2种羌活药用植物的叶绿体基因组密码子使用偏性分析

作者: 王琳璇 王高烽 谷威 赵志敏 马永贵

2种羌活药用植物的叶绿体基因组密码子使用偏性分析0

摘要 对羌活(Notopterygium incisum)与宽叶羌活(N.franchetii)的叶绿体编码基因的密码子使用偏性(codon usage bias)及其影响因素进行了分析。结果表明:羌活和宽叶羌活的叶绿体基因组总ENC值分别为49.79和49.70,偏性较弱,密码子第3位碱基倾向于使用A/T。PR2-plot分析表明,选择压力和突变都是影响2种羌活叶绿体密码子使用偏性的主要因素;而中性绘图分析和ENC-plot分析表明选择压力是影响2种羌活叶绿体密码子使用偏性的主要因素。相对同义密码子使用度(RSCU)分析确定了2种羌活中使用频率较高的30个高频密码子,几乎都以A或U结尾,只有UUG以G结尾。羌活的最优密码子9个,宽叶羌活的最优密码子7个。2种羌活有5个最优密码子相同,分别是UUG、CAU、CGU、AGU、GGA。该研究结果为后续药用羌活植物的基因表达、蛋白质翻译和遗传育种研究提供了研究依据和基础数据。

关键词 羌活;宽叶羌活;叶绿体基因组;密码子使用偏性;最优密码子

中图分类号 Q 943.2  文献标识码 A  文章编号 0517-6611(2022)03-0095-07

doi:10.3969/j.issn.0517-6611.2022.03.025

Codon Usage Bias in Chloroplast Genomes of Two Medicinal Species of Notopterygium H. de Boissieu

WANG Lin-xuan, WANG Gao-feng, GU Wei et al

(College of Life Sciences, Qinghai Normal University, Xining, Qinghai 810000)

Abstract This study analyzed the codon usage bias and affecting factors of the protein coding genes (CDS) of the chloroplast genomes of two medicinal plants, Notopterygium incisum and N. franchetii. The results showed that the chloroplast genomes of N. incisum and N. franchetii had a total ENC value of 49.79 and 49.70, respectively, indicating weak codon usage bias. The third base of the codon of the two chloroplast genomes preferred to use A/T. The analysis of PR2-plot showed that selection pressure and nutation were the main factors affecting the bias of codon usage in N. incisum and N. franchetii CDS, while neutrality plot and ENC-plot analyses both illustrated selection pressure was the main factors affecting codon usage bias in the two species. Relative Synonymous Codon Usage (RSCU) analysis determined 30 high-frequency codons used in N. incisum and N. franchetii, almost all ending with A or U, with only UUG ends with G. There were nine optimal codons identified in N. incisum, and seven optimal codons found in N. franchetii. The five optimal codons shared by N. incisum and N. franchetii were namely UUG, CAU, CGU, AGU, GGA. The results provide important basal data for the future study of gene expression, protein translation and molecular breeding of medicinal Notopterygium plants.

Key words Notopterygium incisum;Notopterygium franchetii;Chloroplast genome;Codon usage bias;Optimal codons

基金项目 青海省基础研究计划项目(2018-ZJ-741)。

作者简介 王琳璇(1994—),女,河北廊坊人,硕士研究生,研究方向:生物化学与分子生物学。

通信作者,教授,博士,从事动植物分子进化与适应研究。

收稿日期 2021-04-03

密码子在蛋白质合成过程中起着传递遗传信息的关键作用,在大多数情况下,编码同一氨基酸的同一密码子的使用频率是不同的,这一现象称为密码子使用偏性(codon usage bias)。某一物种或某一基因通常倾向于使用一种或几种特定的同义密码子,这些密码子被称为最优密码子(optimal codon)。影响密码子使用偏性的因素很多,最主要的因素是定向突变和中性选择[1-3],还包括GC含量、同义替换率[4]、tRNA丰度[5]、有效翻译起始位点的选择[6]、密码子亲水性和DNA复制起始位点[7]、基因长度[8]和表达水平[9]等。在不同物种中,突变和选择的影响强度不同。例如在蓝藻中,影响密码子使用偏性较大的是GC组成与选择压力[10],但在果蝇中则是突变对的密码子使用偏性影响较大[3]。

叶绿体是植物进行光合作用的器官,也参与到植物的氨基酸合成等通路中。作为植物重要的细胞器,叶绿体有自己一套独特的遗传信息[11]。针对叶绿体基因组的密码子使用偏性研究,可以帮助了解叶绿体蛋白质编码基因的使用偏好,为后续遗传改造和基因表达研究提供基础数据。研究发现,乳油木叶绿体基因组密码子使用偏性更多受突变影响[12],选择压力对其使用偏性影响较小。杜梨叶绿体密码子使用偏性则主要受选择的影响[13]。胡晓艳等[14]在对酸枣叶绿体基因组的研究中获得了7个最优密码子。

羌活属(Notopterygium Boissieu)植物隶属于伞形科(Apiaceae)美味芹族,是我国特有的多年生草本药用植物,主要分布在我国西南部高山地区[15]。据《中国植物志(英文版)》记载,该属包括宽叶羌活、羌活、羽苞羌活、澜沧羌活、卵叶羌活和细叶羌活6个种[16]。《中国药典》规定的羌活基源植物为羌活与宽叶羌活,入药部位为干燥根及根茎,具有解表散寒、祛风除湿和止痛的功效。羌活主要产于四川、云南,次产于青海及甘肃;宽叶羌活主产于甘肃、青海,次产于四川、山西和内蒙古等地。近年来,由于过度采挖及生境受到严重破坏,野生羌活的自然群体已经面临濒危,被载入《中国生物多样性红色名录(高等植物卷)》[17]。羌活作为一味传统的中药,富含异欧芹素、羌活醇、阿魏酸等活性物质,具有抗炎、抗氧化、抗心律失常、抗菌、抗癌细胞增殖等药效作用[18]。目前有关羌活属叶绿体基因组密码子使用偏性研究鲜见报道。该研究拟对2种可以入药的羌活属植物,即羌活和宽叶羌活进行叶绿体基因组的密码子使用模式分析,研究结果不但可以阐明羌活光合作用相关基因的使用偏好,也可为羌活基因表达研究及遗传育种研究提供理论基础。

1 材料与方法

1.1 数据获取

羌活样品采集于青海省果洛藏族自治州达日县,99.46° E,33.77° N,海拔3 943.24 m。宽叶羌活样品采自青海省玛可河麦浪沟,100.96° E,32.84° N,海拔3 790.78 m。保存于干冰中,送于北京百迈客生物科技有限公司进行叶绿体基因组测序。利用Illumina HiSeq X Ten 平台测序,使用MIRA序列组装软件的MIRA v3.4.1.1模块进行,最终得到羌活的叶绿体全基因组序列长度为 157 050 bp。宽叶羌活的叶绿体全基因组序列长度为 142 184 bp。测序结果提交至NCBI(national center for biotechnology information),登录号:羌活MW820163、宽叶羌活MW820162。使用Geneious11.1.5 提取编码基因(coding sequence,CDS)并筛选,剔除小于300 bp的基因,并选择起始密码子为ATG的编码基因进行后续分析,最终羌活获得51条编码基因,宽叶羌活获得50条编码基因。

1.2 分析方法

1.2.1 密码子相关参数计算。

使用软件codonW1.4.2分析获得的编码基因,计算有效密码子数(effective number of codon,ENC)。ENC范围一般在20~61,越接近20,表示密码子使用偏性越大。使用在线分析软件CUSP(http://embossgui.sourceforge.net/demo/)对叶绿体基因组密码子的GC含量等碱基组成信息进行研究,并对相关参数进行相关性分析[19]。

1.2.2 中性绘图分析。

分别以CGC1、CGC2、CGC3表示密码子第1、2、3位的GC含量,CGC12表示CGC1与CGC2的平均数,以CGC3和CGC12为横、纵坐标绘制散点图,分析叶绿体基因组密码子第3位和前2位的相关性,从而分析影响密码子偏性的因素[20]。以CGC3、CGC12为横、纵坐标绘制散点图,如果CGC3和CGC12呈显著相关,说明密码子第3位的碱基组成与前2位相似,密码子偏性主要受突变的影响;如果CGC3和CGC12无显著相关关系,趋势线斜率接近0,则说明密码子第3位与前2位碱基组成差异较大,密码子碱基相对保守,这种情况密码子偏性更多受选择的影响[21]。

1.2.3 PR2-plot绘图分析。

为进一步分析影响2种羌活叶绿体基因组密码子偏性的因素,以CA3、CT3、CC3、CG3分别表示密码子第3位A、T、C、G 4种碱基的含量,以CG3/(CG3+CC3)为横坐标,CA3/(CA3+CT3)为纵坐标绘制散点图。如果大部分基因分布在图像上半部,说明密码子第3位碱基含量A>T,反之则T>A,同理如果大部分基因分布在图像右半部,说明密码子第3位碱基含量G>C,反之则C>G。若点在图中均匀分布,则密码子偏性完全受突变影响[20-21]。

1.2.4 ENC-plot绘图分析。

以GC3为横坐标,以ENC值为纵坐标绘制散点图,并以ENC期望绘制标准曲线。

ENC期望=2+CGC32+29CGC32+(1-CGC3)2

标准曲线表示在无选择压力的情况下ENC与CGC3的关系,如果点主要分布于曲线附近,说明密码子偏性更多受突变的影响,如果点分布于距标准曲线较远的位置,则说明密码子偏性更多受选择的影响。根据公式(ENC期望-ENC实际)/ENC期望制作ENC分布频数表,统计ENC实际与ENC期望的差距[22]。

1.2.5 RSCU分析。

使用CodonW计算2种羌活叶绿体基因组的RSCU(relative synonymous codon usage)。RSCU是实际观察到的某密码子使用频率与预期(该密码子编码的氨基酸的同义密码子使用频率相等时)使用频率的比值。理论值与预期值相等时,密码子不存在偏性。所以当RSCU=1.00,表明密码子使用无偏性;RSCU>1.00时,表明该密码子实际使用频率较高;RSCU<1.00时,表明实际使用频率较低[23]。

经典小说推荐

杂志订阅

友情链接