杨树NRAMP基因家族全基因组鉴定与生物信息学分析
作者: 赵志明 袁梦婷 武江昊 门艳阔 江敏 顾丽姣 王进茂
摘要 为研究杨树自然抗性相关巨噬细胞蛋白(NRAMP)家族成员的结构和功能,利用生物信息学方法,从杨树全基因组数据库中筛选并鉴定NRAMP家族基因序列,并对该家族成员的理化性质、二级结构、基因结构、保守基序、染色体定位、进化树和组织表达量进行分析。结果表明:从杨树基因组中共鉴定出6个NRAMP基因家族成员,编码的氨基酸数量差异较大,为503~1 310,亚细胞定位表明其均在质膜上,各个成员跨膜结构数量在10~12。PNT31315的二级结构以无规则卷曲为主,其他家族成员主要的二级结构为α-螺旋。进化树分析表明,杨树NRAMP家族基因全部聚类于第3类,且与玉米、高粱、甘蔗和水稻皆有相似基因,不存在物种特异性。染色体定位分析表明,该家族各基因在染色体上分散分布,只有PNT48459和PNT49289两个基因分布在一个染色体上,且不存在串联重复和片段复制基因。蛋白功能预测结果显示,PNT48459和PNT52668可能与植物金属耐受蛋白结合参与金属离子的吸收与转运,PNT31315可能参与植物激素信号转导。PNT48459、PNT37313和PNT31315在主根中的表达量较高,推测其参与重金属吸收过程。
关键词 杨树;NRAMP基因家族;生信分析;重金属胁迫
中图分类号 S792.11 文献标识码 A
文章编号 0517-6611(2023)14-0090-05
作者简介 赵志明(1995—),男,河北石家庄人,硕士研究生,研究方向:林木遗传育种。*通信作者,教授,博士,从事林木遗传育种研究。
随着我国城市化建设的不断深入,重金属污染问题日益严重,威胁生态系统,影响人类健康[ 1]。杨树适应性较强,广泛分布于世界各地,具有易繁殖、生长快、生物量大等特点,根系发达,对毒性物质具有较强的耐性,对重金属具有较强的富集及转运能力[ 2]。天然抗性相关巨噬蛋白(natural resistanceassociated macrophage protein,NRAMP)是一类参与金属离子运输的跨膜转运蛋白,主要参与植物对铁、锰、镉等金属离子的吸收和转运[ 3]。NRAMP蛋白属于一种具有典型膜整合蛋白特征多肽分子的古老膜整合转运蛋白家族,其序列在各物种间高度保守且具有类似的二级结构[ 4]。在拟南芥中,AtNRAMP1可以高效调控植物体内铁的吸收转运,通过表达后期取代离子转运过程中的铁转运蛋白[ 5]。AtNRAMP2与AtNRAMP1功能相似,具有锰转运活性,在酵母中可介导锰进入胞质[ 6]。AtNRAMP3和AtNRAMP4在铁缺乏时被诱导表达,并在种子萌发和缺锰条件下,在植株光合作用时维持所需锰离子的平衡[ 7]。AtNRAMP6定位于侧根和幼嫩叶片细胞的高尔基体或反面高尔基网络上,是Cd和Fe的转运蛋白[ 8-9]。在水稻8个NRAMP基因家族中,成员OsNRAMP1、OsNRAMP3、OsNRAMP5、OsNRAMP6和OsNRAMP7对锌、锰、镉和铁等有吸收和转运功能[ 4,10-12]。
植物在生长过程中,如遇重金属污染,过量的重金属会对植物细胞膜系统造成伤害,影响植物的生长发育。如镉胁迫时会破坏植物叶片的叶绿素结构;铅的积累会减少植物根细胞的有丝分裂速度,使植物生长缓慢;锰虽然是植物必需的微量元素,过量则会使植物产生毒害作用,使植物生理代谢失调、生长发育受阻等。目前,NRAMP基因家族在拟南芥、水稻、甘蔗[ 13]、大麦[ 14]、马铃薯[ 15]、辣椒[ 16]等多种植物中均有相关研究。但很少有关于杨树NRAMP基因家族的研究,因此,笔者利用生物信息学工具对杨树NRAMP家族成员进行鉴定与分析,旨在后续杨树NRAMP家族基因的功能研究提供参考。
1 材料与方法
1.1 数据来源
杨树全基因组和基因注释文件下载于Ensembl数据库(http:∥plants.ensembl.org/index.html)。水稻、拟南芥、高粱、玉米和甘蔗基因组文件均下载于Ensembl数据库。
1.2 方法
1.2.1 杨树NRAMP基因家族的鉴定。
利用隐马尔可夫模型保守结构域的隐马尔可夫文件(PF01566),利用Perl程序筛选含有NRAMP结构域的蛋白序列,删除重复序列,并通过CDD(https:∥www.ncbi.nlm.nih.gov/cdd/)、Pfam(http:∥pfam.xfam.org/)和SMART数据库(http:∥smart.embl.de/)对候选基因进行确证,剔除无OVATE保守结构域的蛋白序列,保留下的即为杨树PtNRAMP基因家族成员。
1.2.2 杨树NRAMP家族蛋白理化性质、二级结构和跨膜结构分析。
利用在线网站Ex PASy(https:∥web.expasy.org/protparam/)对杨树NRAMP家族蛋白、氨基酸数、分子量、等电点进行分析。利用在线网站wolfpsort对该家族成员蛋白序列进行亚细胞预测(https:∥wolfpsort.hgc.jp/)和信号肽(http:∥www.cbs.dtu.dk/services/SignalP-4.1/)分析。通过在线网站SOPMA("https:∥npsaprabi.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)预测该家族蛋白的二级结构。
1.2.3 杨树NRAMP基因保守基序和基因结构分析。
利用MEME(http:∥memesuite.org/)在线网站对NRAMP蛋白进行保守基序分析,设置Motif数量最大匹配数为10个,长度从6~50个氨基酸残基。通过GSDS(http:∥gsds.gaolab.org/)在线网站绘制基因结构图。
1.2.4 杨树NRAMP家族系统进化树的构建和染色体定位分析。
采用MEGA 7.0软件对杨树NRAMP基因家族蛋白进行多序列比对,运用Neighbor-joining(NJ)算法,bootstrap值取1 000,其余参数默认,构建系统发育进化树。用Evolview在线网址(http:∥www.omicsclass.com/article/671)绘制进化树。
利用Perl程序解析杨树基因组注释文件,得到染色体位置和基因结构信息,并运用Map chart工具绘制染色体定位图。基于以下2个标准:①较短序列的长度占较长序列的70%;②2个对齐序列的相似性大于70%[ 17-18],为片段复制基因。将位于同一染色体上且由少于5个基因间隔的同一家族基因认定为串联重复基因[ 19]。
1.2.5 杨树NRAMP家族基因功能预测。
通过在线网站STRING(https:∥cn.stringdb.org/)对杨树NRAMP家族基因进行互作蛋白预测。
1.2.6 杨树NRAMP家族基因在不同组织下的表达。
杨树组织表达数据参考(https:∥www.ncbi.nlm.nih.gov/bioproject/?term=RNAseq%20of%20major%20tissues%20and%20xylem%20cell%20types%20of%20Populus%20trichocarpa)[ 17-18],分析NRAMP家族基因在杨树不同组织(茎、主根、叶、韧皮部、木质部和导管)中的表达情况。
2 结果与分析
2.1 PtNRAMP家族蛋白理化特性
通过搜索杨树全基因组数据库,得到6个可能是NRAMP家族的成员,提交到CDD、Pfam和SMART确定NRAMP结构域,最终确定6个序列(表1)。由表1可知,该家族成员编码的氨基酸在503~1 310,分子量在54 630.21~142 293.19 Da,家族成员的不稳定系数在34.21~46.27,氨基酸序列的平均亲水系数在-0.008~0.647,仅有PNT31315为亲水蛋白,其余为疏水蛋白,亚细胞定位表明其成员均在质膜上。
2.2 PtNRAMP家族蛋白二级结构分析和跨膜结构
PtNRAMP家族蛋白二级结构主要由无规则卷曲、α-螺旋、延伸链和β-转角组成(表2)。其中,α-螺旋所占比例最高,在33.82%~57.00%;β-转角比例最小,占比仅为2.91%~4.29%。仅PNT31315的二级结构比例表现为无规则卷曲>α-螺旋>延伸链>β-转角,表明其结构多变,可能是蛋白质具有特异功能的部位。6个PtNRAMP家族成员的跨膜结构数在10~12个。这表明PtNRAMP家族蛋白为跨膜蛋白,可能与其跨膜转运重金属离子的功能相适应。
2.3 杨树NRAMP基因保守基序和基因结构分析
通过MEME和GSDS在线网站对杨树NRAMP基因家族的保守基序和基因结构进行分析,结果如图1所示,在杨树NRAMP家族6个基因中,都含有Motif1、Motif2、Motif3和Motif6,只有PNT31315基因含有4个Motif,其余基因含有8个或10个Motif。保守基序在数量上的差异可能表明其基因与其他基因在功能上有一定差别。
基因结构分析表明,每个基因均含有内含子,且数量差别较大,最多含有12个内含子,最少的含有3个;PNT37313基因在5′末端和3′末端均不含有非翻译区(UTR),PNT48459基因仅在5′末端不含有非翻译区,其余4个基因有完整的基因结构。
2.4 杨树NRAMP基因家族系统进化树分析
为了解NRAMP基因家族在杨树和其他物种的进化关系,构建了杨树、水稻、拟南芥、高粱、玉米和甘蔗NRAMP家族成员的进化树。将6个物种分为三大类(图2),3类中都含有单子叶和双子叶植物,表明NRAMP家族基因出现于单、双子叶植物分离前。第1类分支中,仅有1个拟南芥和5个玉米NRAMP家族成员,第2类分支中,除了杨树NRAMP家族成员外,其他物种均有该家族基因分布,杨树NRAMP家族基因全部聚类于第3类,且与玉米、高粱、甘蔗和水稻皆有相似基因,不存在物种特异性,说明这些基因可能具有相似的功能。
2.5 杨树NRAMP基因家族染色体定位分析
杨树NRAMP家族的6个基因在染色体上的分布分散(图3),分布在1号、2号、5号、6号和7号染色体上,其余14条染色体上没有分布,在2号染色体上分布2个该家族基因,其余4条染色体上各分布1个NRAMP家族基因。该家族基因在染色体上的分布位置不同,既有靠近染色体末端,又有近着丝粒区分布。该家族基因不存在串联重复和片段复制。
2.6 互作蛋白预测杨树NRAMP家族基因功能
互作蛋白预测结果显示(图4),有3个杨树NRAMP家族基因蛋白存在于互作网络上,PNT31315与ERT1、ERT3和FBL9互作,PNT48459与PtrMTP9互作,PNT52668与PtrMTP3.2、PtrMTP1、PtrMTP2和PtrMTP12互作。杨树金属耐受蛋白(MTPs)在植物重金属吸收和体内平衡中起关键作用,PtrMTP9在酵母细胞中显示出特定的Mn转运能力,推测PNT48459和PNT52668可能与植物金属耐受蛋白结合参与金属离子的吸收与转运。ETR1与ETR3为乙烯受体蛋白家族成员,PNT31315可能参与植物激素信号转导。
2.7 杨树NRAMP家族基因组织表达
为了解杨树NRAMP家族基因的组织表达特性,该家族基因采用公开的转录组数据在茎、主根、叶、韧皮部、木质部和导管中的表达情况,绘制热图(图5)。PNT52668在茎中表达含量高,PNT49289和PNT27203在木质部中表达含量高,PNT48459、PNT37313和PNT31315在主根中的表达量高。