巨桉ARF转录因子的鉴定与表达分析

作者: 何春玲 齐妍 沈超

巨桉ARF转录因子的鉴定与表达分析0

摘要 [目的]揭示巨桉基因组中生长素响应因子(auxin response factor,ARF)基因家族的特征,为深入解析其生物学功能奠定基础。[方法]基于生物信息学分析巨桉中鉴定出17个 ARF 基因,并对其基因结构特征和表达模式进行综合研究。[结果]巨桉 ARF 不均匀分布在9条染色体上,二级结构均含有α-螺旋、延伸链、无规卷曲和β-转角。根据系统发生关系分成4个亚族。表达分析表明 ARF 基因在巨桉的根、茎、叶等各组织中均有表达,但表达量存在差异。[结论]巨桉 Eucgr.F04380、Eucgr.D00264和Eucgr.D00588在花中特异性表达,Eucgr.D01764、Eucgr.E00888和Eucgr.K03433 在分生组织中特异性表达。

关键词 巨桉; ARF ;系统进化;表达分析

中图分类号 S 792.39  文献标识码 A  文章编号 0517-6611(2022)17-0083-06

doi:10.3969/j.issn.0517-6611.2022.17.021

开放科学(资源服务)标识码(OSID):

Identification and Characterization of ARF Transcription Factors in  Eucalyptus grandis

HE Chun-ling1, QI Yan2, SHEN Chao2

(1. Maoming Agricultural Science and Technology Extension Center, Maoming, Guangdong  525000; 2. School of Biological and Food Engineering,Guangdong University of Petrochemical Technology, Maoming, Guangdong  525000)

Abstract [Objective]This study aims to reveal the characteristics of the auxin response factor (ARF) gene family in the genome of  Eucalyptus grandis  and lay a foundation for further understanding its biological function. [Method]Based on bioinformatics analysis, 17  ARF  genes were identified in  Eucalyptus grandis , and their structural characteristics and expression patterns were comprehensively studied. [Result]The ARF of  Eucalyptus grandis  is unevenly distributed on 9 chromosomes, and the secondary structure contains α-helix, extended strand, random coil and β-turn. According to the phylogenetic relationship, it is divided into four sub-families. Expression analysis showed that the  ARF  gene is expressed in the roots, stems and leaves of  Eucalyptus grandis , but the amount of expression is different. [Conclusion] Eucgr.F04380, Eucgr.D00264,  and  Eucgr.D00588  are specifically expressed in flowers, and  Eucgr.D01764, Eucgr.E00888  and  Eucgr.K03433  are specifically expressed in meristems, laying the foundation for further exploration of their functional identification.

Key words  Eucalyptus grandis;ARF  gene;Phylogenic evolution;Expression analysis

生长素是在植物的胚胎形成、发育、叶片成熟和衰老、不定根的形成、果实发育等生长过程中起着调控作用的一种关键的植物激素,能够促进或者抑制靶基因合成产物[1]。生长素响应因子(auxin response factor,ARF)是植物中广泛存在的影响生长素信号转导的重要转录因子,其特异性结合生长素响应元件TGTCTC,从而影响基因的表达,调控植物的生长发育[2]。在1997年,Ulmasov等[3]在拟南芥中鉴定出第一个生物素响应因子,将其命名为AtARF1。

测序技术的发展极大地推动了基因组测序的发展,使越来越多物种的 ARF 基因家族被鉴定,研究发现 ARF 在不同物种间表现出差异化,且以多基因家族的形式存在[4]。目前,除了拟南芥[5]外,水稻[6]、杨树[7]、番茄[8],玉米[9]、大豆[10]、葡萄[11]、苹果[12]、香蕉[13]和柳属[14]等植物的 ARF 也陆续被鉴定出来。

此外,miRNA与ta-siRNA转录后调控影响 ARF 基因的表达。如在拟南芥中,microRNA160对 AtARF17 的调控会对拟南芥不定根的发育产生影响[15]。植物种子的萌发是microRNA160通过调控 ARF10、ARF16和ARF17 来完成[16]。TAS3 ta-siRNAs 和 ARF2、ARF3 和 ARF4 结合,抑制其表达[17]。

巨桉木材材质结构粗、纹理笔直、耐朽性适中、易劈裂,因此在造纸、纤维板、矿柱材原料等方面普遍应用,成为一种拥有高商业价值的树种。同时,巨桉培育面积大,树干通直,树冠茂密,抵御外界恶劣环境能力强,易于生存,且萌芽能力强,一次造林能够萌芽更新2代,广泛用于人工造林,经济效益巨大。巨桉基因组测序已经完成且已更新,极大地促进了其分子遗传学研究[18-19],为巨桉功能基因组学研究奠定了基础。笔者基于巨桉基因组和转录组数据,鉴定分析了巨桉 ARF 基因家族的结构特征与组织表达模式,为后期进一步对巨桉 ARF 基因进行功能解析提供基础,弥补相关基因研究的不足。

1 材料与方法

1.1 巨桉 ARF 家族基因序列的提取鉴定

从PlantFTDB(http://planttfdb.gao-lab.org/family.php?sp=Egr&fam=ARF)数据库中下载巨桉的基因序列信息和蛋白质信息。在Pfam蛋白质家族数据库(http://pfam.xfam.org/)下载 ARF 基因的HMM Profile,并将其作为查询(P<0.001)搜索巨桉蛋白质序列数据。去除所有冗余序列后,将输出的ARF蛋白序列提交给CDD(https://www.ncbi.nlm.nih.gov/cdd)、SMART(http://smart.embl-heidelberg.de/)和Pfam,以确认保守的 ARF 基因结构域。所有非冗余高置信度基因均命名为巨桉 ARF 基因,在巨桉中共分析和筛选出17个 ARF 基因。

1.2 巨桉ARF蛋白的理化性质分析与二级三级结构预测

使用ExPASy的ProtParam tool(https://web.expasy.org/protparam/)进行巨桉ARF蛋白理化性质分析。利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)进行二级结构分析。应用SWISS-MODEL(https://swissmodel.expasy.org/)进行建模,分析ARF蛋白的3级结构。

1.3 巨桉 ARF 基因家族的系统进化分析

利用MEGA(https://meme-suite.org/meme/index.html)对巨桉 ARF 基因序列进行分析,使用MEGA打开巨桉 ARF 基因的fas格式氨基酸序列,用ClustalW算法对巨桉ARF氨基酸序列进行多序列比对,选择距离模型p-distance构建NJ树,设置Bootstrap method值为1 000。

1.4 巨桉 ARF 基因的染色体定位与基序分析

从巨桉数据库(https://eucgenie.org/)中获取基因,将巨桉11条染色体上的位置信息数据导入Mapchart软件进行染色体定位分析图的绘制。巨桉 ARF 基因结构以及Motif结构分析使用在线网站MEME(https://meme-suite.org/meme/tools/meme),将motif个数设定为10,其余参数均不变。

1.5 巨桉 ARF 基因家族组织表达模式分析

从桉树功能基因组数据库中的转录组数据分析巨桉 ARF 基因家族成员各组织FPKM数值,利用TBtools(https://github.com/CJ-Chen/TBtools)软件进行基因表达HEATMAP的绘制。

2 结果与分析

2.1 巨桉 ARF 家族基因的鉴定与性质分析

通过转录本数据CDD、Pfam和SMART保守结构域分析,共鉴定出17个巨桉 ARF 基因,并对其进行理化性质分析。根据理化性质分析结果(表1)得知,巨桉 ARF 基因的氨基酸数量为454~1 119个残基,其中带负电荷的残基总数在52~98,带正电荷的残基总数在56~93,最短的 Eucgr.K03433 由454个氨基酸残基组成,最长的 Eucgr.C03293 和 Eucgr. C02178 由1 119个氨基酸残基组成。蛋白质分子量为50 713.28~124 934.23 Da,其中 Eucgr.C03293 的分子量最大, Eucgr.K03433 的分子量最小。巨桉ARF蛋白等电点处于5.37~8.38,其中 Eucgr.F04380、 Eucgr.J00923、 Eucgr.K02197 和 Eucgr.K03433 等电点大于7.5,偏向于碱性。不稳定系数在45.96~72.98,均大于40.00,属于不稳定蛋白,脂肪族指数在67.38~77.35,其中 Eucgr.B02480 脂肪族指数最高,热稳定性最强; Eucgr.K03433 的脂肪族指数最低,热稳定性最差。亲水性指数为-0.621~-0.276,亲水指数较低,均小于0,为亲水性蛋白。亚细胞定位分析表明巨桉ARF均定位于细胞核中。

2.2 巨桉ARF蛋白的结构预测

根据二级结构预测结果(表2)可知,巨桉ARF蛋白二级结构均由α-螺旋、β-转角、延伸链和无规卷曲组成。其中,无规卷曲占比最多,为44.41%~66.11%,其中 Eucgr.C02178 占比最少, Eucgr.D00588 中占比最多。β-转角占比最少,为2.57%~7.77%, Eucgr.F04380 中β-转角占比最少, Eucgr.C03293和Eucgr.C02178 中β-转角占比最多。三级结构预测所示,巨桉ARF蛋白三级结构相似,主要以无规则卷曲为主(图1)。

经典小说推荐

杂志订阅

友情链接