向日葵HaFATA基因的生物信息学和表达分析
作者: 周菲
摘要 FATA编码脂酰-酰基载体蛋白硫酯酶A,将质体中以脂酰-ACP形式存在的脂肪酸水解成游离的脂酰-CoA和酰基载体蛋白。为了解向日葵HaFATA基因编码蛋白的结构、功能及基因表达特性,对HaFATA编码蛋白进行生物信息学和基因表达分析。预测HaFATA为碱性且为亲水性蛋白,二级结构主要是无规则卷曲,预测亚细胞定位于叶绿体。系统进化分析表明,HaFATA与同属菊科的莴苣(Lactuca sativa L.)和水飞蓟(Silybum marianum L.)FATA进化关系近,序列相似性分别为90%、87%。HaFATA表达分析结果显示,HaFATA在向日葵种子中表达最高,其次为在管状花和叶中,在茎、舌状花和根中不表达,在发育的种子中,HaFATA除在开花后12 d表达相对较低,在其他6个发育时期表达均较高,表明其对于种子发育和油脂积累可能具有重要作用。
关键词 向日葵;脂酰-酰基载体蛋白硫酯酶;脂肪酸;生物信息学;表达分析
中图分类号 S565.5 文献标识码 A 文章编号 0517-6611(2024)07-0096-03
doi: 10.3969/j.issn.0517-6611.2024.07.024
Bioinformatics and Expression Analysis of HaFATA Gene in Sunflower
ZHOU Fei1,2
(1.Industrial Crops Institute,Heilongjiang Academy of Agricultural Sciences,Harbin,Heilongjiang 150086;2.Heilongjiang Academy of Agricultural Sciences Postdoctoral Programme,Harbin,Heilongjiang 150086)
Abstract FATA encodes lipoacylacyl carrier protein thioesterase A,which hydrolyzes fatty acids in the form of lipoacylACP into free lipoacylCoA and acyl carrier protein in plastids.In order to understand the structure and function of the protein encoded by HaFATA gene and gene expression characteristics in sunflower,the bioinformatics of the protein encoded by HafabZ and gene expression were analyzed.It was predicted that the protein encoded by HaFATA was basic and hydrophilic.The secondary structure of the protein encoded by HaFATA was mainly irregular coil,and the subcellular localization was predicted in the chloroplast.Phylogenetic analysis showed that HaFATA was closely related to Lactuca sativa L.and Silybum marianum L.,which belong to the same family of compositae,with sequence similarity of 90% and 87%,respectively.The results of expression analysis of HaFATA showed that HaFATA expression was the highest in sunflower seeds,followed by tubular flowers and leaves,and was not expressed in stems,ligulate flowers and roots.In developing seeds,HaFATA expression was relatively low at 12 d after flowering,and was high at the other six development stages,indicating that it might play an important role in seed development and oil accumulation.
Key words Sunflower;Lipoacylacyl carrier protein thioesterase;Fatty acid;Bioinformatics;Expression analysis
向日葵(Helianthus annuus L.)是世界上重要的油料作物之一,向日葵油中富含不饱和脂肪酸,是营养价值很高的食用油。植物种子油合成和脂肪酸积累由甘油三酯和脂肪酸生物合成代谢通路上的基因调控。脂酰-酰基载体蛋白硫酯酶(fatty acyl acyl carrier protien thioesterase,FAT)将质体中以脂酰-ACP形式存在的脂肪酸水解成游离的脂酰-CoA和酰基载体蛋白(ACP),进而终止脂肪酸碳链延长。根据其氨基酸序列和底物偏好性分为FATA和FATB 2个亚家族,FATA偏好不饱和酰基-ACP,尤其对18:1-ACP活性最高,相反,FATB通常对饱和酰基-ACP显示出高活性[1]。FAT基因在脂肪酸合成代谢过程中对脂肪酸含量和组成具有重要的调控作用[2]。
目前,尽管已经从向日葵中克隆了FATA基因[3],但是关于该基因研究报道较少。笔者通过分析前期获得的高油酸向日葵种子发育不同时期的转录组数据[4],在脂肪酸生物合成代谢通路中鉴定出显著差异表达的HaFATA基因,对该基因编码蛋白进行生物信息学分析,并对其在高油酸向日葵不同发育时期的种子以及其他组织部位的表达模式进行分析,以期为今后该基因功能的研究提供科学依据。
1 材料与方法
1.1 植物材料
向日葵高油酸保持系“L-1-OL-1”于2019年种植于黑龙江省农业科学院经济作物研究所试验基地(呼兰区康金镇)。根据开花后不同天数于同一时间段对种子取样,从开花7 d起,每5 d取样1次,取至开花后37 d,每次取花盘最外3圈的种子,同时取向日葵开花后7 d的根、茎、叶、管状花、舌状花,将材料液氮速冻后冻存于-80 ℃冰箱,用于实时荧光定量PCR分析。
1.2 方法
1.2.1 基因的生物信息学分析。
在NCBI的BLAST数据库中进行序列同源性比对和相似性搜索;利用ExPASy系统下的蛋白质基本理化性质预测工具Protparam(https://web.expasy.org/protparam/)预测氨基酸组成、相对分子量、等电点和原子组成等参数;利用MEGA7软件构建系统进化树;利用SOPMA在线程序(https://npsaprabi.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html)分析蛋白的二级结构;利用Protscale在线软件(http://web.expasy.org/protscale/)分析氨基酸序列的亲/疏水性;利用Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)在线软件预测基因的亚细胞定位。
1.2.2 荧光定量PCR分析。
利用植物总RNA提取试剂盒(天根)对向日葵种子总RNA进行提取,取0.5 μg RNA利用ReverTra Ace qPCR RT Master Mix with gDNA Remover(TOYOBO)合成cDNA第1条链。采用THUNDERBIRD SYBR qPCR Mix(TOYOBO)试剂,Roche LightCycler 480II荧光定量PCR仪,以向日葵β-actin基因(AF282624)为内参基因,Real-Time PCR总反应体系为20 μL:cDNA 1.2 μL,SYBR Green 10.0 μL,Primer 0.6 μL,ddH2O 7.6 μL。Real-Time PCR反应程序:98 ℃ 2 min,98 ℃ 10 s,58 ℃ 10 s,68 ℃ 30 s,共45个循环,待PCR反应结束后进行溶解曲线分析,采用2-ΔΔCt法进行目标基因的表达量分析。内参基因β-actin引物为F:GCAAAAAGCAGCTCGTCTGT,R:AGCAGCTTCCATTCCAATCA,HaFATA荧光定量引物为F:GTGTCGGATTTTCAACGGATG,R:TCAACCACATCACTCCAAGC。
2 结果与分析
2.1 HaFATA生物信息学分析
2.1.1 蛋白质基本理化性质预测。
HaFATA基因包含有1 098 bp 的开放阅读框,编码365个氨基酸。蛋白质基本理化性质预测表明:HaFATA基因编码蛋白的原子总数为5 786个,分子式为C1788H2893N533O557S15,蛋白分子量41.25 kD,等电点理论值8.40,预测该蛋白是碱性蛋白。HaFATA编码蛋白氨基酸组成见表1。
2.1.2 蛋白质二级结构预测。
预测分析HaFATA编码蛋白质的二级结构,结果显示:该蛋白质有36.99%的α螺旋,3836%的无规则卷曲,20.00%的延伸链,4.66%的β转角。预测结果表明,HaFATA编码蛋白质的二级结构为无规则卷曲(图1)。
2.1.3 蛋白质亲疏水性分析和亚细胞定位预测。
对HaFATA编码蛋白质的氨基酸序列进行亲疏水性分析。大于0部分多于50%为疏水性蛋白,而小于0部分多于50%为亲水性蛋白,结果表明:HaFATA编码蛋白为亲水性蛋白(图2)。Cell-PLoc 2.0软件预测HaFATA编码蛋白亚细胞定位于叶绿体。
2.1.4 HaFATA基因系统进化分析。
将向日葵HaFATA和同为FAT家族的FatB基因与玉米(Zea mays L.)、亚麻芥(Camelina sativa L.)等物种FATA以及拟南芥(Arabidopsis thaliana L.)和甘蓝型油菜(Brassica napus L.)FATA、FATB的氨基酸序列进行了系统进化树构建(图3),结果发现:向日葵HaFATA与其他物种的FATA聚在一个大分支上,与同属菊科的莴苣(Lactuca sativa L.)和水飞蓟(Silybum marianum L.)FATA进化关系最近,序列相似性分别为90%、87%。
2.2 HaFATA基因表达分析
通过qRT-PCR发现,HaFATA(脂肪酰基ACP硫酯酶A)在向日葵种子中表达最高,其次是管状花和叶,在茎、舌状花、根中几乎不表达。在种子发育过程中,HaFATA除在开花后12 d种子中表达相对较低,在其他6个发育时期表达均较高,其中在开花后27 d种子中达最高(图4)。