波纹龙虾全长转录组测序分析

作者: 梁妃爽 梁华芳 孙榕泽 徐思行 温崇庆 王伟

波纹龙虾全长转录组测序分析0

摘要 [目的]获得波纹龙虾丰富的转录组信息和功能基因。[方法]利用太平洋生物平台单分子实时测序技术,对波纹龙虾鳃、肝胰腺、肌肉、性腺、眼柄等组织混合进行全长转录组测序,获得波纹龙虾全长转录文库。[结果]单分子产出的高质量测序reads总量为71.57 G,通过测序拼接和去冗余后共获得10 425个Unigene,平均长度为4 147 bp。使用GO、NR、Pfam、NT、KEGG、SwissProt、KOG等数据库对全长序列进行基因功能注释,其中9 580 条序列得到NR数据库注释,分别比对到358个物种,其中与钩虾( Hyalella azteca )基因相似的序列最多,为3 865个;有7 585条序列得到GO注释;KOG功能注释将7 436条单基因簇分为26个功能组分,其中一般功能预测的最多,为1 421条;KEGG注释结果发现,心肌细胞的肾上腺素能信号、病毒性心肌炎、心脏肌肉收缩中注释的基因较多,分别为289、254和236条。[结论]通过全长转录组测序数据分析及功能注释,为进一步了解波纹龙虾的生物学特性、基因功能、相关代谢途径和信号通路等提供理论基础,为后续研究提供参考。

关键词 波纹龙虾 (Panulirus homarus); 全长转录组;三代测序;功能注释

中图分类号 S 917.4文献标识码 A

文章编号 0517-6611(2022)14-0092-06

doi:10.3969/j.issn.0517-6611.2022.14.022

开放科学(资源服务)标识码(OSID):

Sequencing Analysis of Full-length Transcriptome of  Panulirus homarus

LIANG Fei-shuang,LIANG Hua-fang,SUN Rong-ze et al

(Fisheries College,Guangdong Ocean University,Zhanjiang,Guangdong 524088)

Abstract [Objective]To obtain the rich transcriptome information and functional genes of the  Panulirus homarus. [Method]This study used the Single-Molecule Real-Time sequencing technology of the PacBio platform to perform full-length transcriptome sequencing on mixed tissues of the  Panulirush omarus  gills,pancreas,muscles,gonads,and eyestalks. A full-length transcript library of  Panulirus homarus  was obtained.[Result]The total number of high-quality sequencing reads produced by a single molecule was 71.57 G.A total of 10 425 single gene clusters. and 3 105 long-chain non-coding RNA sequences were obtained after sequencing and de-redundancy. Functional annotation of full-length sequences using NR,NT,SwissProt,Pfam,GO,KOG,KEGG,and other databases were done. 9 580 sequences of these were annotated in the NR database,compared to 358 species of which Hyalellaazteca had the most similar sequences at 3 865. 7 585 sequences have been annotated by GO. KOG functional annotation divided 7 436 single gene clusters into 26 functional components,of which the most general functional prediction was 1 421.KEGG annotation results found that the ADRENERGIC signal in the heart muscle cells pathways,viral myocarditis pathway and cardiac muscle contraction pathway have more annotated genes,thus 289,254,and 236 respectively. [Conclusion]Through full-length transcriptome sequencing data analysis and functional annotation,a theoretical basis for further understanding of the biological characteristics,gene functions,related metabolic pathways,and signal pathways of the corrugated  Panulirus homarus  has been provided.

Key words  Panulirus homarus; Full-length transcriptome;Third generation sequencing;Function annotation

转录组(Transcriptome)是指特定细胞或组织中的所有转录产物,包含信使 RNA、核糖体 RNA、转运 RNA以及非编码 RNA[1]。1977年,第1代DNA测序技术(Sanger双脱氧链终止法)开始探索基因结构,但 Sanger 测序方法速度慢、通量低、成本高,难以满足大量测序要求,因此难以应用于组学测序研究[2]。第2代测序技术主要基于Roche/454、ABI/Solid、Illumina/Solexa测序平台[3],有效解决了速度慢、成本高、通量低的问题,但是其读长短,拼接得到的转录本结构不完整。PacBio平台单分子实时测序技术,也称为SMRT(Single Molecule Real-Time)测序,因其超长的测序读长、超高的测序通量、无GC偏好性、无PCR扩增偏向性、直接检测碱基修饰等诸多优势而广泛应用于水产领域研究,为基因组学、转录组学及DNA甲基化等研究注入了新活力[4]。张金勇等[5]对金乌贼 (Sepia esculenta) 采用全长转录组测序,筛选SSR位点并分析出现频率较高且类型丰富、多态性潜能较高等特点。Zhang等[6]利用三代测序技术筛选施氏鲟  (Acipenser schrenckii)  性腺中早期配子发生的相关基因,探讨了其生殖调控机制。Pootakham等[7]利用三代测序技术对斑节对虾生成第1个全长转录组。因此,利用三代测序技术对波纹龙虾全长转录组测序,分析环境因子相关胁迫差异基因,以期为相关功能基因的研究以及波纹龙虾养殖过程中水质调控和抗环境因子变化胁迫等提供理论支持和数据支撑。

波纹龙虾隶属于十足目(Decapoda)龙虾科(Palinuroidea)龙虾属( Panulirus), 是我国沿海地区的重要经济种类,营养丰富,味道鲜美[8-9]。目前波纹龙虾基因组尚未测序完成,其基因序列信息比较匮乏,相关的分子遗传基础也很薄弱,分子生物学水平研究也较少,仅见李斌等[10]研究了波纹龙虾C-型凝集素PhLecA的基因克隆与表达,Zhuo等[11]研究了波纹龙虾蜕皮激素受体的分子克隆、特征和表达分析,罗嘉俊等[12]研究了波纹龙虾GIH基因克隆、表达及其对光周期的响应等。笔者采用三代测序技术的PacBio 单分子实时测序平台对波纹龙虾 (Panulirus homarus) 进行全长转录组测序,通过生物信息学方法进行序列拼接、功能注释、分类和代谢通路分析,获取丰富的波纹龙虾序列信息,旨在为进一步挖掘波纹龙虾相关功能基因、基因组学及开发分子标记等研究奠定基础。

1 材料与方法

1.1 试验材料 波纹龙虾为购自海南省琼海市青葛村,体质量为21~57 g的幼龙虾,采用干运法运回广东海洋大学东海岛生物研究基地,在20 m3的水泥池中暂养,用黑色幕布遮光,24 h不间断充气。试验海水来源于自然海区,盐度为26‰~30‰,pH 为8.1~8.3,每天换水50%,投喂菲律宾蛤仔 (Ruditapes philippinarum) 等主要鲜活饵料,养殖21 d后开始试验。取正常条件养殖下波纹龙虾的肝胰腺、鳃、肌肉、性腺、眼柄和80 mg/L亚硝酸盐(NaNO2)胁迫7 d的肝胰腺(做3+2项目,取亚硝酸盐胁迫混合作全长转录组,主要是为了进行二代测序时方便筛选差异基因用于后续试验),迅速放入RNAlater中保存,后用干冰保存寄往北京诺禾致源科技股份有限公司进行RNA提取和相关测序。

1.2 RNA提取与质控 利用Trizol法分别对建库及定量试验所用的波纹龙虾组织进行RNA提取,使用1%琼脂糖凝胶电泳分析RNA纯度和完整性,Agilent 2100软件准确检测RNA完整性,用Qubit 2.0软件精确定量RNA浓度,Nanodrop软件检测RNA纯度,并选择符合测序标准的RNA等量混合用于文库建设。混合后的RNA样品纯度和完整性:6例混样的Qubit浓度为112 μL,Qubit体积为39 μL,Qubit总量为4.368 μg,样品纯度 A 260/280 1.949, A 260/230 1.303,Nano浓度为236.417 ng/μL,RIN值为3.8,NC/QC为2.11。结果表明,该例样本基线平整,符合三代建库标准。波纹龙虾是水产低等动物,RNA只有单峰值,检测时会出现其他峰值干扰从而导致RIN值较低的情况,但6例混样的组织RIN值均符合二代测序要求。

1.3 测序文库构建转录组 文库的构建流程如图1,构建好的文库进行质量检测后,在Illumina高通量测序平台NovaSeq 6000进行测序(诺禾致源科技有限公司,天津)。

1.4 全长转录组测序及序列分析 测序完成后对原始下机数据进行去接头和低质量reads,得到高质量数据,采用软件SMRTlink v8.0对高质量数据进行序列组装,得到波纹龙虾的转录组基因数据(Unigene)库。序列分析步骤分别是使用下机数据中subreads.bam文件通过CCS算法,对单分子多测序序列进行自我更正,获得CCS (circular consensus sequence)序列;通过检测CCS是否包含poly-A、5′-primer、3′-primer,对CCS进行分类并找出FLNC(full-length non chimera:全长非嵌合序列)序列和nFL(Non-Full-Length:非全长非嵌合序列)序列;将同一转录本的FLNC序列使用hierarchical n*log(n)算法聚类,得到consensus序列;最后对由此产生的全长序列进行polish,获得Polished consensus序列进行后续分析。具体流程见图2。

经典小说推荐

杂志订阅

友情链接