基于RNA-Seq技术对不同品种猪排卵前卵泡差异表达基因的筛选与注释
作者: 刘林清 李庆岗 苏世广 周梅 张威 王重龙
摘要 [目的]筛选淮猪和大约克猪排卵前卵泡组织差异表达基因。[方法]采集淮猪和大约克猪各3头的排卵前卵泡,提取RNA,个体独立建库。采用RNA测序技术以及GO和pathway方法对所获序列进行显著性富集分析。[结果]测序后,获得的淮猪clean reads数分别为 85 958 912、91 701 082、84 448 828,其中有效Reads数分别达到98.39%、98.59%、96.04%;获得的大约克猪clean reads数分别为87 914 166、80 480 542、85 994 612,其中有效reads数分别达到98.61%、96.95%、98.80%,测序饱和度良好(证明测序数据真实可靠)。结果表明,筛选到上调基因67个,下调基因54个。GO和 Pathway分析发现,差异表达基因富集在繁殖过程、生长过程和代谢过程及WNT信号通路、卵巢类固醇生成通路和类固醇生物合成通路等。[结论]获得了猪排卵前卵泡基因表达谱,并筛选到与繁殖性状相关的关键候选基因。
关键词 淮猪;大约克猪;RNA-Seq;差异表达基因
中图分类号 S828 文献标识码 A 文章编号 0517-6611(2024)11-0076-04
doi:10.3969/j.issn.0517-6611.2024.11.016
Screening and Annotation of Differentially Expressed Genes in Preovulatory Follicles of Different Breeds of Pigs Based on RNA-Seq Technology
LIU Lin-qing, LI Qing-gang, SU Shi-guang et al
(Institute of Animal Husbandry and Veterinary Medicine,Anhui Academy of Agricultural Sciences/Anhui Provincial Key Laboratory of Livestock and Poultry Product Safety Engineering, Hefei, Anhui 230031)
Abstract [Objective]This study aimed to find differentially expressed genes in preovulatory follicles of Huai pig and Yorkshire pig. [Method]This study collected preovulatory follicles from three Huai pig and three Yorkshire pig, respectively, extracted RNA and established individual independent libraries. RNA-Seq technology was used to conduct high-throughput Transcriptome sequencing of the sample library, and the obtained sequences were analyzed for GO and pathway significance enrichment. [Result]The number of clean reads obtained from Huai pigs was 85 958 912,91 701 082,84 448 828, with effective reads reaching 98.39%, 98.59%, and 96.04%, respectively; the number of clean reads obtained from the large Yorkshire pig was 87 914 166,80 480 542,85 994 612, with effective reads reaching 98.61%, 96.95%, and 98.80%, respectively. The high saturation degree of sequencing demonstrated that the data were realistic and reliable.The results showed that 67 upregulated genes and 54 down regulated genes were screened. GO and Pathway analysis found that differentially expressed genes were enriched in the reproductive, growth, and metabolic processes, as well as the WNT signaling pathway, ovarian steroid production pathway, and steroid biosynthesis pathway. [Conclusion]This study obtained the gene expression profiling of porcine preovulatory follicles and identified novel candidate genes for reproductive traits.
Key words Huai pig;Yorkshire pig;RNA-Seq;Differentially expressed genes
基金项目 2022年度畜禽产品安全工程安徽省重点实验室青年人才托举工程创新引导资金(XMT2022-09);安徽省财政农业种质资源保护与利用资金项目;安徽省学术和技术带头人后备人选项目(2022H300);安徽省科技特派团项目;安徽省生猪产业技术体系项目(AHCYJSTX-05-12, AHCYJSTX-05-23)。
作者简介 刘林清(1980—),女,山东莱芜人,助理研究员,博士,从事猪的遗传育种研究。
*通信作者,研究员,博士,从事猪遗传育种和健康养殖研究。
收稿日期 2023-10-17;修回日期 2023-11-13
繁殖性状尤其是产仔数性状是养猪业重要的生产性状,是猪的商业化品系选育中的重要选育指标,直接关系到养猪产业的经济效益。作为复杂的数量性状,产仔数遗传力较低,且影响因素很多。中外猪种在繁殖性状方面存在显著差异[1],随着后基因组时代的来到,应用最广泛的技术之一是转录组学[2]。该技术已经应用于水稻[3]、海鲈鱼[4]、小鼠[5] 等的RNA测序。并有研究者利用该项测序技术筛选出了不同猪种间的差异表达基因,并进行了相应的分析[6]。利用组学技术筛选该类性状的功能候选基因具有重要意义。因此,笔者选取淮猪和大约克猪的卵巢进行了RNA-Seq分析,旨在挖掘在卵泡发育、排卵过程中瞬时表达的关键基因,从而为完善与猪卵泡生长发育、排卵的基因调控及其复杂的调控网络提供科学依据。
1 材料与方法
1.1 试验材料
采集经孕马血清促性腺激素(PMSG)和绒毛膜促性腺激素(HCG)处理后的4月龄淮猪和6月龄大约克猪的成熟卵泡组织各3头,-80 ℃贮存。
1.2 卵泡RNA的提取与测序
将采集的组织直接送交广州基迪奥生物科技有限公司提取RNA,并进行RNA测序。
1.2.1 Trizol 法提取卵泡总RNA。
Trizol 试剂是直接从细胞卵泡组织中提取总RNA 的试剂,其在破碎和溶解细胞时能保持RNA 的完整性。裂解细胞并释放出RNA,加入氯仿后离心,样品分成水样层和有机层。酸性条件可使RNA 与DNA 分离,RNA 存在于水样层中。收集上面的水样层后,RNA 可以通过异丙醇沉淀来还原。
1.2.2 RNA质量检测。
主要进行3种检测,即琼脂糖凝胶电泳、Nanodrop 微量分光光度计检测和Agilent 2100 检测。
1.2.3 RNA-seq文库构建。
通过带有Oligo(dT)的磁珠富集具有polyA尾巴的真核mRNA后,用超声波把mRNA打断。以片段化的mRNA为模版,随机寡核苷酸为引物,在M-MuLV逆转录酶体系中合成cDNA第1条链,随后用RNaseH降解RNA链,并在DNA polymerase I 体系下,以dNTPs为原料合成cDNA第2条链。纯化后的双链cDNA经过末端修复、加A尾并连接测序接头,用AMPure XP beads筛选200 bp左右的cDNA,进行PCR扩增并再次使用AMPure XP beads纯化PCR产物,最终获得文库。文库构建质量检测标准如下:
①琼脂糖凝胶电泳:分析样品RNA完整性及是否存在DNA污染;
②NanoPhotometer spectrophotometer:检测RNA纯度(OD260/280及OD260/230);
③Qubit 2.0 Fluorometer:RNA浓度精确定量;
④Agilent 2100 bioanalyzer:精确检测RNA完整性。
1.3 数据分析
1.3.1 原始数据处理。利用fastp[7]进行质控,并进行reads过滤,步骤如下:
①去除含adapter 的reads;②去除含N 比例大于10%的reads;③去除全部都是A碱基的reads;④去除低质量reads(质量值Q≤20 的碱基数占整条read 的50%以上)。
1.3.2 差异基因的筛选。使用edgeR[8]软件分析获得的read counts数据,筛选FDR<0.05 且|log2FC|>1的基因为显著差异基因。
1.3.3 GO功能显著性富集。利用GO数据库,获得差异表达基因中显著富集的GO条目。
1.3.4 KEGG Pathway显著性富集分析。经过多重检验校正后,可获得差异表达基因中显著富集的Pathway(Q≤0.05)。
2 结果与分析
2.1 差异基因筛选
以淮猪为对照,大约克猪与之相比,差异表达基因中有67个上调基因,54个下调基因(图1)。
2.2 差异表达基因的GO功能显著性富集
GO广泛应用于转录组数据分析中[9]。通过GO功能显著性富集分析发现,已注释的猪卵泡差异表达基因有745个,其中有336个基因参与生物学过程、所占比例为45.10%,有110个基因参与分子功能,所占比例为14.77%及有299个基因参与细胞组分,所占比例为40.13%。由此可以推测,生物学过程在淮猪和大约克猪繁殖性状差异中起着重要作用。
差异表达基因参与的显著性(P<0.05)生物过程主要包括繁殖过程,生长过程及代谢过程等;细胞组分主要表现在细胞外基质、细胞外复合体等;分子功能主要表现在分子转化活性、分子功能调节及信号转导活性等(图2)。
2.3 差异表达基因的KEGG Pathway功能显著性富集
KEGG数据库记录基因产物的相互作用网络[10]。通过KEGG pathway信号通路分析发现,有23 948个差异表达基因,参与了110条生物学代谢通路,其中主要参与繁殖方面的通路包括WNT信号通路、卵巢类固醇生成因子及类固醇生物合成通路等(图3)。