基于重测序的23份香菇种质资源全基因组序列分析
作者: 宋琳琳 陈红芝 毋柳柳 李畅 孟丽 孔维丽
摘 要:为了对河南香菇主产区的主栽品种进行鉴定,并分析其遗传多样性,将河南主栽的23份香菇种质资源进行重测序,对单核苷酸多态性(single nucleotide polymorphism,SNP)和小片段插入缺失(insertion-deletion,InDel)等数据进行统计和分析,并基于SNP变异对23份香菇资源进行遗传结构分析、进化树构建和主成分分析。结果表明,在23份香菇样本中,比对到参考基因组上的reads数目占总数的比例范围为72.53%~90.60%,样品平均测序深度范围为12.83~19.99,覆盖率范围为91.89%~99.32%。SNP位点共计14 115 075个,InDel共计1 909 516个。23份香菇样本的群体遗传结构及系统发育分析表明其包含3个谱系,遗传距离0.054 90~0.656 89,推测它们至少有3个祖先遗传成分。结合主成分分析法明确各菌种间的亲缘关系远近,证明了菌种分支具有明显的地域性。综合分析表明,以基因序列相似度、遗传距离差异及亲缘关系远近为主要依据特点,有助于对香菇地方品种命名和其特征特性关系的认识,促进优异种质资源的交流与利用。
关键词:香菇;重测序;单核苷酸多态性;插入缺失变异;群体遗传结构
中图分类号:S646 文献标志码:A 文章编号:1673-2871(2024)03-028-07
Whole-genome squence analysis of 23 Lentinula edodes germplasms based on genome re-sequencing
SONG Linlin1, CHEN Hongzhi2, WU Liuliu1, LI Chang3, MENG Li1, KONG Weili4
(1. School of Life Science , Henan Institute of Science and Technology, Xinxiang 453003, Henan, China; 2. Xinxiang Institute of Engineering, Xinxiang, 453700, Henan, China; 3. School of Faculty of Arts and Law, Zhengzhou Technology and Business University, Zhengzhou, 451400, Henan, China; 4. Edible Fungus Research Institute, Henan Academy of Agricultural Sciences, Zhengzhou 450000, Henan, China)
Abstract: To identify and analyze the genetic diversity of Lentinula edodes isolated from the main producing area in Henan province, the study resequenced the genomes of 23 cultivated L. edodes germplasm resources. The researchers analyzed the single nucleotide polymorphism (SNP) and insertion-deletion (InDel) data, and finished the genetic structure analysis, phylogenetic tree construction and principal component analysis based on the SNP variation. The proportion of reads matched to the reference genome ranged from 72.53% to 90.60% among the samples, with an average sequencing depth ranging from 12.83 to 19.99 and coverage rates ranging from 91.89% to 99.32%. The researchers identified a total of 14 115 075 SNP sites and 1 909 516 InDel sites. The results revealed the presence of three lineages with genetic distances ranging from 0.054 90 to 0.656 89, indicating the existence of at least three ancestral genetic components. Based on the principal component analysis, the relative distance of each strain was confirmed, which proved that the strain branches had obvious regional characteristics.The comprehensive analysis considered the similarity of gene sequences, genetic distance differences, and the relationships among relatives as the main characteristics. The understanding of these characteristics could facilitate the exchange and utilization of excellent germplasm resources. Additionally, the study provided insights into the relationship between the naming of local varieties and their genetic characteristics.
Key words: Lentinula edodes; Resequencing; Single nucleotide polymorphism; Insertion-deletion variation; Population genetic structure
香菇(Lentinula edodes)又名香蕈、冬菇,隶属于伞菌目(Agaricales)光茸菌科(Omphalotaceae)小香菇属(Lentinula)食用菌,是国际公认的健康食品[1-2]。香菇富含蛋白质、多糖、维生素、微量元素等营养物质。香菇多糖已被证实具有抗病毒、抗衰老、预防心脑血管疾病、预防肝硬化、保护肾功能等功效[3-4];香菇粗纤维可以帮助消化、缓解便秘、减肥;香菇中的嘌呤、胆碱等可以降血压、降血脂,预防肝硬化及动脉硬化的发生;近年来研究证明,食用香菇对减少糖尿病及其并发症,如坐骨神经痛、视网膜炎等均有一定的治疗作用[5-7]。
据中国食用菌学会2022年统计,2021年河南省食用菌总产量576.13万t,位居全国第一。全省食用菌各类品种折合超过57.57亿袋,产值410.37亿元,较2020年增长2.16%,其中香菇以387.04万t的产量位居各种主要食用菌产量之首,占全部食用菌产量的68.07%。品质好、性状稳定的菌种是香菇产业发展的基础,但多年来河南省品种繁多、引种不清、命名混乱、质量标准不统一等问题已经严重影响和制约产业的健康发展。利用形态和生理生化特征对香菇品种进行鉴定,操作繁琐,且结果不一定可靠[8]。基于各种分子标记开展的香菇种质资源亲缘关系鉴定和遗传多样性分析已陆续进行。汪昊等[9]用简单序列重复区间扩增多态性(inter-simple sequence repeat,ISSR)、相关序列扩增多态性(sequence-related amplified polymorphism,SRAP)和目标区域扩增多态性(target region amplified polymorphism,TRAP)标记对我国常见的19个香菇品种进行序列扩增和多样性分析,表明TRAP标记贡献率最高。吴小燕等[10]、肖东来等[11]、宋莹等[12]、郭金英等[13]利用ISSR分子标记对我国常见香菇栽培品种或野生菌株进行聚类分析,结果表明,野生和栽培菌株可明显分开,且名称相似或者同一地区的栽培品种聚为一类。董慧等[14]利用简单重复序列扩增多态性(simple sequence repeat,SSR)标记对我国香菇51个主栽品种进行聚类分析,认为现有的商业品种大多遗传背景相似(遗传相似系数均高于0.60)。Xiang等[15]利用68个InDel和2个SSR标记,对我国2个地区4个香菇居群的遗传变异进行分析,提出地理位置的不同分布是形成我国香菇当前遗传结构的重要因素。沈秀芬[16]用重测序获得的小片段插入缺失(insertion-deletion, InDel)标记对44份野生和地方主栽香菇菌株进行遗传多样性分析,提出了可挑选优质野生菌株和现有主栽菌株进行杂交以获得优良香菇品种的建议。有关香菇全基因组遗传关系分析的研究较多,但是利用重测序获得的单核苷酸多态性(single nucleotide polymorphism, SNP)标记对香菇菌种,尤其是国内主栽品种进行亲缘关系鉴定和遗传多样性分析的研究较少。
笔者针对河南香菇主产区的23份香菇种质资源进行基因组重测序(whole genome resequencing,WGR),一方面利用获得的SNP变异对23份样本进行遗传结构分析、进化树构建和主成分分析,对其亲缘关系进行鉴定,旨在解决主产区香菇菌种命名混乱的问题。另一方面,通过重测序获得香菇样本的SNP变异、InDel变异等数据,利用生物信息学的方法对其特点进行分析,为后期开发香菇重要性状分子标记、研究香菇遗传多样性和分子育种奠定理论基础。
1 材料与方法
1.1 材料
选取河南省南阳、驻马店、三门峡、漯河4个香菇主产区的23份香菇菌株作为供试材料(表1)。2023年4-6月收集河南省食用菌种质资源库、新乡市农业科学院、驻马店市农业科学院、河南科技学院微生物教研室保存的上述河南主产区的香菇品种。
1.2 菌种的活化
2023年7月,在河南科技学院生命科学学院将收集到的23份香菇菌株接种于新的PDA斜面上,28 ℃ 培养活化。选取无污染、长势良好的活化菌种接种于PDA平板上,在培养基和接种菌块之间用灭菌的玻璃纸隔开,便于后期收集菌丝。28 ℃培养一周后,用灭菌的钥勺将玻璃纸上的菌丝轻轻刮下,放入2 mL冷冻管中,立即进行液氮速冻,放入-80 ℃冰箱保存备用。
1.3 DNA提取和文库构建
将收集到的23份香菇菌丝用干冰送样,由武汉菲沙基因信息有限公司进行DNA提取。检验合格的DNA样品通过Covaris破碎机随机打断成长度为350 bp的片段,DNA片段经末端修复、加ployA尾、加测序接头、纯化、PCR扩增等步骤完成整个文库制备。文库质检合格后,把不同文库按照有效浓度及目标下机数据量的需求进行PE150测序。
1.4 测序质检、同参考基因组进行比对
将测序得到的原始图像经识别后,得到的原始数据(Raw reads)需要进一步去除dA、比例高于10%的含N数据、低质量数据等,得到过滤后的数据(Clean reads)。通过比对Clean reads和Raw reads,以及Q20、Q30的数值等检测测序质量。以香菇Lentinula edodes ASM1547640v1(NCBI Accession:GCA_015476405.1)为参考基因组,将过滤后的Clean reads用微生物重测序分析软件BWA(Burrows wheeler alignment,0.7.17)与参考基因组比对,利用GATK(Genome analysis toolkit,4.2.0.0)软件对PCR重复进行去重处理。对去重后的数据进行比对率、覆盖度和测序深度的统计。