基于全基因组重测序分析中国地方鸡的群体结构和保护优先权

作者: 高超群 蔡钊 胡晓玉 魏梦雅 王克君 赵姝灿 李文婷 康相涛

基于全基因组重测序分析中国地方鸡的群体结构和保护优先权0

摘要  [目的]旨在对中国本土鸡品种群体结构和保护优先权进行分析,促进畜牧业的可持续健康发展。[方法]收集了8个品种、共96个个体的重测序数据。通过主成分PCA分析、构建系统进化树及近交和遗传距离分析来了解群体结构,计算去除每个品种后总体基因和等位基因多样性的增减、模拟计算品种对具有最大基因多样性和最大等位基因多样性合成群体的贡献占比,进而系统评估品种保护优先权。[结果]所研究的品种可分为4个集群,其中藏鸡与其他品种分化最高,其自身分为2个亚群,其他品种则分为南北2个集群。藏鸡对遗传多样性的贡献最大;其次是文昌鸡和瑶鸡,此三者应考虑作为优先保护的品种。[结论]该研究结果将可为地方鸡品种保护与开发利用提供参考。

关键词  全基因组重测序;群体结构;遗传多样性;保护优先权

中图分类号  S831  文献标识码  A  文章编号  0517-6611(2024)05-0091-05

doi:10.3969/j.issn.0517-6611.2024.05.022

开放科学(资源服务)标识码(OSID):

Population Structure and Conservation Priorities Analysis of Chinese Indigenous Chicken Using Whole-genome Re-sequencing

GAO Chao-qun1,2, CAI Zhao1, HU Xiao-yu1,2 et al

(1. College of Animal Science and Technology, Henan Agricultural University, Zhengzhou, Henan 450046;2. The Shennong Laboratory, Zhengzhou, Henan 450046)

Abstract  [Objective] This study aims to analyze the population structure and conservation priorities of local chicken breeds in China to promote sustainable and healthy development of animal husbandry. [Method] The study collected whole-genome re-sequencing data of 96 individuals from eight breeds. The population structure was analyzed by principal component analysis (PCA), constructing a phylogenetic tree, and analyzing inbreeding and genetic distances. The increase or decrease in overall gene and allele diversity was calculated by removing each breed, and the contribution of each breed to the synthesis of a population with maximum gene and allele diversity was simulated to systematically evaluate breed conservation priorities. [Result] The results showed that the eight breeds were divided into four clusters, with the highest differentiation between the Tibetan chicken and other breeds, which was further divided into two subclusters. The other breeds were divided into two clusters, northern and southern. The contribution of Tibetan chicken to genetic diversity is the highest;followed by Wenchang chicken and Yao chicken, these three should be considered as the priority conservation breeds. [Conclusion] The results of this study will provide a reference for the protection, development and utilization of local chicken breeds.

Key words  Whole-genome re-sequencing;Population structure;Genetic diversity;Conservation priority

基金项目  中国博士后科学基金第66批面上资助二等资助(2019M66-2497);河南省博士后科研项目二等资助(201902030)。

作者简介  高超群(1998—),男,河南周口人,硕士研究生,研究方向:家禽遗传育种。

*通信作者,副教授,博士,从事动物遗传育种与繁殖研究。

收稿日期  2023-03-30

由于本土品种可以更好地适应其特定的环境条件,人们对保护当地品种的关注日益增加[1-2]。中国作为家鸡驯化中心,是世界上鸡遗传资源最丰富的国家之一。截至2022年,收录在《中国畜禽遗传资源志·家禽志》中的地方鸡品种达到115个,中国地方鸡在经历几千年的自然和人工选择下已形成了纷繁、各具特色的品种,清楚地研究和理解种群之间和种群内部的多样性及种群结构对于有效管理遗传资源至关重要[3]。然而,世界上每一个畜禽品种都得到保护显然是不可能实现的。因此,确定保护优先权是保种策略有效实施的关键。此前已有多项不同畜牧品种保护优先权的研究报道,例如基于微卫星标记分析希腊绵羊品种[4]与中国家鸭品种的保护优先权[5],基于SNP 芯片对牛品种进行保护优先权分析[6]。但尚未有研究对中国本土鸡品种的保护优先权进行系统评估。因此,为有效保护本土遗传资源,保障我国养鸡产业的可持续发展,尤其是在保种资金有限的情况下,确定其保护优先权是十分必要的。

为了保持种群对于未来潜在选择压力的适应力,保持遗传多样性是保护优先权的首要事项[7],遗传多样性通常利用基因和等位基因多样性来估计,由于基因多样性对选择效应敏感[8-9],等位基因多样性对瓶颈效应敏感[10]。该研究通过全基因组重测序数据分析中国本土鸡品种对遗传多样性的贡献,评估保护优先权和群体结构,以期为设计和实施遗传资源保护策略提供参考。

1  材料与方法

1.1  材料

该研究所有品种的全基因组重测序数据均收集于NCBI(Sequence Read Archive;https://www.ncbi.nlm.nih.gov/sra/)测序公共数据库,项目号为:PRJNA482210,PRJNA306389。收集的品种包括淮北麻鸡(HM)、惠阳胡须鸡(HY)、江汉鸡(JH)、宁都三黄鸡(ND)、藏鸡(TC)、文昌鸡(WC)、南丹瑶鸡(YC)、正阳三黄鸡(ZYS)8个品种,共96个个体(表1)。

1.2  方法

1.2.1  数据处理。

使用Fastp[11]默认参数对重测序数据进行过滤接头信息、低质量碱基、未测出的碱基(10%N碱基)等一系列的质量控制得到的质控数据。随后用BWA-MEN[12]将质控后的重测序数据比对到鸡参考基因组上(GRCg6a),利用SAMtools v.1.14[13]建索引、去除重复读长,利用 GATK v4.12[14]进行变异检测。使用GATK 硬过滤(参数为 “QD < 2.0 || MQ < 40.0 || FS > 60.0 || SOR > 3.0 || MQRankSum < -12.5 || ReadPosRankSum < -8.0”)得到34 073 789个SNPs,PLINK v1.9[15]过滤位点缺失率和次等位基因频率(参数为 --geno 0.2,--maf 0.01),获得4 444 055个质量较高的SNPs,利用PLINK基于连锁不平衡过滤冗余位点以降低分析偏差(参数为“indep-pairwise 50 5 0.2”),最终获得409 145个独立SNPs用于后续分析。

1.2.2  数据分析。

首先利用PLINK对数据进行PCA 分析,使用ggplot2[16]进行PCA可视化。使用MEGA X[17]设置引导复制1 000次,使用邻接法(Neighbor joining)构建系统发育树,使用网络服务器ITOL(https://itol.embl.de/)对系统发育树进行可视化及群体信息注释。为了研究各品种的分化程度,使用Hierfstat[18]计算成对群体分化指数(Fst),使用PLINK计算品种之间的基因组近交系数FHOM(基于观测和期望纯合基因型数量之间的差异估计)。使用Metapop2[19]计算每个品种的Nei’s 最小遗传距离,研究中评估遗传多样性的方法:将8个品种合成一个元种群(Meta-population),之后依次剔除品种,观察元种群基因和等位基因多样性的增减[9,19],从而得到对应品种对元种群的总基因多样性(HT)和总等位基因多样性(AT)的贡献,为了更全面地估计每个品种对总群体基因多样性的贡献,将总基因多样性(HT)分为品种内平均基因多样性(HS)和品种间平均基因多样性(DG)。 HS等于1减去品种内共祖系数,DG通过品种间平均Nei’s最小遗传距离估算。总等位基因多样性(AT)也分为品种内(AS)和品种间(DA),AS由El Mousadik和Petit[20]根据该品种的平均等位基因丰富度减1进行估算,而DA则是通过品种的平均私有等位基因数量进行估算。

另外一项模拟计算:构建一个合成池(synthetic pool),通过迭代方式向合成池内抽样,当合成池最大基因多样性和等位基因多样性最大时计算各品种个体占比,以此衡量其对遗传多样性贡献[9,19],两项结果使用Z-score标准化得到其标准分数,Z-score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性,Z-score标准化公式等于处理值减去组内平均数最后除以标准差[21]。

2  结果与分析

2.1  中国8个地方品种的群体结构分析

2.1.1  系统进化树与PCA分析。

PCA和系统进化树对8个中国地方鸡品种的分析结果见图 1。PCA分析结果(图 1A)显示,每个品种的个体都相对集中地聚集在一起。来自8个地方鸡品种的个体分为4个集群,在PC1主成分上藏鸡与其他品种分开;在PC2主成分上藏鸡(TC)又分为2个亚群,华中地区的3个品种(淮北麻鸡,HM;江汉鸡,JH;正阳三黄鸡,ZYS)与华南地区的4个品种(惠阳胡须鸡,HY;宁都黄鸡,ND;文昌鸡,WC;瑶鸡,YC)分为2个集群。值得注意的是,在PC1和PC2主成分上藏鸡分布均较散,表明该品种内个体间的遗传距离较远。系统进化树可视化与注释结果见图1B,进化树分析显示不同品种分别聚类在不同的分支上,其中藏鸡与其他品种处于不同的分支,华南地区鸡群体与华中地区分别聚在不同的分支上,这与PCA分析结果相一致。

经典小说推荐

杂志订阅

友情链接