棉籽油性状全基因组关联分析研究进展
作者: 刘文豪 余渝 吴珂 刘丽 李航 孔宪辉摘要 棉籽油味道柔和,色泽金黄,在各种食品中起着至关重要的作用。此外,棉籽油因其独特的脂肪酸特性、抗炎和心脏保护特性而备受关注。因此,了解调控棉籽贮藏油生物合成的遗传机制,开展关键基因挖掘,选育高油优质棉花品种具有重要意义。随着高通量测序技术和生物信息学分析工具的快速发展,全基因组测序变得更加简单高效,使得全基因组关联分析技术(GWAS)成为了研究复杂性状的一种核心工具。介绍了GWAS的原理及研究优势,论述GWAS在不同油料作物及棉花性状研究中的应用进展。并对今后棉籽油相关性状的遗传研究提出了一些建议,对存在的问题进行探讨及展望,旨在为今后利用GWAS进行棉籽油性状遗传基础的研究及分子标记辅助育种提供理论依据。
关键词 棉籽油;GWAS;复杂性状;基因
中图分类号 S562 文献标识码 A 文章编号 0517-6611(2024)13-0011-04
doi:10.3969/j.issn.0517-6611.2024.13.003
开放科学(资源服务)标识码(OSID):
Progress in Genome-wide Association Analysis of Cottonseed Oil Traits
LIU Wen-hao,YU Yu,WU Ke et al
(Cotton Research Institute,Xinjiang Academy of Agricultural and Reclamation Science / Northwest Inland Region Key Laboratory of Cotton Biology and Genetic Breeding,Ministry of Agriculture and Rural Areas,Shihezi,Xinjiang 832000)
Abstract Cottonseed oil,soft in taste and golden in color,plays a crucial role in various foods.In addition,cottonseed oil has attracted much attention due to its unique fatty acid properties,anti-inflammatory and heart protective properties.Therefore,it is of great significance to understand the genetic mechanism that regulates the biosynthesis of cottonseed storage oil,carry out key gene mining,and select high-quality cotton varieties with high oil content.With the rapid development of high-throughput sequencing technology and bioinformatics analysis tools,whole genome sequencing has become simpler and more efficient,genome-wide association analysis (GWAS) has become a key tool for studying complex traits.This paper introduces the principle and research advantages of GWAS,discusses the progress of its application in the research of different oil crops and cotton characters.Some suggestions for future genetic studies of cottonseed oil related traits were put forward.The existing problems were discussed and prospected in order to provide a theoretical basis for future studies on the genetic basis of cottonseed oil traits and marker-assisted breeding by GWAS.
Key words Cottonseed oil;GWAS;Complex traits;Genes
基金项目
棉花生物学国家重点实验室开放课题(CB2022A27); 新疆生产建设兵团第三师重大科技计划(KY2022ZD02);国家重点研发计划子课题(2022YFD1200305-3)。
作者简介 刘文豪(1992—),男,安徽界首人,助理研究员,硕士,从事棉花育种研究。*通信作者,研究员,硕士,从事棉花育种研究。
收稿日期 2023-09-04
棉花是世界上重要的纤维作物,约占全球纤维消费总量的35%[1]。也是仅次于大豆、棕榈、油菜籽和向日葵的第五大油料作物[2]。棉花作为食品、饲料和可再生纤维的主要商业商品在30多个国家种植[3]。棉纤维和棉籽的产量比例通常为1∶1.65,棉籽是棉花中仅次于纤维的第二大有价值的成分[4]。棉籽是人类食用油的主要来源[5],整粒棉籽或榨油后的棉粕是动物饲料的常用来源[6]。棉籽含有丰富的蛋白质(20%~25%)、油脂(18%~25%)、碳水化合物、纤维素和矿物质元素[7],具有较高的利用价值[8]。随着无腺体棉籽的出现,提高棉籽的利用率已成为近年来研究的一个热门话题[9]。
植物油具有特殊的理化性质,在人类营养饮食中发挥着至关重要的作用[10]。棉籽油(CSO)由于其高纤维含量和抗自氧化的稳定性而受到越来越多的关注[9]。据报道,棉籽油在各种食品中起着至关重要的作用,如起酥油、人造黄油、液体油和其他加工脂肪,而在家庭、餐馆和食品加工商制作的食品中,棉籽油也已成为重要的成分[11]。精制棉籽油味道柔和,色泽金黄,用于制作饼干、薯片、甜甜圈和冰激凌[10]。此外,棉籽油因其独特的脂肪酸特性、抗炎和心脏保护特性而在全球食用油市场上享有良好声誉[9]。Son等[12]研究发现,富含棉籽油的饮食改善脂肪肝雄性小鼠模型的肝脏和血浆脂质水平。Sun等[13]研究发现,棉籽油是一种脂溶性溶剂,可通过抑制脱铁作用减轻缺血性脑卒中损伤和氧化应激,对缺血性脑卒中的神经保护提供了一种新的潜在治疗机制。Liu等[14]发现,棉籽油通过抑制小胶质细胞和星形胶质细胞的炎症激活来减轻缺血性脑卒中损伤。Park等[15]研究证明,棉籽油通过减少炎症细胞因子和氧化应激标志物对葡聚糖硫酸钠诱导的肠道炎症具有保护作用。此外,除了用作食用油外,棉籽油在化妆品、农业和化学品等许多领域都有应用[9]。随着豆油等常见植物油脂来源的短缺,迫切需要为肉鸡生产商寻找替代油脂来源。Yang等[16]研究发现,精制棉籽油可替代肉鸡日粮中的大豆油作为关键饲料成分。近来,使用棉籽油作为生物柴油的原料,也引起了相当大的关注,与化石燃料相比,棉籽油具有负碳特性,可以显著减少二氧化碳排放[17]。
棉花作为一种四倍体物种,有着复杂的遗传基础和丰富的遗传机制,这些遗传机制支撑着棉籽中各种有价值代谢产物的积累和覆盖种子的纤维发育[4]。截至目前,棉花研究主要集中在棉纤维的产量和质量上。而种子性状的研究集中于种子发芽和种子大小,其他的种子性状研究相对较少。因此,尽管棉籽具有丰富的可用性和良好的改良潜力,但其研发重点一直落后于其他油料作物[4]。随着高通量测序技术和生物信息学工具的快速发展,全基因组测序变得更加简单方便,使得全基因组关联研究(GWAS)成为了研究复杂性状的一种强大而普遍的工具[18]。GWAS具有定位精确度高和检测范围广的优点,被广泛用于剖析一些主要作物的复杂性状[19]。例如花生[20]、水稻[21]、玉米[22]以及大豆[23]等作物的分子标记辅助育种研究。该研究总结了GWAS技术在棉籽油品质性状相关基因挖掘中的研究进展,为今后通过分子标记辅助育种途径改善油料作物品质提供参考借鉴。
1 GWAS研究概述
一个物种的遗传多态性和个体之间观察到的表型差异的因果关系具有重要的生物学意义。预测人类疾病的遗传风险因素,或者研究植物生长速度和产量等重要农艺性状,需要了解表型背后的特定基因座和性状的遗传结构。表型和基因型之间的这种关系一直备受关注[24]。正向遗传学是解决这些问题的一个非常强大的工具,在正向遗传学中,许多基因型不同的个体都会被筛选出目标表型。一般来说,被筛选的原始遗传差异是通过诱变或从自然群体中取样获得的。任何已鉴定的表型差异都通过各种定位方法与潜在的功能基因座联系起来。2000年至今,进行基因研究所需的技术和分析工具越来越容易获得,高密度SNP阵列和DNA重测序已经应用于许多生物的大部分基因型空间,包括人类[25]和拟南芥[26]。而且人们对研究遗传因素引起的变化影响越来越感兴趣[27]。全基因组关联研究(GWAS)是近些年用于解析动植物复杂数量性状的一种常见方法,将群体基因组中表型与其潜在遗传学之间的点联系起来[1]。它最早被开发并应用于人类疾病遗传学领域。作物研究的许多领域都将GWAS纳入了植物研究中。GWAS的目的是确定单核苷酸多态性(SNPs),其等位基因频率作为表型特征值的函数而系统变化。特征相关SNPs的鉴定对这些表型背后的生物学机制提供了新见解。技术进步方便了人们系统研究分布在整个基因组中的大量SNP带来的影响[27]。GWAS已迅速成为复杂疾病和育种性状遗传研究的有力工具[28]。
2 GWAS研究的优点
传统的植物QTL鉴定依赖基于群体的连锁分析或基于自然群体的连锁不平衡(LD)分析[29]。鉴于需要大的种群规模、高分辨率的连锁图谱和可靠的表型来确保检测的准确性,这些因素使得连锁分析存在基本的局限性,很难识别QTL背后的关键基因[30]。首先,QTL定位只能分析在特定F2杂交的亲本之间或RIL群体内分离的等位基因多样性[31]。其次,在RIL群体的创建过程中发生的重组量限制了作图分辨率[32]。相反,GWAS克服了上述QTL分析的两个主要局限性,可以利用历史重组将QTL解析到基因水平。它的广泛采用解析了复杂性状的相关变异或候选基因的快速鉴定。GWAS利用了具有丰富变异的自然群体,可以精确定位进化过程中自然群体中积累的多个等位基因[33]。
3 GWAS在不同油料作物性状研究中的应用
油料作物的品质性状是由多基因共同控制的数量性状[34]。近年来,GWAS已经成为发现油料作物品质性状相关遗传基础有力和有效的研究方法,并取得了一系列的研究进展[35]。栽培花生是一种提供食用油和蛋白质的主要油料作物,其日益增长的市场需求可以通过对产量相关性状的遗传改良来满足,Wang等[36]对195份花生材料进行GWAS分析,确定基因组区域内的36个候选基因,这些基因可能参与确定花生产量相关性状的表型变异。种皮颜色是一种典型的形态特征,可以用来揭示大豆的进化过程。Yang等[37]利用QTL定位和GWAS鉴定到3个大豆种皮相关性状的候选基因。为了深入解析中国大豆种质水溶性蛋白的遗传基础,沈甲诚等[38]以224份大豆种质为试验材料进行全基因组关联分析,在区间内共获得25个候选基因。芝麻是一种重要而传统的油料作物,芝麻的种皮颜色与蛋白质和油脂代谢中涉及的生化功能以及抗氧化剂含量有关。Cui等[39]对12个环境中的366个芝麻种质材料进行全基因组关联分析,在与芝麻种皮颜色最显著相关的4个SNPs附近鉴定出92个候选基因。在芝麻中,脂肪酸(FA)生物合成和三酰甘油(TAGs)组装的调节机制仍然存在很大未知。Zhou等[40]通过全基因组关联分析和转录组数据挖掘揭示了芝麻脂肪酸生物合成的新基因座和1个候选调控基因。干旱胁迫会严重限制向日葵的产量和质量,为了了解抗旱性的潜在机制,并确定抗旱育种的候选基因,Wu等[41]以收集到的226个向日葵自交系进行了GWAS和RNA-seq分析,鉴定出4个参与干旱反应的脱落酸相关蛋白激酶和转录因子。分枝数是影响甘蓝型油菜产量和品质的重要性状,He等[42]对甘蓝型油菜的GWAS、QTL定位和基因表达分析揭示了分枝形态发生的遗传控制。通过对几种重要油料作物不同性状的关联分析,发现了多个关键基因,为油料作物遗传改良和分子育种提供了新的依据。