潜在马铃薯晚疫病抗性基因的表达和SNP标记分析
作者: 李晓川 王朝海 周平 马维 陈军 陆燚 吴显 王宗明 吴瑞 宋治豪 马杰 付毅
摘要 从马铃薯参考基因组中筛选出了433个NBS-LRR类基因,并绘制这些基因在基因组中的分布图,这些基因的其中一部分成簇分布。马铃薯基因组测序协会(PGSC)的转录组数据分析显示,只有12个NBS-LRR类基因在PGSC的转录组数据中完全没有检测到表达,不同NBS-LRR类基因转录水平不同,一部分NBS-LRR类基因有较高的生物胁迫和激素刺激应激性。分析了这433个基因的编码区域的单核苷酸多态性(SNP)位点,SNP标记作为在高通量测序和生物大数据分析中最常使用的遗传标记,有助于鉴定NBS-LRR基因在不同马铃薯品种中的实际抗病性。
关键词 马铃薯;晚疫病;抗性基因
中图分类号 Q37 文献标识码 A 文章编号 0517-6611(2023)10-0079-06
doi:10.3969/j.issn.0517-6611.2023.10.017
Abstract In this paper, 433 NBSLRR genes were screened from the Solanum tuberosum reference genome, and the distribution of these genes in the genome were mapped, showing that some of these genes were distributed in clusters. Only 12 NBSLRR genes were not detected in all of the transcriptome analysis data of PGSC. The expression levels of different NBSLRR genes were different, and some NBSLRR genes had higher biological and hormonal stimulation irritability. The single nucleotide polymorphism (SNP) sites in the coding regions of these 433 genes were also analyzed. As the most commonly used genetic markers in highthroughput sequencing and biological big data analysis, SNP markers are helpful for the identification of actual disease resistance of NBSLRR genes in Solanum tuberosum varieties.
Key words Solanum tuberosum;Phytophthora infestans (Mont.) DE Bary;Resistance (R) gene
马铃薯(Solanum tuberosum)适应性广,丰产性好,营养丰富,经济效益高,已成为世界上继水稻、小麦的第三大粮食作物[1]。但在生产中经常受到其第一大病害——晚疫病的危害造成产量严重降低。晚疫病是由致病疫霉菌[Phytophthora infestans(Mont.)de Bary.]引起,特别是由于病原菌A2交配型的出现,与原A1交配型有性杂交,发生变异,导致最初的抗病马铃薯品种失去抗性[2-3]。
目前已经发现多个马铃薯晩疫病抗病基因(R基因),包括克隆自Solanum demissum中,位于第5号染色体上的R1[4],第4号染色体上的R2[5],第11号染色体上的R3a[6]和R3b[7],第9号染色体上的R8[8];克隆自Solanum bulbocastanum,位于第8号染色体上的Rpi-blb1(RB)[9-10],第6号染色体上的Rpi-blb2[11],第9号染色体上的Rpi-blb3和第4号染色体上的Rpi-abpt[5];来源于Solanum venturii位于第9号染色体上Rpi-vnt1.1、Rpi-vnt1.2和Rpi-vnt1.3[12];来源于Solanum stoloniferum位于第8号染色体上Rpi-sto1和Rpi-pta1[13-14];来源于Solanum americanum位于第4号染色体上Rpi-amr3i[15]。已鉴定出的R基因都拥有NBS-LRR(Nucleotidebinding site and leucinerich repeat)结构,因此可以利用基因结构上的保守型从参考基因组中筛选潜在的抗性基因[16-17]。目前已在多个植物的参考基因组中筛选出NBS-LRR类基因,包括重要的作物水稻[18]、小麦[19]、玉米[20]、大豆[21]、棉花[22]、十字花科[23]、黄瓜[24]、模式生物-拟南芥[25]以及茄科植物辣椒、番茄[26]和茄子[27]等。虽然马铃薯晩疫病抗病基因能提供抗病性,但单个R基因导入带来的抗性易被变异的致病疫霉菌克服,如将RD基因导入而育成的栽培种Biogold,在田间种植不到1年即被晚疫病菌克服[28],但通常认为引入多个R基因能够增强晚疫病抗病表现[29]。因此,尽可能多地筛选出晩疫病抗病基因,有助于马铃薯晚疫病抗性育种。
高通量测序技术提高了人们对作物遗传学的理解。由于普通栽培马铃薯基因组是高度杂合的同源4倍体的特性。马铃薯基因组测序协会(potato genome sequencing consortium,PGSC)首先通过对一个纯合的双单倍体(DM1-3 516 R44,DM)马铃薯品种测序得到了马铃薯参考基因组,参考基因组提供了详细的马铃薯基因座信息,因此可以通过序列比对在参考基因组中查找具有保守序列和结构域的基因[30]。并且利用参考基因组对一个(杂合二倍体RH89-039-16,RH)马铃薯品种重测序,基因分型得到了两者之间的单核苷酸多态性位点(SNP)。PGSC还利用参考基因组对DM的16种组织包括:心皮、花瓣、萼片、雄蕊、花、果肉、未成熟果实、成熟果实、叶柄、叶、匍匐茎、未成熟块茎、成熟块茎、愈伤组织、根和芽的转录组,以及11种经处理包括:盐、甘露醇和热胁迫,4种激素[IAA(吲哚乙酸)、BAP(6-苄基腺嘌呤)、GA3(赤霉酸)和ABA(脱落酸)]处理,4种生物胁迫[接种晚疫病菌、2种诱导植物抗病的因子苯并噻二唑(BTH)和DL-氨基丁酸(BABA)处理以及受伤叶片]后转录组表达水平的变化情况处理进行了转录组测序。并且作为对DM转录组数据的补充和对照,PGSC还对杂合二倍体品种RH的花、雄蕊、根、叶、水分胁迫叶、叶柄、茎尖、茎、匍匐茎、未成熟块茎、成熟块茎、块茎髓、块茎皮、块茎芽、块茎皮质和整株16种组织的转录组进行了测序。转录组测序数据经随后的RNA定量验证显示出很高的准确性[30-31]。因此,可以利用R基因的NBS-LRR结构特性,分析马铃薯参考基因组种的NBS-LRR类基因,并通过转录组数据分析这些基因在不同组织和处理条件下的表达特性,以及利用基因组序列信息,分析分子标记信息,为鉴定各基因的实际抗病性鉴定打下理论基础。
1 材料与方法
1.1 马铃薯NBS-LRR类基因的鉴定
使用BLASTp工具(http://spuddb.uga.edu/blast.shtml),以期望值(E-value=1)为阈值,用已知的R基因的蛋白序列作为查询序列,以及隐马模型(Hidden Markov Model,HMM)[32],以Pfam:PF00931作为查询序号,以默认参数从马铃薯参考基因组(V 4.03)中鉴定(http://spuddb.uga.edu/integrated_searches.shtml)。利用SMART检索基因的蛋白结构域(http://smart.emblheidelberg.de/)[33];以0.9为阈值,利用 COILS 程序检索基因的CC结构域(http://www.ch.embnet.org/software/COILS_form.html)[34]。基因的氨基酸序列利用Clustal Omega在线服务器进行多序列比对,利用Neighbor-Joining参数进过计算1 000次生成树图(http://www.ebi.ac.uk/Tools/msa/clustalo/)。
1.2 马铃薯NBS-LRR类基因的表达分析
利用马铃薯基因组测序协会(potato genome sequencing consortium,PGSC)的Illumina RNA 测序数据分析NBS-LRR类基因在不同组织和处理方式下的表达模式[30-31]。转录组数据的表达丰度用每百万个映射上的片段数中映射到外显子中的每1 000个碱基上的片段个数(fragments per kilobase of exon model per million mapped reads,FPKM)值表示。对不同组织内NBS-LRR类基因表达水平的热图(Heat map)进行构建时,FPKM 值首先经过以2为底数的对数进行转化。构建生物胁迫以及激素处理时NBS-LRR类基因表达水平变化的热图时,首先计算与对照的对比值,以log2比值的相对值≥1确定为差异表达基因[31]。热图使用 MeV 4.9.0 软件进行构建[35]。相关性分析用IBM SPSS Statistics 22 软件进行(SPSS GmbH Software,Munich,Germany)。
1.3 马铃薯NBS-LRR类基因编码序列的SNP标记分析
NBS-LRR类基因编内的SNP标记信息来源于以DM为参考基因组,RH重测序信息,Sol-CAP对于6个常见栽培种的转录组测序信息,以及对大西洋(Atlantic)和Superior的重测序信息[6,36]。
2 结果与分析
2.1 马铃薯NBS-LRR类基因的鉴定
从马铃薯参考基因组中鉴定得到433个NBS-LRR类基因,其中366个基因能够定位到12个染色体中。在这些基因中的142个基因间的距离小于1.0 mb,其中44个基因间的距离小于10 kb。21个基因定位于第4染色体上2.0 mb的染色体区域,12个基因定位于第5染色体上1.5 mb的染色体区域,22个基因定位于第11染色体上2.0 mb的染色体区域,说明这些基因的其中一部分成簇分布(图1)。433个NBS-LRR类基因中的103个基因蛋白编码序列的N端含有一个CC(coiled-coil)结构域,这与已发现的晚疫病抗性基因的CC-NBS-LRR蛋白结构域相同(图2)。进一步利用已知的R基因和CC-NBS-LRR基因的氨基酸序列进行比对并绘制系统进化树。进化树分成2个部分(黑色和红色),其中黑色部分没有已克隆的R基因。红色部分的进化树又可分成2个部分(基因编号突出显示和未突出显示的部分),这2部分内部又可分成2~3个小组(基因编号不同颜色字体显示)。Rpi-blb1(RB)与15个CC-NBS-LRR基因聚集成一个小组,R3a和R3b 与19个CC-NBS-LRR基因亲缘关系较近,Rpi-amr3i与14个CC-NBS-LRR基因聚集成一个小组,Rpi-vnt1.1、Rpi-vnt1.2和Rpi-vnt1.3与17个CC-NBS-LRR基因聚集成一个小组,其他7个已克隆的R基因与23个CC-NBS-LRR基因亲缘关系较近(图3)。
2.2 马铃薯NBS-LRR类基因的表达分析
利用PGSC在马铃薯不同器官和发育阶段以及在胁迫处理和激素刺激时的不同转录组测序所产生的数据,包括:DM的16种组织内基因的表达水平,DM的11种包括盐胁迫、激素刺激、生物胁迫处理后转录组表达水平的变化情况,以及以DM为参考基因组,RH的16种组织内基因的表达模式。分析NBS-LRR类基因的表达。转录组数据分析显示,只有12个NBS-LRR类基因在所有的组织或处理中完全没有检测到表达(图2)。
PGSC分别在DM和RH的16种不同组织中进行了转录组分析,提取了其中易受晚疫病侵染影响的组织的转录组表达数据,进一步分析了433个NBS-LRR类基因在不同组织和样品间的表达模式。在DM的6种组织中(根、叶、叶柄、匍匐茎、不成熟块茎和成熟块茎),433个NBS-LRR类基因,表达量FPKM均值最大的10个基因分别是PGSC0003DMG400007999、PGSC0003DMG400009635、PGSC0003DMG400007469、PGSC0003DMG400003527、PGSC0003DMG402018257、PGSC0003DMG400018464、PGSC0003DMG400031405、PGSC0003DMG400020587、PGSC0003DMG400033159和PGSC0003DMG400007471,其表达量的FPKM值在52.67~11.60。有57个基因在DM的6种组织中没有检测到表达,208个基因在这6种组织中至少有1种组织中没有检测到表达。376个基因在至少DM的6种组织之一中检测到表达,反映表达量在6种组织间离散程度的标准差(σ),最大为34.13,平均为1.76。在RH的8种组织中(根、叶、叶柄、植株、茎、匍匐茎、不成熟块茎和成熟块茎),433个之间NBS-LRR类基因,表达量均值最大的10个基因分别是PGSC0003DMG400007999、PGSC0003DMG400007469、PGSC0003DMG400031405、PGSC0003DMG400013490、PGSC0003DMG400029505、PGSC0003DMG400005335、PGSC0003DMG400007462、PGSC0003DMG400018428、PGSC0003DMG400018429和PGSC0003DMG400026187,其表达量的FPKM值在60.27~12.58。有32个基因在RH的8种组织中没有检测到表达,179个基因在这8种组织中至少有1种组织中没有检测到表达。401个基因在至少RH的8种组织之一检测到表达,反映表达量FPKM值在8种组织间离散程度的标准差(σ),最大为62.45,平均为1.57。结果显示,相同的NBS-LRR类基因在DM或RH的不同组织间的表达水平有一定的差异,但整体上差异并不明显,即组织特异性不明显。在DM和RH组织之间,相同基因表达量的FPKM值均值,其中在DM中大于RH中的基因有126个,在RH中大于DM中的基因有283个,说明相同的NBS-LRR类基因在DM和RH之间,整体上基因在RH中表达水平略高于在DM中。433个NBS-LRR基因在DM和RH组织间表达水平的Pearson相关系数r=0.600(P<0.01),有显著的正相关关系,说明NBS-LRR基因在DM和RH的组织中有类似的表达模式。