广东农科院绘制栽培种花生基因组序列图谱,揭示花生起源进化和油脂改良的分子机制
花生是世界上重要的油料作物和优质植物蛋白资源。花生栽培种(Arachis hypogaea L.)起源于南美洲,推测是通过两个二倍体野生种A. duranensis(AA, 2n=20)和A. ipansis(BB, 2n=20)自然杂交后再经过染色体加倍形成的异源四倍体(AABB, 2n=4x=40)。由于栽培种花生基因组的复杂性,基于全基因组水平的研究进展缓慢,限制了生物技术在花生遗传改良上的应用。对栽培种花生基因组的解码和相关生物学问题的解析,有望加速花生从传统的遗传改良研究迈入基因组辅助育种,为培育更加高产、抗病、优质的花生新品种奠定基础。
近日,广东省农业科学院作物研究所梁炫强研究员科研团队联合福建农林大学等国内外科研单位完成了花生栽培种全基因组测序和基因功能分析,揭示花生起源进化和油脂改良的分子机制。相关研究成果以Sequencing of cultivated peanut, Arachis hypogaea, yields insights into genome evolution and oil improvement为题发表在国际著名学术期刊 Molecular Plant上。
打开网易新闻 查看精彩图片
该研究以我国花生地方品种伏花生(Fuhuasheng)为材料,该品种曾作为育种亲本被广泛应用,我国近50年来育成的花生品种,约70%与伏花生有亲缘关系。通过结合二代和三代测序数据,BioNano以及高密度的遗传图谱等多种技术和手段,绘制了栽培种花生的基因组序列图谱,成功组装出了四倍体栽培种花生的20条染色体(10条A基因组和10条B基因组)。研究表明,栽培种花生基因组大小约2.6 Gb,在A和B亚基因组中分别预测到编码蛋白的基因39,888和41,526个。预测鉴定到了5,161个转录因子,分属于58个家族,其中FAR1家族在四倍体栽培种和两个二倍体野生种基因组中都高度富集,这可能与花生某些特有的生物学特性有关。比较基因组学分析发现,四倍体栽培种与其两个二倍体野生种A. duranensis和A. ipansis 有近15,071个共有基因家族;A和B亚基因组分别有1,668和2,758个特异基因;有1,984个基因仅在栽培种基因组中特异存在。主要豆科植物的进化分析显示,花生属(四倍体栽培种和两个二倍体野生种)与其他豆科植物明显分属于不同分枝,这表明花生属经历了独有的物种进化历程。
打开网易新闻 查看精彩图片
图1. 花生基因组及其编码基因、重复序列,基因表达谱和共线性关系。
二倍体野生种A. duranensis和A. ipaensis大约在2百万年前分化,在大约18~25万年通过自然杂交加倍形成现在的栽培种花生。基因组进化分析表明花生基因组至少经过3次多倍化(polyploidization),四倍体栽培种形成时间约在18万年左右。比较两个亚染色体组发现,二者不对称进化,A基因组进化比B基因组更快。分析表明,野生种A. duranensis可能并非栽培种花生基因组中A亚基因的唯一或直接的祖先种。有假说认为花生四倍体是通过野生二倍体一次杂交后加倍形成的。通过比较栽培种基因组和野生二倍体基因组表明四倍体栽培种可能经过多次的杂交,或者多个A基因组的野生种作为了现在栽培种A亚基因组的供体。
在花生基因两个亚组中,基因丢失事件并不显著,A和B亚基因组分别有187和171个基因发生了基因丢失;与其他多倍体植物类似,有29,301个基因与野生种同源基因相比发生了移码或提前终止,而且A亚基因组显著高于B亚基因组。基因转换事件分析显示,由A转换成B(21.27%)的事件远多于B转换成A(4.03%),进一步证明了栽培种花生两个亚基因组的不对称进化特点。
同源基因的差异表达在多倍体植物中是一个普遍存在的现象。然而,在花生的两个基因组中同源基因的差异表达并不显著;在数量上,两个亚基因组表达的基因几乎一致,仅有约2%的同源基因具有表达偏好性。
在花生基因组中鉴定了2559个与油脂合成相关的基因,这些基因相对比较保守,与野生种比较发现仅12个基因。花生栽培种基因组测序的完成为花生油脂代谢等相关研究提供了丰富的候选基因资源,有助于花生遗传改良和遗传多样性研究。
广东省农业科学院作物研究所陈小平,鲁清,刘浩,洪彦彬和河北省农业科学院谷子所张嘉楠为该论文的共同第一作者,梁炫强研究员、刘仲健教授、Rajeev Varshney教授、 Andrew Paterson教授为共同通讯作者。