首页 > 分享 > 超大基因组如何组装?41分的向日葵这样做! | 论文精读

超大基因组如何组装?41分的向日葵这样做! | 论文精读

继《CNS一周论文推荐》之后,科技君和小伙伴继续深耕论文解读,给大家带来“论文精读”,而且甄选范围更广、研读更细,助您了解疾病、动植物、微生物等领域的经典方案和技术突破。第一期,我们解读了心血管疾病发病机制。以下,是向日葵基因组论文的精读。

文献ID:


文章题目:The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution

发表期刊:《Nature》

发表时间:2017

影响因子:41.577

主要研究团队:法国卡斯塔内托洛桑国家农业研究院


研究亮点:


1. 通过纯三代测序数据,组装获得了高质量的向日葵基因组,并获得了向日葵和花器官的大量转录数据。这些数据将为向日葵的农业生产、人类营养学、生物多样性等研究领域带来新的启示。

2. 重构了菊分支的进化史,进一步确定了菊类分支II上存在三倍化事件,在约2900万年前向日葵又单独发生了一次全基因组特性重复。

3. 重构了花期和油脂代谢这两大育种性状的遗传网络,揭示了这些网络中新的候选基因,这将有助于人们在考虑到农业限制因素和人类营养需求的前提下,利用遗传多样性改善向日葵的抗逆性和产油量,加速其分子育种进程。

研究背景:


向日葵(英文:Sunflower,学名:Helianthus annus)是一种全球性的油料作物,能在包括干旱在内的各种环境条件下保持稳定的产量,同时向日葵可以作为研究向光生长及花穗发育的模式生物,然而向日葵基因组大小约3.6G,存在大量的重复序列,基因组组装是一大难题。

研究方法:


基因组测序和组装:采用PacBio RS II平台,对自交系XRQ基因型的向日葵进行测序,利用WGS 8.3组装流程进行组装。

蛋白质编码基因和重复序列注释:利用EuGene 4.2预测基因结构,利用Interpro对蛋白编码区域进行功能注释,利用LTRharvest 和LTRdigest对重复序列进行注释。

向日葵进化史和全基因组复制研究:用向日葵、朝鲜蓟、咖啡、和莴笋以及葡萄作为外群进行比较分析。通过同义替换水平评估分化距离和时间,进一步鉴定直系和旁系关系。通过染色体共线性(synteny)和Ks分析来识别基因组加倍事件。

花期和油脂代谢遗传网络:运用GWAS、QTL方法重构了花期和油脂代谢这两大育种性状的遗传网络,找到了新的候选基因。

研究成果:


1. 向日葵基因组的组装

研究通过纯三代基因组测序(PacBio RS II platform,102×)总共组装得到13,957contigs, contig N50为399kb,共组装得到了3Gb的基因组数据,占预估基因组大小的80%。研究人员利用4个高密度遗传图和1个物理图谱,构建出了17条假染色体,挂载率为97%;通过对基因组组装结果分析,发现向日葵基因组中超过75%的序列为长末端重复逆转录转座子(Long Terminal Repeat Retrotransposons,LTR-RTs),LTR-RTs以非随机的模式分布。


图1 整合了遗传学、多样性以及基因表达数据的向日葵基因组组装图

2. 向日葵的进化史和全基因组复制事件(WGD)

基于基因组组装的结果,研究人员比较了向日葵、莴笋、朝鲜蓟、葡萄、咖啡的基因组,评估了菊科植物的演化史。研究人员通过与全基因组加倍事件的经典研究物种之间的比较分析发现,向日葵、生菜、朝鲜蓟都经历了一次全基因组三倍化事件(WGT);此外,向日葵在2900万年前还发生了一次全基因组二倍化事件(WGD-2),在此过程中染色体经过多次断裂及融合,最终形成向日葵现在的17条染色体。


图2 向日葵进化史

3. 花期和油脂农艺性状研究

研究人员通过转录组测序获得了不同组织器官(根、茎、叶和8个花器官)的表达谱数据,同时构建了不同激素水平和逆境压力下的基因共表达网络;共预测出了52,232个编码基因、5803个lncRNA、123个miRNA;其中67个lncRNA及1,020个mRNA被鉴定为miRNA的靶基因。


图3 向日葵转录组的组装特性性表达

研究通过转录组测序获得了不同组织器官的表达谱数据,同时构建了不同的激素水平和逆境压力下的基因共表达网络;通过拟南芥花期相关数据库,在向日葵中共找到了270个与拟南芥花期相关的旁系同源基因;通过对480个F1代个体进行GWAS分析,在基因组上找到了与花期相关的35个候选区域。这些区域与通过QTL定位获得的区间相吻合,证实了结果的准确性。另外,研究发现花期网络是由最近的全基因组倍增塑造的,这意味着,在数千万年中,古老的橫向同源基因(基因组中由于倍增产生的同源基因)都能在同一调控网络中保留下来



图4 a.向日葵花期调控基因网络关系 b.向日葵花期基因在染色体上的分布

研究构建了全基因组范围内的油脂代谢网络,在向日葵基因组中找到了与油脂合成相关的12条代谢通路,包含429个基因。通过对产油及不产油两个群体的80份材料进行FST分析,研究人员发现了与油脂代谢通路相关的基因在差异区域中能被富集;有9个油脂代谢相关基因在高油和低油品系中分化明显,在驯化后的育种过程中受到了人工选择。



图5 向日葵油脂代谢通路分析

文章总结


在该文章中,法国科学家利用纯三代PacBio测序,组装获得了高质量的向日葵的基因组数据,通过比较基因组分析,重构了向日葵的进化史和全基因组复制事件,推动了菊科植物的进化史研究;结合重测序和转录组测序数据,利用GWAS和QTL定位分析,重构了向日葵的花期和产油量性状相关的基因网络,并定位了相关候选基因,为向日葵的分子化育种提供重要参考依据。

科技君点评


向日葵基因组大小达3.6G,这给组装带来巨大的难题,文章中对大基因组的组装策略以及基因组复制事件的研究,可以为今后大基因组大染色体的组装和研究带来一些参考和启示。

参考文献:

Badouin H, Gouzy J, Grassa C J, et al. The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution[J]. Nature, 2017, 546.

撰稿:王晓丽

编辑:市场部

【近期热文】

十年!一文说清微生物与心血管疾病的重磅研究 | 论文精读

MGISEQ-2000重磅推出PE150测序试剂 | 只等你来

那些年,我们一起pick的封面论文 | 动植物基因组

样本总是“戴错帽子”?解读错配率趋于0的DNA纳米球技术

重大突破!目前最完善的小麦基因组图谱发布

Nature!BGISEQ助力解析高效利用氮肥调控机制,推动作物绿色变革新方向

CNS一周论文推荐(2018.08.30)


请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~


关注华大科技,尽享精彩科研!

↓↓↓点击下方阅读英文文献

相关知识

Nature:科学家测定向日葵基因组
园林学院科研团队完成紫薇基因组组装和群体重测序
金鱼草全基因组精细图谱公布—论文—科学网
微生物组入门必读+宏基因组实操课程=新老司机赶快上车
泛基因组:赋能未来作物育种的基石
【江苏科技报】迄今世界最大植物基因组发布
里程碑式成果!华大基因联合破译超大凤丹牡丹基因组遗传密码
首个梅花全基因组重测序研究完成,论文在《自然通讯》发表
我校花卉工程技术研究中心在龙游梅高质量基因组组装及曲枝性状形成机制解析方面取得重要进展
科学家解析月季基因组

网址: 超大基因组如何组装?41分的向日葵这样做! | 论文精读 https://m.huajiangbk.com/newsview724929.html

所属分类:花卉
上一篇: 科学网—Nature Plant
下一篇: Nature Plants |