月季中重要性状的定位
2018.6.11
摘要
月季是世界上最重要的观赏植物,具有经济,文化和象征意义。月季在全世界种植,并以花园月季,切花和盆栽植物的形式出售。月季是远亲种,可以有各种倍性。我们的目标是通过对双单倍体进行测序,为月季开发高质量的参考基因组,结合长短reads,并锚定到高密度遗传图上,并研究其主要观赏性状的基因组结构和遗传基础.。我们从Rosa chinensis 'Old Blush'产生了一个双单倍体月季('HapOB')并产生一个月季基因锚定到7个伪染色体(512 Mb,N50为3.4 Mb和564个contig)。512Mb代表估计的月季单倍体基因组大小的90.1-96.1%。在组装中,95%仅包含在196个contigs中。使用高密度二倍体和四倍体遗传图验证挂载率。我们描述了染色体特征,包括中心体周围区域,通过注释转座元件家族和使用荧光原位杂交定位着丝粒重复序列。月季基因组与草莓属基因组显示出广泛的同线性,我们只划定了两个重要的重组。从不同的属种选择七种二倍体和一种四倍体重测序数据分析遗传多样性。结合遗传和基因组的方法,确定了关键装饰性状的潜在遗传调控因子,包括刺的密度和花瓣数量。认为月季APETALA2 / TOE同系物是月季花瓣数量的主要调节者。这个参考序列是研究多倍体化,减数分裂和发育过程的重要资源,正如针对花和刺的发展所展示的。它还将通过开发与性状相关联分子标记以加速育种,识别基因,探索蔷薇科的共线性关系。
结果:
1.高质量的参考基因组
从二倍体杂合品种'Old Blush'中到晚期的单核小孢子发育阶段使用花药培养物开发了单倍体愈伤组织细胞系(HapOB)。该用分布在七个连锁群的10个微卫星标记验证HapOB系的纯合性。 Illumina和PacBio测序技术用来组装双单倍体HapOB基因组序列。 PacBio测序数据用CANU组装,产生551contig(N50为3.4 Mb),总长度为512 Mb。所获得的序列,95%仅包含在196个contig中。K-mer谱分析(K = 25)表明532.7 Mb的基因组大小. 而流式细胞仪分析估计的基因组大小1C = 568±9 Mb。 因此,组装的序列代表96.1%或90.1%。
开发了高密度的雌性和雄性遗传图谱从R. chinensis ‘Old Blush’和Rosa wichurana (OW)杂交中。其中196个contig手动锚定到七个连锁群上,大部分在雌性和雄性遗传图谱上(分别为174和143 contig)。总之,466 Mb因此锚定在遗传图谱上并组装成7条伪染色体,代表90%的组装contig长度(表1)。
在基因组组装中定位着丝粒
使用生物信息学和细胞遗传学方法鉴定着丝粒区域。 发现了一个非常丰富的串联重复的单体(159 bp长),我们称之为OBC226(图2a)。PCR证实了这种重复的串联组织(图2b)。FISH分析明确确认了重复的位置在七条染色体中的四条中(Chr2,Chr5,Chr6和Chr7(图2c)。比对 OBC226的重复序列揭示了所有HapOB伪染色体覆盖率很高除Chr1外,这就解释了为什么没有明显的着丝粒区域检测到(图2d)。在Chr3和Chr4上,OBC226的拷贝数可能也是很低以至于没有被FISH检测到。 此外,核心OBC226着丝粒重复侧翼有其他重复序列,而这些在染色体上分布不均匀,核心着丝粒区域密度较高(图2d)。 这些着丝粒区域也富集Ty3 /Gypsy转座元素。 总之,这些结果证实了这七个伪染色体上的着丝粒区域并揭示当前分配给Chr0的高重复序列含量和低基因含量。
图2.确认HapOB基因组上的着丝粒区域
序列的注释
编码基因, 基于比对的723,268转录物序列,我们预测总共44,481个基因覆盖21%基因组序列长度。 这些包括39,669个蛋白质编码基因和4,812个非编码基因。 在所有预测的基因中发现了87.8%的转录证据。
月季(39,669)中预测的蛋白质数量较高,与F. vesca预测的蛋白质的数量相比。 通过BLAST分析,我们确定了6,543种蛋白质是月季特有的。 其中,5,867种蛋白质在拟南芥中没有同源物。
月季和F. vesca的共线性
月季和草莓都属于蔷薇科亚科,大约在5000万年前发生分离。 以前的遗传学研究已经证明,大的共线性区域在月季和草莓之间是保守的。我们比较了HapOB基因组和最近更新的F. vesca基因组。 R. chinensis的 Chrs 1,4,5,6和7分别与F. vesca 的Chrs 7,4,3,2和5有很强的共线性。 符合以前的结论,一个互惠的易位在R. chinensis 2号,3号和F. vesca 的Chrs 6 和 1上检测到。 我们的结果说明F. vesca和Rosa之间高度的保守共线性,只显示两个重要的易位事件。
蔷薇属的遗传多样性
现有的150个或更多月季种属于四个亚属。除了蔷薇亚属,所有亚属只含有一种或两种物种。我们重测序了八种蔷薇科物种(表2),代表四个亚属(Hulthemia:R. persica,Herperhodos:R. minutifolia和Rosa)中的三个。在蔷薇科中,我们根据最新的系统发育分析涵盖了所有主要部分(表2)。除了R. gallica是四倍体外,其他都是二倍体物种(表2)。SNP和indels被确定根据HapOB参考序列(图3)。
表2.八个蔷薇科物种的重测序和序列变异
8个物种的系统发育树(图3a)与以前的分子分析一致。该分支包括R. chinensis,R. gallica,R. moschata和R. laevigata,与之前叶绿体分析发现的Synstylae和同盟进化枝一致。 R. persica和 R. xanthina的情况也是如此,均属于肉桂科和等位分支。R. rugosa和R. minutifolia表现出不确定的位置。
正如预期,SNP的大部分(79.2-89.0%)位于非编码区域。只有3-7%的SNP位于外显子,其中一半是同义的,和其他物种一致。显示不同的物种有不同水平的纯合性。小的indels数量比苹果更多,平均346,498 indel,表明蔷薇属内有更高水平的多样性。
图3. 8个蔷薇科物种的重测序
重要性状的遗传控制
这个新的参考序列是帮助解析观赏性状基础的重要工具,数据证明控制连续开花的重要基因座,重瓣花形态,自交不亲和刺密度主要定位于Chr3的基因组区域(图4a),检测到一个新的等位基因控制月季连续开花的。大多数月季种类都是'一次开花'。 在月季花中,连续开花由TERMINAL FLOWER 1的同系物控制,RoKSN,位于Chr3。连续的开花表型是由于在RoKSN基因中插入了Copia逆转录转座子元件。连续开花的Old Blush是RoKSNCopia / RoKSNCopia在RoKSN位点。
在这里,OW后代中QTL分析鉴定了Chr3上的连续开花基因座(图4a),但是在注释的HapOB基因组中我们无法检测到RoKSN基因。详细分析RoKSN等位基因在OW后代中的分离显示存在空等位基因,其中RoKSN被删除。OB比对的二倍体“Old Blush”亲本因此是半合子RoKSNCopia / RoKSNnull,和RoKSNnull等位基因存在于HapOB基因组序列中。总之,这些数据揭示了RoKSNnull是CONTINUOUS FLOWERING位点的重排造成的。造成了RoKSN基因的完全缺失。
重瓣花
文章将基因组序列与四个不同F1子代的分离数据相结合预测DOUBLE FLOWER位点的推定位置在Chr3的293-kb区域图(4a)。用96种栽培月季的全基因组关联研究(GWAS)方法,我们发现了一个很强的关联在同一区域(位置33.08Mb和33.94Mb之间;图4b)。第二个显著位点是位于5 Mb的距离,可能是影响这种形状的次要位点。293-kb区域含有41个注释基因。在这些当中,一半在花卉发育的早期阶段表达。 通过排除晚期花卉阶段表达的基因,我们保留了四个候选基因:F-box蛋白(RC3G0245100),APETALA2 /TOE(RC3G0243000),gyp1p超家族蛋白(RC3G0245000)的Ypt / Rab-GAP结构域和四肽类重复超家族蛋白(RC3G0243500)。
自交不亲和性:如其他蔷薇科物种所述,在一些二倍体月季,自交不亲和是由配子体SI(自交不亲和)位点引起的。这个位点很可能是由编码S-RNases基因和F-box蛋白的基因组成的,它们代表雌性和雄性特定的组件。在HapOB基因组中搜索S-RNase和F-box同源物序列鉴定出Chr3上100kb的区域包含三个基因编码S-RNAses和四个基因编码S-locus F-box蛋白(图4a)。其中一个S-RNase(S-RNase36)在'‘Old-Blush '雌蕊中表达。在F-box基因中,Fbox38在雄蕊中积累。因此,这个区域履行了功能性S位点的要求。
刺的密度:文章调查了刺针密度的遗传调控。在两个F1后代中,在Chr3上检测到QTL。在OW和YW后代中,在雄性和雌性图上的31.2Mb位置和染色体末端之间检测到大区域显着关联(分别为图4d,e)。在这两个群体中,清楚地检测到两个峰,这可能对应于两个相邻的QTL(图4a,d,e)。通过GWAS的方法,我们发现SNP和刺状物的存在之间的强烈关联在31.0 Mb到 32.4 Mb之间。在拟南芥中寻找控制毛状体发生和发育的同源基因。筛选HapOW Chr3上的QTL区域对于这些候选基因的基因家族成员揭示了几个WRKY转录因子,其中RC3G0244800(定位在33.40 Mb;图4a)与AtTTG2有很大的相似性,AtTTG2参与拟南芥中的毛状体发育。研究了在具有不同刺密度的OW后代的三个不同个体中TTG2同系物的表达。RcTTG2转录物积累在表现出刺的茎的有更高水平,表明RcTTG2是月季中刺出现的正面调节者。这种TGG2同系物代表了月季花中刺的候选基因。
图4.chr3末端的一段区域控制重要的装饰性状
更多精彩内容,欢迎关注生信人
一个物种一个家
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史
相关知识
单倍型解析中国月季基因组揭示重要观赏性状的遗传基础
植物组织培养对月季观赏性状的影响
粉色系月季杂交后代花色性状遗传分析
最新项目文章|菊花高密度遗传图谱构建和花瓣性状QTL定位|群体遗传专题
花卉遗传连锁图谱构建及QTL定位研究进展
一份水稻花器官突变体的形态发生、性状遗传分析及相关基因的分子标记定位
园林学院在月季花色花香性状研究取得新进展
基因定位及分子标记辅助育种
武汉植物园在我国软枣猕猴桃多倍体基因组解析、适应性进化以及性状定位等研究中取得新进展
中国农科院蔬菜花卉所开发异交物种基因高效定位的新算法工具OcBSA
网址: 月季中重要性状的定位 https://m.huajiangbk.com/newsview281007.html
上一篇: 葡萄遗传学研究揭示了是什么造就了 |
下一篇: 非洲菊、花毛莨、银莲花种质资源的 |