本文是2022年3月浙江西湖高等研究院发表在《BMC Biology》(IF:7.431)题为“Unprecedented organelle genomic variations in morning glories reveal independent evolutionary scenarios of parasitic plants and the diversification of plant mitochondrial complexes”。主要是通过旋花科植物细胞器基因组(22个线粒体12个质体),甘薯rRNA缺失的转录组合基因组蛋白组学鉴定肽、拟南芥WFT9和HSP60基因家族分析和分子实验(q-PCR)研究旋花科物种系统发育和基因组变异和植物线粒体ccFmc的分裂、剪接移位和编码扩展。研究背景
旋花科是一个大家族,该家族成员包括农作物、蔬菜、药用植物、观赏植物和坚硬杂草;具有丰富多样的形态特征,包括草本植物、灌木、乔木、攀缘植物和无叶寄生植物菟丝子,过去的几十年里,旋花科物种分为12个部落6个分支。随着基因组测序技术的进步,许多植物类群的质体基因组已经完成。旋花科的质体组研究主要集中在甘薯和菟丝子上,这个科的许多属被忽略使得系统发育关系未经更大的数据集检验,而“菜栾藤族”和菟丝子科的位置也未得到解决。此外,该家族中只有两个线粒体基因组已知,一个是土丁桂,另一个牵牛花。另一方面,旋花科的细胞器基因组表现出多种独特的特征。例如,旋花科质体中rpl2的内含子缺失是一种突触形态,在菊科中是一个独特的事件,infA已从质体中消失,在虎掌藤属和菟丝子中反向重复(IR)边界已改变。I. nil的线粒体基因组只有266kb长,比大多数已知的被子植物线粒体基因组要小得多。此外,线粒体基因组注释揭示了一个不寻常的ccmFc基因,其片段位于三个不同的位置,需要进一步的研究来调和这些发现。菟丝子的质体和许多其他异养植物一样,体积较小,基因减少,结构可变,核苷酸替换增加。菟丝子的核基因组经历了巨大的基因丢失,它们的线粒体基因组进化模式仍有待探索。为了解开旋花科细胞器基因组的秘密,组装了22个线粒体基因组和12个质体,包括六个分支中的五个以及12个部落中的八个,揭示了不寻常的细胞器基因组变异,描绘了它们的进化轨迹。寄生菟丝子的线粒体基因组已经朝着不同的方向进化,要么获得大量外源DNA,要么保留较小的基因组。所有家族成员的线粒体ccmFc中检测到异常突变,并利用组学数据确认基因分裂、剪接移位和编码扩展。
结果和讨论
旋花科植物质体变异
图1 旋花科植物的取样、质体组和线粒体基因组含量及表型多样性
组装了12个新的质体,其中6个属是首次测序,首次组装了四只菟丝子(Cu.epilinum、Cu.europaea、Cu.americana、Cu.californica)。新的质体显示出与菟丝子已知质体相似的特征,都有基因、内含子和IR区域的丢失。叶状物种中,质体DNA序列或基因含量没有太大差异,主要是IR区域变化。IR区向不同方向扩张或收缩导致不同的结构,所有物种在IR边界上都是非典型的。Dinetus 和 Dichondra包含一些反转,它们是唯一两个失去rpl23基因的叶状物种。 Dichondra质体也有一些不寻常的重复,可能会产生rpl16的另一个副本。
图2旋花科植物的质体变异。
Dinetus和Dichondra分别有一个约1.5和2.2 kb外源DNA插入短单拷贝(SSC)区和IR区,这两个外源序列在旋花科的线粒体基因组中没有同源性,也与NCBI 数据库中的任何序列都不相似。
旋花科植物线粒体基因组变异
图3 线粒体基因组共线性分析
组装了旋花科22个物种的线粒体基因组,使这项研究成为为数不多的包含大量新的完整线粒体基因组的研究之一。其中18个获得了完整的线粒体基因组,包括所有的叶类物种Cuscuta epilinu、Cu. Europaea、Cu. Japonica 。然而,由于大量重复,四种菟丝子只能从菟丝子亚属(美洲菟丝子、澳大利亚菟丝子、加利福尼亚菟丝子和野菟丝子)中获得线粒体草图。旋花科植物的线粒体基因组长度大多在300kb左右,比大多数被子植物要短。旋花科线粒体基因组的基因含量与其他被子植物相似,除ccmFc外,“核心”基因保存完好。与茄目比,所有的成员均缺失rpl2和sdh3。rps7 仅在I. biflora 中发现,系统发育分析表明,它最接近蔷薇科。因此,rps7极有可能在旋花科的共同祖先中丢失,而I. biflora 通过水平基因/DNA转移(HGT)重新获得。Grammica的线粒体基因组也是该家族中退化最严重的,它们丢失了更多的基因,类似于它们的质体。Cu. epilinum, Cu. europaea, Cu. Japonica 基因含量没有显著差异,菟丝子中大多数线粒体基因的替换率都有所增加,但没有一个来自HGT。与该家族较小的个体相比,Cu. japonica已经超过800kb,是其他物种的两倍,Dichondra, Evolvulus、Cu. Epilinum、 Cu. europaea 显示出扩张。线粒体基因组共线性比较发现线粒体基因组结构和DNA含量发生了快速变化。为了理解差异原因,线粒体基因组序列分为五类:保守的(旋花科中都有同系物)、类质体的(质体插入)、重复的、属或种的特异性的及其他的。最显著的差异来自于属或物种特异性序列,尤其是在Cu. Japonica。
为了确定来源,Dichondra、Evolvulus、Cu. Japonica 的许多 GSS来历不明,大多数GSS与远缘类群具有高度相似性。这三个物种的GSS中,唇形目、金虎尾目、龙胆目、豆目和茄目占比很大,可能表明它们的扩张经历了类似的事件。
菟丝子线粒体基因组的分化进化
图4旋花科植物的线粒体基因组变异
寄生植物在被子植物中独立进化了至少12次,这为研究植物相互作用和分子进化提供了极好模型,它们的基因组通常表现出其他植物不常见的特征,包括基因丢失和HGT。绿色自养植物中的质体是非常保守的,而寄生植物中的质体较小、光合作用基因的丢失、不同的IR边界和上升的替代率,如菟丝子。许多专性寄生植物线粒体基因组表现出宿主的广泛HGT,包括本地基因的替换,Cu. Japonica接收了大量来自其他物种的DNA。然而,其他菟丝子的线粒体基因组大小仍然与多叶物种相似。
使用Cu. japonica重要的HGT序列作为查询,搜索其他六个菟丝子中的同系物,只有几个GSS从其他菟丝子那里得到一样是匹配,表明尽管菟丝子有一些共同的HGT序列,但大多数扩增在Cu. japonica 物种形成后独立发生。菟丝子的线粒体基因组大小以不同的方式进化。
被子植物中,槲寄生的线粒体基因组最小(仅66 kb),是V.album8.6倍。为什么一些菟丝子和V.scurruloideum会朝相反的方向进化,以及它们如何维持一个小的线粒体基因组,这些都是未来需要回答的问题。
系统发育关系
图5 旋花科质体、线粒体和核序列的ML树
利用质体蛋白编码序列(CDS)、线粒体CDS和核45S(18S、5.8S和25S rRNAs及间隔区)序列构建旋花科的最大似然(ML)树。质体基质包含77711个柱,16689个简约信息位点(PIS)。质体树的拓扑结构与之前研究类似。结果显示菜栾藤的单系可能仍不确定,菟丝子科分支的支持率很低,菟丝子的姐妹群仍未解决。线粒体基质有30753个柱,但只有1033个PIS。线粒体树是一个非常不同的结果拓扑,支持较差。线粒体序列在家族或目水平上的系统发育受到挑战。核树表明菟丝子属和丁公藤属之间的关系更为密切,但核树的支撑也很弱,可能是由于缺乏PIS。
所有成员都有 破损的ccmFc
图6 ccmFc遇到了两个独立的断裂,变成了两个基因。
在旋花科的所有成员中,它被分成三个片段。第一次突变发生在第一个外显子的3′端附近,导致约43个氨基酸的丢失(在番茄中位于164到206位之间);第二次突破发生在内含子内,没有碱基丢失。丰富的样本表明,断裂最有可能发生在这个家族的共同祖先身上。三个ccmFc片段的基因组分布因物种而异,多叶成员中,第一个片段(FR1)与nad5外显子3、rps13和ccmC形成了一个新的基因块(该片段在菟丝子中重新排列)。第二个(FR2)和第三个(FR3)片段在多叶物种中仍然连接。Cu. epilinum 和 Cu. Europaea中约有3.5 kb插入(质体起源2.8 kb);插入量减少到约1.3kb;其他菟丝子中连接中断,FR2和FR3分离。
CcmFc裂变和拼接移位
将红薯的rRNA缺失转录组映射到线粒体基因组,以检查活性表达,三个片段都产生了高表达水平(图6b,c)。FR1与下游nad5外显子3、rps13和ccmC形成一个新的转录单元。FR1的3′端附近未发现剪接位点,而FR2和FR3的读码均映射到两端。这些结果支持FR1成为一个独立基因,而FR2和FR3是另一个基因的两个外显子。为了验证这一点,我们利用红薯、Dichondra、Cu. Australis、Cu. Japonica、tomato、 Arabidopsis的mRNA合成了cDNA进行PCR分析。引物对“F1/ R1”在番茄和拟南芥中产生了条带,在旋花科中没有。引物对“F2/ R2”扩增包含FR2和FR3的区域内的一部分,产生了所有cDNA模板的条带,作为cDNA模板质量的阳性对照,这些结果支持根据转录组数据推断的裂变事件的发生。
ccmFc2的两个外显子在大多数家族成员中仍然是串联的,但在一些家族中是分离的。被子植物线粒体基因组中顺式和反式剪接的存在提出了ccmFc2 mRNA如何剪接的问题。剪接在所有物种中都是反式的:一方面使用随机引物进行反转录,可以克隆含有前mRNA的无片段内含子,番茄和拟南芥的凝胶中观察到另一条亮度较低的条带,但旋花科则没有。另一方面顺式剪接内含子也可能在高水平转录,甘薯的转录组图谱显示出相对较低的覆盖率,接近FR2。
编码序列在裂变后扩展
随着裂变的进行,ccmFc编码区的indels和发散碱基增加,从而加快了取代率。突变后,FR1与终止密码子分离,它需要一个新的下游终止密码子;FR2需要一个新的上游起始密码子。然而最近的终止和ATG起始密码子距离较远,导致ccmFc1和ccmFc2分别扩增约185和118 个aa,新的RNA编辑位点在扩展的基因区域中缺失。克隆了cDNA以证实基因的扩增,甘薯质谱数据进一步证实了这种扩增,在肽鉴定过程中检测到多次点击。菟丝子中,ccmFc1获得了独立的无义突变,将长度缩短至断点,CcmFc定位于线粒体内膜,在两个外显子中包含多个预测的跨膜螺旋。
顺式和反式剪接可能差别不大
图8 旋花科植物WTF9的系统发育表达及ccmFc的潜在进化史
顺式剪接向反式剪接转变的机制尚不清楚。What’s This Factor 9 (WTF9)是一种核编码植物细胞器RNA识别蛋白,可以直接与ccmFc内含子的48个核苷酸结合来调节顺式剪接,该过程中,分子伴侣热休克蛋白60(HSP60)与WTF9互用。为了检测反式剪接移位引起的潜在变化,以拟南芥WTF9和HSP60为参考,在旋花科和其他被子植物的基因组中寻找同源物。WTF9存在旋花科的所有物种中,在甘薯属中有复制。检测了 I. trifida, I. triloba,以及其茄科的马铃薯和半夏WTF9的表达水平,甘薯WTF9-1的表达模式与茄属相似。HSP60也出现了类似的情况,剪接移位后这两个内含子片段几乎完全保留在所有物种中,包括48个核苷酸结合区。基于这些推测顺式和反式剪接之间的机制可能相似,但需要进一步的研究来验证这一假设。
旋花科CcmFc的变异在被子植物中是前所未有的
旋花科发现的ccmFc代表了被子植物中一种新型的反式剪接。据我们所知,这项研究中发现的先分裂后扩增的现象在线粒体基因组中尚属首次。旋花科的ccmFc可能是最复杂的,整合了基因分裂、剪接移位和扩增。HGT广泛存在于线粒体基因组中,但大多数是非功能性的。在某些情况下,HGT可以完全或部分替代天然基因,旋花科植物中的嵌合ccmFc1和ccmFc2融合了新的HGT和天然编码序列,代表了HGT如何在功能上影响生物体的一种新方式。一个紧迫的问题是,这些变化将如何改变CCM复合物的结构,甚至改变氧化磷酸化的效率,替代率的提高和跨膜螺旋的潜在变化可能影响了蛋白质结构。我们的结果提供了一个植物呼吸多样性的例子,可能对未来的植物呼吸工程有启示。
结论
旋花科植物以其广泛的用途、多样的形态和不同的营养模式而闻名。在这项研究中成员分支显示,同样的惊奇也存在于他们的基因材料中。旋花科有一些变化,即使在绿叶成员中IR边界也都是非典型的,不常见的特征,如内含子丢失、核转移(infA)、复制和外源插入。Cu. Japonica线粒体基因组被HGT序列显著膨胀,而其他菟丝子保存在一个小的大小像他们的叶子亲戚,线粒体基因组的进化在菟丝子不同。
此外,菟丝子线粒体基因有更多的丢失和更高的替换率,但没有HGT事件。最显著的变异是线粒体ccmFc。它在其他植物中高度保守,但在旋花科的共同祖先中可能遇到基因分裂、剪接移位和编码扩展,这在被子植物中是独一无二的,参与剪接过程的核基因似乎仍有功能,这就提出了顺式剪接和反式剪接在机制上有什么不同的问题。ccmFc的这些异常变化可能是由HGT插入后双链断裂和不精确修复引起的。我们的数据为研究旋花科植物的进化和系统发育以及植物寄生提供了宝贵的遗传资源。同时也有助于理解线粒体复合物的多样性和基因创新。
相关知识
花龟、草龟物种杂交后代的线粒体基因组研究
叶绿体基因组序列的进化分析揭示了蔷薇科独特的进化历程以及果用樱桃的独立起源
学者综述核质冲突现象与动植物进化历史研究
分析染色体级别的基因组装配揭示了六倍体栽培菊花的起源和进化
如何成为寄生植物?——昆明植物所在解析列当科寄生植物基因组的演化历史方面取得新进展
从叶绿体到进化历程:完整基因组与比较分析,揭示植物世界的变迁
昆明植物所在解析列当科寄生植物基因组的演化历史方面获进展
牧草基因组多样性研究
国家植物园科研人员及其合作者揭示杜鹃花属植物适应性进化和花色多样性形成的分子机制
单子叶植物中叶绿体TRNA的基因组和进化方面
网址: 牵牛花中细胞器基因组变异揭示寄生植物的独立进化场景和植物线粒体复合体的多样性 https://m.huajiangbk.com/newsview1937629.html
上一篇: 旋花树科 |
下一篇: 【旋花根的功效与作用】中药旋花根 |