本文网络首发于《遗传》杂志
物种形成(speciation)指物种起源的演化过程,是演化生物学领域研究的核心科学问题之一。研究物种形成对理解生物多样性的起源与形成机制具有重要意义。对于物种形成的研究伴随着人类文明的发展。
从持续了近20个世纪的“神创论”、“物种不灭论”,到“拉马克学说”的提出,人们开始用唯物主义的思想去理解物种形成过程。达尔文在环球航行中,对物种形成问题展开了系统性的观察与思考,随后提出了对后世产生深远影响的“自然选择学说”(又称演化论)。
随着20世纪上半叶分类学、遗传学等生物学分支的发展,人们综合多学科的研究方法提出了“现代综合演化论”(又称新达尔文主义)。现代综合演化论将物种形成研究从性状水平带入了基因时代,明确了群体(population,又被译为种群或居群)是物种组成和形成的基本单位,指出了生殖隔离(reproductive isolation)是物种形成的必要条件。
在此背景下,物种形成研究的核心问题逐渐明晰,具体包括:(1)生殖隔离是如何建立的?(2)哪些基因参与了现有近缘物种之间的生殖隔离?物种形成最初阶段驱动物种独立演化的关键生殖隔离基因(即物种形成关键基因)是什么?(3)物种的起源方式是什么?(4)用于区分近缘物种的形态性状是如何起源与固定的?它们与最初驱动物种形成的关键基因之间有何关系?
1977年,Sanger等开发的DNA测序技术正式面世,使得在序列水平探究物种形成的分子机制成为可能。研究人员开始在DNA水平对伴随物种形成产生的形态学、行为学、生理学等各类性状的关键遗传机制进行解析。然而,由于物种形成历史复杂,自然选择(natural selection)、遗传漂变(genetic drift)、趋同演化(convergent evolution)、杂交(hybridization)、不完全谱系筛选(incomplete lineage sorting)等均有可能在现存物种的遗传信息中造成大量影响,使得从中提取有效遗传变异信息、准确重塑物种形成过程十分困难。因此,物种形成研究也一直是相关领域最具挑战的前沿问题之一。
近年来,基因组学领域快速发展,测序成本不断下降,测序质量与通量大幅提升,测序数据呈现爆炸式增长,生命科学研究进入了基因组时代。本研究介绍了基因组时代物种形成问题的研究进展,重点探讨了相关研究方法及其应用范围与技术特点等,以期为相关研究人员提供参考。
“什么是物种”是研究物种形成的基础。生物学家开展研究之时,都不可避免根据已有的物种概念和分类学结果为其所研究的材料进行物种定名。但是,“物种”的形态学、生态学、遗传学等特征在不同类群中往往具有不同的表现模式,导致不同类群间的“物种”定义与物种界定标准存在较大的差异,也造成了众多物种概念的相继提出与使用。因此,“什么是物种”、“地球上有多少物种”等被Science杂志列进全世界最前沿的125个科学问题,迄今依然存在争论。
长久以来,在“有性生殖”为主的生物类群中,以姊妹物种(sister species)或近缘物种(closely related species)之间的“生殖隔离”作为标准的“生物学物种概念”(biological species concept)被物种形成研究领域广泛认可。但是,“生殖隔离”本质上是一种数量性状,何种程度的“生殖隔离”可以作为不同物种的界定标准,迄今尚未达成共识。
“生物学物种概念”中的“生殖隔离”常被误解为应是“完全的生殖隔离”(complete reproductive isolation)。然而,自然界中的大多数近缘种间(甚至很多近缘属间)都没有形成“完全的生殖隔离”。如果以“完全的生殖隔离”(尤其是合子后生殖隔离,详见下文)作为物种界定的标准,很多物种(甚至属)都将面临合并。事实上,无论是“生物学物种概念”最初提出之时,还是近年来众多演化生物学家对其进行的深入讨论和总结:“生殖隔离”作为“生物学物种”的主要鉴别依据,从未特指是“完全的生殖隔离”,且均指出存在“生殖隔离”的物种之间可以通过杂交产生种间杂交后代。
在物种形成的过程中,不同群体之间首先会产生一定程度的生殖隔离,使得各群体更易在群体内部交配产生后代,从而形成独立的演化谱系;进而导致等位基因在各自群体内进行谱系筛选(lineage sorting)、固定(fixation)以及新突变(de novo mutation)的积累,在群体水平上形成稳定的遗传分化;不同形态特征也将在各自群体中固定或产生新的性状,导致群体间出现形态特征差异。需要理解的是,物种形成过程是一种动态过程;现存“物种”均处于物种形成过程的某一时刻或阶段。自然界中所有的物种都在“物种分化路上”,处于物种形成的中期或后期;或正在开始新一轮的物种分化,处于物种形成的早期。
为应对实际应用过程中的复杂挑战,强调整合形态学差异、群体遗传分化、生殖隔离、生态位分化、系统发育关系(单系原则)等多类标准共同进行物种界定的整合物种概念( integrative species concept)可能是更为合理的权衡策略。需注意的是,自然界中广泛存在的种间(或群体间)杂交(含回交)后代往往会模糊群体间的差异,而整合物种概念中依据的各类物种界定标准,在群体水平存在统计学差异即可;分化群体(姊妹种或近缘种的群体)不必在全部个体间均存在差异,允许因杂交或回交等导致的无明显差异的个体存在。
因为,一个群体的绝大多数个体都在群体内进行交配、产生基因流并形成一个演化单元(unit),即为一个独立的演化谱系。在整合物种概念的实际应用过程中,无论是各类群DNA条形码(DNA barcode)序列间的固定差异,还是更为理想的数据类型——群体基因组数据揭示的群体间遗传分化,均可用于指示物种间的群体遗传差异,但是必须遵循“种间分化程度大于种内群体差异”的原则。在物种界定时,符合上述界定标准越多的物种,往往拥有越强的辨识度。
而在物种界定的实践过程中,不同物种间应至少在两方面特征(尤其是形态学特征)上存在统计学差异,才能区分为不同的物种;这种情况下的物种通常已处于物种分化的中后期。与此同时,整合物种概念同样适用于种下分类单位(如亚种、变种)的界定。正如达尔文所指出,“亚种”、“变种”等种下分类单位与“种”之间没有本质区别,现存众多类群划分为“种”、“亚种”亦或是“变种”往往是分类学家根据属内形态特征差异做出的主观判断与权衡。根据独立演化谱系作为分类等级的现代分类学标准,这些种下分类单位也需符合上述物种界定标准;只是这些演化谱系可能处于“物种分化路上”更为早期的位置,它们之间的统计学差异与同一属内其他近缘“物种”之间的差异相比可能更小,因而被界定为种下分类等级。正因如此,种下分类等级在很多属中不再使用。
对于不同的谱系,究竟何种程度的形态学和遗传学差异,可以将其界定为不同的物种呢?不同类群间不存在统一标准,更无法对其进行定义。这不仅与“物种分化阶段”密切相关,还与类群的有效群体大小、选择(自然选择或人工选择)压力程度等相关。人工选择可以视为特殊的“自然选择”,在物种驯化过程中远比自然选择具有更强的效力。
动植物的驯化群体大多作为独立的物种,与其野生祖先群体相区别。这些驯化物种由于受到人类的定向选择,且有效群体非常小,因此会在短时间内迅速积累形态、遗传和生殖隔离等差异。对于同一个驯化物种的不同品种,短时间内人类强选择导致的趋异演化(divergent evolution),可能远大于自然状况下近缘物种之间的差异。例如,不同狗(Canis lupus familiaris)品种之间的形态差异远大于犬属野生物种之间的差异;同样,较大程度的形态差异和生殖隔离也出现在亚洲栽培稻(Oryza sativa)的两个亚种——籼稻(O. sativa subsp. indica)和粳稻(O. sativa subsp. japonica)之间。籼稻与粳稻可能分别驯化自亚洲广义野生稻(O. rufipogon)同一个物种的两个分化群体,或亚洲狭义野生稻与尼瓦拉野生稻(O. nivara)两个物种;尽管存在强烈、但不完全的生殖隔离,籼稻与粳稻之间仍然存在人为介导的杂交和广泛的基因流,并通过杂交相互引入了优异等位基因。如果基于整合物种概念标准(考虑单系性、生殖隔离程度以及与同属其他物种的形态差异等),籼稻与粳稻作为两个不同的独立物种更为合理,它们将分别与野生稻和尼瓦拉野生稻组成祖先-衍生物种对。但是在物种界定时,很少详细衡量上述亚种(或品种)之间的差异程度,不再将其作为物种界定的依据。因此,上述谱系大多作为驯化物种的种下亚种(或品种)处理。物种界定实际上是近缘物种分化形成的各类差异与物种界定后使用中便捷程度之间的权衡。因此,在物种界定的实践过程中,重点要注意两方面的问题。
首先,现在很多志书采用的物种概念是模式标本物种概念:采集的材料与模式标本存在形态差异就可能被界定为不同的物种,而没有考虑群体水平上的统计学差异;这些形态特征差异可能是群体内基因型不同导致的变异。因此,志书中描述和记载的部分物种可能不是独立演化谱系,不同物种(谱系)间的杂交个体(hybrids,又称杂种)也有可能被命名为独立的物种。此外,由于基因组等遗传数据的增多,对于根据独立演化谱系定义的物种,种内可能分化出亚遗传谱系;但是,应避免在缺乏形态特征差异的情况下,将这些亚遗传谱系定名为独立的物种。若缺乏肉眼可见的形态特征差异,界定的物种难以供其他领域的研究人员或大众使用。
物种(群体)之间存在生殖隔离是指:当它们同域分布(即不存在地理隔离)时,物种内通过有性繁殖、遗传重组产生的有效后代,显著多于物种间杂交产生的相应后代,导致每个物种各自形成独立演化谱系。探索生殖隔离的存在及其起源与演化过程是物种形成研究的关键。生殖隔离的种类繁多,根据其存在之时合子是否形成,可将其分为合子前隔离(prezygotic isolation)与合子后隔离(post-zygotic isolation)。生境隔离(habitat isolation)、花期隔离(flowering time isolation)、传粉者隔离(pollinator isolation)、性选择(mating choice)、配子不亲和(gamete incompatibility)等都属于合子前隔离,而合子后隔离则包括杂种不活(又称杂交衰亡,hybrid inviability/hybrid necrosis)、杂种不育(hybrid sterility)、杂种衰败(hybrid decay)等。除此之外,根据遗传机制,同样可以对生殖隔离进行分类,例如:植物的雄性不育(male sterility)可被分为细胞质雄性不育(cytoplasmic male sterility, CMS)和细胞核雄性不育(nucleic male sterility)。其中,细胞质雄性不育广泛存在于高等植物之中,往往受到细胞质基因与细胞核基因的共同控制,是研究核质互作的经典体系,也是作物人工育种过程中杂种优势利用的重要手段。
正如前文所述,现存的多数近缘种(或姊妹种)之间还没有形成完全的生殖隔离。同时,生殖隔离的程度也受物种分化时间等因素的影响存在强度差异:处于物种分化早中期的近缘种(或姊妹种)间,生殖隔离程度相对较弱;而随着独立演化时间的增长,各自积累的遗传分化位点增多,处于分化后期的近缘种(或姊妹种)间的生殖隔离则会增强。地理隔离可导致来自共同祖先的不同群体各自独立演化,受本地环境的自然选择、遗传漂变等作用形成群体间的遗传差异、形态区别和生殖隔离。但是,地理隔离并不是唯一可以导致独立演化谱系形成的因素。达尔文指出,自然选择(包括性选择)在独立演化谱系的形成过程中发挥了更为重要的作用。即使在完全地理隔离的情况下,自然选择对遗传与形态差异以及生殖隔离的作用效果,可能在某些情况下依然强于遗传漂变。然而,目前对于生殖隔离的比较研究与综合研究仍然相对较少,相关研究主要集中于:评估近缘(或姊妹)物种(或群体)之间存在哪些生殖隔离机制?其生殖隔离的总程度如何?哪些生殖隔离机制对于物种间最终的总生殖隔离强度起到了更为关键的作用?生殖隔离类型与程度为物种形成研究提供了重要的生物学/生态学先验背景,为其研究思路提供了方向指引。
野外观测在生殖隔离的研究中十分重要,可以初步、直观的对自然状态下生殖隔离的类型与程度进行考察与评估。对于植物类群而言,结合其分布区域的环境因素可以对生境适应性隔离进行初步推断,而对传粉者类型、花期差异等合子前生殖隔离性状的观测同样具有重要意义。然而,环境差异可能会对植物的生长状态、花期等生理性状造成明显影响。因此,在相同环境条件下开展的同质园实验(common garden experiment)对于部分类型生殖隔离(如花期隔离、生境适应性隔离等)的准确衡量十分重要;也是排除地理隔离后,检测是否存在生殖隔离的重要手段。动物类群中的生殖隔离情况与植物类群中基本相似,现存的许多近缘种(或姊妹种)间并没有形成完全的生殖隔离,合子后生殖隔离程度也相对较弱。性选择等合子前生殖隔离在动物类群中十分重要,通过对同域(生活在一起,类似植物同质园实验)或邻域近缘种(或姊妹种)的繁殖行为等进行观察,将帮助人们深入了解它们之间的合子前生殖隔离状况。
生理实验与种间杂交实验同样也是种间生殖隔离研究的重要手段,可以帮助人们揭示或验证近缘种(或姊妹种)间的合子前/后生殖隔离类型与程度。在植物类群中,可对相同生长条件下(如温室中,亦可视作室内同质园实验)长势相对一致的近缘物种植株进行胁迫处理(如高温、干旱、金属元素胁迫等),通过形态观测、生理指标测定,观察并评估物种间环境适应性相关的生殖隔离类型与程度;而种间人工杂交实验及对其杂交后代适合度(fitness)的研究,则是评估其合子后生殖隔离程度的重要指标之一。在动物类群中,生理实验同样可以帮助评估环境适应性相关的种间生殖隔离程度;种间杂交是否可产生与种内交配同样高比例的可繁育后代,是评价其合子后生殖隔离程度的重要指标之一。但需要特别注意的是,动物中的生理实验与行为实验等(尤其是种间杂交实验)需要严格遵循动物实验伦理原则。
随着分子生物学与基因组学等技术的发展,近年来对于生殖隔离的分子机制研究日益增多。调控生殖隔离性状形成的关键基因被称为生殖隔离基因;这些生殖隔离基因的等位变异,可导致明显的生殖隔离性状差异,或造成种间杂交后代适合度(生存率、繁育率等)的降低。目前关于生殖隔离基因的报道非常多,这里仅列举几例加以说明。例如,在果蝇属(Drosophila)中鉴定到的Odysseus合子后生殖隔离基因,该基因在果蝇属近缘物种之间发生了快速的遗传等位分化与谱系筛选,导致近缘种间杂交后代的雄性不育,是这些近缘种合子后生殖隔离(雄性不育)的主要遗传基础。在植物类群猴面花属(Mimulus)近缘物种中,YUP基因的遗传分化调控了其花色变化,导致其种间传粉者不同,从而形成合子前生殖隔离。在亚洲栽培稻的两个亚种——籼稻和粳稻之间鉴定到了众多合子后生殖隔离基因,如导致其杂交后代雌性不育的S5、S7、HSA1以及导致雄性不育的Sa、Sc、RHS12等。必须指出的是,上述生殖隔离基因都没有导致物种之间的完全生殖隔离,如:Odysseus基因可能与其他基因共同作用,导致果蝇属近缘物种之间的杂交F1代个体雄性大多不育,但其雌性个体完全可育,不是完全的生殖隔离。这种种间杂交雄性不育、雌性可育的不完全合子后生殖隔离现象,还存在于较多其他的动物类群中,如亲缘关系较远的牦牛(Bos grunniens)和黄牛(B. taurus),正反杂交后雌性都完全可育,只有雄性不育。
猴面花属近缘物种的合子前生殖隔离与合子后生殖隔离也均不完全,在自然状态下或通过人工杂交均能产生杂交后代,但杂种衰败导致其种间杂交后代的成活率与结实率均明显低于种内杂交后代;尽管亚洲栽培稻的两个亚种之间存在较强的合子后生殖隔离,但它们之间仍然能够产生杂交后代。事实上,多数近缘物种间均能部分产生杂交后代,并建立性状分离群体;可基于数量性状基因(quantitative trait locus,QTL)及重组自交群体,通过GWAS等方式定位生殖隔离性状关键基因,并对其等位变异导致的生殖隔离进行分子机制研究。
两个近缘种(或姊妹种)之间的生殖隔离往往是由多个生殖隔离性状共同导致的,而每个生殖隔离性状也大多由多基因共同控制。关于不同物种之间的同一生殖隔离性状(如植物种间花期或杂交结实率的差异、动物中由毛色或行为差异导致的性选择以及动植物类群中的种间杂交雄性不育等)是否是由相同基因控制,迄今依然缺少比较分析或整合分析。尽管如此,依然可以推测,即便近缘种(或姊妹种)之间的同一生殖隔离性状是由相同通路上的同源基因控制的,由于这些基因间的等位遗传变异往往是由随机突变产生后、通过自然选择而留下的,因此多数情况下这些等位遗传变异的位置和突变类型并不一致。那么,在近缘种(或姊妹种)之间鉴定到的生殖隔离基因,是否即是物种形成基因呢?
事实上,生殖隔离基因的概念与范畴要明显广于物种形成基因。只有在物种形成最初阶段对于群体分化起到重要推动作用的生殖隔离基因,才是严格意义上的物种形成基因(speciation gene,又称成种基因)(图1)。一些生殖隔离基因的等位遗传分化与固定,可能是由“成种基因”在物种形成早期推动群体分化后,再通过遗传漂变、新突变和自然选择而形成的。因此,对物种分化中后期的近缘种(或姊妹种)开展生殖隔离基因研究时,由于很难追溯鉴定到的生殖隔离基因在物种分化早期是否发生了谱系筛选、遗传分化并推动了群体的进一步分化,因此对于鉴别其是否是“成种基因”难度较大;对物种分化早期(刚开始群体分化或只在部分个体之间存在生殖隔离)的材料(如出现新花色的新基因型植株或不同生态型等)进行生殖隔离基因研究时,则又无法确定这类基因与其遗传变异能否推动独立演化谱系的形成,即推动所研究的群体达到物种形成的中后期阶段,成为多个物种界定标准都认可的“好种”。物种形成早期刚刚分化的群体,如果没有新积累的遗传差异导致生殖隔离的进一步加强,很有可能在选择压力减弱或消失之后,由于生殖隔离程度较弱,初步分化群体将再次融合为一个谱系,从而无法形成分化的独立演化谱系(即“独立物种”)。因此,无论是采用姊妹或近缘“好种”,还是采用刚开始分化的群体开展研究,鉴定“成种基因”都存在较大的挑战。

图1 | 生殖隔离基因与物种形成基因示意图。
正如达尔文指出,自然选择对于新物种的形成具有关键性作用。因而,对于大多数类群,合子前生殖隔离基因可能才是更为重要的物种形成基因。因为合子前生殖隔离基因控制的性状(如环境适应性、交配行为等),即使在完全异域分布(地理隔离)的情况下,也会首先受到自然选择,导致其等位变异率先实现谱系筛选和群体分化。根据BDMI模型(Bateson-Dobzhansky-Muller incompatibilities),合子后生殖隔离基因需要两个及以上基因位点的等位分化,可导致合子不育、生存率下降以及繁殖率降低等合子后生殖隔离现象。这些位点的等位分化可能是由于完全异域分布(地理隔离)条件下,遗传物质随机漂变(random drift)后在群体间固定的产物,但更可能是来自合子前生殖隔离相关性状或等位变异的选择性分化产物。当然,合子前生殖隔离相关的同一位点或多个基因的等位分化,也可同时导致合子后生殖隔离,如猴面花属的一个物种在适应铜污染环境时,受到选择的适应性等位基因,也同时导致其群体间杂交结实率显著降低。因此,合子后生殖隔离基因的等位分化或固定,完全可以不需要地理隔离,可直接由同域或邻域群体各自的自然选择导致。此外,在现有近缘种(或姊妹种)之间,合子前生殖隔离对总生殖隔离的贡献要远高于合子后生殖隔离,因为若后代无法存活或交配,合子发育就不能发生。所以,合子前生殖隔离基因及其等位变异,在物种形成初期可能发挥了更为重要的作用,不仅有助于合子后生殖隔离的形成,也符合达尔文新物种形成的自然选择学说。
由一个祖先物种分化为两个物种的二歧式物种形成(bifurcating speciation)可能是自然界中较为常见(或目前已知物种中较为常见)的物种形成方式之一。祖先类群的不断分化(表现为二叉状的物种分化树)被认为是地球上丰富的物种多样性的主要来源。目前对于二歧式物种形成的研究多为对其物种多样化历史和地理分布格局的探索,较少关注其物种分化关键性状的遗传分化以及生殖隔离基因的形成机制,尤其是对物种形成早期发挥关键作用的“物种形成基因”的研究较少。相关研究进展在前文(见“生殖隔离”部分)已有介绍。因此,本节将重点介绍二歧式物种分化(或多样化)历史方面的研究方法。
系统发育分析(phylogenetic analysis)是二歧式物种多样化研究中的常用方法之一,主要用于对物种多样化历史与地理分布隔离的检测,可利用性状数据或分子数据,基于系统发育树的拓扑结构、枝长、支持度等信息推断物种之间的二叉状演化关系。常用的分子数据包括:单基因、全基因组(核基因组)、质体基因组等序列的单碱基变异位点(single nucleotide polymorphisms,SNP)或插入缺失(insertion/deletion,InDel)。常用的系统发育分析算法包括最大似然法(maximum likelihood,ML)、邻接法(neighbor joining,NJ)和贝叶斯法(Bayesian inference,BI)等。
最大似然法的应用范围较为广泛,但基于全基因组数据的系统发育分析往往数据量较大,其计算速度相对较慢的特点因此被放大。随着近年来分析算法的优化,这一问题正逐渐被克服。
邻接法的计算速度相对较快,但易出现长枝吸引现象(long branch attraction,LBA),从而影响分析结果,导致不相似的序列聚为一支。
邻接法与最大似然法的准确性可通过自举法(bootstrap)进行检验,而贝叶斯法则是基于后验概率(posterior probability)对其进行评估。在相当长的一段时间内,构建物种树往往采用将不同基因(或序列片段)首尾相接构成矩阵的串联法(concatenate method)。然而由于不同基因(或序列片段)的演化速率、演化历史等可能存在差异,在同一数据矩阵中可能会相互干扰,影响结果的准确性。
近年来,在基于全基因组数据的系统发育分析中,数据量的大幅增加导致计算成本的明显提升,溯祖法(coalescent method)的出现很好的解决了这一问题。溯祖法基于溯祖理论对所有基因树进行整合并推断物种树,可以很好的克服基因间差异化的演化历史导致的系统发育冲突。
迄今为止,大量可用于(或可辅助进行)系统发育分析的软件先后被开发,值得一提的是中国学者在相关领域做出了巨大的贡献。例如,陈程杰等开发的TBtools软件、张东等开发的PhyloSuite软件、余光创等开发的ggtree等R包和余岩等开发的Easy353软件等,因其便捷、用户友好的使用方式以及强大的功能被广泛使用并备受好评。使用上述方法或软件,既可以利用直接鉴定的直系同源基因数据,也可以基于参考基因组,利用基因组重测学数据提取同源基因的位点变异信息进行系统发育分析。
在基于分子数据的系统发育分析中,多种因素可能会对分析结果产生影响。首先,碱基替换模型(base substitution model)的选择十分重要,在构建系统发育树时可基于序列进行最优模型的选择。然而,随着序列长度的增加,有效信息位点逐渐增多,碱基替换模型对系统发育分析结果的影响也将逐渐降低。
此外,外类群(outgroup)的选择在系统发育分析中也至关重要。若外类群与内类群(ingroup)的亲缘关系较远,遗传差异的增大将使得可用于系统发育分析的位点数量大大降低,从而影响结果的准确性;反之,若外类群与内类群的亲缘关系过近,则易受到杂交、渐渗(introgression)、不完全谱系筛选等影响,导致系统发育分析结果出现偏差。通过对动物、植物、真菌等不同类群公共数据的研究发现,前期开展的系统发育分析中约9%~18%的结果无法得以重现。因此,为提升系统发育分析的准确性,可对同一数据集采用不同的方法进行交叉验证。
基于分子钟模型,DNA或蛋白质序列的演化速度在近缘类群中被视为近似恒定,遗传距离(位点差异水平)与分歧时间因此一定程度上呈线性关系,结合时间校准信息(calibration point)可对不同类群的分歧时间进行评估。常用的时间校准信息包括化石记录、碱基替换速率以及基于前期研究结果的二次校准信息等。然而,不同类群之间或不同基因组区域之间演化速率的差异性和化石记录的准确性等因素往往会对分歧时间的评估造成影响。
因此,在相关计算中对于化石记录以及不同序列信息(如核基因组序列与质体基因组序列、全基因组序列与部分基因序列、4DTv或基因间区等中性位点区域与其他基因组区域)的合理选择至关重要。分歧时间评估可应用于不同的分类单元或谱系支之间(如不同的目、科、属、种等),分析过程中样本的选择同样十分重要。物种内部可能存在复杂的群体遗传结构(population genetic structure),在没有对独立演化谱系全面取样(多群体、多个体取样),尤其是取样到杂交渗入个体时,可能会导致谱系支之间的分歧时间评估存在较大误差;而对一个属或科进行分歧时间评估时,对其所含种或属取样不完全也会造成较大影响。因此,一个物种或谱系支内全面的取样往往有利于获取更加准确的分歧时间评估结果。
种内杂交是自然界中维持一个谱系的独立演化、遗传一致性及其与近缘谱系之间差异的重要方式。种内不同基因型或分化群体之间的杂交,可以导致不同遗传信息的重新组合,从而产生新的基因型、表型以及杂种优势。在自然界中,与种内杂交相比,种间杂交可以看作是两个分化程度更高群体(谱系)之间的杂交,其与种内杂交的主要区别是:(1)杂交机会更少(由于生态位、花期、性选择等合子前生殖隔离以及可能存在的地理隔离等影响);(2)杂交结实率或产仔率锐减;(3)F1代成活率低,且F1代之间杂交产生后代的概率进一步降低。
其中,(1)属于合子前生殖隔离;而(2)和(3)两方面都属于合子后生殖隔离。自然界种间杂交产生的F1代杂交个体,常常与拥有更多个体的亲本同域分布,从而有更多与亲本回交的机会;它们的回交后代之间由于遗传差异和生殖隔离程度降低,可以更快恢复育性,使得产生回交后代的机会增大,也将进一步减少种间杂交后代之间交配、产生后代和发展为独立演化谱系(物种)的机会。若这种F1代杂交个体与亲本种之一发生多轮回交(backcross),就会导致渐渗,这也是远缘种间杂交育种的主要方式。渐渗群体有可能长期存在,也可能在反复回交的过程中与亲本种逐步融合,最终湮灭。杂交个体(如F1-FN、BC1-BCN以及BC1-D1-BC1-DN等)也被称为“杂种”。若具有相似基因组组成的同一代(如F1、BC1或BC2等)个体间相互交配、恢复育性并继续产生后代,形成一个可自我繁殖并与亲本物种同时存在生殖隔离(非完全)的独立演化谱系,就会导致广义的同倍体杂交物种形成。这类广义同倍体杂交物种(homoploid hybrid species)的大部分群体和个体,包含具有相似比例的来自两个亲本物种的基因组混合(genomic admixture)(图2);但对于不同的杂交物种,来自两个亲本的混合比例可能并不相同。例如,由F1代杂交个体相互杂交、恢复育性、形成独立演化谱系的同倍体杂交物种,其来自两个亲本物种的基因组比例应维持在50%:50%左右(由于基因丢失以及亲本物种间部分基因组区域缺乏等位差异等情况无法估算,该比例并不严格);从回交一代群体(BC1)演化而来的同倍体杂交物种,则维持在75%:25%左右;而由回交多代群体(如BC3、BC4、BC5等)演化而来的同倍体杂交物种,两个亲本物种贡献的基因组比例差异则会越来越大。自然界的同倍体杂交物种中,来自两个亲本谱系遗传组成成分比例为50%:50%的情况实际上较少,大多并不均衡,甚至极为悬殊。例如,袖蝶属(Heliconius)的同倍体杂交物种H. elevatus中,来自两个亲本种的遗传组成成分比例分别为99.3%(H. pardalinus)和0.7%(H. melpomene)。此外,不完全谱系筛选同样可能会造成遗传组成成分在不同物种中的非均匀分布,给渐渗的界定以及同倍体杂交物种形成研究带来挑战。需要注意的是,对于严格(或狭义)的同倍体杂交物种,还要证明杂交导致了该独立演化谱系与两个亲本谱系的生殖隔离;除此(严格的同倍体杂交物种)之外的具有基因组杂交混合的独立演化谱系(物种、属或科等),通常被一些研究归入广义的杂交渐渗(hybridization introgression)。实际上,这些经历杂交渐渗的独立演化谱系,多数情况下可能是同倍体杂交物种形成的产物,而种间杂交是否导致了其杂交后代与两个亲本物种产生生殖隔离仍有待进一步证明。
图2 | 同倍体杂交物种形成示意图。从过程上看,杂种是同倍体杂交物种起源过程中的“中间过渡状态”,但是很多类群在进行分类和命名时,由于演化历史并不清晰,经常导致二者的混淆。把“杂种”命名为一个独立物种(独立演化谱系)的情况较为常见。例如:麻核桃(Juglans hopeiensis)目前被界定为一个独立物种,实际上其所有现存的自然个体均为种间杂交产生的F1代杂种,由于遗传分化较大形成了合子后生殖隔离与生殖衰败,导致这些F1代个体(即麻核桃)胚胎、花粉的败育率极高,几乎不能通过有性生殖产生后代,无法形成能自我繁殖的独立演化谱系。因此,这些F1代个体是典型的杂种,应将其命名为“Juglans × hopeiensis”。与此同时,也存在另外一类相反的情况,可能将杂交物种命名为“杂种”。
图3 | 青藏高原猎隼同倍体杂交物种形成示意图。
图4 | 同倍体杂交物种形成中3种主要的系统发育拓扑结构示意图。Admixture分析Admixture分析是群体水平上检测相对稳定的杂交信号的重要方法。当K=2时,若两个亲本谱系拥有独立的群体遗传结构,而杂交谱系则显示出稳定的(全部个体中比例相近的)祖源成分混合,则可作为其杂交起源的重要群体遗传学证据。若亲本谱系内部存在群体亚结构,可能在K>3时才能检测到稳定的祖源成分混合现象,此时同倍体杂交谱系的亲本谱系可能为亲本谱系的部分群体。杂交谱系中不同祖源成分的比例并不固定。若F1代个体间发生相互交配形成一个独立演化谱系,可能导致不同祖源成分的比例各占50%,这种情况相对较少。而当两个亲本谱系分化时间较长,积累的遗传差异和生殖隔离程度较大时,生殖衰败将导致其产生后代的机率降低,造成F1代个体数量过少的情况,从而很难形成一个能相互交配的群体。然而,回交可以降低生殖隔离和生殖衰败的程度,因此回交一代(BC1)或回交多代(如BC2-BCN等)后的个体存在相互杂交后产生独立演化谱系的可能,在此情况下两个亲本谱系对杂交谱系的遗传贡献可能十分不均衡。当同倍体杂交物种形成发生的历史时间相对较近时,杂交谱系易检测出稳定的杂交信号。若同倍体杂交物种形成发生的时间相对古老,或相关谱系突变速率较快时,杂交谱系与亲本谱系可能在完成同倍体杂交物种形成后,各自积累大量特异的遗传变异,导致杂交信号在Admixture分析中被湮没;若某一亲本谱系的祖源成分占比较低,也可能导致类似现象。研究发现,同倍体杂交物种黔金丝猴(Rhinopithecus brelichi)群体显示出稳定的来自两个亲本谱系的祖源成分混合,其比例分别为69%和31%;而在居中虎榛子和桦木科鹅耳枥属千金榆组(Carpinus sect. Distegocarpus)等杂交谱系的Admixture分析中,则均无法检测出祖源成分混合现象。研究表明,Admixture分析对于数据异常灵敏、不同群体间取样数量不均或取样完整性欠缺均有可能影响结果。因此,对同倍体杂交谱系和亲本谱系进行相对全面的取样工作,选取相对接近的群体和个体数量,将有助于Admixture分析的准确性。特别需要注意的是,Admixture分析揭示的祖源成分混合现象可提示杂交事件的潜在可能,但不完全谱系筛选等演化事件同样可能导致相似现象,故仅依赖Admixture分析无法对杂交事件进行证实。然而,Admixture分析依然是同倍体杂交物种形成研究的重要方法,分析结果对于杂交事件的提示可为后续研究指引方向。基因流检验基因流(gene flow)指遗传物质在不同类群或个体之间的转移。杂交事件会导致基因流的发生,同倍体杂交谱系与亲本谱系之间均有基因流的存在。因此,基因流检验是HHS分析的重要内容。IBD(identity by descent)分析是一种常见的共享单倍型分析方法,可以对来自共同祖先、遗传信息相同、未经历过重组的DNA片段进行鉴定与分析。系统发育分析、Admixture分析以及共享单倍型分析等,均可提示不同谱系间存在基因流的可能,但无法在基因流与不完全谱系筛选造成的相似现象间进行鉴别。常见的3类基因流检验方法包括D检验(又称ABBA-BABA检验)、TreeMix分析和PhyloNet分析,这些方法均可在考量不完全谱系筛选影响的情况下进行基因流的检测。D检验是较早被开发出来的基于位点统计(site pattern)的检验方法,可利用杂交谱系、两个亲本谱系、外类群共4个谱系的遗传信息,对杂交谱系与亲本谱系之间的基因流进行统计学检验。在HHS分析中D检验存在3个方面的局限:(1)无法对基因流的强弱进行定量;(2)无法判断基因流的方向;(3)基于阳性结果可以证实基因流的存在,但阴性结果不能说明类群间不存在基因流。以D检验为基础开发的一系列方法对此做出了改进, 检验( 和 等)可一定程度反应基因流的强弱,而DFOIL检验则通过考虑更多(5个)谱系的遗传信息实现了基因流方向的检验。TreeMix分析可基于等位基因频率进行最大似然树(ML树)构建,在对分化与杂交事件推断的同时进行基因流方向与强度的评估。而PhyloNet分析则依赖基因系统发育信息,通过模型计算对基因流进行推断。TreeMix分析与PhyloNet分析的结果均可通过系统发育树的形式展示,若存在基因流则呈现为网状树的形式。除此之外,TreeMix软件包还可以进行f3检验(three-population test)和f4检验(four-population test),前者可以计算某一谱系是否与其余两个谱系同时存在基因流,用于推断该谱系是否由杂交产生;而后者亦可对不同谱系间的基因流进行评估。杂交起源分析上述分析主要通过基因流检测和群体遗传结构等特征对同倍体杂交起源事件进行间接推断,而HyDe分析可基于遗传信息对新谱系的同倍体杂交起源进行直接检验。HyDe分析的结果具有统计学意义,可对亲本谱系在杂交类群遗传组分中的贡献比例进行评估。群体水平的HyDe分析是推断同倍体杂交起源的重要依据。此外,通过对相关谱系分化时间的评估也是排除不完全谱系筛选、推断杂交起源事件的有效方法。由于杂交谱系的基因组中混杂有两个亲本谱系的遗传信息,基于序列直接对其分化时间进行评估并不合理,可通过系统发育分析等手段鉴定杂交谱系中来自不同亲本的区域,并基于其分别计算杂交谱系与来源亲本的分化时间。若杂交谱系与两个亲本的分化时间相对接近,且明显短于亲本间的分化时间,则可为其杂交起源提供有力证据。然而,该方法不适用于杂交起源时间与亲本分化时间较为接近的谱系,无法对其发生不完全谱系的潜在可能进行排除。实际上,若两个亲本谱系的分化时间较短,在物种分化早期发生的“同倍体杂交事件”,正如“物种界定”时两个亲本谱系不是“好种”一样,也不是典型的“同倍体杂交物种形成”。最后,在证实同倍体杂交起源事件的前提下,可以使用LOTER分析对杂交谱系每个个体中来自不同亲本的遗传组分比例进行评估,不同个体间稳定的比例是印证杂交起源事件的另一重要证据。群体动态历史模拟鉴于物种形成历史往往相对久远且较为复杂,群体动态历史模拟在同倍体杂交物种形成研究中至关重要。前文所述的fastsimcoal2、DIY-ABC2和BPP等软件可以对不同演化模型(如HHS模型、渐渗起源模型、不完全谱系筛选模型等)进行模拟与比较,选取最优演化模型,并对其具体演化参数(分化时间、渐渗比例等)进行评估。标准三:“ 杂交物种与亲本种间的生殖隔离由杂交事件直接导致”该标准是区分“广义”和“狭义”同倍体杂交物种形成的关键,是严格定义“同倍体杂交物种形成”的基础,也是最具挑战的部分。无法满足此标准的发生遗传混合的独立演化谱系(或物种),应归为广义的“杂交渐渗”,但与种内杂交渐渗有所区别。不同物种间常常具有不同的生殖隔离性状,物种形成早期最初建立的生殖隔离性状的相关基因,在其物种形成过程中发挥最为重要的作用,是典型的物种形成基因。因此,该标准的核心分析需求是对同倍体杂交物种形成基因进行鉴定,分析这些基因是否直接由杂交产生,进而推动了杂交谱系的独立演化,促使其积累更多的遗传变异,产生更多的生殖隔离,从而使得杂交谱系与亲本谱系的生殖隔离程度随时间推移进一步加强。结合前文所述的生殖隔离研究方法,对杂交物种形成关键基因的鉴定,是证实“杂交物种与亲本种间的生殖隔离由杂交事件直接导致”最直接、有效的研究手段。然而,受限于同倍体杂交物种形成的演化特点和前期研究方法的局限,在很长一段时间内研究人员对此束手无策。在桦木科虎榛子属的研究中,研究人员揭示了同倍体杂交物种形成的分子遗传新机制——亲本物种的生殖隔离关键(等位)基因在杂交后代中重新组合,成为“杂交物种形成”关键基因,促使其与亲本物种快速建立种间生殖隔离,并推动其演化成为新的同倍体杂交物种;并基于该分子机制,构建了同倍体杂交物种形成关键基因鉴定的新方法。该方法利用群体遗传学数据,结合类群分组、自然选择计算(HKA检验)、分化程度评估(群体间基因功能相关的固定差异位点)、系统发育分析等手段, 可以对同倍体杂交物种形成关键候选基因进行鉴定。最后,通过转基因实验和分子生化实验(如酶活实验、LUC实验)等方法,对关键候选基因进行功能验证,筛选得到在同倍体杂交物种形成过程中发挥重要作用的同倍体杂交物种形成关键基因。研究人员利用该方法首次实现了同倍体杂交物种形成关键基因的鉴定,成功鉴定到了虎榛子属的同倍体杂交物种形成关键基因。研究发现,FRO4与ZIP5等等位基因的分化和重新组合可能导致了杂交物种居中虎榛子的铁元素适应性与亲本种滇虎榛子相似,与另一亲本种虎榛子形成生殖隔离;而LHY等等位基因的分化和重新组合则是导致居中虎榛子的花期与虎榛子相似,与滇虎榛子形成生殖隔离的主要原因;亲本种间不同类型的生殖隔离在杂交后代中重新组合,促使其与不同亲本种间同时建立生殖隔离,并快速演化成为新的杂交物种。上述同倍体杂交物种形成的分子遗传新机制与关键基因鉴定方法在桦木科千金榆组、黔金丝猴、猕猴属(Macaca)食蟹猴种组(fascicularis group)、亚洲黑熊(Ursus thibetanus)等众多植物和动物的同倍体杂交类群中被反复验证,展现出了较高的普适性。事实上,多数生殖隔离性状都由复杂调控网络中的众多基因共同控制。利用上述方法鉴定到的同倍体杂交物种形成关键基因作为主效基因,在所研究类群的杂交物种形成过程中发挥了重要作用。然而,即使是同源基因控制的同一性状,在不同类群发生的亲本谱系分化和杂交物种形成事件中,涉及的基因或遗传变异都可能有所差异。除此之外,在杂交物种形成过程中,若导致大量亲本谱系之间固定的SNP和InDel在杂交谱系中重新组合,基于BDMI模型,可导致杂交谱系与亲本谱系之间杂交后代的产生机率与适合度均降低(即导致生殖衰败),造成杂交谱系与亲本谱系间合子后生殖隔离的快速形成,亦可作为“杂交物种与亲本种间的生殖隔离由杂交事件直接导致”的重要证据之一。但是,由于该过程涉及的基因和遗传变异较多,很难利用可靠的遗传、分子或生化证据进行证实。正如前文所述,合子前生殖隔离与合子后生殖隔离相比,相关的等位变异与性状更易在物种形成中受到自然选择而保留,对推动物种形成具有更为关键的作用,同时也对种间总生殖隔离贡献更大。因此,通过上述模型、方法与流程所鉴定到的合子前生殖隔离基因,由于直接继承自亲本物种,且在同倍体杂交物种形成的基因组重新组合过程中最早(最初几代)固定,在同倍体杂交物种与两个亲本物种最初的生殖隔离建立过程中发挥关键作用,应是比较典型的“同倍体杂交物种形成基因”。
图5 | 不同的物种形成方式示意图。
图6 | 物种形成研究内容与研究方法示意图。“种间杂种”与“同倍体杂交物种”在理解和实践中经常被混淆。前者存在杂交衰败,是一个非独立演化的谱系;而后者为繁殖和生存能力正常的独立演化谱系。此外,“渐渗”和“同倍体杂交物种”在一些研究实例中也不易区分。对于严格的同倍体杂交物种,必须证明杂交对其与两个亲本物种的生殖隔离发挥了重要作用;不能提供此证据的“基因组遗传混合”物种(或独立演化谱系),可暂时归入种间杂交渗入。中文背景下,“杂种”、“杂交种”和“杂交物种”三个名称均有使用。“杂种”有时指 “种内杂种”,有时指“种间杂种”,目前无法利用其他简短术语对以上两种情况进行区分,要根据上下文背景进行理解。“杂交种”多指“种间杂交物种”,但有时仍被用来指代“种间杂种”;为了减少混淆,建议尽量不使用“杂交种”这个术语。此外,严格的种间杂交渐渗是指:渗入的基因和遗传成分不会导致被渗入群体与其他群体产生生殖隔离,往往被渗入群体是一个更广义物种的部分个体或群体。但是,很多物种中被杂交渗入的基因参与了被渗入群体与其他群体的生殖隔离(如环境适应性的合子前生殖隔离),由于它们之间的生殖隔离程度与分化程度均较小,可视为“同倍体杂交物种形成的早期”,但仍然只能作为“杂交渐渗群体”来处理。除这些概念和术语在未来研究中要加以区分外,我们建议还应重点关注如下5个方面的内容:(1)利用整合物种概念和方法,对现有记载的物种进行群体水平上的差异性统计、验证和分类修订,判断不同物种间是否具备多种物种界定证据(越多越好),重点关注其是否具备群体水平上形态学、遗传学和生态位(含地理分布)的统计学差异;如有条件,也可检测其是否具备生殖隔离;特别是在野外采集或室内标本鉴定时,要重视“种间杂种”的概念,不要试图把所有个体均界定为某一物种:有些分布区域(尤其是两个物种的分布接触区)的个体,甚至大面积分布的群体,都有可能是杂种,物种界定时应正确使用杂种名称;(2)对于二歧式物种分化研究,要加强生殖隔离主效基因的研究;特别是将生殖隔离等位基因分化与群体分化历史相结合,开发新分析方法,对推动群体最初分化的“物种形成关键基因”进行鉴定与甄别;(3)对于同倍体杂交物种形成研究,已有的研究方法可对通过杂交发生重新组合(交替继承自亲本谱系)的“同倍体杂交物种形成基因”进行鉴定,但对于杂交谱系独立演化之后获得的生殖隔离机制及其他关键表型相关基因(或遗传变异)的关注较少,对于杂交谱系如何克服杂交衰败、恢复正常繁殖能力的遗传机制也鲜有报道;(4)目前对于高级分类单元(如包含多个现存物种的目、科、属等)存在的古老同倍体杂交物种形成的研究依然报道较少;建议利用 WGDI等软件和方法对广泛存在的古老基因组加倍谱系进行杂交历史鉴定(或确认),同时对古老杂交多倍化影响表型创新、物种辐射演化的遗传机制进行深入解析;(5)在驯化物种的形成与演化历史研究中,人类选择效应与杂交渐渗相互交替,极其复杂,也是未来研究中的重要方向。此外,基于二歧式的基因组系统发育树,很多节点都存在严重的拓扑结构冲突。排除不完全谱系筛选等因素的影响后,杂交物种形成应该是造成该现象最为重要的原因。若能证明杂交(同倍体杂交或杂交多倍化)广泛存在于生命演化中的诸多节点,则说明“生命之树”更应表述为“生命之网”。值得注意的是,物种形成研究的意义不应局限于理论贡献,更应关注其应用价值。结合物种形成理论及物种形成关键基因的鉴定等,不仅可以指导濒危物种保护,还将在远缘杂交精确育种等方面具有重要意义。尤为重要的是,因为同倍体杂交物种能聚合双亲物种的优异性状,未来可有目的通过同倍体杂交物种形成方式,创制具有双亲性状的新同倍体杂交物种,最终利用创制的新物种进一步培育新品种进行栽培或养殖。这是一条完全不同于已有(通过反复回交、渗入极少量基因)的远缘杂交育种途径。尽管可能存在很多挑战,但是新创制的同倍体杂交物种杂合度较高,杂种优势将更为明显,未来的突变速率与可塑性均会更大,具有更为广泛的应用价值。为了不让您最关心的内容被湮没
防止我们一不小心失散
快把“iPlants”设置为星标吧★
只需三步↓↓
微信加群相关知识
同倍性杂交物种形成和适应性进化的遗传基础
综述 | 福建农林大学兰思仁/刘仲健研究团队综述兰花研究及其产业化进展与展望
青海苜蓿和花苜蓿基因组水平的物种形成研究
花龟、草龟物种杂交后代的线粒体基因组研究
二代测序技术和叶绿体基因组在菊花系统学分类和遗传资源研究中的应用综述
IF 27.5重磅综述|植物群体重测序研究进展
MP长篇综述|植物泛基因组及其应用
多组学研究揭示竹类植物生活史转变和物种多样化的遗传机制
FR综述 | 景观基因组研究果树对当前和未来气候条件局域适应性
昆明植物所研究团队发表被子植物系统发育基因组学与“生命之树”研究综述
网址: 遗传重磅!万字综述:基因组时代的物种形成研究 https://m.huajiangbk.com/newsview627116.html
| 上一篇: 国内首现!云南发现中国新记录物种 |
下一篇: 植物所王印政研究组揭示大岩桐属套 |