药用植物桔梗Platycodongrandifloras (Jacq.) A. DC. 隶属于桔梗科桔梗属,为多年生草本,别名包袱花、铃当花、道拉基[1]。在《中国药典》2020年版中桔梗以根入药,具有宣肺利咽、祛痰排脓等功效,多用于咳嗽痰多、胸闷不畅、咽痛音哑、肺痈吐脓[2]。桔梗的主要化学成分为含桔梗皂甙,此外含有丰富的多糖、各种氨基酸及矿物质等,国家卫生部将桔梗列为药食两用的中药材[3]。桔梗科有60~70个属,中国产16个属,而桔梗属仅有1个种桔梗[4]。桔梗产自东北、华北、华东、华中各省,韩国、朝鲜、日本等地区也有分布[5]。山西省阳泉市盂县山地面积广,海拔高,土壤中富含磷钾,为桔梗的生长提供了得天独厚的自然环境。桔梗作为山西盂县地道中药材,因其品质好被百姓誉为“小人参”。目前,药用植物桔梗的叶绿体基因组虽然已经报道[6],但是对于不同地区桔梗的叶绿体基因组组装、基因组特征和系统进化分析等未见报道。
叶绿体基因组一般由1个大单拷贝区域(large single copy,LSC)、1个短单拷贝区域(small singlecopy,SSC)和2个反向重复区域(inverte drepeat,IR)组成闭环双链DNA结构,基因组大小多为150~200 kb [7-9]。叶绿体是植物细胞内半自主性的细胞器,拥有相对独立的基因组,依赖于母系遗传,具有结构稳定、序列保守、间隔区变异位点丰富,分子进化速率慢等特点,广泛应用于亲缘关系、系统进化关系及遗传多样性研究[10-12]。
随着测序技术的不断发展以及测序成本的降低,已报道多种重要的药用植物叶绿体基因组序列,如人参Panax ginseng C. A. Meyer [13]、银杏Ginkgo bilobaL. [14]、厚朴Houpoea officinalis (Rehder & E. H. Wilson) N. H. Xia & C. Y. Wu [15]、红豆杉Taxus wallichianavar. chinensis (Pilger) Florin [16]、肉苁蓉Cistanche deserticolaMa [17]、三七Panaxnotoginseng (Burkill) F. H. Chen ex C. Y. Wu & K. M. Feng [18]、石斛Dendrobium nobileLindl. [19]、丹参Salvia miltiorrhiza Bunge [20]等。本研究基于高通量测序技术,对桔梗开展叶绿体全基因组测序、组装及注释,获得其叶绿体基因组的全长序列信息;利用生物信息学手段比较分析不同地区桔梗的结构特征、简单重复序列(simple sequence repeats,SSRs)位点、边界分析、序列变异程度等,同时构建系统进化树,为深入研究桔梗的鉴定、分子标记开发及系统发育关系提供数据支撑。
1 材料
桔梗新鲜叶片材料采自山西省阳泉市盂县桔梗种植基地(38°13′55″E,113°6′16″N),凭证标本号为XZ-2020-1。叶片装入取样袋带回实验室,液氮速冻后放于−80 ℃冰箱保存备用。样品由山西中医药大学杜晨晖教授鉴定,凭证标本存放于山西中医药大学标本馆。桔梗及其近缘物种叶绿体基因组序列来源于NCBI数据库,实验材料详细信息见表1。
2 方法
2.1 提取DNA及测序
采用北京天根生化植物DNA提取试剂盒(Tiangen Biotech有限公司,中国)提取叶片DNA,1%琼脂糖凝胶电泳和微量分光光度计(Nanodrop 2000,美国)检测DNA质量及浓度。以1 μg DNA起始量建库,随机打断检测合格的基因组总DNA,构建长度约350 bp的插入片段文库。构建好的文库经过质检后,利用lllumina NovaSeq平台进行双末端测序,序列读长为150 bp,测序工作由北京上锋基因生物科技有限公司完成。
2.2 序列拼接、注释及绘制物理图谱
利用Trimmomatic软件[21]对测序得到的原始序列(raw reads)进行质控(参数设置选择默认值),滤过去除接头(adapter)和低质量序列(reads),得到高质量待分析序列(clean reads)。参考序列为桔梗(NC_035624),运用NOVOPlasty软件[22]对桔梗叶绿体基因组组装,并利用GapCloser软件对组装结果进行内洞修补。然后使用CPGAVAS软件[23]进行叶绿体基因组注释,并运用Apollo软件对注释结果进行人工校准,最终结果提交至GenBank获得登录号(MZ202358)。运用Organellar Genome DRAW在线软件[24]绘制桔梗叶绿体基因组物理图谱。
2.3 简单重复序列分析
利用MISA软件检测桔梗叶绿体基因组的SSRs [25] ,参数设置为:单核苷酸重复单元≥10,二核苷酸重复单元≥5,三核苷酸和四核苷酸重复单元≥4,四核苷酸、五核苷酸和六核苷酸重复单元≥3,且2个SSRs之间的最小距离为100 bp。
2.4 密码子偏好性分析
使用CodonW软件[26](http://codonw. sourceforge.net/)获得桔梗叶绿体基因组的有效密码子数(effective number of codon,ENC)、密码子的第3个碱基出现G/C的概率(GC3s)、相对同义密码子使用度(relative synonymous codon usage,RSCU)。以ENC值为参考,对桔梗叶绿体基因组编码序列从大到小排序,筛选最高和最低两端各10%的基因,分别建立高、低表达基因库,以ΔRSCU(高表达基因RSCU-低表达基因RSCU)≥0.08为条件,筛选出高表达密码子;以RSCU>1为条件,筛选出高频密码子。同时满足高频和高表达条件的密码子确定为最优密码子[27]。
2.5 叶绿体基因组IR边界的收缩和扩张分析
IR区域相对保守,IR边界的膨胀和收缩被认为是被子植物叶绿体全基因组大小变化的主要机制[28]。本研究使用IRscope在线软件(https://ir-scope. shinyapps.io/irapp/)获得并比较分析桔梗及桔梗科其他4种植物叶绿体基因组的IRA/IRB、LSC和SSC和边界基因的序列长度,探讨桔梗科植物叶绿体基因组IR边界的收缩和扩张特征[29]。
2.6 叶绿体基因组序列变异分析
本研究基于LAGAN模型,利用mVISTA软件对中国地区桔梗(MZ202358)与韩国地区桔梗(NC_035624)叶绿体全基因组进行序列比对和变异分析[30]。
2.7 系统发育分析
从GenBank获取紫茎泽兰(NC_036222)、展枝沙参(NC_036221)、薄叶荠苨(NC_026999)等桔梗科17种(19个)物种和2个外类群物种的完整叶绿体基因组信息,分析获得66个共有蛋白质编码基因:atpA、atpB、atpE、atpF、atpH、atpI、ccsA、cemA、matK、ndhA、ndhC、ndhD、ndhF、ndhG、ndhH、ndhI、ndhJ、petA、petB、petD、petG、petL、petN、psaB、psaC、psaI、psaJ、psbA、psbB、psbD、psbE、psbF、psbH、psbI、psbK、psbL、psbM、psbN、psbT、psbZ、rbcL、rpl14、rpl16、rpl2、rpl20、rpl32、rpl33、rpl36、rpoA、rpoB、rpoC1、rpoC2、rps11、rps12、rps14、rps15、rps16、rps18、rps19、rps2、rps3、rps4、rps7、rps8、ycf1、ycf2。利用在线软件MAFFT7(https://mafft. cbrc.jp/alignment/ server/)将上述物种的共有编码基因进行比对,比对结果使用IQ-TREE multicore 2.0.5(http:// www.iqtree.org/)软件[31],最大似然法(maximum likelihood method,ML)构建系统发育树,构树参数设置:-mMFP- B1000-alrt 1000,优构树模型:GTR+F+R3,Bootstrap value为1000。
3 结果与分析
3.1 叶绿体基因组的基本特征
与大多数被子植物相同,桔梗的叶绿体基因组呈现典型的四分体结构,由2个大小相同、方向相反的反向重复区(IRa、IRb)、1个LSC区和1个SSC区组成(图1)。桔梗的叶绿体基因总长度为172 770 bp,其中LSC区长79 115 bp,SSC区长7841 bp,IRa区长42 907 bp,IRb区长42 907 bp。桔梗叶绿体基因组整体GC含量为38.10%,其中蛋白编码区的GC含量是38.11%,4个区段中GC含量最高的是IR区(39.53%),其次是LSC区(37.25%)和SSC区(31.03%)。
桔梗叶绿体基因组共注释到139个基因,包括95个蛋白编码基因、36个tRNA基因和8个rRNA基因(表2)。蛋白编码基因的长度为90 594 bp, 占整个基因组长度的52.44%;tRNA基因的长度为2713 bp,占总长度的1.57%;rRNA基因的长度为9176 bp,占总长度的5.31%。非编码区主要包括内含子、假基因(trnT-GGU、rpl23、clpP、ndhE等)和基因间隔区,占整个基因组长度的40.68%。在桔梗叶绿体基因组注释到4个具有内含子的基因,包括trnT_GGU、rpl23、clpP、ndhE。
3.2 密码子的偏好性
桔梗叶绿体基因组的密码子使用偏性中,叶绿体基因组的ENC值为51.24,明显高于35,表明密码子偏好性较弱。GC3s含量为28.61%,表明密码子第3位偏好于A和U结尾。通过最优密码子分析显示(表3),有30个密码子RSCU>1,25个密码子ΔRSCU≥0.08,筛选发现同时满足这2个条件的最优密码子有9个,分别为UUG、AUU、UCA、AGC、CCU、GCU、CAU、CGU和GAU,其中以A/U结尾的有7个,以C/G结尾的有2个。
3.3 SSR位点分析
共检测到桔梗叶绿体基因组139个SSR位点,包括115个单核苷酸重复序列、6个二核苷酸重复序列、5个三核苷酸重复序列、11个四核苷酸重复序列和2个六核苷酸重复序列。其中,60个SSR位于基因间隔区(IGS),65个SSR位于外显子 (exon),14个SSR位于内含子(intron)。叶绿体不同区域的SSR分布情况见图2,大部分SSR位于LSC和IRs区域内,只有少数位于SSC区域内。SSR中重复占比最大的是单核苷酸,约82.73%,而二核苷酸、三核苷酸、四核苷酸和六核苷酸则占比减小,分别占4.32%、3.60%、7.91%和1.44%。桔梗叶绿体基因组中的SSR主要是有A和T组成的,占所有重复序列的83.45%,其中A/T碱基构成的单核苷酸重复108条,AT/AT组成的二核苷酸重复序列5条,ATT/TAA组成的三核苷酸重复序列2条,AAAT组成的四核苷酸重复序列1条。
桔梗科5种植物叶绿体基因组序列中,总共检测到SSR位点103~143个SSR位点(表4),其中单核苷酸重复为90~117个、二核苷酸重复为6~8个、三核苷酸重复5~14个、四核苷酸重复1~11个、五核苷酸重复0~4个、六核苷酸重复0~2个。这些SSR主要分布于叶绿体基因组的LSC区(36.70%~65.12%),编码基因序列中分布的SSR数量仅占总数的32.56%~54.37%。
3.4 桔梗及桔梗科部分物种叶绿体全基因组特征比较
桔梗科部分植物叶绿体全基因组特征的比较分析见表5,桔梗及其近缘种物种共5种(6个)植物叶绿体基因组的序列长度范围为159 759~172 770 bp,其中沙参的叶绿体基因组长度最短,而桔梗的叶绿体基因组最长,不同地区的桔梗叶绿体基因组长度相差952 bp。6个物种叶绿体基因组总GC含量为38.10%~39.03%,IR区的GC含量(39.53%~51.00%)均显著高于LSC区(36.86%~38.18%)和SSC区(31.03%~35.42%)。其中桔梗的GC含量最低,铜锤玉带草的GC含量最高。不同地区桔梗全基因组的总GC含量相差不大,分别是38.10%和38.12%。
利用Geneious 11.0.3软件获取桔梗及4种近缘桔梗科植物的IR 区、LSC区和SSC区序列。结果表明,IR区的序列长度范围为20 200~85 814 bp,其中沙参的IR区最短,桔梗的IR区最长,不同地 区桔梗的IR区的长度相差948 bp。LSC区序列长
度范围为79 061~112 321 bp,其中桔梗的LSC区长度最短(79 061 bp),沙参LSC区长度最长(112 321 bp),不同地区的桔梗LSC区的长度相差54 bp。SSC区序列长度范围介于7840~27 238 bp,其中沙参的SSC区最长(27 238 bp),桔梗的SSC区最短(7840 bp),不同地区桔梗的SSC区的长度仅相差1 bp。
3.5桔梗及桔梗科部分物种的叶绿体基因组边界分析
桔梗及桔梗科5个属共5种植物叶绿体基因组的IR-LSC和IR-SSC边界比较显示(图3),桔梗与其余4种桔梗科植物叶绿体全基因组相比,边界处基因不完全相同,基因的长度也有差异。LSC/IRb 边界(JLB)边界扩张范围显示,桔梗与其余4种桔梗科植物相比,JLB边界侧翼基因为rps11和rpl36基因,而铜锤玉带草、毛细钟花和小党参JLB边界处具有相同的基因,左翼为rps19基因,右翼为rpl2基因,但扩张程度稍有差异,沙参的JLB边界位于trnL基因左翼。SSC/IRb(JSB)边界扩张范围显示,桔梗、毛细钟花与铜锤玉带草JSB边界位于ndhE基因,但扩张程度不同。小党参JSB边界位于ndhE基因的右翼,距离1 bp,而沙参JSB边界位于ndhF基因的左翼。SSC/IRa(JSA)边界扩张范围显示,桔梗和小党参JSA边界位于ndhE基因内,但扩张程度稍有差异。毛细钟花和铜锤玉带草JSB边界位于ndhF基因右翼,距离分别为273、139 bp,而沙参JSB边界位于clpP基因右翼。LSC/IRa(JLA)边界扩张范围显示,桔梗与其余4种桔梗科植物JLA边界位于trnH基因左翼,但扩张程度有差异。不同地区的桔梗其边界具有高度的保守性,各边界侧翼基因完全相同,扩张程度略有差异。
3.6 叶绿体基因组序列变异分析
本研究测序的桔梗植物叶绿体基因组与韩国地区桔梗全基因组序列相似性比较结果见图4。结果表明,2种不同地区桔梗叶绿体基因组序列的整体相似度较高,但仍存在明显的差异。变异程度最高的区域集中在IR区,编码区和非编码区都有不同程度的变异。psbC、rps18、rpoB、ycf1等基因的编码区存在7个单碱基突变(SNP),ycf1基因的编码区有2个插入突变。非编码区存在7个单碱基突变和5个插入突变,包括rpl32-trnL、trnS-psbZ、trnN -ycf1等,如新测序桔梗在trnN-ycf1基因间隔区108 704 bp处插入255个碱基。这些变异位点是不同地区桔梗鉴定的潜在分子标记,具有极高的研究价值。
3.7 系统进化分析
本研究以桔梗、2个外类群和已公布的17种(18个)桔梗科植物的66个共有蛋白编码基因进行比对,将比对结果采用IQ-TREE软件ML法构建系统进化树(图5)。结果显示,19个桔梗科物种构成一单系分支,显著区分于外类群拟南芥和人参,具有100%支持率。在系统树上,桔梗科物种可以分为3个主要分支。A分支是半边莲亚科构成的单系分支,支持率为100%。B分支和C分支由桔梗亚科构成,支持率为100%。分支C包括2个族,桔梗族和蓝钟花族。不同地区的桔梗聚为一小支,进一步与党参属、蓝钟花属、细钟花属物种聚为一支。分支B是风铃草族构成的构成的单系分支,支持率为100%。基于叶绿体基因组的系统进化树与已知的物种进化关系一致,为桔梗科物种系统进化关系的建立提供依据。
4 讨论
桔梗始载于《神农本草经》,是中医常用的一味止咳平喘的良药。本研究完成了桔梗叶绿体基因组的测序、组装和注释。结果表明,桔梗叶绿体基因组具有被子植物叶绿体基因组典型的四分体结构,包括1个LSC区、1对IR区和1个SSC区, 序列长172 770 bp,其长度高于其他4个近缘种。不同地区桔梗叶绿体基因序列长度在171 800~172 800 bp,IR区的差异最大(952 bp),原因是本研究测序的桔梗位于IR区的ycf1基因存在明显的序列插入现象,导致其比已报道的韩国地区桔梗序列长。桔梗叶绿体基因组GC含量低于其他4个近缘种。不同地区桔梗叶绿体基因组GC含量基本一致(38.10%~38.12%),IR区的GC含量均高于其他区域,可能与IR区含有高GC含量的rRNA基因有关。不同地区桔梗叶绿体基因组分别注释到139和140个基因,包括95个蛋白编码基因、36~37个tRNA基因和8个rRNA基因,体现了叶绿体基因组的稳定性。
植物叶绿体基因组中IR区域的收缩和扩张是一种相对普遍的现象,使相同植物群体之间的整个叶绿体基因组之间出现差异[32]。本研究中桔梗与其他4个近缘种IR边界分析显示,其LSC/IRb边界(JLB)、SSC/IRb边界(JSB)、SSC/IRa边界(JSA)和LSC/IRa边界(JLA)的侧翼基因类型和扩张程度有明显差异,对研究物种进化等具有重要意义。不同地区桔梗叶绿体基因组边界基因和扩张程度完全相同,仅JLA边界与侧翼基因trnH的距离相差2 bp。本研究中桔梗叶绿体基因组SSR位点有139个,以单核苷酸重复(占总数的83.40%)为主要类型,且随着拷贝数目增加,SSRs数量明显减少,这种现象在其它植物中也有报道[33]。桔梗叶绿体基因组中的SSR主要分布于LSC和IR区,多数由碱基A和T组成,与石斛属部分物种的SSR碱基组成相似[34]。不同地区桔梗的核苷酸重复类型基本相同,但SSR的数量有差异,原因是IR区的SSR数量存在差异。桔梗科不同属的物种叶绿体基因组中的SSR的数量和分布模式差异显著,这些SSRs为桔梗科物种鉴定和系统发育分析奠定基础。
已有研究表明,叶绿体基因组常应用于物种鉴定和系统发育关系研究[10-12]。比对2个不同地区的桔梗叶绿体基因组序列编码区和非编码区都有不同程度的变异,psbC、rps18、rpoB、ycf1等基因的编码区和rpl32-trnL、trnS-psbZ、trnN-ycf1等基因间隔区存在14个单碱基突变和7个插入缺失突变,基于21个差异区可开发特异DNA条形码,鉴定不同地区的桔梗,为优化种质资源及良种繁育奠定基础。
为进一步界定药用植物桔梗在桔梗科的系统位置,探讨桔梗属与其近缘属的系统发育关系。基于桔梗科19个物种66个共有编码基因构建系统发育树结果显示,所有的桔梗科物种形成一个单系群,支持率为100%。桔梗族物种与蓝钟花族物种聚为一组,该结果与Li等[34]的研究结果类似。不同地区的桔梗聚为一小支,进一步与党参属、蓝钟花属、细钟花属物种聚为一支,说明桔梗属、党参属、蓝钟花属、细钟花属亲缘关系较近。有学者认为铜锤玉带属与半边莲属有密切的亲缘关系,应合并为半边莲属[10]。铜锤玉带草原隶属于铜锤玉带属,但目前《中国植物志》已修订铜锤玉带草为半边莲属[35]。图5显示铜锤玉带草与其他半边莲属物种互为姐妹群,支持“半边莲属与铜锤玉带属应合并成为半边莲属”的说法[10]。本研究中桔梗科系统进化树与已知的物种进化关系一致。
本研究对桔梗叶绿体基因组重新测序,综合分析桔梗的叶绿体基因组序列、结构和特征,筛选出不同地区桔梗叶绿体基因组的差异序列,探讨桔梗科物种系统进化关系,结果不仅丰富了桔梗的叶绿体基因组信息,为叶绿体基因组序列中筛选特异性DNA条形码基因序列及系统发育关系研究提供了参考。
利益冲突所有作者均声明不存在利益冲突
参考文献(略)
来 源:张 瑜,杜晨晖,詹海仙,尚彩玲,李瑞锋,原淑佳.桔梗叶绿体比较基因组学分析及系统发育研究 [J]. 中草药, 2023, 54(15):4981-4991.
相关知识
百合属的比较叶绿体基因组学研究
单子叶分支的花粉形态和演化研究——兼论泽泻目的叶绿体系统发育基因组学
绣球花族叶绿体基因组结构比较与系统发育研究
抗癌药用植物鬼臼亚科的系统发育基因组学和生物地理学研究
丁香属3种植物完整叶绿体基因组与系统发育研究
广义红豆杉科系统发育基因组学与生物地理学研究
昆明植物所研究团队发表被子植物系统发育基因组学与“生命之树”研究综述
中国特有苏铁属植物叶绿体比较基因组学研究
蔷薇类系统发育基因组学研究取得进展—论文—科学网
科学家在蔷薇科叶绿体系统发育基因组研究中取得进展
网址: 桔梗叶绿体比较基因组学分析及系统发育研究 https://m.huajiangbk.com/newsview2213577.html
上一篇: 【白花桔梗的功效与作用】白花桔梗 |
下一篇: Plant Journal |