高分辨率的时间动态转录组学揭示Gh-CAL介导的棉花开花调控通路
一区,影响因子:9.803
从营养生长到生殖生长的过程对于棉花的早熟非常重要。然而,这种高度动态和复杂的发育过程的遗传控制仍不清楚。使用两个早熟和晚熟棉花品种的 72 个样本,从六个发育阶段生成高分辨率的组织和阶段特异性转录组谱。石蜡切片的组织学分析结果表明,早熟品种的花芽分化发生在真叶第三期(3TLS),晚熟品种的花芽分化发生在真叶第五期(5TLS)。采用两两比较和加权基因共表达网络分析,得到5312个差异表达基因,分为10个基因共表达模块。在MElightcyan模块中,鉴定出46个调控棉花花芽分化的候选基因,并在花芽分化阶段表达。在 MElightcyan 模块中鉴定了一个与花芽分化相关的新的关键调控基因 GhCAL。Anti-GhCAL 转基因棉花植物表现出晚花芽分化和开花时间。 GhCAL 与 GhAP1-A04/GhAGL6-D09 形成异二聚体并调节 GhAP1-A04 和 GhAGL6-D09 的表达。 GhAP1-A04-和GhAGL6-D09-沉默的植物也显示出显着的晚开花。最后,我们提出了一种由 GhCAL 介导的新开花调控途径。本研究阐明了棉花开花调控的分子机制,为棉花早熟育种提供了良好的遗传资源。
材料和方法
1. 植物材料和样品采集
早熟陆地棉品种CCRI50、Yanzao2和晚熟品种Guoxinmian11、STS458。收集了六个阶段的茎尖:子叶阶段(0TLS),第一真叶阶段(1TLS),第二真叶阶段(2TLS),第三真叶阶段(3TLS),第四真叶阶段(4TLS)和第五个真叶阶段(5TLS)。对于每个阶段,对于三个生物重复中的每一个,将 10-15 个棉苗的茎尖汇集在一起,用于RNA提取。将这些样品立即放入液氮中并储存在80°C的冰箱中。
2. 茎尖的解剖观察
在本研究中,在每个阶段的3个生物重复中,为了保持样品完整,每个阶段都轻轻地切除3 ~ 5个棉花幼苗的茎尖。处理—染色。在日本Olympus SZ61TR光学显微镜下观察棉花花芽分化过程,记录并拍摄各时期的分化日期和形态特征。
3. RNA提取测序
测序平台Illumina HiSeq 双端150bp。
4. 比对分析
TM-1 参考基因组 (Gossypium hirsutum, ZJU)。从 https://cottonfgd.org/about/download.html 下载。 去除低质量读数后,使用 TopHat 和默认参数设置将 Illumina 测序读数映射到 TM-1 参考基因组。 FPKM 用于定量估计基因表达。 DESeq用于分析基因的差异表达,选择log2ratio≥1和q<0.05作为差异上调基因。 将同一品种的每一阶段与前一阶段(同一品种,不同阶段)进行比较,早熟品种与晚熟品种的同一阶段(不同品种,同一阶段)分别进行比较。为了准确鉴定早熟品种和晚熟品种之间的差异表达基因,在分析中排除了两个早熟品种之间和两个晚熟品种同一时期之间的差异基因。
5. WGCNA和功能富集分析
WGCNA总共使用了5312个基因,平均FPKM用于WGCNA分析。这些模块是使用默认设置的自动网络构建功能块获得的。 计算每个模块的特征值并用于测试与每个品种和阶段的关联。 这些基因被分为 10 个品种和特定阶段的模块。 使用 Cytoscape_v.3.0.0 可视化网络。
AgriGO 用于 GO 分析。 Q值为0.05,被认为是显着富集。
6. 候选基因的克隆、载体构建和转化
以早熟品种CCRI50茎尖cDNA为模板,用PimerSTAR GXL DNA聚合酶扩增候选基因的完整CDS序列。扩增产物被克隆到载体PBI121中。GhCAL的反义序列也被构建到过表达载体PBI121中。如其他地方所述,通过根癌农杆菌介导的基因转移转化拟南芥植株。通过农杆菌介导的DNA转移以及愈伤组织、分化愈伤组织、胚性愈伤组织和嫁接植株等一系列共培养,将GhCAL反义融合基因转化到棉花“ZM24”下胚轴中。本研究中使用的引物如表S8所示。
7. 序列比对和系统发育分析
在这项研究中,核酸和蛋白质序列是从棉花基因组网站上下载的,ClustalW用于多序列比对。在MEGA5中采用邻接法构建了系统发育树。通过1000次(bootstraps)评估树中节点的可靠性。
8. Y2H 分析中的蛋白质相互作用
通过特异性引物PCR扩增候选基因的编码区并克隆到pGBKT7载体中,然后进行自激活活性测定和毒性试验。 将候选基因的编码区克隆到pGADT7载体中。 PGBKT7-基因和pGADT7用作阴性对照质粒。 将重组质粒导入酵母菌株 Y2Hs。 在选择性上检测到双杂交相互作SD/-Trp/-Leu双脱落和SD/-Ade/-His/-Leu/-Trp四重培养基。
9. BiFC
将全长基因的开放阅读框(ORF)插入到单独的pUC-SPYNE和pUC-SPYCE载体中。根据之前的方案进行BiFC测量。从拟南芥叶片中分离的原生质体用于质粒转化。使用FV1000仪器进行共焦显微镜检查。
结果
一、棉茎尖形态发育研究
两个早熟品种和两个晚熟品种的比较
(a) 与早熟相关的特征比较。DAS:播种后天数;BT:出芽时间; NFFB:第一个ruiting分支的节点;FT:开花时间。
( b - y )棉花茎尖的石蜡切片。 0TLS、1TLS、2TLS、3TLS、4TLS和5TLS分别表示子叶、第一、第二、第三、第四和第五真叶阶段。 绿色箭头代表植物芽。 红色箭头表示花蕾。
本研究选取2个早熟陆地棉品种CCRI50和Yanzao2,以及2个晚熟品种Guoxinmian11和STS458进行研究。与晚熟品种相比,早熟品种的出芽时间提前了10天,开花时间提前了19天,整个生长期短了33天。
二、棉花植物不同发育阶段 72(4*6*3) 个 RNA 文库的转录组图谱
早熟品种和晚熟品种六个发育阶段之间的转录组关系
(a) 聚类树图显示了不同的聚类组。
( b )在所有样品中鉴定的基因的主成分分析。
RNA 测序数据来自 4 个不同品种的 72 个样本,在 6 个不同的发育阶段,具有 3 个生物学重复。所有样品均以品种名称和时期的简称命名,即CCRI50、Yanzao2、Guoxinmian11、STS458的简称分别为C、YZ、G、STS,子叶至真叶5期的简称为0, 1, 2, 3, 4 和 5。总共产生了 30 亿个高质量的reads。 Q20 (~92%) 和 Q30 (~89%) 的值表明测序数据的质量足以支持进一步的转录组分析。大约 85% 的读数是唯一比对的(表 S1)。三种生物重复之间表达值的比较高度相关(图S1)。因此,将三个重复的平均 FPKM 值计算为每个样本中基因的表达水平。为了减少转录噪声的影响,FPKM <0.5 的基因被认为没有表达。在至少一个样本中发现总共有 49 000 个基因表达。为了了解早熟和晚熟棉花品种发育的转录动态,对所有样品进行了层次聚类(图 2a)和主成分分析(PCA)(图 2b)。结果表明,转录本可以根据发育阶段初步分为两类(0,1,2和3,4,5),然后在每一类中区分早熟品种和晚熟品种。
三、加权基因共表达网络分析(WGCNA)
差异表达基因的 WGCNA
(a) WGCNA 共表达模块的层次聚类树。树上的每一片叶子都是一个基因。主要的树枝构成了 10 个用不同颜色标记的模块。
(b) 模块-样本关联。 每行对应一个模块。 模块名称显示在左侧。 每列对应一个特定的样本。 行列交叉处每个单元格的颜色表示模块与样本之间的相关系数。 特定模块和样本之间的高度相关性用红色表示。
(c) 不同共表达模块富集的 GO 功能分类。 仅显示显著差异的分类 (FDR < 0.05)。
采用了另一种分析工具 WGCNA。 模块被定义为高度连接的基因簇; 同一簇中的基因之间具有较高的相关系数。 通过 FPKM 筛选差异表达基因后,5312 个差异基因用于 WGCNA分析,产生 10 个不同的模块(用不同的颜色标记)(图 3a、b 和表 S2)。几乎 80% 的基因聚集在特定于发育阶段的模块(MEcyan、Megreen、MElightgreen、MEtan、MEsalmon 和 MEturquoise)中(图 3b)。这与早期的层次聚类(图2a)和PCA(图2b)一致,并且物种中的基因表达高度保守,其次是早熟和晚熟品种之间的差异。共有540个基因(包括33个转录因子)聚集在MElightgreen模块(阶段0TL–2TL)、MEtan模块(阶段0TL和2TL)、MEsalmon模块(阶段1TL–2TL)和MEturquoise模块(阶段0TL–1TL)中。根据石蜡切片的组织学分析结果(图1),在营养生长期的0TL、1TL和2TL没有花芽分化。
该聚类的GO分析结果表明,GO分类为(‘transport’, ‘response to stimulus’, ‘response to abiotic stimulus’, ‘response to stress’, ‘response to extracellular stimulus’, ‘response to temperature stimulus’ )“运输”、“对刺激的反应”、“对非生物刺激的反应”、“对应激的反应”、“对细胞外刺激的反应”和“对温度刺激的反应”(图3c和表S3)。这些模块中的基因可能在棉花幼苗对环境变化的响应中发挥重要作用,以保证幼苗的早期正常生长和形态建成。
Megreen模块共包含311个基因,在4个品种中随着发育上调。与生殖生长相关的GO分类如(‘flower development’, ‘reproductive structure development’, ‘developmental process involved in reproduction’ and ‘reproduction’)“花朵发育”、“生殖结构发育”、“参与生殖的发育过程”和“生殖”显著富集(图3c)。此外,与生长发育相关,(‘developmental process’, ‘anatomical structure development’ and ‘multicellular organism development’)如“发育过程”、“解剖结构发育”和“多细胞生物发育”也是显著富集。
模块MElightcyan中的基因在3TLS中表达,且在两个早熟品种中的表达量始终高于两个晚熟品种(图3b)。GO富集分析显示,这46个基因富集了与生殖生长相关的GO分类,(‘flower development’, ‘developmental process involved in reproduction’, ‘reproductive structure development’ and ‘reproductive process’, )如“花发育”、“参与生殖的发育过程”、“生殖结构发育”和“生殖过程”(图3c)。由此可见,该模块中的基因在棉花营养生长向生殖生长的转变中起着至关重要的作用,值得进一步研究。
四、棉花从营养生长向生殖生长过渡的相关基因的鉴定
模块MElightcyan分析
(a) 热图显示了模块 MElightcyan 的基因的相对 NFPKM。
(b) 使用模块 MElightcyan 中16个ABCDE 同源基因和拟南芥基因 AtAP1、AtPI、AtSEP2、AtSEP3 和 AtSEP4构建邻接系统发育树。
(c)模块MElightcyan的相关网络。 WGCNA构建了一个基因网络,其中每个节点代表一个基因,基因之间的连接线(边)代表共表达相关性。 边缘权重 > 0.1 的基因由 Cytoscape 可视化。 每个圆圈的大小和颜色代表边的数量。
MElightcyan模块包含46个基因,包括29个转录因子。这些基因的表达模式与花芽分化阶段相吻合,以3TLS表达,并且这些基因在两个早熟品种中的表达水平始终高于两个晚熟品种(图4a)。 Hub基因是那些在网络中显示出最多连接的基因,包括CAL同源基因(GH_D07G0876)、AP1同源基因(GH_A04G1749)、AGL6同源基因(GH_D09G0468)、GhMADS22、GHMADS23和GhSOC1(图4c和表S4)。其中,GhMADS23、GhMADS22和GhSOC1已被证明与棉花开花调控有关,它们在拟南芥中的过表达可显着提前开花时间。在这项研究中,这三个基因在早熟和晚熟品种中均表现出从 0TLS 到 2TLS 的较低表达。然而,在3TLS的早熟品种中的表达水平显着高于两个晚熟品种,这与之前的结果一致(图 S2)。上述结果进一步证明了数据的可靠性。 MElightcyan模块中的基因可能在调控棉花从营养生长到生殖生长的转变中起重要作用。最值得注意的是,GH_D07G0876 的连接线(边)数量最多,它是 AtCAL 基因的同源基因,命名为 GhCAL(图 4c 和表 S4)。拟南芥AtCAL过表达可促进早花。然而,除拟南芥外,CAL 基因在其他植物中鲜有报道。
有趣的是,一些基因仅在两个早熟品种中在 5TLS 阶段表达(图 4a)。 这些基因来自ABCDE基因类。 ABCDE 基因是花发育中最广为人知和研究最充分的基因。 A类基因有4个AP1同源基因,B类包括3个PI同源基因,E类基因数量最多,即2个SEP2同源基因、4个SEP3基因和3个SEP4基因(图4b)。 这些基因仅在花器官中表达(图 S3)。
五、GhCAL在调节营养生长向生殖生长过程中的作用
具有Anti-GhCAL 的转基因棉花品系的表型
(a) ZM24 (WT)与Anti-GhCAL转基因棉系的形态学比较。白色框是放大三倍的白色圆圈区域。
(b) WT 和 T3 转基因棉花品系中 Anti-GhCAL 的相对转录水平。
(c) 在 3TLS 阶段,ZM24 (WT)和Anti-GhCAL的转基因棉花系芽尖的石蜡切片。
(d) 转基因和野生型棉花早熟相关性状的比较。DAS,播种后天数;BT,萌芽时间; FT,开花时机; NFFB,第一个果枝的节点; PH,株高; WGP,整个生长期。显示为平均加减标准偏差 (SD);
(e) WT 和 T3 转基因棉花品系中 GhAGL6-D09、GhAP1-A04 和 GhSEP4 的相对转录水平。 **在 P < 0.01 时与野生型差异极显著,误差线是三个生物学重复的标准偏差。
为进一步证实GhCAL在棉花中的功能作用,构建了含有由35s启动子驱动的GhCAL反义序列全长编码区的反义表达载体,并转化到ZM24(早熟棉花品种)中。进一步研究了三个具有 GhCAL 沉默的 T3 转基因棉花品系,即Anti-GhCAL-1、Anti-GhCAL-2 和Anti-GhCAL3(图 5a)。使用特定引物的 qRT-PCR 分析证实 GhCAL 的转录水平显着低于WT植物(图 5b)。Anti-GhCAL 转基因棉花植物的花芽分化发生较晚(图 5c)。与WT相比,3个T3转基因品系的出芽时间分别推迟了14、15和12天,开花时间分别推迟了19、21和14天。WT植物的第一个果枝通常出现在主茎的第 6 节或第 7 节,而转基因棉花则分别出现在第 11 节、第 12 节和第 10 节(图 5d)。在株高方面,三个转基因棉花品系显着短于野生型植物。上述结果表明,低GhCAL表达的延缓了棉花从营养生长向生殖生长的转变。
六、病毒诱导的 GhAGL6-D09 和 GhAP1-A04 沉默延迟了棉花开花
为了探索 GhCAL 如何调节棉花开花,分析了以 GhCAL 为中心的 WGCNA 基因网络中具有更多连接线(边缘)的其他基因的表达(图 4c)。编码AGL6同源基因的GH_D09G0468和编码AP1同源基因的GH_A04G1749分别命名为GhAGL6-D09和GhAP1-A04。 GhAGL6-D09 在子叶、芽尖、花芽和茎中表达。在芽尖中 GhAP1-A04 的表达最低,而在花蕾中观察到最高表达(图 S4)。在Anti-GhCAL 转基因棉花品系中,GhAGL6-D09 和 GhAP1-A04 的表达显著降低,这可能是由于 GhCAL 表达的降低(图 5e)。在 35S::GhCAL 转基因拟南芥株系中,与野生型植物相比,GhCAL 显着上调,而 AGL6 和 AP1 也分别显着上调近 220 倍和 2300 倍(图 S5b )。这些结果表明,AGL6 和 AP1 受 GhCAL 调控,是控制从营养生长向生殖生长过渡的重要调节因子。
图 6 通过 VIGS 对 GhAL6-D09 和 GhAP1-A04 进行功能分析。
(a) 栽培品种 ZM24 中 GhAGL6-D09 的 VIGS。 具有 pCLCrVA::00 的 ZM24 用作对照 (CK)。 PDS:pCLCrVA::PDS。
(b) CK 和 VIGS 植物中 GhAGL6-D09、GhCAL、GhAP1-A04 和 GhSEP4 的相对转录水平。 CK 和 pCLCrV-GhAGL6-D09 显示为平均标准偏差。
(c) 病毒诱导的 GhAGL9-D09 基因沉默植物的表型。
(d) 栽培品种 ZM24 中 GhAP1-A04 的 VIGS。 具有 pCLCrVA::00 的 ZM24 用作 CK。 PDS:pCLCrVA::PDS。
(e) CK 和 VIGS 植物中 GhAP1-A04、GhCAL、GhAGL6-D09 和 GhSEP4 的相对转录水平。
(f) 病毒诱导的 GhAP1-A04 基因沉默植物的表型。 CK 和 pCLCrV GhAGL6-D09 显示为平均标准偏差。 ** 与野生型差异极显著,P < 0.01。
GhAGL6-D09 和 GhAP1-A04 的功能通过棉花中的病毒诱导基因沉默 (VIGS) 进一步验证。 qRT-PCR显示VIGS植物具有较高的基因沉默效率,相应的沉默植物中GhAGL6-D09和GhAP-A04的表达显着降低(图6b,e)。与非VIGS(CK)植物相比,沉默植物的出芽和开花时间明显晚,第一个果枝的节数更高(图6a,c,d,f)。有趣的是,GhAGL6-D09 沉默的植株较短,这与Anti-GhCAL 转基因棉花品系的表型变化一致,GhAP1-A04 的表达显着降低,而 GhCAL 的表达稳定(图 6b)。然而,GhAP1-A04 沉默的植物更高,GhAGL6-D09 和 GhCAL 的表达水平与 CK 的表达水平没有显着差异(图 6e)。上述结果表明,GhAGL6-D09和GhAP1-A04在棉花开花调控中起重要作用,GhAGL6-D09调控GhAP1-A04的表达。
七、GhCAL-D07 可以与 GhAGL6-D09/GhAP1-A04 形成异二聚体
GhCAL、GhAP1-A04 和 GhAGL6-D09 的蛋白质相互作用
(a) GhAGL6-D09 和 GhAP1-A04 基因结构域和 CArG-box 在其转录起始位点的 2K 上游区域的预测。
(b) 蛋白质相互作用的酵母双杂交测定。 -Leu-Trp 缺失选择性培养基上的细胞生长代表正常细胞(上图),-Leu-Trp-His-Ade 缺失选择性培养基代表正相互作用(下图)。
(c) 拟南芥原生质体中 GhCAL、GhAGL6-D09、GhAP1-A04 和 GhSEP4 蛋白质相互作用的双分子荧光互补 (BiFC) 测定。 AUTO,自发荧光; BF,明场; 合并,YFP、AUTO、BF合并; YFP,YFP荧光。
GhCAL、GhAGL6-D09和GhAP1-A04属于MADS转录因子家族,具有MADS、I、K和C四个特征结构域,其中GhAP1-A04中有5个CArG-box元件,在GhAP1-A04中有2个CArG-box元件。 GhAGL6-D09(图 7a)。以前的研究表明,一些 MADS-box 转录因子可能形成异二聚体来发挥调节作用。为了确认 GhCAL、GhAGL6-D09 和 GhAP1-A04 之间的相互作用,进行了酵母双杂交 (Y2H) 和双分子荧光互补 (BiFC) 检测。 Y2H 分析表明,这三种蛋白质相互作用,形成异二聚体(图 7b)。这些相互作用在使用拟南芥原生质体的 BiFC 测试中得到了进一步验证(图 7c)。 GhCAL 与 GhAGL6-D09 和 GhAP1-A04 形成异二聚体。同时,GhCAL调节GhAGL6-D09和GhAP1-A04的表达。在拟南芥中,MADS-box 转录因子可以形成特定的异二聚体,与自身启动子区域的 CArG-box 结合并调节其自身的表达。 GhCAL 可能通过与 GhAGL6-D09 和 GhAP1-A04 的启动子区域中的 CArG-box 结合形成异二聚体,然后调节它们的表达。
GhCAL 介导的从营养生长到生殖生长过渡的调节途径。 正方形代表核酸,椭圆代表蛋白质。实线箭头表示本研究验证的调控关系,虚线箭头表示预测的调控关系
最后证明了MElightcyan、GhCAL模块中的Hub基因可以调节GhAGL6-D09和GhAP1-A04的表达,促进棉花从营养生长向生殖生长的转变。我们提出了一个通过 GhCAL 诱导开花的工作流程(图 8)。在早熟品种中,GhCAL 以 3TLS 表达。 GhCAL与GhAGL6-D09形成异二聚体,可能与GhAGL6-D09启动子区的CArG-box结合,诱导GhAGL6-D09的表达,从而启动花芽分化。在 5TLS 时,GhCAL/GhAGL6 与 GhAP1-A04 形成异二聚体,可能与 GhAP1-A04 启动子区域的 CArG-box 结合并诱导 GhAP1-A04 的表达。 ABCDE模型中的GhAP1-A04和GhSEP4基因调控棉花花器官的发育。在晚熟品种中,GhCAL 以 5TLS 表达,导致花芽分化开始较晚。一般来说,GhCAL作为整个通路的调节中心,调节从营养期到生殖期的过渡,以诱导早期开花。
结论
石蜡切片的组织学分析结果表明,早熟品种的花芽分化发生在真叶第三期(3TLS),晚熟品种的花芽分化发生在真叶第五期(5TLS)。
在 MElightcyan 模块中鉴定了一个与花芽分化相关的新的关键调控基因 GhCAL。
Anti-GhCAL 转基因棉花植物表现出晚花芽分化和开花时间。
GhCAL 与 GhAP1-A04/GhAGL6-D09 形成异二聚体并调节 GhAP1-A04 和 GhAGL6-D09 的表达。
GhAP1-A04-和GhAGL6-D09-沉默的植物也显示出显着的晚开花。
我们提出了一种由 GhCAL 介导的新开花调控途径。
本研究阐明了棉花开花调控的分子机制,为棉花早熟育种提供了良好的遗传资源。
相关知识
高分辨率的时间动态转录组学揭示Gh
番茄果实发育和成熟的高分辨率时空转录组图谱
运用转录组学联合靶向代谢组学技术揭示杜鹃叶片越冬新机制
植物科学顶刊,转录组+代谢组学揭示玫瑰花色的形成机制
解锁植物基因密码:一步指南开启转录组新视界
Nat Comm | 蛋白质组学和磷酸化修饰组学揭示肠道病毒感染宿主的动态调控
动态代谢组和转录组学揭秘如何打造金花茶的“金色”魅力
【Science】中国科学院刘赐融团队:揭示小脑皮层的跨物种单细胞空间转录组图谱
转录组分析揭示了急性花生过敏反应的关键驱动因素
技术介绍 | 多组学联合分析(转录+蛋白+代谢)
网址: 高分辨率的时间动态转录组学揭示Gh https://m.huajiangbk.com/newsview2364767.html
上一篇: 甜瓜英文翻译 |
下一篇: 研究揭示OsPID调控水稻花器官 |