Bootstrap

大豆重测序-文献精读53

Natural variation in GmSW17 controls seed size in soybean

GmSW17的自然变异控制大豆种子的大小

摘要

种子大小/重量在决定作物产量中起着重要作用,但在大豆中,仅有少数控制种子大小的基因被鉴定出来。在本研究中,我们进行了全基因组关联研究,并在第17号染色体上发现了一个主要的数量性状基因座(QTL),命名为GmSW17(Seed Width 17),该基因座决定了自然群体中大豆种子的宽度/重量。GmSW17编码一种泛素特异性蛋白酶,是UBP22的同源物,属于泛素特异性蛋白酶(USPs/UBPs)家族。进一步的功能研究表明,GmSW17与GmSGF11和GmENY2相互作用,形成一个去泛素化酶(DUB)模块,影响H2Bub水平,并负调控GmDP-E2F-1的表达,从而抑制G1至S期的转变。群体分析表明,GmSW17在大豆驯化过程中经历了人工选择,但在现代育种中尚未固定。总之,我们的研究鉴定了一个与大豆种子重量相关的主要基因,为高产大豆育种提供了潜在的优势。

引言

种子是植物最重要的器官之一,因为它在适应性和遗传中起着核心作用,并且也是产量的主要组成部分。种子发育是一个复杂的过程,除了环境因素外,还需要众多遗传、代谢和生理途径的协调整合。在种子发育的初始增殖阶段,细胞数量增加,而细胞大小保持相对恒定。随后,细胞大小显著增加,直到器官达到预定大小。在此过程中,有多个调控因子被报道在细胞周期的不同阶段,特别是在G1至S期的转换过程中发挥作用,从而决定种子的最终大小。例如,过表达CYCB1;4可以通过加速细胞周期进程来增加拟南芥种子的大小;D型细胞周期蛋白(CYCDs)和E2F被认为是参与G1至S期转换的关键细胞周期调节因子;敲除DP-E2F-LIKE1(DEL1)可以增加倍性水平,并导致拟南芥种子大小增加11%。

到目前为止,已经鉴定出多个控制种子大小的途径,包括HAIKU(IKU)途径、G蛋白信号途径、丝裂原活化蛋白激酶(MAPK)信号途径、植物激素感知和稳态途径,以及转录调控途径,其中泛素-蛋白酶体途径尤为重要。作为一种重要的蛋白质修饰,泛素化显著影响了包括激素信号、应激反应和器官发育在内的多种细胞过程。最近,多个参与种子大小调控的泛素相关基因被功能性鉴定。例如,DA1和DA1相关基因(DAR1)编码预测的泛素受体,ENHANCER OF DA1(EOD1)/BIG BROTHER(BB)和DA2编码具有E3泛素连接酶活性的RING型蛋白,这些基因通过限制细胞增殖周期来调控拟南芥的最终种子大小。此外,DA2的同源基因也参与了水稻、玉米和小麦种子大小的控制。与主要涉及多泛素化的泛素-蛋白酶体途径不同,单泛素化主要参与DNA修复、基因表达和受体内吞。此外,已有研究表明,组蛋白H2B的单泛素化通常与转录激活相关。例如,OsUBR7通过调控H2Bub来影响水稻中的细胞周期相关基因,从而影响植物高度。去泛素化是泛素化的可逆过程。去泛素化酶(DUBs)可以从修饰的底物中切除泛素,以在确定的水平上维持靶蛋白的泛素化。泛素特异性蛋白酶(USPs/UBPs)是DUBs的主要类别,构成了一个拥有多个成员的大家族。研究发现,不同的UBPs在植物发育和应激反应中发挥着不同的、广泛的和重要的作用。然而,关于去泛素化在种子发育中的功能研究还相对有限。目前已知UBP14通过影响CYCA2;3和CDKB1;1的稳定性来调控拟南芥中的内复制和细胞/器官生长,OsUBP15则作为水稻中谷粒宽度和大小的正向调节因子,尽管其底物尚未被鉴定。OTU家族中的OTU1通过表观遗传方式调控DA1和DA2,最终影响拟南芥的种子大小。然而,是否还有其他UBPs参与种子大小的调控仍不清楚。

大豆(Glycine max (L.) Merr)是一种重要的油料作物,为人类和动物提供了主要的植物蛋白和油脂。随着人口增长和人们生活水平的提高,预计到2050年大豆产量需要翻倍。大豆产量是一个复杂的性状,受多个因素影响,其中种子大小在高产大豆育种中起着至关重要的作用。鉴定控制种子大小的关键基因并阐明其调控机制是实现高产大豆育种的首要任务。通过基因组关联研究(GWAS)或QTL定位等前向遗传方法,已经在大豆中鉴定了多个与种子大小相关的基因,例如Phosphatase 2C-1(PP2C-1, Glyma.17G221100)、GmKIX8-1(Glyma.17G112800)、GmSWEET10a(Glyma.15G049200)、GmSWEET10b(Glyma.08G183500)、Dt2(Glyma.18G273600)和GmST05(Glyma.05G244100)。此外,通过同源性分析,多个在其他物种中已知控制种子大小的基因也被发现具有保守的功能,例如GmCYP78A是拟南芥P450/CYP78A(细胞色素P450家族)的同源基因,GmCIF1和GmC/VIF2是AtCIF1的同源基因,GmBS1和GmBS2是紫花苜蓿中BIG SEEDS1(BS1)的同源基因。然而,通过基因发现或基于潜在机制对大豆种子大小的研究还不足以满足分子设计育种的需求,特别是在自然群体中。进一步的种子大小调控功能研究将为大豆育种提供重要的遗传资源。

在本研究中,通过对超过1800个大豆种质的GWAS研究,我们鉴定了GmSW17,它是拟南芥UBP22的同源基因,是大豆种子宽度和重量的正向调节因子。GmSW17通过一种涉及蛋白质翻译后修饰(H2Bub)的表观遗传机制调控GmDP-E2F-1。这些发现将促进高产大豆品种的培育。

结果
GmSW17的自然变异主要决定了大豆种子的宽度

为了鉴定控制大豆种子宽度的关键基因,我们对2016年和2017年重新测序的1853个大豆种质进行了表型分析。使用混合线性模型进行的全基因组关联研究(GWAS)揭示,在第17号染色体的93.7 kb区间内,2年中均出现了稳定的关联信号(图1a–c及补充图1a–f),该区域被命名为数量性状基因座种子宽度17(GmSW17)。根据参考基因组ZH13的注释,在93.7 kb区间内共鉴定出12个蛋白编码基因(图1d)。转录组数据表明,在这12个基因中,有3个基因(SoyZH13_17G104400、SoyZH13_17G104500和SoyZH13_17G105400)在种子发育过程中表现出显著的高表达(图1e)。单倍型分析显示,SoyZH13_17G104400没有单倍型差异。在剩余的两个基因中,SoyZH13_17G104500编码类肝素酶蛋白3,SoyZH13_17G105400编码包含Zf-UBP和泛素羧基末端水解酶(UCH)结构域的UBP蛋白(图1f)。这两个基因被认为是GmSW17的候选基因。

a GWAS种子宽度结果的曼哈顿图,使用了1853个种质2年的最佳线性无偏预测(BLUP)数据。 b 种子宽度的分位数-分位数图。在该图中,-Log10转化的观察到的P值与-Log10转化的预期P值作图。 c 染色体17的8.3-8.7 Mb区间的全基因组曼哈顿图。红色虚线表示峰值的候选区域。红色图标表示GmSW17中的核苷酸变异。 d 连锁不平衡图,显示连续关联区块中8.495-8.589 Mb区间的SNP。候选基因显示在面板顶部,GmSW17用红色标出。颜色键(白色到红色)表示种质的连锁不平衡值(r²)。 e 候选区域内候选基因的表达热图。颜色键(蓝色到红色)表示基因表达水平(每百万转录本数,TPM)。 f GmSW17的基因结构示意图。基因示意图上标出了位于第二外显子(UCH结构域)中的非同义位点(+988位C/T)。两个结构域(ZF-UBP和泛素羧基末端水解酶,即UCH结构域)显示在面板顶部。 g GmSW17H1(n = 295个种质)和GmSW17H2(n = 731个种质)的单倍型分析。箱线图的边缘代表第一和第三四分位数,中心线表示中位数,须线延伸到距边缘1.5四分位距范围内的最小和最大数据点。统计显著性通过双侧t检验确定。源数据文件提供了源数据。

此外,我们检查了一个重组自交系(RIL)群体的种子重量,该群体由243个个体组成,来源于东农50(DN50)和Williams 82(W82)的杂交。DN50的平均百粒重为8克,W82的平均百粒重为19克。QTL定位显示,在第17号染色体上发现了一个主要效应QTL(补充图1g),该QTL与包含GmSW17的GWAS区间重叠(图1a–d和补充图1g)。DN50和W82在SoyZH13_17G104500基因上的基因型相同,但在SoyZH13_17G105400基因上的基因型不同。之前的研究表明,UBPs可能参与种子发育。因此,SoyZH13_17G105400被认为是与该区域种子宽度相关的候选基因,随后被命名为GmSW17。在与次等等位基因频率(MAF)大于0.05相关的多态性中,一个来自第二外显子的C/T单核苷酸多态性(SNP)导致氨基酸由精氨酸变为半胱氨酸,其关联值高于阈值(图1f),并被用于将GmSW17在自然群体中分为两大单倍型(图1g)。我们发现携带GmSW17H2的种质表现出显著较大的种子宽度,而携带GmSW17H1的种质种子宽度较小(图1g)。

然后,我们从一个在GmSW17区域为杂合,但在其他区域为纯合的剩余杂合系(RHL)中生成了一组近等基因系(NILs)。我们观察到NIL-GmSW17H2的种子宽度、种子长度和种子厚度显著增加,这导致百粒重、单株种子重和每块地的产量均显著高于NIL-GmSW17H1(补充图2a–g)。通过冷冻扫描电子显微镜(cryoSEM),我们发现NIL-GmSW17H2在R6期子叶的子叶面积、细胞面积和细胞数量均显著大于NIL-GmSW17H1(补充图2h–l)。这些结果表明,NIL-GmSW17H2的大种子表型可能源于细胞扩展和细胞分裂的增加。

GmSW17在控制大豆种子宽度和重量中的功能验证

GmSW17与拟南芥的AT5G10790(UBP22)共享63.2%的同源性(补充图3a)。为了确定不同物种之间催化位点的保守性以及GmSW17H1/GmSW17H2在大豆中的差异,我们对多个物种的GmSW17同源物进行了蛋白质比对,发现催化三联体(标记为星号)在所有检测的物种中都是保守的(补充图3b)。然而,GmSW17H1/GmSW17H2之间的差异位点在不同物种中有所不同(补充图3b)。在N. benthamiana叶片中的亚细胞定位研究显示,GmSW17H1和GmSW17H2都定位于细胞核,这表明GmSW17中的SNP并未影响蛋白质的定位(补充图3c)。为了验证GmSW17的功能,我们通过CRISPR/Cas9系统敲除DN50中的GmSW17(携带GmSW17H1),导致GmSW17CR1(在第398个氨基酸处产生提前终止密码子)、GmSW17CR2(在第397个氨基酸处产生提前终止密码子)和GmSW17CR3(一个氨基酸替换、两个氨基酸缺失)中的移码突变(补充图4a, b)。表型分析表明,GmSW17CR系表现出种子宽度的减小(图2a, b)。此外,GmSW17CR系的种子长度、种子厚度和百粒重也低于野生型DN50(图2c和补充图4c–e)。因此,与DN50相比,GmSW17CR系的单株种子重和每块地的产量显著降低(图2d, e)。大豆基因组中有三个GmSW17同源基因,分别是SoyZH13_13G144800、SoZH13_14G104200和SoyZH13_17G206600,它们分别与GmSW17共享95.4%、65.9%和66.3%的相似性(补充图3a, b)。我们发现这四个同源基因表现出不同的表达模式(补充图4f)。GmSW17在种子中的表达显著高于其他三个同源基因,这在我们之前的研究数据中也有所显示(补充图4f)。我们还研究了GmSW17CR2系中GmSW17同源基因的表达,未观察到显著变化(补充图4g),表明GmSW17在控制种子发育中独立于其他同源基因发挥作用。

a DN50与GmSW17CR系之间的种子宽度比较。比例尺为1厘米。 b DN50与GmSW17CR系的种子宽度(DN50为120株,GmSW17CR系为30株生物独立植株)。 c DN50与GmSW17CR系的百粒重(DN50为113株,GmSW17CR1为30株,GmSW17CR2为31株,GmSW17CR3为26株生物独立植株)。 d DN50与GmSW17CR系的单株种子重(DN50为215株,GmSW17CR1为89株,GmSW17CR2为68株,GmSW17CR3为90株生物独立植株)。 e DN50与GmSW17CR系的每块地的产量(n=3个生物重复)。每块地面积为7.5平方米。 f DN50与GmSW17-OE系之间的种子宽度比较。比例尺为1厘米。 g DN50与GmSW17-OE系的种子宽度(DN50为120株,GmSW17-OE系为30株生物独立植株)。 h DN50与GmSW17-OE系的百粒重(DN50为113株,GmSW17H1-OE-1为28株,GmSW17H1-OE-2为31株,GmSW17H1-OE-3为31株,GmSW17H2-OE-1为32株,GmSW17H2-OE-2为29株,GmSW17H2-OE-3为25株生物独立植株)。 i DN50与GmSW17-OE系的单株种子重(DN50为215株,GmSW17H1-OE-1为59株,GmSW17H1-OE-2为89株,GmSW17H1-OE-3为87株,GmSW17H2-OE-1为79株,GmSW17H2-OE-2为63株,GmSW17H2-OE-3为53株生物独立植株)。 j DN50与GmSW17-OE系的每块地的产量(n=3个生物重复)。每块地面积为7.5平方米。数据(e, j)以平均值±标准差(SD)表示。在所有箱线图中,中心线表示中位数,箱体边缘表示第一和第三四分位数,须线延伸到距箱体边缘1.5四分位距范围内的最小和最大数据点。统计显著性通过双侧t检验确定。源数据文件提供了源数据。

我们进一步在DN50中过表达了由大豆β-伴球蛋白α亚基编码基因(Glyma.20G148300)特异性启动子驱动的GmSW17H1和GmSW17H2的编码序列(CDS),并获得了六个独立的转基因过表达(OE)系(分别命名为GmSW17H1-OE-1、GmSW17H1-OE-2、GmSW17H1-OE-3、GmSW17H2-OE-1、GmSW17H2-OE-2和GmSW17H2-OE-3)。qRT-PCR分析表明,GmSW17的转录水平在GmSW17-OE系中显著高于野生型DN50(补充图5a)。正如预期的那样,GmSW17-OE系表现出增加的种子宽度(图2f, g)。此外,GmSW17-OE系的种子长度、种子厚度、百粒重、单株种子重和每块地的产量也更大(图2h–j和补充图5b–d)。综上所述,这些结果表明GmSW17在大豆中正向调控种子大小(种子宽度或重量)。

GmSW17与GmSGF11和GmENY2形成去泛素化模块

为了鉴定GmSW17的相互作用伙伴,我们通过筛选从不同发育阶段的种子构建的cDNA文库,进行了酵母双杂交(Y2H)分析。在这些相互作用的蛋白中,我们发现拟南芥SGF11的同源蛋白GmSGF11(SoyZH13_11G189300)比其他蛋白更频繁出现,因而引起了我们的兴趣(补充表1)。GmSGF11编码SAGA相关因子11,它是SAGA复合体中去泛素化模块(DUBm)的组成部分。已发现DUBm在组蛋白H2B去泛素化中起重要作用,这有助于在染色质上建立表观遗传模式,从而调控基因表达。研究表明,拟南芥的UBP22(及其酵母和人类的同源蛋白)与SGF11相互作用,并与SGF11和ENY2一起,形成SAGA复合体的DUB模块来去泛素化H2B。我们进一步通过酵母双杂交(Y2H)、免疫共沉淀(Co-IP)实验以及双分子荧光互补(BiFC)确认了GmSW17(包括GmSW17H1和GmSW17H2)与GmSGF11的相互作用(图3a, b和补充图6a)。拉下实验显示GmSW17(包括GmSW17H1和GmSW17H2)能够在体外直接与GmSGF11相互作用(补充图6b)。此外,我们发现GmSW17CR3也与GmSW17在Y2H实验中相互作用(补充图6c)。我们进一步评估了GmSW17的Zf-UBP和UCH结构域与GmSGF11在酵母细胞中的相互作用能力,结果发现只有GmSW17的Zf-UBP结构域对其与GmSGF11的物理相互作用是必需的(补充图6d)。这一观察结果与酵母Ubp8(UBP22同源蛋白)通过Zf-UBP结构域与Sgf11相互作用的机制一致。由于自然变异位于UCH结构域(图1f),因此该变异可能不会导致两个单倍型在相互作用能力上的差异,GmSW17H1和GmSW17H2都能够与GmSGF11相互作用。

a GmSW17不同单倍型与GmSGF11在酵母双杂交实验中的相互作用。转化的酵母细胞在DDO(双脱辅基 -Trp/-Leu)或QDO(四重脱辅基 -Trp/-Leu/-His/-Ade)合成脱辅基培养基上培养。顶部的数字表示不同的连续稀释倍数。AD,GAL4激活域。BD,GAL4 DNA结合域。 b 使用抗Flag珠进行的Co-IP分析,显示GmSW17不同单倍型与GmSGF11的蛋白质相互作用。 c GmENY2与GmSGF11在酵母双杂交实验中的相互作用。 d 使用抗Flag珠进行的Co-IP分析,显示GmENY2与GmSGF11的相互作用。 e DN50与GmSGF11-OE系之间的种子宽度比较。比例尺为1厘米。 f DN50与GmSGF11-OE系的种子宽度(DN50为120株,GmSGF11-OE系为30株生物独立植株)。 g DN50与GmSGF11-OE系的百粒重(DN50为113株,GmSGF11-OE-1为72株,GmSGF11-OE-2为51株,GmSGF11-OE-3为53株生物独立植株)。 h DN50与GmENY2-OE系之间的种子宽度比较。比例尺为1厘米。 i DN50与GmENY2-OE系的种子宽度(DN50为120株,GmENY2-OE系为30株生物独立植株)。 j DN50与GmENY2-OE系的百粒重(DN50为113株,GmENY2-OE-1为42株,GmENY2-OE-2为57株生物独立植株)。实验(b, d)重复两次,结果相似。在所有箱线图中,中心线表示中位数,箱体边缘代表第一和第三四分位数,须线延伸到距箱体边缘1.5四分位距范围内的最小和最大数据点。统计显著性通过双侧t检验确定。源数据文件提供了源数据。

ENY2是DUBm的另一个重要组成部分,参与与酵母和拟南芥中SGF11的保守相互作用。我们发现GmSGF11可以与GmENY2相互作用(图3c, d)。然而,GmSW17不能直接与GmENY2相互作用(补充图6e, f)。为了确保Y2H实验的可靠性,我们通过蛋白质印迹(western blot)确认了蛋白质的表达(补充图6g)。综上所述,这些结果表明,GmSW17(包括GmSW17H1和GmSW17H2)通过Zf-UBP结构域与GmSGF11物理结合,而GmSGF11作为介质与GmENY2相互作用,形成大豆中的DUBm。

为了研究DUBm在种子大小调控中的作用,我们在DN50中过表达了GmSGF11和GmENY2的编码序列(CDS),由35S启动子驱动。我们获得了三个独立的GmSGF11转基因过表达系(命名为GmSGF11-OE-1、GmSGF11-OE-2和GmSGF11-OE-3)(补充图7a),以及两个GmENY2转基因过表达系(命名为GmENY2-OE-1和GmENY2-OE-2)(补充图7b)。表型分析表明,与野生型DN50相比,GmSGF11-OE和GmENY2-OE系均表现出显著增大的种子大小(包括种子宽度、种子长度和种子厚度)、百粒重以及单株种子重(图3e–j,补充图7c–j)。这些结果表明,GmSW17、GmSGF11和GmENY2可以形成DUBm并影响大豆中的种子大小/重量。

GmSW17的自然变异导致H2Bub去泛素化活性差异

研究表明,UBP22在人体和拟南芥中能够去泛素化组蛋白H2B。同样也发现,拟南芥UBP22的同源蛋白Ubp8在酵母中单独不具备H2B去泛素化活性,除非SGF11和SUS1同时存在。鉴于GmSW17是人USP22、拟南芥UBP22和酵母Ubp8的同源蛋白,我们想知道GmSW17(GmSW17H1和GmSW17H2)是否具有组蛋白去泛素化功能。为了探究这一可能性,我们分别纯化了GmSW17(GmSW17H1和GmSW17H2)、GmSGF11和GmENY2蛋白(补充图8a),并在体外与牛组蛋白共同孵育,随后通过蛋白质印迹检测H2B的泛素化水平。我们发现,当GmSW17(GmSW17H1和GmSW17H2)与GmSGF11和GmENY2共同孵育并在体外构建DUBm时,单泛素化的组蛋白H2B(H2Bub)水平下降(补充图8b)。更重要的是,我们观察到GmSW17H2的H2Bub去泛素化活性比GmSW17H1更强(图4a),这一点通过泛素-AMC水解实验进一步得到了验证(图4b)。

a. 通过组蛋白去泛素化实验确定不同单倍型GmSW17的DUB模块亚基对组蛋白H2B去泛素化活性的影响。将纯化的His-GmSW17、His-GmSGF11和His-GmENY2(各4 μg)与20 mg的纯化牛组蛋白孵育,之后通过蛋白质印迹法检测H2Bub的水平。H3的水平作为加载对照。非特异性条带用星号标记。下方面板显示了1、2和3号样品的H2Bub信号的定量分析(n = 3个生物重复)。实验重复三次,结果相似。

b. 不同单倍型GmSW17的催化活性。数据表示为三个技术重复的平均值。显示了两个独立生物重复中的一个代表性结果。

c. 比较DN50和不同GmSW17转基因系中的H2Bub水平。H2Bub信号的定量结果显示在上方(n = 3个生物重复),以H3作为加载对照。实验重复三次,结果相似。

d. 比较DN50与GmSGF11-OE系之间的H2Bub水平。H2Bub信号的定量结果显示在右侧(n = 3个生物重复),以H3作为加载对照。实验重复三次,结果相似。

e. 比较DN50与GmENY2-OE系之间的H2Bub水平。H2Bub信号的定量结果显示在右侧(n = 3个生物重复),以H3作为加载对照。实验重复三次,结果相似。

(a, c–e)中的数据以平均值 ± 标准差表示。统计显著性使用双侧t检验确定。来源数据提供为来源数据文件。

为了进一步验证DUBm在“消除”H2Bub中的作用,我们测量了GmSW17CR、GmSW17-OE、GmSGF11-OE、GmENY2-OE和野生型DN50体内的H2Bub水平。结果显示,GmSW17 CRISPR突变体系(GmSW17CR2和GmSW17CR3)的H2Bub水平显著高于DN50,而多个独立的GmSW17过表达系(GmSW17H1-OE-1、GmSW17H1-OE-3、GmSW17H2-OE-2和GmSW17H2-OE-3)的H2Bub水平显著低于DN50(图4c)。此外,我们还发现,与DN50相比,GmSGF11-OE系(GmSGF11-OE-1和GmSGF11-OE-2)(图4d)和GmENY2-OE系(GmENY2-OE-1和GmENY2-OE-2)(图4e)的H2Bub水平也有所降低。综上所述,结果表明,不同单倍型的GmSW17能够与GmSGF11和GmENY2形成DUBm,在大豆中表现出不同的H2Bub去泛素化活性。

GmSW17通过调节其靶基因GmDP-E2F-1的H2Bub水平影响细胞周期

为了挖掘GmSW17的下游靶标,我们使用来自野生型(DN50)和代表性敲除系GmSW17CR2的种子材料进行了RNA-seq转录组分析。在野生型和GmSW17敲除系(WT/GmSW17CR2)之间共鉴定出263个上调基因和448个下调基因作为差异表达基因(DEGs)(补充图9a)。基因本体(GO)富集分析显示,WT/GmSW17CR2的DEGs参与了增殖细胞中的多个途径,例如DNA模板转录、起始和DNA复制(补充图9b)。在263个上调基因中,GmDP-E2F-1(DP-E2F-LIKE1的同源基因)在GmSW17CR2中的表达显著增加(图5a)。考虑到已有研究报道DEL1在调控拟南芥G1到S期转变和种子大小方面的功能5,7,11,12,GmDP-E2F-1可能是GmSW17的一个靶基因。为了确认DP-E2F-1是否控制种子重量,我们筛选了拟南芥中DP-E2F-LIKE1的T-DNA插入突变体(命名为e2f-1)(补充图10a–c)。与之前的报道一致12,我们发现e2f-1的千粒重显著高于野生型Columbia(Col)(补充图10d, e),表明DP-E2F-LIKE1在拟南芥中负调控种子重量(种子大小)。随后,我们进行了qRT-PCR分析GmDP-E2F-1的表达,结果显示在GmSW17CR2中显著上调,而在GmSW17H1-OE-1和GmSW17H2-OE-2中显著下调(图5b)。这些结果表明,GmSW17负调控GmDP-E2F-1。

a 火山图展示了 GmSW17CR2/WT 中差异表达基因 (DEGs) 的分布。 b GmDP-E2F-1 在 DN50 和 GmSW17 转基因株系中的相对表达水平(n=3 生物学重复)。 c DN50 和 GmSW17CR2 中 GmDP-E2F-1 基因位点的 H2Bub ChIP-seq 轨迹。 d DN50 和 GmSW17CR2 中 GmDP-E2F-1 基因位点的 H2Bub ChIP-qPCR 验证(P1、P2 和 P3)。P1 到 P3 代表用于评估 H2Bub 水平的 ChIP-qPCR 引物覆盖的区域。数据经输入染色质归一化处理,GmTubulin 作为阴性对照。 WT 中的 H2Bub 水平设为 1(n=3 生物学重复)。 e WT 和 GmSW17CR 株系中 2C(左)和 4C(右)核的细胞周期阶段细胞数量,通过流式细胞术测量(n=3 生物学重复)。 f WT 和 GmSW17CR 幼苗不同细胞周期阶段的细胞百分比(n=3 生物学重复)。P < 0.001,P < 0.01,P < 0.05,ns,表示无显著性差异。 g DN50 和 GmSW17 转基因株系子叶表面的冷冻扫描电镜 (cryoSEM) 图像。比例尺,20 μm。 h DN50 和 GmSW17 转基因株系的子叶面积。 i DN50 和 GmSW17 转基因株系中子叶的细胞面积。 j DN50 和 GmSW17 转基因株系子叶腹面细胞数量。图 (b, d–f) 中的数据以均值 ± SD 表示。所有箱线图中,中心线表示中位数,箱体边缘表示第 1 和第 3 四分位数,须线延伸到距箱体边缘 1.5 倍四分位距的最小和最大数据点。统计显著性通过双侧 t 检验确定。原始数据作为原始数据文件提供。

此外,我们进行了 H2Bub 的染色质免疫共沉淀测序 (ChIP-seq),并观察到 H2Bub 水平与转录变化之间的相关性(补充图 11a, b)。下调的差异表达基因(DEGs)伴随着 H2Bub 水平的降低(补充图 11a);相反,上调的 DEGs 则伴随着 H2Bub 水平的增加(补充图 11b)。这一结果与先前报道的 H2Bub 在转录激活过程中发挥作用的研究结果一致【27,28,29】。此外,在 GmSW17 敲除后,GmDP-E2F-1 基因位点的 H2Bub 水平显著增加(图 5c),这一结果也通过 ChIP-qPCR 得到验证(图 5d)。

此外,我们通过 ChIP-qPCR 评估了 NIL-GmSW17H1 和 NIL-GmSW17H2 在 GmDP-E2F-1 基因位点的 H2Bub 水平。这些结果显示,与 NIL-GmSW17H1 相比,NIL-GmSW17H2 在 GmDP-E2F-1 基因位点的 H2Bub 水平较低(补充图 12a)。正如预期的那样,GmDP-E2F-1 在 NIL-GmSW17H2 中的表达水平显著低于 NIL-GmSW17H1(补充图 12b)。这些结果表明,与 NIL-GmSW17H1 相比,NIL-GmSW17H2 通过显著改变 GmDP-E2F-1 位点的 H2Bub 水平,达到了较低的表达水平,这与体外实验中 GmSW17H2 的 H2Bub 去泛素化活性强于 GmSW17H1 的结果一致。

在表型上,我们使用流式细胞术分析了 GmSW17CR 和 DN50 细胞的细胞周期过程。与 DN50 相比,GmSW17CR 株系中的 4C 细胞较少,而 2C 细胞较多(图 5e)。细胞周期分析显示,GmSW17 敲除导致 G1 期细胞数量显著增加,而 S 期细胞数量相应减少(图 5f)。此外,USP22(一种与 GmSW17 同源的蛋白)的缺失会在人体和酵母中导致 G1 期细胞周期的特异性阻滞【59,61】。细胞周期过程在 NIL-GmSW17H1 和 NIL-GmSW17H2 中表现出不同的调控,观察到 NIL-GmSW17H1 株系中 4C 细胞较少,2C 细胞较多,显示 G1 期显著增加,S 期显著减少(补充图 12c–e)。正如预期,我们发现 GmSW17CR2 的 R6 期种子子叶中的平均细胞大小和细胞数量减少;相反,在 GmSW17H1-OE-1 和 GmSW17H2-OE-2 中,细胞大小和数量增加,表明 GmSW17 能够促进细胞扩展和细胞分裂(图 5g–j)。

因此,我们的研究表明,GmSW17 通过影响 GmDP-E2F-1 基因位点的 H2Bub 水平负调控 GmDP-E2F-1 的表达,从而影响 G1 期向 S 期的转换,最终通过影响细胞扩展和细胞分裂来调控种子大小/重量。

GmSW17 的地理分化选择

栽培大豆(Glycine max [L.] Merr.)是 5000~9000 年前从其野生近缘种(G. soja)在中国驯化而来的【49,62,63】。由于种子大小显著影响大豆产量,因此一直是大豆育种中的关键因素。在调查了之前重测序的 2069 份大豆样本【49】,包括 88 份野生大豆、858 份地方品种和 1123 份改良品种后,我们发现 94.32% 的野生大豆具有较小的种子尺寸,并且表现出 GmSW17H1 的特征。然而,这一比例在地方品种和改良品种中分别下降至 30.77% 和 18.43%(图 6a)。因此,随着野生大豆向地方品种的驯化,具有较大种子特征的 GmSW17H2 的比例增加了(图 6a)。π 和 FST 分析也揭示,野生大豆比地方品种和改良品种表现出更高的遗传多样性,表明 GmSW17 在大豆驯化过程中受到了人工选择(图 6b, c 和补充图 13a)。

a GmSW17 在野生大豆(n = 88 样本)、地方品种(n = 858 样本)和改良品种(n = 1123 样本)中的单倍型频率分布。 b 野生大豆、地方品种和改良品种中与 GmSW17 相关的 π 值。 c 野生大豆、地方品种和改良品种中与 GmSW17 相关的 FST 值。FST(Soja_Landrace) 和 FST(Landrace_Cultivar) 的阈值分别为 0.702 和 0.089。红色虚线代表 GmSW17,黑色虚线代表其他基因。 d 提出的模型阐明了 GmSW17 在调控大豆种子大小中的作用。GmSW17、GmSGF11 和 GmENY2 形成了一个三聚体去泛素化(DUB)模块,作用是降低大豆中的 H2Bub 水平。由于 GmSW17H2 在去泛素化 H2Bub 上比 GmSW17H1 具有更强的酶活性,导致 GmDP-E2F-1 的 H2Bub 水平降低,进而减少了 GmDP-E2F-1 的表达水平。因此,G1 到 S 期转换的限制被减轻,最终导致种子大小增加。

通过对从中国收集的 1539 份大豆样本(包括地方品种和改良品种)的变异分布进行调查,我们发现带有 GmSW17H1 的样本主要分布在中国南部地区(生态区 III),而在北方地区(生态区 I)较少(补充图 13b)。相反,带有 GmSW17H2 的样本主要分布在中国北方地区,并从北方地区到黄淮海地区(生态区 II)再到中国的生态区 III 呈现出逐渐减少的趋势(补充图 13b)。这一结果表明,GmSW17 的两种单倍型在大豆育种的不同地区中都得到了利用,但尚未完全固定。

讨论

大豆是一种重要的豆科作物,既是蛋白质也是油脂的重要来源。为了增加大豆产量,解析和理解与种子相关性状的调控机制至关重要。虽然已有多个与种子重量相关的数量性状基因座(QTLs)被鉴定【64】,但这些 QTLs 背后的基因及其功能仍然大多不明。在本研究中,通过全基因组关联分析 (GWAS),我们鉴定并表征了 GmSW17,该基因正向调控种子相关性状。此外,我们发现 GmSW17CR1、GmSW17CR2 和 GmSW17CR3 相比于 DN50 具有较小的叶片,而 NIL-GmSW17H2 的叶片大于 NIL-GmSW17H1(补充图 14a-d)。这表明 GmSW17 不仅影响种子相关性状,还影响叶片大小。同样,在拟南芥 otu1 突变体中也发现了种子和叶片大小的减少表型【38】。有趣的是,GmSW17 位于一个多项独立研究发现与种子大小相关的热点区域,其中 GmKIX8-1 被确定为 qSW17-1 负责的致因基因【41,63,65-72】(补充图 15)。然而,GmSW17 和 GmKIX8 位于两个独立的、不重叠的区域(补充图 15)。因此,从数量性状基因的角度来看,GmSW17 和 GmKIX8 可能独立发挥作用。这两个基因在决定种子大小/重量时的功能“交叉”、显性效应和组合效应尚不明确,未来需要进一步研究。此外,除了 GmSW17 和 GmKIX8 之外,可能还有其他控制种子大小/重量的致因基因存在于这个“热点”区域,例如 Seed weight 30-76 的 QTL(补充图 15)。

在本研究中,我们显示 GmSW17 是 DUBm 的组成部分,它通过调控 GmDP-E2F-1 位点的 H2Bub 水平来影响种子大小。因此,我们提出了一个可能的工作模型:GmSW17 与 GmSGF11 和 GmENY2 形成三聚体去泛素化模块(DUB),影响 GmDP-E2F-1 中的 H2Bub 水平,进而在大豆种子发育过程中调控细胞周期。此外,我们揭示了 GmSW17H1 的 H2Bub 去泛素化活性比 GmSW17H2 弱。GmSW17H1 的较弱去泛素化活性导致 H2Bub 水平增加,从而使 GmDP-E2F-1 的表达水平更高,最终导致种子大小的减少(图 6d)。

UBPs 是 DUBm 的主要组成部分之一,并且在拟南芥和酵母中具有相对保守的功能机制。然而,研究还表明,不同的 UBP 成员在控制不同性状方面发挥了广泛和多样的作用。除拟南芥的 UBP14【36】和水稻的 OsUBP15【37】外,其他 UBPs 在种子发育中的作用很少被报道。在此,我们鉴定了 GmSW17,它是拟南芥 UBP22 的同源物,是大豆中控制种子大小的关键调控因子。这一发现揭示了该基因家族的重要成员,并进一步阐明了 UBPs 在种子发育中的作用。我们的结果表明,GmSW17 可以与 GmSGF11 和 GmENY2 形成 DUB 模块(图 3,补充图 6),这一发现与先前的研究一致【54,55,57-59】,表明了 DUBm 的保守性。我们的数据还揭示,GmSW17 通过调控 G1 期细胞周期阻滞来发挥作用(图 5e, f),这一点与早期研究结果【59,61,73】高度一致。在人体中,研究发现 Myc 能招募 USP22 到靶基因(如 CAD 和 MTA1)的启动子【59】。还发现 USP22 在稳定关键的 G1 期细胞周期蛋白 CCND1 方面发挥了直接作用【61】。在本研究中,我们发现 GmSW17 通过 GmDP-E2F-1 来调控细胞周期。然而,GmSW17 如何被招募到下游的 GmDP-E2F-1 基因位点的机制尚未确定,揭示这一过程虽然具有挑战性,但也非常值得深入研究。

先前的研究表明,USP22 可以从单泛素化的 H2A 和 H2B 中移除泛素部分,从而改变染色质结构和基因转录【61,74-76】。由于在酵母中发现了 H2B 的多泛素化【77】,且 H2B 泛素化的分子机制在酵母到植物中是保守的【78】,因此可以推测植物中可能同时存在 H2B 的单泛素化和多泛素化现象。我们观察到 GmSW17 去泛素化 H2Bub 并影响了大豆中 GmDP-E2F-1 的表达(图 5)。此外,我们还发现下调的 DEGs 与 H2Bub 水平的降低相关,而上调的 DEGs 则伴随着 H2Bub 水平的增加,表明 H2Bub 水平与转录变化相关(补充图 11a, b)。未来还需要进一步研究 GmSW17 除了组蛋白 H2A 和 H2B 之外的其他底物,以更详细地理解 GmSW17 在大豆中的功能。

总之,我们鉴定了 GmSW17 作为正向调控因子影响种子大小/重量,它可以与 GmSGF11 和 GmENY2 形成 DUBm 复合体。GmSW17 的天然变异导致了 GmDP-E2F-1 位点 H2Bub 去泛素化活性的变化,这对大豆种子的大小/重量产生了影响。此外,过表达这些基因在提高大豆产量方面具有潜在的应用价值。总体而言,我们的研究结果为大豆种子大小的遗传基础提供了重要的见解,并为通过分子育种提高大豆产量提供了帮助。

方法
植物材料和表型分析

用于全基因组关联分析 (GWAS) 的 1853 份大豆材料于 2016 年和 2017 年夏季分别种植在中国科学院遗传与发育生物学研究所实验站(北京,40°22′N,116°23′E)。在本研究中,大豆(Glycine max (L.) Merr.)品种东农50 (DN50) 作为对照组,用于产生转基因株系。CRISPR 和过表达转基因株系按照随机完全区组设计在三行地块中种植,每个环境进行三次重复。每个地块长度为 5 米,行距为 0.5 米,株距为 0.14 米,地块间距为 0.5 米。

QTL 映射

从 DN50 和 Williams (W82) 的杂交中获得的 F1 植株通过单粒传递法连续自交至 F6,并最终产生 243 条重组自交系 (RILs)。QTL 检测使用 QTL lciMapping 4.2 软件进行。通过进行 1000 次置换检验确定 LOD 阈值(P < 0.05)。在 RILs 中,具有 GmSW17 杂合性的剩余杂合系 (RHL) 被持续自交以生成 F6 系列,用于构建 GmSW17 的近等基因系 (NILs),即 NIL-GmSW17H1 和 NIL-GmSW17H2。

上述所有种子在收获后储存一个月,随后用于种子性状的测定。每个品种至少测量 30 粒代表性的干种子的种子宽度、种子长度和种子厚度。对于 100 粒种子重和单株种子重,至少检测 20 个重复样本。

种子宽度性状的 GWAS

来自 1853 份大豆材料的重测序数据生成的 31,870,983 个单核苷酸多态性 (SNPs) 被用于种子宽度性状的 GWAS【49】。使用 Bayesian 聚类工具 fastStructure【79】评估种群结构。GWAS 仅使用了在种群中 MAF > 0.05 且缺失率 < 0.1 的 SNPs。关联分析采用 EMMAX 软件包【80】中实现的混合线性模型 (MLM) 进行。通过 EMMAX 计算由随机效应的方差协方差矩阵的简单匹配系数得出的成对遗传距离矩阵。GWAS 的阈值基于先前的报告确定【81】。简言之,首先随机打乱观察到的表型,以破坏这些表型与其相应基因型之间的关联。然后,我们使用与观察到的表型相同的模型对置换的表型进行 GWAS。记录全基因组中最显著的 P 值。这个随机过程重复 1000 次。通过 1000 个重复中最显著 P 值的分布确定阈值,该阈值表示发生 I 型错误的概率为 5%。

载体构建与转化

在 CRISPR/Cas9 系统实验中,根据先前描述的方法【82】,设计了两个 sgRNA。U6 启动子用于引导 RNA 寡核苷酸对。驱动单个引导 RNA 的 U6 启动子盒被克隆并插入到 PMDC123 载体中。这些构建体随后引入根癌农杆菌菌株 EHA105,并转化至 DN50。相关引物列于补充数据 1 中。

为了构建 GmSW17 (SoyZH13_17G105400/Glyma.17G109100) 的过表达载体,从 DN50 和 Williams 82 (W82) 中分别扩增了 GmSW17H1 和 GmSW17H2 的编码 DNA 序列 (CDS)。从 W82 基因组 DNA 中扩增了来自 β-伴大豆素 α 亚基编码基因 Glyma.20G148300 的 2 kb 大豆种子特异性启动子 DNA 序列。连接的启动子-cDNA 片段被克隆并插入 pTF101 载体中。为了构建 GmSGF11 (SoyZH13_11G189300/Glyma.11G168600) 和 GmENY2 (SoyZH13_16G052500/Glyma.16G056700) 的过表达质粒,从 W82 中扩增 GmSGF11 和 GmENY2 的 CDS,并将其连接到 pFGC5941 载体中。这些构建体随后引入根癌农杆菌菌株 EHA101 或 EHA105,随后转化至 DN50。用于构建载体的所有引物列于补充数据 1 中。

原生质体制备

拟南芥原生质体的制备按照标准程序进行【83】。用锋利的刀片将 3-4 周龄拟南芥的叶片切成 0.5–1 mm 的条状,并在暗处进行 3–4 小时的酶消化。消化后,用 40 µm 滤网分离原生质体。最后,使用质粒 DNA 转化原生质体并在暗处孵育 12–16 小时。

RNA 提取、PCR 和 qRT-PCR

总 RNA 从 R5 阶段的种子中提取,使用 HUAYUEYANG Quick RNA Isolation Kit v1.0(HUAYUEYANG,北京),并按照制造商的协议进行操作,每个实验进行三次生物学重复。使用 cDNA 合成试剂盒 (TransGen, AE311) 进行反转录。cDNA 序列随后被用作定量实时 PCR (qRT-PCR) 的模板。qRT-PCR 使用 LightCycler 480 SYBR Green I Master Mix (TransGen, AQ101-01) 在 LightCycler 480 仪器 (Roche) 上进行。基因表达归一化到大豆基因 GmACTIN11 (Glyma.18G290800) 的表达。相关引物列于补充数据 1 中。

亚细胞定位

分别克隆了 GmSW17H1 和 GmSW17H2 的 CDS,并插入到 35S::eYFP 载体中。通过瞬时表达 GmSW17H1-eYFP 和 GmSW17H2-eYFP 在烟草 (N. benthamiana) 叶片中确定 GmSW17 的亚细胞定位。为了最小化叶绿素自发荧光,我们仔细选择了适当的荧光滤光片来匹配激发和发射波长。GFP 的激发波长为 470–490 nm,发射波长为 510–530 nm,而 RFP (如 mCherry) 的激发波长为 540–560 nm,发射波长为 580–610 nm。相关引物列于补充数据 1 中。

系统发育树分析

从大豆以及其他代表性物种(如水稻、玉米、紫花苜蓿和拟南芥)中获得与 GmSW17 高度相似的重复基因和直系同源基因,并从 Phytozome 13 (https://phytozome-next.jgi.doe.gov/blast-search) 获取数据,利用 MEGA11 软件构建最大似然树。

酵母双杂交实验

随后按照 Clontech 的《酵母操作手册》中描述的程序进行酵母双杂交实验。将 GmSW17H1、GmSW17H2 和 GmENY2 的编码序列(CDS)分别克隆并插入诱饵载体 pGBKT7 中。同样地,将 GmSGF11 和 GmENY2 的编码序列克隆并插入猎物载体 pGADT7 中。随后,将等量的配对质粒共转化到酵母菌株 Y2H Gold(Clontech)中,并在 DDO(双缺失 -Leu-Trp)和 QDO(四缺失 -Ade-His-Leu-Trp)培养基上进行筛选。空载 AD 或空载 BD 载体作为阴性对照。所用引物的序列在补充数据 1 中提供。

双分子荧光互补(BiFC)

为了构建 BiFC 载体,我们使用了 Gateway 兼容的载体 pUGW2-nYFP 和 pUGW2-cYFP,并通过 Gateway 克隆技术生成 BiFC 实验载体。pUGW2-nYFP 用于与黄色荧光蛋白(nYFP)融合 N 端区段的载体,而 pUGW2-cYFP 用于与 YFP(cYFP)融合 C 端区段的载体。GmSW17H1 和 GmSW17H2 的全长编码序列被克隆并插入 pUGW2-nYFP 中,GmSGF11 的全长编码序列则被克隆并插入 pUGW2-cYFP 中。阿拉伯芥原生质体被制备用于表达实验。将不同质粒组合共转化到阿拉伯芥原生质体中,并在 22°C 的黑暗环境中孵育 12-16 小时。使用共聚焦激光扫描显微镜(Zeiss LSM 985 NLO)观察 YFP 荧光。所用引物的序列在补充数据 1 中提供。

共免疫沉淀(Co-IP)实验

为了评估 GmSW17、GmSGF11 和 GmENY2 之间的相互作用,在阿拉伯芥原生质体中进行了 Co-IP 实验。GmSW17H1、GmSW17H2、GmSGF11 和 GmENY2 的全长编码序列被克隆并插入 pUC19-35S-HA 载体和 pUC19-35S-Flag 载体中。例如,为了研究不同单倍型的 GmSW17 与 GmSGF11 之间的相互作用,将 GmSW17H1-Flag 或 GmSW17H2-Flag 构建物与 GmSGF11-HA 共转化到阿拉伯芥原生质体中,并在黑暗环境中过夜孵育。孵育 12-16 小时后,从阿拉伯芥原生质体中提取总蛋白,并在含有提取缓冲液(50 mM Tris-HCl (pH 7.5)、0.5 mM EDTA、150 mM NaCl、0.5% NP-40、1 mM PMSF 和 1× 完全蛋白酶抑制剂鸡尾酒(Roche 04693132001))中孵育。蛋白裂解物与 Flag 磁珠(MBL, M185-11R)孵育 2-3 小时,之后用含有 50 mM Tris-HCl pH 7.5、150 mM NaCl、20% 甘油、0.1% Triton X-100、1 mM EDTA pH 8.0 和 1× 完全蛋白酶抑制剂鸡尾酒的缓冲液洗涤四次。免疫沉淀物通过 SDS-PAGE 分离,然后转移到硝酸纤维素膜(GE Healthcare)上,用抗 HA(MBL, M180-7, 1:5,000 稀释)或抗 DDDDK 标签 mAb-HRP-DirectT(MBL, M185-7, 1:10,000 稀释)抗体进行蛋白检测。所用引物的序列在补充数据 1 中提供。

流式细胞术分析

在 4°C 下,将大豆叶片在 500 µl GS 缓冲液(20 mM MOPS、30 mM 柠檬酸钠、45 mM 氯化镁、0.1% (v/v) Triton X-100)中用剃刀片切碎。随后,通过 40 µm 网筛过滤细胞核。分离的细胞核在冰上用 10 µM DAPI 染色液染色 5 分钟,然后使用流式细胞仪(BD FACSAria II;BD Biosciences)进行分析。根据 DNA 含量的分布,确定细胞周期阶段(G1、S、G2/M)。处于 G1 期的细胞具有单倍体 DNA 含量,处于 G2/M 期的细胞具有二倍体 DNA 含量,而处于 S 期的细胞的 DNA 含量介于单倍体和二倍体之间。

冷冻扫描电子显微镜(cryo-SEM)

在 R6 阶段(绿色种子填充荚腔)取样种子的子叶,并使用 Crossbeam 340 & VCT500 场发射扫描电子显微镜(SEM, Carl Zeiss, Germany)进行观察。冷冻扫描电子显微镜的工作流程可以总结为以下步骤:首先,将样品安装并以正确的方向放置在样品台上。其次,快速冷冻样品。第三,将样品在真空条件下转移到扫描电子显微镜腔室中。第四,在真空下保持低温环境,以防止水分流失和外源冰的形成。使用 Tomato 分析仪估算 NIL 线种子和转基因种子腹面子叶区域的大小。使用 ImageJ 计数视野内的细胞数。细胞面积计算为视野面积与视野内细胞数量之比。平坦表面的子叶细胞数量估算为子叶面积与细胞大小之比。

体外组蛋白去泛素化实验

纯化的 His-GmSW17、His-GmSGF11 和 His-GmENY2 蛋白(各 4 µg)与 20 µg 总牛组蛋白(Roche,未分级,含 H2A、H2B、H3、H4 及其变体)在含有 50 mM Tris-HCl(pH 8.0)和 50 mM NaCl 的缓冲液中室温(25°C)孵育 3-4 小时,参考之前描述的协议,并进行了少许修改。特别地,在进行蛋白质印迹分析时,将样品通过 12% SDS-PAGE 分离,用 5% 牛奶封闭,并使用抗 H2Bub(Cell Signaling Technology, 5546 s, 1:5000 稀释)和抗 H3 抗体(Abcam, Ab1791, 1:5000 稀释)进行探测。

泛素-AMC 水解实验

泛素-AMC 水解实验参考之前描述的协议,进行了少许修改。具体而言,我们使用了 DUB-Activity Assay Kit(701490),该试剂盒根据制造商的说明使用荧光通用泛素底物(Ubiquitin-AMC)。通过至少 30 分钟内实时测量 365 nm 激发和 460 nm 发射的荧光来监测 Ub-AMC 的裂解。Ub-AMC 的使用浓度为 500 nM。GmSW17H1 和 GmSW17H2 突变复合物的使用浓度为 20 nM。

体内组蛋白去泛素化实验(蛋白质印迹分析)

在 R5 阶段取样种子,并使用 EpiQuik Total Histone Extraction Kit(OP-0006-100)提取总组蛋白。随后,将总组蛋白用于蛋白质印迹分析,以评估体内 H2Bub 水平。抗 H3 免疫印迹作为装载对照。使用的抗体包括抗 H3(Abcam, ab1791, 1:5000 稀释)和抗 H2Bub(Cell Signaling Technology, 5546 s, 1:5000 稀释)。免疫印迹使用增强型化学发光(ECL)系统进行。

RNA-seq 样品制备及数据处理

从 R5 阶段的 DN50 和 GmSW17CR2 种子中提取总 RNA 进行 RNA-seq 分析,每个样品进行三个生物学重复。使用 Illumina NovaSeq 6000 仪器在 BerryGenomics 公司(中国)构建和测序成对末端文库。使用 fastp(0.20.1)去除 RNA-seq 文库中的接头序列和低质量读段。清洁的读段随后使用 hisat2(2.1.0)比对到 W82 Refseq v2,并使用 featureCount(2.0.1)进行基因表达量化。使用 R 中的 DESeq2 包(1.34.0)评估差异表达基因,调整后的 p 值 < 0.05 和 Log2 倍数变化 > 1。来自计数矩阵的每百万转录本数(TPM)值用于表征基因表达并进行层次聚类分析。

对于功能富集,使用 W82 Refseq v2 生成 GO 注释文件,并使用 R 包 clusterProfiler(4.2.2)进行富集分析。

染色质免疫共沉淀(ChIP)实验

ChIP 实验按照标准程序进行。简而言之,将 R5 阶段的 DN50 和 GmSW17CR2 种子各 1.5 克在液氮中研磨成细粉末,然后悬浮于 20 毫升冷裂解缓冲液(0.4 M 蔗糖、10 mM Tris-HCl (pH 8.0)、10 mM MgCl2、5 mM 二硫苏糖醇 (DTT)、0.1 mM 苯甲基磺酰氟 (PMSF) 和 1× 蛋白酶抑制剂混合物)中。加入甲醛(Sigma, F8775)使最终浓度达到 1% 进行交联。15 分钟后,加入 0.125 M 的甘氨酸(Sigma, 50046)终止交联。通过双层 Miracloth(Millipore, 475855)过滤样品并离心分离细胞核。将细胞核用 10 毫升核重悬液 I(0.25 M 蔗糖、10 mM Tris-HCl (pH 8.0)、10 mM MgCl2、1% Triton X-100、5 mM 二硫苏糖醇 (DTT)、0.1 mM 苯甲基磺酰氟 (PMSF) 和 1× 蛋白酶抑制剂混合物)清洗 3-4 次,并重悬于 700 微升核重悬液 II(1.7 M 蔗糖、10 mM Tris-HCl (pH 8.0)、2 mM MgCl2、0.15% Triton X-100、5 mM 二硫苏糖醇 (DTT)、0.1 mM PMSF 和 1× 蛋白酶抑制剂混合物)中。随后,将蛋白质转移至 700 微升核重悬液 II 中,然后让混合物分层并以 13000 g 离心 1 小时。将细胞核重悬于 200 微升核裂解缓冲液(50 mM Tris-HCl (pH 8.0)、10 mM EDTA (pH 8.0)、1% SDS)中,并在冰上放置 30 分钟。随后,加入 1800 微升不含 Triton 的 ChIP 稀释缓冲液(167 mM NaCl、16.7 mM Tris-HCl (pH 8.0)、1.2 mM EDTA、0.01% SDS)。使用 Covaris 装置(M220)以 10 分钟开/4 分钟关的循环超声 30 分钟,使染色质片段化至 200-500 bp 的平均长度。然后加入 61 微升 20% Triton X-100,使最终浓度达到 1.1%。预清洗的 A/G 蛋白珠在含 Triton X-100 的 ChIP 稀释缓冲液(167 mM NaCl、16.7 mM Tris-HCl (pH 8.0)、1.2 mM EDTA、0.01% SDS 和 1.1% Triton X-100)中孵育三次。每管加入 50 微升磁性 A/G 蛋白珠,混合物在 4°C 下旋转孵育 2 小时。将清液转移到新的 2 毫升管中,取出 2% 作为输入样本,并存储在 -80°C。加入抗 H2Bub 抗体(CST, 5546 s, 1:150 稀释)以结合蛋白质-DNA 复合物,混合物在 4°C 下旋转孵育过夜。对于免疫沉淀捕获的 DNA/蛋白复合物,每管加入 50 微升预清洗的 A/G 磁性珠,并在 4°C 下旋转孵育 4 小时。依次使用低盐洗涤缓冲液(20 mM Tris-HCl (pH 8.0)、150 mM NaCl、0.1% SDS、1% Triton X-100、2 mM EDTA)、高盐洗涤缓冲液(20 mM Tris-HCl (pH 8.0)、500 mM NaCl、0.1% SDS、1% Triton X-100、2 mM EDTA)、LiCl 洗涤缓冲液(10 mM Tris-HCl (pH 8.0)、0.25 M LiCl、1% NP-40、1% 去氧胆酸钠、1 mM EDTA)和 TE 缓冲液(10 mM Tris-HCl (pH 8.0)、1 mM EDTA (pH 8.0))洗涤磁珠。使用洗脱缓冲液(1% SDS、0.1 M NaHCO3)进行洗脱。在 200 mM NaCl 中 65°C 反向交联过夜后,用蛋白酶 K(Invitrogen, 25530049)消化并纯化洗脱的 DNA,用于测序或 qPCR。在 ChIP-qPCR 实验中,GmTubulin (SoyZH13_08G013700/Glyma.08G014200) 被用作阴性对照位点。所用引物的序列在补充数据 1 中提供。对于 ChIP-seq,使用染色质免疫沉淀的 DNA 构建测序文库,按照 DNA SMARTTM ChIP-Seq Kit 用户手册(Takara Bio USA, Cat. No. 634866)的协议进行,并由安诺优达基因科技公司(中国)使用 HiSeq-PE150(Illumina)进行测序。

ChIP-seq 分析

通过 fastp(0.20.1)去除 ChIP-seq 文库中的接头序列和低质量读段,并使用 bwa mem 算法(0.7.17)将清理后的读段比对到 W82 Refseq v2。我们进一步使用 “samtools view -bS -F 1,804 -f 2 -q 30” 命令过滤低质量比对的读段。随后,使用 Picard-2.20.5-0 对高质量比对的读段进行重复去除。将两个生物学重复的去重复 bam 文件使用 samtools(1.5)合并,合并后的 bam 文件通过 deeptools(3.3.0)中的 bamCoverage 转换为 bigwig 文件,参数为“-bs 10 –effectiveGenomeSize 978000000 –normalizeUsing RPKM –smoothLength 50”。bigwig 文件使用 deeptools(3.3.0)和 IGV(2.8.0.01)进行可视化。

;