您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2021
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

混合系白血病染色质异质性的自动切割标记分析

 二维码
发表时间:2021-10-25 15:33作者:武汉新启迪Xinqidibio

摘要

急性髓系和淋巴样白血病常伴有染色体易位KMT2A基因,编码KMT2A赖氨酸甲基转移酶(也称为混合系白血病-1),并产生KMT2A与其他染色质调节蛋白的帧内融合。在这里,我们在细胞株和病人样本中为不同的KMT2A肿瘤融合蛋白绘制了跨基因组的融合特异性靶标。通过修改剪裁和标记染色质谱以实现完全自动化,我们确定了KMT2A肿瘤融合蛋白诱导的异常染色质调控的常见和肿瘤亚型特异性位点。KMT2A肿瘤融合结合位点的一个子集由二价(H3K4me3和H3K27me3)染色质标记,单细胞切割标记分析表明,这些位点表现出细胞到细胞的异质性,暗示着谱系可塑性。此外,我们还发现H3K4me3在基因体中的异常富集对Menin抑制剂是敏感的,这表明自动染色质谱在鉴定治疗弱点方面的作用。因此,自动化和单细胞切割与标记的集成可以揭示患者样本中表观基因组的异质性,并预测治疗药物的敏感性。

10%的急性白血病患者存在染色体易位KMT2A编码赖氨酸甲基转移酶2A(亦称混合系白血病-1)的基因1。在正常作用下,KMT2A催化组蛋白H3核小体尾(H3K4)的Lys 4残基甲基化,是胎儿和成人造血所必需的。2。KMT2A的N端部分包含一个介导蛋白质相互作用的低复杂度结构域,一个AT-钩子/CXXC结构域,它与dna和多个染色质相互作用域(pd结构域和溴化结构域)结合,而C-末端部分包含一个与组蛋白乙酰转移酶相互作用的反活化结构域和一个催化组蛋白h3k4甲基化的结构域。3,4,5,6。KMT2A前体蛋白被切割成320 kDa N端片段(KMT2A-N)和180 kDa C端片段(KMT2A-C),形成稳定的二聚体。7,8.

KMT2A通过涉及kmt2A N端dna结合区与其他染色质调节蛋白阵列的致癌染色体重排来促进白血病的发生。9,10。虽然已经确定了80多个易位伙伴KMT2A-重新安排(KMT2A(R)白血病、涉及AF9、ENL、ELL、AF4和AF10转录延伸因子的融合占大多数病例。1,10。这些融合伙伴调节RNA聚合酶II的延伸(ELL和AF4),招募DOT1LH3K79组蛋白甲基转移酶(AF 10),或两者兼而有之(AF9和ENL)。11,12,13,14。此外,enl和af9与cbx 8染色质盒蛋白相互作用,中和多梳抑制复合物1(Prc 1)基因沉默复合物。15,16.

以往的工作表明,kmt2A融合蛋白结合不同的基因组位点取决于融合伙伴,以驱动不同的白血病亚型。17,18。例如,AF4融合在急性淋巴细胞白血病(ALL)中更常见,AF9融合与急性髓系白血病(AML)相关。1。此外,KMT2A在混合表型急性白血病(Mpal)中,重排也很普遍。KMT2A在血统类型之间相互转换的r白血病已被记录在案。17,19,20,21。然而,由于缺乏有效和可靠的KMT2A融合结合位点分析方法,KMT2A融合位点与染色质结构和谱系可塑性之间的关系一直具有挑战性。在这里,我们建立了一个染色质分析平台,有效地描述了致癌融合蛋白,转录相关复合物和组蛋白修饰在细胞株和病人样本中。通过将这些结果与相关的单细胞方法的结果相结合,我们描述了KMT2A白血病。我们确定了融合癌蛋白的一组目标基因,它们在同一样本中显示不同的活性和抑制性染色质的模式。这些模式表明,kmt2A融合蛋白激活同一肿瘤不同细胞内不同的致癌网络,并可能解释与之相关的谱系可塑性。KMT2A白血病。此外,我们还发现不同的融合伙伴对不同的转录辅助因子有不同的亲和力,这预示着癌症对治疗性化合物的敏感性。

结果

不同KMT2A融合蛋白结合位点的定位

嗜癌融合蛋白染色质定位的特征往往受到染色质免疫沉淀和测序(芯片-seq)不能用于少量患者样本的限制。为了有效地比较野生型kmt2A与融合蛋白的结合位点,我们采用了Autocut&run。22穿过一个四人小组KMT2A白血病细胞系与8例原发性白血病KMT2A为CD 45分类的病人样本+爆炸。这个集合跨越了KMT2A多种白血病亚型KMT2A与转录延伸因子AF4(SEM,RS4;11,1°ALL-1,1°MPAL-2),AF9(1°AML-3,1°MPAL-1),enl(KOPN-8,1°AML-2),AF6(ML-2)和AF 10(1°AML-4,1°AML-5),以及与细胞质GTPase SEPT 6(1°AML-1)相对罕见的融合的易位。1)。除了AML衍生细胞系ML-2外,这些样本还包含KMT2A轨迹。为了比较,我们还分析了kmt2A在未经转化的人CD 34中的定位情况。+H1人胚胎干细胞和K 562白血病细胞系中的造血干细胞和祖细胞(HSPC),每种细胞都缺乏造血干细胞和祖细胞。KMT2A易位。C末端抗体只识别野生型KMT2A-C,而N端抗体既识别野生型KMT2A-N,又识别融合蛋白(图1)。1A)。因此,通过比较C端和N端KMT2A特异性抗体所获得的染色质谱,可以确定致癌融合蛋白的特异结合位点。我们用AutoCUT&Run对两种不同的N末端抗体和两种不同的KMT2A C末端抗体对复制样品进行了分析,测序结果的相关性分析表明,该方法具有较高的重复性。r=0.78±0.19;扩展数据图。1A).

图1:AutoCUT&KMT2A融合蛋白结合的快速分析。
figure1

a,KMT2A融合蛋白定位的一般策略。野生型KMT2A蛋白(黑色)被切割成KMT2A-N和KMT2A-C蛋白.常见的致癌病变(黑箭头)与众多的融合伙伴(灰色)一起产生致癌KMT2A的帧内翻译。抗C末端KMT2A(蓝色)抗体可识别野生型KMT2A-C。抗N端KMT2A(RED)抗体识别野生型KMT2A-N和致癌KMT2A融合蛋白.b,野生型KMT2A绑定站点的示例(EIF4E)和癌蛋白结合位点(霍萨)。黑色标尺,10 kb。c,比较KMT2A峰宽和相对富集的KMT2A N与对照C端的散射图(CD 34)+和K 562)样品和KMT2AR(SEM和ML-2)样品。d,KMT2A信号在CD 34中以宽KMT2A结合位点(顶部)和窄KMT2A结合位点(底部)为中心的10 kb窗口的热图比较。+扫描电镜细胞中HSPC和KMT2A融合蛋白结合位点(顶部)和野生型KMT2A结合位点(底部)。e,饼图显示宽KMT2A峰的分数(CD 34)+和H1细胞)和KMT2A融合结合位点(KMT2A(r样本)重叠转录起始位点(Tsss)、基因体和基因间区域。P计算值采用Fisher氏精确检验。fKMT2A-N和KMT2A-C信号盒图显示,KMT2A N端抗体相对于KMT2A C端抗体在融合结合位点富集。中线表示中间值,方框限制表示第一和第三四分位数,而晶须则显示下四分位数和上四分位数的1.5倍范围内的所有数据;未显示异常值。P值是使用两个样本计算的。t测试(双面)CD 34+, n=131;K 562,n=65;ML-2,n=144;SEM,n=91;RS4;11n=92;KOPN-8,n=192;1°all-1,n=156;1°AML-1,n=349;1°AML-2,n=423;1°AML-3,n=103;1°AML-4,n=270;1°AML-5,n=186;1°MPAL-1,n=248;1°MPAL-2,n=189。g融合癌蛋白结合位点的主成分分析KMT2AR样本显示了前两个组件。

为了评估我们的kmt2A双抗体方法,我们首先比较了kmt2A野生型和C端的kmt2A N端和C端的分布。KMT2AR样本如预期,在H1和K 562细胞和CD 34中+HSPC、KMT2A-N和KMT2A-C在整个基因组中表现出几乎相同的富集模式。r=0.82±0.08;1B以及扩展数据图。1A,b)。值得注意的是,在h1细胞中,kmt2A结合通常集中在tsss上方的窄峰处,而在K 562细胞和CD 34细胞上。+祖细胞附加区域显示KMT2A-N和KMT2A-C的宽峰,从tsss延伸到基因体。许多在CD 34中具有广泛KMT2A分布的基因+祖先(例如,HOXA 9, Runx 2, Meis 1, MEF2C)是造血细胞命运的主调节因子。1C)以前曾被定义为白血病中的KMT2A融合癌蛋白靶点。18,23。在KMT2AR白血病标本中,KMT2A N端与C端的相关性明显低于对照组(P<0.05)。r=0.53±0.21;扩展数据图。1A,c),许多宽的KMT2A结合区域显示了相对于KMT2A C端的丰富的KMT2A N端信号(如图所示)。1B,c)。为了系统地定义融合蛋白结合位点,我们采用高斯混合模型,根据KMT2A峰的宽度和KMT2A-N与KMT2A-C信号的富集归一化比(KMT2A N/C分数),将KMT2A峰划分为两种不同的分布。1C以及扩展数据图。2)。CD 34+在6,336个KMT2A结合位点中,有131个被称为宽峰(平均为8.2±4kb),而两组分高斯混合模型未能根据N/C评分划分KMT2A结合位点(图1)。1C,d以及扩展数据图。2A-E),表明KMT2A-N和KMT2A-C蛋白有类似的富集,与野生型KMT2A结合一致。相比之下,在编码KMT2A-AF4融合的扫描电镜细胞系中,8,259个KMT2A结合区中有195个被称为宽(平均=13.1±10 kb),其中约一半(91/195)的KMT2A-N相对于KMT2A-C富集,我们认为KMT2A-C是融合癌蛋白结合位点(图1)。1C,d以及扩展数据图。2F-j)。根据这一解释,我们在sem细胞中发现的91种癌蛋白靶基因中,有61条与kmt2A-af4靶基因重叠,这些基因以前是在seq芯片上在扫描电镜细胞中发现的。23(扩展数据图。2K)。Ml-2细胞系存在野生型缺失。KMT2A等位基因只携带KMT2A-AF6融合癌蛋白。如所料,大多数KMT2A结合位点的KMT2A N/C评分较高(144/211;图1)。1C以及扩展数据图。2L)。KMT2A-AF6融合癌蛋白在ML-2细胞中持续定位于染色质,表明该癌蛋白的结合不依赖于野生型KMT2A。

接下来,我们研究了KMT2A在野生型和癌融合蛋白中的分布是如何不同的.CD 34+HSPC,81%的宽峰重叠于基因tss,而在KMT2A与TSS重叠的融合蛋白峰显著减少(30%),与基因体重叠的比例显著增加(50%)。1E)。相比之下,在对照h1人胚胎干细胞系中,17000个kmt2A峰中只有15个称为宽峰,这些峰在tsss基因上的富集程度明显低于我们在CD 34中发现的宽kmt2A峰。+和癌蛋白结合位点相比,hspc在基因体中的富集程度要低得多。KMT2AR白血病样本(图1.1E以及扩展数据图。2M)。KMT2A融合癌蛋白在靶基因体中的这种分布模式与以前的报道是一致的。23,24。通过比较KMT2A N端和C端融合癌蛋白结合位点的富集情况KMT2AR样本,我们发现,在所有情况下,N末端是显着地富集比C端(图1)。1F),以及在所有情况下,在癌蛋白结合区N端和C端信号的折叠差异。KMT2A在CD 34中r样本大于宽的kmt2A结合区。+扩展数据图3A)。结合这些发现,我们得出结论,我们的KMT2A N端和C端抗体多路复用方法可以识别不同的KMT2A融合癌蛋白结合的区域。

然后我们比较了不同KMT2A融合的白血病中癌蛋白靶点。我们发现,在440个(~18%)融合癌蛋白靶基因中,有5个或更多的基因共有81种。KMT2A我们分析了白血病样本,占融合蛋白所占序列空间的12%(扩展数据图)。3B,c)。正如我们所预期的,在我们收集的样本中,我们发现的KMT2A融合目标中最常见的一组基因包括已知需要的几个基因。KMT2AR白血病,包括HOXA 9, Meis 1, MEF2C, MBNL 1JMJD1C25,26,27,28,29(扩展数据图。3C和补充表2)。所有癌蛋白结合位点的KMT2A N/C评分表明,肿瘤的特异性融合伴和髓系与淋巴系的偏倚都可能影响肿瘤融合蛋白的肿瘤特异性定位(图一)。1g)。例如,所有KMT2A-AF4样本聚在一起,聚在一起,并与来自ALL患者的样本和MPAL患者的样本进行分组。相比之下,所有细胞系KOPN-8携带KMT2A-enl融合蛋白,并与携带KMT2A-AF4的白血病分离.含有KMT2A-AF9、KMT2A-AF10和KMT2A-enl融合的AML原始样本除含有KMT2A-SEPT6的主AML和含KMT2A-AF9的MPAL样本外,形成第二簇。因此,含有KMT2A-AF4融合蛋白的肿瘤具有明显的结合谱,但其他肿瘤融合蛋白,如KMT2A-enl和KMT2A-AF9,似乎也受到肿瘤谱系偏差的影响。

染色质景观KMT2AR白血病标本

为了经济地描述肿瘤的全球染色质情况,我们开发了AutoCUT&Tag,这是对我们以前的AutoCUT和运行机器人平台的一种改进。22。剪裁标签利用了抗体系结TN的高效率和低背景。5基于标记的染色质分析相对于以前的方法,如芯片-seq和剪切和运行。30。标准的切割和标记协议要求在PCR扩增文库前提取DNA。然而,我们最近开发了不需要提取(切割和标记直接)的dna释放和PCR富集的条件。31。在这个改进的协议中,使用低浓度的sds来取代绑定的TN。5从标记DNA,以及随后加入的非离子洗涤剂TritonX-100淬火SDS,以允许有效的PCR。这一简化协议使切割和标签与96井板格式的机器人处理样本兼容,并生成数据质量可与桌面切割和标记所产生的数据质量相当的配置文件(r=0.79±0.093;扩展数据图。4A-C).

为了确定KMT2A融合结合位点周围的染色质特征,我们用AutoCUT&Tag分析了活性染色质修饰的H3K4me1,H3K4me3,H3K36me3,H3K27ac和H4K16ac,以及启动了以C-末端结构域Ser5磷酸化为标记的RNA聚合酶II(RNAP2S5p)。此外,我们还描述了沉默组蛋白H3K27me3和H3K9me3的修饰。这八种修饰共同区分了活性启动子、增强子、转录区、发育沉默染色质和构成性沉默染色质。32并提供一个简单的图像,一个基因组的调节状态(图)。2A)。复制控制CD 34中每个标记的配置文件+样本和KMT2AR白血病样本非常相似,并被合并作进一步分析(H3K27me3,r=0.93±0.051;H3K4me3,r=0.96±0.015;H3K4me1,r=0.90±0.037;H3K9me3,r=0.83±0.060;H3K27ac,r=0.80±0.077;H3K36me3r=0.95±0.021;H4K16ac,r=0.97±0.012;RNAP2S5pr=0.77±0.107)(扩展数据图。4D).

图2:聚类调节特征区分白血病样本中常见的和限制性的元素。

aMeis 1位点是KMT2A-AF9在1°MPAL-1样品中的直接靶标,由活性染色质标记和抑制染色质标记修饰。这个霍萨该肿瘤内簇相对受抑制。黑色标尺,10 kb。bH3K4me3信号在诊断性免疫表型标记启动子处可准确分类AML、ALL和MPAL白血病。c、H3K4me1标记区的PCA聚类分析根据谱系特异性对样本进行分离。d,和在cH3K4me3。e,和在cH3K36me3。f,和在cH3K27me3。用H3K27me3的PCA对标本进行分组--标记抑制染色质分离同一家系的肿瘤。g,二维t-分布式随机邻居嵌入(t-SNE)对所有H3K4me1标记区域的预测分离特定的谱系调控元素。每个彩色像素对应于单个H3K4me1峰,以所示样本类型中的最大强度着色。h, t-SNE投影的H3K4me3确定谱系特异性启动子。i,和在gH3K36me3。j,和在gH3K27me3。AML和所有样本显示广泛存在的H3K27me3,而H3K27me3则更局限于CD 34。+对照和MPAL样品。k,热图显示H3K4me3-和H3K27me3-特异性区域(顶部)以及称为二价区(底部)的1°MPAL-1样品。l比较不受KMT2A融合基因(非靶点)、KMT2A融合基因(癌蛋白靶点)与大多数样本中结合但在感兴趣样本(缺失靶点)中缺失的基因的二价染色质,发现在癌蛋白靶基因处有二价染色质特征富集。

我们首先比较了所有样本中与野生型KMT2A结合位点相关的染色质特征和KMT2A肿瘤融合蛋白结合位点。根据KMT2A融合蛋白的定位,我们发现活性启动子标记H3K4me3、RNAP2S5p和H3K27ac均存在于癌融合蛋白结合位点(扩展数据图)。5A-C)。H3k4me3在ML-2细胞系中的一些启动子中也被富集(例如,LPO利兹在图中。2B),缺乏KMT2A甲基转移酶结构域,说明是另一个H3K4me3甲基转移酶引起的。与样本匹配的野生型KMT2A结合位点相比,H3K27ac在所有样本中均在癌融合蛋白结合位点富集,但在11份样品中仅6份(SEM、KOPN-8、1°AML-1、1°AML-2、1°AML-3和1°AML-5)的差异有统计学意义。5B)。在5个样品(SEM、RS4、11、1°AML-1、1°AML-2和1°MPAL-2)中,H3K4me3标记在癌融合蛋白结合位点显著富集,并在其他5个样品(1°ALL-1、1°AML-3、1°AML-4、1°AML-5和1°MPAL-1)中明显缺失。5C)。肿瘤融合蛋白结合位点缺乏H3K27me3和H3K9me3(扩展数据图)。5D,e)但在H3K4me1和H3K36me3中均有富集,这两种基因都标记了转录的基因体,这种富集在11种基因中的9种和6种中都具有显着性。KMT2AR白血病样本,分别(扩展数据图)。5F,g)。这些标记的富集预期是由于将KMT2A融合基因误判到基因体上。33.

组蛋白修饰谱可能通过报告白血病的转录状态来揭示白血病之间的相似和区别。例如,H3K4me3报告基因启动子活性,并在与每种白血病免疫表型特征相匹配的标记基因上富集。2B)。以确定这些标记的全局分布在KMT2AR白血病样本,我们首先确定了在我们收集的每一次修饰中富集的区域。KMT2AR白血病标本及CD 34+使用SEACR峰值调用方法的HSPC34并对样本进行聚类分析,根据其修改的特异性相似性进行聚类。总体而言,以H3K4me1、H3K4me3、H3K36me3、H4K16ac或RNAP2S5p为标记的活性染色质特征按ALL、AML或MPAL谱系分类(图1)。2C-e以及扩展数据图。6a,b),这表明在每一种白血病亚型中都使用了类似的活性基因。相比之下,基于H3K27ac或H3K27me3的PCA将样本分成基本上与白血病亚型无关的组(图1)。2F以及扩展数据图。6C仅1°AML-1样品用H3K9me3(扩展数据图)进行鉴别。6d)。H3K27me3是一种表观遗传的组蛋白修饰,它与发育进程有关,因为细胞决定了它们的身份。因此,这些不同的H3K27me3白血病景观可能与每个肿瘤中存在缺陷的造血转换有关。

接下来,我们研究了基因和调控元件使用上的世系特异性变异,如我们通过表演所描绘的每一个标记的全局染色质景观所指示的那样。t-这些元素的SNE,然后是密度峰值聚类。35。这一分析表明h3k4me1标记区域在谱系亚型之间差异很大,其中很大一部分在AML样本中有很大一部分被标记为在AML样本的一侧。t-SNE地块(8,221/56,267),地块另一侧的所有特定元素(8,466/56,267)和CD 34+HSPC组在中间(7,141/56,267)。2G以及扩展数据图。6E,f)。Cd 34中的h3k4me1也标记了一部分AML和所有特异性元素。+细胞和原始的MPAL样本,我们分析(图)。2G以及扩展数据图。6E,f)。这种调控重叠意味着MPAL白血病与ALL和AML都有共同的特征。KMT2AR白血病样本维持H3K4me1在正常造血过程中所使用的调节元件。

在所有样本(~50%,25,973/56,267)中,只有约一半的H3K4me1标记元素具有相似的标记,但H3K4me3(~75%,10,958/13,998)和H3K36me3(~85%,22,858/26,759)的峰在白血病亚型中普遍存在,表明这些亚型在很大程度上共享基因表达谱(见图)。2H,i以及扩展数据图。6g-j)。分组H3K4me3-标记启动子区域t-SNE还将64个AML和508个所有特定元素划分到t-SNE图表,并确定了与MPAL样本和CD 34共享的1,918个元素+HSPC(图1.2H以及扩展数据图。6g,h然而,与H3K4me1相比,在56,267个总峰中,我们发现了23,828个谱系特异性峰(~40%),而H3K4me3标记特征显示出任何谱系特异性(2,490/13,998个峰,或~18%)。这与以前的报道一致,即以H3K4me1标记的调控元件通常比H3K4me3标记的启动子元件表现出更多的细胞类型特异性(参考文献)。36,37).

类似于t-H3K36me3标记区域的SNE分析,tH3K27ac-、H4K16ac-和H3K9me3标记区的SNE分析没有按谱系划分基因组(扩展数据图)。7A-c)。相反,RNAP2S5p和H3K27me3峰的多样性与H3K4me1相似。2J以及扩展数据图。7D)。分析t-SNE与H3K27me3没有根据谱系亚型划分元素(如图所示)。2J)。相反,AML和所有样本在h3k27me3标记的基因组中所占的比例明显高于CD 34。+细胞(图1.2J以及扩展数据图。7E),提示这些肿瘤类型具有较高的分化性。根据这一解释,MPAL样本的H3K27me3标记区域明显少于ALL或AML样本,并被认为具有较高的谱系可塑性(图一)。2J以及扩展数据图。7E)。我们的结论是,高吞吐量的裁剪和标记分析提供了一个强大的工具来描述KMT2A白血病和对发育抑制的基因组的分析揭示了肿瘤特异性的差异,这种差异通过对活性基因组的分析并不明显。

KMT2A融合蛋白靶区二价染色质

除了标记参与活性转录的启动子外,H3K4me3还存在于一个有限的转录抑制‘二价’(即‘TACK’)启动子的子集上,该启动子也被标记为H3K27me3(参考文献3)。38,39)。在我们收集的白血病样本中,我们观察到H3K4me3和H3K27me3在一些被称为KMT2A融合蛋白靶的启动子上同时存在。2A,左)。此外,我们还观察到了大多数肿瘤融合蛋白结合的基因。KMT2AR白血病样本,但在特定样本中未被称为靶标;我们称之为“缺失靶点”(图1)。2A,右)。为了系统地定义样品中的二价启动子,我们以标记启动子和无标记启动子的基因tsss为中心,定量了2kb窗口中H3K4me3和H3K27me3的丰度。通过将这些群相交,我们确定了大约2,000-5,000个二价启动子。KMT2AR白血病样本(图1.2K和补充表3)。有趣的是,我们发现约33%(129/396)缺失目标的启动子被称为二价,而约24%(267/1097)的KMT2A融合目标启动子是二价启动子,只有14%的野生型KMT2A目标启动子是二价启动子(图1)。2L)。因此,肿瘤融合蛋白靶启动子被富集成二价染色质特征,表明这些基因的表达可能在样本中的细胞间波动。

KMT2A融合靶点的细胞间染色质异质性

为了检验kmt2A融合靶启动子上的二价染色质特征是否是由于细胞间的异质性,我们对四个细胞进行了单细胞切割和标记。KMT2AR细胞株及4株原生质体KMT2A白血病样本。抗体结合与Pa-TN5在大量样本上进行捆绑,然后在icell 8平台上将单个细胞排列在微波中,以进行条形码PCR文库的富集。30。通过改变用于释放TN的SDS洗涤剂的数量,我们优化了每个单元的唯一读取数的中位数,同时在ICELL 8上保持了较高比例的读取峰值(FRIP)。5标记后,用TritonX-100在PCR前熄灭SDS(扩展数据图)。8a,b)。利用这一方法,我们分析了H3K4me3、H3K27me3和H3K36me3组蛋白修饰的1,137-3,611个细胞。剔除少于300个片段的细胞后,单个细胞对H3K4me3、H3K27me3和H3K36me3的唯一读取量分别为4,972、13,025和3,962个(扩展数据图)。8C)。作为第二个质量控制步骤,我们将每个标记所描述的所有细胞的汇总数据称为峰值,并删除了每个标记的FRp值低于正态分布的细胞的峰值(扩展数据图)。8D,e)。然后将每个细胞的轮廓分割成5 kb的垃圾箱,在整个基因组中平铺,并在此基础上将细胞投射到UMAP空间中(如图所示)。3A-c)。令人鼓舞的是,从同一个白血病样本中提取的细胞在不同的实验中被聚在一起,表明数据质量是一致的(扩展数据图)。8F-h)。这种方法解决了基于H3K4me3或H3K27me3分析的样本集群,而不是H3K36me3分析(图1)。3A-c)。这意味着白血病样本在两组活性启动子和沉默区域都不同。

图3:H3K4me3和H3K27me3的单细胞谱显示了KMT2A融合靶位点的染色质异质性。
figure3

a,UMAP投影H3K4me3在单个白血病细胞中分解样品特异性簇。b,和在aH3K27me3。1°ALL-1、1°MPAL-1和1°MPAL-2样品中有一部分细胞混合在H3K27me3 UMAP空间中。c,和在aH3K36me3。根据H3K36me3谱,白血病细胞不形成紧密的样本特异性群。d、散点图比较1°MPAL-1平均估算的H3K4me3评分和按KMT2A融合结合状态(靶区、缺失靶区或未结合对照)和启动子二价状态分组的基因的标准化离散度。突出显示选定的基因。e,和在dH3K27me3。fKMT2A融合靶点显示H3K4me3和H3K27me3在某些白血病样本中的离散度增高。中线表示中间值,方框限制表示第一和第三四分位数,而晶须显示1.5倍于上下四分位数的IQR范围内的所有数据;未显示异常值。P值是使用两个样本计算的。t测试(双面)每个样本,n值列出了二价控制、二价目标和二价缺失目标:ml-2:n=2 425、14、14;SEM:n=3 441、8、15;RS4;11:n=2,635,6,9;KOPN-8:n=2,044,31,5;1°all-1:n=1 873、6、9;1°AML-2:n=2 483、17、12;1°MPAL-1:n=3,101,40,8;1°MPAL-2:n=3 018、15、7。g。根据H3K4me3基因在1°MPAL-1细胞上的协方差,组织基因分解出与另一组基因呈负相关的组群。选定的基因突出显示以供比较。h,和在gH3K27me3。i的H3K4me3基因分值gh显示在1°mpal-1细胞的umap图上,显示为暗绿色簇。a. j,和在iH3K27me3。HOXA 9TAPT 1代表一组与第二组不同的共变体KMT2A融合靶基因(例如,CPEB 2Meis 1).

为了研究h3k4me3和h3k27me3信号的瘤内异质性,我们首先使用archr单细胞软件包。40,41根据所有细胞的UMAP投影计算所有基因的推测基因分数。然后,我们从同一样本中确定了计算分数在细胞中的归一化离散度(如图所示)。3D,e)。在SEM、KOPN-8、1°ALL-1、1°AML-2、1°MPAL-1和1°MPAL-2样本中,二价缺失靶点的H3K4me3离散度明显高于肿瘤配对对照基因(图1)。3F)。这意味着这些基因中H3K4me3活性启动子标记的水平在不同的细胞内存在差异。KMT2A白血病。

其次,我们研究了抑制性H3K27me3标记在二价癌蛋白靶基因上的变异。在1°MPAL-1细胞中,二价缺失靶基因H3K27me3的归一化离散度显著高于二价靶基因,而在1°MPAL-2样本中,二价靶基因的归一化H3K27me3离散度高于肿瘤配对对照基因。3F)。H3K4me3和H3K27me3修饰的细胞间存在一些二价基因差异。例如,HOXA 9基因是1°MPAL-1细胞缺失的靶点。2A)但在H3K4me3和H3K27me3信号中均表现出较高的分散性。3D,e)。因此,染色质标记的双价性与样品中细胞间的异质性有关。

将二价靶基因分组,根据他们在某一白血病样本细胞上估算的基因分数的Pearson相关性,用H3K4me3或H3K27me3谱将两组分离开来(如图所示)。3G,h以及扩展数据图。9A-g)。例如,缺失的目标基因HOXA 9在1°MPAL-1白血病细胞中,H3K4me3评分升高(~15%)。3I以及扩展数据图。9H)。这个TAPT 1基因聚在一起HOXA 9(无花果)第三代)和预期一样,在相同的细胞中,H3K4me3得分最高。HOXA 9 (r=0.87)(图1。3I)。相反,与之相关的基因HOXA 9,如CPEB 2(r=−0.74)和Meis 1 (r=−0.42),细胞中H3K4me3信号最弱HOXA 9是活跃的(如图所示)。3I)。这表明KMT2A融合癌蛋白激活了两个排他基因表达程序。此外,我们还发现,估算的H3K27me3分数也形成了与H3K4me3基因关联的反向模式,其中,诸如HOXA 9H3K4me3在1°MPAL-1白血病细胞中很少显示H3K27me3在大多数肿瘤细胞(~55%)中表现出较高的H3K27me3评分。3J以及扩展数据图。9I)。这些不同的KMT2A融合蛋白靶点可能参与了KMT2A的表型可塑性。KMT2A白血病。

AutoCUT&Tag谱预测白血病的药物敏感性

我们认为,KMT2A融合蛋白的不同结合位点可能部分是由融合癌蛋白相关的辅助因子所驱动。因此,我们使用AutoCUT&Tag来绘制与KMT2A融合蛋白相互作用的两种染色质蛋白enl和dot1l的分布图。33。KMT2A融合蛋白结合区与野生型KMT2A结合位点相比,DOT1L和ENL均富集。4A-C)。DOT1L被认为是KMT2A融合蛋白在某些白血病中致癌转化的核心成分。14,42我们发现在KOPN-8、1°AML-3和1°MPAL-1样本中,DOT1L组蛋白甲基转移酶在肿瘤融合蛋白靶点上的富集程度明显高于我们所观察到的其他白血病(图1)。4B)。1°AML-3和1°MPAL-1均携带KMT2A-AF9融合蛋白,KOPN-8携带KMT2A-enl融合蛋白,提示AF9融合伙伴在癌蛋白靶位上吸收的DOT1L水平特别高,而其他白血病对DOT1L的摄取可能是可变的。KMT2A-SEPT6融合(1°AML-1)也说明了这一点,在融合结合位点只观察到DOT1L和ENL的适度富集。

图4:AutoCUT&Tag分析显示KMT2AR白血病对DOT1L的抑制作用。
figure4

a比较了转录辅因子DOT1L和enl在10 kb窗口内的热图,其中心是融合癌蛋白位点(TOP)和样本匹配的野生型位点(底部)。b,DOT1L在融合癌蛋白结合位点均显著富集。KMT2A白血病样本。KMT2A-AF9-含1°AML-3和1°MPAL-1样品及KMT2A-enl细胞株KOPN-8融合癌蛋白位点DOT1L的富集最强。对于所有方框图,中线表示中间值,框限表示第一和第三四分位数,而晶须显示在1.5倍于上下四分位数的IQR范围内的所有数据;未显示异常值。P值是使用两个样本计算的。t测试(双面)n值列为对照样本的窄位点和宽位点,以及野生型位点和癌蛋白位点。KMT2AR样本:CD 34+: n=6,204,131;SEM:n=8 168,91;RS4;11:n=10 287,92;KOPN-8:n=9,723,192;1°all-1:n=3 747,156;1°AML-1:n=15,915,349;1°AML-2:n=26 148 423;1°AML-3:n=3,943,103;1°AML-4:n=7 218,270:1°AML-5:n=11,256,186;1°MPAL-1:n=8,641,248;1°MPAL-2:n=15 179 189。c,enl在融合癌蛋白结合位点均显著富集。KMT2A白血病样本。n值与b. d、SEM、RS4;11和KOPN-8细胞对DOT1L抑制剂EPZ-5676(DOT1Li)浓度升高的细胞存活曲线。错误栏表示S.D。三个副本。e对30 M DOT1L抑制剂作用3d后,H3K27ac在KOPN-8细胞中的融合癌蛋白结合位点缺失,而非SEM或RS4;11细胞。n值与b.

多项研究表明,含KMT2A-AF9的白血病对DOT1L甲基转移酶活性的药理抑制特别敏感。43,44。我们推测DOT1L信号在癌蛋白靶点的升高可能是对DOT1L抑制剂的敏感性的指示。事实上,我们发现KOPN-8细胞对DOT1L抑制剂EPZ-5676(半数最大抑制浓度(IC))更敏感。50)比SEM(IC)50=110.45或RS4;11(IC)50=29.71μm)细胞(图1)。4D)。以前的研究也表明,KOPN-8细胞对DOT1L抑制剂EPZ-0007477是敏感的(参考文献)。44)。我们怀疑EPZ-5676芯片50这里获得的值比以前报告的值要高。KMT2A因为我们只将细胞暴露在抑制剂中72小时,而不是4-10天。45,46。随着KOPN-8细胞对DOT1L抑制剂敏感性的增强,经EPZ-5676处理72h后,我们发现KOPN-8细胞的肿瘤融合蛋白结合位点上的活性组蛋白标记H3K27ac明显减少,而在扫描电镜或RS4;11细胞株中KMT2A-AF4结合位点上则未发现活性组蛋白标记H3K27ac(如图所示)。4E)。因此,这种药理剂可以特异性地改变肿瘤融合蛋白靶点的染色质。KMT2A白血病样本。

为了扩展这一分析,我们使用AutoCUT&RUN对转录支架蛋白Menin进行了分析,该蛋白与KMT2A的N端部分和癌融合蛋白相互作用。扫描电镜、RS4;11和KOPN-8细胞在kmt2A融合结合位点均有类似的Menin水平,而sem细胞对Menin抑制剂vtp 50469(Icp 50469)更敏感。50=2.4 NM)大于RS4;11(IC)50=18.7NM)或KOPN-8(IC)50=14.7 NM)细胞。5A-C)。然后,我们使用AutoCUT&Tag在VTP 50469细胞中分析H3K4me3。5D)。我们称之为H3K4me3峰,在药物治疗后显示出明显的信号减弱(扩展数据图)。10),这些缺失位点在肿瘤融合蛋白靶基因体中高度富集(如图所示)。5E,f)。最后,我们用聚合酶链反应(POL-CUTAC)检测了药物处理细胞的染色质可及性和启动RNA聚合酶II(Rnap2s5p)的存在。47,48并发现许多肿瘤融合位点和Menin结合位点通常通过启动RNA聚合酶II而被高度访问和结合(如图2所示)。5G)。这支持了肿瘤融合蛋白诱导转录的观点。KMT2AR白血病对Menin抑制高度敏感。

图5:KMT2A融合靶基因体中H3K4me3的异常富集对Menin定位的破坏很敏感。
figure5

a,转录支架蛋白Menin在癌蛋白结合位点富集。KMT2AR细胞株对于所有方框图,中线表示中间值,框限表示第一和第三四分位数,而晶须显示在1.5倍于上下四分位数的IQR范围内的所有数据;未显示异常值。P值是使用两个样本计算的。t测试(双面)每个样本,n野生型位点和癌蛋白位点的值列示:SEM:n=8 168,91;RS4;11:n=10 287,92;KOPN-8:n=9 723 192。b、SEM、RS4;11和KOPN-8细胞的细胞存活曲线,对MENIN结合抑制剂VTP 50469(Menin-I)作用72h后细胞存活曲线进行了研究。三个副本。c,和在b但VTP 50469处理时间延长至96h。d30 mVTP 50469作用3d后,H3K4me3在融合癌蛋白结合位点缺失。n值与a. e,H3K4me3峰在VTP 50469作用下表现出明显的信号丢失,在癌蛋白靶基因体中富集。f,两例KMT2A-AF4结合基因(TAPT 1PAN 3)在扫描电镜下,在基因体内丢失H3K4me3的细胞中,30 M的Menin抑制剂作用3d后,黑箭头指向附加注释的tsss。黑色标尺,10 kb。g热图显示,如RNAP2S5pCUTAC(POL-CUTAC)所示,位于所述细胞融合蛋白靶基因体中的Menin敏感的H3K4me3峰可用于启动RNA聚合酶II。热图主要集中在门宁敏感的H3K4me3峰,在癌蛋白靶基因体中下降。

讨论

在这里,我们应用了高通量染色质分析技术。KMT2AR白血病描绘融合蛋白特异性靶点,并确定染色质特征的特点,髓系,淋巴样和混合谱系白血病。为了经济地描述这些特性,我们利用了高信噪比和低排序深度要求,在标准液体处理机器人上对切割和运行、切割和标记以及完全自动化这两种方法都有着内在的要求。AsCut&Tag只需要数千个细胞就可以进行信息丰富的组蛋白修饰。47,AutoCUT&Tag适用于广泛的研究,包括发育和疾病研究,以及病人样本的筛选。用于染色质分析的AutoCUT&Run和AutoCUT&Tag平台提高了吞吐量和一致性,使得这些技术适合于对患者标本进行分析。

通过在KMT2A融合体和超伸长复合物和Dotcom复合物上进行AutoCUT和Run,我们阐明了可能导致这些肿瘤异质性的机制的细节。我们发现,最常见的KMT2A融合蛋白,包括KMT2A-AF4、KMT2A-AF9、KMT2A-enl和KMT2A-AF10,都与DOT1L和enl蛋白在基因体内共定位。这表明AF4、AF9、ENL和AF 10的C端结构域与转录伸长复合物的相互作用很可能将融合蛋白从启动子中引入到基因体中。根据这些相互作用在致癌转化中起关键作用的可能性,野生型enl蛋白在许多肿瘤的生长中是必需的。KMT2AR细胞株49.

利用AutoCUT&Tag对白血病标本中组蛋白修饰进行了分析,确定了具有二价染色质特征的KMT2A融合癌蛋白位点。在某些位点,二价染色质特征与同一肿瘤细胞间的异质性相关,说明混合系白血病细胞群体中基因表达的异质性根源于染色质动力学。我们鉴定了一组kmt2A癌蛋白靶基因,这些基因在大多数癌基因中是共有的。KMT2AR白血病,但在一组样本中被遗漏。在几个KMT2A我们分析了r白血病样本,这些缺失的靶点是肿瘤内活性和抑制性染色质标记变异最大的基因之一,表明这些缺失的靶点可能被肿瘤内有限的细胞中的癌蛋白结合和激活,导致它们低于在我们的大规模KMT2A分析中检测到的水平。我们在KMT2A癌蛋白靶基因上观察到这种异质性,如果只有一部分细胞对特定的抗癌药物敏感,那么对治疗的抗药性就会产生影响。

如果早期的癌细胞分裂并分化为两种相关的细胞类型,那么白血病的异质性就会出现。另外,某些白血病可能偶尔在细胞类型之间切换。21,50。我们的单细胞图谱显示,一些白血病在KMT2A融合目标位点上显示出活性和抑制性染色质状态,这些位点在单个细胞之间存在差异。细胞群内染色质动力学分析将需要确定双价反应是否反映分化或零星切换,这对限制复发的治疗策略有暗示作用。

以染色质蛋白为靶点的多种化合物已显示出治疗某些白血病的前景。44,51。通过分析这些化合物的目标,可以区分出KMT2A在KMT2A融合癌蛋白靶点富集DOT1L的r白血病,为选择适合DOT1L靶向治疗的患者提供了一种策略。我们还鉴定了KMT2A融合癌蛋白靶基因在基因体内广泛富集H3K4me3并与RNA聚合酶II结合的样品,这些白血病对Menin抑制剂VTP 50469治疗特别敏感,并再次证明染色质谱在选择治疗治疗中的作用。因此,将AutoCUT&Run和AutoCUT&Tag纳入纵向临床试验可以为评价表观遗传药物的有效性提供一条途径。此外,这些技术在复制之间高度一致,并增加了可以并行处理和排序的样本数量,相对于常规染色质分析而言,这表明将AutoCUT&Run和AutoCUT&Tag应用于病人诊断是可行的。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297