您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2021
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

促癌剂促进食管鳞状细胞癌变及转移

 二维码
发表时间:2021-07-29 09:54作者:武汉新启迪Xinqidibio

摘要

.的作用顺式-食管鳞状细胞癌(ESCC,简称EC)中的元素及其异常尚不清楚。本文对28例H3K27ac标记的H3K27ac活性增强子谱和50个转录序列在原发性EC、转移性淋巴结癌(LNC)和邻近正常食管组织(NOR)中的表达进行了研究。在EC和LNC样品中分别检出了数千个增强剂和数百个变异的超增强子,其中有大量常见的增强剂和丢失促进剂。此外,这些差异增强子还参与了ECs和LNCs的转录异常。我们也揭示了可能的驱动因子应用化学抑制剂抑制预期的超增强靶点显示HSP 90AA1和PDE4B是ESCC的潜在治疗靶点。因此,我们的表观基因组图谱显示了一份重新编程的概要。顺式-食管癌发生和转移过程中的调控因素,以揭示治疗癌症的潜在靶点。

导言

食管癌有两种主要亚型:食管鳞状细胞癌(ESCC)和食管腺癌(EAC)。1。预后不良,5年生存率仅为18%。2。食管鳞癌占全世界食管癌病例的90%,主要分布在东亚和非洲。3。虽然食管癌患者的5年生存率在过去十年中有所提高,但这种癌症的预后仍然很差,因为除非通过筛查,否则患者在晚期之前通常不会表现出临床特征。Ⅲ期肿瘤累及肌肉层,累及淋巴结或其他邻近结构。3。食管切除术后5年生存率有利于淋巴结切除,浸润深度和淋巴结转移是重要的预测指标。4。因此,迫切需要更好地理解食管癌发生过程中的分子依赖性和脆弱性及其淋巴结转移,以制定有前途的诊断和治疗策略。

一个异常的和重新编程的转录组是人类癌症的一个普遍特征,它与细胞的增殖、侵袭和转移有关。5。异常转录模式的主要原因是基因改变和解除管制的信号通路和表观基因组特征,包括dna甲基化、组蛋白修饰和其他。顺式-监管要素6。多项研究强调了组蛋白修饰在疾病和癌症状态的建立和维持中的重要性。7,8,超增强子是由聚类增强子组成的,被认为是不同细胞类型和疾病条件下的关键控制因子。9,与疾病特有的基因变异和突变有关。8,10。我们和其他人最近提出,关键转录因子(Tf)驱动的增强子重新编程,以组蛋白h3赖氨酸27乙酰化(H3k27ac)为标志,并定位于启动子和转录起始位点(Tsss)远端,促进肿瘤的发生和转移。11,12,13.

几种家族遗传风险突变管理系统更新1, ASCC 1, CTHRC 1, Crtc 1, BARX 1, Foxp 1,TP 53, CDKN2A, Smad 4,和NFE2L2,已在Barrett‘s食管和腺癌患者中被确认14,15,16,17,18。同时,ESCC的某些家族形式和许多易感位点,以及一些遗传驱动因素(例如,TP 53)已报告16,17,19,20,21,22,而癌症发生的复杂性可能不仅仅是基因的改变。近年来,肿瘤特异性启动子、增强子和超增强子基因在癌变过程中的表观基因组谱被广泛应用于研究结肠癌、胃癌、肾癌和室管膜瘤等癌基因局部和区域表达异常的分子机制。8,23,24,25,26,27。虽然全球组蛋白修饰与胰腺癌和前列腺癌远处转移的演变有关。28,29,对ESCC肿瘤发生和转移的基因组范围的表观图谱了解甚少。

在本研究中,为了探讨增强子动力学在食管鳞癌进展和淋巴结转移中的作用,我们对食管鳞癌、淋巴结癌组织和正常食管上皮中的增强子和SE景观进行了描述。我们鉴定了大量的与区域基因表达相关的普遍改变的增强子和LNC特异性增强子,可用于精确的亚分类。通过分析反式-改变促进剂中的元素,我们发现了几个调控食管癌细胞增殖和迁移的关键因子。通过对SE相关基因与药物相互作用数据库的整合分析,我们发现了一些对药物抑制有反应的癌靶点。这些结果表明,对不同增强子和SE的鉴定对阐明食管和LNCs的核心转录调控回路和发现治疗靶点有很大帮助。

结果

H3K27ac谱定义食管癌发生和转移的有效调控元件

表征活性顺式-食管癌发生和转移过程中的调控元件,我们用染色质免疫沉淀和测序法(芯片-seq)对10例食管鳞癌患者进行染色质免疫沉淀和序列测定(芯片-seq),获得28条活性组蛋白标记(H3K27ac),并与邻近正常食管组织(NOR或Adj)、原代ESCC(本文进一步简称EC)和LNC组织进行比较。此外,共有50份转录(补充数据)1对18例ESC患者进行RNA测序(RNA-seq)检测,排除4例LNC标本,在临床病理检查中发现肿瘤细胞较少(图1)。1A病人的详细资料见附图。1A并在附图中显示了正常组织和癌组织的典型组织学图像。1B)。所有肿瘤均为Ⅲ期以上。质量控制分析表明,测序结果的Q30评分为90%,芯片-seq和RNA-seq数据与人类基因组的作图率均在75%以上(补充图)。2A-d)。在元素分析之前,我们对H3K27AC信号进行了分位数归一化,使其在28片SEQ数据集中达到可比较的水平,如方框图(补充图)所示。2E,f)。在本研究中,活性典型增强子被定义为与最近的tsss相距超过2kb的显著的h3k27ac峰,而在tsss(tsss±2kb)内的区域(tsss±2kb)被认为具有显著的h3k27ac活性启动子元件,正如前面的研究所描述的那样。26,30。在24份和19份样品中,活性启动子和增强子的数量分别达到饱和。顺式-从10个ESCC患者的28份样本中可以检索到调节成分(补充图)。2G,h).

图1:H3K27ac图谱定义了原发性食管和转移淋巴结肿瘤的活性调节元件。

a本实验设计用于分析癌旁正常组织(NOR)、食管鳞状细胞癌(EC)和淋巴结癌(LNC)组织的转录组和表观基因组。bNOR中差异分布增强子的鉴定n=10),欧共体(n=10),以及LNC(n(8)组织。通过NOR与EC、LNC或EC与LNC的比较,给出了改变(得失)启动子(Pro)或增强子(Enh)的数目。瑞尔。亲戚。c改变后的增强子的热图n=10),欧共体(n=10),以及LNC(n8)有H3K27AC富集信号的样品。利用H3K27ac富集信号,给出了六组(G1~G6)增强子。d28个NOR,EC和LNC样本差异增强子的无监督层次聚类分析c。还提供了病人人数。e28 NOR主成分分析n=10),欧共体(n=10),以及LNC(n=8)样品使用所有差异分布的启动子元素,如附图所示。5A中所示的增强剂c. f维恩图描绘了共享促进剂(左)和超级促进剂(右)的数目,跨越NOR,EC和LNC样本。g感染样地EC和LNC样品中超促进剂的鉴定。顶级超增强子相关基因被标记。在这三种类型的样本中,共享的、特定于EC的和特定于LNC的超级增强子的数量显示在饼形图中。hH3k27ac芯片-seq和rna-seq数据在EHFCCND 1四个代表的位点配对NOR,EC和LNC样本。先前鉴定的增强子79上游CCND 1启动子被指明。源数据作为源数据文件提供。

接下来,我们建立了一个差异分析管道来识别变更。顺式-调节元件,同时用DESeq 2(补充图2)鉴定差异表达基因(DEGS)。3)。检验我们预测的可靠性顺式-元素,我们首先重叠我们确定的H3K27ac峰(P值<1e-09)31并发现重叠率为90%(补充图)。4A)。通过将28份样品中预测的启动子和远端增强子元素组合在一起(补充图)。4B我们回收了24,823个活性启动子元件和57,675个活性增强子(补充图)。5A和补充数据2)。增强子谱的无监督层次聚类很容易从原始EC和LNC样本中区分正常样本(补充图)。4C),在肿瘤发生过程中表现出明显的表观基因组差异。提到以前的研究26我们将获得或丢失的元素定义为≥2的H3K27ac每千巴读量(RPKM)中有一倍变化(FC)的元素,以及≥0.5的绝对差(RPKM)。考虑到患者与样本之间的巨大差异,我们评估了肿瘤或LNC/正常对中改变元素的分布情况。约80%的改变增强子区域有显著差异(q < 0.1, paired t-试验;本雅明-霍奇贝格校正)在≥6/10患者的阈值(EC与NOR)(补充图1)。4D,e)。为了便于后续分析的简单性和一致性,我们为LNC和NOR(≥6/10)或EC(≥6/8)组织之间的比较设置了相同的阈值(补充图)。4F-I)。利用这些标准,我们在EC组织中获得了2917个启动子元件和3027个缺失启动子元件,8587个启动子元件和9642个缺失增强子,1471个和1403个缺失启动子元件,4399个和4626个缺失增强子在LNC(相对于NOR)中获得了高置信度和完整的增强子,在LNC(相对于EC)中获得了864个和715个缺失启动子和2733个缺失增强子,2466个缺失增强子(见图)。1B和补充图。5A)。这些数字与以前在其他癌症方面的研究相当。8,26。改变的元素在分析的病人中表现出明显的得失(补充图)。5B和补充数据3)或有代表性的病人(补充图)。5C),如热图所示。

其次,将这些差异增强子分为6类:G1(EC特异性增益;n=985),G2(LNC-比增益;n=837),G3(共同利益;n=1974年),G4(欧共体-特定损失;n=871),G5(LNC-特定损失;n=548)和G6(共同损失);n=2715)(图1。1C和补充数据4)。这些结果表明,原发癌和转移癌占大多数(59%)和少数(41%)的定位特异性表观基因组特征,这一模式有别于启动子变异,其中只有少数共同改变的启动子元素(补充图)。5D,e)。对这些差异增强子进行了非监督层次聚类分析,并将这三种增强子谱清晰地划分为组特异性特征(图1)。1D)。同样,对差异启动子元件和增强子相关基因进行主成分分析(PCA),成功地分离了PC1的正常和癌症标本;此外,EC和LNC样本沿PC2进行了区分(图2)。1E)。在前100位改变元件相关基因中(得得50和损失50),PC1评分为阳性的基因(如GFI 1, MSI 2, RUNX 3, CD 72,和Exo 1)在启动子分析和基因阴性的PC1评分(如CD 72, RUNX 3, TNFSF 8, NCF1C,和CTNNB 1)在增强子分析中被认为是促进致癌的潜在癌基因(附图)。6a,b)。此外,启动子分析中PC2阳性和阴性的基因与增强子分析中的顶层基因部分重叠,其中包括参与癌变和转移的功能调节因子(补充图1)。6a,b).

考虑到远端三组间表观遗传差异,其表观遗传特征在多个患者中更具有动态性,远比近端启动子区更稳定(附图)。5),我们在随后的分析中重点研究了增强子重编程。对于与增强子相关的基因,PC1评分阳性的基因主要与RAP1和RAS信号通路相关的RNA聚合酶II活性和表皮发育有关,而PC1评分为阴性的基因与细胞迁移、免疫应答和T细胞受体信号有关(补充图1)。6C,d)。在LNC阳性PC2维度中,增强子相关基因主要参与免疫细胞功能和细胞形态调控,而负PC2方向富集的基因与癌细胞粘附、细胞组织和通路调节有关(补充图)。6E,f)。这些数据验证了样本收集的准确性,并证明远侧增强子相关基因的全基因组改变是食管癌发生和转移的潜在调节因子。

SE是一种具有较大物理距离的增强子,它调节细胞身份和疾病状态的主调节因子的表达。9,32。越来越多的证据表明SE富含癌症特征,是多种癌症的一个特征。23,25,26。为了研究SE在ESCC中的作用,我们总共确定了1042个非冗余预测SE(补充数据)。5)使用玫瑰33并发现这三个群体在SE区域中所占比例为35.7%,高于普通典型增强子的比例(图1)。1F,g;补充图。6g),表明SE区域在不同患者和细胞类型之间的进化保守性。值得注意的是,绝大多数SE发生了改变,其中436和427个SES在EC和LNC中分别丢失了481和310个SE(附图)。6g),验证了预测SE的异质性。23。当对所有这些SE进行PCA时,三组癌症概况大致分开,并有严格的重叠(补充图)。六小时).

相对于正常食管上皮,在EC和lnc h3k27ac谱中分别检出392例(46.3%)和494例(52.1%)癌特异性SE,这些SE含有癌相关基因或癌基因,如CCND 125,26, CWH43, ANO 1,和CXCR 4(无花果)1F,g和补充图。7)。例如,邻近的区域CCND 1, CLUAP 1,和MTMR8在癌组织中,启动子元件、增强子和SE有显著的增加,启动子元件、增强子和SE在癌组织中也有明显的缺失。TFAP2B, MAU 2,和EHF,伴随转录激活(CCND 1)或压制(EHF)(图1.和附图。6I, 7)。我们一致地检索了以前发现的远端增强子(例如CCND 1来自其他癌症的rs 7105934位点)25,26,34在我们对H3K27AC的无偏分析中,富集进一步支持了我们数据的可靠性。

增强子改变与ESCC转录异常相关

为了探讨表观基因组增强子的改变与基因表达之间的关系,我们分析了来自同一队列的RNA-seq数据以及另外8例ESCC患者的22份转录。如先前报告所述9我们将预测增强子分配到最接近tsss的附近基因,然后分析6组差异增强子连锁基因的表达情况(见图)。1C)。与预期相比,差异增强子附近基因的表达与H3K27ac富集信号呈显著正相关,尤以普通增益(G3)和缺失(G6)增强子的表达最为显著。2A)。在增强子改变较多的组中,G3中上调基因的数目和G6中下调的基因数目明显多于其他各组(图1)。2B)。与增益增强子(G1~3)相关的基因在EC或LNC中的表达水平一般较高,而与丢失促进剂(G4-6)相关的基因在癌组织中的表达水平低于正常上皮(图1)。2C)。对于可检测到表达水平的差异增强子连锁基因,较高比例的DEGS的表达遵循H3K27ac的变化模式,特别是在G3中。n=413;78.8%)和G6(n(442;70.8%)组,虽然某些基因的表达与其附近的H3K27ac标记的模式不一致(附图)。8a,b和补充数据6)。此外,DEGS的总数量大于修饰增强子连接DEGS的数目(补充图)。8C和补充数据7),可能是因为DESeq 2用于DEG分析(n18)不考虑患者配对和≥阈值6/10用于鉴别增强子(补充图)。3)。这些结果表明,增强子的获取和丢失是原发性和转移性ESCC的可靠和稳定的特征,甚至比异常基因的表达更具有特异性和预见性(附图)。8C)35.

图2:得失促进剂对异常基因表达有促进作用。
figure2

a标准化H3K27ac峰富集在(上面板)和表达(下面板)的差异增强子(G1-G6)相关基因在NOR。n=10),欧共体(n=10),以及LNC(n=8)样本。这个P根据kruskal-Wallis秩和检验,所有比较的数值均<0.001.方框对应于四分位数范围(IQR),粗黑线表示中值,晶须延伸到最低或最高数据点,仍在底部或顶部四分位数的0.5 IQR范围内。b与差异增强剂(G1-G6)相关的上调和下调基因数目(EC与NOR或LNCvs.NOR)。c差异增强子(G1-G6)相关基因表达呈折叠变化(EC/NOR或LNC/NOR)。P计算值采用双面Wilcoxon检验(无调整)。d所有差异增强子相关基因(EC/NOR、LNC/NOR或LNC/EC)的表达折叠变化(EC对NOR、LNC对NOR、LNC对EC)来自NOR(n=10),欧共体(n=10),以及LNC(n=8)样本。P计算值采用双面Wilcoxon检验(无调整)。*P < 10e-10, **P < 10e-20, ***P < 10e-30. e提出了与所指示的增益(红色)和丢失增强子(灰色)数目相关的基因的表达折叠变化。P计算值采用双面Wilcoxon检验(无调整)。上面板:*P < 10e-8, **P < 10e-14, ***P < 10e-18. Lower panel: *P < 10e-3, **P < 10e-10, ***P < 10e-20. c–e, Data points represent means of Nor (n=10),欧共体(n=10),以及LNC(n=8)样本。方框对应于四分位数范围(IQR),粗黑线表示中值,晶须延伸到最低或最高数据点,而数据点仍在下四分位数的1.5 IQR以内。源数据作为源数据文件提供。

当考虑三个群体的差异时,我们发现在三组比较中,增益增强子的基因表达显著上调,与未改变增强子的对照基因相比,失活增强子相关基因的表达明显下调(图一)。二维空间),通过增强子的改变进一步验证基因调控失调的作用。此外,虽然单个改变的增强子足以诱导异常基因的表达,但增加的增强子数量与基因激活呈正相关,而丢失的增强子数量的增加与基因抑制呈数量上的负相关(图一)。2E)。这进一步证明了增强子的改变和重新编程有助于原发性和转移性肿瘤的异常转录程序。为了鉴定EC和LNC的生物标志物,我们选择g1-、g2-、g3-和g6-相关基因作为输入,并分析了它们的平均表达水平与h3k27ac信号的相关性。EHD 3, ANO 1,和EN1);例如,H3K27ac在EHD 3增强子与其表达密切相关(r=0.86,Spearman相关)(补充图。9a,b和补充数据8)。前100位基因按FCS的表达进行排序,前10位或15位基因被划分为G1亚组(P<0.0 5)。FAM19A5, LAMC 2, SNAI 2, PMEPA 1,G2(Tcf7, KLHL6, SCIMP, CXCR 4,g3(FCGR2A, HOXD 11, ZNF 469, CLDN 3,以及g6(例如TFAP2B, “仲裁示范法”, EMP 1, EHD 3等等)具有区域特异性增强子和转录本浓缩(补充图。9C,d和补充数据9)。这四组基因的组合被定义为NOR(G1)的生物标志物。G2G3G6+),欧共体(G1)+G2G3+G6)和LNC(G1)G2+G3+G6)组织(附图。9E).

基因本体论(GO)和京都基因和基因组百科全书(KEGG)通路分析表明,EC和LNC中的增益增强子在细胞增殖、运动和迁移等基本的癌症过程中富集,并与蛋白多糖、趋化因子信号、转录失调、RAPI信号传导和其他癌症途径有关(补充图)。10a,b)。重要的是,符合PCA的结果(补充图)。6LNC中获得的增强子与T细胞受体信号有关的细胞迁移和免疫系统过程有关,这可能是由来自淋巴结的最小免疫细胞的混合所引起的(补充图1)。10a,b)。然而,我们也观察到,与EC样品相比,LNC样品中所获得的增强子在细胞粘附、细胞迁移和其他转移特性中富集,并激活了与肿瘤相关的通路(补充图)。10C,d)。有趣的是,一些特定的癌症特征,包括PI3K-AKT信号,HIF1信号,和河马信号。36,以EC特有的特征出现,但在LNC样品中减少了(补充图)。10d)。有趣的是,我们发现一些基因与附近的活性增强子没有转录激活在特定的状态。已经有人提出,在细胞处理前,表观遗传模式和增强子信息可以被建立并嵌入增强子元件中。37。因此,我们选择了附近的增强子被预先激活的基因(例如SORL 1, BCL 2, KLHL6,和CLDN 3)或沉默前(如MAPK 6, ETS 2, Lcn 2,和LGALSL)在EC样本转录改变之前,并认为这些增强子或其相关基因可能是启动肿瘤转移相关过程的启动因子(附图)。11和补充数据10)。总之,我们认为增强子重新编程在食管癌的发生和转移中会产生异常的基因表达。

原发性和淋巴结肿瘤的超增强子特征及异质性

在食管或LNC(补充图)中,SE的比例比典型的增强剂高得多。5A6g)。然而,活性的典型增强子在同一组患者中相对一致,并且比在多个癌细胞株中更稳定。23≥5/10或5/8患者的估计复发率为6~16%(图5/10或5/8)。3A),显示原发性和淋巴结肿瘤中SE的异质性。

图3:原发性和淋巴结肿瘤的超增强子信号。

a预测典型增强子和超增强子(SE)在NOR中的百分比(英文)n=10),欧共体(n=10),以及LNC(n(8)在越来越多的患者中,H3K27ac的富集率高于随机选择的区域(99%)。b基因本体(GO)分析前2000预测典型增强子连锁基因和SE相关基因;顶端显着相关的生物过程被提出。ce根据Ec与NOR、LNC、NOR、LNC和EC样品之间H3K27ac强度的差异,对1317个超增强子进行了排序。与最高得失SE相关的基因列出;癌基因以红色高亮显示,抑癌基因以蓝色突出显示。f, gH3K27ac富集信号的变化f)和差异SE相关基因的表达水平(g)(EC/NOR、LNC/NOR或LNC/EC)和差异SE(得失)相关基因(EC对NOR、LNC对NOR、LNC对EC)。以未改变的SE相关基因作为对照。数据点表示NOR(n=10),欧共体(n=10),以及LNC(n=8)样本。方框对应于四分位数范围(IQR),粗黑线表示中值,晶须延伸到最低或最高数据点,而数据点仍在下四分位数的1.5 IQR以内。P计算值采用双面Wilcoxon检验(无调整)。*P < 10e-10, **P < 10e-20, ***P < 10e-30. h癌症特征分析采用差异预测SE,显示EC或LNC中的H3K27ac信号相对于NOR有反复恢复、反复丢失和未改变的H3K27ac信号。原木(调整)P给出了超几何检验的结果。i, j生存分析:高表达组和低表达组中最常见的丢失组(i)或获得(j)用Kaplan-Meier绘图仪分析ESCC TCGA数据中SE相关基因。食管癌患者的预后较差,肿瘤患者的SE相关基因高表达,SE相关基因缺失表达低。每20个月提供一次生存数据。对生存数据进行对数秩检验。源数据作为源数据文件提供。

GO分析结果表明,EC和LNC基因在代谢过程、信号转导、对细胞因子的反应、细胞增殖、细胞迁移和细胞迁移等方面均有丰富的基因,其富集程度高于前2 0 0 0个典型增强子中H3K2 7ac信号最强的Go条件。3B)。由于绝大多数se是在ecc或lnc样本中反复获取或丢失的,因此我们建议与我们先前的研究相一致。11增强子重新编程(尤其是SE)可能主要介导细胞对细胞因子如转化生长因子β信号的反应,从而促进肿瘤的发生和转移。

使用以前报告的战略23,26绘制获得或丢失SE的地图(附图)。6g),我们确定了一些顶级改变促进剂的可能靶点(补充数据)11),包括一些与细胞激活、通讯、粘附和运动有关的SE连锁癌基因(如CCND 1, GNAS, FGF3, HOXA 10,和CEBPB),以及许多丢失的SE连锁基因(例如EHF, TFAP2B, NFIX, “仲裁示范法”,和Meis 1)参与上皮的发育、形态发生和发育过程。3C,d和补充图。12A)。有趣的是,丢失SES的靶点与RCC中报道的高度重叠,这些基因在肿瘤组织中的表达水平较低,而在正常组织中的表达水平较高。3C,d)26,表明上皮特征缺失的保守机制。此外,相对于EC,LNC获得的SE主要集中在免疫系统和致癌特征(附图)。12b),如以下所示:FOXA 1, CXCR 4, SOX 2, CCND 2,等(图)3E)。与与增强子改变相关的转录变化趋势相比较(见图)。二维空间得失的SE相关基因随FCS基因的上调或下调而解除调控(图一)。3F,g)。接下来我们进行癌症特征分析。9进一步探讨预测SE异质性的生物学意义和得失状态。与GO分析结果一致(附图)。12A,b)体细胞获得的SES在与血管生成、侵袭和逃避生长抑制因子相关的基因中富集,这种富集比体细胞丢失和未改变的类别更为显著(图1)。3H)。这些数据表明,在EC和LNC中获得的体细胞SE可以用来预测ESCC和LNC的进展和侵袭性,并强调ES在癌变中的重要性。

临床标本分析中SE的异质性和方差(附图)12C)可能会导致某些顶级差异SE显示出较大的绝对差值,但fc值较小。因此,我们建立了另一条管道,对每一个阈值为≥5/10或5/8的患者(在单个样本中识别并在≥3中递归识别的SE在补充数据中列出),考虑样本配对,对差异预测SE进行排序。12和补充图。12D)。各组获得的SES的得失数略大于平均信号的计算值,且有很大比例的重叠改变SES(附图)。12E)。为了避免缺少必要的SE,我们结合了通过这两种策略识别的差异SE,并根据它们的FC(补充图)对这些SE进行了排序。12F和补充数据12)。Fc最高的SES(增益fc>2,损失fc<0.7;由于损失较少)与绝对值最高的SES(增益>2,损失<−2)重叠,识别出数十个高置信度改变的SE(附图)。12F)。如附图所示。13A14(补充数据)13H3K27ac信号的增益或丢失分别与附近基因的上调或下调模式呈正相关,与许多具有代表性的基因呈正相关(如FGF 3,ANO 1, HOXA 9,和CCND 1)或丢失(如NFIX, TFAP2B,和HOXA 3)SE与图中所示的结果重叠。3C-E。这些在EC或LNC中获得的SE连锁基因也与肿瘤的侵袭和炎症过程有关(附图)。13B)。综合起来,我们找出了四组与这些差异相关的基因(n=456)(补充数据14),其中大多数是在EC和lnc中获得或丢失的,还有一小部分具有lnc特异性的SES的基因(例如Meis 1CXCR 4)(附图。13C14),与改变的典型增强子连锁基因一致(补充图。8B).

为了探讨预测的SE靶基因在其他癌症中的潜在作用,我们分析了SE连锁基因的表达差异(补充图)。13C)在原发性和转移性胰腺癌(PDA)和大肠癌(CA)数据集中,来自肿瘤基因组图谱(TCGA)。令人惊讶的是,我们在PDA和CA中分别发现了78个和212个DEGS,它们分别表现出共同的增益/丢失或转移特异性的增益/丢失模式,其中常见的上调(增益)和下调(丢失)基因占DEGS的大多数(附图)。15a,b和补充数据15)。ESCC、PDA和CA检测的DEGS重叠,表明这三种肿瘤中有许多DEGS是一致的,尤其是在ESCC和CA之间有共同得失的组中。15C);12个基因,包括ANO 1, CTTN, PYGB, SOX 4, SOX 9, PMEPA 1等,在所有三种类型的癌症中普遍被上调(补充图)。15D和补充数据16),一种可能由SE激活所介导的效应。我们还鉴定了六个基因(KHDRBS 2, IQSEC 1, ARHGEF 1, ARID5A, IRX 5,和TMC 6)在三种癌症类型中的两种转移癌中被激活(补充图)。15D),可能与转移特征有关。为了阐明SES改变与ESCC患者生存之间的临床关系,我们通过Kaplan-MeierPlotter和TCGA数据,确定了与其靶基因表达高度相关的SE连锁差异基因,并通过Kaplan-MeierPlotter进行了生存分析。较高的表达共同丢失的SE相关基因预测更高的概率病人的生存(图一)。3I在EC、PDA和CA患者中,共同获得的SE相关基因的高表达预示着较低的存活概率(如图所示)。3J和补充图。15E-g)。这表明在ESCC癌变过程中,癌相关的SE与临床事件密切相关。

ESCC和LNC的转录因子回路

细胞类型或状态特异性转录调控的核心回路通常由几个关键的tfs控制,以建立上下文依赖关系。38。为了确定促进ESCC肿瘤发生和转移的主要因子,我们预测反式-与普通增益或LNC特异性增益增强剂相关的作用因素39。许多必需的TFs的结合基序,如RXRA、NFE2L2、ESRRA、IRF 2、RERA、ESRRA、SOX 2和Smad 2/3(图1)。4A,b),介导转化生长因子β信号在上皮间充质转换和肿瘤转移中的关键作用。11,40,在普通增益或LNC特异性增益增强子中富集,并有一些重叠的TFs。核心调节电路分析25,41进一步表明,由增益增强子预测的许多tfs,包括smad 3、rxra、irf 2、ets 1等,都显示在与其他预测tfs交互的顶级排序tfs中(补充数据)。17);FOSL 2、SOX 2和RXRA的鉴定(图1)。4C),以前在室管膜瘤中也有发现。25,支持我们的数据和策略的可靠性。值得注意的是,与正常食管上皮组相比,在EC和/或LNC组中,大多数顶级富TFs高表达(图1)。4D和补充数据18)。这个反式-通常失去的促进剂(如Tbx 21、NFIA、Meis 1和ELF 3)所预测的作用因素参与了上皮的发育(补充图1)。16A一些LNC特异性缺失增强子的功能预测在LNC(补充图)中仍然很不清楚。16b)。有趣的是,许多通常丢失的促进剂预测的TFs与普通增益或LNC特异性增益增强剂预测的TFs呈负相关(补充图)。16C和补充数据19),表明这些TFs在正常组织和癌症组织中的独特作用。

图4:食管癌发生和转移的转录因子回路。

a, b从普通获得的顶端转录因子(TF)结合基序预测a)或特定于LNC的收益(b)增强剂使用荷马。预测的TFs按其P给出了双侧二项分布检验的数值,并给出了受这些因子有效调节的目标比例.c使用核心电路分析,根据预测的活动对TFs的热图进行排序。提出了具有高TF连接性的代表性基因。d热图显示NOR、EC和LNC组中常见增益增强子或LNC特异性增益增强子预测TFs的表达。中所示的TFSa, b用红色高亮显示。e利用shRNAs评价基因敲除效率。为每个TF构建两个shRNAs,并对表达TE1细胞的shRNA进行实时定量PCR分析。表达对照shRNA的对照组细胞中各TF的表达均为“1”。控制中心。n=2项独立于生物的实验。f本实验用细胞计数法对表达TE1细胞的对照或shRNA进行计数,并复制对照细胞(Ctrl和Ctrl 2)。三个井的细胞数平均为每个样本的一个重复,并从三个重复中得到结果。绘制了归一化细胞数的时程曲线。数据以平均值±S.D表示。n=3项独立于生物的实验。g用对照组和表达TE1细胞的shRNA进行创面愈合试验,计算各组创面愈合率。伤口愈合率按附图所示计算。17B。数据以平均值±S.D表示。n=3项独立于生物的实验。统计数字:*P < 0.05, **P < 0.01, ***P < 0.001, unpaired t-测试。源数据作为源数据文件提供。

用两个独立的短发夹RNA(ShRNAs)对每个靶标进行了研究,有效地降低了相应的tff(rxra、nfe 2l2、zff 519、esrra、rela、tcf 4、sox 2、ets1、sox 12、nfatc2、irf 2和zEB1),从而研究了修饰增强子预测的顶级tfs的功能作用。ETS 1ShRNA 1和ZNF 519 shRNA 2)(图2)。4E)。然后,我们对TE1食管癌细胞的生长进行了评估,这些细胞表达的是针对这12个tfs的对照shRNA或shRNAs,这表明IRF 2, RXRA, 雷拉, SOX 12,和NFATC 2导致细胞增殖显著下降,ETS 1(使用shRNA 2),ZEB 1, TCF 3,和NFE2L2导致细胞生长略有下降(图一)。4F和补充图。17A)。伤口愈合试验进一步证明NFE2L2, ESRRA, TCF 4, SOX 2, ETS 1(使用shRNA 2)、SOX 12(弱但显着)和IRF 2导致细胞迁移受损(如图所示)。4G和补充图。17B)。与这些细胞表型一致的是,一些关键的TFs被击倒,例如IRF 2,雷拉,RXRA,和NFE2L2,诱导细胞周期抑制物的上调P21以及癌基因的下调C-Myc和EMT诱导剂Snai 1FN1(补充图。17C).

此外,肿瘤细胞系中8个TFs的结合位点(数据可从ENCODE获得;数据源在补充数据中提供)20)与预测的增强剂(补充图)有很大的重叠。18A);数十至数百种常见或lnc特异性的增强剂与重要的致癌或转移相关基因相关,例如ZXDC, CTNNB 1, CXCR 5, CCND 2, STAT 3,和Snai 1,受IRF 2、RXRA、rela或ZEB 1约束(附图1)。18B和补充数据20)。因此,我们建议这些TFs介导增强子的增益过程。总之,我们成功地确定了几个调控ESCC癌变和转移的重要TFs。反式-由增益促进剂制成的TFs。

已获得的SE图谱鉴定抗ESCC癌变和转移的候选药物

为了筛选用于ESCC和淋巴结转移的候选药物,我们与华盛顿大学药物基因相互作用数据库对我们的肿瘤特异性SE连锁基因进行了综合分析。42对69个常见的SE连锁基因和43个LNC特异性的SE连锁基因进行了重复分类,分别分为21类和18类,包括可药基因组、激酶、临床可操作性、细胞表面、TF结合等。5A,b和补充数据21)。在49个和25个可供选择的基因组目标中,我们的分析显示236种药物与与一般获得的SE相关的36个可药基因相互作用,170种药物与18个与LNC特异的SES相关的可药基因相互作用(补充图)。19A和补充数据21)。由于许多基因可被多种药物靶向,我们根据与药物相互作用的数量对这些基因进行排序,并从常用的化学抑制剂中筛选出最具相互作用的前八位可药靶点(HSP 90AA1、CCND 1、ANO 1和CCR 3;以及LNC特异的SES中的BCL 2、PDE4B、ROCK 1和CXCR 4),这些基因被确定为对小分子抑制剂有反应的候选基因,用于随后的功能研究(附图)。19b)。除ROCK 1和CXCR 4抑制剂外,六种抑制剂,特别是HSP 90AA1和PDE4B抑制剂,均以剂量依赖性的方式显著抑制TE1细胞的生长,这两种抑制剂对细胞增殖具有协同作用(图一)。5C和补充图。19C,d)。此外,HSP 90 AA1或PDE4B抑制剂或双重抑制剂均能诱导细胞凋亡(补充图)。19E,f)。值得注意的是,抑制细胞增殖的作用(附图)。20A-d)和促凋亡效应(补充图。20E,fHSP90AA1和PDE4B抑制剂在另两个ESCC细胞系(KYSE 30和KYSE 150)中得到了很好的验证。因此,我们证明,抑制HSP 90AA1或PDE4B活性可明显抑制细胞增殖,诱导细胞凋亡。

图5:活性调节超促进剂预测抗食管癌发生和转移的候选药物。

a, b饼图显示通过综合分析共同获得的候选药物化合物(a)和LNC-具体(b)华盛顿大学药物基因相互作用数据库的超级促进剂。三个类别以红色突出显示。c用8种化学抑制剂分别或联合(AH+ML-030)处理TE1细胞。细胞计数于72h,数据以平均值±S.D表示。n=3项独立于生物的实验。d创面愈合实验检测对照和表达TE1细胞的shRNA。每2 4h检查一次创面宽度,0 h处创面宽度归一化为“1”,计算0 h相对宽度。数据以平均值±S.D表示。n=3项独立于生物的实验。eg异种移植瘤生长分析。用AH或ML-030免疫缺陷裸鼠注射TE1细胞,测定肿瘤体积。e)。这些肿瘤在第21天从牺牲的小鼠身上采集,用于图像采集(f)和肿瘤重量测定(g)。对于来自五个重复序列的集合数据,值表示平均值±S.D。来自n=2个独立实验。e喷泉-温室校正的双向方差分析**P < 0.01. g未配对t-试验(二尾),**P < 0.01. h表达HSP 90AA1在NOR,EC和LNC样本中我们的RNA-seq数据.数据以平均值±S.D表示。n=18 for NOR和EC;n=14为LNC。*P < 0.05, ****P < 0.0001, unpaired T-试验(二尾)i两组患者的2年生存率(n=9每一组)拥有高或低HSP 90AA1在本研究的临床资料中所确定的表达。n=3/9(33.33%)HSP 90 AA1-高和n=6/9(66.67%)HSP 90 AA1-低的患者,表现为单一的2年生存率,存活到2020年9月.j比较高、中、高两组食管鳞癌患者的无病生存率(DFS)。n=73)或低(n=73)HSP 90AA1用GEPIA表达。源数据作为源数据文件提供。对生存数据进行对数秩检验。

为了评价这些获得的SE连锁靶点在肿瘤转移中的作用,我们对这些抑制剂进行了伤口愈合试验,发现几乎所有这些抑制剂都表现出强烈的抑制作用(HSP 90AA1、PDE4B和BCL 2)或对细胞迁移的抑制作用(ANO 1、CCR 3、CCND 1和CXCR 4)。5D和补充图。19g)。此外,对免疫缺陷的食管癌异种移植小鼠(TE1细胞),用盐酸阿夫斯皮霉素(AH,一种HSP 90 AA1抑制剂)或ML-030(一种PDE4B抑制剂)对肿瘤生长有明显的抑制作用(图一)。5E-g)。巧合的是,HSP 90AA1PDE4B在EC组和LNC组中,EC组和LNC组与正常对照组相比,其附近的SE更显着地富集(图1)。5H和补充图。21a,b),验证它们作为临床上可实现的抗肿瘤靶点的潜力。考虑到高表达HSP 90AA1相对于PDE4B在EC和LNC样本中,我们将HSP 90AA1作为潜在的临床诊断和治疗目标。本研究将18例EC患者分为高、低两组。HSP 90AA1在EC样本中的表达(附图)。21C)并发现HSP 90AA1-低病人(66.7%)n=6/9)比HSP 90AA1-高病人(33.3%)n=3/9)(如图所示)。5I)。虽然存活曲线没有显着性差异,但HSP 90AA1-在我们对有限数量患者的分析中,低组表现出更好的生存趋势(补充图)。21D)。为了支持我们的假设,我们在tcga数据库中分析了多种类型癌症患者的生存概率,结果表明这较低。HSP 90AA1在ESCC,EAC,头颈部鳞状细胞癌和肝癌中,表达预测了更好的生存和预后。5J和补充图。21E-g)。考虑到PDE4B的特异性增益,我们检测了PDE4B抑制肿瘤转移的效果。如我们所料,在肌内注射模型中,ML-030治疗明显降低了KYSE 150细胞源性原发肿瘤的转移,以模拟原发性EC(补充图)。21h)。这些数据表明SE景观可以指导治疗靶点,如HSP 90AA1和PDE4B,以对抗ESCC的癌变和转移。考虑到这些获得的SE可能是由关键的TFs介导的(如图所示)。3),我们分析了具有代表性的染色质结构。ANO 1, HSP 90AA1,和PMEPA 1基因,表明增强子的得失主要发生在相同的拓扑关联域(TADS)中,这些基因根据一组hi-C数据对胎儿肺成纤维细胞(Imr 90)进行了分析。11,与一些预测的TFs结合位点(补充图)。22A)。因此,我们研究了三个可能的目标的表达。ANO 1, HSP 90AA1,和PMEPA 1)在TF耗尽时,表明某些关键TFs的击倒(这可能是SE增益的中间部分)导致了对SEF的下调。ANO 1, HSP 90AA1,或PMEPA 1表达式(附图)22b)。总之,我们的结果确定了原发性和转移性肿瘤特异性增强剂和SE及其驱动的TFs,揭示了调控癌基因转录程序的分子基础,并为发现与ESCC癌变和转移有关的治疗靶点提供了一种策略。

讨论

食管癌是一种死亡率高、预后差、淋巴结转移频繁的严重疾病,其生存率与其转移和复发呈负相关。除了外科手术和化疗外,很少有针对生物分子的化学药物获得临床批准。1,2,3,4。因此,对于这类临床异质性疾病,了解其表观基因组解除管制特征已成为一项关键的战略,以确定这种临床异质性疾病的生物标志物、脆弱性和治疗目标。23。通过分析组蛋白H3K27ac在配对正常、原发和淋巴结肿瘤对中的修饰,我们生成了ESCC启动子和增强子改变的综合简编。

我们的研究描述了超越基因组改变的原发性和转移性ESCC肿瘤的综合表观遗传学特征。17为研究肿瘤转移提供了有价值的表观基因组信息资源。类似于最近关于ESCC中DNA甲基化改变的报道43,我们工作的意义在一定程度上受到有限样本的限制;更多的患者可能有助于解剖更多的临床和治疗亮点,如临床分组和个性化治疗,如前面在EAC中所报告的那样。44。其次,我们发现LNC的表观和转录图谱与原发肿瘤非常相似,具有一些LNC特异性特征。提示靶向HSP 90AA1等原发性和转移性肿瘤中常见的增强子相关致癌靶点是ESCC治疗的一种潜在策略。此外,阻断LNC特异性增强子相关基因可能会特异性地抑制癌细胞转移.这表明,表观基因组图谱可能比转录差异更稳定。35,能够分析相似肿瘤实体之间的分子差异。第三,我们证明了变异增强子和超增强子重新编程有助于转录重构,这一点在核心转录调控回路的反向工程中得到了进一步的强调(如图1所示)。4)。最后,利用药物相互作用数据库对人体获得的SES进行综合分析,使我们能够识别和验证对药物或抑制剂有反应的强大的主调节剂和癌症依赖物(图1)。5),突出增强剂前景的可靠性,为从药物数据库获得的精确治疗提供信息。

近年来,关于启动子改变的表观基因组研究24,45远端增强子动力学显示了表观基因组元素在控制人类疾病和癌症细胞状态中的重要作用。8,9,23,25,26,46,这促使我们研究食管癌发生和转移的一致的表观基因组特征。由于从供体获得适当数量的高纯度细胞进行芯片-seq分析的局限性,我们只绘制了H3K27ac剖面图(图1)。1),类似于最近一份关于室管膜瘤的报告中使用的方法;25然而,虽然增强子特异性组蛋白h3赖氨酸4单甲基化(H3k4me1)谱将有助于准确分离启动子区域的活性启动子和增强子丰富的h3k27ac信号。26。因此,我们主要研究的是启动子区域以外的远端增强子,它们在增强子连接中占大多数。顺式-监管要素47。仅用H3K27ac识别启动子是不准确的,因此我们将TSS±2kb区域定义为活性启动子元件(包括启动子和几个近端增强子),而不是活性启动子。考虑到增强子标记的h3k27ac和h3k4me3(三甲基化)在tsss附近的占用率,我们鉴定的活性启动子元件的数量与另一项工作中报道的tss±2kb区域内的h3k27ac+/h3k4me3+定义的活性启动子的数目相当。26,表明活性启动子元件与活性启动子的相似性。

虽然有大量最近的放松管制的基因与改变增强子元素有关(见图)。2),仍有数百例与最近的H3K27ac改变不成正相关(补充图)。8)。如前所述,大约一半的预测增强子/基因或SE/基因相互作用直接调节最近的近端基因。23,48。为了建立一个完善的远侧相互作用模型,能够识别tad内的增强子和配对的目标基因,生成ESCc特异性hi-c数据将有意义;或者,将改变的增强子或se与来自交互数据集(如prestIGe 30、great 31和rnapi chia-pt)的数据集成是另一个可行的策略。23准确定位功能性远端促进剂。此外,我们还鉴定了一组基因,在H3K27ac改变后有延迟表达的改变(补充图)。11),表明这些增强子可能是其靶区转录调控的主要启动子。这种可能性也可能是基因表达与附近H3K27ac改变不一致的部分原因。有趣的是,有人提出相邻的“正常”组织可能含有累积的普遍的基因组改变。49,50,51,52。研究表观基因组改变与相邻正常组织基因组突变之间的联系将是非常有意义的。

与匹配的非恶性食管组织相比,EC和LNC组织中反复预测的SE在已知的癌基因(如CCND 1, CEBPB,和RXRA25,26,以及基本的致癌促进剂。我们还观察到不同患者之间的SE变异范围很广,异质性明显超过典型增强剂(图1)。3)。尽管已经有人提出超过60%的se是组织型或癌症型特异性的。23,差异最大的SE相关基因与其他类型的癌症非常相似。20,23,25,26,强调这些最重要的取得在致癌过程中的重要性(如图所示)。3B)。我们试图将绝对差异和FC数据结合起来,成功地检查高度可靠、最易修改的SE(补充图)。12, 13),这可能是一种值得其他研究推荐的策略。ESCC和LNC之间的增益和丢失增强子/SE的高度重叠(图1)。13)验证原发性ESCC转移性LNC细胞的来源,并提出原发性和转移性肿瘤表观基因组特征的相对一致性,以及与其他类型癌症的分子一致性(附图)。15).

同时,我们恢复了一系列潜在的肿瘤抑制因子(EHF,MAL,TFAP2B)。26这与失去的促进剂有关,只能在正常组织中才能发现(如图所示)。3C-E)。我们还鉴定了一系列LNC特异性增强剂和SE;但是,我们不能排除少数几个增强剂获得特异性增益的可能性很小,只有极少数的免疫细胞能反映出来。事实上,在与癌基因相关的LNC组织中,许多与癌基因相关的增强子也在EC中相对于正常组织获得了增强子(附图)。13)。常见的增益/丢失促进剂可能比LNC特异性的改变促进剂更可靠。为支持这一概念,(见图)。3i,j)我们的生存分析表明,体细胞获得的ES有助于异常基因的表达,并能预测不良的临床预后。

我们的表观遗传学景观包含了一个诱人的潜在靶点,可以促进ESCC肿瘤的发生和转移。我们表演反式-利用增益促进剂进行元素预测(图1)。4)并与药物相互作用数据库集成,以预测对抑制剂有反应的潜在靶点(如图所示)。5)。通过阐明RXRA、NFE2L2、IRF 2、rela等几种核心转录调控通路参与了细胞的生长和迁移(图1)。4F,g),其中一些在室管膜瘤和肾癌中也有促进肿瘤的作用。25,26。澄清这些信托基金在建立癌症特异性增强子档案中的潜在作用将是非常重要的。根据这一假设,在从增益增强子预测的tf电路中,sox 2曾被确认为控制ESCc细胞表观遗传和转录模式的核心调控回路的一个因子。53.

我们值得注意的发现是确认HSP 90AA1和PDE4B为有效的治疗靶点,这两种药物都曾被认为是ESCC潜在的生物标志物。54,55,56,进一步支持我们的发现。重要的是,这两个分子的药物抑制明显抑制细胞的增殖、迁移和异种移植瘤的生长。5)。PDE4B是一种与心力衰竭和结肠癌有关的保护性环磷酸二酯酶。57,58。虽然PDE4B与ESCC的临床相关性不如HSP 90AA1和ESCC强,但PDE4B抑制剂具有很强的抗肿瘤作用。因此,PDE4B在肿瘤发生中的作用机制还有待于进一步阐明。HSP 90AA1是一种对目标蛋白稳定性至关重要的热休克蛋白,对自噬和耐药非常重要。59,60。在这里,我们验证了它与肿瘤进展和癌症死亡率的正相关,并强调了它在ESCC癌变和转移中的作用。

总之,我们证明增强子和SE解除管制的主要原因是在癌变和转移过程中转录重编程,LNC增强子的特征与原代ESCC非常相似,但具有转移特异性特征。通过反式-元素分析从一组改变的促进剂,我们成功地确定IRF 2,rela,NFATC 2等,作为参与肿瘤细胞生长和迁移的必要的TFs,可能通过建立致癌增强子程序。硒连接的HSP 90AA1和PDE4B是食管癌发生的关键基因和潜在治疗靶点。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297