您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2021
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

用多体谱法确定三阴性乳腺癌的超增强子视野

 二维码
发表时间:2021-04-19 09:49作者:武汉新启迪Xinqidibio

摘要

乳腺癌是一种异质性疾病,影响着全世界350万以上的妇女,但顺式调节因子(包括超促进剂)在不同乳腺癌亚型中的功能作用尚不明确。三阴性乳腺癌(TNBC)是一种具有侵袭性的乳腺癌亚型,预后较差.在这里,我们应用整合的表观基因组和转录谱来揭示乳腺癌亚型之间的超增强子异质性,并为TNBC提供临床相关的生物学见解。通过CRISPR/Cas9介导的基因编辑,我们鉴定了由TNBC特异性超促进剂(包括FOXC 1和MET)调控的基因,从而揭示了TNBC中关键癌基因的特异性过度表达机制。我们还确认ANLN是由超增强子调控的TNBC特异性基因.我们的研究揭示了TNBC特有的表观基因组,导致乳腺肿瘤发生过程中癌基因表达失调。

导言

乳腺癌是全世界最常见的癌症,也是导致女性癌症死亡的主要原因。1。基于基因表达谱的分子研究揭示了不同的乳腺癌亚型:腔型、HER 2+/ER−和基底样。大多数基底样肿瘤(~70%)为三阴性(ER-/PR-/HER 2-)。2,3。化疗通常具有高毒性,是三阴性乳腺癌(TNBC)的主要治疗方案,因此临床需要为这种侵袭性亚型确定新的治疗靶点。与乳腺癌不同亚型(包括PTEN、PIK3CA、HER 2、BRCA和TP 53)相关的关键基因组改变已被全面地描述。然而,由于TNBC缺乏常见的基因改变,限制了针对这种恶性肿瘤的靶向治疗的发展。另一方面,解除对不同亚型乳腺癌表观基因组的管制导致不同表型结果的知识仍然缺乏了解。

转录组重编程是肿瘤的重要特征之一,其异常癌基因或抑癌基因的表达与肿瘤的发生、发展和转移有关。这可能是由于基因的变化,如拷贝数,染色体重排,和体细胞突变的蛋白质编码基因。基因表达的改变也可能是由转录因子(Tfs)或其他调节因子所结合的非编码基因组区中顺式元件的变化引起的。4,5。这些表观标记的改变在包括癌症在内的不同疾病的发展中起着重要作用。例如,带有修饰组蛋白标记的隐匿性启动子被鉴定为胃恶性肿瘤的驱动因素。6.

增强子是基因组中的非编码区,携带顺式调节元件,促进靶基因的转录。它们的特征是组蛋白修饰,如组蛋白H3在赖氨酸27(H3K27ac)上的乙酰化和辅助性激活剂(如p 300)的结合。7。超增强子(Se)是一大群增强子,它们驱动特定的表达程序来定义细胞的身份。8。它们与不同的疾病状态有关,例如2型糖尿病患者胰岛细胞中增强子团的富集。9。最近的研究表明,SE在促进癌症驱动基因的表达方面也起着关键作用。10,11。例如,在多个上皮性癌中,能够驱动MYC表达的se的焦点扩增已经被发现。7。在胃癌中,在肿瘤发生、TF占位和疾病结局过程中观察到SE的重新编程和异质性。12。近年来,CD 47和ERG在乳腺癌和前列腺癌中分别被认为是上调的。13,14。此外,在神经母细胞瘤中,Prrx 1的表达改变了SE和mRNA的表达,使其向间充质状态转变。15。表观基因组图谱已用于多种实体肿瘤,包括髓母细胞瘤。16结肠癌17,用于鉴别子群特异性SE。然而,目前还没有公布乳腺癌不同亚型SE的综合目录及其在肿瘤发生中的重要作用。

在本研究中,我们旨在描述乳腺癌的SE景观。为了分析SES在TNBC和非TNBC亚型中的异质性,我们进行了整合转录和表观基因组分析,并提供证据证明SES在描述亚型特异性特征中起着重要作用。我们还鉴定了TNBC特异性SES的相应靶向基因,包括FOXC 1、MET和ANLN.本文测定了TF FOXC 1在乳腺癌生长中的关键作用及其临床意义。18,19。通常情况下,FOXC 1的过度表达会导致肿瘤的生长和迁移。然而,很少有研究涉及FOXC 1的调控网络。在此,我们的网络生物学分析将FOXC 1定义为调控侵袭转移标志基因表达的主要节点。通过CRISPR/Cas9基因组编辑,我们删除了FOXC 1相关的SE,发现FOXC 1的表达明显减少,球体和克隆生长受损,与其致癌性质一致。此外,我们还发现ANLN是由SE调控的TNBC特异性基因,与TNBC的致瘤性有关。综上所述,我们的多体分析揭示了乳腺癌亚型特异性SE的调控机制,并描述了SE在TNBC特异性致癌信号中的关键作用。

结果

乳腺癌细胞远端超强化剂的研究进展

摘要通过高通量顺式调节元件定位,表观基因组异常(包括SE异质性)在多种肿瘤类型的发病机制中发挥着重要作用。12,16。在乳腺癌中,增强子转录可以提高功能增强子识别的保真度。20。然而,缺乏对乳腺癌亚型依赖性异质性的认识。在此,我们收集了17种公共乳腺癌细胞系和2种三阴性(TN)永生化乳腺癌细胞系的芯片-seq数据(补充表)。1),基因组-广泛识别和描绘不同亚型乳腺癌的SES景观。

我们根据h3k27ac芯片-seq信号识别的染色质谱注释了全基因组的顺式调节元件,先前显示为标记活性增强子和其他调控区域。21。我们关注的是富含H3K27ac信号并远离基因转录起始点(tsss上/下游2.5kb的tsss)的区域,之前的研究证明这些区域是增强子区域。12。其次,通过拟合促渗剂的大小分布和用黄土回归法识别19条乳腺材料的拐点(斜率1),从预测的主动促进剂中识别SE(图1)。1A,补充表2)。对于预测的SE和典型的增强子,观察到H3K27ac和H3K4me1信号(增强子区的活性标记)和较低的H3K4me3信号(tss中的活性标记)的高度富集,这与先前的研究结果也是一致的。22,23。为了探讨乳腺癌的亚型依赖性异质性,我们首先比较了TNBC和非TNBC细胞株间SES的共存程度。我们发现,簇内SE相似性评分的平均值(tnbc:0.265;非tnbc:0.291)显著高于簇间相似性评分的平均值(0.150)(两者均为)。P < 0.001, Wilcoxon signed-rank tests), indicating that cell lines belong to the same subtype showed a higher degree of SE similarity (Fig. 1B)。此外,与以前的基因表达谱和增强子研究相一致。20两株TN、永生化乳腺系(MCF-10A、76NF2V)与TNBC系有较强的SE相似性。有趣的是,TNBC细胞系MDA-MB-468与非TNBC细胞株有较高的交叉亚型相似性.通过比较SES的全基因组位点和取其结合区,检测到6284个非TNBC位点和9996个UNIT-TNBC位点,其中7333个为TNBC特异性位点。1C)。TNBC和非TNBC在基因组中的分布是相似的。1D)。大多数SE位于远端基因间区和内含子区,在其他肿瘤类型中也有这种分布。24,25.

图1:表观基因组图谱鉴定了乳腺癌亚型中的远端超强化剂。

a用黄土回归法将SE与典型促进剂区分开来,拟合促进剂的粒径分布,并对拐点进行识别(斜率=1)。以AU 565细胞系为例,对H3K27ac和H3K4me1信号较高,H3K4me3信号较低的SE进行了富集。b属于同一亚型的细胞系显示出较高的ES共发生度。该矩阵显示了在不同的细胞类型中检测到的SE成对相似性。相似度与重叠百分比成正比。左上角部分(橙色矩形)表示TN单元线,右下角部分(蓝色矩形)表示非TNBC细胞系。cVenn图显示了在至少一个TNBC和非TNBC细胞系中,以及在TNBC和非TNBC细胞系中唯一发现的SE的数目。d在TNBC和非TNBC细胞株中检测到SES的全基因组注释。e乳腺癌细胞系之间SE相似的网络。每个节点代表一条细胞系,边缘宽度对应于重要的jaccard相似系数(BH调整后)。P < 0.001, one-sided hypergeometric test). Based on network partition, two clusters of cell lines were identified, which recapitulates the subtype identify (TNBC vs. non-TNBC).

为了进一步探讨不同亚型乳腺癌基因组范围内SE谱的异质性,我们采用了一种基于网络的方法来研究19种细胞株的关联(图1)。1E)。更具体地说,我们建立了一个SE相似性网络,其中节点表示细胞系,加权边编码jaccard相似系数,量化细胞株间SE的共生性。用切分法计算SE共现度(Jaccard相似系数>0.1)和统计显着性(BH调整)。P < 0.001, Hypergeometric tests), only significant associations were retained to build the network (Supplementary Data 1)。马尔可夫聚类算法26,27用于检测是否存在指示子类型模式的网络群集。因此,根据SE特性检测到两个簇:簇1包括6株TNBC细胞系和2株TN,即永生化乳腺细胞系,而第2组包括8株非TNBC细胞系和1株TNBC细胞系。因为细胞系MCF 7和CAL 51与其他细胞系的交点相对较小,而且它们不符合我们网络的阈值条件(补充数据)。1,Jaccard相似系数>0.1和超几何检验BH-调整P < 0.001), these two cell lines were excluded from the network and downstream analyses. Our network-based approach revealed that the clustering of SEs is sufficient to characterize the subtype identity (TNBC vs. non-TNBC), without prior knowledge of the transcriptomes or markers.

TNBC特异性超促进剂的多组学特征

为了在多体水平上进行更全面的描述,我们重点研究了相对于非tnbc细胞株而言,在tnbc细胞株中对h3k27ac信号的显着富集或缺失的ess(x/log 2倍富集x>1&bh-调节)。P < 0.05, Wilcoxon signed-rank tests). As a result, the 3035 TNBC-specific and 1765 non-TNBC-specific SEs showed distinct patterns of H3K27ac enrichment, and many oncogenes (e.g. FOXC1, MET, and MYC) are associated with the predicted TNBC-specific SEs (Fig. 2A,b)。例如,MET,一种受体酪氨酸激酶在实体癌症中经常发生改变。28,被发现位于TNBC线高度活跃的SE附近(如图所示)。2C).

图2:亚型特异性超级促进剂的多体特征。

a热图比较了TNBC特异性SE和非TNBC特异性SE与非TNBC细胞株H3K27ac的富集模式。bTNBC细胞株中已鉴定的TNBC特异性SE基因位点和共发生频率的全基因组概述。癌基因FOXC 1、MET和MYC。c基因组浏览器图说明了在MET上游区域检测到的TNBC特异性SE。d在TNBC细胞株中,H3K4me1信号的富集率高于非TNBC细胞株,而H3K27me3信号在TNBC细胞株中的富集率高于非TNBC细胞株,而H3K27me3信号在TNBC细胞株中的富集率较高。e热图显示TNBC细胞株与非TNBC细胞株相比,肿瘤相关基因的基因表达、DNA甲基化、H3K27ac、H3K4me1、H3K4me3、H3K27me3基因模式。在每个热图中,用层次聚类的方法组织细胞株,标记颜色分别为橙色和蓝色,突出TN系和非TNBC系。

由于根据H3K27ac信号检测到了亚型特异性SE,我们进一步证实了其他活性或抑制性表观遗传标记是否也在该亚型特异性SE中显示了不同的模式。正如预期的那样,已知的活性增强子标记H3K4me1的信号在TNBC细胞株中比非TNBC细胞株高得多,而在非TNBC细胞株中则是相反的。二维空间,补充图。1A,P < 0.001, Wilcoxon signed-rank test). On the other hand, H3K27me3 signal, known as a suppressive marker, was depleted in the TNBC-specific SEs in the TNBC cell lines (Fig. 二维空间,补充图。1B,P < 0.001, Wilcoxon signed-rank test). These data agree with histone modification profiles reported in previous studies12,16,进一步证实了所鉴定的亚型特异性SE的特异性。

接下来,我们整合了H3K27ac,H3K4me1,H3K4me3,H3K27me3芯片-seq数据,DNA甲基化和基因表达数据,以研究SE和相应基因(启动子)中的潜在关联。利用从CCLE获得的15个细胞系的基因表达谱,我们特别关注与癌症相关的基因(从癌症基因普查中获得),Https://cancer.sanger.ac.uk/census,log 2折叠变化区>0.5&BH-调整后P < 0.05) that were differentially expressed between the TNBC and non-TNBC cell lines, and predicted their potential regulatory SEs within 500 kb of upstream region. Consequently, we identified 29 upregulated cancer-related genes in TNBC cell lines and 13 upregulated cancer-related genes in non-TNBC cell lines. Using unsupervised classification of active markers, including H3K27ac, H3K4me1, and H3K4me3, in SEs or promoters of the target genes, we observed similar patterns across cell lines of the same subtype (Fig. 2E)。正如预期的那样,抑制性标记H3K27me3在非TNBC细胞株的SE和启动子中高度富集。与组蛋白修饰和基因表达相比,DNA甲基化在TNBC和非TNBC细胞中没有明显的差异。这些结果突出了肿瘤相关基因在组蛋白修饰的TNBC中的失调以及SE在这些过程中的意义。

综合网络分析确定了一种SE驱动的TNBC侵袭和转移的主调节剂。

先前的研究表明,癌细胞在肿瘤发育过程中获得了与特征性生物学能力(或癌症特征)相关的功能相关的基因,从而获得了特定于癌症的SE。10,29。为了阐明SES在肿瘤标志中的调节作用,我们对TNBC特异性SE和基因表达谱进行了综合分析。利用TCGA-BRCA数据集,我们首先确定了4501个基因的差异表达(x/log 2的变化>0.5&BH-调整后)。P < 0.05) between TNBC (n = 115) and non-TNBC samples (n = 605). To explore the functional relevance, we performed hypergeometric tests to evaluate overrepresentation of the differentially expressed genes in 10 cancer hallmark genesets collected from a previous study10。因此,我们确定了三个有统计学意义的基因集(BH调整后)。P < 0.05) associated with cancer hallmarks of “activating invasion and metastasis”, “sustaining proliferative signaling”, and “evading growth suppressors” (Supplementary Fig. 2A)。为了研究SES是否参与TNBC癌标中基因的调控,我们在TNBC样本中寻找表达上调的基因上游的特异性SE 500 kb。因此,我们获得了331对tnbc特异性的SE靶基因对(补充数据)。2),与癌症特征显著相关,如“逃避生长抑制因子”和“激活侵袭和转移”(补充图)。2B)。为了验证,我们分析了细胞株和9个独立样本的基因表达数据集(补充表)。1)。这10个数据集的基因集富集分析(GSEA)都证实了这些SE-靶基因在tnbc(ALL)中的高表达。P < 1 ×10−4,补充图。35).

结果表明,tnbc的转录程序是相对一致的。30因此,我们推断了一个基于SE的调控网络,使用tcga-brca数据集来阐明tnbc特异性TFs对癌症相关过程的调控。从TNBC特异性SE-靶基因中鉴定出9个为TFs(log 2倍变化>1,图1)。3A)并被选为潜在的监管机构。TNBC中1785个上调基因(log 2倍变化>0.5,BH调节)P < 0.05) were selected as potential target genes of the nine TFs. Integrating the gene expression levels of these TFs and potential target genes, we inferred a regulatory network based on the ARACNE algorithm31,32,33(方法的细节)(如图所示)。3B)。为了确定tnbc的主调节器,我们进行了主调节器分析。33,测试每个TF的调节子在特定生物过程中的特征基因的过量表达。使用这种策略,我们确定FOXC 1是唯一具有统计学意义的主调节器(BH调整后)。P < 0.05, a hypergeometric test, Supplementary Fig. 2C)肿瘤标志“激活侵袭和转移”失调在TNBC中的表达。FOXC 1属于TFs的叉头家族,其特征是有一个独特的dna结合的叉头结构域,它与附近一个激活的tnbc特异性SE相关联(如图所示)。3C)。结果表明,非TNBC亚型细胞系MCF-7在FOXC 1启动子区域上游有较强的CTCF峰,而TN、永生化乳腺细胞系MCF-10A则未见CTCF峰,提示非TNBC中可能存在绝缘体阻断FOXC 1转录的作用。这些结果提示,依赖于亚型的SE可能调节FOXC 1的表达,FOXC 1在TNBC侵袭转移的转录重编程中起着核心作用。

图3:确定FOXC 1是TNBC侵袭和转移的超级增强子驱动的主调节因子。

aTNBC特异性SE潜在靶基因的预测。X轴代表TCGA-BRCA队列中TNBC和非TNBC基因表达的对数2倍变化。Y轴代表TNBC与非TNBC细胞株之间TNBC特异性SE的H3K27ac信号的对数2倍富集。在所有预测的目标基因中,有9个转录因子被识别和强调。b通过对TCGA-BRCA数据集中SE调控的TFs和基因表达数据的综合分析,推断出一个调控网络。FOXC 1被认为是激活TNBC侵袭转移的主要调节因子。由9个TFs调控的预测基因按TNBC和非TNBC样本的差异表达水平进行着色。c基因组浏览器图谱显示,在TNBC细胞株靠近FOXC 1的SE中,H3K27ac信号的富集程度高于非TNBC细胞株。dFOXC 1在TNBC中的表达明显增高(n=327),而被分类为其他亚型的(Her 2)n=237,Luman=706,Lumbn=484,并且是正常的n=199)在METABRIC队列中(双边Wilcoxon签名秩检验)。盒子代表25百分位数,中位数和75百分位数,胡须延伸到最远的值,也就是不超过四分位数范围的1.5倍。eKaplan-Meier图显示,FOXC 1高表达的乳腺癌患者(前10%)总体生存率明显低于METABRIC队列中的其他患者。统计显着性采用对数秩检验(单边)计算。(f, gFOXC 1在38例外科乳腺癌标本(18例TNBC,20例非TNBC)中表达的免疫组织化学。有代表性的FOXC 1染色图像显示。条形图显示了FOXC 1在手术标本中的平均染色强度分数。(h)TNBC组织芯片样品中FOXC 1的平均染色强度评分。n=48)和非TNBC(n=102)。i免疫印迹法检测FOXC 1在乳腺癌细胞株中的表达,独立重复两次,结果相似。数据表示为平均值±扫描电镜。g)和(h). P-数值由双面学生计算t测试(g)和(h)。源数据作为源数据文件提供。

Tnbc-特异性FOXC 1超增强剂是肿瘤球体生长和侵袭所必需的。

FOXC 1在TNBC中的临床意义已经确立。利用独立的临床注释乳腺癌基因表达数据,我们证实FOXC 1在TNBC中的表达与METABRIC队列中的非TNBC相比有显着性上调(图1)。三维空间FOXC 1的高表达与乳腺癌患者整体生存率差有关(图一)。3E)。对38例FFPE手术乳腺肿瘤标本和150例组织芯片进行免疫组化进一步验证。3F-h,补充表3),其中FOXC 1在TNBC中的上调与更高的级别(P=9.72×10−5,卡方检验),Ki 67(P=6.14×10−4、卡方检验)和肿瘤浸润淋巴细胞(P=1.54×10−6、卡方检验)。FOXC 1在一组TNBC线中也有过表达(如图所示)。3I)。然而,人们对这一众所周知的癌基因调控的分子机制却知之甚少.DNaseⅠ超敏反应常与增强子激活相一致。为了实验确定FOXC 1上游约128 kb的SE图谱是否驱动FOXC 1的表达和肿瘤发生,我们重点研究了SE区域内五个组分增强子中的两个(E1,e2)。在TNBC细胞的5个组分增强子中,E1和e2区对DNaseⅠ的敏感性最高(见图)。4A)。利用CRISPR/Cas9系统,我们在三个TNBC细胞系中删除了E1或e2,并用PCR方法验证了缺失。4A)。E1或e2缺失导致FOXC 1在所有三个品系中的表达明显降低,说明FOXC 1是FOXC 1 SE的靶基因。4B)。此外,E1或e2缺失导致克隆形成能力、球体大小和肿瘤生长明显下降(图1)。4C-E),表明FOXC1SE在TNBC致瘤性中的功能重要性。MDA-MB-231细胞在三维培养中表现出侵袭性表型,E1或e2缺失后侵袭力降低(图2)。4D),同意FOXC 1在TNBC侵袭和转移中的重要作用(图1)。3B)34,35。事实上,shRNA击倒FOXC 1后,TNBC细胞的形态发生了变化,从纺锤形到立方状(补充图)。6A,补充图。6B)。FOXC 1的耗竭也显着地抑制了球体的生长,伴随着侵袭性表型的降低(补充图)。6C)。此外,FOXC 1基因敲除后,克隆形成能力和异种移植物生长受到损害(补充图)。6d,补充图。6E)。FOXC 1过表达促进TNBC细胞克隆性生长(附图)。6f)。重要的是,FOXC1-SE缺失对球体生长和侵袭性的抑制作用可以通过FOXC 1的过度表达而被解除。4F,补充图。6g)。这些数据表明SE在提高FOXC 1对TNBC发展的关键作用。

图4:缺失FOXC1SE可减少TNBC球体的生长和侵袭。

aFOXC1SE(SSE 245)原理图和PCR检测CRISPR/Cas9介导的E1和e2缺失。INSET显示SSE 245内5个组分增强子(E1-e5)及其对MDA-MB-231细胞DNaseⅠ的敏感性。分别删除了E1和e2的1203和907碱基对。b缺失SSE 245的E1或e2后,FOXC 1在BT 549、MDA-MB-231和MCF 10-DCIS中的免疫印迹。(实验)a)和(b)分别重复两次,结果相似。cBT 549、MDA-MB-231和MCF 10-DCIS基因缺失E1或e2的克隆形成分析。条形图显示克隆性增殖的定量,n=BT 549和MDA-MB-231的3个独立实验,n=2用于MCF 10-DCIS。dBT 549、MDA-MB-231和MCF 10 DCIS球体的Phalloidin和Hoechst染色。条形图显示球体尺寸的量化。n=3项独立实验。eMDA-MB-231异种移植瘤体积有无E1,e2缺失。各组肿瘤数目n=7。fFOXC 1过表达条件下含有或不含E1、e2缺失的MDA-MB-231球体的生长。右面板,球体尺寸的量化。n=98,81,87,93,99,60球体(从左到右)检查了3个独立的实验。数据表示为平均值±扫描电镜。cf). P-数值由双面学生计算t测试(cf)。源数据作为源数据文件提供。

通过靶向表观遗传调控,bet抑制剂(如jq 1)在包括tnbc在内的各种癌症中显示出了潜在的抗癌潜力。36。作为研究jq 1对tnbc特异性SE的影响的第一步,分析了jq1或dmso处理的乳腺癌细胞系中brd 4的芯片seq剖面(补充表)。1)。JQ 1抑制BRD 4与TNBC特异性SES的结合。5A)。相反,BRD 4与TNBC特异性的SES在T47D中的结合最小,无论是否存在JQ 1。正如预期的那样,JQ1对TNBC特异性SE中H3K27ac的水平没有影响(图1)。5B)。为了验证H3K27ac的富集以及JQ1对BRD 4和P 300与FOXC1SE结合的影响,我们对FOXC 1基因附近的SE区进行了芯片-qPCR。我们观察到H3K27ac在TNBC的E1和e2区明显富集,但在腔内细胞中未见明显的富集。5C;补充图。7A)。此外,用JQ 1处理TNBC细胞能有效地降低BRD 4的结合(如图4所示)。5D,补充图。7b)和p 300(图1)。5E,补充图。7C)到SE。如预期,H3K27ac水平没有受到JQ 1的影响(图1)。5C)。根据SE在调节FOXC 1表达中的作用,JQ 1处理降低了TNBC细胞FOXC 1蛋白和mRNA水平(图1)。5F,补充图。7D)。JQ 1对TNBC、克隆形成和球体生长也有明显的抑制作用(图1)。5G,补充图。7E)。将这些分析扩展到患者样本,我们观察到与非TNBC肿瘤相比,在TNBC的FOXC1SE上H3K27ac有明显的富集(图1)。5H),同意FOXC 1在大多数TNBC病例中的表达上调(图1)。3D,f,g,h)。然后,我们进行荧光素酶报告测试的组成促进剂E1-e4(图4)。4A)。E1对DNaseⅠ的敏感性最高,具有最强的定向无关活性(图1)。5I),确认它是FOXC 1 SE中的主要调节元素。最后,我们探讨了与FOXC1SE的组成增强子E1相关的TFs。询问dnase-seq和jaspar数据库中已知的tf结合位点定义的核小体无区(Nfr)。Http://jaspar.genereg.net/)37,我们发现了96个与SSE 245组分增强子E1结合的候选TFs(补充数据)。3)。我们进一步进行了dna-下拉试验和质谱分析,并确定了55个与E1(补充图)结合的候选TFs。8,补充数据4,其中11例与TFs结合预测分析预测的结果相重叠(图1)。5J)。在11名候选人中,有8名和3名被证明分别与转录激活和抑制活动有关。转录激活剂hif-1α在肝细胞癌中被报道与FOXC 1启动子结合并增强其表达。38。利用ENCODE TF靶标数据库,我们还在FOXC 1启动子区域找到了SP1和YY1结合位点。在未来的研究中,这三位候选人将被优先考虑测试他们在SE介导的FOXC 1过度表达中的作用。

图5:TNBC中FOXC 1表达的表观遗传调控。

a芯片-seq剖面为BRD 4在JQ 1或DMSO(车辆控制)治疗乳腺肿瘤线面板。bH3K27ac富集于TNBC特异性SES中,无论是否经JQ 1处理。C-EH3K27ac(c),Brd 4(d)和P 300(e)用FOXC1SE E1引物扩增所指示细胞系的芯片-qPCR。n=3项独立实验。f免疫印迹检测FOXC 1在JQ 1或DMSO处理细胞中的表达,独立重复两次,结果相似。g0.3MJQ 1处理前后指示细胞的克隆性生长。n=3项独立实验。h应用FOXC1SE E1引物扩增临床乳腺癌标本H3K27ac芯片-qPCR。对4份TNBC和4份非TNBC新鲜冷冻样品进行了检测。i双荧光素酶报告法检测BT-549细胞FOXC1SE组分增强子活性。n=3项独立实验。(j)Venn图显示TFs可能与预测和质谱鉴定的SE区结合。预测唯一发现的tfs的大小与-log 10变换成正比。p-值,仅用质谱法发现的tfs的大小与-log 10转化的BH调整值成比例。p-价值。数据表示为平均值±扫描电镜。ce)和(gi). P-数值由双面学生计算t测试(ce)和(gi)。源数据作为源数据文件提供。

为了进一步说明用我们的综合方法阐明肿瘤基因在TNBC中特异表达的机制的可行性,我们对MET进行了一组平行的CRISPR/Cas9研究,这是另一种癌基因在TNBC中的高表达,与临床结果相关(补充图)。9A-c)。与FOXC 1类似,MET近端SE富集于H3K27ac,与Brd 4和p 300结合在TNBC中(补充图)。9d-f)。此外,JQ 1还抑制Brd 4和P 300与SE的结合,降低MET在TNBC细胞中的表达(附图)。9d-g)。SE在MDA-MB-231和BT 549细胞中的表达、集落形成、球体生长和侵袭性的降低显示了SE的功能意义(附图)。9H-K)。在MCF-10-DCIS细胞中,dCas9-Krab系统39被用于灭活SE,这也导致MET的表达和集落形成能力下降(附图)。9L,m)。这些结果证实了我们在鉴别TNBC特异性SE及其调控的癌基因方面的高度整合的方法。

Cas 9介导的ANLN超增强子缺失鉴定了其在tnbc克隆原性中的重要作用

FOXC 1和MET在TNBC中的作用已经确立。然而,我们的SE靶基因分析(补充数据)中其他几个最重要的基因的生物学意义2)在TNBC仍然难以捉摸。为了检验我们的综合方法是否也能应用于识别由SE驱动的新的TNBC特异性基因,我们将重点放在一个顶级的HITS,ANLN,因为它在乳腺癌患者中的高表达已被证明与复发、增殖基因的表达显著相关(所有17个在参考文献中测试过的基因)。40),以及整体生存状况不佳(见图)。6A;41)。但对ANLN在TNBC中的特异性功能和调节作用的研究较少。初步检测ANLN的表达。应用临床注释的乳腺癌基因表达数据集,我们发现TNBC中ANLN mRNA表达上调的病例比例明显高于乳腺腔内肿瘤(图一)。6A)。此外,在一组乳腺肿瘤细胞系中,ANLN在TNBC细胞系中的蛋白表达水平高于腔内或Her 2高表达的细胞系(图1)。6B)。这与我们的生物信息预测(补充数据)是一致的。2)和芯片PCR数据。6C-EANLN是TNBC富集SE的潜在靶点。重要的是,ANLN在正常乳腺组织中最少表达(42例TNBC肿瘤与21例癌旁正常组织相比),Http://syslab4.nchu.edu.tw/;42、图1.6f),提示将ANLN靶向用于治疗目的的潜力。为了研究ANLN SE的功能作用,我们使用CRISPR/Cas9系统删除SSE 256的峰值。6g)。SE缺失后ANLN水平和克隆原性显著降低(图1)。6h,我),表明SE驱动ANLN的表达和TNBC后代的产生能力。总之,我们的结果表明,基于SE的表观基因组特征可以区分TNBC和非TNBC亚型,并识别决定表型结果的tnbc特异性基因。我们的研究确定了一种在TNBC中上调FOXC 1和MET表达的机制。此外,我们的分析发现ANLN是由SE调控的TNBC特异性癌基因.

图6:ANLN超增强子在TNBC克隆原性中的作用。

aANLN的高表达与METABRIC组乳腺癌患者预后差有关。统计显着性采用对数秩检验(单边)计算。ANLN在TNBC中的表达增加(n=327,与其他亚型相比(Her 2)n=237,Luman=706,Lumbn=484,并且是正常的n=199;双边Wilcoxon签名秩检验)。盒子代表25百分位数,中位数和75百分位数,胡须延伸到最远的值,也就是不超过四分位数范围的1.5倍。b免疫印迹法检测ANLN在乳腺癌细胞系中的表达,独立重复两次,结果相似。ceH3K27ac(c),Brd 4(d)和P 300(e)用引物扩增ANLN SE E1的方法对所指示的细胞系进行芯片-qPCR。n独立实验用散点表示。fANLN的mRNA表达水平,来自癌症RNA-seq Nexus的数据。TNBCn=42个样本,正常组织n=21个邻近TNBC的样本。g在Hs578T、MDA-231和BT 549细胞中检测ANLN SE(SSE 256)原理图和检测ANLN SE E1缺失,两次独立重复,结果相似。hSSE 256 E1区缺失后,ANLN免疫印迹检测,两次独立重复,结果相似。iSSE 256 E1缺失或不缺失的Hs578t和BT 549细胞克隆形成分析。n=3项独立实验。数据表示为平均值±扫描电镜。ce)和(i). P-数值由单面学生计算t测试(ce). P-数值由双面学生计算t测试(i)。源数据作为源数据文件提供。

讨论

虽然乳腺癌中的基因异常已经得到了很好的研究和描述,但是对于TNBC患者来说,基因组引导的治疗策略是缺乏的。TNBC高度的基因组异质性进一步限制了突变靶向治疗。最近的研究强烈地表明,表观基因组的解除在乳腺癌的发病机制中起着至关重要的作用。20,43。然而,表观遗传变化如何影响亚型特异性SE和转录程序尚不清楚.我们的研究的动机是最近在其他癌症类型中的发现,突出了表观遗传回路的重要性,有可能对肿瘤发生的机制产生新的见解,并确定治疗干预的目标。例如,对髓母细胞瘤进行了亚组特异性的研究。16,为亚组的转录多样性和临床行为提供了调节性解释。此外,还发现嵌合TF PAx-FOXO 1能在一种特定的横纹肌肉瘤亚型中诱导新的SE,从而使Jq 1具有选择性治疗的脆弱性。23。虽然人们对乳腺癌中的SE知之甚少,但Franco et。艾尔。最近开发了一个计算管道来识别不同亚型的转录增强子,并证明了包括FOSL 1和PLAG 1在内的tfs在增强子的形成和tnbc细胞的生物学中起着关键的作用。20。在治疗上,cdk 7抑制剂已被证明可以阻止tnbc患者来源的异种移植物的肿瘤生长,因为cdk 7抑制剂依赖于tnbc特异性se的潜在驱动的关键基因簇。30。通过芯片seq和crispr的筛选,最近的一项研究发现bambi是一种SE驱动的基因,可以调节tnbc细胞的生长,而不是正常的乳腺细胞。44。这些研究强调了识别和描述SES的重要性,以完善我们对TNBC肿瘤发生的表观遗传过程的理解。

为了获得乳腺癌SES的全基因组图谱,我们对19个已建立的细胞系进行了活性增强子(H3K27ac)的芯片-seq分析。值得注意的是,非监督分类和网络分析发现了以前未被识别的乳腺癌SE异质性,其中全基因组SE图谱足以描述亚型身份(tnbc与非tnbc)。我们进一步鉴定了3035个TNBC特异性的SES和1765个非TNBC特异性的SES,并证明了它们具有多重活性和抑制性组蛋白修饰标记的特异性。通过对推测的肿瘤相关基因及其相应调控基因的多体谱分析,我们强调了SES通过组蛋白修饰而不是DNA甲基化来调控TNBC的表观遗传调控。这一分析的一个潜在限制是使用RRBS数据仅涵盖DNA甲基化丰富的基因组位点,这可能不包括SE和启动子的整个区域。因此,如果这一发现得到更高分辨率的dna甲基化数据(例如全基因组亚硫酸亚铁测序)的支持,这一发现在未来仍有待证实。鉴于已知的相对一致的TNBC转录程序,我们在乳腺癌患者数据集中进行了网络生物学分析,以确定SE驱动的TFs作为不同细胞过程的主调节因子。我们的分析表明,很大比例的tnbc特异性靶基因与多个肿瘤标记有关,我们很想发现FOXC 1是激活侵袭和转移的最重要的调节因子。在本研究中,我们通过在TNBC样本中扩增的基因上游500 kb范围内寻找SE靶基因来预测SE靶基因。我们进一步采用了公共数据集(补充表)。1)用Hi-C数据对TN系MCF-10A和非TNBC系MCF 7进行检测,探讨SES是否与其预期目标基因的启动子相连。由于数据太少(MCF-10A:169,655,013次接触;MCF 7:165,433,519次接触),我们无法确定整个基因组的任何重要循环。然而,我们发现SES与FOXC 1的启动子之间确实存在联系。10A),MET(附图。10b)和ANLN(附图)。10C)在MCF-10A中,而不是在MCF 7中,证明SE-启动子之间的相互作用是TNBC特有的。

尽管FOXC 1在乳腺癌发病机制中的作用和临床意义已得到充分研究,但对其调控机制知之甚少。Bmp4-smad信号转导促进成肌细胞中FOXC 1的表达和成骨分化。45,而典型的Wnt信号可以激活P19胚胎癌细胞中FOXC 1的转录。46。在基底样乳腺癌中,p65和gta 3分别促进和抑制foxc 1的表达。47,48。在本研究中,为了直接研究SE在调节FOXC 1表达中的作用,我们通过CRISPR/Cas9删除了相关的SE,导致FOXC 1和TNBC球体生长和侵袭性的表达降低,基因表达下调。在临床标本中,我们发现在TNBC肿瘤中,H3K27ac在FOXC1SE处富集。我们进一步证明,BRD 4和p 300在FOXC1SE上的富集对JQ 1是敏感的。尽管JQ1最近在TNBC患者中显示了疗效36,BRD 4和SE之间的机械连接尚待演示。因此,我们的发现不仅阐明了TNBC特异性SE的功能和临床意义,而且为FOXC 1在TNBC中的特异性过表达提供了机制。在肺腺癌和子宫内膜癌中,MYC的过度表达是由病灶放大的SE驱动的,这可能是促进上皮性癌中癌基因表达的一个潜在的共同机制。7。然而,在我们的基因组分析中,我们没有观察到FOXC1SE聚焦扩增。为了探索FOXC1SE选择性作用于TNBC细胞的分子机制,我们在SSE 245中对增强子E1进行了TFs结合预测和质谱研究,并鉴定了11个与FOXC1SE相关的潜在TFs。在这些TFs中,HIF-1α参与了FOXC 1在实体肿瘤中的表达调控。在肺癌中,hif-1α与foxc 1启动子中的低氧元件结合,促进了fxc 1的转录,从而促进了肿瘤的进展。49。测试HIF-1α是否在tnbc中介导SE驱动的FOXC 1过表达是很有趣的。此外,还预测162、66、45和39个TFs分别与SSE 245的其他四个组分增强子e2、e3、e4和e5结合(补充数据)。3)。在这些TFs中,FOXC 1可能与E3中的两个位点结合,表明FOXC 1有可能自我调节,并与其他TFs相互作用,作为TNBC的核心转录调节回路。另一个与致癌物质有关的中心问题是它们是如何获得和形成的。已经证明,肿瘤细胞通过多种机制获得se,包括SE的dna突变或indels,以生成新的tf结合位点、染色体重排以及定义拓扑关联区域的元素的变化。50。在我们的研究中,我们没有观察到FOXC1SE的焦点放大。导致我们新发现的TNBC特异性SE形成的结构或DNA变化仍有待研究。

通过对SE峰的多体分析和缺失,我们确定了一个参与胞质分裂的基因anLN是tnbc特异性SE的靶基因。51,52。与FOXC 1和MET不同,ANLN在乳腺癌中的作用尚未得到广泛研究。ANLN的表达与肿瘤易感性的关系主要是通过基因表达研究来推断的。例如,ANLN在卵巢癌、肺癌、肝癌、胰腺癌、结直肠癌和乳腺癌中均有上调。41,53。ANLN的致癌作用与其调节细胞周期的作用有关。在非小细胞肺癌和乳腺癌细胞系中,细胞增殖受到抑制,ANLN耗尽后形成大的多核细胞。41,54,55。最近,ANLN被证明可以调节乳腺癌细胞的迁移和干细胞。56。考虑到FOXC 1和MET在乳腺癌中的迁移和侵袭作用,研究SES是否在促进TNBC转移过程中协同上调这三种基因是很有意义的。在此,我们确认了ANLN在TNBC中的升高机制,这些研究进一步提示了ANLN SE在TNBC肿瘤发生中的临床和生物学意义,值得进一步研究。

总之,我们在TNBC和非TNBC细胞之间发现了不同的SE景观.我们的研究强调了TNBC特异性SE在决定生物学结果方面的功能意义,并提供了关键癌基因在TNBC中特异表达的机制。我们还展示了我们的多体平台在分析乳腺癌不同亚型的基因表达和生物学调控回路中的作用,进一步提倡阐明表观基因失调,为新的治疗干预提供见解。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297