队列和全球基因组模式的临床特征 美国学术医学中心联盟(AURORA US transferrable Project)基于转化型乳腺癌研究联盟的基础设施成立,以进行匹配的转移性和原发性乳腺癌的多平台基因组研究,类似于癌症基因组图谱(TCGA)对原发性乳腺癌的研究 20 。这项回顾性研究的合格标准包括新鲜冷冻(FF)转移标本、其相关原发肿瘤(FF或福尔马林固定石蜡包埋(FFPE)样本)、正常DNA来源和相应的肿瘤病理学和分子分析指标(图。 1a ).这些要求确定了55个个体,包括19个分析了一个以上转移的个体;在尸检时收集了20个参与者样品(代表具有一个以上转移的个体)。该组的临床人口统计数据构成了一个年轻的队列,初诊时的中位年龄为49岁,其中18%为非洲裔美国人,7%为西班牙裔美国人。在转移背景下,这些个体接受了三种系统治疗的中位数。正如预期的那样,这些个体的总体存活率通常很低,并且根据临床亚型而不同(扩展数据图)。1a、b ).BC诊断的中位总生存期为4.5年,转移诊断的中位总生存期约为2年。与TCGA原发性肿瘤相比,AURORA队列也有更高频率的三阴性BC (TNBC)和基底样原发性肿瘤(扩展数据图。 1c,d ).基于基因组特征和增殖评分的复发风险在转移样本中高于奥罗拉和TCGA原发肿瘤(扩展数据图。 1e–g ).从多个部位获得转移,最常见的是肝脏( n = 28),肺( n = 13)、淋巴结( n = 12)、大脑( n = 11)和其他16个站点;临床或基因组亚型与转移部位之间的关系见扩展数据图。 2 。补充表中显示了其他临床统计数据 1 .
图1:转移性乳腺肿瘤的研究设计和整体基因组模式。 a 极光转移项目的队列描述。 b 对55名参与者中的每一位成功进行的共有或个体肿瘤DNA甲基化、WES全外显子组测序(WES)和RNAseq数据的图表;DNAme,DNA甲基化;prim,primary遇到了,转移了。c ,使用97个配对的和34个未配对的原发性和转移性肿瘤中的前5,000个最易变的癌症相关的高甲基化CpG,进行DNA甲基化景观的全球概况分析。参与者有意订购样本,以目测检查参与者内DNA甲基化模式的保守性。 d ,使用所谓的1,900个内在基因列表(在该数据集中发现约1710个基因),对102个配对的和21个未配对的原发性和转移性RNA测序肿瘤进行监督分级聚类分析 21 . e 在41个原发性肿瘤和93个转移性肿瘤中显示了37个最常见突变的基因。右边的百分比表示跨样本的每个基因的突变频率;LumA,LuminalLumB,Luminal B,Claudin,Claud in-low;正常的,正常似的;Del,删除;Ins,插入。这个数字部分是使用施维雅医疗艺术,由施维雅提供,根据知识共享署名3.0非移植许可证( smart.servier.com ).
从每个样本中分离肿瘤DNA和RNA,并用于四种不同的分析:DNA外显子组和低通全基因组测序(were肿瘤和正常),全转录组RNA测序(RNAseq)使用rRNA耗竭和DNA甲基化微阵列。总的来说,153份样本中有88份成功完成了所有四项检测,153份样本中有141份完成了四项检测中的三项(图。 1b );102个转移瘤和51对原发肿瘤的多平台基因组数据集因此代表了研究MBC的前所未有的资源。使用显示癌症相关高甲基化的前5,000个最易甲基化的CpG对DNA甲基化状况进行的全球分析显示,在大多数原发性肿瘤-转移配对中,总体甲基化谱具有显著的保守性(图。 1c );事实上,36对肿瘤转移配对中有32对显示出最高的相关性。类似于DNA甲基化的发现,基于基因表达的分级聚类使用了1710个基因的乳腺肿瘤“内在”列表 21 还确定了每一个原发肿瘤转移配对的个体性,其中39对中的31对在系统树中聚集在一起(图。1d ),如在其他转移瘤研究中所见 22 ,23 。为了量化配对之间的相似程度,我们比较了随机配对和匹配配对之间的平均相关性(扩展数据图。 3a–d ).这些比较显示,总的来说,原发性肿瘤与成对转移样本的相似性高于与其他乳腺肿瘤的相似性。最后,体细胞突变景观确定 TP53 , KMT2C , FLG 和 PIK3CA 作为最频繁突变的基因,再加上 ESR1 4例雌激素受体阳性(ER+ )BC AF94,AER2,AD9I和AD9E(图。 1e ).类似地,在AURORA原发性肿瘤中发现的真正的BC驱动基因(在TCGA定义)中的大多数体细胞突变也存在于配对转移中(图。 1e ). TP53 和 FLG 转移瘤中的基因突变比原发肿瘤中的更频繁(66%比33%( P = 0.006)和28%对3%( P = 0.003),分别为);然而,在错误发现率(FDR)调整后,这一发现没有达到统计学意义。对于体细胞DNA拷贝数情况,我们计算了533个重复出现的DNA片段水平分数( 方法 和补充表格 8 )并观察到11个片段被发现在转移中更频繁地扩增( q < 0.05). Of these 11 segments, all overlapped an amplified region found in Bertucci et al.2 和Aftimos等人发现的2个重叠扩增区。 3 涉及 真菌学 和 MDM4 扩增。
基因表达亚型转换和基因组特征差异 为了评估原发性肿瘤和其转移瘤之间的基因表达差异,我们对123个样本中的每一个进行了来自RNAseq数据的PAM50分子分型 21 ,24 并在每个个体中测试亚型一致性(图。2a,b ).在测试的39个RNAseq病例中,39个中的13个显示了原发性肿瘤和其转移之间的亚型“转换”。我们注意到类似正常的区别典型地反映了低肿瘤细胞性(肿瘤细胞性和评估分数在补充表中 2 );因此,如果我们不考虑正常样组的转换,那么基底样表型是最稳定的,16对样本中有15对是基底样的。相反,包括lumina(LumA),lumina B(LumB)和HER2富集(HER2E)的‘lumina’表型在19个个体中有8个发生了亚型转换。我们还进行了TNBC分型25 关于TNBC样本(扩展数据图。 2 ),有趣的是,我们观察到免疫调节(IM)亚型的频率降低,从原发性肿瘤的13%降至转移性肿瘤的2%(补充表 2 ).
图2:原发性和转移性肿瘤之间基因表达标记的亚型转换和监督分析。 a 在39个参与者匹配的原发性乳腺和1个或多个转移性肿瘤之间的总体分子内在亚型变化。 b 在39个参与者匹配的原发性乳腺和1个或多个转移性肿瘤中的参与者特异性分子亚型变化。 c ,d luminal/HER2E中的原发性和转移性肿瘤之间显著不同的一些代表性特征的热图( n = 16个原发性肿瘤对29个转移性肿瘤; c )和仅基底样亚型( n = 10个原发性肿瘤对14个转移性肿瘤; d ).使用LMMs( q < 0.01). Significant signatures are row ordered from high to low according to ꞵ -系数(或回归系数)并根据转移中上调(阳性)或下调(阴性)来划分。根据PAM50分子亚型对个体进行列排序,并根据原发性肿瘤和转移进行划分。在4级RNAseq数据中计算签名分数(方法 ).AURORA队列的分析中排除了正常样肿瘤和治疗后原发肿瘤。有关中列出的签名的背景/来源的更多信息 c 和 d ,参见补充表格 3 ,第2页。LumA,LuminalLumB,鲁米那B;淋巴结。
接下来,我们进行了额外的基于RNAseq的统计分析,具体比较了原发性肿瘤和转移瘤的不同分组。我们首先将基因表达数据转化为一组749个先前发表的基因表达信号,代表肿瘤细胞及其微环境的许多特征,包括> 100个免疫细胞的信号,这些信号显示出与病理学家评估的免疫细胞浸润百分比和基于DNA甲基化的白细胞浸润评估显著相关 26 ,27 (扩展数据图。 4a–d );补充表格中列出了完整的签名列表 2 。在我们的整个分析中,我们依赖于多种有效的免疫细胞信号,包括许多显示预后和预测价值的信号 24 ,27 ,28 ,29 ,作为我们对免疫细胞存在/参与的主要衡量标准。这些免疫信号包括许多集中于适应性免疫的信号,并包括T细胞和B细胞的免疫信号 30 和协作免疫细胞的标记,包括IgG标记 31 B细胞/T细胞协同性信号 32 和GP2免疫元基因标记( 方法 ).我们使用这个签名库对所有原发肿瘤和所有转移瘤进行了监督分析,并鉴定了135个差异表达的签名( q < 0.05; Extended Data Fig. 5a ),包括成纤维细胞/基质细胞和内皮细胞的标记和许多在转移中较低的适应性免疫标记。然而,当在已知与转移可能性相关的基因表达亚型内进行监督分析时 33 ,34 ,则观察到亚型特异性差异(图。 2c,d ).具体来说,鲁米诺/ER + 亚型转移瘤(LumA、LumB和HER2E组合)显示成纤维细胞和内皮信号的低表达,并且很少有适应性免疫特征不同。相反,基底样/TNBC转移瘤具有明显较低的适应性免疫特征表达,包括多种T细胞、B细胞、自然杀伤(NK)细胞和HLA相关标记,而成纤维细胞和内皮细胞的标记没有变化(图。 2d ).
我们接下来询问是否存在根据转移部位的表达特征差异,这里我们集中于三个最常见的部位(即肝、肺和脑)。仅使用AURORA数据集,对原发性脑转移瘤与成对脑转移瘤的测试产生了48个在脑转移瘤中较低的特征,其中大部分是免疫和成纤维细胞/基质细胞的特征(扩展数据图。 5b ).对肝转移瘤与其原发肿瘤的监督分析产生了22个差异表达的信号(扩展数据图。 5c ),而对肺转移的类似分析没有产生显著的特征。少量的差异表达特征表明我们可能受到样本量的限制;因此,我们从北卡罗来纳大学(UNC)快速尸检项目(RAP2个原发性肿瘤-转移配对,10个原发性肿瘤-多发性转移配对和22个不成对转移配对,由82个标本代表)和来自公共领域的第三个数据集,其具有来自gei cam/2009-03 convert her(gei cam)试验的102个原发性肿瘤-转移配对 22 。使用该RNAseq组合群组来比较原发性肿瘤和肝转移( n = 58个肿瘤,27个原发性肿瘤和31个转移瘤)产生了更大的一组显著特征,包括许多在肝转移中较低的适应性免疫特征(扩展数据图。 5e ).此外,组合队列使我们能够在基底样/TNBC表型的背景下改进我们对脑转移瘤的分析( n = 13个肿瘤,5个原发性肿瘤和8个转移瘤),这也产生了更显著的信号,包括上调的细胞分化相关信号和较低的免疫和基质相关信号(扩展数据图)。 5d ).最后,原发性肺转移瘤( n = 36个肿瘤,18个原发性肿瘤和17个转移瘤)仍然没有产生显著的信号。
这些比较分析表明,免疫特征可能根据转移部位而系统地变化。为了直接解决这一假设,我们利用组合的AURORA-RAP数据集,其中包含14名至少有两次转移的参与者,通过RNAseq(其中一次来自肝脏)进行分析,以检查同一个体不同转移部位的免疫信号水平。该分析显示,在14个个体中的9个中,GP2免疫元基因标记的最低水平在肝转移中(图。3a,b ),并且在许多这些个体中,这种免疫信号在肝转移瘤中比在匹配的原发肿瘤中更低,但是在肺转移瘤中通常更高(图。3a,b ).接下来,我们使用AURORA–RAP–GEICAM联合队列进行了统计检验,并比较了肝肺转移和肝淋巴结转移,两者均显示肝转移的免疫信号显著降低(补充表 3 ).我们还比较了肝转移瘤和脑转移瘤,发现了76个主要与非免疫相关的差异信号(除了脑转移瘤中较高的γδ T细胞)。当将脑转移瘤与肺或淋巴结转移瘤相比较时,脑转移瘤也表现出免疫相关标记的较低表达。
图3:在AURORA-RAP联合队列中,检查了患有多发性转移的个体的免疫特征。 a 显示了根据来自具有至少两个转移灶的参与者的个体样本的GP2-免疫-元基因的基因表达标记分数,通过RNAseq数据分析(n = 14个人)。星号表示签名表达最低的肝脏标本。b 成对的原发性肿瘤和肝(36对)、脑(15对)、肺(21对)或GP2-免疫-元基因标记的“静止”(110对)转移瘤之间的表达变化(对同一器官中具有一个以上转移瘤的个体进行平均)。两个配对组之间的比较通过双侧配对样本Wilcoxon检验进行。具有统计显著性的值以红色突出显示。所有的盒状和须状图显示了每个条形的中值,显示了数据的上下四分位数范围(Q1到Q3)。晶须代表从最小值到Q1和Q3到最大值的线;LumA,Luminal,;LumB,鲁米那B;Brt,乳房;Adr,肾上腺;丽芙,肝;倾角,隔膜;Per,腹膜;Rct,直肠,Skn,皮肤;Stm,胃;Thy,甲状腺;SoftT,软组织;LN,淋巴结;Ple,胸膜;伦,肺;Brn,大脑;Bon,骨头;小子,肾;车,胸;Spl,脾脏;Mes,肠系膜;潘,胰腺;AUR,奥罗拉。
最后,为了评估基因表达特征作为生存分析中的预测变量,我们在AURORA队列中从BC诊断到死亡(总生存)进行了Cox比例风险模型。正如所料,该队列中存活的主要决定因素是鲁米诺/ER + -相关(较好结果)信号与基础样相关表型信号(较差结果)的对比。当对临床或分子亚型进行调整时,主要的存活发现是免疫相关的信号,这些信号预示着更好的结果(补充表 4 ).
人类白细胞抗原 失调及其对抗肿瘤免疫的影响 an的表达减少 水平线性排列(同horizontal linear ray) 基底样/TNBC转移瘤中的metagene信号使我们检查了构成该信号的单个基因的多平台数据,包括人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C 和 B2M 。检查启动子CpG岛 人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C 和 B2M ,我们确定了 人类白细胞抗原 23个肿瘤(12个个体)中的甲基化,以及人类白细胞抗原 当比较不成对的数据时,转移瘤中的启动子甲基化显著高于原发瘤( P = 0.035),而配对分析不显著,但趋势相同(图。 4a 和扩展数据图。 6a ).相比之下,只有三个肿瘤(一个人)显示甲基化人类白细胞抗原B ,只有一个肿瘤 人类白细胞抗原C 或者 B2M 甲基化(图。 4a ).为了进一步验证这些结果,我们定量了62例转移样本中的HLA-A蛋白(图。 4b ).我们发现HLA-A蛋白与 人类白细胞抗原 mRNA(图。 4c )并与 人类白细胞抗原B mRNA但不是 人类白细胞抗原C mRNA(扩展数据图。 6b ).我们还观察到 人类白细胞抗原 mRNA表达于 人类白细胞抗原 -甲基化肿瘤(图。 4d 左图)和HLA-A蛋白表达与 人类白细胞抗原 DNA甲基化(图。 4d ,对)。DNA拷贝数分析也证实了来自8名参与者的23份样本在该区域有局灶性缺失,但是在来自3名参与者的13份样本中,这些局灶性缺失在an附近 水平线性排列(同horizontal linear ray) 基因(< 40kb;图。 4e ).在这13个样本中,只有三个肿瘤(两个参与者)有RNAseq数据,这些局灶性缺失似乎在名义上与具有以下特征的样本相互排斥 人类白细胞抗原 甲基化(图。 4f ).遵循应用于 人类白细胞抗原 基因,来自三个不同个体的三个肿瘤在B2M 基因(图。 4f ).其他的 水平线性排列(同horizontal linear ray) I类相关的DNA甲基化事件似乎很少见,除了 TAPBP .
图4: 人类白细胞抗原 转移性肿瘤中免疫相关特征的失调和影响。 a ,高甲基化CpG位点 人类白细胞抗原 (8个CpG站点), 人类白细胞抗原B (14个CpG站点)和 人类白细胞抗原C 133个原发性和转移性肿瘤的(12个CpG位点);转录起始位点。 b 37个转移样本的代表性图像,显示了两种不同水平的HLA-A蛋白表达的HLA-A免疫荧光染色(上三分之一和下三分之一)。HLA-A蛋白表达值根据低(下三分之一)、中(中三分之一)或高强度(上三分之一)分为三等分。c HLA-A蛋白表达与乳腺癌的相关性分析 人类白细胞抗原 基因表达值( n = 37个转移灶)。使用Spearman相关系数测量相关性。 d ,箱线图 人类白细胞抗原 转移瘤中的mRNA基因表达水平(左; n = 75个转移性肿瘤)和HLA-A蛋白表达(右; n = 34个转移性肿瘤)。 e , 人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C 和 HLA-DRB5 焦点缺失 水平线性排列(同horizontal linear ray) 49个人的区域。f ,热图表示中的差异 人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C , B2M 和 TAPBP 在配对的初级( n = 36)和转移性( n = 60)肿瘤。从该分析中去除了类似正常的成对和不成对肿瘤(成对的正常和不成对组来自补充表的‘Pairs-PAM 50-Prim’栏 2 ).基因和签名分数是根据 人类白细胞抗原 基因表达变化。对于60个转移瘤,这种关联显示为 人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C , B2M 和 TAPBP 基因甲基化/DNA焦点缺失状态、PAM50和转移部位;NK,天生杀手。 g 左,MHC I类改变的肿瘤中MHC I类相关新抗原水平( 人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C , B2M 和 TAPBP 高甲基化或病灶缺失)与未改变的肿瘤(其他)的比较(基底样肿瘤: n = 25,5个原发灶和20个转移灶;luminal/HER2E肿瘤: n = 39,9个原发灶和30个转移灶)。右,MHC类改变的肿瘤相对于其他肿瘤的TMB(基底样肿瘤: n = 35,11个原发和24个转移;luminal/HER2E肿瘤: n = 52,15个原发灶和37个转移灶);NS,不显著。 h , 人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C 和 B2M 基因表达值如所示 人类白细胞抗原 -当数据可用时,相对于其他肿瘤的改变( n = 37,13个原发灶和24个转移灶)。 i 根据转移性样品中的治疗方案的MHC类元基因标记分数( N = 77). j 根据极光中的分子亚型,原发性和转移性肿瘤之间的MHC类元基因标记分数差异( n = 46)和RAP( n = 57)队列。从分析中去除了正常样肿瘤。该图的所有盒须图显示了每个条形的中值,显示了数据的上下四分位数范围(Q1到Q3)和数据异常值。晶须代表从最小值到Q1和Q3到最大值的线。两组以上的所有比较均采用事后Tukey检验(单侧)进行方差分析,并且 P 值显示为红色( i 和 j ).仅两组之间的比较通过不成对的Mann-Whitney检验(双侧)进行,并具有显著性 P 值以红色突出显示( d , g 和 h ).LumA,LuminalLumB,鲁米那B;LN,淋巴结;Unme,未甲基化;超甲基化。
与这些事件的功能作用相一致,转移性样品 人类白细胞抗原 甲基化或局部缺失降低了 水平线性排列(同horizontal linear ray) 基因和多重免疫信号与其匹配的初级相比(图。 4f ).这 人类白细胞抗原 -, 人类白细胞抗原B 表示“对象”: analysand 人类白细胞抗原C -改变的样品也显示了更高程度的 人类白细胞抗原 -预测的新抗原(图 4f ).我们还分析了 人类白细胞抗原 原发性肿瘤和成对转移瘤中的mRNA表达与12个原发性肿瘤-转移瘤对的RAP数据集中的免疫信号相关,并确定了相同的低相关关系 人类白细胞抗原 mRNA和低/低免疫细胞基因表达特征,这在基底样/TNBC中再次是最常见的(扩展数据图。 7a–d ).
有趣的是,我们注意到 人类白细胞抗原 -预测的新抗原 人类白细胞抗原 基因表达,与 人类白细胞抗原B 或者 人类白细胞抗原C ,在来自原发性肿瘤和转移瘤的基底样样品中(扩展数据图。 6c ).在基底样原发性和转移性肿瘤中 人类白细胞抗原 变异具有显著更高数量的MHC类相关新抗原,这不是由更高的肿瘤突变负荷驱动的(TMB;图。 第四代移动通信技术 );特别是,与在其他参与者中观察到的相比,参与者AER2在原发性肿瘤和肝转移中表现出超过50倍的新抗原负载。在这个参与者中, 人类白细胞抗原 在原发性和转移性肿瘤中是甲基化的 人类白细胞抗原 在肝转移中,mRNA和免疫信号甚至更低。相比之下,在MHC I类基因或表观遗传改变的病例中,luminals和HER2E原发性和转移性肿瘤表现出比所有其他病例更高的TMB和MHC I类新抗原(图。 第四代移动通信技术 ).此外,总的来说 人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C 和 B2M 在基底样样品中观察到基因表达 人类白细胞抗原 遗传或表观遗传改变(图。 4h ).综上所述,这些结果表明对MHC类限制性新抗原CD8有很高的选择压力 + 基底细胞样BC中t细胞介导的免疫和MHC类基因表达。值得注意的是,在增加转移治疗线后获得的转移样本中观察到MHC类基因的较低表达(图。 4i ),不分亚型。
接下来,我们检测了MHC类元基因信号的原发性/转移特异性下调的相关性,该信号由下列基因的复合表达组成 人类白细胞抗原 , 人类白细胞抗原B , 人类白细胞抗原C , B2M , TAP1 , TAP2 和 NLRC5 根据内在亚型在转移和匹配的原发肿瘤之间。在AURORA和RAP数据集中,只有基底样BCs在转移性疾病中表现出MHC类元基因标记的一致和显著下调(图。 4j ).观察到这种下调 人类白细胞抗原 , 人类白细胞抗原B 和 人类白细胞抗原C 仅基底样肿瘤中的基因(扩展数据图。 6d,e ).基因表达的变化 人类白细胞抗原 , 人类白细胞抗原B 和 人类白细胞抗原C 在一个给定的转移样本中,基因是一致改变的,支持所有三个基因的共同调节(扩展数据图。 6d,e ).
为了确定通过MHC类表达的抗原呈递和相关的新抗原如何影响肿瘤免疫微环境,我们进行了CIBERSORTx 35 在“相对模式”下对RNAseq数据进行反卷积。我们构建了一个相关矩阵,并通过无监督的层次聚类进行了进一步分析。我们观察到四个相关的特征聚类,其中两个反映了正特征相关模式,两个反映了负特征相关模式(扩展数据图。 6f ).第一个阳性聚类反映了MHC类新抗原(特别是那些对HLA-A和HLA-C具有预测结合亲和力的抗原)与肿瘤相关巨噬细胞、调节性T细胞和γδ T细胞的关联。第二个阳性簇显示细胞毒性CD8的富集 + t细胞,记忆激活的CD4 + 高MHC类表达肿瘤中的t细胞、B细胞、树突状细胞(DCs)和炎性巨噬细胞,与更发炎的表型和完整的抗原加工和呈递以及适应性免疫一致。与我们先前的发现一致,即具有高MHC I类新抗原的BCs似乎下调MHC I类基因的表达,第一个负相关聚类显示,具有更丰富新抗原的肿瘤通常与DC细胞活化标志差(负聚类1)和MHC I类基因表达低(负聚类2)相关。
鉴于...的发现 人类白细胞抗原 转移背景下的损失,我们也试图通过评估包含RNA序列、DNA测序和DNA甲基化数据的TCGA-BRCA数据来确定这是否可能发生在早期疾病中以及发生的频率 36 。在检测的761例TCGA-BRCA肿瘤中,68例显示甲基化 人类白细胞抗原 和8个显示甲基化 人类白细胞抗原B (扩展数据图。 8a–c ).原发瘤 人类白细胞抗原 甲基化与较低的 人类白细胞抗原 多种适应性免疫信号的mRNA水平和较低表达(扩展数据图。 8d–f ).重要的是,肿瘤 人类白细胞抗原 甲基化显示较差的生存结果,即使在调整了分期和PAM50亚型的多变量分析中(扩展数据图。 8g,高 ).
转移瘤中细胞粘附的表观遗传学抑制 我们对与转移相关的DNA甲基化变化进行了系统分析,以揭示受表观遗传机制影响的其他基因。细胞组成对DNA甲基化谱有深远的影响;因此,不同的转移部位可能通过污染基质DNA甲基化信号产生假阳性结果。我们通过筛查转移性肿瘤中甲基化缺失来避免转移部位污染的问题 独联体 -在代表转移靶组织的正常组织中持续甲基化的调节元件。我们在ENCODE项目定义的远端增强子样元件中选择了19607个CpG位点 37 在八种正常组织中组成性甲基化。比较原发性肿瘤和转移瘤的统计测试分析发现,与匹配的原发性肿瘤相比,转移瘤中有123个CpG位点明显甲基化不足。使用11,348个染色质免疫沉淀和测序(ChIP–seq)数据集,我们发现21种蛋白质的47个DNA结合位点在123个低甲基化CpG位点显著过度表达(图。 5a ).参与雌激素信号传导的蛋白质主导了这些低甲基化CpG的结合,包括那些由 ESR1 , FOXA1 , TFAP2A 和 TFAP2C ,与其他关于雌激素信号在乳腺癌进展中的报道一致 38 ,39 。我们进一步研究了由ESR1和FOXA1结合的远端元件,通过对由这些元件调节的推定靶基因进行基因本体(GO)富集分析( 方法 和图。 5b ).我们发现参与细胞粘附调节的基因经常出现在靶基因中(图。 5b ).然而,令人惊讶的是,我们发现远端元件低甲基化与这些相关基因的表达减少显著相关,这表明在分析雌激素受体个体时,这些基因受到雌激素信号的负调控+ 仅BC(图 5c,d )或者甚至当使用所有个体时(扩展数据图。9a–d ).我们证实了远端元件低甲基化和低表达之间的显著联系。 JAM3 和 FOXF1 在TCGA(图。 5e,f ).
图5:远端增强子元件处转移性肿瘤相关DNA低甲基化。 a 分析在显著甲基化不足的CpG位点的DNA结合蛋白。每个点代表分析的11,348个芯片序列数据集中的一个。这 y 轴代表富集的优势比,而 x 轴代表重叠蛋白结合位点的显著CpG的数量。圆点的大小表示富集的统计学显著性(费希尔精确检验);HR,激素受体。 b ,GO分析甲基化不足的推定靶基因 ESR1 或者 FOXA1 远端结合位点。此处显示了基于的前50个GO术语 P 费希尔精确检验的值。点的大小与基因的数量成正比。红色文本突出显示细胞粘附GO术语和感兴趣的基因。 c ,分析参与调节er中细胞粘附的推定增强子靶基因 + 肿瘤。原发性肿瘤( n = 15个肿瘤)和转移瘤( n = 19个肿瘤) + 显示肿瘤。 d 甲基化( β 值≥0.4)和未甲基化( β 值< 0.4) ER + 肿瘤。这 P 的值 c 和 d 是用韦尔奇的双样本计算的 t -测试(双面)。 e ,f 远端元件DNA低甲基化的分析( e )和推定的目标基因表达( f )在TCGA公元前的资料( n = 835个肿瘤,761个原发性肿瘤和74个邻近正常组织)。正常乳腺组织样本显示为深灰色,肿瘤样本通过PAM50分子亚型进行颜色编码。样品被鉴定为甲基化或未甲基化 β 值阈值为0.4。这 P 使用Welch的双样本计算值 t -测试(双面)。所有的盒须图显示了每个条形的中值,显示了数据的上下四分位数范围(Q1到Q3)和数据异常值。晶须代表从最小值到Q1和Q3到最大值的线。LumA,LuminalLumB,鲁米那B;克劳丁,克劳丁-洛。
我们通过选择在代表转移靶组织的正常组织中组成性未甲基化的CpG位点,进行了类似的启动子甲基化获得性筛选。我们鉴定了三个基因的转移相关启动子DNA超甲基化( JAM3 , YBX3 和 SYNDG1 ),其中一个也在远端元件DNA低甲基化分析中被鉴定(扩展数据图。 10 左侧和中间)。所有三个基因的基因表达在转移性肿瘤中显著低于匹配的原发性肿瘤,这种观察在HER2E或luminal亚型中更明显(扩展数据图。 10c,f,I ).
克隆进化和亚型转换 许多出版物研究了纵向样本中基于DNA的克隆进化以及对治疗选择的反应 40 ,41 。我们在这里集中研究了三个显示基于基因表达的亚型转换的病例,以解决表达表型的这种变化是否伴随着DNA克隆性变化的问题(图。 6a–o ).参与者AER8被诊断患有ER + 孕酮受体 + /HER2 – LumA亚型原发肿瘤,接受新辅助化疗和辅助内分泌治疗加依维莫司;参与者AER8在大约20个月的治疗后被诊断为肝转移,接受了额外的三线治疗并死于疾病,此时获得了几个转移病灶的活检(图。 6a ).两个检测的肝转移瘤具有相同的克隆谱系(橙色),这不同于原发性肝转移瘤的优势克隆谱系(紫色;图。 6b,c ),这一发现也得到DNA超甲基化谱的支持(图。 6e ).转移M2通过RNAseq分析,显示亚型转变为HER2E(但临床上仍为HER2 – ),随着增殖信号的增加和 人类白细胞抗原 mRNA水平和免疫细胞特征(图。 6d ).获得HER2E亚型在没有获得 HER2 已经报道了转移样品中的扩增 3 ,22 ,42 .
图6:个体极光病例的多组学参与者特征。 a –o 、参与者临床病史时间表( a , f 和 k ),克隆结构( b , g 和 l ),克隆进化( c , h 和 m )和转录组( d , i 和 n )和羟甲基描述( e , j 和 o )的参与者AER8( a , b , c , d 和 e ),AFR3( f , g , h , i 和 j )和AFE4( k , l , m , n 和 o ).转录组数据反映了基因表达值,基因表达签名使用标准化的RNAseq数据计算;LumA,LuminalLumB,鲁米那B;p,初级;m,转移;n,AQ21normalLN,淋巴结;右肺,右肺;左肺;右肝,右肝;l .肝脏,左肝;m,转移;胚胎干细胞。PGR,黄体酮;ESR1,雌激素受体;TAC、多西他赛(紫杉特尔)、盐酸阿霉素(阿霉素)和环磷酰胺;CBDCA,卡铂;Gem,吉西他滨;RT,放射治疗;开普,卡培他滨;THP、多西他赛、曲妥珠单抗和培妥珠单抗;全脑放射治疗。
亚型转换的第二个例子是参与者AFR3,他被诊断为ER + /公关 + /HER2 – 公元前卢马。参与者AFR3先接受化疗,然后接受内分泌治疗,并出现多发性转移,其中脑转移已通过手术切除(图。 6f ).脑标本显示ER发生了巨大的变化 – /公关 – /HER2 + ,基因表达分析证实了 HER2 表达和一个亚型切换到HER2E(图。 6f ),伴随着DNA克隆能力的改变,包括获得 HER2 区域和an ERBB2 /HER2 E668Q激活突变(图 6克,高 ).这种DNA克隆变化也反映在DNA超甲基化景观中(图。 6j )并伴随着 ESR1 和 精密图像记录器(precision graph recorder) 和上调 ERBB2 mRNA(图。 6i ).
与参与者AFR3相反,其BC转变为HER2E亚型,可能是由于获得性 HER2 放大,参与者AFE4表现出相反的趋势。也就是说,这个参与者出示了一个ER + /公关 + /HER2 + BC (HER2E表达亚型),其中注意到临床HER2免疫组织化学(IHC)结果为2+,荧光原位杂交(FISH)结果不确定,但为HERmark检测阳性。曲妥珠单抗治疗30个月后,记录了肿瘤进展,进行了肺活检,并重新测量了临床受体状态,表明存在er + /HER2 – 状态。给予额外的治疗;然而,肿瘤发展了,参与者在18个月后死亡。尸检时,获得了多个转移性肿瘤标本(图。 6k ).有趣的是,通过RNAseq分析的三个转移标本显示亚型转变为LumA或LumB,DNA克隆性改变和缺失。 HER2 放大(图 6l,m ),而 HER2 mRNA水平略有下降(图。 6n ).DNA甲基化特征与DNA克隆进化基本一致,除了右肺转移(M1)表现出最低的DNA肿瘤纯度评分(图。 6o ).有趣的是,肝转移(M6)是最明显的克隆转移(正如克隆进化史和DNA甲基化所显示的),表现为LumA亚型转换和最低水平的 人类白细胞抗原 表达和免疫相关特征。
讨论 已确定的转移性肿瘤很难治疗,其生物学特性也很复杂。总的来说,当原发性肿瘤与其匹配的转移瘤比较时,在原发性肿瘤中看到的优势基因组模式倾向于在转移瘤中保持;然而,已经确定了显著的差异,这些差异可能导致与MBC相关的不良预后。在进行原发性肿瘤与转移瘤的多平台分析时,我们发现了几种模式,可以解释一些转移肿瘤的行为,包括来自表观遗传、基因组和转录进化的事件。
这里确定的一个关键表观遗传机制是DNA甲基化。 人类白细胞抗原 和 人类白细胞抗原 小的局灶性缺失,典型地在基底样/TNBC转移的疾病中,导致 人类白细胞抗原 以及相关的免疫细胞特征表达的降低。对…的改动 人类白细胞抗原 也描述了在BCs中使用杂合性丢失(LOH)分析 43 通过简单降低mRNA 44 。这里,我们展示了 人类白细胞抗原 在那些TCGA的原发性癌症中,当观察到DNA甲基化时,与较低的免疫细胞特征和较差的总体存活率有关。这些发现为一些转移性肿瘤中免疫细胞特征的丧失提供了分子解释,这具有潜在的治疗意义。一个这样的暗示是ICIs可能对这些影响不大 人类白细胞抗原 -低肿瘤,因为这些不能被CD8识别 + t细胞(注意这些 人类白细胞抗原 -甲基化肿瘤倾向于具有高的新抗原负荷)。这些结果也提示了生物标记驱动的治疗方法,其中 人类白细胞抗原 DNA甲基化肿瘤(即生物标志物)可以用DNA去甲基化药物结合ICIs来靶向 45 .
转移性乳腺肿瘤的体细胞遗传学变化已被充分证明 2 ,3 在这里,我们将转移性肿瘤的变化扩展到表观遗传学领域。原发性和转移性肿瘤之间的基因表达亚型不一致以前已有描述 22 ,46 ,47 这里的极光研究也发现了类似的结果。也就是说,在三个BC患者之一中,我们发现了一个基因表达肿瘤亚型转换,这在luminal/ER患者中尤为常见+ 公元前。除了肿瘤细胞中可能的表观遗传变化之外,多种免疫细胞信号的RNAseq分析显示了仅根据转移部位的显著差异。已经认识到,大脑是一个免疫特权部位 48 ,我们的结果证实了这一发现。也有越来越多的证据表明,肝脏同样具有免疫特权 49 我们的结果证实了肝转移瘤中免疫细胞低下的特征。利用这种独特的资源,我们发现在14例多发性转移的患者中,有9例肝转移具有所有同步转移部位中最低的免疫细胞特征。这些比较转移组织部位的发现具有临床意义,因为肝脏是转移评估的常见活检部位,我们的数据表明,肝脏转移更可能具有低免疫细胞特征,这可能会使免疫治疗生物标志物阳性的测定结果产生偏差。
有趣的是,我们通过对转移相关的DNA甲基化改变的系统筛选发现了导致肿瘤转移相关基因表达下调的机制 JAM3 在转移性肿瘤中的表达,即远端ESR1结合位点的DNA低甲基化和基因启动子的DNA高甲基化。值得注意的是,据报道 JAM2 在BC细胞系中过量表达(第二个JAM家族成员)阻断了侵袭和迁移 50 , JAM3 在结肠直肠癌中因DNA超甲基化而沉默 JAM3 抑制促进迁移 51 。此外,DNA甲基化和ER介导的基因表达抑制之间的因果关系先前已有报道 52 以及我们的发现,调节细胞粘附的多个基因似乎受雌激素信号负调节,可能对转移的进展具有功能性后果。这与先前关于雌激素介导的BC细胞E-钙粘蛋白下调的报道一致 53 .
最后,我们克隆进化的三个例子强调了DNA克隆性的变化与基因表达为基础的亚型变化相一致。在参与者AER8中,克隆转移和改变的表达亚型不包括任何新的可操作突变,这可能是转移背景下基于DNA的可操作突变变化的最常见发现 54 。在参与者AFR3中,确定了一个可操作的变体(即 HER2 ),并给予曲妥珠单抗治疗,尽管肿瘤有所进展。参与者AFE4强调了精准医疗的另一个挑战,其中识别并瞄准了可操作的基于DNA的特征(即, HER2 扩增),然而肿瘤最终通过删除治疗靶点来逃避治疗。这些参与者中的每一个都说明了这项研究的第三个临床影响,即如果医学上可能,活组织检查和表征转移性疾病,因为它可能相对于原发性肿瘤发生了变化。
这项研究有局限性。第一个挑战是样本量可能不足以发现体细胞突变频率的差异。第二个挑战是FF标本的数据与FFPE标本的数据的整合。第三个挑战是参与者接受了多种辅助和/或转移治疗,我们无法评估治疗效果(注意每个参与者平均接受三种治疗)。尽管如此,我们发现了许多多平台支持的关于MBCs常见的肿瘤克隆进化和免疫逃避的发现。这里介绍的转移性疾病的多平台基因组数据资源是对原发性疾病的TCGA资源的高度补充 36 ,55 ,56 并且已经开始阐明MBC的分子景观。