摘要
有丝分裂细胞分裂增加肿瘤突变和拷贝数负载负担,预测标志物的临床免疫治疗的好处。 细胞分裂有关也与基因组脱甲基甲基化涉及损失延迟复制部分甲基化领域。 这里我们发现集中在这些领域和免疫调节通路基因转录抑制脱甲基肿瘤的CpG岛启动子甲基化。 全球甲基化损失与免疫逃避签名独立于突变的负担和非整倍性。 我们的群Methylome数据(n= 60)和出版组(n= 81)在肺癌和黑色素瘤组(n= 40)一致表明,基因组甲基化变化抵消高变异的贡献负担和增加免疫治疗抵抗。 预测能力是观察甲基化损失高于突变的负担。 我们还发现,基因组hypomethylation与非整倍体肿瘤的免疫逃逸的签名。 因此,DNA甲基化改变影响表观遗传调制精度免疫疗法。
介绍
癌症免疫疗法基于检查点的封锁已成为高效的一个子集的不同类型的人类癌症患者。 特别是,抗体介入干预目标细胞毒性T淋巴细胞antigen-4 (CTLA-4)和程序性死亡receptor-1 (PD-1) T淋巴细胞和主配体(PD-L1)肿瘤细胞能扭转tumour-induced免疫抑制和诱导持久的临床反应1。
免疫疗法目前面临的一个主要挑战是生物标记的识别预测临床反应CTLA-4和PD-1 / PD-L1封锁。 总的来说,突变或neoantigen负载2,3.,4,5和已有的T细胞浸润6,7是检查点封锁的临床效益指标。 另一方面,体细胞拷贝数改变(大会)8,9,10肿瘤的异质性,11,特定基因的遗传改变12或途径13已经被确认为阻力因素。
肿瘤细胞产生neoantigens或抗原,免疫系统从未见过没有癌症。 的抗原表位neoantigens显示肿瘤细胞表面,并引发免疫反应。 因此,肿瘤与高突变负载更容易应对anti-immunosuppressive策略基于检查点的封锁2,3.,4,5。 突变负载的增加细胞分裂期间由于重复的错误。 不仅突变,而且甲基化损失积累在一轮轮的细胞分裂14。 全球hypomethylation和CGI甲基化代表标志癌症甲基化变化15。 考虑与后期的协会复制时间,进步的甲基化损失可能发生由于甲基化维护机器的失败remethylate新合成的女儿站在DNA复制14,16。 然而,基因组甲基化的影响损失通过细胞分裂从未调查癌症免疫疗法的上下文中。
与此同时,大会成为一个阻力参数8,9,10。 pan-cancer分析发现协会大会做细胞毒性免疫的分子签名活动跨不同肿瘤类型10。 特别是,高度与广泛的染色体非整倍性肿瘤或arm-level大会显示标记的表达越低,表明免疫细胞浸润。 相比之下,焦大会主要与细胞增殖相关的标记,而不是免疫活动签名。 然而,非整倍性的机制影响免疫细胞渗透仍然未知。 全球癌症促进脱甲基染色体不稳定17,18,19,20.,特别是涉及大规模的改变导致非整倍性21,22,23。 因此,我们研究了甲基化变化和非整倍性之间的关系。
这里,我们进行大规模的系统分析TCGA的分子数据样本的在各种肿瘤的类型。 我们检查了全球甲基化水平的关系标记的细胞增殖,突变负担,大会的水平,标记的免疫细胞浸润,不曾想基因的活动。 重要的是,我们测试我们的假设由分子分析通过使用我们的肺癌组。 这是第一个研究检验DNA甲基化模式在分子和临床数据对于癌症免疫疗法。 结果,我们建议作为一个重要的预测标记免疫疗法,基因脱甲基牵连到表观遗传调制作为精密免疫疗法的组合方案。
结果
全球甲基化与免疫有关的签名
TCGA pan-cancer分析数据表明,标记细胞增殖与突变紧密关联的负担和非整倍性癌症和样本在每个癌症类型(补充图。1)。 我们的测量基于长点缀的基因组脱甲基核元素1(1号线或L1)24,25探针(补充图。2)也强烈与细胞增殖标记(图。1和补充数据1)。 全球甲基化损失也(图与突变的增加负担。1 b(图)和染色体大会做负载。1 c),两种类型的基因变异体积累通过细胞分裂(补充图。5)。
值得注意的是,我们发现全球L1甲基化水平之间的相关性和免疫标记等签名tumour-infiltrating CD8 + T细胞(图。1 d补充数据1,补充图。3.)。 然而,免疫细胞标记有望与突变的负担也与非整倍性有关10。 解开这个组间关联,我们进行多元回归的每一个基因的表达水平sample-level特性,即全球L1甲基化变异负担,非整倍性,肿瘤纯洁,年龄和肿瘤的阶段。 通过这种方式,我们能够确定免疫浸润与突变的全球甲基化水平独立负担和非整倍性纯洁的时候,调整年龄、肿瘤分期(无花果。2)。
基因组甲基化损失与免疫逃避签名。一个热图的基因集富集分析(GSEA)48规范化浓缩分数(洛克)基因集代表各种先天和适应性免疫细胞(行)。 对于每个基因/癌症类型,一个线性回归模型是适合使用信使rna表达水平作为响应变量和全球甲基化变异负担,非整倍性,肿瘤纯洁,年龄和肿瘤阶段预测。 为每个三个预测因子(全球甲基化水平,突变负担,非整倍性水平),GSEA进行基因与显著的回归系数。 细胞显著NES colour-scaled(罗斯福< 0.25)。b热图GSEA湖水的标志免疫和增殖基因集和基因参与抗原处理和表示,MHC或cytokine-cytokine受体相互作用
显著相关性基因脱甲基作用观察还为免疫调节途径,应该包括基因表达的肿瘤细胞。 这些包括抗原处理和表示,主要组织相容性复合体(MHC), cytokine-cytokine受体相互作用,干扰素等细胞因子信号,补充和凝固(无花果。2 b)。 有一个新兴角色互补系统在调节抗肿瘤免疫反应26。 细胞增殖相关的标记是在相反方向的免疫细胞标记或免疫调节基因(无花果。2 b)。 我们证实,全球L1甲基化水平本身并不影响白细胞分数,只有免疫相关基因表达(补充图。4)。
在延迟复制地区免疫基因的镇压
关注不曾基因在肿瘤细胞的镇压,我们排除了特异表达基因在免疫系统从以下分析。 因为甲基化损失主要发生在延迟复制区域14,16,我们检查是否late-replicated基因的转录活动在经历了全球脱甲基的肿瘤的影响。 通过使用细胞系的数据,我们发现基因复制或晚早些时候在癌症与正常细胞相比(补充数据2)。 因此,我们发现在癌症晚期基因复制脱甲基肿瘤(图明显压抑。3)与CpG岛(CGI)启动子甲基化(无花果。3 b)。 相比之下,early-replicating基因往往是脱甲基肿瘤(图中。3 c)。
在延迟复制地区特性的基因。一个比较肿瘤之间的late-replicated基因的表达水平较低和高全球甲基化。 肿瘤类型的搭配t以及P< 1×10≤10所示。b比较hypermethylated CpG岛的数量较低的肿瘤之间的延迟复制基因的启动子和高全球甲基化。 肿瘤类型与P< 0.05(双边Mann-Whitney U测试)。 箱线图,中线,边界框,和胡须代表50th,25th和75年th,5th,95th百分位数,分别。c比较肿瘤之间的early-replicated基因的表达水平较低和高全球甲基化。 肿瘤类型的配对t检验P< 1×10≤10所示。d丰富的细胞循环和免疫途径根据复制时机。 通道的数量显示显著的浓缩(罗斯福< 0.25)由GSEA表示在酒吧。e大大丰富了通路的基因延迟复制区域和两个代表GSEA情节。 上特异表达基因免疫系统被排除在外
总的来说,几种途径在基因在细胞周期延迟复制区域过多集中在early-replicating区域(图3 d)。 更具体地说,途径最丰富的延迟复制基因在癌症包括cytokine-cytokine受体相互作用,interferon-α/β(IFN-α/β)信号和RIG-1 / MDA5-mediated IFN-α/β感应(无花果。3 e和补充表1)。 RIG-1 / MDA5-mediated感应IFN-α/β代表先天免疫反应对RNA病毒。 与我们的数据从tumour-intrinsic脱甲基,甲基化抑制剂的治疗被证明诱导双链rna(极)来源于内源性逆转录病毒(erv)和线路,导致激活IFN-α/β响应的癌症27,28,29。 没有沉默IFN-α/β通路,基因组脱甲基作用会导致抗病毒反应,促进抗肿瘤免疫反应与脱甲基的代理证明。 我们测量erv的表达水平和l1的肿瘤样本。 表达水平的相关指标的细胞毒性免疫活动不积极,但负面(补充图。5),这意味着IFN-α/β消声覆盖immune-stimulatory ERV / L1表达基因脱甲基作用的影响。
镇压的免疫基因部分甲基化领域
甲基化损失延迟复制地区从事异色的结构称为部分甲基化领域的形成(pmd)而不是高度甲基化领域(HMDs)16。 pmd是首次发现相邻地区的CpG甲基化水平较低分化细胞30.。 PMD-like远程在结肠肿瘤脱甲基作用被发现31、乳腺癌32和大脑33癌症。 最近的一项研究显示,PMD脱甲基作用是一种常见的特征不同的癌症类型16。 这种远程脱甲基作用在癌症是伴随着基因沉默的程序。 基因在pmd under-expressed分化细胞30.。 同样,在各种类型的癌症基因在pmd在很大程度上是被压抑的染色质结构的形成或通过CGI甲基化31,32,33,34,35。
pmd的特征,定义基于solo-WCGW甲基化水平的高可变性样本16。 甲基化变化的检查和复制各种pmd的时间导致了三个不同的子类(图。4)。 按照以前的报告36pmd的属性与基因组长度较短有关pmd复制时间早些时候(图的特征。4 a、b)。 引人注目的是,免疫调节通路基因抗原处理和表示,cytokine-cytokine受体相互作用,JAK-STAT信号通路都集中在短pmd(无花果。4 c, d和补充表2)。 INF-α家族基因在短期pmd(无花果。4 e)。 8 HLA基因,包括HLA-DQA1 HLA-DRA, pmd和HLA-DRB1位于短。 与延迟复制区域(图一致。3 a, b),短pmd是伴随着基因镇压(图。4 f)和CGI甲基化(图。4 g在脱甲基肿瘤。 Hypermethylated cgi 150 kb的PMD中最丰富的边界31。 丰富的免疫基因(图。4 c, d)明显集中PMD边界附近的平均距离143 kb(图。4 h),这表明这些基因是特别容易启动子甲基化。
表征基因部分甲基化领域。一个识别PMD子类通过甲基化变化层次聚类和复制时机。b比较之间的PMD的大小确定PMD子类。c浓缩的基因在短pmd的几种途径。d域的基因甲基化变异细胞周期分布和免疫途径。 的两个示例Kolmogorov-Smirnov测试是用来评估偏离细胞周期基因的分布。eIFN-α时机与后期在短PMD的基因复制。 的平均值和标准误差的加权平均信号复制时间在正常细胞和癌细胞。f基因的信使rna表达水平的比较短的pmd肿瘤样本之间的低和高全球甲基化。 肿瘤类型的配对t检验P< 1.0×10≤10所示。g比较hyper-methylated启动子的数量之间的短pmd cgi肿瘤样本较低和高全球甲基化。 肿瘤类型与P< 5.0×10−2(双边Mann-Whitney U测试)。h浓度的免疫基因PMD边界附近。 免疫相关基因的平均距离(b) HMDs到最近的是由一个箭头标志。 观察到的平均距离的统计显著性是评估基于零分布通过使用随机生成PMD的基因
全球甲基化预测对免疫治疗的反应
测试是否全球甲基化变化影响免疫疗法的临床效益,我们生成methylome和60个外显子组数据样本在肺癌anti-PD-1 / PD-L1队列收集从三星医疗中心(SMC)(补充表3.)。 同时,我们使用一个额外的anti-PD-1肺癌组由81 methylomes和22从外显bellvige生物研究所(IDIBELL)37。 进行验证,我们利用数据从40 TCGA黑色素瘤病人免疫疗法。 总结的三个军团中提供了无花果。5。
基因组脱甲基作用产生不利影响的临床受益检查点封锁。一个总结免疫治疗组和可用的数据样本。b无人监督的层次聚类的DNA甲基化概要SMC肺癌组样本。 甲基化探针(行)集群和样品(列)分为两组中值显示全球的甲基化水平。 热图显示β值最不同的甲基化位点(最高1%)肿瘤样本之间的低和高全球甲基化。 甲基化探测器是由相对距离分类的CGI (CGI,海岸,书架和大海)。c微分CGI /大海全球低和高集团之间的甲基化。 两组之间的差异甲基化位点(罗斯福< 0.05)被选中,每个β值平均为每个组。 配对t检验是用来测试的统计学意义。d比较突变负担,非整倍性水平,和hyper-methylated启动子之间的短pmd cgi肿瘤样本较低和高全球甲基化。e,f生存分析使用甲基化的肿瘤样本的数据e结合或fIDIBELL队列。 全球L1患者分层的甲基化水平。 日志等级测试是用来比较kaplan meier生存曲线估计的方法。g生存分析使用SMC肿瘤样本和甲基化水平,突变的负担,和非整倍性水平。 全球L1患者分层的甲基化水平(左),突变负担(中)和(右)的非整倍性水平。h生存分析使用甲基化和肿瘤样本变异的数据队列相结合。 全球L1患者分层的甲基化水平(左)或突变负担(中间)。 估计的相对贡献全球甲基化变异负担和病人生存和临床效益,多变量Cox比例风险模型(PFS:无进展生存)或多元逻辑回归模型(DCB:持久的临床效益和NDB:没有持久的好处)。我生存分析使用IDIBELL肿瘤与甲基化和突变数据样本。 全球L1患者分层的甲基化水平(左)或突变负担(右)
结合肺癌组的样品被分成全球低与高甲基化组根据L1的甲基化水平。 全球低甲基化组表现出降低基因组(大海/架)甲基化,增加了CGI /岸甲基化(无花果。5 b, c)。 同意我们的pan-cancer分子数据分析,全球低甲基化样本显示高突变负担和非整倍性以及CGI甲基化在短期pmd(无花果。5 d)。 SMC TCGA队列和队列的转录组数据表明,在MHC基因的镇压和cytokine-cytokine受体相互作用被大大丰富了全球两个组别中脱甲基肿瘤(补充图。6和补充数据3.)。
高突变负载相关的临床效益检查点封锁2,3.,4,5。 然而,当我们分层患者样本根据L1甲基化水平,全球低甲基化组显示不良预后尽管高突变负载。 在合并后的肺癌组(n= 141),风险比(人力资源)为0.56(日志等级测试,P= 7.0×10#3)(图。5 e)。 IDIBELL组(n = 81)(图5 f)和SMC组(左无花果。5克)导致HR = 0.57(日志等级测试,P= 4.0×10−2)和HR = 0.52(日志等级测试,P= 5.0×10−2),分别。 而P值随着样本容量的增长,降低效果(人力资源)仍然是一个相似的水平。
我们未来的影响相比全球甲基化和突变的临床反应上的负载。 合并后的肺癌组、methylome和匹配的外显子组数据用于总共82个样本(图。5)。 与全球L1甲基化水平(日志等级测试,HR = 0.46P= 7.0×10#3),突变负担未能显示显著的解释力(日志等级测试,HR = 0.77P= 0.3)(左和无花果。5 h)。 多元回归与生存或临床效益作为响应变量表现出显著影响全球L1的甲基化水平而不是突变的负担P= 0.05(无花果。5 h)。 我们重复的单变量比较两组肺癌。 SMC组(n= 60)和IDIBELL群组(n= 22)导致显著分层由全球甲基化,但不是突变负担(左和无花果。5克和我)。
全球L1甲基化水平与非整倍性负相关(无花果。5 d)。 pan-cancer分析发现了协会的非整倍性免疫逃避的签名10。 综上所述,两种低甲基化和高非整倍性预计将减少肿瘤免疫和破坏免疫疗法的临床受益。 然而,当我们检查了SMC肺癌组的非整倍性数据(无花果。5非整倍体),只有全球甲基化而不是显示显著的相关性较差的临床反应(左和右的无花果。5克)。
上述分析是重复,TCGA黑色素瘤组(n=(图40)。5)。 样本首先分为全球低与高甲基化组根据L1的甲基化水平。 全球低甲基化组在黑色素瘤重现CGI启动子甲基化在短期pmd(补充图。7一个)和不良预后,以应对免疫疗法(日志等级测试,HR = 0.48P= 3.0×10−2)(补充图。7 b)。 突变的负担和非整倍性水平未能解释临床效益(补充图。7 c, D)。
全球脱甲基作用排除非整倍性的影响
我们的结果从临床数据与之前的非整倍性研究协会的非整倍性和免疫逃避签名10。 因此,我们研究的可能性,全球甲基化能够解释这种关联。 全球癌症促进脱甲基染色体不稳定17,18,19,20.。 DNA hypomethylation-related不稳定主要是染色体的性质和涉及到大规模的改变导致非整倍性而不是广泛的放大或删除21,22,23。 在ICF综合征(免疫缺陷、着丝粒不稳定和面部异常),失败的甲基化维护pericentromeric序列可能导致错误的染色体隔离在癌症38,39,40,41,42。
事实上,全球大会脱甲基作用显著相关性在不同肿瘤类型(无花果。6a)。 我们确定染色体的大小大会(cSCNAs)结合染色体大会和手臂大会以前计算的水平10相比,这一结果与焦大会(fSCNAs)。 相关性更强,cSCNAs比fSCNAs(无花果。6 b和补充图。8)。 我们使用局部相关性估计全球L1甲基化水平的程度与cSCNAs(或fSCNAs)当控制fSCNAs(或cSCNAs)。 在大多数情况下,全球hypomethylation fSCNAs cSCNAs独立(无花果。6摄氏度)。 相比之下,相关性与fSCNAs cSCNAs控制(图时消失。6摄氏度)。 重要的是,多元回归分析的免疫签名分数显示显著解释力全球L1甲基化水平高于cSCNA水平(图。6 d)。 我们还执行免疫签名的偏相关分析分数,全球L1甲基化水平,cSCNA水平。 总的来说,免疫签名得分之间的正相关和全球L1甲基化水平保持cSCNA水平时控制了(图6 e),除了一个肿瘤类型,以前曾有报道称作为例外,对于非整倍性的作用10。 这些结果表明,高非整倍体的肿瘤免疫逃避签名与基因组脱甲基作用相关联。 事实上,最近的分子机制研究43与以前的报告10表明非整倍性细胞产生炎性信号消除对自己的免疫系统是对癌症细胞的免疫监视。
全球hypomethylation DNA非整倍性表示。一个比较大会做全球肿瘤之间的低和高甲基化水平。 这里显示是cSCNAs和fSCNAs的组合。P从双边Mann-Whitney U测试显示值。b协会全球DNA甲基化与cSCNA fSCNA水平。 值标准化/肿瘤类型。 斯皮尔曼等级相关系数及其P值显示。c偏相关分析比较cSCNAs(红色)和fSCNAs独立与全球甲基化(橙色)的相关性。 斯皮尔曼相关使用。d每个肿瘤类型、样品较低(< 30th百分位)和高(> 70th百分位)免疫签名评分比较通过与甲基化标准化的全球多元逻辑回归,cSCNA, fSCNA水平和肿瘤纯度作为预测因子。e偏相关分析比较全球甲基化(蓝色)和cSCNAs(红色)的相关性与免疫签名独立评分。 斯皮尔曼相关使用。 (一个- - - - - -e)这些分析仅限于11肿瘤类型的cSCNA和fSCNA数据是可用的
讨论
在这项工作中,我们建议DNA甲基化异常现象是一个重要的决定因素的肿瘤宿主免疫反应活动,并提供一种机制,通过这种机制快速分裂和高度突变肿瘤逃避免疫反应和抵抗免疫疗法。 的关键机制似乎异染色质的形成,加上先进的域级甲基化损失。 一个开放的问题是决定这些表观遗传变化在特定地区,比如MHC轨迹。 一种可能性是,这些变化在特定位点选择性地支持癌症进化,因为他们提供免疫逃避机制,增加肿瘤细胞的健康。 也有可能域脱甲基的几种地区是一个固有的染色质倾向比选择的结果。 在任何情况下,我们的研究结果表明,有丝分裂细胞分裂导致遗传和表观遗传改变施加反对对肿瘤免疫的影响通过增加neoantigens和抑制免疫基因表达,分别。 细胞分裂也会增加焦点和染色体拷贝数变化。 我们的数据表明,染色体拷贝数变化的特定的协会与低抗肿瘤免疫活动可以解释全球甲基化损失。
有多个研究报告由CDK4/6抑制抗肿瘤免疫增强和协同效应的细胞周期抑制剂和检查点封锁44,45,46。 我们的研究结果表明,细胞周期抑制可能通过抑制基因改变带来相反的影响,促进neoantigen同时形成,预防免疫逃避由表观遗传改变,抑制免疫调节通路的基因。 因此,细胞周期抑制的报道效果表明,福利通过表观遗传的影响可能大于抑制neoantigen形成造成的不利影响。
镇压签名IFN-α/β信号特别提请注意,鉴于这个途径应该是刺激引起的免疫反应对dsrna基因组脱甲基。 最近的研究表明,DNA甲基化抑制剂诱导dsRNA表达和刺激抗肿瘤免疫活动通过IFN-α/β反应激活的病毒防御通路27,28,29。 基于这些结果,结合表观遗传治疗和免疫治疗47,48。 根据我们的结果,肿瘤与全球甲基化损失往往独自抵抗免疫疗法,可能会特别受益于这种联合治疗的方法。 然而,内在de-suppressed极可能无法增强抗肿瘤免疫力由于灭活IFN-α/β信号。 我们确实观察到ERV /线表达不会增加免疫签名,而相比之下,减少可能反映干扰素-α/β失活。 因此,不同的行动机制的表观遗传治疗需要针对这些肿瘤。 具体地说,它需要测试甲基化抑制剂或其他后生调节器是否能够恢复IFN-α/β响应和其他免疫调节通路通过减少CGI甲基化或放松异染色质结构在这些本质上脱甲基肿瘤。 我们的研究揭示了表观遗传调制和检查点封锁潜在精度免疫治疗方案。
方法
TCGA分子和临床数据
batch-corrected和归一化DNA甲基化数据基于英飞纳姆甲基化450 k技术),连同mRNA表达和基因突变数据,生成的PanCancer Atlas财团获得出版的页面(https://gdc.cancer.gov/about-data/publications/pancanatlas)。 TCGA整除条形码标记为不使用在合并后的样品质量注释文件被丢弃。 我们选择> 100的癌症患者样本的分子数据和年龄信息。 选择的肿瘤类型包含21 6968名样本的类型(补充表4),包括膀胱移行细胞癌(BLCA),乳腺腺癌(BRCA),宫颈鳞状细胞癌和子宫腺癌(塞斯克)结直肠癌(CRC),食管癌(光电子能谱)、头颈部鳞状细胞癌(HNSC),肾肾透明细胞癌(KIRC),肾肾乳头状细胞癌(KIRP),低级别胶质瘤(LGG),肝脏肝细胞癌(LIHC),肺腺癌(LUAD),肺鳞状细胞癌(LUSC),胰腺腺癌(PAAD),嗜铬细胞瘤和副神经节瘤(PCPG),前列腺腺癌(马),肉瘤(不仅),皮肤皮肤黑色素瘤(SKCM),胃腺癌(STAD),睾丸生殖细胞肿瘤(TGCT),甲状腺癌(THCA),子宫内膜癌和子宫语料库(UCEC)。 PMD甲基化水平来自周et al。16(https://zwdzwd.github.io/pmd)。 非整倍性水平和肿瘤得到了纯度值表的泰勒et al。49。 cSCNA和fSCNA水平从11个癌症类型从Davoli et al。10。 多形性胶质母细胞瘤(GBM),芯片的基因表达数据从UCSC的齐娜获得公共数据中心。
估计全球甲基化水平
确定全球甲基化水平,我们选择甲基化探针的至少90%的序列(≥45 bp)映射到年轻的亚科1号线(L1HS和L1PA)。 探针映射信息和1号线的家人从GPL16304注释了50的RepeatMasker UCSC基因组浏览器51,分别。 我们平均每个肿瘤的β值选择调查样本,并使用β作为平均预估全球甲基化水平(补充数据1)。 亚硫酸氢进行验证,我们获得了全基因组测序数据的样本(三级β值)甲基化数组数据(n= 18; 补充表5环球数码创意遗留存档()https://portal.gdc.cancer.gov/legacy-archive)。 我们首先选择进化年轻1号线重复元素包含至少三个不同的CpG网站覆盖了至少10一致读,然后计算平均β值为每个重复元素。 选择的对每个样本重复元素的数量从67732年到71958年(补充表5)。 我们得到的均值平均重复元素的β值代表全球每个样本的甲基化水平。 我们执行一个额外的验证通过使用1号线焦磷酸测序数据集的15个样品甲基化数组数据相同的平台52。 我们比较我们的措施的基础上,选择阵列探测器重亚硫酸盐测序和焦磷酸测序措施(补充图。2)。
线性回归模型
对于每个基因/癌症类型,一个线性回归模型是适合使用信使rna表达水平作为响应变量,和全球甲基化,突变负担,非整倍性,肿瘤纯洁,年龄和肿瘤阶段预测。 我们包括肿瘤阶段模型中至少有100名患者的肿瘤类型与肿瘤样品阶段信息(n= 15; 补充表4)。 使用以下公式建立了回归模型使用lm函数R。
基因的mRNA表达Y ~β1×全球+β甲基化水平2×突变+β负担3.×+β异倍性水平4×肿瘤纯度+β5×年龄+β6×肿瘤阶段
为每个三个预测因子(全球甲基化水平,突变负担,非整倍性水平)/肿瘤类型,GSEA48进行基因重要业务回归系数(Benjamini和罗斯福< 0.05)。 基因排序的z分数的线性回归模型被用于输入GSEA preranked模块的软件48与免疫和增殖基因集(见下文)。 GSEA运行与默认设置,除了最小数量的基因集,这是设置为10。
识别的基因复制与微分时机
Repli-Seq测量(wavelet-smoothed信号)的编码5正常(HUVEC IMR90,这些地方,BJ_1和BJ_2)和10个癌症细胞系(MCF-7、SK-N-SH HepG2,海拉,A549, G401, LNCaP, T47D, H460,和Caki-2)从UCSC基因组浏览器下载53和编码项目门户网站54。 平均wavelet-smoothed信号值在每个5 kb窗口缩放和quantile-normalized。 Windows窝藏缺失值的细胞系被排除在外。 我们学生的执行t以及为每个5 kb窗口评估复制时间正常和肿瘤细胞的区别。 然后我们分配P价值和t统计每一个基因。 对于基因生成多个复制时间窗口,我们分配了一个总和P值和平均使用费舍尔的方法t统计。 我们排除了位于性染色体或基因特异表达的免疫系统(见下文)。 基因与Bonferroni-adjustedP值< 0.05被定义为在癌症早期或late-replicated基因。 基因排序的t数据被用于输入GSEA preranked模块的软件48从MSigDB规范化REACTOME和KEGG通路55。
与微分分析的基因复制时机
调查和late-replicated早期基因的表达差异之间的肿瘤样本与高、低全球甲基化水平,我们分区的肿瘤样本到低(< 30th百分位)和高(> 70th百分位)为每个癌症全球甲基化组类型。 每个基因mRNA表达的z分数归一化后的数据每癌症类型,我们计算每组的平均基因的表达水平和对比组。 计算分数的丰富细胞循环和免疫途径(图。3 c),基因的排名t统计(复制时间区别正常与肿瘤细胞)被用于输入的preranked模块GSEA软件与REACTOME通路(提供https://reactome.org/属于细胞周期)或免疫系统类别。 通路窝藏至少10基因用于分析。
PMD和聚类分析的焦点在PMD甲基化
通过使用之前定义的位置HMDs pmd和每100 kb16,我们合并相同类型的连续域和留存> 300 kb的长度。 后分配平均甲基化变异和复制时间从正常到每个样本合并PMD,我们进行层次聚类。 尤其是浓缩的基因通路为集群计算使用二项测试。 估计的数量hypermethylated CpG岛启动子探针总之pmd对于每一个样本,我们首先计算均值和标准差的CpG岛HMDs探针在合并后,然后计算CpG岛启动子探针(标注为TSS200或TSS1500)总之pmd的甲基化水平大于两个标准差的意思。
分析免疫基因PMD的接近边界
总共77个免疫基因的途径丰富短pmd (n= 13; 无花果。4摄氏度),我们计算原始平均距离他们最近的头盔显示器(HMD定义为周et al。16),然后估计它的P价值通过生成背景分布。 我们随机挑选77 PMD基因和计算的平均距离他们最近的头盔显示器。 这个过程重复了10000次。
收集和识别标志基因集
我们获得标记的CD8 + T细胞和扩散(无花果。1 a, d从Thorsson等)。56和使用single-sample GSEA估计的活动标记。 基因集标识不同类型的免疫细胞和MHC(一级,二级和非经典的)来自Charoentong et al。57。 标志从MSigDB获得的免疫和增殖基因集55。 抗原呈现细胞因子和信号通路来自规范KEGG MSigDB通路55。 基因免疫签名设置分数得到的非整倍性研究10。 过滤掉特异表达基因在免疫系统中,我们使用了基因表达数据Illumina公司人力BodyMap 2.0项目(ftp://ftp.ncbi.nih.gov/gene/DATA/expression/Mammalia/Homo_sapiens/)。 的平均基因表达水平在白细胞和淋巴结5倍高于其余的组织(n= 14)被视为特异表达基因在免疫系统(n= 1216; 补充数据4)。
量化的第1行和ERV表达式
量化的第1行和ERV表达水平,我们一致RNA-seq读取1号线58和ERV59通过使用BWA序列库,分别60。 然后我们归一化映射的阅读数量一致的总数RNA-seq读取。 读取映射到这两个库或其他重复库58(Alu和上海广电)被排除在外。 规范化表达水平标准化/肿瘤类型的比较。
SMC组的临床资料
60晚期非小细胞肺癌患者接受anti-PD-1 / PD-L1从2014年到2017年在三星医疗中心为本研究(补充表3.)。 临床反应是反应评估标准评估的固体肿瘤(RECIST)版本1.1,最低6个月随访。 免疫疗法的反应分为持久的临床效益(DCB,应答器)或非持久效益(NDB,人)2。 部分响应(PR)或稳定的疾病(SD)持续超过6个月被视为DCB /应答。 进步的疾病(PD)或SD,持续了不到6个月被视为NDB /人。 无进展生存(PFS)从一开始就计算日期的治疗进展或死亡的日期,哪个是早些时候。 患者审查在最后随访的日期PFS如果他们没有进步和活着。 我们遵守所有相关的伦理法规与人类参与者。 知情同意。 本研究从三星医疗中心的机构审查委员会批准(2018-03-130和2018-03-130)。
Whole-exome、转录组和methylome SMC组的数据
肿瘤样本获得anti-PD1 / PD-L1治疗前,然后在福尔马林固定后嵌入到石蜡或保持新鲜。 DNA准备使用AllPrep DNA / RNA迷你包(试剂盒,80204),AllPrep DNA / RNA微工具包(试剂盒,80284),或QIAamp DNA FFPE组织工具包(试剂盒,56404)图书馆准备全外显子组测序。 图书馆准备是由使用SureSelectXT人类所有外显子V5(安捷伦科技公司,5190 - 6209年)根据指令61。 短暂,200 - 300 ng的肿瘤和正常基因组DNA是修剪,和150 - 200个基点的剪切end-repairing DNA片段被进一步加工,磷酸化,结扎适配器。 结扎DNA杂交利用whole-exome鱼饵SureSelectXT人类所有外显子V5。 库被量子位和2200 Tapestation,量化和排序Illumina公司HiSeq 2500平台2×100 bp配对结束。 目标覆盖正常样本和肿瘤样本××100。
人类的参考基因组的测序读是一致的(hg19) BWA mem模块(v0.7.12)60使用默认参数。 PCR重复读取都使用皮卡62。 我们使用Strelka263叫体细胞变异和选择单核苷酸变异(SNVs)和indels覆盖了至少10和五个读入肿瘤,分别。 我们进一步过滤掉150年dbSNP常见的生殖系变异存在64并使用ANNOVAR带注释的体细胞变异65。 SNVs过滤的列表并indels提供补充数据5。 拷贝数变异(CNVs)被称为使用CNVkit66圆形二元分割算法(补充数据6)。 非整倍性水平来自于叫做基因拷贝数异变。 具体来说,我们应用定义的阈值的±0.2(平均值LUAD LUSC)段日志2比率(肿瘤与正常)检测放大/缺失染色体臂的影响至少有10%或5%的染色体。 非整倍性水平绝对段日志的总和2它的长度比例,每个加权10。
RNA提取使用Allprep从相同的肿瘤组织DNA / RNA迷你包(试剂盒,80204)。 RNA提取从福尔马林固定石蜡包埋(FFPE)使用Rneasy FFPE工具包(试剂盒,73504)。 RNA是评估质量和数量使用nanodrop 8000紫外可见光谱仪(nanodrop技术公司)和4200 TapeStation仪器(安捷伦技术)。 RNA的完整性(RIN)数量> = 5图书馆被选为进一步准备。 总共500 ng RNA从新鲜组织和100 ng的RNA FFPE用于图书馆准备使用Truseq RNA库准备工具包v2 (Illumina公司,rs - 122 - 2001, rs - 122 - 2002)或Truseq RNA访问图书馆准备工具包(Illumina公司,rs - 301 - 2001, rs - 301 - 2002),分别。 库生成根据制造商的指示。 RNA图书馆多路复用和测序100个基点对终端读取HiSeq2500平台上(Illumina公司)。
RNA-seq读取对齐到人类基因组参考(hg19)和明星67和基因表达值是使用RSEM量化68。 基因在t值获得比较之间的信使rna表达水平较低的肿瘤(n= 14)和高全球甲基化水平(n= 13)被用于输入GSEA preranked模块的软件和KEGG通路和MHC基因集。
甲基化分析是由指令后,英飞纳姆MethylationEPIC BeadChIP工具包(Illumina公司,wg - 317 - 1002)。 短暂,500 ng基因组DNA (gDNA)用于亚硫酸氢转换使用EZ DNA甲基化工具包(D5001 Zymo研究)。 放大的亚硫酸氢gDNA变性和中和,并进一步处理的碎片。 分裂后,DNA被筛选了和resuspended杂交缓冲区,然后在BeadChip杂化。 BeadChip是准备染色和扩展后冲刷unhybridized DNA,并使用Illumina公司iScan成像系统。 原始文件被预处理强度minfiβ值使用preprocessIllumina函数69。 甲基化数据被视为全球甲基化水平评估部分中描述。 我们群的PMD水平样本计算基于史诗的平均探针Solo-WCGW PMD论文认定共同之处16(提供https://zwdzwd.github.io/pmd)。 冗余探针如multi-hit探测器使用的过滤功能冠军包70。 我们使用MethylCIBERSORT71和评估72估计肿瘤纯洁和白细胞分数(补充图。4)。 我们加工的原始甲基化强度文件81肺癌IDIBELL样本队列37相同的管道和合并使用战斗SMC组数据73。
黑色素瘤组数据
黑色素瘤患者无进展生存数据接受免疫抑制剂检查站(药品名称贴上Ipilimumab、Yervoy或Pembrolizumab;n= 15)下获得et al。9。 我们包括额外的25例接受其他类型的免疫疗法使用药物环球数码创意遗留的数据归档。 我们选择样本的类型(CDE_ID: 2793530)列表示免疫疗法治疗而不包括接受多种药物的患者样本。 这些样本的分子数据获得,TCGA分子和临床数据部分中描述。
多元的生存分析
全球甲基化和基因突变的负担被组合在一个多变量Cox比例风险模型使用coxph函数R .多变量逻辑回归模型被用来评估全球甲基化的影响和突变负担目标响应使用glm函数R。