基于网络的方法概述
抗pd-1治疗的疗效取决于肿瘤细胞表面主要组织相容性复合体(Mhc)Ⅰ类分子对肿瘤抗原的表达,以供细胞毒性CD8+T细胞监测。22。因此,我们假设在基因网络中任何接近MHCⅠ类基因的异常都可能解除MHCⅠ类抗原处理和呈递通路(以下简称MHC I通路)的调控,并影响肿瘤对抗-PD1的反应。我们提出的基于网络的方法如图所示。1.
图1:基于网络的方法。a计算每个基因与MHC I基因(蓝节点)的功能关联评分。与MHC I基因在功能上联系更紧密的基因(如基因1)比其他基因(如基因2)与抗PD-1反应的相关性更强。基因集富集分析(GSEA)用于根据关联评分排序的基因序列,确定与抗PD-1治疗反应相关的通路。通路A丰富了关联评分较高的基因,与抗PD-1治疗比途径B更有关联。b利用来自对抗PD-1治疗有反应和耐药的肿瘤样本的基因表达数据,可以确定特定癌症类型或细胞状况下抗PD-1治疗反应的相关通路。c将顶级基因(例如,前10%)整合到我们的关联预测中(如a)利用基因的免疫相关性(根据TCGA的转录数据计算),选择与抗PD-1治疗后各类型肿瘤反应相关的最高免疫阳性和阴性基因。其中,100个顶级免疫阳性基因被选为预测特定癌症类型抗PD-1治疗反应的标志。d通过整合tcga癌症类型的基因组改变数据和(())中所描述的最高免疫阳性和阴性基因,确定与抗pd-1治疗反应相关的基因组改变。c). e将药物靶点数据映射到最高的免疫阴性基因(如c)在特定的癌症类型中,找出对抗Pd-1治疗有潜在促进作用的化合物。基因表达,mut突变,CNV拷贝数畸变。
第一,网络犯罪关联法。19,23用于计算每个基因与mhcⅠ类基因的功能相关性(以下称为mhc i关联评分)。,PDCD 1,和CD 274(下称MHCⅠ通路基因)根据其相对接近这些基因在一个编译的基因网络(见方法)(见图)。1A)。MHC I关联评分较高的基因变异更有可能解除MHC I通路的调控,从而与抗PD-1治疗的肿瘤反应有关。
其次,我们认为MHC I关联评分高的基因丰富的途径也与肿瘤对抗PD-1治疗的反应有关(图一)。1A)。基因集富集分析(GSEA)24它可以评估基因在一个路径中的分布,在MHCⅠ关联评分排序的有序基因列表中,用于识别与抗PD-1治疗反应相关的通路(称为GSEA关联分析)。然而,由于我们在关联预测中使用的基因网络包含了跨越不同细胞类型和状态的分子相互作用,所以并不是所有预测的基因和途径都与特定癌症类型的MHC I通路相关。通过利用来自一组接受抗PD-1治疗的癌症患者样本的基因表达数据,我们能够识别与MHC I通路功能高度相关的基因和通路,并在特定的癌症类型中解除管制(图1)。1B)。相关通路的解除管制水平也可以用GSEA(称为GSEA解除管制分析)来确定。截断乘积法25(参见方法)用于组合p由GSEA协会和GSEA解除管制分析产生的每一条通路的价值,以确定在特定癌症类型中与抗PD-1反应相关的通路。
第三,用于研究肿瘤免疫浸润的tcga转录数据。26也可以与我们的网络MHCI关联预测集成(图一)。1C)确定特定癌症类型中抗PD-1治疗后与肿瘤反应相关的基因和途径。我们推测mhc i关联预测中的顶级基因,其表达与免疫浸润评分显著相关(估计值)。26在特定的癌症类型中,将与对该癌症类型的抗PD-1治疗的反应有关.因此,我们首先确定了每个基因的表达水平与特定TCGA肿瘤类型的免疫浸润评分之间的相关性。然后,我们将结果与mhc i关联预测结合起来,选择免疫阳性和阴性mhc I相关基因,这些基因是我们的关联预测中的前10%,其表达水平分别与特定癌症类型的免疫浸润评分(绝对相关≥0.2)呈极强的正相关或负相关。这些基因及其通路将与抗PD-1治疗的肿瘤反应有关。此外,我们还通过整合关联预测和tcga转录组数据(见方法)进行了Meta分析,选择前100位免疫阳性mhc i相关基因来计算标记评分,即MIAs,用于预测特定癌症类型的抗pd-1治疗后患者的反应(图1)。1C)。MIAS评分较高的患者比得分较低的患者更有可能对抗PD-1治疗有反应。方法部分详细介绍了MIAS评分的计算方法。
第四,目前抗pd-1治疗的临床队列规模仍然非常有限,对抗pd-1的反应进行了遗传关联分析。6。一些大规模的癌症基因组项目,如tcga,揭示了许多癌症类型的基因组情况。因此,利用我们的顶级mhc i关联预测来挖掘tcga数据将使我们能够在特定的癌症类型中探索与抗pd-1治疗相关的遗传和表观遗传变异(图)。1D)。在这里,我们从一种癌症类型的最高免疫阳性和阴性mhc i相关基因中筛选出反复改变的基因。
第五,我们还推断,在特定的癌症类型中,对某些免疫阴性mhc I相关基因的抑制很可能会促进抗pd-1治疗对该癌症类型的肿瘤反应。因此,从DGIdb数据库汇编的药物目标数据27被定位到特定癌症类型中最高的免疫阴性mhc i相关基因,以确定可能的抑制剂,可以增强对抗pd-1治疗该癌症类型的肿瘤反应(如图所示)。1E).
Mhc i通路相关基因和通路的预测及抗pd-1治疗的应答
我们的方法首先预测了与MHC I通路基因相关的基因。1A)。一些已知直接参与MHC I通路的基因,如TAP 1, 塔普2, CALR, TAPBP,和B2M28,在我们的预测列表中排在前1%(补充数据)1A)。预测中一些顶级基因的变化,如B2M, JAK 1, JAK 2, HSP 90,和IFNG,已知与抗pd-1治疗的不良反应有关。5,28,29,30,31。最近发现的几个与抗pd-1反应相关的基因也被发现在我们的关联预测列表中,例如克拉斯32, STK 1133, ATR34,和阿克塞尔35.
几个小组开发了基于T细胞的crispr/ca 9筛选器,以确定与肿瘤细胞和T细胞相互作用相关的基本基因。36,37,38,39,40。因此,我们利用这些研究中的六个基因集来全面评估我们的预测。六个基因集的接收机工作特性(ROC)曲线和曲线下面积(AUC)如图所示。2A。高的AUC值表明,在我们的关联预测列表中的许多顶级基因将与抗PD-1治疗的反应高度相关。通过配对重叠分析,我们还发现,我们预测的前10%的基因与所有六个基于CRISPR的基因集都有显著的重叠(补充图)。1)。然而,在不同的研究中,一些CRISPR基因集之间的重叠并不显著。这可能是由于在他们的实验中使用了不同的技术或细胞来源。
图2:使用基准基因集和已知的抗PD-1治疗相关通路对MHC-I关联预测的评价。a基于CRISPR的6个基因组和一组癌症通路基因的ROC曲线:来自芒果(Manguso)的81个基因、PanPmel1(PanPmel1)的PMEL-1T细胞鉴定的289个基因、Pan-1T细胞鉴定的138个基因(PanOT1)、Patel(Patel)的109个基因、Li(LI)的74个基因、Lawson(Lawson)的182个基因和京都基因和基因组(KEGG)的328个基因(癌症途径基因)。将这7个基因组中的基因作为阳性实例处理,将基因网络中的其余基因作为阴性实例处理。TPR真阳性率、FPR假阳性率、AUC面积下ROC曲线.b根据我们的预测,我们预测了Wnt通路的GSEA关联图。GSEA评估该通路的基因在我们的关联预测生成的有序基因列表中的分布。c在我们的预测中,一些与MHC I通路显著相关的通路。条的长度表示统计意义的大小(以−log 10表示p在GSEA关联分析、GSEA放松管制分析或使用截断乘积法的组合分析中,给定路径的值)。此图中所有面板的源数据都在源数据文件中提供。
接下来,我们将GSEA应用到我们的关联预测中的基因有序列表中,以推断与抗PD-1治疗相关的通路(图1)。1B)。研究结果还显示,已知与抗PD-1治疗反应相关的几条途径在我们的预测列表中居首位(如图所示)。2C;补充数据1B):WNT通路(此通路的GSEA关联图如图所示。2B)、PI3K-AKT通路、MYC通路、MAPK通路、干扰素信号通路和TP 53通路。41,42,43,44。由于这些关联预测并不是特定的癌症类型,我们还将我们的预测与来自抗pd-1治疗应答者和无效者的肾细胞癌样本的基因表达数据相结合。45。我们对基因表达数据进行了分析,并利用GSEA检查了这些通路的解除管制情况。GSEA协会和GSEA解除管制分析的结合揭示了一些在我们的预测中与MHC I通路高度相关的通路,并且在反应和非应答肾癌样本之间显着地解除了管制(图一)。2C;补充数据1B).
此外,最近提出的抗pd-1治疗反应或抵抗机制的几条途径也被我们的方法所确认(补充数据)。1B),如DNA损伤/修复途径46和缺陷转录延伸47.
一些作为网络枢纽的癌症基因与抗pd-1治疗的反应有关。
我们发现许多已知的癌症基因都在我们的mhc-i关联预测的首位,例如Akt 2, EGFR, TP 53, PTEN, MAPK 1, MAPK 3, CTNNB 1, AKT 1, JAK 1,和JAK 2(补充数据)1A)。我们用京都基因和基因组(KEGG)癌症路径汇编的328个癌症相关基因对我们的关联预测列表进行了ROC曲线评估,也表明许多癌症途径基因在我们的预测列表中居首位(图一)。2A)。重叠分析表明,所有6个基于CRISPR的基因集也与KEGG癌症通路基因集或从两个数据库编译的其他癌症基因集有显著的重叠(图1)。3A)。这些结果表明,许多肿瘤基因及其相关通路可能与MHC I通路和患者对抗PD-1治疗的反应密切相关。
图3:一些作为网络枢纽的癌症基因与抗PD-1治疗的反应有关.a我们的MHC I关联预测表(TOP基因)中前10%的基因的重叠分析和所有基于CRISPR的基因集的重叠分析(与图相同)。2)使用从数据库中编译的三个癌症基因集(见方法)。热图图中的颜色标度表示重叠的统计意义,−log 10(p-数值),由单边超几何学检验计算。b利用六种基于CRISPR的基因集和KEGG癌症通路基因集,用度中心法进行预测的评价。这些基因集如图所示。2. cSpearman对MHCⅠ关联预测和全度中心度预测的秩相关分析。dSpearman对MHCⅠ关联预测和中间中心性预测的秩相关分析。相关性相关系数p-分析值显示在每个相关图的上角。此图中所有面板的源数据都在源数据文件中提供。
我们推测,这些癌症基因可能是网络中的枢纽,直接或间接地解除了多个分子通路的管制。19,48,包括MHC I通路,抑制免疫系统,促进癌细胞的生长、存活和增殖。为了验证这一点,我们首先计算了编译网络中所有基因的三种中心性评分:程度、中间度和特征向量中心(见方法)。然后,我们使用基于CRISPR的六个基因集来评价三种中心性方法所产生的结果。图中的中华民国曲线。3B结果表明,6个CRISPR基因集的度中心性结果与所有6个CRISPR基因集的结果具有较好的相关性。其他两种中心性方法(补充图)也有类似的结果。2和3)。图形3C,d,以及附图。4分别表明,MHCⅠ关联预测的程度、中间度和特征向量中心性方法的结果均与我们的MHCⅠ关联预测结果高度相关。综上所述,这些结果表明,一些癌症基因在分子网络中起枢纽作用,间接地解除了某些途径,如MHC I通路,从而驱动癌细胞的免疫逃逸。
挖掘tcga数据以识别与抗pd-1反应相关的遗传变异和通路
一些大规模的癌症基因组项目,如tcga,已经揭示了几种癌症类型的基因组情况,也可以与我们的网络关联预测集成(图一)。1C,d)确定特定癌症类型中抗PD-1治疗后与肿瘤反应相关的遗传变异和通路。在我们网络关联预测的前10%的基因中,我们首先根据mhc-i的表达水平与估计的免疫浸润评分(绝对相关≥0.2)的相关性,选择了最高的免疫阳性和阴性的mhc-i相关基因。26在TCGA癌症类型的所有样本中。我们发现前10%的关联预测列表(补充数据)1A)在大多数癌症类型中显着地丰富与免疫浸润相关的基因(如图所示)。4A)。平均而言,在一种癌症类型中发现了大约800个最高的免疫阳性和阴性的mhc i相关基因;在所有癌症类型中,总共发现了2008年的基因(补充数据)。2)。这些顶级的免疫阳性和阴性的mhc i相关基因有望与每一种癌症类型的抗PD-1治疗反应或耐药性相关。对每种癌症类型的这些顶级免疫阳性和阴性基因的通路分析也揭示了在某些癌症类型中与抗-pd 1反应相关的几条众所周知的途径,例如PI3k信号通路、IFN-γ和wnt通路(补充数据)。3A和3B).
图4:MHC I关联预测与TCGA数据的集成.a对34种肿瘤类型,MHCI关联预测表前10%的基因与免疫浸润评分(绝对相关≥0.2)显著相关的基因之间的重叠分析。b用500个顶级免疫阳性和阴性基因对34个TCGA肿瘤类型的免疫浸润相关值进行了分级聚类,表明相关组织系中的肿瘤类型聚类在一起。此图中所有面板的源数据都在源数据文件中提供。
在比较了所有癌症类型中最高的免疫阳性和阴性mhc i相关基因之后,我们发现只有59个基因在所有癌症类型中共享(补充数据)。4)。所有59个基因均为免疫阳性,大部分与T细胞诱导的溶细胞过程有关。此外,我们还发现,在所有癌症类型中,这些2008基因中的某些基因与免疫浸润的相关方向并不一致;也就是说,它们在某些癌症类型中是正相关的,而在另一些类型中则是负向的(图一)。4B)。此外,这些2008年基因中的500个最可变基因的免疫浸润相关性的分级聚类表明,相关组织系中的癌症类型被聚在一起(图一)。4B)。例如多形性胶质母细胞瘤和低级别胶质瘤聚集在一起,肺鳞状细胞癌/肺腺癌、肾嫌色癌/肾乳头状细胞癌、胃腺癌/胃和食管癌。这些结果表明,与抗PD-1治疗反应或耐药相关的分子机制可能是组织和谱系依赖性的。
此外,我们可以将这些顶级免疫阳性和阴性mhc i相关基因定位到tcga中的突变和拷贝数数据,以确定可能与每种癌症类型的抗pd-1反应或耐药相关的遗传变异。表1列出了黑色素瘤中已发现的一些基因异常。我们发现了一些已知的与抗pd-1耐药相关的基因变异,例如拷贝数丢失。B2M和IFNGR 129,30的拷贝数增益MYC42。表中几个已鉴定的基因1最近的研究表明,在其他癌症类型中,适应性免疫反应与适应性免疫反应有关,并将成为黑色素瘤潜在的生物标志物和治疗靶点。首先,p16-cyclinD-CDK 4/6-视网膜母细胞瘤蛋白通路在大多数黑色素瘤中存在异常。49。最近,CDK 4在小鼠乳腺癌模型中发现与抗肿瘤免疫有关。50的基因产物的抑制作用CDK 4能增加pd-l1的表达,提高体内抗pd-1的治疗效果。51。因此,CDK 4拷贝数增加将与抗Pd-1治疗黑色素瘤的耐药性有关.第二,基因的过度表达PTK 2已被证明能促进人黑色素瘤异种移植的转移。52。几项研究还表明,沉默PTK 2能使胰腺癌对抗PD1产生反应53。拷贝数增益PTK 2因此与抗Pd-1治疗黑色素瘤的耐药有关.第三,泛素化在MHCⅠ通路中起重要作用。54在癌症的发展过程中55。因此,泛素C的突变UBC)可能与抗Pd-1治疗黑色素瘤的耐药有关.第四,一些研究表明,翻译起始因子3b(EIF3b)是最大的翻译起始因子的一个关键亚基,其作用是保证翻译起始的准确性,它与肿瘤的发生密切相关。56。徐等人57报告说EIF3B基因表达通过激活β-catenin信号通路促进食管鳞状细胞癌的进展,促进免疫逃逸和抗pd-1抵抗。41。因此,拷贝数增益为EIF3B通过β-catenin激活,可能与抗Pd-1治疗黑色素瘤的耐药有关.
表1为TCGASKCM筛选的基因的化合物、遗传变异和免疫浸润评分相关性。 抗PD-1联合治疗的潜在治疗靶点
我们还推测,针对我们的关联预测列表中的一些顶级基因和途径的疗法可以克服阻力,扩大抗PD1治疗的临床应用范围。最近,一些靶向治疗和化疗联合抗PD-1疗法的临床试验已经完成.为了评估我们的方法预测治疗靶点与抗pd-1联合使用的能力,我们手工收集了36个化合物的155个靶基因,这些基因已经在临床试验中测试过,或者用于抗pd-1治疗癌症的联合治疗(补充数据)。5)。如图所示。5这些化合物的许多目标都在我们的MHC I-缔合分析和三种中心性方法的预测列表中。这表明,这些网络方法可以帮助确定有针对性的治疗策略,以提高患者对抗PD-1治疗的反应。
图5:抗PD-1联合治疗的治疗指标的预测性能。ROC曲线评估MHCI关联方法和其他网络中心性方法的预测,使用36个化合物的靶基因,这些化合物已经在临床试验中测试过,或用于抗PD-1治疗的联合治疗。此图的源数据在源数据文件中提供。
我们还探索了TCGA,SKCM数据集,以确定额外的潜在治疗目标在黑色素瘤。我们认为,抑制所选的免疫阴性mhc I相关基因的表达将增强免疫浸润,使其成为与抗PD-1联合治疗的潜在治疗靶点。从DGIdb数据库汇编的药物目标数据27然后将其定位到这些顶级免疫阴性的MHCI相关基因上,以确定与抗PD-1联合治疗的潜在化合物。表1列出了SKCM的一些已鉴定的化合物,并引用了与免疫应答相关的文献。我们鉴定出的一些化合物,如组蛋白去乙酰化酶和聚adp核糖聚合酶抑制剂,没有包括在上述性能评估所用的36种化合物中,目前正在与抗pd-1疗法结合进行临床试验。58,59。其他已被证实与免疫反应相关的化合物也可用于抗PD-1治疗黑色素瘤的联合治疗。首先,一种用于治疗白血病和淋巴瘤的抗肿瘤药物--反尼露素diftitox(Denileukin Diftitox)抑制了延伸因子2(EEF 2)的ADP核糖基化产生的蛋白质合成,导致细胞死亡。60。最近的一项研究47报道过高表达EEF2抗Pd-1治疗肾细胞癌和转移性黑色素瘤时,基因抑制炎症反应通路,并与不良反应相关。这意味着去黑素可用于增强黑色素瘤的免疫反应。第二,蛋白质精氨酸甲基转移酶1(PRMT 1)参与干扰素信号传递61,一些研究指出,蛋白质精氨酸甲基转移酶5(PRMT 5)可能参与调节某些免疫应答基因的表达62。最近的一些研究表明,一些表观遗传靶向药物,如dna甲基转移酶抑制剂,在某些小鼠模型中可以诱导T细胞的吸引和增强icb的疗效。63。因此,编码蛋白质的抑制剂PRMT 1和PMRT 5可与抗Pd-1联合治疗黑色素瘤.第三,Li等人。64结果表明,糖原合成酶激酶3β(GSK 3β)与Pd-L1相互作用,可诱导Pd-L1磷酸化依赖性蛋白酶体降解。泰勒等人的一项研究。65还报道了GSK 3β抑制剂可下调Pd-1的表达,增强CD8+T细胞在肿瘤治疗中的作用。因此,GSK 3β抑制剂tideGlusib与抗PD-1联合治疗可能是治疗黑色素瘤的一种很有前途的策略。第四,蛋白激酶C epsilon基因(PRKCE)在大多数实体肿瘤中过度表达,并在不同的肿瘤相关通路中发挥关键作用,包括在诱导先天免疫和适应性免疫过程中发挥作用的Toll样受体4(tlr-4)信号。66。最近发现tlr-4信号可以改善慢性病毒感染时抗pd-1的治疗。67。因此,蛋白激酶C抑制剂扎司他林(Enzastaurin)可增强抗Pd-1治疗黑色素瘤的能力.
Mhc i相关免疫核心与抗pd-1治疗的病人反应有关。
我们的MHCI关联预测可以集成到特定癌症类型的TCGA转录数据中,选择标志性基因来计算MIAS评分,以预测癌症类型中抗PD1治疗的患者反应(图一)。1C)。在这项工作中,我们通过应用我们的治疗黑色素瘤的方法来证明这种能力,而抗PD-1疗法是最有效的。我们首先使用一种元分析方法(见方法)将我们的mhc i关联预测与基因表达免疫相关数据结合起来,使用tcga黑色素瘤样本进行计算,选择100个顶级免疫阳性mhc i相关基因(补充数据)。6)用于响应预测。在此,TCGA黑色素瘤样本可视为选择签名的训练集。然后,我们使用来自6个黑色素瘤队列的411个样本(补充数据)验证了这一特征的预测能力。7)16,68,69,70,71,72单用抗Pd-1治疗,或联合抗CTLA-4治疗。我们对411份样本的基因表达数据进行了分析,并使用该标记计算了他们的MIAS评分(见方法)。然后用MIAS评分和临床反应数据计算AUC,以量化我们的MIAS方法的预测能力。此评估分别应用于每个队列数据集以及来自所有队列的组合数据集。如图所示。6A大多数数据集的AUC值显著高于随机期望值(AUC=0.5)。然而,由于一些数据集的大小很小,因此ROC曲线的评估可能不可靠。73。因此,我们还使用了Wilcoxon-mann-Whitney统计量,该统计量与rc曲线的aUC直接相连。74,以评估我们的MIA方法的性能。实际上,我们发现Wilcoxon检验和AUC的结果在一些小数据集中是不一致的;也就是说,一些小数据集的AUC值很高,但在Wilcoxon检验上没有显著的p值(例如,Auslander.PD1.Pre_2018数据集)。
图6:抗PD-1治疗反应预测的表现.a p-单侧Wilcoxon检验值和接收者操作特性曲线(ROC)曲线下面积(AUC)的值,该曲线量化了我们的MIAS评分对几个黑色素瘤患者队列数据集(Auslander、Gide、Hugo、Liu、Riaz、Abril-Rodriguez)和聚合数据集(SKCM.All)对抗-PD1反应的预测性能。“prep”表示治疗前;“on”,在治疗期间。两个条形图中的垂直虚线分别表示。p-数值=0.05,AUC=0.5。不同队列的数据集用不同的颜色着色。b我们的方法与三种先前的方法,IMPRES,潮汐,和GEP的性能比较,使用了六组黑色素瘤患者数据集的单侧Wilcoxon检验。条形图中的虚线表示p-数值=0.05。c四种模型场景与三种先验方法的性能比较采用单边Wilcoxon检验,对所有411个样本进行融合。这四种模型场景根据MIA的两个主要元素(分别表示MHC-I和估计)的组合,选择不同的特征基因进行响应预测。条形图中的虚线表示p-Wilcoxon检验值=0.05。d对411个样本的MIAS和其他三种方法的成对集成预测的性能。热图图中的颜色标度表示预测性能的统计意义,−log 10(p-数值),由单侧Wilcoxon检验计算。每个方法的性能的统计意义也列在其名称后面的括号内。此图中所有面板的源数据都在源数据文件中提供。
接下来,我们将MIA方法的性能与最近提出的其他三种方法IMPRES的性能进行了比较。16潮17,和GEP75,由Wilcoxon-Mann-Whitney检验(图1.6B)和AUC(附图)。5)。结果表明,在大多数数据集中,MIAS方法的预测性能优于以往的三种方法。黑色素瘤中MIA的预测是建立在前100位免疫阳性MHC I相关基因的基础上的,这些基因主要是通过整合两个元素来选择的(参见Eq)。(8方法:(A)他们的MHCⅠ关联评分(表示MHC-I);(B)它们的表达与黑色素瘤免疫评分(表示估计值)的相关性。为了确定MIA方法中的这两个元素是如何比以前的三种方法具有更好的预测性能,我们考虑了四种方案,即根据这两种元素的组合选择特征基因来计算ssGSEA富集分数(见方法),以预测所有的411例黑色素瘤样本的反应。第一个方案表示MHC-I+估计,这是我们的MIA方法,它的特征基因是根据这两个元素来选择的。因此,MIA方法的特征基因是那些与黑色素瘤免疫浸润相关的顶级MHC I相关基因。第二种方案表示MHC-I+nESTIMATE,仅根据MHC-I关联评分选择前100位基因。因此,在这种情况下,100个MHC I相关基因可能并不都与黑色素瘤中的免疫浸润有关。第三种方案表示NMHC-I+估计,仅根据估计元素选择前100位免疫阳性基因。因此,本方案中的100个免疫相关基因可能并不都与MHC-I通路和抗-PD1应答有关。第四种情况是NMHC-I+nESTIMATE,随机选择100个基因进行预测(也就是说,这两种基因都没有被用来选择基因)。接下来,我们通过Wilcoxon-Mann-Whitney检验,将这四种情景的预测性能与三种先验方法的预测性能进行了比较。6C)。结果表明,我们的MIAS方法(MHC-I+估计)的预测性能明显优于其他三种方案,说明这两种因素对MIAS的预测性能都有重要的影响。我们还发现,第三个NMHC-I+估计方案的预测性能与GEP相当.类似于第三种情况,即标志性基因只与免疫浸润水平相关,GEP的预测是基于18个炎症基因的表达水平。75。虽然潮汐在预测中使用的特征也与免疫浸润水平有关,但它比第三种方案和GEP有更好的性能,这可能是因为它的两种不同类型的特征分别与T细胞浸润功能障碍和排斥有关。17。然而,潮汐的预测性能仍然比我们的MIAS方法差得多。MIAS在抗PD1反应预测中表现更好的一个解释是,它的特征基因是那些与黑色素瘤免疫浸润相关的顶级MHC I相关基因。
此外,与MIAS、TEAD和GEP相比,IMPRES的预测涵盖了免疫反应机制的不同方面。IMPRES的预测是基于免疫检查点基因表达之间的15对成对关系。16,采用神经母细胞瘤的回归和进展训练数据,而非黑色素瘤患者样本,用抗PD1治疗。因此,15对转录相关可能并不是所有的预测抗-PD1反应在黑色素瘤。尽管如此,我们认为MIA和IMPRES分数的集成可以提高整体预测性能,因为它们是相辅相成的。我们使用Wilcoxon-Mann-Whitney检验对综合数据集(例如所有411个样本)的综合分数的预测性能进行了评估(图1)。6d)和AUC(附图)。6)。结果表明,综合得分优于两种方法。相反,在综合预测MIAS和其他两种先验方法时,性能没有得到改善。
此外,我们发现mias和前面的三种方法在预处理数据集中的表现都很差,但在处理数据集上的表现要好得多,除了gide数据集之外。71。为了探讨治疗前和治疗前的差异,我们比较了他们估计的免疫浸润评分。26并发现预处理数据集的免疫浸润水平均显著低于治疗前数据集(附图)。7)。我们还比较了所有治疗前和治疗前的免疫浸润细胞的组成,用ssgea富集了29个免疫细胞基因的分值来计算。15,并发现大多数在治疗中的样本比治疗前的样本有更多的浸润免疫细胞(补充图)。8)。这与预期的抗-PD1可以增强免疫反应是一致的。正如上述段落所述,MIAS、THED和GEP的预测是基于与免疫浸润相关的特征基因。因此,这些方法在预处理数据集中性能较差的原因可能是由于这些样本的免疫渗透水平较低。其他类型的数据,如突变负担,可能需要整合,以便在预处理样本中进行更可靠的响应预测。
以上结果表明,MIAS评分可以作为建立抗PD1响应预测的综合机器学习模型的一个有用的特征。计算黑色素瘤样本MIA分数的R脚本可在GitHub存储库(Https://github.com/perwu/MIAS)。我们还利用收集到的411例黑色素瘤样本(290例治疗前和121例治疗中)的MIAS和IMPRES评分作为数据特征,并应用支持向量机分别对治疗前和治疗中的黑色素瘤患者样本进行综合反应预测。通过五重交叉验证计算的这些预测指标的准确率列在补充表中。1。这些预测器(也可在Https://github.com/perwu/MIAS)可以帮助人们直接利用转录数据预测SKCM患者样本的反应。