您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2021
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

从接受治疗的肿瘤标本中提取的通路信号可以预测转移性黑色素瘤对抗PD1阻断剂的反应

 二维码
发表时间:2021-10-22 09:48作者:武汉新启迪Xinqidibio

摘要

基因组和转录标记已经被开发来预测转移性黑色素瘤对免疫检查点阻断(Icb)疗法的反应;然而,这些特征大部分来自于治疗前的活检样本。在这里,我们在治疗前(PAS-PRE)和治疗中(PAS-Pre)建立基于路径的超级特征,基于转录数据和临床信息从大量的转移黑色素瘤数据集作为训练集,以抗PD1为基础治疗黑色素瘤。三个独立的转移性黑色素瘤数据集作为验证集,分别验证了传递信号和传递信号,曲线下面积(AUC)分别为0.45~0.69和0.85~0.89。我们还合并了所有测试样本,并分别获得了0.65和0.88的AOC值,分别用于PAS-Pre和PASON签名。与现有签名相比,传递签名在所有四个数据集中都显示出更健壮和更优越的预测性能。总之,我们提供了一个建立基于路径的签名的框架,它是基于治疗后肿瘤标本对抗PD1治疗反应的高度准确的预测。这项工作将为应用从治疗中的肿瘤样本中提取的基于路径的信号来预测患者对ICB疗法的治疗反应提供理论依据。

导言

虽然免疫检查点阻断(Icb)疗法在治疗转移性黑色素瘤和许多其他类型的癌症方面取得了显著的成功,但只有一部分患者获得了长期利益,并取得了持久的临床疗效。1,2,3,4。缺乏强有力的临床工具来指导ICB治疗不仅不能对患者进行分类,而且会导致过度使用,这可能会带来相当大的副作用和成本。因此,有必要确定ICB治疗反应的预测生物标记物,以指导和优化治疗决策。

先前的基因组和转录研究已经确定了许多预测转移性黑色素瘤对ICB治疗的反应的生物标记物。5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20。这些预测生物标记物包括肿瘤突变负担(TMB)和新抗原负荷。5,6,9,10,21,22,HLA-I基因型23,24,溶细胞活性13非整倍体12,以及T细胞库11。此外,在肿瘤或肿瘤免疫微环境(Time)中表达的免疫预测评分(Impres)和干扰素-γ反应基因(Time)等基因表达特征也与预测转移性黑色素瘤对icb治疗的反应有关。7,8,11,12,13,14,15,16,17,18,19,20。由15个免疫基因组成的IMPRES在几个独立的数据集中被开发和验证,这些数据表明对转移性黑色素瘤的ICB治疗有很高的预测能力。一种由18位干扰素-γ反应基因组成的全肿瘤T细胞炎症基因表达谱(Pgp)被证实,可以预测包括黑色素瘤在内的9种肿瘤标本对icb治疗的反应。17。Mhc-i/ii基因标记也可作为预测黑色素瘤icb治疗反应的生物标志物。19,25,26。在这些标记中,TMB和基因表达信号被广泛应用于许多预测ICB治疗反应的研究中。然而,这些研究在大多数情况下是有限的,因为这些预测特征通常是建立在临床前模型、临床队列中只有治疗前活检、外周血样本和具有有限数量转录本的NanoString rna面板上,而不是全转录rna序列(RNAseq)数据。8,27,28,29。事实上,由于批处理效应、缺乏重现性或其他原因,ICB疗法的大多数预测特征未能在队列中得到验证,从而引发了这一领域的争论。30,31,32,33。例如,Carter等人。表达了他们对IMPRES的关注14,指出它不能重复预测对转移性黑色素瘤的ICB疗法的反应。30。肖等人也提出了免疫细胞的可重复性问题。34跨不同的RNAseq数据集32.

事实上,从概念和技术上来说,开发一个可靠和可靠的特征来预测对ICB治疗的反应是很有挑战性的。跨独立数据集和潜在的各种癌症类型的签名的可重现性是在临床实践中广泛应用之前的一个基本要求。因此,我们认为,由于基因表达数据和批处理效应所固有的噪声,由有限数量的基因构建的单个基因或预测标记可能会降低重复性和通用性。35。鉴于这个原因,一些研究开发了基于路径的预测签名,以减轻批处理效应和其他技术问题,这表明与基于单个基因的预测签名相比,具有更高的重现性。35,36,37,38。以前的一项结合致癌通路信号的研究BRAF, 克拉斯,和PI3KCA突变显示对西妥昔单抗对结直肠癌患者有良好的预测作用。37。另一项研究综合了基因表达和药物敏感性数据集,对10种癌症类型的数百种抗癌化合物进行了测试,并确定了几个基于路径的特征,这些特征对癌症的治疗具有高度的预测作用。35。不幸的是,大多数已发表的基于路径的信号主要集中在预测化疗或靶向治疗的反应上。35,36,37。因此,它需要进一步的研究,以构建和验证基于路径的签名,将忠实和准确地预测对ICB治疗的反应。

在这项工作中,我们开发了基于路径的信号来预测转移性黑色素瘤对基于抗PD1的治疗的反应,在四个独立的数据集中使用RNAseq数据和治疗前和治疗中的转移性黑色素瘤的临床信息。我们从抗PD1的肿瘤标本中鉴定出明显富集的通路信号。r在治疗前和治疗时间点,被试者(R)与无反应者(NR)比较.我们还识别出在治疗前与治疗前反应者的治疗样本中不同表达的通路信号。最后,我们询问这两种类型的信号在预测转移性黑色素瘤对抗PD1治疗的反应方面的能力,并与现有的预测信号进行比较。总之,我们证明从治疗中的肿瘤标本中提取的基于通路的信号可以很好地预测转移性黑色素瘤患者对抗PD1阻断疗法的反应。

结果

病人队列和计算框架

在本研究中,我们分析了四个已发表的数据集和一个新生成的数据集,这些数据可用于治疗前和治疗中的转移性黑色素瘤患者,这些患者接受抗PD-1/PD-L1单药治疗,抗PD-1/PD-L1单抗治疗,或抗PD-1联合抗CTLA-4治疗(见图)。1A,b)。我们设计了一个计算框架来发现基于路径的特征,以预测患者对icb治疗的反应。在这个框架中,我们首先通过训练数据集生成签名,然后在验证数据集中测试广义预测能力。因为里亚兹等人的样本量。DataSet是所有四个数据集中最大的,我们将其指定为训练数据集,并为验证目的分配了Lee等人、Gide等人和MGH队列的其他三个队列(图1)。1C).

图1:队列合并和计算工作流。
figure1

一个, b样品包含和排除标准流程图。a选择抗PD-1治疗的黑色素瘤患者作为训练数据集,包括治疗前49例和治疗中54例。b三个独立的黑色素瘤队列和一个新生成的队列被登记为验证数据集。最后对135个预处理样本和84个待处理样本进行了分析.c模型构建和验证的计算流程。分别利用Riaz等人的预处理样本和治疗样本构建预测模型.数据集模型在三个独立的数据集中得到验证。非评估,R响应者,和NR无响应者。

在Riaz等人案中。数据集3968例108例患者接受抗PD1单药治疗(59例),或未接受抗CTLA-4治疗(49例)。1A和补充数据1A)。排除那些在实体肿瘤(RECIST)中没有反应评估标准的患者(RECIST)(n=4),以及那些没有RNAseq数据的人(n(1)在治疗前,共检出49例活检标本,在治疗时间点为54例活组织检查。这相当于84对治疗前和治疗中的活检和19例未配对的活检。在治疗前样本组中,18例来自应答者(R),31例来自无效者(NR)。在治疗样本中,R组21例,NR组33例。

在吉德等人案中。数据集4054例63例患者接受抗PD1单药治疗,其中30例有抗CTLA 4,51例58例采用抗CTLA 4联合抗PD1治疗。1B和补充数据1B)。在排除31例没有RNAseq数据的活检后,我们在分析中包括了32对治疗前和治疗中的活检和58例未配对的活检。处理前样品72份(R 45份,NR 27份),处理样品18份(R 11份,NR 7份)。

在Lee等人案中。数据集41对55例94例患者进行抗PD1单药治疗,包括Nivo(Nivo)或pembro(Pembro)。1B和补充数据1C)。在分析中共包括了28对治疗前和治疗中的活检和51例未配对的活检。治疗前44例(R 22例,NR 22例),治疗前35例(R 6例,NR 29例)。

我们还分析了在马萨诸塞总医院接受抗PD1/pd-l1单药治疗的转移性黑色素瘤患者的队列,包括已发表的数据集。14和新生成的数据集为这项研究(图。1B和补充数据1D)。这个MGH组包括42对治疗前和治疗中的活检和8例未配对的治疗前和治疗中的活检。在MGH队列中,有19个肿瘤治疗前样本(n=6表示R和n=13份(NR)及31份正在处理中的肿瘤样本(n=5表示R和n=26(NR)。

基于路径的预处理样品的超签名

为了研究抗PD1阻断剂治疗转移性黑色素瘤患者治疗前的信号的预测性能,我们首先使用弹性网络惩罚Logistic回归(ENLR)模型,在Riaz等人的预处理样本基础上构建基于预测路径的信号。训练数据集我们基于路径的签名构建需要一个计算管道,包括差异表达基因分析(DEGS)、基因集富集分析(GSEA)、候选路径筛选以及ENLR模型的训练和验证(图1)。2A)。通过对DEGS的分析,我们从R中筛选出190个与NR(Log)相比前处理样本中显著上调的基因。2FoldChange>1和Wald试验p < 0.05) (Fig. 2B和补充数据2A)。为了识别mSigdb反应组中与治疗前反应表型相关的基因集,我们根据dgs的基因等级列表实施了gsea,并确定了98条显著丰富的途径(富集分数>0,fdr<0.05)(补充数据)。2B)。我们通过归一化富集评分(NES)对过滤路径进行排序,并将重点放在前15位路径上(图1)。2C)。接下来,我们进行了单样本gsea(Ssgea),利用前沿基因对15条路径中的每一条路径进行了评分,并将r的ssGSEA值与ddr校正Welch的nr值进行了比较。t-试验(FDR<0.05)。二维空间和补充数据2C)。基于路径评分,我们随后使用ENLR模型来识别预测准确率最高的路径。为了缓解分类不平衡的问题,在ENLR模型中采用了成本敏感性法和三重交叉验证训练法,确定了最优惩罚参数,误差在最小标准误差范围内,并计算了每个候选路径的影响大小(附图)。1A,b)。随后,我们获得了预测抗-PD1治疗反应最有效的6个途径:(1)补体级联;(2)胰岛素样生长因子IGF转运和胰岛素样生长因子结合蛋白IGFBPs摄取的调节;(3)清道夫受体结合和摄取配体;(4)血浆脂蛋白重塑;(5)白细胞介素2家族信号;(6)RA生物合成途径(附图)。1C,d)。清道夫受体和白细胞介素2家族信号通路的补体级联、结合和摄取与免疫和炎症有关,而血浆脂蛋白重塑和RA生物合成途径则与代谢有关。以有效大小为权重,计算了这六条路径的ssGSEA值的加权平均值,并将其命名为基于路径的超签名(PASS)评分。Riaz等人的预处理样本(PAS-PRE)的PASS分数的分布。数据集显示,与NR相比,R中的PAS-Pre分数显著高于NR(p=0.004;单边秩和检验)(图1.2E和补充数据二维空间)。为了量化PAS-PRE的预测能力,我们生成了接收机算子特征(ROC),并观察到曲线下的面积(AUC)为0.73(图)。2F),突出了PAS-PRE的良好预测能力。此外,我们还评估了路径标志评分与患者生存的关系。我们根据签名评分计算每个样本的优势比,然后将患者分为高、低两个亚组,以优势比均值为界,并进行总体生存(OS)和无进展生存(PFS)的Kaplan-Meier生存分析。与低签名组相比,高签名组OS和PFS明显改善(OS:HR=3.6,95%CI 1.5~8.7,P<0.05)。p=0.0028;PFS:HR=3.6,95%CI 1.7-7.6p < 0.001) (Fig. 2G,h).

图2:预处理样本的基于路径的超签名。
figure2

aRiaz等人基于预处理样本的模型构建计算流水线。队列。bRiaz等人治疗前应答者(R)与非应答者(NR)基因表达差异分析的火山图。队列。计算Log2Fold变化(FC)。双面Wald测试用于测试响应者和非应答者之间是否存在差异表达。蓝点代表明显的下调。基因(log2Fold Change<−1,P-数值<0.05)。红色的点代表明显的放大(符号)。基因(log2Fold Change>1,P-数值<0.05)。灰色点代表非显着性(NS)基因。c15个最佳候选路径的GSEA结果。计算了归一化富集分值(NES)和前沿基因集的大小.基于置换P-数值显示了富集分数的统计意义。排列的数目是10,000。错误发现率(FDR)是归一化富集分数表示假阳性发现的估计概率。dRiaz等人的预处理应答者(R)和非应答者(NR)的ssGSEA值的热图。队列。不响应者呈现左侧的样本数,响应者呈现右侧的样本数。Fdr校正双面焊t-比较R和NR样品的ssGSEA值,只有FDR<0.05。e前处理样本的路径超签名(PAS-PRE)的盒形图,反应者(R)和非应答者(NR)在Riaz等人中的签名评分。队列。这个P-数值是通过单边秩和检验计算的.方格中心线表示中间线,方框边缘表示四分位数范围,晶须延伸到最小和最大,离群点使用“*”符号单独绘制。fROC和AUC PAS-PRE对Riaz等人的预处理样品。队列。G,h总体生存(OS)的Kaplan-Meier生存分析(g)和无进展生存(PFS)(h)的前处理样品。队列。采用双面对数秩检验方法,以预处理样本奇数比作为截止点,对高、低亚组进行了比较。危险比(HR)用置信区间(CI)表示。源数据作为源数据文件提供。

我们进一步验证了PAS-PRE在三个独立数据集中的预测性能,这些数据可以用于预处理样本,包括Gide等人、Lee等人和MGH队列。我们计算了每个验证数据集中每个预处理样本的ssGSEA值、签名分数和优势比。我们使用fdr校正Welch比较了r和nr的ssGSEA值。t-试验(FDR<0.05)。FDR结果在Gide等人、Lee等人和MGH数据集中R和NR之间没有显着性差异(图1)。3A-c,以及补充数据3A-c)。在Gide等人中R的及格分数的分布。显著高于NR(p=0.005;单边秩和检验)(图1.三维空间和补充数据三维空间)。然而,在Lee等人中,通过了R的预分数。MGH数据集与NR值相比,差异不显著(P>0.05)。p为Lee等人=0.72;p为MGH=0.10;单边秩和检验)(图.3E,f和补充数据3E,f)。对于Gide等人、Lee等人和MGH数据集,我们分别生成了具有签名分数的ROC和AUC,AUCS分别为0.69、0.45和0.69(图1)。第三代)。此外,我们还测试了其他两个黑色素瘤组:Van Allen等人的PAS-PreSignal的预测性能。6还有Hugo等人。7数据集。在预处理样本中,这两个数据集的AUCs分别为0.56和0.46(补充图)。1E)。AUCS表明,在所有六个训练和验证数据集中,Pre的预测能力是不稳定的。此外,我们结合Gide等人、Lee等人和MGH数据集的测试前处理样本,计算了AUC和签名分数。我们生成了一个0.65的联合AUC(如图所示)。3H)。我们用Youden指数法找到了Riaz等人的最优截止点。传-预签名分数,是0.3834分。我们预测了联合试验前处理样品的治疗反应.预测精度为0.59。Mathew相关系数为0.19。同样地,我们计算了每个样本的优势比,根据通过-预签名得分,并将预处理样本分成两个子集,分别以样本的奇数比平均值作为阈值,将其分为高签名和低签名两个子集。所有样本的Kaplan-Meier生存分析表明,签名评分较高的患者PFS明显改善(HR=1.8,95%CI1.1-3.0;p=0.028)和操作系统(HR=1.9,95%CI 1.1-3.2,p=0.026)与分数较低的学生相比(图1)。3I和补充图。1F)。我们还研究了各数据集的PFS和OS的差异。在吉德等人案中。数据集中,得分高的患者与PFS相关(HR=1.9,95%CI 1.0~3.6)。p(HR=1.8,95%CI0.93.9;p=0.11)(图1。3J和补充图。1g)。因为没有针对Lee等人的PFS数据。数据集,我们只执行操作系统分析。高、低分值组OS值无显着性差异(HR=1.7,95%CI 0.5~5.1,P<0.05),差异无显着性(P>0.05)。p=0.37)(附图。)。对于MGH队列,OS有明显的改善(HR=3.4,95%CI1.0~12.0,p=0.04)而不是PFS(HR=1.5,95%CI1.1-3.9,p在特征评分高的患者中,与低评分的患者相比,观察到0.4(图1)。3K和补充图。1I).

图3:预处理样本的基于路径的超签名。
figure3

acGide等人的预处理应答者(R)和非应答者(NR)的ssGSEA值的热图。队列(a),Lee等人。队列(b),以及MGH队列(c)。不响应者出现在左侧,响应者出现在右侧。Fdr校正双面焊t-比较R和NR样品的ssGSEA值,只有FDR<0.05。df前处理样本在Gide等人中通过预签名分数的盒形图。队列(d),Lee等人。队列(e),以及MGH队列(f前处理样本分为应答者(R)和无应答者(NR),每个队列显示样本数。这个P-数值是通过单边秩和检验计算的.方格中心线表示中间线,方框边缘表示四分位数范围,晶须延伸到最小和最大,而离群点是使用“*”符号单独绘制的。gGide等人,Lee等人的预处理样品的PAS-Pre的Roc和AUC。和MGH队列。hRoc和AUC对所有预处理样品,其中结合Gide等人,Lee等人.和MGH队列。ik联合试验前处理样本无进展生存率的Kaplan-Meier分析(英文)i),Gide等人。队列(j),以及MGH队列(k)。采用双面对数秩检验方法,以预处理样本奇数比作为截止点,对高、低亚组进行了比较。危险比(HR)用置信区间(CI)表示。源数据作为源数据文件提供。

综上所述,我们得出的结论是,在预处理样本中,PAS-PreSignal的预测性能不够稳健和稳定。最后,ENLR模型选择的六条路径没有在预处理样本的不同数据集中推广。

基于路径的处理样品的超签名

接下来,我们研究了从处理样本中提取的签名的预测性能.类似于对预处理样本的分析,我们构建了一个由DEGS、GSEA、候选路径过滤和ENLR模型组成的计算管道,为Riaz等人提供了基于路径的处理样本签名。数据集作为训练集(图。4A)。通过对dgs的分析,我们从R中筛选出1078个基因,与NR(Log)相比,R中的基因显著上调。2FoldChange>1和Wald试验p < 0.05) (Fig. 4B和补充数据4A)。随后,GSEA鉴定出111条反应体通路,它们明显富集(富集分数>0,FDR<0.05)(补充数据)4B)。我们通过NES对过滤后的路径进行了排序,并将重点放在前15位作为下游分析的候选路径上(图1)。4C)。接下来,我们利用前沿基因计算了每个候选通路的ssGSEA值,并将其概括为通路评分(图一)。4D和补充数据4C)。根据15个候选路径的路径评分,我们随后使用ENLR模型来识别预测准确率最高的路径,并估计它们的效果。ENLR模型在训练方法中实现了成本敏感性和三重交叉验证,确定了最优惩罚参数,误差在最小标准误差范围内,并计算了每个候选路径的影响大小(补充图)。2A,b)。因此,我们发现了四种途径的特征,包括:(1)过氧体脂代谢;(2)第二信使分子的产生;(3)脂肪酸代谢;(4)PD1信号(补充图)。2C,d)。值得注意的是,过氧化物酶体脂代谢和脂肪酸代谢与脂肪酸和脂质代谢有关。42。第二信使分子的产生是T细胞受体(TCR)刺激的重要信号通路.PD1信号通路作为一种免疫调节信号通路,在免疫调节中起着重要的作用。以有效大小为权重,计算了这四条路径的ssGSEA值的加权平均值,并将其命名为基于路径的处理样本(传递)评分的超签名。里亚兹等人传球分数的分布。数据集的R值高于NR(p < 0.001; one-sided rank-sum test) (Fig. 4E和补充数据4D)。为了确定传递的预测能力,我们使用传递值生成了ROC。我们观察到AUC为0.83,强调了良好的传递预测能力(如图所示).4F)。我们还评估了签名评分与患者生存之间的关系。我们首先根据每个样本的特征评分计算优势比,然后根据优势比的平均值将患者分为高、低两个亚组。Kaplan-Meier生存分析表明,与低信号评分组相比,高特征值患者的OS和PFS显著延长(OS:HR=4.2,95%CI1.4~12.0)。p=0.0042;PFS:HR=3.5,95%CI 1.7-7.3,p=0.00044)(图1。4G,h).

图4:基于路径的处理样本的超级签名。
figure4

a基于Riaz等人基于处理样本的模型构建计算流水线。队列。bRiaz等人在治疗应答者(R)和非应答者(NR)之间差异基因表达分析的火山图。队列。计算Log2Fold变化(FC)。双面Wald测试用于测试响应者和非应答者之间是否存在差异表达。蓝点代表明显的下调。基因(log2Fold Change<−1,P-数值<0.05)。红色的点代表明显的放大(符号)。基因(log2Fold Change>1,P-数值<0.05)。灰色点代表非显着性(NS)基因。c15个候选路径的GSEA结果。计算了归一化富集分值(NES)和前沿基因集的大小.基于置换P-数值显示了富集分数的统计意义。排列的数目是10,000。错误发现率(FDR)是归一化富集分数表示假阳性发现的估计概率。dRiaz等人的治疗应答者(R)和无反应者(NR)的ssGSEA值的热图。队列。不响应者出现在左侧,响应者出现在右侧。Fdr校正双面焊t-比较R和NR样品的ssGSEA值,只有FDR<0.05。e在处理样本的路径超级签名(传递)签名(R)和非响应者(NR)的方格图显示在Riaz等人中的样本数。队列。这个P-数值是通过单边秩和检验计算的.方格中心线表示中间线,方框边缘表示四分位数范围,晶须延伸到最小和最大,而离群点是使用“*”符号单独绘制的。fROC和AUC在Riaz等人体内处理样品的传递。队列。g, h总体生存(OS)的Kaplan-Meier分析(g)和无进展生存(PFS)(h)在Riaz等人体内进行处理的样品。队列。采用双面对数秩检验,以处理样本奇数比均值为截止点,对高、低亚组进行了比较。危险比(HR)用置信区间(CI)表示。源数据作为源数据文件提供。

为了进一步验证传递的预测性能,我们用RNAseq数据对三个独立的数据集进行了测试,这些数据包括Gide等人、Lee等人和MGH队列。我们计算了ssGSEA值,并比较了每条路径的rr和nr之间的ssGSEA值(fdr<0.05;fdr校正Welch)。t-测试)(如图所示。5A-C,以及补充数据5A-C)。我们还计算了验证数据集中每个待处理样本的签名分数和比特率。类似于Riaz等人。数据集、处理样本的签名分数分布表明,在Gide等人中,R的签名分数显著高于NR的签名分数。(p=0.003),Lee等人。(p和MGH数据集(p=0.002)(图1。5D-f,以及补充数据5D-f)分别。我们制作了ROC和AUC的签名评分和病人的反应数据。对于Gide等人、Lee等人和MGH数据集,AUCs分别为0.88、0.85和0.89,这表明在所有四个数据集之间传递的预测能力是稳定的和可接受的(图)。5G)。我们还结合了Gide等人、Lee等人和MGH测试数据集的所有处理样本,生成了一个AUC为0.88(图1)。5H)。进一步,我们实现了YoudenIndex方法,从Riaz等人那里得到了最优截止值为0.4247。在治疗样本传递-签署分数。利用优化的截止时间,计算了组合测试样本传递签名的准确性.准确度为0.82,Mathew相关系数为0.53。接下来,我们根据优势比将治疗样本分为高低子集,以平均值作为阈值,并对每个个体或组合数据进行Kaplan-Meier生存分析。与低签名组相比,所有测试患者的PFS均有显著改善(HR=4.1,95%CI1.6~10.0)。p=0.002),Gide等人。(HR=3.6,95%CI 1.0-13.0,p和MGH数据集(HR=5.5,95%CI1.2-26.0,p=0.016)(图1。5i-k)。在MGH组中,签名评分较高的患者OS也显著升高(HR=5.6,95%CI1.1~28.0),差异有显着性(P<0.05)。p(HR=1.8,95%CI 0.8~4.1,p=0.14),Gide等人(HR=2.7,95%CI 0.5-14.0)p=0.23),或Lee等人。(HR=0.65,95%CI 0.2-2.4,p=0.52)队列(附图)。2e-h).

图5:基于路径的处理样本的超级签名。
figure5

acGide等人治疗应答者(R)和非应答者(NR)ssGSEA值的热图。队列(a),Lee等人。队列(b),以及MGH队列(c)。不响应者出现在左侧,响应者出现在右侧。Fdr校正双面焊t-比较R和NR样品的ssGSEA值,只有FDR<0.05。df在处理样本的传递签名得分的方格图,在吉德等人。队列(d),Lee等人。队列(e),以及MGH队列(f)。在处理样本分为应答者(R)和非应答者(NR),每个队列中显示样本数。这个P-数值是通过单边秩和检验计算的。方框中线表示中间线,方框边缘表示四分位数范围,而离群点则使用“*”符号单独绘制。gRoc和AUC传递了来自Gide等人、Lee等人和MGH队列的处理样本。h与Gide等人、Lee等人和MGH队列结合的所有治疗试验样品的Rc和AUC。伊克联合试验治疗样本无进展生存率的Kaplan-Meier分析(英文)i),Gide等人。队列(j),以及MGH队列(k)。采用双面对数秩检验,以处理样本的奇数比均值作为截止点,对高、低亚组进行了比较。危险比(HR)用置信区间(CI)表示。源数据作为源数据文件提供。

通过对治疗样本的分析,我们确定并证明了传递在预测患者对抗-PD1疗法的临床反应方面的有效性。此外,传递分数能够区分生存效果较好的患者和预后较差的患者。

基于时间响应相互作用路径的处理前和处理样品的超级签名

与基于路径的超级签名基本基于R和NR样本在治疗前或治疗时间点的比较相比,我们还对基于路径的签名的预测性能进行了研究,它反映了时间-响应的相互作用。我们推断这些签名在治疗过程中是动态变化的。在识别反映时间-响应相互作用的基于路径的特征的分析中,我们实现了两个独立的ENLR模型,从Riaz等人的预处理和治疗样本中提取预测签名。数据集。构建了由DEGS、GSEA和候选路径过滤组成的计算流水线。值得注意的是,两个独立的ENLR模型共享相同的候选路径。然后在管道中实现了两个独立的ENLR模型来计算ssGSEA值,并分别从预处理样本和处理样本中提取基于路径的签名(图1)。6A)。具体来说,我们在Riaz等人的R样本中进行了DEGS,以确定其表达水平在治疗前和治疗时间之间发生变化的基因。数据集(未配对分析)火山图显示R样本中有60个上调基因(原木)2FoldChange>1和Wald试验p < 0.05) (Fig. 6B和补充数据6A)。我们进一步通过使用排序基因列表进行GSEA,并确定了110个显著上调的途径。我们选择了R样本中排名前15位的路径作为候选路径(补充图)。3A和补充数据6B)。每一候选路径计算预处理样本的ssGSEA值,并将其归纳为通路评分。基于fdr校正的韦尔奇t-检验,在所有数据集的预处理样本中,R和NR的路径评分没有明显差异(补充图)。3B-E和补充数据7A-d)。我们使用第一个独立的ENLR模型从15位候选人中筛选出预测路径并评估其效果。使用第一个独立的ENLR模型(TimeANLS-PRE),实现了三文件夹交叉验证方法,以确定训练过程中具有相关有效尺寸的路径数(补充图)。3F-h)。以有效尺寸为权重,计算了每个预处理样本基于时间交互路径的超签名评分。从Riaz等人、Gide等人、Lee等人和MGH数据集的签名分数分布来看,R样本的值一般高于NR(补充图)。3I-l和补充数据8A-d)。为了量化超级签名在训练和验证数据集中的预测能力,我们生成了ROC。我们在Riaz等人身上观察到AUC为0.82。数据集(图1.6C),在Gide等人、Lee等人和MGH数据集中分别为0.60、0.49和0.76。6d)。我们还合并了所有的测试前处理样本,并产生了一个0.63的AUC(如图所示)。6E)。此外,AUC与时间ANLS-预先签署在Van Allen等人。还有Hugo等人。治疗前样品分别为0.59和0.76(附图)。三米)。ROC和AUC在训练和验证数据集中的结果表明,基于时间响应交互路径的超级签名在预处理样本上是不稳定的。我们使用优势比的平均值,这是从签名分数得出的,作为将患者分为高组和低组的截止点。我们评估了签名评分与患者生存的相关性,结果显示OS明显改善(HR=2.4,95%CI1.1~5.3,P<0.05)。p=0.03)而不是PFS(HR=1.6,95%CI0.9-3.1,p与Riaz等人的低签名评分相比,签名分数高的患者观察到的特征值为0.13)。数据集(附图)4A,b)。在总体测试前,Gide等人、Lee等人或MGH队列(补充图)中,高分和低签名患者的OS和PFS均无显着性差异(P>0.05)。4C-h).

图6:基于时间响应相互作用路径的治疗前和治疗样本的超级签名。
figure6

a基于时间响应交互路径的超级签名模型构建计算流水线。b里亚兹等人的反应预处理和治疗样品差异基因表达分析火山图。队列。计算Log2Fold变化(FC)。采用双面Wald试验,检测治疗前和治疗后样品之间是否存在差异表达。蓝点代表明显的下调。基因(log2Fold Change<−1,P-数值<0.05)。红色的点代表明显的放大(符号)。基因(log2Fold Change>1,P-数值<0.05)。灰色点代表非显着性(NS)基因。C-E来自Riaz等人的预处理样品(TimeANLS-Pre)的基于时间反应相互作用途径的ROCs和AUCs的超级签名。队列(c)、Gide等人、Lee等人和MGH队列(d)、联合预处理与Gide等人、Lee等人和MGH队列(e). fhROC和AUCs的时间响应e来自Riaz等人的处理样品(TimeANLS-ON)的基于相互作用路径的超级签名。队列(f)、Gide等人、Lee等人和MGH队列(g),与Gide等人、Lee等人和MGH队列联合治疗(h)。源数据作为源数据文件提供。

在处理样品中,我们测试了所有数据集处理样本的ssGSEA值在R和NR之间的差异(fdr<0.0 5;fdr校正Welch)。t-测试)(附图。5A-d和补充数据9A-d)。我们使用第二个独立的ENLR模型(TimeANLS-ON)从15位候选人中筛选出预测路径并评估其效果。TimeANLS-on模型与TimeANLS-Pre模型相似,在培训过程中也采用了三文件夹交叉验证方法(补充图)。5E-g)。在Riaz等人、Gide等人、Lee等人和MGH数据集(补充图)中,R样本的分布均高于NR样本。5H-K和补充数据10A-d)。为了量化超级签名在训练和验证数据集中的预测能力,我们生成了ROC。我们在Riaz等人身上观察到AUC为0.81。数据集(图1.6f),在Gide等人、Lee等人和MGH数据集中分别为0.75、0.91和0.82。6g)。我们还结合了所有的试验处理样本,并产生了一个AUC为0.87(图1)。六小时)。ROC和AUC在训练和验证数据集中的结果表明,基于时间响应交互路径的超级签名对于治疗样本具有良好的预测能力。我们还利用从治疗样本的特征评分中得出的优势比的平均值作为分界,将样本分为高组和低组。与低签名组相比,高签名组与两组OS均有显着性差异(HR=3.7,95%CI 1.6~8.7,P<0.01)。p(HR=4.6,95%CI 2.1-9.8,p < 0.0001) in the Riaz et al. (Supplementary Fig. 6a,b)。然而,在对治疗队列的总体测试中,在OS分析方面,Gide等人观察到的差异没有显着性.还有Lee等人。(补充图。6C-g)。在MGH数据集中,特征评分高的患者与OS的改善相关(HR=5.6,95%CI1.1~28.0)。p(HR=2.7,95%CI 0.8-9.3,p=0.11)与那些签名分数较低的人相比(补充图)。6h,我).

比较基于路径的超级签名和已发布的预测签名

与现有的基于转录组的预测签名(包括干扰素-γ信号)相比,我们进一步研究了PAS-Pre和PASON签名的预测性能。17,T细胞炎GEP17,Chemokine签名10、免疫核心10,溶细胞活性(CYT)13,MHC-I19,MHC-II19,CD8A/CSF1R比值43、CD8+T细胞44,以及IMPRES14。我们在四个数据集中推导出每个发布的预测签名的AUC,然后计算平均AUC。

首先,通过对前处理样本的分析,比较了PAS-PRE和TimeANLS-PRE与已发表的预测签名的预测性能。PAS-Pre和TimeANLS-Pre的平均AUCs分别为0.66和0.67,与其他已发表的预测签名(AUCS为0.51至0.66)相当(图1)。7A和补充图。7A).

图7:基于路径的超级签名与现有签名的比较。
figure7

a基于路径的超签名(PAS-PRE)和基于时间响应交互路径的预处理样本超级签名(TimeANLS-PRE)的性能与现有的公开签名进行了比较。b基于路径的超级签名(传递)和基于时间响应交互路径的超签名(TimeANLS-ON)的性能。每个队列的样本数都显示在图例中。以AUCS的均值和标准差为误差条。源数据作为源数据文件提供。

同样,我们比较了传递和时间ANLS的预测性能和已发表的签名的预测性能。传递-传递和时间-ANLS-分别达到平均AUCs为0.86和0.82,这是优于任何其他公开发表的签名(AUCS从0.65到0.80)(图一)。7b和补充图。7b).

讨论

尽管ICB疗法已经彻底改变了转移性黑色素瘤的治疗,但只有一部分患者取得了持久的疗效。1,2,3,4。为了抵消ICB治疗的相当大的副作用和成本,有必要确定对ICB治疗反应的可靠特征,以便为治疗决策提供信息并进行优化。先前的研究报告了预测转移性黑色素瘤对ICB治疗反应的基因组和免疫特征。5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,28,45然而,大多数这些特征仅仅是根据治疗前的肿瘤标本或外周血标本构建的。此外,预测信号通常来自于单个基因或有限数量基因的基因集。因此,我们的愿望仍然是确定基于路径的信号来预测对icb治疗的反应。在此,我们通过分析治疗前和治疗中的肿瘤样本和发展路径特征来填补这一知识空白,在四个已发表的RNAseq数据和一个新生成的RNAseq数据队列中,预测转移性黑色素瘤对抗-PD1治疗的反应。我们发现,从治疗中的肿瘤标本中提取的基于通路的信号不仅可以预测转移性黑色素瘤患者对抗PD1阻断的反应,而且还与疾病结局有关。

以往的研究表明,在预测乳腺癌对内分泌治疗的反应方面,治疗后的肿瘤样本可能比治疗前的样本更能提供更多的信息。46,47,48。此外,从治疗样本中提取的预测信号在预测乳腺癌对内分泌治疗的反应方面优于治疗前样本。46,47。然而,到目前为止,预测icb治疗反应的基因表达特征在很大程度上仅限于研究治疗前样本与患者临床反应之间的关系。相比之下,Chen等人。先前根据早期治疗过程中获得的肿瘤样本开发了适应性免疫标记,并表明它们对转移性黑色素瘤患者的ICB治疗有很高的预测作用。8。然而,他们通过定制的795基因NanoString面板进行基因表达谱分析,而不是全转录测序。此外,他们没有在其他独立数据集中评估其签名的预测能力。Auslander等人建立了免疫预测评分(Impres),其中包含15个免疫检查点基因之间的成对转录关系,以预测转移性黑色素瘤对icb治疗的反应。14。与两个独立数据集中的预处理样本相比,impres特征对处理样本具有更高的预测能力。14。然而,这个特征最初是由神经母细胞瘤形成的。在本研究中,我们开发了分别基于治疗前和治疗中的转移性黑色素瘤的路径特征,并专门在四个独立的数据集中预测抗PD1治疗的反应,这些数据集中有RNAseq和临床数据。我们发现,从治疗中的肿瘤标本中提取的基于路径的信号可以提高转移性黑色素瘤患者对抗-PD1阻断剂的反应和疾病结局的预测准确性。这表明,在ICB治疗开始后,不仅在预处理样本中,更重要的是在肿瘤标本中,应该尝试识别和评估标记。从生物学的角度来看,这是有意义的,因为癌症治疗通常会导致基因和信号通路的复杂变化。因此,在治疗样本可能提供更有价值的洞察和窗口在转录水平的动态变化是相关的临床反应,从而导致更高的预测准确性。这些发现也具有重要的临床意义,并将引导我们重新考虑当前临床实践中的临床管理,因为在以前的研究中,只有在大多数接受icb治疗的患者中只有预处理样本。基于这些在治疗中的特征,医学肿瘤学家可以准确地预测并潜在地识别出更有可能从icb治疗中受益的这一亚组患者。对于那些可能没有受益于抗-PD1治疗的人,其他有效的治疗方法,如针对肿瘤基因组成的靶向治疗,可以尽早使用。这将减少ICB治疗引起的疾病负担和副作用的发生率,并导致更好的疾病结局。

除了使用治疗样本外,我们还使用基于路径的方法来建立预测签名.事实上,基于路径的方法已经被引入来建立对化疗或靶向治疗的反应的预测特征,与单个基因水平的标记相比,该方法具有更高的重现性和更强的鲁棒性预测性能。35,36,37,38。同样,从生物学的角度来看,这是有意义的,因为癌症治疗通常同时改变许多基因;因此,基于路径的方法不仅可以整合多个基因和基因集的读数,而且还可以产生一个更稳定的度量,以减轻由于单个基因的杂乱表达模式而产生的不利影响。35,38。在本研究中,与现有的治疗样本相比,不同的转移性黑色素瘤患者对抗PD1治疗的反应有更稳定的预测性能。这些发现表明,基于路径的方法可以帮助减少对不同数据集的测序和分析平台和批处理所特有的影响,从而产生具有高度鲁棒性和可重现性的预测签名。此外,基于路径的方法也可以帮助我们识别以前被忽视的路径,这些路径被癌症治疗显著改变,但在单基因表达水平上却无法被识别。在本研究中,我们确定了四种途径:(1)过氧体脂代谢;(2)脂肪酸代谢;(3)第二信使分子的产生;(4)PD1信号传导,以构建适合于治疗样本的预测模型。有趣的是,其中两个与脂肪酸和脂代谢有关。据我们所知,这是第一项研究,揭示了脂肪酸和脂质代谢相关特征的预测能力,在对转移性黑色素瘤患者的ICB治疗的反应方面。最近的一项研究分析了接受肿瘤浸润性淋巴细胞或抗PD1免疫治疗的转移性黑色素瘤患者的蛋白质组,并显示脂肪酸氧化途径在应答者中明显富集。42。本研究高度强调线粒体代谢包括脂肪酸代谢在免疫治疗应答中的重要作用。42。从理论上讲,应答者在肿瘤中较高的线粒体活性可能比无应答者消耗更少的葡萄糖,从而减少与细胞毒性T淋巴细胞的葡萄糖竞争,从而引起免疫治疗的反应。42。其他研究也表明,促进脂肪酸分解代谢可以提高CD8的细胞毒性。+T淋巴细胞与免疫治疗延缓肿瘤进展49,50。这些研究的结果以及我们自己的发现为代谢相关的信号预测免疫疗法的反应提供了一个生物坚实的基础,这需要进一步的机械研究。

除了对R和NR样本进行比较的基于路径的超签名传递进行了研究外,我们还研究了反映时间-响应相互作用的基于路径的签名的预测性能。考虑到治疗时间和临床反应的相互作用,将为识别在治疗过程中动态变化的预测特征提供一个独特的洞察力。在本研究中,我们建立了两个基于时间-响应相互作用分析的ENLR模型,并分别利用预处理样本和待处理样本进行了预测。三个数据集的签名值为0.49-0.76,用于预处理样本(如图所示)。6d)。同样,三个数据集的签名值达到了0.750-0.91个待处理样本(如图所示)。6g)。综合来看,这些结果表明,在处理样本的预测性能比前处理样本更加稳健和优越。

与先前发表的签名相比,传递签名显示出更健壮和稳定的预测性能(如图所示)。7b)。如上所述,在治疗中的肿瘤标本通常比治疗前的标本提供更多的信息;而基于路径的标记可以克服单个基因签名的局限性。这些进展可能在一定程度上解释了为什么传递签名要优于先前发表的从肿瘤预处理标本中提取的签名。尽管我们已经证明了传递签名的力量和优越的性能,但该签名仍然存在一些限制,有待进一步完善。首先,由于数据集访问的局限性,本研究仅对4组转移性黑色素瘤进行了分析。在临床应用之前,进一步验证传递签名在其他独立队列中的预测性能将是至关重要的。第二,在基于抗PD1/PD-L1的队列中生成和验证传递签名,但在基于反CTLA 4的队列中没有验证。此外,在其他类型的ICB治疗中,如CAR-T或oncolytic病毒疗法,测试这种特征的预测能力将是很有趣的。最后,传递信号仅在转移性黑色素瘤的队列中得到验证。因此,有必要进行进一步的研究,以检验这一特征在其他类型癌症中的预测性能。

总之,从治疗样本中提取的通路信号可以很好地预测转移性黑色素瘤患者对抗PD1治疗的疗效。重要的是,我们已经在转移性黑色素瘤的不同队列中展示了他们的稳健和稳定的预测能力。我们的研究不仅提供了高度准确和个性化的抗PD1治疗反应的预测特征,而且也为抗PD1治疗转移性黑色素瘤患者的临床治疗提供了依据。需要进一步的研究来验证这些特征在转移性黑色素瘤、其他类型的ICB治疗和癌症患者中的预测性能。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297