学习设计
初步结果表明,与多分析方法不同,单脂类监测对病例与对照的鉴别效果不佳。此外,脂质种类和分类也是相互关联的,因此认为对脂质体的分析不仅可以提供PDAC的分子生物学见解,而且可以为临床诊断提供更可靠的实验设计。总体方法在图中作了总结。1。在样品制备前,用外源性脂类内标(IS)对血脂种类进行量化(补充表)。1–4)。这允许实验室内和实验室间的比较,因为结果是独立于仪器信号响应来表达的。用基于质谱的方法对提取液进行分析,用内部脚本对脂肪体质谱数据进行处理。22允许自动识别和定量脂肪。最后,用描述性和探索性方法对数据进行统计评价。在不同的研究阶段和不同的研究阶段,所有的脂类都符合定义的包含标准,即超过25%的样品必须报告浓度,否则,统计评价中不包括脂类。由于敏感性的自然差异,这一排除标准导致不同方法和阶段的脂质覆盖程度不同。
图1:PDAC患者(T,RED)与正常健康对照组(N,蓝色)和胰腺炎患者(PAN,Green)的研究设计概述。a第一阶段(发现)364个样本(262 T+102 N)分为训练(213 T+79 N)和验证(49 T+23 N)组,分别由UHPSFC/MS、猎枪MS(LR)和MALDI-MS测量。b554份样本(444 T+98 N+12 PAN)分为训练(328 T+82 N+12 PAN)和UHPSFC/MS(116 T+16 N)、猎枪MS(LR和HR)和RP-UHPLC/MS在3个不同实验室测定的第二阶段(资格)。c830个样本(546 T+262 N+22 PAN)的第三阶段(核查)分为培训(430 T+246 N+22 PAN)和UHPSFC/MS测量的验证(116 T+16 N)集。
这项研究分为各个阶段。23(无花果)1)称为发现、限定和验证阶段,每个阶段都有各自的目的。在应用多变量数据分析(MDA)之前,将个体阶段的样本集分为训练集和验证集,以确保无偏见的统计评价。训练集用于建立统计模型,验证集用于独立评价模型的性能,以区分癌症患者和健康对照者的样本。在超高效超临界流体色谱(Uhpfc)/质谱联用(Uhpsfc)技术的初步测试、方法优化和验证过程中,评价了采血管对脂质体分析的影响。24。结果表明,血清脂质浓度略高于血浆,从而提高了敏感性。因此,本研究以血清为样本矩阵进行PDAC筛选研究。
第一阶段(发现)
该发现阶段是一个概念的证明研究,目的是找出患者和对照组的血脂谱之间的差异。共对262例PDAC患者和102例健康对照进行了UHPSFC/MS和猎枪质谱分析,并对64份样本进行了基质辅助激光解吸电离(MALDI)质谱分析。所有方法都有不同的脂类检测覆盖率,其中猎枪MS检测到的脂类数量最多(补充数据)。1),其次是UHPSFC/MS和168种脂类(补充数据)2),其中两种方法都基于正离子模式。两种方法均属于甘油脂、磷脂、鞘脂和胆固醇酯。在负离子模式下,用MALDI-MS法检测了鞘氨酰肌醇类和硫化物类中的42种脂类(补充数据)。3)。以脂质体剖面为基础,用丙二醛(MDA)观察病例标本与对照标本的差异。对主成分分析(PCA)评分图进行了病例与对照的部分判别,并通过监督正交投影到隐结构判别分析(OPLS-DA)模型实现了明显的群体分化。调查性别对病例和对照样本分化的影响(图一)。2)在性别和性别分离的情况下执行OPLS-DA。对于性别分离的模型,正确地分配样本类型的准确性略好一些,因此本工作进一步使用了性别分离模型,这与先前发表的结果相一致。25.
图2:性别分离对OPLS-DA模型的质量的影响。OPLS-DA模型用于区分PDAC患者(T)和健康对照(N)的人血清样本(N),在第一阶段使用UHPSFC/MS进行训练。a两性都是。b男性。c女性。d个别模型的特异性、敏感性和准确性。源数据作为源数据文件提供。
癌症和对照样本的脂肪体谱方法似乎与癌症阶段无关,因为在OPLS-DA图中观察到了癌症分期的随机分布,没有任何聚类(图)。3A-d)。这一发现表明,即使是早期癌症,脂肪酶谱也与对照样本不同,这一点在随后的研究阶段得到了进一步的证实。在发现阶段,所有方法的训练和验证集的ROC曲线和精度是可比的(图)。3E,f)。最失调的脂类如图所示。3G-j。UHPSFC/MS被用于后续研究,因为在比较的方法中,UHPSFC/MS具有最高的鲁棒性和吞吐量,并且得到了我们组广泛经验的支持,包括完整的方法验证26并对一年内采集的样品进行稳定性检验。24。对整个样品制备方案进行了优化,包括质量控制(QC)体系的开发。
图3:第一阶段的结果。单个样本按肿瘤(T)期着色:T1-黄色,T2-橙色,T3-红色,T4-玫瑰色和Tx-棕色(没有关于这个阶段的信息)。男性测量的OPLS-DAa与UHPSFC/MS和c用猎枪MS进行训练(104 T+30 N)。OPLS-DA为女性测量bUHPSFC/MS和d训练组(157 T+49 N)的猎枪MS。训练中男性(M)和女性(F)的Roc曲线(Tr.)和验证(Va.)成套:eUHPSFC/MS,以及f对PDAC患者(T)和健康对照组(男性(M)和女性(F))的人血清中磨牙浓度的测量:gSM 41:1用UHPSFC/MS测量,hSM 41:1用猎枪MS(LR)测量,分别为男性(104 T和30 N)和女性(109 T和49 N),i用MALDI-MS法测定SHexCer 41:1(OH)jSexCer 40:1(OH)用MALDI-MS法测定,分别为雄性(15 T和14 N)和雌性(18 T和19 N)。在每个方格图中,中心线代表中间线,边界代表第一和第三四分位数,而胡须从中间位数到四分位数范围内跨越1.5倍。源数据作为源数据文件提供。
第二阶段(资格)
第二阶段的目的是确认其他经验丰富的脂肪体实验室可以实现病例组和对照组之间的类似区分,这应排除在单个实验室进行测量时可能存在的隐藏偏见。合作实验室2和3(“方法”部分的细节部分)没有关于脂肪体定量的分析方法的处方,因此他们遵循自己制定的样品制备、基于MS的测量和数据处理的协议。第二阶段的新样本包括554个样本,其中344个新获得的样本来自第一阶段的同一志愿人员,210个样本来自新的受试者。用四种不同的MS方法(UHPSFC/MS、低分辨率猎枪MS(LR)、高分辨率(HR)猎枪MS和反相超高效液相色谱(RP-UHPLC)/MS)(附图)对扩展队列进行测定。1)。RP-UHPLC/MS允许定量测定431种脂质(补充数据)4, 5),由于脂肪酰基与非极性固定相之间的疏水相互作用,对脂类进行了分离。猎枪质谱是在LR情况下使用特定扫描事件或在HR情况下与串联质谱(MS/MS)相结合的直接样品注入到MS的基础上。用猎枪LR-MS(补充数据)对232例血脂进行定量分析。6)和183名血脂用猎枪HR-MS(补充数据)7)。对于UHPSFC/MS,采用了脂类分离,得到了202种脂类的定量结果(补充数据)。8)。NIST 1950参考血浆也用所有方法进行测量,并用于个别方法获得的男性血脂浓度的正常化(补充图)。2)和女性(补充图。3)27。一些最失调的脂肪物种的方格图(图)。4A-C,补充图。2I、J、3I,和4A-l)对所有方法都显示出相同的模式和相似的归一化浓度。四种方法得到的每个样品的选定脂类的浓度的相对标准偏差(图)。4D-f)说明不同定量方法的可接受重现性。大多数样品的RSD<40%,无论采用不同的方法制备样品,都是混合物、随机化和脂肪组分析。国际脂肪组学协会计划的未来分析协议的协调应进一步改善不同实验室之间的相互关系。用于来自第二阶段的单个方法数据集的MDA,例如ROC曲线(图1)。4G-j),OPLS-DA评分图,以及分别为男性准备的敏感性、特异性和准确性的评估(补充图)。2A-h)和女性(补充图。3A-h)被执行。统计结果显示,所有方法在区分病例组和对照组方面都有相似的结果。
图4:三个不同实验室使用四种基于质谱的方法获得的第二阶段结果的比较。从PDAC患者(443 T)和健康对照者(95 N)获得的样本中符合NIST标准的脂质浓度方框图,包括验证和培训集:aSM 41:1,bLPC 18:2,以及cCER 41:1用于UHPSFC/MS(方法1)、猎枪MS(LR)(方法2)、猎枪MS(HR)(方法3)和RP-UHPLC/MS(方法4)。在每个方格图中,中心线代表中间线,边界代表第一和第三四分位数,而胡须从中间位数到四分位数范围内跨越1.5倍。四种方法测定每个样品的相对标准偏差dSM 41:1,eLPC 18:2,以及fCER 41:1.颜色注释:浅蓝对照女性,蓝色对照男性,红癌女性和暗红色癌症男性。训练中男性(M)和女性(F)的Roc曲线(Tr.)和验证(Va.)成套:gUHPSFC/MS,h猎枪MS(LR),i猎枪MS(HR)和jRP-UHPLC/MS源数据作为源数据文件提供。
第三阶段(核查)
在第二阶段和第三阶段之间的时间框架内,对UHPSFC/MS方法和脂肪体分析样品制备协议进行了优化和验证。26,28,29。此外,预分析和分析方面的影响,如采血管24,相同的志愿者在一年内的脂肪酶谱稳定性。24,以及质谱仪的影响。30被系统地调查了。研究结果表明,UHPSFC/MS在脂肪体分析中具有较高的重现性。第三阶段旨在验证脂肪酶谱在鉴别对照和癌症标本中的适用性,使用优化和验证的UHPSFC/MS方法对830个样本进行脂肪体分析(补充数据)9)。该样本集由来自4个不同采血点的不同样本组组成,其中临床1期830份样本中有554份与Ⅱ期的样本相对应,除PDAC与对照鉴别(如胰腺炎、糖尿病、年龄、癌症分期和治疗)外,还对各种因素的影响进行了研究。
这套培训包括341个男性样本(122名对照者和219名病例),如图所示。5)和335例女性样本(124例对照,211例,图1)。6)。在PCA评分图中观察到小群分化。5A和6A),但OPLS-DA(图1.5B和6B)PDAC与对照组有明显的聚类。用样本颜色编码显示肿瘤分期的影响。不存在依赖于肿瘤分期的聚类,表明脂肪酶谱可能具有早期检测PDAC的潜力。训练组的敏感性、特异性和准确性总体>94%,验证组>80%。5C, 6C,以及补充数据10)。用S-图(图5)观察病例和对照样品中浓度差异最大的脂类。5D和6d)和热图(无花果。5E和6E),当样品以蓝色标记时,脂质浓度降低,而升高的脂类以红色表示。此外,还进行了统计学检验,结果表明,脂类的折叠变化率为≥的20%,p-根据Welch检验,值<0.05,投影(VIP)值>1中的变量重要性被定义为统计相关性,并在补充数据中进行总结11–13。脂类p-值<Bonferroni校正值被进一步强调,并被认为对脂肪体分化具有统计学意义,例如选择鞘磷脂、甘油磷脂和甘油脂。然而,甘油脂的浓度可能会受到饮食摄入的影响。31,因此可能容易产生误解。因此,考虑统计参数(折叠变化,p-值和VIP),除外源干扰外,Sm 41:1、SM 42:1、Cer 41:1、Cer 42:1、SM 39:1、LPC 18:2和PC O-36:3对分化的相关性最高,与Ⅰ期和Ⅱ期的结果一致。
图5:第三阶段PDAC患者(T)和健康对照组(N)男性血清血脂谱的结果。a训练集的PCA(219 T+122 N)。bOPLS-DA用于培训集(219 T+122 N)。个别样本按肿瘤(T)分期染色:T1-黄色,T2-橙色,T3-红色,T4-玫瑰色和TX-棕色(没有关于该阶段的信息)。c训练(219 T+122 N)和验证(56 T+6N)组的敏感性(红色)、特异性(蓝色)和准确性(绿色)。dS-图训练集,注释大多数上调(红色)和下调(蓝色)脂质种类。e训练和验证组的热图(275 T+128 N)使用脂质种类浓度[nmol/mL]。fOPLS-DA早期T1+T2,年龄一致(N平均65±4岁,T 67±4岁),数目一致(39T+39N)。这个图表包括两性。源数据作为源数据文件提供。
图6:第三阶段PDAC患者(T)和健康对照组(N)女性血清血脂谱的结果。a训练集(211 T+124 N)的PCA。bOPLS-DA训练集(211 T+124 N)。个别样本根据其肿瘤(T)期进行着色:T1-黄色、T2-橙色、T3-红色、T4-玫瑰色和TX-棕色(无法获得有关该阶段的信息)。c训练和验证集的敏感性(红色)、特异性(蓝色)和准确性(绿色)。dS-图训练集,注释大多数上调(红色)和下调(蓝色)脂质种类。e训练和验证组的热图(271 T+134 N)使用脂质种类浓度[nmol/mL]。源数据作为源数据文件提供。
通过年龄匹配对照和早期PDAC标本,进一步研究了癌症分期和年龄对病例和对照标本分化的影响(图1和T2)。5F)。对平均年龄为65±4岁的39份对照样本和平均年龄为67±4岁的39份病例样本(考虑性别因素)建立了OPLS-DA模型,因为年龄匹配和性别分离模型会导致样本数量不足。敏感性、特异性和准确性分别为97.4%的早期癌症分期与对照样本,这支持了先前的主张,适合于早期PDAC检测,并排除了可能的偏见,因为癌症患者通常是年龄比健康对照,在许多报告的研究,包括这项工作。此外,还制作了对照、早期(T1和T2)、晚期(T3和T4)和胰腺炎(PAN)的箱形图,并对最显著的脂类SM 41:1和Cer 41:1进行了统计分析。7b、c)。与独立于癌症分期的对照样本相比,癌症样本中的浓度被下调,而胰腺炎样本中的浓度与对照样本相似。这些结果提示脂肪酶谱可能适用于胰腺炎与PDAC的鉴别,但在前瞻性研究的框架内,更多样本的证实是必要的。用于训练和验证集的男性和女性的Roc曲线提供了超过0.90的AUC值(如图所示)。7A)。在第三阶段的830个样本中,年龄对最紊乱的脂质种类的影响也是可见的(图3)。7D,e)。个别年龄组的血脂浓度总体相似,39岁以下癌症患者的血脂浓度略有升高,SM 41:1和LPC 18:2除外(图1)。7D,e),但这一观察结果可能受到这一年龄组中人数较少的受试者的影响。糖尿病与胰腺功能障碍有关,通过比较糖尿病患者和正常对照组的血脂水平(SM 41:1),探讨糖尿病对血脂水平的影响(图4 1)。7F),没有观察到可见的效应。
图7:第三阶段血脂谱的结果,以及癌症分期、年龄和糖尿病的影响。a训练中男性(M)和女性(F)的Roc曲线(Tr.)和验证(Va.)布景。标准化为NIST标准物质的脂摩尔浓度方框图,用于:bSM 41:1和cCER 41:1.仅包括已知肿瘤(T)分期的标本,其中早期(T1和T2,男性24例,女性30例)和晚期(T3和T4,174例男性,176例女性)进行总结,并与健康对照组(男性128例,女性134例)和胰腺炎患者(男性13例,女性9例)进行比较。对照(蓝色)和癌症(红色)样本年龄间隔的比较(d)SM 41:1和eLPC 18:2.调查糖尿病影响的方框图(f)SM 41:1.在每个方格图中,中心线代表中间线,边界代表第一和第三四分位数,胡须从中间位数到四分位数范围内跨越1.5倍。第三阶段调查的男女样本的ROC曲线比较(g)红-CA 19-9,蓝-脂组学,绿色结合的CA 19-9和脂组学,以及紫-CancerSeek。32. h敏感性(红色)和特异性(蓝色)对CA 19-9,脂质组学,CA 19-9和脂质组学的结合,以及CancerSeek。源数据作为源数据文件提供。
比较了PDAC筛查中脂质体谱的总体性能,并与临床建立的CA19-9生物标志物监测PDAC的进展进行了比较。CA 19-9的截止值对性别没有差别,因此对两性都进行了脂质体分析的MDA。此外,还对脂肪组分析和CA 19-9相结合来预测样本群以及最近发表的结合蛋白质和ctDNA分析的CancerSeek方法进行了比较,其中包括PDAC。32。ROC曲线显示脂肪酶谱和CA19-9相结合的效果最好,其次是脂肪酶谱,CancerSeek法,最后是CA19-9的测定(图1)。7g)。不同方法的敏感性和特异性值的比较(见图)。7H)表明CA 19-9和CancerSeek比灵敏度值具有更高的特异性。32。脂肪酶谱的敏感性高于特异性值。脂肪酶谱和CA19-9的结合提高了特异性.
研究了肿瘤治疗对采血样本中的一个小亚组在术前和术后几天血脂谱的影响。MDA图没有显示任何返回到控制组(如图所示)。8APDAC可能是一种全身性疾病,对机体代谢有很强的影响,肿瘤切除可使脂肪酶谱立即恢复。Sm 41:1和LPC 18:2的方块地块(图1)。8B,c与对照组(图5)相比,手术后血药浓度主要下降。5D和6d)。此外,一些病人接受了治疗(如化疗),并在治疗前后收集了样本。没有观察到药物治疗对脂质谱的显著影响(图)。8D,e)。此外,OPLS-DA模型(图)。8F,g)在任何治疗前为患者做好准备,并为年龄匹配的健康对照组做好准备,以排除治疗引起的任何可能的偏见。准确率超过90%,血脂失调模式相同,表明实际治疗并没有引起脂质谱的相关变化。
图8:PDAC患者(T)和健康对照者(N)在第三阶段的血脂谱结果。手术对脂肪体轮廓的影响:aOPLS-DA为女性(211 T+124 N)使用的培训集与突出显示的样本之前(绿色,n=13)及之后(橙色,n=10)外科手术。男女两性(男2人,女10人)术前和术后配对标本的磨牙脂浓度盒图:bSM 41:1,和cLPC 18:2.在此之前收集成对样本的方框地块(n=22)和治疗后(n=22作征收1,n=12作托收2,n=7作托收3,n=4(收集4)男女均使用摩尔浓度:dSM 41:1,eLPC 18:2.在每个方格图中,中心线代表中间线,边界代表第一和第三四分位数,胡须从中间位数到四分位数范围内跨越1.5倍。OPLS-DA模型仅适用于治疗前或手术前f男性(83 T+122 N)和g女性(72 T+124 N)。源数据作为源数据文件提供。
生存预后潜力
利用第二阶段的数据对不同方法的血脂用于预测预后的可能性进行了调查。所有样本的脂类浓度和寿命数据均采用Kaplan-Meier生存分析方法(补充数据)进行处理。14和补充表5)。几种脂类在统计学上表现出显著的相关性(p < 0.05) with the overall survival (Fig. 9A-c),如lpc 18:2,cer 36:1,pc 32:0,pc O-38:5。14。Cer 36:1、Cer 38:1、Cer 42:2、PC 32:0、PC O-38:5、SM 42:2与存活呈负相关。性别和治疗对生存率没有任何统计学意义(补充图)。5CA19-9浓度与生存功能呈极显著负相关(附图)。5)。Cox比例风险模型是另一个用于显示生存时间和预测变量之间关联的回归工具(图)。9dLPC浓度比中位数高18:2与生存呈正相关,而CA19-9和PC O-38:5则相反。
图9:UHPSFC/MS测得的某些脂质对II期生存预后的潜在作用。Kaplan-Meier生存计划:aLPC 18:2(n=128表示二进制代码0,n=72表示二进制代码1),b核证的排减量36:1(n=89对0,和n=111(1),以及cPC 32:0(n=99对0,和n=101,加上双面对数秩检验。p-价值。dCA 19-9,pc 32:0,pc O-38:5,lpc 18:2,cer 36:1,cer 38:1,cer 42:2,sm 42:2的Cox比例风险模型。p给出了各参数的取值。危险比>1表明存活率较低。第二阶段所有样本的归一化脂种浓度经NIST标准物质转换为二进制代码,其中0为c<中位数,1为c>中位数(计算了包括所有样本在内的每种脂类的浓度中位数)。源数据作为源数据文件提供。