介绍

胰腺导管腺癌(PDAC)被预测为2030年癌症死亡的第二大原因,其预后在过去几十年中几乎没有改善1。PDAC是一种高度异质性的肿瘤,具有显著的间质和不同的组织学特征。组学研究证实了其肿瘤间分子异质性,这可能是解释大多数临床试验失败的主要因素之一。肿瘤细胞和间质的两种转录组亚型分别被描述为具有重要的预后和治疗诊断意义2,3,4,5。在肿瘤细胞中,基底样亚型被定义为与早期转移和Folfirinox耐药性相关的预后较差,相比之下,经典亚型的特征在于具有改变的代谢的祖上皮表型6。在基质中,活化的基质富含无组织的前肿瘤相关的成纤维细胞,几乎没有细胞外基质,而非活化的基质的特征是由更多静止的肌成纤维细胞分泌的丰富和致密的胶原。迄今为止,这些亚型只能通过RNA图谱来确定。提出了对PDAC进行表型化的工具,要么用肿瘤细胞的二元分类(纯粹基底样/经典)要么用肿瘤(基底样,经典)和间质(活化,失活)亚型的四个半定量转录组特征5,7。后一种方法的优点是承认了肿瘤内异质性的可能性,因为肿瘤是根据每个特征“评分”的。然而,这些方法受限于样品的数量和质量(福尔马林固定和像活检中的低细胞性)以及分析延迟和跨平台再现性,这限制了其在临床试验和常规护理中的应用。此外,肿瘤可能包含几种亚型的混合物,这使得使用批量转录组方法对它们的解释变得复杂,从而限制了它们的临床价值8。最近的一项研究表明,在原发性切除肿瘤中,肿瘤细胞结构(即腺体的形成)与肿瘤细胞转录组亚型部分相关9。这种方法需要训练有素的病理学家和整个肿瘤的人工分析,以充分评估肿瘤亚型及其可能的异质性。人工智能被证明是一种从组织切片中预测分子变化或表型的有价值的工具,有可能为所有人打开先进的诊断10,11,12,13.

在这里,我们提出了PACpAInt,这是一种基于多级人工智能的工具,使用深度学习模型从常规组织学制备(苏木精-伊红-番红(HES染色))中确定PDAC分子亚型(肿瘤和间质),其分辨率能够在大规模上破译肿瘤内的异质性,并提供不同细胞类型及其分子表型的空间信息(图。1a).

图1:用于鉴定PDAC分子肿瘤亚型的PACpAInt方法。
figure 1

a研究的简化工作流程:应用第一个模型来寻找肿瘤区域(肿瘤细胞和基质)(PACpAInt-Neo),随后应用第二个模型在载玻片水平(PACpAInt-B/C)预测整体肿瘤细胞分子类型(经典对基底样)或在切片水平(112 m宽的小正方形)预测细胞的性质(肿瘤或基质-PAC paint-细胞类型)及其分子亚型(肿瘤细胞的经典对基底样,基质的活性对非活性)(PACpAInt-Comp),b群组的描述。发现队列(DISC)由来自三个中心的202名患者(手术标本)组成。从用于RNA分析的块中取出组织胡萝卜(直径600微米)。HES载玻片(至少2个/肿瘤)被数字化用于PACpAInt分析。在大多数情况下,组织胡萝卜和HES不是来自同一块。第一个验证队列BJN大学未匹配(手术标本)的工作流程类似。对于接下来的两个验证队列(BJN-M匹配(手术标本)和EUS _肝(肝转移瘤,细针活检)),在对肿瘤区域进行显微解剖后,使用相同的块提取RNA,并生成HES载玻片,用PACpAInt进行数字化和分析。此外,在BJN M匹配队列中,所有剩余的肿瘤切片也被数字化用于PACpAInt分析。最后,在TCGA-PAAD验证队列(手术标本)中,与所有其他队列相反,RNA是从冷冻材料中提取的,而不是福尔马林固定的石蜡包埋的。与发现队列相似,RNAseq分析的组织与数字化载玻片在空间上不匹配。

结果

PACpAInt在整个载玻片水平上预测肿瘤区域和肿瘤分子亚型

使用具有相应转录组的1796张载玻片(598名患者)在多个群组上训练和验证模型(群组在图中描述)。1b).深度学习模型在发现群组(DISC群组)上进行训练,发现群组由来自三个中心切除的202个PDAC的424个全切片组织学图像组成(平均切片数量/病例= 2)。这些模型在(I)三个切除PDAC的队列中进行了外部验证:两个来自第四个中心(不同于训练中心)(BJN大学(n= 148),BJN_M(n= 97))和公共TCGA_PAAD队列(n= 126)和(ii)一组通过细针活检获得的肝PDAC转移瘤(肝_FNB,n= 25)也来自不同于训练中心的第四个中心。在外科标本常规检查过程中,病理学家对一名患者的多个肿瘤区域进行取样,导致多个组织块。对于发现队列和两个验证队列(BJN大学和TCGA大学),对于每个患者,转录组是从一个小组织芯中获得的,该组织芯取自一个可能对应或可能不对应于模型分析的HES载玻片的块(即,“空间不匹配”队列)。相比之下,对于BJN-M和里弗-FNB研究组,相同的模块用于制作HES玻片和提取RNA。此外,不使用小的组织核心,而是显微切割该块的整个肿瘤区域,以在HES和转录组之间具有完美的匹配(即,“空间匹配”组群)。

对于所有的模型,幻灯片被分割成更小的图像,称为“平铺”,112 × 112微米(224 × 224像素)。使用在切片水平(检测肿瘤区域)或在整片水平(预测肿瘤亚型)定义的标签来训练模型。第一个模型(PACpAInt-Neo)基于两位病理学家的注释,用于预测肿瘤区域。当应用于两个独立的验证队列时,PACpAInt-Neo成功检测到肿瘤区域(AUC:BJN U = 0.99,TCGA = 0.98)(补充图)。1a).该模型允许快速识别和可视化肿瘤区域,即使它们不相邻,也能以高精度从消化壁成分、淋巴结等检测肿瘤细胞和基质区域。(补充图。1b,c).第二个模型(PACpAInt-B/C)仅使用预测为肿瘤的区域在椎间盘群组上进行训练,以确定由PurIST-RNA分类器定义的基底样/经典(B/C)亚型(图。2a).尽管PDAC具有高度的组织学多样性,但PACpAInt-B/C确定了一组基底样和经典亚型特有的形态学特征(图。2b和供应图。2b).对于分子亚型的载玻片水平预测,PACpAInt-B/C将一个分数分配给一个分块子集,并将所有分块分数汇总到载玻片的单个预测中,即基底样或经典。PACpAInt-B/C在2个空间不匹配的验证队列中成功预测了基底样/经典RNA亚型,在BJN大学和TCGA大学队列中的AUC分别为0.86[0.79 0.94]和0.81[0.71 0.90](图。2c和供应图。2a).在具有空间匹配的组织学和分子面积(BJN_M,AUC = 0.83[0.73–0.93])的第三个验证队列中实现了可比的性能(图。2d).为了确保PACpAInt-B/C不仅概括了组织学分化,我们在三个手术验证队列中分别评估了该模型在高/中分化和低分化肿瘤中的性能(补充表1).AUC范围从0.71到0.90,远离随机猜测,证实分化和分子亚型不是彼此的替代物。

图2:分子亚型PACpAInt-B/C的外部验证及其与存活率的关系。
figure 2

a研究的简化工作流程:应用第一个模型来发现肿瘤(PACpAInt-Neo ),随后应用第二个模型在载玻片水平预测整体肿瘤细胞分子类型(经典与基底样)( PACpAInt-B/C ),b在BJN大学队列(微米广场112号)验证中被PACpAInt-B/C确定为经典或基底状的代表性瓷砖,cePACpAInt-B/C的性能,以使用整个队列或仅验证队列中具有明确RNA亚型(清晰亚型)的病例(BJN_U不匹配(手术标本),即分析的载玻片和用于RNAseq的组织在空间上不匹配)来鉴定分子亚型;BJN_M匹配(手术标本),即载玻片分析和用于RNAseq的组织在空间上匹配;FNB肝脏(EUS细针活检),f, g临床/病理因素和PACpAInt-B/C的多变量分析证明了后者对无病生存的独立预后价值(n= 243)和总存活率(n= 248).圆圈代表可变风险比,而胡须代表该风险比的95%置信区间。P使用双侧Wald测试计算值。没有对多重比较进行调整。***P < 0.001; **P < 0.01; *P < 0.05; +P < 0.1; −P> 0.1.源数据作为源数据文件提供。

PACpAInt强调PDAC瘤内宏观异质性及其预后影响

鉴于之前描述的肿瘤内异质性可能会模糊转录组标签,我们将分析限制在50%具有最清晰、明确的转录组亚型的病例(即,转录组特征表明它们是“纯的”,仅由基底样或经典细胞组成的病例)。在这些情况下,模型的表现有了实质性的改善(BJN大学和TCGA大学队列的AUC分别为0.91[0.84-0.98]和0.88[0.79-0.98])。2c和供应图。2a)8,14。这在空间匹配的验证队列BJN_M中尤为显著(AUC = 0.95[0.90-1.0]),突出了基于RNA的二元分类法在高度异质性肿瘤中的局限性(图。2d)如前所述,而不是模型性能的真实增加,这必须在整个群组中得到认可14,15。因为大多数患者是在肝活检的转移阶段被诊断的,我们也在25例细针肝活检中用匹配的RNAseq数据验证了PACpAInt-B/C(肝脏FNB队列)。性能与手术标本一样好(AUC = 0.85[0.69-1.0]),在具有明确同质分子亚型的病例中也有类似的改善(AUC = 0.92[0.77-1.0])(图。2e).为了评估PACpAInt-B/C的稳健性,我们对肝脏FNB队列进行了研究,这是一个瓷砖的二次抽样,以模拟缺乏肿瘤的活检。使用75%的肿瘤瓦片,AUC是相似的(AUC = 0.85[0.68–0.96]),并且当仅使用50%或25%的肿瘤瓦片来预测分子亚型时,AUC下降但保持良好(AUC = 0.82[0.62–0.96]和0.82[0.61–0.96])。我们将PACpAInt-B/C纳入合并的BJN大学和BJN大学队列的多变量生存分析。PACpAInt-B/C预测对两个OS都有很强的独立预测价值(HR = 1.37[1.16-1.62]p < 0.001) and DFS (HR = 1.27 [1.08−1.49] p= 0.003),与和OS无关的PurIST-RNA分类相反(图。2f,g和供应图。2c,d和补充表格2, 3).

以前已经表明,在同一病例中,不同的载玻片上的肿瘤细胞可能具有不同的形态9。这在经典亚型的肿瘤中特别有意义,可以预期这些肿瘤包含小的基底样区域,这可能影响患者的预后。为了评估假定的微小基底样区域的影响,我们在BJN M验证队列中选择了77例(共97例)被纯化RNA预测为经典的病例。然后在所有肿瘤载玻片上运行PACpAInt-B/C(每个病例的平均载玻片数= 9 ),我们比较了所有载玻片的预测值(图。3).30个病例(39%)至少有一个载玻片被预测为基底样,这表明在整个病变范围内,这些肿瘤具有重要的形态学和分子异质性。这些异质性病例的DFS和OS较短(中位生存期为15个月对35个月,p= 0.08,36个月对64个月,p= 0.002),突出了肿瘤异质性的临床影响(图。3).

图3:通过PACpAInt和全肿瘤分析鉴定的肿瘤内宏观异质性。
figure 3

对于被RNAseq定义为经典的77个病例,所有包含肿瘤的组织切片被数字化(n= 660)并通过PACpAInt-B/C分类。顶部中间面板:在Y轴上表示估计每个载玻片的“基底性”的PACpAInt-B/C评分,而沿着X轴排列患者(1至77)。每个点代表一张幻灯片。所有载玻片显示低PACpAInt评分(< 0.2)的病例被称为“纯”经典,相比之下,更不均匀的肿瘤被称为“混合”经典,因为至少有一个载玻片被预测为基底样。底部中间图片:Kaplan-Meyer分析比较“纯”和“混合”典型肿瘤的总生存率(p值= 0.001538)。***p < 0.001; **p < 0.01; *p < 0.05; +p < 0.1; −p> 0.1.左图:经PACpAInt鉴定为“纯”经典的案例(中间图中的绿色箭头)。显示组织取样位置和相应组织学特征的切除宏观图像(比例尺= 200微米)。虽然这些区域在空间上相距遥远,但肿瘤形态是均一的,其特征是腺体形成模式和整个肿瘤的良好分化。右图:被PACpAInt确定为“混合”经典的案例(中间图中的红色箭头)。显示组织取样位置和相应组织学方面的切除宏观图像。这里的形态是高度不均匀的,有明显的腺体形成区和非腺体形成区。p使用双侧对数秩检验计算数值。源数据作为源数据文件提供。

PACpAInt可以破译肿瘤内的微观异质性

关于基于RNA的肿瘤表征,这些结果促使我们从二分法标记(即PurIST-RNA)转换到基于Puleo等人签名的连续多参数标记。3a)5。使用这种方法,每个肿瘤由四个连续成分定义,两个描述肿瘤细胞(经典和基底样成分),两个描述基质(活性和非活性)。这种方法承认,一个病例可以是“纯”的,具有典型的表型和无活性的间质。3a病例1)或两种肿瘤表型共存的“复杂”病例(补充图。3a情况2),可能更准确地反映肿瘤生物学。在DISC群组上训练一个新模型,以在整个组织切片上预测这些肿瘤细胞/基质成分(PACpAInt-Comp)。PACpAInt-Comp与RNA肿瘤和间质成分的相关性在BJN大学的验证队列中非常显著,在BJN大学的空间匹配验证队列中显著改善(补充图。3b).

为了更好地研究肿瘤内的微观异质性,我们开发了一个模型来预测肿瘤是否主要由肿瘤细胞或间质组成(PACpAInt-Cell型)(图。4a).该模型在由病理学家专家进行的肿瘤细胞和基质注释上进行训练。在BJN大学和TCGA大学的两个验证队列中,该模型的AUC达到0.99(图。4b,c).PACpAInt-Cell类型在BJN M队列的子集上得到进一步验证(n= 50),使用肿瘤特异性泛细胞角蛋白免疫组织化学(Pearson’sR= 0.72,p < 0.001) (Fig. 4d).使用这个模型对一个集合队列的预测(迪斯克,BJN和BJN,n= 451),我们证实了大量间质与较好的预后独立相关(HR = 0.86[0.76–0.96],p= 0.01,HR = 0.87[0.77-0.98],p= 0.02,分别用于DFS和OS)(图。4e和补充表4),如以前报告的那样16,17,18.

图4:通过PAC paint-细胞类型鉴定肿瘤细胞和基质。
figure 4

a使用PAC paint-细胞类型进行细胞类型识别的工作流程。PACpAInt-Neo首先用于识别肿瘤区域,然后是PAC paint-细胞类型,在这些区域内,PAC paint-细胞类型将肿瘤细胞与基质区分开。PACpAInt-Cell type在圆盘群组的81个载玻片的区域上进行训练,由两位病理学家在细胞水平上进行注释。b在TCGA验证队列(微米广场112号)中通过PAC paint-细胞类型确定为肿瘤或间质的代表性瓦片。cPACpAInt-Cell type在BJN大学(上图)和TCGA大学(下图)验证队列中识别肿瘤和基质细胞的性能,d通过PAC paint-细胞类型或基于泛细胞角蛋白免疫组织化学的肿瘤基质/比率的计算机辅助计算(比例尺= 300微米)计算的肿瘤细胞/基质比率之间的相关性(染色面积/总肿瘤面积的比率) (p值= 3.16e-09)。p值是使用双边计算的t-测试,e临床/病理因素的多变量分析和PAC paint-细胞型计算的无病肿瘤/间质比率(左,n= 428)和总体(右,n= 451)在合并的椎间盘队列和BJN_U + M验证队列中的存活率。圆圈代表可变风险比,而胡须代表该风险比的95%置信区间。P总存活率的值是:辅助治疗,p= 0.001935;PACpAInt-cell类型,p= 0.020405,嗜神经侵袭,p= 0.797476;分化,p= 0.731345;血管入侵,p= 0.512674;病理学N阶段,p= 0.001960;纯化核糖核酸,p= 0.001058;切除状态,p= 0.002100;肿瘤大小,p= 0.053910.P无病生存的价值是:辅助治疗,p= 0.007799;PACpAInt-cell类型,p= 0.008226,嗜神经侵袭,p= 0.721716;分化,p= 0.779395;血管入侵,p= 0.745392;病理学N阶段,p= 0.000665;纯化核糖核酸,p= 0.000153;切除状态,p= 0.002868;肿瘤大小,p= 0.019464.***p < 0.001; **p < 0.01; *p < 0.05; +p < 0.1; −p> 0.1.源数据作为源数据文件提供。

PDAC显示出主要的肿瘤内微观不均一性,对预后有重要影响

然后,我们将完整的三步模型应用于每张载玻片的每一片(112微米宽的正方形),以预测其是否包含肿瘤组织、肿瘤细胞或间质及其分子表型(每片载玻片的平均nb = 23,306)(图。5a).模型的瓦片水平预测(肿瘤细胞瓦片上的基底样/经典和基质瓦片上的活性/非活性)与PDAC两位病理学家的瓦片评分之间的一致性良好(肿瘤成分的一致性= 100和99.2%,基质成分的一致性= 99.2和99.4%)。此外,根据PACpAInt-Comp预测具有基底样和经典表型的瓦片是含有肿瘤细胞的瓦片(根据PAC paint-细胞类型)。类似地,根据PACpAInt-Comp预测为包含活性或非活性基质(分别为基质活性或基质活性成分高分)的瓦片是根据PAC paint-细胞类型包含基质(且无肿瘤细胞)的瓦片(图。5c).在用GATA6/Claudin18和KRT17抗体染色的载玻片上进一步评估PACpAInt-Comp,这三种抗体分别为经典和基底样表型建立了特异性标记19,20。PACpAInt-Comp能够区分GATA6 + /Claudin18+和KRT17+区域,基底样和经典肿瘤评分的AUC分别为0.87和0.75(图。5d).使用PACpAInt-Comp预测,我们还强调了活跃间质和基底样表型之间的强相关性,而不是经典表型(图。5e如以前报告的那样5。在多变量Cox模型中,相对于单独的临床分子数据,使用PACpAInt-Comp评分显著改善了预后预测(+4 c指数,p= 0.007和+3 c指数,p= 0.008分别用于OS和DFS)(补充表)5).

图5:分子成分的PACpAInt鉴定以解释肿瘤内的微观异质性。
figure 5

a瓦片级分子成分识别的工作流程。首先应用PACpAInt-Neo来识别肿瘤区域,接着应用PAC paint-细胞类型来识别肿瘤细胞和间质,然后应用PACpAInt-Comp来预测肿瘤细胞和间质的分子亚型,b在TCGA验证队列(微米广场112号)中,PACpAInt-Comp确定为典型或基底样或间质活性或非活性肿瘤的代表性图块,cPAC paint-细胞型肿瘤和间质评分,通过PACpAInt-Comp确定为经典、基底样、间质活性或无活性(对每个类别的100 K切片进行分析(即经典、基底等)。).中心对应于第一和第三四分位数的中间值、下铰链和上铰链,胡须对应于不超过1.5 × IQR的历史/最低值(四分位数间距),d通过PACpAInt-Comp鉴定为经典或基底样并通过免疫组织化学用经典(GATA6/Claudin18)或基底样(KRT17)标记(比例尺= 200微米)染色的区域的平铺水平的例子,e基质和上皮评分滑动中位数之间的相关性。源数据作为源数据文件提供。

PACpAInt强调PDAC瘤内微观异质性及其预后影响

我们进一步评估了肿瘤内异质性的影响,使用PACpAInt-Comp对总共630万个肿瘤切片进行了空间表型分析,包括451名合并队列(DISC,BJN大学和BJN大学)的患者。PACpAInt分型显示71%的肿瘤呈现明显基底样肿瘤细胞的可检测部分,证实大多数PDAC确实含有基底样细胞,如先前对12例的单细胞分析所提示的8,21。基底样细胞的总体比例具有预后性,在多变量分析中,从5%的基底样肿瘤细胞开始恶化的预后与OS和DFS独立相关(图。6a、b和补充表6).此外,随着基底样瓦片的比例增加,非活性基质瓦片的比例减少,而活性基质瓦片的比例增加(图。6c).

图6:评估微小基底样肿瘤成分的影响。
figure 6

aKaplan-Meier和无疾病的多变量分析(n= 428)和b总存活率(n= 451)比较少于5%、5-20%和多于20%的肿瘤块被鉴定为基底样的肿瘤,c相同肿瘤中基底样瓦片的百分比与非活性或活性基质瓦片的比例之间的关联(n=总共451,[0–5]n= 305[5–20],n= 121[20–100],n= 25).中心对应于第一和第三四分位数的中间值、下铰链和上铰链,胡须对应于不超过1.5 × IQR的历史/最低值。源数据作为源数据文件提供。

对基底样和经典PACpAInt-Comp评分的逐瓦分析显示,只有60%的肿瘤有明确的主要亚型(经典41%和基底样19%)。其余的可分为罕见的杂交亚型(10%),由可明显区分的基底样和经典肿瘤细胞共存定义,以及中间亚型(30%),其中大多数肿瘤细胞不能明确归入这两种亚型中的任何一种(图。7a,b).进一步支持这些发现的是,在PACpAInt预测为基底样的病例中,RNA基底样信号较高,而在经典和中间肿瘤中较低(图。7c).经典的RNA信号与此相反。有趣的是,预测为混合型的肿瘤显示出高度经典和基底样特征,证实了它们的双重性。PACpAInt的亚型预测具有很强的预后影响。正如预期的那样,主要的典型肿瘤预后最好(中位DFS 27.5个月,中位OS 45.1个月),主要的基底肿瘤最差(中位DFS 8.4个月,中位OS 13.6个月)(图。7d还有。补充表格7).中间型和混合型肿瘤显示出中等预后(中间型肿瘤的中位DFS为15.7个月,中位OS为33.0个月,混合型肿瘤的中位DFS为12.3个月,中位OS为23.4个月)。在主成分分析中,基于转录组特征的病例分布清楚地表明AI定义的中间肿瘤确实存在于病变之间(图。7e).基因组变异分析表明,AI定义的中间肿瘤,如基底样肿瘤,关闭了胃/肠样分化程序,这是经典肿瘤的标志,但没有上调基底样信号(鳞状和EGFR/KRAS途径),从而证实了它们的中间性质(图。7f).

图7:基于异质性的PDAC亚型的PACpAInt鉴定。
figure 7

a患者分布为四种亚型:主要经典型、中间型、混合型和主要基底样型。对于每个列式患者,首先显示第99百分位的基底样和经典评分,其次显示不同水平的基底样和经典表型的肿瘤瓦片的比例,b肿瘤细胞表型沿基底样与经典分化轴的瘤内分布示意图,c肿瘤水平RNA定义的基底样和经典表型特征分数的分布在四种亚型之间进行了比较:主要经典型、中间型、混合型和主要基底样,(n=总共451,高低音n= 84,高. clan= 192,混合n= 45,利息n= 130).中心对应于中间值,下铰链和上铰链对应于第一和第三四分位数,胡须对应于不超过1.5 × IQR的历史/最低值,dKaplan-Meier无病生存率和总生存率分析比较了主要的经典型、中间型、混合型和主要的基底样肿瘤,e基于肿瘤转录组谱的主成分分析中PACpAInt定义的亚型的分布,f在PACpAInt定义的亚型(n=总共272,高低音n= 61,高. clan= 128,利息n= 83).中心对应于中间值,下铰链和上铰链对应于第一和第三四分位数,胡须对应于不超过1.5 × IQR的历史/最低值。源数据作为源数据文件提供。

讨论

随着对PDAC分子亚型的全球共识最终出现,并且早期结果表明它们除了强大的预后价值之外还具有潜在的预测价值,对有效和可靠的肿瘤分型的需求比以往任何时候都大6。在这项研究中,我们开发了PACpAInt,这是一种基于人工智能的工具,能够在常规病理切片上预测肿瘤和基质细胞的PDAC分子亚型。我们的方法依赖于可解释的深度学习设计,将整个肿瘤上定义的分子特征转化为基于形态学的空间化细胞表型,用于全面的肿瘤内异质性分析。

我们的训练队列包括来自不同中心的长时间不同染色方案的载玻片,以确保染色的广泛可变性,从而建立稳健的模型。对四个独立队列的模型验证是本研究的一个优势。来自第四个中心和多中心策划的TCGA-PAAD队列的验证队列的良好表现也支持了模型的稳健性,特别是因为TCGA-PAAD载玻片用H&E染色,而其余载玻片用H&E + Safran染色,这是法国的标准组织学染色,在某些情况下更好地突出了纤维化基质。我们还使用IHCs对肿瘤/间质亚型模型进行了空间验证,以定义H&E载玻片上的基底样和经典区域,并使用病理学家注释将活动和非活动间质区域定义为金标准。最重要的是,我们验证了肝活检的肿瘤亚型鉴定,肝活检是PDAC诊断最常见的诊断样本。PACpAInt即使在减少25%的分析瓦片数量时也表现得同样好,这表明即使在肿瘤组织的量稀少时它也可能是有用的。我们的研究没有带来任何新的深度学习方法,而是依赖于现有的深度学习技术,这些技术已被证明在各种任务中工作良好22,23。PACpAInt通过深度学习带来了无RNA PDAC分子分型和大规模PDAC肿瘤内和肿瘤间异质性的分析。

虽然肿瘤细胞的二元分类未能如实概括PDAC的复杂性,但它提供了一种易于实施的工具,有助于评估预后并可能立即决定治疗,而无需冗长和昂贵的RNAseq分析,从而允许其在临床试验中用于对患者进行分层。在具有很少肿瘤细胞和/或被非肿瘤细胞严重污染的样品中,基于RNA的肿瘤分层会显著受损,这在胰腺活检中是非常常见的情况。除了这些挑战之外,在PDAC的常规实践中,需要非常快速地进行预测性RNAseq,以避免延误首次化疗。这意味着,除非进行大量的集中工作,否则每个中心每周将处理几个样本,导致高成本和样本标准化的困难。在载玻片层面使用PACpAInt有助于克服这些问题。此外,它可能有助于无法访问RNAseq的小中心的病理学家。PACpAInt的一个明显限制是活检可分析的组织量。非常小的病变导致很少的细胞,足以诊断恶性肿瘤,但不适合PACpAInt。应用于CT扫描的深度学习模型可能代表一种有吸引力的非侵入性替代方法。到目前为止,提出了用于PDAC诊断(相对于自身免疫性胰腺炎)或预测更简单的分子标记的模型,据报道这些分子标记影响PDAC的生存率,例如免疫组织化学的KRT81阳性24,25。此外,PACpAInt-Neo等深度学习模型可用于检测新辅助治疗后剩余的肿瘤细胞,为标准化回归评分铺平了道路,该评分也可用于调整辅助治疗的试验26,27。这是特别令人感兴趣的,因为一个国际专家组最近的研究强调了使用CAP评分对新辅助肿瘤反应进行分级缺乏观察者间的一致性28。在全数字病理学实验室中,这种类型的模型将比细胞角蛋白染色和计算机辅助的肿瘤密度计数更快。

PACpAInt使我们能够深入评估肿瘤内的异质性。很少有研究进行了多区域RNAseq,每一个都在少数病例中进行,这表明两种主要亚型可能存在于单个肿瘤中29,30。我们的结果提供了PDAC瘤内异质性的清晰图像,显示几乎三分之一的肿瘤可能介于经典亚型和基底样亚型之间。这是一个重大的兴趣,因为一些表观遗传药物正在开发中,试图重新编程PDAC细胞。我们的数据显示,次要的基底样成分,可能会被二元分类法忽略,具有很强的预后意义。最后,这项研究还表明,间质室可以快速分型,为药物靶向试验中的患者分层铺平了道路。深度学习模型经常被批评为缺乏可解释性的黑盒模型。我们研究中使用的模型可以通过设计来解释,我们能够检索最有预测性的区域。病理学家的分析证实了模型发现的生物学意义。此外,像我们用于肿瘤/间质亚型鉴定的弱监督方法可用于突出局部模式(即,具有特定特征如坏死、存在三级淋巴结构等的肿瘤区域)。)这可以解释否则不清楚的全球分子标签,可能揭示关键的细胞成分和/或它们的相互作用。

总之,虽然证明了基于组织学的深度学习模型对PDAC肿瘤分型的价值,但这些结果也显示了基于分子的分型在高度异质性样本中的局限性。随着数字病理学的扩展,基于远程人工智能的PDAC分型可以在世界范围内部署,最终为基于强大分子标准的患者分层开辟了道路。