您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2021
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

HER 2阳性乳腺癌的空间反褶积描述肿瘤相关细胞间的相互作用

 二维码
发表时间:2021-10-22 09:27作者:武汉新启迪Xinqidibio

摘要

在过去的几十年里,转录研究已经彻底改变了癌症的治疗和诊断。然而,肿瘤测序策略通常会导致空间信息的丢失,这对于理解细胞间的相互作用及其功能相关性至关重要。为了解决这一问题,我们利用空间转录技术研究了HER 2阳性乳腺肿瘤中的空间基因表达。我们表明,基于表达的聚类支持数据驱动的肿瘤注释和患者内部和患者间异质性的评估;从中我们发现了免疫和肿瘤过程的共享基因特征。通过与单细胞数据的整合,我们在空间上绘制了肿瘤相关细胞类型图,以寻找三级淋巴样结构,以及与T细胞和巨噬细胞子集共定位区域重叠的Ⅰ型干扰素反应。我们构建了一个预测模型,以推断是否存在三级淋巴样结构,适用于组织类型和技术平台。综合起来,我们结合不同的数据模式,定义了肿瘤细胞间相互作用的高分辨率地图,并提供了跨组织和跨疾病的通用工具。

导言

转录和遗传学研究改变了我们对癌症的理解,并导致了新的诊断和治疗工具的开发。单细胞核糖核酸测序(scrna-seq)技术的最新进展为深入了解肿瘤的细胞组成提供了广泛的视角。1,2,3。在数十年的临床和临床前研究的基础上,许多scrna-seq研究分析了肿瘤相关细胞,其中一些主要集中在癌细胞上。4,5,6,7,8,9,10,11,12,免疫细胞13,14,15,16,17,18,19,或成纤维细胞20,21,22。在这些研究中,细胞类型根据其分子特征被划分为更精细的区别。这些细胞亚群共同构成复杂的生态系统,不断相互作用,以控制肿瘤的进展和治疗结果;然而,关于肿瘤相关细胞亚群如何和在何处相互作用的许多基本机制仍未解决。

虽然scRNA-seq提供了一个高通量的分析细胞的转录,他们的空间上下文丢失在组织处理。相反,免疫组织化学(IHC)和原位杂交等技术提供了较高的空间分辨率,但往往需要预先选择目标,因此这些方法不太适合高通量探索性分析。此外,最近的研究表明,大多数肿瘤相关细胞状态复杂,不易被少数标记基因或表面受体所定义。2,这对有针对性的空间方法提出了技术和财政方面的挑战。23。因此,St hl和Salmén等人开发的空间转录(ST)。24它提供了空间分辨和转录广泛的表达信息,非常适合于研究肿瘤间质中细胞间的相互作用和基因表达的空间方面。

乳腺癌仍然是一个重要的公共卫生问题,仅在美国每天就夺去一百多人的生命,而且它的治疗往往很艰难,给病人造成了巨大的损失。25。乳腺癌分为几个亚型,包括HER 2阳性的肿瘤,其定义是肿瘤细胞对HER 2(人表皮生长因子受体2)表达的富集。26,27。据估计,在所有乳腺癌中,有15-20%的肿瘤是HER 2阳性,这些肿瘤通常表现出积极的生长,需要大量的治疗。28,29。对控制乳腺肿瘤进展的分子基础的研究已经为HER 2阳性的乳腺癌患者带来了相当大的临床益处;最显著的是,引入了HER 2靶向疗法,极大地改善了疾病的结局。30。尽管取得了这一进展,许多转移性her 2阳性乳腺肿瘤患者仍因原发性或获得性抗药性而屈服于抗her 2治疗。31。因此,治疗HER 2癌症患者的替代策略是必要的。

在过去的十年里,针对免疫系统的药物提高了病人在几种不同癌症中的存活率。32。传统上,乳腺癌不被认为是一种免疫原性疾病,但肿瘤浸润淋巴细胞的增加一直与乳腺癌预后良好相关。33。在三阴性(Tnbc)和her 2阳性乳腺癌中,肿瘤相关淋巴细胞水平升高,表明与其他乳腺癌亚型相比,它们具有更强的免疫原性。34。此外,三级淋巴样结构(Tls)是一种能在肿瘤等组织中异位形成的淋巴结样结构,对her 2阳性肿瘤的治疗结果有一定的预测能力。35,36,37。然而,到目前为止,免疫检查点阻断治疗还只是临床上批准的TNBC。因此,有必要了解HER 2阳性肿瘤的分子特征和细胞组成的基本机制。

在这项研究中,我们试图通过将ST应用于人类乳腺癌来加深我们对肿瘤相关细胞关系的空间方面的理解。更确切地说,我们用ST对来自8个HER 2阳性个体的36份样本进行了空间基因表达和细胞类型的调查。我们使用许多不同的方法,包括基于表达式的聚类和单细胞数据集成,来检查患者内部和患者间的异质性。我们在这里定义:(I)HER 2阳性患者之间共享的空间表达特征;(Ii)高分辨率细胞状态共定位模式,揭示I型干扰素相关的巨噬细胞T细胞相互作用;(Iii)在ST数据中识别假定的三级淋巴样结构的方法。

结果

8例HER 2阳性的肿瘤患者(患者A-H)接受ST,三次(相邻)或六次(平均间隔)从每个肿瘤中获得6次(平均间隔)。n=36款(方法和补充数字)1)。为了简洁起见,我们将参考源自同一个复制个体的部分。图形1提供分析工作流和方法的概述。

图1:研究概况。
figure1

样本检索后,对36例HER 2阳性切片进行ST(SpaceTranscriptomics)检查.一位受过训练的病理学家从每个样本中手工标注了一个部分。采用基于表达式的聚类和单细胞数据集成的方法,对数据中的空间表达式轮廓和单元类型交互进行了研究。对每一个簇提取标记基因并进行功能富集分析,使我们能够从生物学角度对它们进行注释。通过用单细胞数据解卷积每个点的表达谱,我们可以推断出细胞状态共定位的模式,并设计一个预测三级淋巴样(TL-like)结构的模型。单细胞数据及其相关的细胞注释来自外部来源,也检查HER 2阳性肿瘤样本。

人工注释和初始数据特征

一位病理学家检查和注释了每个肿瘤的一个部分(A.E.)根据相关的HE图像(苏木精和伊红)的形态学。区域标记为:原位癌,浸润性癌症,脂肪组织,免疫浸润,或结缔组织。2A和补充数字2).

图2:基于表达式的病人G的分析结果。

A病理学家将形态学区域划分为脂肪组织(Cyan)、乳腺腺(绿)、原位癌(橙色)、结缔组织(蓝色)、免疫浸润区(黄色)和浸润性癌(红色)。B将基于表达式的簇的分布划分为一个组织部分。C所有点的UMAP嵌入(n446)从这三个副本中,标记是基于聚类标识进行着色的。D在三个复制中分配给每个集群的点的比例。E点图显示簇和注释区域之间的重叠。点的大小表示属于带注释区域的聚类点的比例。病理学家的注释是在x轴上的群集注释y轴心。F。簇的热图和差异表达的基因。根据其与形态区域和标记基因的关联,对每个聚类进行注释。热图颜色表示规范化和缩放的表达式值。APC代表抗原提呈细胞。

为了探索空间基因表达数据,我们首先应用常用的归一化技术,并使用umap(方法和辅助图)将其可视化在2D空间中。3)38。来自不同患者的空间捕获位置(以下简称斑点)被分离成孤立的簇,每个患者的复制之间有高度的混合。这种聚类模式意味着患者间存在异质性,这在处理肿瘤样本时是可以预料的。39。在scrna-seq数据中,免疫细胞,而不是肿瘤细胞,通常混合在病人之间。16。在ST,多个不同的细胞类型对每个斑点的转录谱有贡献(~0-200个细胞/斑点);因此,即使是免疫丰富的斑点也倾向于以病人特有的方式分离。40。因此,为了正确地捕捉每个病人的分子轮廓的细微差别,而不冒熄灭弱信号的风险,我们最初分别对每个病人进行了分析。

基于表达式的聚类

对于病人分析,我们将数据分成相互排斥的病人子集,每个子集被独立标准化,目的是消除技术噪音和批处理效应。接下来,我们使用Seurat的共享最近邻方法(集群称为pXcY)对数据进行聚类;X=病人身份,Y=组群id)41。物理空间中相邻的点通常被分配到同一个星系团中,并且这些星系团与病理学家的注解相一致(如图所示)。2A-C和补充数字2)。此外,簇的空间排列和每个簇中斑点的比例在各个复制体之间是一致的(图)。二维空间,补充数字35).

聚类注释

为了更好地理解以表达为基础的聚类所代表的生物实体,我们进行了差异基因表达分析,得到了一组标记基因,这些标记基因在每个聚类中被上调并具有特征性(图1)。2F)。标记基因的选择是由一个联合的截止相对于他们的调整。p价值和折迭变化(方法和补充数据)1)。为了评估生物途径的富集程度,我们使用g:Profile对GO:BP(GO生物过程)数据库中簇的标记基因进行了查询。42。基于标记基因的集合及其相关途径,我们注释了基于表达的聚类(补充数据)。2);这些注释并不是详尽无遗的,而是为以后的分析提供了指导。

聚类与病理学家注释区的比较

我们通过计算属于每个聚类的区域内的点的分数,将病理学家注释的区域与基于表达式的集群联系起来(图1)。2E)。观察到了很强的一致性;免疫相关过程富集的簇与免疫浸润物很好地重叠,与癌症相关的路径簇也进入了癌区(补充数据)。3)。这种比较在病理学家的注释和我们的数据驱动方法定义的集群之间建立了一致。值得注意的是,一个原位癌区域,只有三个点正确地聚在一起,物理上分开,但注释相同(图4中的pGc 4)。2B和补充数字6),证明了ST的敏感性,并验证了集群并不仅仅是由物理邻近所驱动的。在病人H中,标记为原位癌的部分区域在所有复制体上是一致的,由两个基于表达的簇组成;一个(PHc 1)与其他癌症区域重叠,另一个(Phc 4)为免疫过程而富集,并在空间上与带注释的免疫浸润相一致(补充图)。6)。这些观察表明,数据驱动的基于表达式的聚类捕获了可能被视觉检查忽略的信号,因此在某些情况下提供了对组织的更深入和细致的描述。

探讨患者内外异质性

多个肿瘤特征可能存在于一组个体之间,但也存在于给定的病人中。这种异质性的特征可以帮助设计更细致和个性化的治疗方案。43。因此,我们使用基于表达式的集群作为一个框架来检查数据中的病人内部和患者间的异质性。

有趣的是,我们在大多数患者的转录组水平上观察到了患者内部的异质性;除两名患者(患者B和H)外,所有患者都有多个标记为癌症的簇。鉴于HER 2受体在HER 2亚型病因学中的重要作用,我们还研究了ERBB 2(编码HER 2受体)在癌群中的表达。我们观察到在ERBB 2基因表达(双面Mann-Whitney)U测试,p[医] < 0.05) between clusters in the same patient, attesting to a certain spatial heterogeneity of ERBB 2“表达(补充数字)7和补充表1)。患者E在两个空间分离的肿瘤灶中表现出不同的转录谱(pEC 3和pEC 4)(补充图)。2)。虽然这样的观测结果可能是“过度聚类”的结果,但这两个星系团在UMAP-空间中是分开的和不相邻的,这表明了不同的表达轮廓。两个集群ERBB 2被列为标记基因,用于细胞生长相关途径的富集,但其中一组(PEC 3)在与免疫反应相关的过程(如体液免疫反应)中表现出高度的富集,p[医]=4.0×10−5;免疫系统过程,p[医]=8.0×10−5)而凋亡和调节途径则在另一条中富集(pEC 4:例如,细胞死亡,p[医]=6.5×10−9;凋亡过程,p[医]=1.6×10−8)(补充数据4)。这些发现暗示一个肿瘤病灶(PEC 3)可能有较高程度的浸润免疫细胞。因此,ST使我们能够进一步在空间上标定具有相似形态的不同分子剖面的区域。

免疫和肿瘤核心特征

为了评估数据中普遍存在的特征,我们比较了不同患者的标记基因的聚类,如上文所述。我们推断,如果两个簇共有大量的标记基因,它们应该被认为比相反的基因更相似。为了将相似性的概念转化为定量度量,我们计算了每个簇对组合的Jaccard指数。五个不同的超群((a,“集群”)是在根据相似性(方法和补充图)对集群进行分级分组之后出现的。8)。只有成员中至少有一个共有基因的超群才被认为是稳健的,五个超群中有三个符合这一标准。在其余三个超群中,大多数成员簇中存在的标记基因(至少80%)被认为是具有代表性的核心签名。两个核心特征是免疫相关的:第一个是一组47个基因,包括APOEC1q{A,B,C}巨噬细胞(M)高表达,提示相应超群中的团簇可能含有肿瘤相关的M。16第二组基因由55个基因组成,包括淋巴细胞和mhc I-Ⅱ类相关成员(例如,TRBC 1, [医]{A,B}, Hla-D{QB1,RA,RB1})44。第三个核心特征由11个基因组成,其中几个基因与癌症和增殖生长有关(例如,ERBB 2,EPCAM,(Cdh 1)45,46。这个癌症核心特征来自于一个超群,其中所有的星系团都被注释为与癌症相关的。为了明确起见,上述癌症超级群完全由与癌症相关的簇组成,但并不是所有这类簇都是这个组的成员。完整的核心签名可在补充数据中找到6.

与单细胞数据集成的细胞类型组织推断

鉴于不同细胞类型之间的空间排列和相互作用模式对疾病的进展和治疗都有影响,我们想要绘制每一种细胞类型在组织中的空间分布。然而,ST数据并不提供单细胞解析,即每个SPOT承载几个可能不同类型的单元,这意味着SPOT并不总是被专门分配给单个单元类型。在捕获位置估算细胞类型丰度的一个共同策略是整合ST和单细胞/核-seq数据,以便将前一种类型的混合观测数据解压缩,有效地将细胞类型映射到空间上下文中。这种综合方法以前已经成功地应用于空间癌症数据。47。为了反卷积我们的ST数据,我们使用了立体镜方法,对于空间数据中的每一个点,估计属于在给定的单个单元数据集中定义的每个单元类型的单元格的比例,从而产生一个n斑点 × n细胞类型比例值矩阵48。立体显微镜方法使用完整的表达谱,便于区分具有重叠标记基因的相似细胞类型,这在复杂和混杂的肿瘤环境中尤为重要。

从五个HER 2阳性肿瘤中提取scRNA-seq数据集,在三个层次(方法)中注释,用于解译我们的空间数据。49。这三个层被称为主要层、次要层和子集层(Wu等人的术语)。主要有8种不同的细胞类型:髓系细胞、T细胞、B细胞、上皮细胞、浆细胞、内皮细胞、癌相关成纤维细胞(CAFs)和血管周围样细胞(PVL细胞)。次要层代表主要细胞类型(如M和CD8+T细胞)的更精细的划分。反过来,最低层进一步将小层分裂成细胞状态或“亚群”,如趋化因子表达的M和IFNγ表达的T细胞。综合分析的摘录如图所示。3。补充数据7包含所有剩余病人和层的可视化,所有来自立体镜的输出都在补充数据中找到8.

图3:scrna-seq数据中细胞类型的空间映射。

A在病理学家(病人G)确定的区域内主要细胞类型的富集(绿色)和耗竭(红色),以及不同细胞类型(如上皮、CAFs、浆细胞和B细胞)的比例估计。斑点注释用边界颜色表示,包括区域:原位癌(橙色)、浸润性癌症(红色)和免疫浸润(蓝色)。B类似于A而是由基于表达式的聚类定义的区域。C在所有36个切片和患者的主要层内所有细胞类型的相关图,可以观察到髓系细胞和T细胞之间有明显的相关性。D髓系细胞和T细胞所占比例分别为1、2、1。所有显示的结果都与患者G有关,但C次图除外,其中所有患者的相关值都是计算出来的。CAF与癌症相关的成纤维细胞,PVL血管周围的细胞。

结果交互探索

我们已经编译了一个包含基于表达式的集群和单细胞映射的所有数据和结果的资源;具有一个图形用户界面(GUI),可以对这些数据进行全面的探索(代码可用性)。

手动定义区域中单元类型的富集

接下来我们在病理学家注释的区域内检查细胞类型的富集/耗竭。观察到一些积极的趋势,B和T细胞在免疫浸润中富集,而肿瘤区域则显示出肿瘤相关细胞类型的富集和几种基质细胞类型的减少(图G中的病人G)。3A,所有在补充资料中的病人9)。除病人B外,所有患者均发现浸润性癌区HER 2相关上皮癌型增高(补充图)。9)。与此形成对照的是,患者B在浸润性癌区表现为HER 2相关上皮细胞型的缺失和B腔型(LEM)的富集。巧合的是,患者B也有独特的孕酮受体阳性谱,符合Lumb分子亚型(补充图)。9和补充表2)50。综合起来,这些发现被认为是肯定的,我们的地图的有效性。

基于表达式的簇内细胞类型的富集

我们研究了基于表达的簇内细胞类型的富集/耗尽,以了解单细胞映射与这些类型之间的关系(图1)。3B和补充数据9)。在病人E中,在两个空间上分离的肿瘤灶中,某些上皮细胞的凋亡和调节通路(PEC 4)的相关簇(PEC 4)被富集,而缺乏记忆的B细胞。相反,免疫丰富的癌细胞群(Pec 3)对记忆性B细胞和CD4+T细胞富集,癌细胞类型弱或不富集(补充图)。10)。在患者G中,所有标记为肿瘤的簇都是:血浆细胞减少,富集率很低,或B和T细胞减少,每四组中有三组上皮细胞富集(图一)。3B)。原位癌群(PGc 4)是患者G中唯一的肿瘤簇,在所有复制的树突状细胞中富集,同时也缺少肌成纤维细胞样的CAFs(补充图)。11)。我们还观察了血浆细胞免疫簇(PGC 1)对浆细胞的富集情况,而抗原提呈细胞(APC)免疫簇(PGC 3)对B细胞、T细胞和髓样细胞的富集作用较强。PVL细胞在肿瘤/结缔组织混合簇(PGc6)中表现出过度表达,并表现为髓样细胞、CAFs和内皮细胞的富集(图6)。3B和补充数字12)。与组织形态学、病理学家注释和基于表达的聚类相一致的结果表明,单细胞数据充分代表了我们的组织,从而提供了包含的细胞类型的可靠映射。

人口多样性空间图

为了了解不同空间区域内细胞种群的多样性,我们计算了每个点内细胞类型分布(比例估计)的熵。高熵分数表示高多样性,而低熵分数表示相反。我们发现,与免疫相关的簇比癌症团簇的异质性更强,这一效应在患者A中更为明显。当APC富集簇出现时,其多样性程度最高,患者B群为例外(补充图)。13).

细胞型共定位的发展趋势

通过计算细胞型点状Pearson相关图,探讨细胞间的相互作用。3C),两种细胞类型之间的正相关被认为是共定位的。在主要层次,最突出的特征--在所有患者中--是上皮细胞与其他细胞类型之间的反关系(如图所示)。3C)。内皮细胞(主要层)与CAFs(除G外)和血管周围细胞(除F外)均有保存良好的共定位模式(图1)。3C)。在次要层,上皮细胞分裂成癌细胞和正常上皮细胞,除病人E外,所有患者均与此相关(补充图)14)。对于病人共定位矩阵,我们参考补充数据。10。增加的细胞类型分辨率,从而揭示了肿瘤上皮细胞是如何主要贡献的趋势,上皮细胞的反关系观察到的主要层。两种类型的咖啡厅在小层之间也有一个空间分隔(除了病人A之外,所有病人都是补充图)。14)。在子集水平上,成熟的腔细胞(正常上皮细胞的子集)总是与一种癌症类型(患者A除外)共定位,这意味着接近腔细胞或成熟腔表型(补充图)15)。在免疫细胞群体中,血浆细胞与B细胞在所有患者中均呈负相关(图一)。3B、C)(病人A,补充数字16)。这些发现表明B细胞和浆细胞位于肿瘤内不同的位置。51。目前尚不清楚这些发现是否反映了肿瘤相关B细胞局部分化过程中浆细胞的迁移,或者浆细胞是否是从肿瘤微环境外的B细胞发展而来的。在8例患者中有5例观察到B细胞和T细胞(主要层)间的不同强度的共定位;患者G和H表现出特别强的共定位信号,它们的B和T细胞分布有充分的重叠,如下图和补充图所示。17和18.

我们还观察到T细胞与髓样细胞共同定位。3C,D),因为T细胞和髓系细胞之间的相互作用已经建立得很好,并能深刻地影响它们各自的行为。52。最近的研究还揭示了T细胞和髓样细胞类型之间的巨大异质性,它们各自的亚群呈现出不同的状态谱。13,16,18。当检测T细胞和髓样细胞的较细层时,可观察到多种共定位趋势,如cDC2:CD1C、M:Egr1和PDC:IRF 7之间的弱阳性信号,其中包括Tfh和Tregs等CD4+T细胞。我们还观察到M_2:CXCL 10与所有患者T细胞状态(T细胞:Iit 1)之间存在显著的相关性(图1)。4A),并想进一步探讨这个问题。

图4:髓系细胞与T细胞的共定位。
figure4

AT细胞与髓系细胞亚群的相关图显示T细胞:IFIT 1和M_2:CXCL 10(巨噬细胞2:CXCL 10)在所有患者中均有明显的相关性。B每个表达型T细胞和髓样细胞亚群的富集(绿色)和耗竭(红色),突出显示患者G(PGc 4)第4组中存在相关的T细胞类型:Iit 1子集和M_2。CT细胞的比例估计:pGc 4中的Iit 1子集和M_2。DPGC 4Ⅰ型干扰素信号通路的标记基因富集的通路以红色突出。交叉大小相当于pGC 4标记基因与给定通路的重叠项数。EⅠ型干扰素信号通路(GO:0060337)在患者G上的点状富集p浓缩分数所依据的数值是用双边Fisher精确检验(方法)计算的,由于每个点都有单一假设(富集或不富集),因此不对多假设检验进行调整。

I型干扰素应答过程的存在

如scRNA-seq资源所示,M_2:cxcl 10表达的趋化剂水平增加。CXCL 9CXCL 10。这两种趋化因子结合CXCR 3,通常存在于T细胞和NK细胞上。53,54。肿瘤相关髓系细胞表达CXCL 9/10已经被描述并被认为是重要的免疫治疗诱导的抗肿瘤功能。16,55,56,57。此外,CXCL 9/10I型干扰素刺激可诱导表达49。类似地,T细胞的几个标记基因:ifit 1状态也与I型干扰素反应有关。

肿瘤内Ⅰ型干扰素激活可直接作用于肿瘤细胞,抑制增殖或刺激凋亡过程,或通过激活抗肿瘤免疫间接作用。58,59。此外,某些抗癌疗法已被证明可以诱导和依赖于Ⅰ型干扰素的激活。59。鉴于I型干扰素应答在癌症治疗中的相关性,我们希望在我们的空间数据中评估其与M_2:CXCL 10和T细胞:Iit 1细胞状态共定位信号的相关性。因此,我们检查了细胞“簇内类型”的浓缩结果,并注意到大多数患者至少有一个簇(如pGC 4)同时富集了M_2:CXCL 10和T细胞:Iit 1(图1)。4B和补充数据9)。因此,我们的目标是对M和T细胞的联合存在在我们的集群中的分布做一个更定量的估计。为此,我们设计了一个基于细胞类型比例的联合评分,其中高值表示两种细胞类型的高比例值。将每个样本的斑点按聚类同一性分层,出现了几个具有联合得分升高信号的聚类,例如,pBc 3、pDc5、pEC 1和pGc 4(补充图)。19-补充数字20),与团簇型富集结果一致(图1)。4B和补充数据9)。此外,干扰素反应相关的途径在所有集群中都得到了丰富,并获得了较高的联合评分(补充数据)。4).

I型干扰素反应的空间富集

为了研究干扰素通路的表达情况,我们进行了空间富集分析。I型干扰素通路高度富集的区域与M_2:CXCL 10和T细胞的区域在空间上一致(图1)。4C-E和补充数字21)。值得注意的是,I型干扰素信号与细胞状态的联合存在之间的关系似乎是不对称的;M_2:CXCL 10和T-cell:Iit 1的存在与升高的干扰素信号重叠,但情况并不总是如此。这种不对称是预料中的,因为已知的其他细胞类型都是由干扰素信号通路来表现和刺激的。59。然而,我们的结果暗示,联合定位M_2:CXCL 10和T细胞:IFIT 1的子集经常发生在存在I型干扰素信号的情况下。我们在一个独立的her 2阳性空间基因表达数据集中证实了这些发现,该数据集是使用vi偏平台生成的(补充图)。22)。最后,我们在一组数据中展示了同一信号的存在,该数据集来自由两种不同平台ST2K和Vitom(辅助图)生成的一种截然不同的癌症形式(鳞状细胞癌,scc)。23和补充说明1)60。我们的结果表明,一种受空间限制的I型干扰素反应可能与M诱导的特定T细胞亚群的募集有关。进一步的研究将有助于确定这些相互作用是否与疾病的结果有关。

从细胞类型比例推断三级淋巴样结构

接下来,我们回到B-和T-细胞共定位的模式,更具体地说,这与TLS的关系。我们对TLSS的兴趣来源于它们在抗肿瘤免疫反应中的主要作用,以及与临床结果和治疗反应的关系。在癌症的背景下,TLS是向T细胞表达肿瘤抗原的场所之一,从而促进了一种更有针对性的抗肿瘤攻击。61.

由于TLS是由多种细胞类型的存在和相互作用来定义的,因此scRNA-seq技术是研究它们的次优方法,除非这些位点在解离前从剩余的组织中分离出来。因此,我们认为我们使用ST,即每个点代表一个由多个细胞组成的小邻里,作为scRNA-seq方法在研究这些结构时的补充。虽然TLS并不完全是B和T细胞所居住的,但它们的共同存在也会影响到它们的存在。62。在将每个点的细胞类型组成反转之后,我们能够识别出在B细胞和T细胞之间表现出高度共定位的斑点,因此我们有可能构成一个TLS-位点的一部分,我们称之为TL样结构。更明确地说,我们这样做的方式类似于M_2:CXCL 10和T-cell:IFit1子集的分数是如何计算的,从而产生了一个我们称为TLS评分(方法)的度量。一个阳性的TLS评分转化为B和T细胞都在一个地点富集,负值相反。从B和T细胞分布的重叠来看,患者G和H表现出较小的分隔区,TLS评分高(图一)。5A)这里被认为是类似TL的结构。

图5:三级淋巴样结构的推断和预测。
figure5

AB、T细胞比例估计及计算出的G、H患者TLS评分(三级淋巴结构)、附加说明的苏木精和伊红(HE)图像可供参考。B拟合模型的秩-图(系数值与秩),包含在TLS特征中的基因用红色表示;变焦(*)表示秩TLS-相关基因。CTLS信号显示富集的前15条路径,按调整后的顺序排列。p值(由g:分析器提供)。D预测10倍基因组的TLS评分TM使用对病人G和H.病理学家对可能的TLS-位点(RED)的注释进行训练的模型,将Vi偏乳腺癌数据集作为参考。标尺表示1000μm。

类TL结构的实验验证

为了验证我们对B和T细胞联合存在的估计是否适合作为Tl样结构的代理,我们使用了IHC。我们用标准细胞型标记CD 20(B细胞)和CD3(T细胞)对另外3例H患者进行染色,一次双染,两次染色(方法)。这些切片并不与ST段相邻,而是在技术上尽可能接近,以尽可能多地保存主要组织学区域。我们的结果显示了先前描述的未成熟TLSS的特征--T细胞包围的B细胞的分隔结构,但在TLS信号升高的区域缺乏明显的生发中心(补充图)。24) 61,63.

TL样结构基因表达谱的表征

接下来,我们要评估基因表达与TLS评分的关系。为此,我们用一个简单的线性模型来预测一个点的TLS评分,基于它的(规范化)基因表达,然后提取最大系数的基因,即对一个正分数的最高贡献,我们将这组基因称为TLS特征。签名成员数(171个基因,图1)。5B,补充数据5)由训练后的模型(方法)得出的阈值来确定。系数值最大的三个基因为:MS4A1(一种众所周知的B细胞相关基因,编码抗原CD 20),B2M(编码与MHC i相互作用和稳定的蛋白质),以及TRBC 2(编码T细胞受体的一个组成部分)。其他签名成员以前曾与TLSs相关联,例如C。XCL 13,CXCR 5,CCL 19,LTB,后两者表明除了B和T细胞外,还存在其他与TLS相关的细胞类型(如图所示)。5B)61。为了了解TLS的特征在哪些生物过程中得到了丰富,我们对其进行了功能富集分析(使用g:Profile,查询Go:BP)。这些过程都与细胞的活化、分化和免疫反应或调节有关(如图所示)。5C和补充数据12).

跨平台预测模型验证与生存结果预测

为了控制过度拟合,我们将该模型应用于(HER 2阳性)来自不同平台的乳腺癌数据(Vitom,从10倍基因组学下载)。TM网站,见数据可用性)。我们的病理学家发现,在VISM数据中观察到了强烈的集中信号,与被我们的病理学家认为可能是TLS-位点的区域重叠(图1)。5D)。作为一个额外的测试,我们将我们的模型应用于来自其他组织类型的ST数据:发育性心脏、类风湿关节炎和黑色素瘤。64,65,66。在前者没有发现类似TL的结构,而在后两个中发现了几个类似TL的结构,如预期的那样(补充图)。25和补充说明2).

虽然我们的病人没有临床数据,但我们推断,如果我们提出的模型能捕捉到与TLS相关的特征,那么它应该能够重现先前研究的结果。因此,我们将我们的模型应用于与Cabrita等人相同的数据集(tcga皮肤黑色素瘤(Skcm)散rna-seq)。67。用于显示TLS信号的强度如何与整体生存相关联。令人鼓舞的是,我们成功地复制了他们的结果,将预测较高的TLS评分的患者与总生存率联系起来,比低或中等分数的患者更好(补充数字)。26和补充说明3)。因此,我们的模型不仅可以推广到其他实验平台和外部数据,而且还可以复制大量rna-seq研究得出的与tls相关的患者结果。这些结果有力地支持了我们的模型识别类TL结构的能力。

讨论

我们利用ST技术研究了8例HER 2阳性肿瘤的空间基因表达谱。这项工作可分为两个主要部分。

首先,我们的研究遵循了类似于许多单细胞研究的大纲;我们对数据进行归一化和聚类,通过差异基因表达分析为每个聚类提取标记基因,对标记基因进行功能丰富分析,最后利用整个信息集对这些聚类进行注释。通过对聚类的联合分析,我们在数据集中得到了具有代表性的共有肿瘤和免疫群体的核心特征。基于表达的簇符合高级病理学家的注释,但也给出了更精细的组织划分和每个区域的分子剖面信息。它的价值是多方面的;手工注释是劳动密集型的,需要获得训练有素的病理学家,而且不像ST数据那样支持区域的分子特征分析(例如,路径富集)。

在本研究的第二部分,我们使用了一种综合的方法(立体镜)来对单细胞数据集中定义的单元类型/状态进行空间映射;这使得我们能够调查细胞类型的空间分布及其共定位模式。从共定位趋势来看,我们的结论是:上皮性癌在出现时倾向于占优势;B细胞似乎在空间上与血浆细胞分离;某些患者的某些T细胞与M状态之间存在I型干扰素相关的偶联,B和T细胞在几个病人中呈共定位。我们特别关注其中的两个相互作用,T细胞/莫氏亚群和B细胞/T细胞之间的相互作用。

之间的近端位置。CXCL 9/10-在几个样本中观察到M和T细胞状态,表明M_2:CXCL 10可能正在将表达T细胞的IFIT 1招募到特定的位置。我们在两个外部数据集(乳腺癌(HER 2-阳性)组织切片和来自不同癌症类型(SCC)的较大数据集)中复制了我们的发现--M和T细胞亚群在存在I型干扰素应答时的相互作用--这两个数据集都有不同的实验平台。M细胞和T细胞之间的共定位已经通过基于抗体的方法和受体cxcr 3及其配体cxcl 9/10/11的表达在scc数据集中得到了显示;作者还报告了数据中存在的Ⅰ型干扰素应答,但没有明确地将这两个信号连接在一起。60。尽管其他出版物已经记录了相关的发现,但还需要更广泛的努力来了解三重相互作用的机制及其在肿瘤生态系统中的作用。13,14.

B和T细胞之间的另一个共定位信号被用作类似TLSS的位点(这里是TL样结构)的代理,IHC染色证实了这一方法。染色显示预期的B细胞和T细胞分裂,但不能证实成熟生发中心的存在,暗示不成熟的TLS或变化的组织质量。我们使用线性回归模型来识别基于基因表达的TL样结构,并从模型的参数中提取一个基因特征。一些标记基因在TLS的形成或功能中被认为是重要的,而不是特异性的B和T细胞,作为该方法合法性的进一步证据。尽管其简单性,该模型推广到技术和组织,它也复制了以前的结果,将TLS患病率与临床结果联系起来。虽然需要进一步的研究来证实我们的发现,但以这种方式对TL样结构进行转录谱分析可能会揭示旨在促进抗癌免疫反应的药物的治疗靶点。

我们选择立体显微镜方法来映射单细胞数据,因为它不依赖于标记基因,而是与表达谱一起工作,当试图解决由少数而不是相互排斥的标记基因定义的细胞状态时,这是有益的。映射的单细胞数据被认为是我们组织的代表,但也有一些缺点。重要的是,中性粒细胞、肥大细胞和脂肪细胞等细胞类型在单细胞数据中不存在。其他细胞类型(例如,某些树突状细胞亚群)数量太少,无法进行稳健的映射,因此在映射中被忽略。然而,我们的ST数据和先前的研究表明,这些细胞类型已经被证明在肿瘤组织中具有重要的肿瘤相关功能。2,68。没有单元格类型也可能导致对单元类型分布的轻微错误表示。此外,转录占优势的细胞类型有掩盖较少数量的细胞类型的风险,因为大多数捕获的转录本来自前者。最后,我们认为,由增殖状态定义的细胞亚群可能被错误地映射到同一区域--即呈现假共定位信号--如果增殖过程强烈地支配这些细胞的表达轮廓,类似于以前的研究所观察到的那样。69。然而,这些关切涉及依赖参考数据集的所有方法,而不是立体镜独有的。综合起来,我们把基于表达的综合聚类策略看作是一种互补的方法,共同建立我们的数据的整体形象。

我们的研究显示了如何使用ST数据来绘制疾病背景下组织样本的分子图谱。这也暗示了未来类似研究如果结合临床数据可能产生的潜在影响。例如,细胞共定位模式可以与病人的结果联系起来,用于评估肿瘤内药物反应的空间限制,并用于研究功能间的相互作用。此外,能够评估多个细胞类型之间复杂、非线性和分层相互作用的计算方法的发展将有益于任何前瞻性研究。

最后,我们展示了一个可转换的工作流程,用于全面分析应用于HER 2阳性乳腺癌肿瘤的ST数据。我们的分析中出现了一些发现,如果进一步探索,可能有助于更好地理解潜在的疾病机制,并为治疗开辟新的有利条件。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297