介绍

多细胞生物中的细胞通过与其他细胞类型的相互作用来适应它们的表型和功能。短程和长程细胞间信号是机体稳态的组成部分,当改变时,驱动各种疾病的发病机理。例如,在癌症中,转化细胞和非转化基质细胞之间生动的相互作用促进或抑制肿瘤的发展、转移和药物的功效。

不断上升的发病率和高致死率使胰腺导管腺癌(PDAC)成为癌症相关死亡的主要原因之一1。由于PDAC通常在晚期被发现,并且对大多数治疗方式都是难治的,因此迫切需要更有效的治疗和允许早期检测的生物标志物。然而,PDAC的标志性特征,如致密和纤维化的间质、免疫抑制肿瘤微环境(TME)和通常的低肿瘤细胞性,加剧了其分子特征和治疗发展2,3。基于转录谱和病理特征,PDAC分为两个主要的分子亚型4。经典PDAC的特征在于分化良好的组织病理学和上皮基因表达特征。相比之下,间质性(基底样)PDAC显示出未分化的非腺组织学,间质性基因表达谱,与经典亚型相比,与不良预后和对标准护理化疗的高耐药性相关5,6,7,8,9。尽管这两种PDAC亚型之间存在实质性的临床病理学差异,但迄今为止还没有系统地研究癌细胞与其TME之间细胞间信号传导的潜在差异。

对肿瘤细胞组成和表型的重要认识已经通过全系统转录方法获得。然而,mRNA和蛋白质拷贝数之间的相关性变化很大10,11,特别是对于在细胞间串扰中起作用的蛋白质12,13。因此,用于全面定量蛋白质分析的系统范围的和无偏见的工具可以提供关于癌细胞与其微环境的上下文依赖的串扰的独特视角14。基于质谱(MS)的蛋白质组学是当今高通量蛋白质分析的黄金标准,并大大提高了我们对癌症发病机理的理解15,16,17,18。蛋白质组学与细胞选择性代谢蛋白标记策略的结合有望解决复杂的异细胞系统(如肿瘤)中依赖于环境的细胞行为和相互作用。新兴的方法之一是使用特别设计的甲硫氨酰tRNA合成酶L274G(MetRS*),它能够在时间控制下和细胞特异性地将非典型氨基酸叠氮亮氨酸(Anl)引入蛋白质组19,20,21。叠氮炔点击化学允许随后从细胞混合物中提取表达MetRS*的细胞衍生蛋白质。在活体动物中的成功应用为广泛的组织相容性提供了证据22并且揭示了,例如,暴露于丰富环境的小鼠的海马兴奋性神经元中200种蛋白质的差异表达23。与基于细胞分选的策略(如FACS或MACS)相比,完整的组织在收获后直接速冻,随后在没有细胞解离的情况下裂解。这有效地避免了细胞损伤相关的损失、对更健壮的细胞群体的选择偏差、以及在从组织中提取细胞所必需的酶和机械处理期间由压力和环境变化引起的潜在蛋白质表达或修饰状态假象24,25,26,27。然而,已实现的蛋白质组覆盖范围通常较低,即使是最深入的研究也仍然低于4000种特定富集的蛋白质23,28,为全面的基于Anl富集的蛋白质组学分析提供了可能性。

在这里,我们开发了一种改进的工作流程,使细胞类型特异性细胞蛋白质组和分泌组的体外和体内分析达到前所未有的蛋白质组学深度。这极大地提高了通常丰度较低的细胞间信号蛋白(如分泌型细胞因子或受体)的检测能力,因此提高了基于MetRS*/ Anl的细胞通讯分析的潜力。我们将我们的方法应用于原代PDAC共培养和原位移植模型,并证明了与传统的基于细胞分选的蛋白质组学相比,在捕获细胞外蛋白方面的独特优势。我们利用我们全面的细胞类型特异性蛋白质组学工作流程的优势,揭示了肿瘤和循环中经典和间充质PDAC亚型之间的功能差异,例如癌细胞衍生的EMT促进分子和免疫调节剂的上下文特异性分泌,与体内不同的免疫细胞募集相关,以及癌细胞衍生的蛋白质对肿瘤细胞外基质(ECM)的不同定性和定量贡献。

结果

改进的工作流程能够高效、特异地进行蛋白质细胞选择性富集

概念上,甲硫氨酰-tRNA合成酶L274G基于(MetRS*)的叠氮蒽(Anl)标记为分析复杂异细胞系统中的细胞间相互作用提供了独特的可能性。然而,在我们最初的实验和之前发表的基于MetRS*的研究中,所达到的蛋白质组深度不超过4000个蛋白质23,28因此显著低于现代质谱仪和软件的最新水平29,限制了发现潜力。因此,我们着手确定并克服技术瓶颈。

我们首先在体外通过常规的基于MS的鸟枪法蛋白质组学评估了MetRS*表达细胞的Anl-掺入率,没有特定的富集。对含有Anl的肽与其未修饰的对应物进行定量分析表明,Anl的掺入确实对MetRS*表达细胞具有高度特异性,但比甲硫氨酸的掺入慢得多(L甲硫氨酸甲基13丙,丁3)或MetRS*非依赖性Met取代的叠氮基高丙氨酸(Aha)(补充图。1a、b).此外,如先前的研究所示,Anl标记具有强烈的剂量依赖性,并随着甲硫氨酸的竞争而减少19,30,31。考虑到组织中细胞类型的异质性和有限的Anl生物利用度,我们推断Anl蛋白丰度在大多数应用中非常低,特别是在体内。因此,当以深度蛋白质组学分析为目标时,对富集工作流程的回收率和特异性的要求非常高。我们选择了一种简单的铜(I)催化的叠氮炔环加成(CuAAC)和基于炔琼脂糖的策略,以实现可扩展性和高反应速率32作为协议优化的基础。我们分别评估了关键的实验步骤,通过系统地实施以前的发现来提高从组织中提取蛋白质和点击化学的效率33,34以及反应物比例、缓冲成分和新试剂(包括下一代Cu(I)稳定剂)的经验测试35.

我们改进的炔烃-琼脂糖CuAAC方案与常用的基于二苯并环辛烯(DBCO)树脂和可裂解二硫键生物素炔烃标签(DST)的程序的直接比较(图。1a)证明了实质性的优势:使用表达MetRS*和阴性对照野生型原代PDAC细胞,两者都在含有Anl的培养基中孵育,我们的方案显示了最小的非特异性背景和显著增加的特异性富集肽的产量(图。1b).这一优势在MS分析中得到了很好的体现:虽然基于DST的富集提供了良好的特异性,但降低了总体覆盖范围,而基于DBCO的富集在MetRS*和阴性对照样品中都导致了许多鉴定,这与应变炔烃的较高副反应一致32,36。相比之下,我们的方案产生了深度蛋白质组覆盖,但在阴性对照中鉴定最少(图。1c).技术重现性等于或优于替代方案,84%的所有MetRS*样品鉴定在所有三次重复中定量,前体变异系数(CV)中值为11.5%(补充图。2a,b).重要的是,在MetRS*样品和对照中鉴定的蛋白质的低重叠和高强度差异证明了我们工作流程中非特异性富集的背景干扰非常低(图。1d).如Alvarez-Castelao等人所述,我们将蛋白质定义为特异性富集,如果它们在MetRS*样品中被专门鉴定或以比阴性对照中至少高三倍的强度被定量,并且从进一步分析中排除所有其他蛋白质。23,37。因此,我们的工作流程总共鉴定了6576个特异性富集的蛋白质组(相比之下,基于DST或DBCO的富集分别为4416个和4736个),包括其他两种方法涵盖的几乎所有蛋白质,加上1039个排他性鉴定(补充图)。3).

图1:全面的细胞类型选择性蛋白质组学和分泌组学的灵敏工作流程。
figure 1

a细胞选择性蛋白质组学工作流程图:甲硫氨酰-tRNA合成酶L274G(MetRS*)通过将其加载到甲硫氨酰-tRNAs上来激活叠氮吗啉(Anl)。表达MetRS*的细胞将Anl作为甲硫氨酸替代物掺入新合成的蛋白质中。从条件性胰腺表达Kras的小鼠肿瘤中分离的慢病毒转导的表达MetRS*的原代或野生型(Ctrl) PDAC细胞G12D在补充有4 mM Anl的无Met培养基中生长8小时。1 × 107MetRS*和Ctrl细胞通过DST富集、DBCO富集和我们改进的炔烃-琼脂糖CuAAC富集方案(n= 3,工作流复制)。b富集、消化和固相肽提取后,通过280 nm处的吸光度确定肽产量(平均值±SD)。c使用2 h色谱梯度长度和数据依赖采集(DDA)进行基于质谱的分析后鉴定的蛋白质组(平均值±SD)。dMetRS*和对照样品中鉴定的蛋白质的强度比。显示具有比率的重叠标识的计数。e在炔烃琼脂糖富集和单次运行DDA、通过离线高pH反相色谱分离的16个级分的DDA分析或单次运行数据独立采集(DIA )(平均SD,分级)后鉴定的特异性富集的蛋白质组(与对照样品相比,排除或> 3倍高强度)n= 1,单次拍摄n= 3,工作流复制)。后者用于所有进一步的实验。f细胞选择性分泌组方案工作流程:将MetRS*和Ctrl 8661 PDAC细胞在含有5% FBS的Met-贫化培养基中培养8小时,所述培养基含有4 mM Anl(n= 3,工作流复制)。缓冲液交换和浓缩后,从细胞上清液中富集表达MetRS*的细胞衍生Anl蛋白。g通过无标记定量(LFQ)强度对特异性富集的PDAC细胞释放蛋白进行排序。指出了具有细胞因子功能的蛋白质。源数据作为源数据文件提供。

为了优化深入的蛋白质组学研究,我们将我们的工作流程与富集和消化后的肽段离线高pH反相分离相结合,鉴定了10,146个特定富集的蛋白质组,展示了出色的蛋白质组覆盖率(图。1e).此外,使用数据独立采集(DIA)方法,我们在2小时运行中实现了每个样品平均8770个特异性富集的蛋白质组,而没有分级分离。与数据依赖采集(DDA)相比,DIA的使用还提高了重复之间的数据完整性,并减少了前体cv(补充图)。2c,d).

为了进一步评估我们富集的技术可重复性,我们用10个阴性对照重复进行了实验,证实了之前观察到的特异性富集蛋白和非特异性背景之间的高信噪比(补充图。4a、c).而阴性对照中非常低的信号强度导致比MetRS*样品中更随机的鉴定(补充图。4b),当对照样品被分成三组并分别用于评估MetRS*样品中的背景干扰时,结果保持非常一致(补充图。4c).对照中绝大多数具有稀疏标识的蛋白质具有远高于我们选择的特异性临界值的高比率(补充图。4d).相反,大多数MetRS*/Ctrl比值较低的蛋白质具有非常高的数据完整性。因此,不仅整体上背景干扰较高的蛋白质数量非常有限,而且对照也能有效地持续捕获大多数蛋白质。

在本研究中,我们将所述的过滤策略应用于所有后续MetRS*实验,使用至少三个野生型细胞实验作为相应MetRS*样品组的阴性对照,以确定特异性富集的蛋白质,并确保细胞选择性的高置信度。为了在更大规模的实验中实现高通量的深度和MS省时分析,我们将我们的富集工作流程与DIA单次分析结合使用。

含血清培养基中全面的细胞选择性分泌组学分析

受到特异性肽回收率显著增加的鼓舞,我们下一步的目标是调整我们的方法用于细胞间信号传导的研究,特别是用于分泌蛋白的综合分析。以前,叠氮氨基酸的非细胞选择性掺入已经改善了在含有血清的条件培养基中存在高度丰富的血清蛋白的情况下对相对低丰富的分泌细胞蛋白的检测38。基于MetRS*的Anl标记可以扩展这一概念,用于异细胞系统中的细胞选择性分析,如共培养实验。为了用我们的富集方案建立深入分泌组学的概念证明,我们分析了存在5%血清的原代PDAC细胞的上清液(图。1f).这产生了PDAC细胞释放蛋白的深度覆盖,总共有2229个特异性富集的蛋白质组和788个用UniProtKB关键字“分泌的”和/或“信号”注释的蛋白质组根据CellPhoneDB,其中103个蛋白质组是细胞间通讯的已知配体39,包括具有所述细胞因子功能的46个(图。第一代).尽管它们通常体积小、丰度低,但在检测到的细胞间信号蛋白和细胞因子中,有83种(81%)和41种(89%)被鉴定为至少含有两种肽。

与体内FACS相比,基于MetRS*的细胞选择性蛋白质组学的产量和细胞外蛋白覆盖率增加

基于MetRS*的Anl标记的一个关键特征是其在活体动物中的适用性。如Falcomatà和rthel等人先前所述。40,我们通过在完全免疫活性的同系小鼠的胰腺中原位移植原代低传代癌细胞,在体内模拟了分子PDAC亚型。我们通过直接比较基于Anl的富集与来自MetRS*和eGFP共表达细胞的常规荧光激活细胞分选(FACS ),评估了来自该模型的组织样本的富集工作流程。在细胞注射和最初的肿瘤生长期后,我们通过腹膜内注射补充Anl,然后使用每个肿瘤的一半进行Anl富集或FACS(图。2a).总的来说,13-17%的解离细胞是癌细胞,如eGFP荧光所示(补充图。5).

图2:体内基于MetRS*和FACS的癌细胞选择性蛋白质组学。
figure 2

a用于细胞选择性蛋白质组学的PDAC移植方案:MetRS*-eGFP表达8661 PDAC(移植前> 90% eGFP阳性细胞,见补充图。5a)和野生型(Ctrl)细胞原位移植到完全免疫活性的同系小鼠(n= 3,生物复制)。在16天的肿瘤生长期后,小鼠腹腔注射Anl,每天两次,共5天。之后,收集肿瘤并切成两半。一半快速冷冻用于随后的点击化学富集,另一半新鲜用于细胞解离和eGFP-FACS。b通过280 nm处的吸光度确定肽产量(平均值±SD)。c用任一方法专门鉴定和重叠(特定富集的)癌细胞衍生的蛋白质组。d生物重复之间前体变异系数的分布。e与所有其他已鉴定的蛋白质(补充数据中的完整列表)相比,使用任一种方法对专门鉴定的蛋白质中的富集GO注释(Fisher精确检验)进行分析4).源数据作为源数据文件提供。

与FACS相比,通过点击化学富集,肽产量显示出惊人的差异,癌细胞衍生的蛋白质的平均回收率高50倍以上,表明在解离和分选过程中显著的细胞损失(图。2b).然而,这两种方法都产生了足够的肽量,可用于使用现代MS仪器进行单次蛋白质组学分析。这两种方法都产生了超过8100个蛋白质组,对于富含蛋白质的样品,重复之间的变异系数中值较低,表明定量精度较高(图。2c,d).而在FACS和基于Anl富集的分析中,约70%的已鉴定蛋白质组重叠(图。2c),每种方法的独特鉴定显示了不同的优势。例如,流式细胞仪分选的样品显示了跨膜蛋白的富集,这可能是由基于强离子去污剂的裂解促进的,这增强了跨膜蛋白的提取和消化41,42但是会干扰CuAAC反应34。相反,细胞选择性标记可以很好地捕获细胞释放的蛋白质,如ECM成分和细胞因子(图。2e).我们主要将此归因于肿瘤间质中蛋白质的富集,这些蛋白质可用于基于MetRS*的细胞选择性蛋白质组学,但在基于组织解离和分选的方案中丢失。