您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2020
本企业通过iso9001质量体系认证

糖肽组学特征在高级别浆液性卵巢癌肿瘤亚型及临床预后预测中的应用

 二维码
发表时间:2020-12-04 11:12作者:武汉新启迪Xinqidibio

摘要

肿瘤间异质性是基因组、转录、翻译和翻译后分子特征的结果.为了探讨蛋白糖基化在高级别浆液性卵巢癌(HGSC)异质性中的作用,我们对119例TCGA HGSC组织进行了质谱分析。对完整的糖原蛋白质组谱进行聚类分析,勾画出3个主要的肿瘤簇和5组完整的糖肽。N-糖聚糖结构与肿瘤分子亚型有密切的关系,其中岩藻糖基化与间充质亚型的关系就是其中之一。进一步的生存分析显示,间充质亚型完整的糖肽特征与HGSC的临床结果有关。此外,我们还研究了mRNAs、蛋白质、糖原和完整的糖肽的表达,以及参与糖蛋白生物合成途径的糖基化酶的表达水平。结果表明,糖蛋白水平主要受其各自蛋白的表达控制,而糖蛋白修饰糖基聚糖则与糖基化酶的蛋白水平相对应。糖基聚糖类型的变化进一步显示出与肿瘤异质性的协同作用。深入了解HGSC不同亚型的糖基化过程和糖基化产物可能为精确药物治疗和肿瘤靶向治疗提供重要线索。

导言

高级别浆液性卵巢癌(Hgsc)作为卵巢癌最常见、最具侵袭性的类型,仍然是卵巢癌相关死亡的主要原因。1,2。晚期hgsc占卵巢癌总数的50%以上,预后差:5年生存率32.1%,10年生存率15%。3。肿瘤异质性增加了HGSC的复杂性,肿瘤异质性可分为肿瘤间异质性和肿瘤内异质性。肿瘤内异质性在转移、治疗、复发和治疗耐药中起着至关重要的作用,而肿瘤间异质性、手术方式和基因组不稳定性可能导致hgsc内生存率的变化。4,5,6,7,8,9。几项大规模的研究提供了整合hgsc异常和广泛的肿瘤间异质性的观点,并有证据表明hgscs呈现出不同的分子图谱,包括基因组、转录、蛋白质组学和磷蛋白组学特征。10,11.

不同蛋白质修饰的蛋白质形式给细胞蛋白质组增加了巨大的复杂性。12。糖基化是最常见的蛋白质修饰类型之一。13。蛋白糖基化是由糖基化生物合成过程中的糖基转移酶和糖苷酶的表达和活性水平控制的,与dna模板和mrna翻译控制的基因表达和蛋白质序列分析不同。14。糖结合聚糖的结构反映了受到严格调控的酶生物合成反应,并产生了不同的糖聚糖分布。15。糖结合介导了细胞表面的特性,为基因编码蛋白基因产物的功能增加了一定程度的可塑性。近年来,糖基化已成为癌症的一个新的特征。16,17。它在肿瘤的发生发展中起着重要的作用,包括细胞基质相互作用、细胞信号传导、肿瘤血管生成、免疫调节和肿瘤转移等。18,19。靶向糖基化已成为一种潜在的治疗方法。20。在低水平抑制ERα-葡萄糖苷酶可能会破坏这些蛋白质的折叠,并且在治疗病毒感染方面有潜在的治疗作用,而不会影响宿主细胞的生存能力。21。此外,糖基化增加了肿瘤的异质性,因为异常的糖聚糖修饰是细胞特异性的、蛋白质特异性的和位点特异性的。19.

虽然在了解肿瘤基因组、蛋白质组和磷蛋白组方面已经取得了很大的进展,但对于卵巢癌中较大的糖蛋白组的研究还相对缺乏。以前的研究已经检查了卵巢肿瘤或卵巢癌患者血清中的糖基化异常。22,23,24。需要进一步研究糖基转移酶和糖苷酶在糖基化结构中的作用,糖基结构变化程度与肿瘤间异质性的关系,以及糖基化特征的临床意义。集成多组学数据集的系统生物学方法是解决这些问题的有用方法。11,24,25,26,27,在将基因组改变与糖表型联系起来方面具有很大的潜力。

在本研究中,我们对119例HGSCs进行了基于质谱(MS)的糖蛋白组学分析.这些HGSC肿瘤组织以前通过肿瘤基因组图谱(TCGA)和临床蛋白质组分析联合会(CPTAC)在基因组和转录水平以及蛋白质组和磷蛋白组水平上进行了表征。10,11分别。采用两种糖蛋白组学策略,固相萃取含糖体多肽(Speg)进行糖原分析。28和完整的糖肽,用于研究糖基特异性聚糖(Igps)。29,30我们分析了HGSCs中的N-连接糖蛋白组,鉴定和定量了糖基及其连接的糖基结构。通过整合基因组学、转录组学、蛋白质组学和糖蛋白组学,我们确定了与不同HGSC亚型相关的糖基化变化,并进一步研究了底物蛋白和糖基化酶在糖蛋白生物合成中的作用。此外,整合临床信息有助于识别与患者生存相关的糖蛋白组学特征.总之,这项研究揭示了糖基化在卵巢癌异质性中的潜在作用,并为基于糖蛋白表达模式的患者分层提供了理论依据。

结果

糖肽的鉴定与定量

应用JHU和PNNL对来自HGSC的169例TCGA卵巢肿瘤进行分析。11。JHU研究小组分析了119个可用的卵巢肿瘤,并在本研究中进一步利用糖蛋白组学进行了分析(补充数据)。1)。对肿瘤组织进行裂解,提取蛋白质,然后进行蛋白质水解,用等压标签标记肽,进行相对定量和绝对定量(ITRAQ)。独立地,一个质量控制(QC)样本被包括在多重重复分析中,用于对样品处理和数据采集管道的重复性进行纵向评估。将iTRAQ标记的多肽分解为三个脂肪族化合物进行全球蛋白质组学分析,并对SPEGS和完整糖肽(IGPs)中含糖石肽的糖肽进行平行富集。28,30。用LC-MS/MS和随后的数据分析方法(见“方法”一节,附图)分析了富含糖石的多肽和IGPs。1)。如附图所述。1A,cptac全球蛋白质组分析中的iTRAq标记肽丰富了SPEGS和IGPs。11。这允许直接比较SpeG,IGP和全局蛋白质(见“方法”部分,补充图。1B).

在SpeG和IGP实验中,分别发现了5115个N链SPEGS和15512个N链IGPs(补充数据)。2),用455个SPEG和351个IGPs对所有肿瘤样本进行量化。在这些肽中,在5115个SpeG糖肽中,4957个(96.9%)和15513个完整的糖肽中有14264个(92.0%)含有糖基NxS/T基序。在随后的数据分析之前,SpeG和IGP的丰度根据每个样本的全球糖蛋白中值进行归一化。此外,我们利用我们的QC渠道来评估整体数据质量,并利用单个肽变异系数(CV)来确定糖蛋白质组学分析的重现性(补充图)。2)。据报道,SPEGS和IGPs的平均CVs(四分位数范围)分别为7.0%(4.0%)和14.0%(8.0%)。值被发现远低于那些在不同的肿瘤样本(补充图)。2AB)。这些都表明了糖肽富集和后续数据采集的高重复性,以及我们的数据集的高整体质量。

基于糖苷组学的HGSC聚类

为了研究肿瘤异质性,我们利用SPEGS和IGPs的表达数据对119个HGSC样本进行了聚类分析。一致聚类结果表明,根据IGPs中的糖肽组学数据,可以识别出3个肿瘤簇和5个糖肽组群(图1)。1,补充数据3)。此外,利用SPEGS的表达模式进行聚类分析时,我们观察到了高度的一致性。然后,我们整合了先前由TCGA和CPTAC分别描述的基于转录和蛋白质组的HGSC亚型(如图所示)。1)。接下来,我们评估了不同组学数据类型之间的富集分数,以描述hgsc基于蛋白质和糖基亚型之间的关系,并选择了一个超几何测试。p0.01作为不同组学亚型重叠的阈值。如图所示。2AIGP 1簇主要与“Stroma”蛋白亚型重叠(富集评分=2.94),其次是“分化”蛋白亚型(富集评分=2.03),IGP 2簇与“免疫反应性”(富集评分=2.05)和“增生性”蛋白亚型(富集评分=1.75)重叠。IGP 3特有的是与“间充质”蛋白亚型高度重叠(富集评分=2.77)。12A)。在119例HGSCs中,鉴定出67个同源重组缺陷(HRD)样本,并在图中作了注释。1A。有趣的是,我们发现IGP 1的HRD样本频率较高(67%),而IGP 2和3的HRD样本频率较低(~53%)。t测试,p=0.07)。

图1:基于糖蛋白组学数据的高级别浆液性卵巢癌的聚类分析。

119个肿瘤组织中完整糖肽表达的双聚类。肿瘤呈列状,按不同颜色所示的完整糖肽簇分组。完整的糖肽用于肿瘤分类显示为行与糖聚糖显示在右侧的热图。每个单元格的颜色表示Z该样本中完整糖肽的得分(log 2,用完整的糖肽标准差标出的相对丰度)。转录组、基于蛋白质组的亚型、HRD注释和提议的SpeG、IGP簇在热图上方以颜色表示。

图2:完整糖肽和糖聚糖在肿瘤簇中的特异性。
figure2

a完整的糖肽和蛋白质组簇的对应关系。值对应于属于相应IGP簇的每个蛋白质组亚型的被试数量的平方,除以IGP组的样本数和IGP簇的样本数。*表示p基于超几何检验的数值<0.01。b平均Z各组完整糖肽评分。对于IGP群组1中的每一组,n=27个样本;对于IGP第2组中的每一组,n=49个样本;对于IGP第3组中的每一组,n=43个样本。方框轮廓表示IQR,方框中的实线表示中值“平均”。Z得分“,盒外的胡须延伸到最小和最大”平均“。Z得分“。c各IGP组的糖聚糖。d三个例子显示了不同肿瘤簇中的不同表达。在IGP群组1中,n=27个样本;在IGP第2组中,n=49个样本;在IGP第3组中,n=43个样本。方框轮廓表示IQR,盒子中的实线表示中等强度,盒外的晶须延伸到最小和最大强度。源数据作为源数据文件提供。

接下来,为了识别每个肿瘤IGP簇的定义IGP特征,我们平均Z-五个IGP组中的每个IGP的得分值(图)。2B)。IGPS在第3、4、1组分别在肿瘤簇1、2和3中高表达(图3)。2B)。为了进一步研究这三种IGP团簇的糖基组成,计算了IGPs携带的三种糖链类型(即高甘露糖、岩藻糖和唾液酸)在各组中所占的百分比(图)。2C)。第1组的iGPS主要由含有岩藻糖的糖聚糖组成,而第3组的IGPs含有含有岩藻糖和唾液酸残基的糖聚糖。第4组iGPS与第1组和第3组不同,主要由高甘露糖组成。在下游分析中,我们重点研究了这三个完整的糖肽组,即第1组、第3组和第4组。2B和C)。图中为每个IGP提供了特异性完整的糖肽。二维空间。EVNDTLLVNELK-携带岩藻糖POSTN含岩藻糖和唾液酸的蛋白质SERPINA 1蛋白质和NATLAEQAK-携带高的甘露糖HYOU 1蛋白在完整亚型3、1和2中表达上调。为了深入了解这些完整的糖肽图谱的功能相关性,我们进行了字符串蛋白-蛋白质相互作用网络分析(补充图)。3)31。我们发现,第1组、第3组和第4组的IGPs分别被定位到与细胞外基质、补体和凝血级联以及溶酶体相关的蛋白质(经调整)。p < 0.05).

完整糖肽信号的生存分析

为了研究糖类蛋白簇是否与临床预后有关,我们首先对IGPs差异表达所定义的三个簇进行生存分析(图1)。3A)。Kaplan-Meier图显示,第3组的5年生存率最差,第2组的预后最好.为了进一步研究完整的基于糖肽的签名是否有助于生存预测,我们根据平均数据计算了每个样本的值。Z-3个完整的糖肽组(第1、3和4组)的评分。然后,我们从每个IGP组中选出50个较高评分样本和50个较低评分样本。结果表明,与其他两组相比,第1组有较好的预测价值(图1)。3乙-d),被归类为具有较高的组1评分的肿瘤有一个更差的生存预后(图一)。3B, p < 0.05). Taken together, these results indicated that the glycoproteins carrying non-sialylated fucosylated glycans were associated with HGSC tumors with worse survival outcomes. The tumor cluster with elevated levels of non-sialylated fucosylated glycans mainly contained the messenchymal HGSC subtypes from the proteomic and transcriptomic subtypes (Fig. 1A)。此外,我们还使用Cox比例风险回归模型对年龄和IGP聚类进行了多变量分析。年龄与生存密切相关(p < 0.005), while IGP clusters have no significant association with it (p=0.33)。即使对这两个因素进行调整,IGP第1组的得分仍与生存有很强的相关性(p=0.03)(附图。4A)。我们还研究了与IGP第1组基因相对应的蛋白质和mRNAs与存活的关系,结果表明:蛋白质(补充图)。4B)和mRNAs(补充图)。4C糖原蛋白组水平分析显示IGP组1与生存无明显关联(图1)。3B)。对IGP第3组和第4组进行了类似的分析(补充图)。4DI).

图3:总体生存的Kaplan-Meier图,由IGP群或IGP群签名构成。

a三组。在IGP群组1中,n=27个样本;在IGP第2组中,n=49个样本;在IGP第3组中,n=43个样本。b第一组签名。c第三组签名。d第4组签名。在……里面bd对于得分最高和分数最低的两组,n=50个样本。中使用无调整的LOGRAK测试bd.

HGSCs糖基化畸变分析

由于糖基化异常与肿瘤发生有关,且与DNA/mRNA基因表达谱无关,我们通过对糖基化异常和总糖蛋白表达模式的评估,研究了HGSC中糖基化异常的程度。假设在样品中,如果SpeG-全局具有较高的相关性,即低扰动,则糖基化过程主要受底物控制;如果不相关,糖基化可能受糖基化酶等其他因素的调控。利用413个含糖原肽的SpeG数据和120个糖蛋白的全球数据,计算了样品间的Spearman相关关系。有趣的是,我们观察到含糖石肽的IGP簇1与SPEG有很高的相关性,而IGP第3簇的相关性较低(图1)。4A,b),表明IGP第3簇存在较高程度的糖基化紊乱。为了确定糖基相关基因是否影响了观察到的糖基化紊乱,我们利用生物信息资源cBioPortal(Http://cbioportal.org)为了研究这些基因的突变频率32(无花果)4C)。我们发现,糖相关基因的突变非常罕见,可能是通过与这些基因潜在功能丧失相关的细胞致死性或其他基因组保真度机制来反映的。拷贝数放大,mRNA上调,蛋白质上调也被标注在图中的每一个样本。4C。糖基相关基因的拷贝数扩增和mRNA表达上调在样品中分布均匀。相反,我们观察到,在前50名相关性较高的样本和50名相关性较低的样本中,平均在蛋白质水平上上调了4.7和3.5个糖相关基因。t试验p分别为0.03(图1)。4C)。这些结果表明,与基因组和转录事件相比,糖基化相关基因的蛋白水平表达对糖基化紊乱的影响更大。

图4:糖和蛋白质之间的样本相关性分析。

a119例HGSCs含糖肽与全局蛋白的样本相关性研究。IGP团簇显示在底部面板中。b3个IGP簇样本间相关性的盒形图。在IGP群组1中,n=27个样本;在IGP第2组中,n=49个样本;在IGP第3组中,n=43个样本。p=0.272(IGP组1对IGP组2),p=8.73e−3(IGP集群1与IGP集群3),以及p=2.65e−5(IGP组2对IGP组3)t-测试。方框轮廓表示IQR,方框中的实线表示中位相关值,盒外的晶须延伸到最小和最大相关值。c糖相关基因变异在突变,拷贝数放大,mRNA和蛋白质水平。用双尾非配对法比较了50例高相关组和50例低相关组的糖基相关基因表达量。t-试验不作调整。NS表示非显着性,*表示显着性。只有蛋白质水平有显着性差异(p=0.03)。源数据作为源数据文件提供。

糖肽与mRNA、蛋白质和糖类的相关性

为了进一步扩展多组学之间表达相关性模式的评估,我们对mRNA、蛋白质和IGP水平进行了基因相关性分析(见图)。5)。我们发现,成对mrna转录本与已鉴定糖蛋白的蛋白质丰度之间的中位相关值为0.428,这与先前在hgscs中从mrna和总蛋白水平上报道的结果相似。11。然后,我们评估了含糖基肽的SPEG与相应糖蛋白的蛋白质之间的相关性,观察到中位相关值为0.824(如图所示)。5A)。有趣的是,当我们研究不同类型的IGPs与全球糖蛋白的相关性时,我们发现IGPs有一个更多变化的表达模式。相对于高甘露糖IGPs(Spearman相关系数=0.572),复杂型含糖糖脂(包括唾液酸和岩藻糖糖结构)具有较高的相关性(图一)。5A)。这一趋势在五个IGP组中观察到,特别是在第4组和第5组中,中位相关性较低(图5)。5B),后者为高甘露糖结构富集。这些结果表明,相对于更复杂的甘露聚糖,具有异常或差异调节高甘露糖结构的细胞机制。

图5:mRNA、蛋白质与完整糖肽的相关分析。
figure5

a相关分析遵循中心教条。b含不同聚糖的完整糖肽五亚组蛋白质与完整糖肽的相关性分析。在第一组,n=26个糖肽;在第2组中,n=79种糖肽;在第3组中,n=85个糖肽;第4组,n=43个糖肽;第5组,n=95种糖肽。为b方框轮廓表示IQR,方框中的实线表示中位相关值,盒外晶须延伸到最小和最大相关值。源数据作为源数据文件提供。

糖基化酶与完整糖肽的相关性

共轭与生物合成N-连接到新生肽链上的糖链不仅涉及糖蛋白底物,还涉及无数糖基化酶(例如,糖转移酶和糖苷酶),通过一系列协调一致的步骤,建立或修饰连接的糖聚糖结构(补充图)。5)。为了将糖苷转移酶和糖苷酶的总蛋白表达与IGPs的表达谱联系起来,我们进行了成对相关分析。6A)。我们观察到两组酶与携带高甘露糖聚糖的IGPs高度相关。一组包括三种葡萄糖苷酶-GANAB、MOGS和PRKCSH,它们与高含甘露糖的IGPs高度相关,但与更复杂类型的糖聚糖呈负相关(见图)。6A)。第二组包括OST复合物的三个亚基(DDOST、RPN 1和RPN 2),这些亚基与膜锚定的Dol-P-低聚糖结合,并将甘氨酸转运到新生蛋白上。有趣的是,后一组在高甘露糖和复杂类型之间没有明显的相关性。对单个糖基化酶的研究表明,糖苷酶MAN1A1与携带高甘露糖结构的完整糖肽呈负相关(图一)。6B)。同样,岩藻糖苷酶FUCA 1和FUCA 2与岩藻糖基化糖肽呈负相关,而岩藻糖基转移酶FUT 11与岩藻糖基化肽呈正相关。此外,唾液酸相关酶ST3GAL1和ST6GALNAC与sialylated IGPs相关。我们发现mRNA表达数据与图中所示的已知酶-糖聚糖活性的相关性较差。6B(补充图。6A和B)。这一特点最好的例子是葡萄糖苷酶PRKCSH与高含甘露糖的IGPs的关系。PRKCSH是内质网中切割未成熟糖基糖前体葡萄糖残基的一种葡萄糖苷酶,虽然PRKCSH的全局蛋白水平与高含甘露糖的IGPs相关,但mRNA水平在所有肿瘤中的表达更为动态,与IGP的组成结构无关。总之,这些结果表明,糖基化酶的蛋白质水平更多地反映了糖基化活性,而不是mrna水平的表达,而这些糖基化相关基因可能受到转录后调控。33.

图6:N-连接糖基化酶与含不同糖聚糖的完整糖肽表达的热图。

a对119例肿瘤标本中完整糖肽(柱)与糖基化酶在总蛋白水平(ROW)表达的相关性进行了双聚类分析。红色表示正相关,蓝色表示负相关。b酶表达(蛋白水平)与特异性完整糖肽的相关差异。对于PRKCSH,n(NO)=128个糖肽,n(是)=47种糖肽,p=1.84e-15(是和否);对于MAN1A1,n(NO)=128个糖肽,n(是)=47种糖肽,p=4.93e−17(是和否);对于FUCA 1,n(NO)=97种糖肽,n(是)=78种糖肽,p=4.10e−4(是和否);对于ST3GAL1,n(NO)=117个糖肽,n(是)=58个糖肽,p=9.04e−7(是和否)。双尾未配对t-没有调整的测试在b。方框轮廓表示IQR,方框中的实线表示中位相关值,盒外的晶须延伸到最小和最大相关值。源数据作为源数据文件提供。

基于糖苷组学的HGSC模型

根据不同糖聚糖与糖基化酶之间的关系,我们提出了三种HGSC肿瘤簇中受不同糖基合成途径调控的糖肽组学特征(图1)。7)。对于以IGP簇2为代表的免疫反应和增殖亚型,高甘露糖水平升高,部分可能受葡萄糖苷酶和OST复合物某些亚基的影响。糖苷酶对高甘露糖具有特异性作用,而OST复合物的亚基对N-连接糖基的合成有着广泛的影响。对于以IGP簇3为代表的高丰度间充质亚型,岩藻糖苷酶(FUCA 1和FUCA 2)的下调和岩藻糖基转移酶(FUT 11)的上调参与了岩藻糖基化模式的观察。分化型和间质型以IGP簇1和ST3GAL1和ST6GALNAC两种酶为代表。

图7:不同HGSC亚型的糖原加工模型。

为了总结卵巢癌亚型的分子特征,我们提出了三个模型,包括糖聚糖、糖基化酶和糖基化酶合成途径。

讨论

在人类hgsc之间观察到了显著的肿瘤间异质性,这些亚型是由转录和蛋白质组学特征确定的。10,11。在本研究中,我们评估了糖基化对HGSC疾病异质性的贡献,揭示了由完整的糖肽模式定义的三个主要肿瘤簇。此外,更深入地描述了这三个簇中每一个突出的糖基组成,勾勒出了与蛋白质水平相关的糖合酶表达和推断活性的特定糖原形式。结合以往特征性蛋白质组亚型信息,筛选出的糖型特征丰富,包括富含silated和岩藻糖基化完整糖肽的“分化”和“Stromal”亚型,高甘露糖基完整糖肽富集的“免疫反应”和“增殖”亚型,以及富集于岩藻糖基化中的“间充质”亚型。总之,这些结果突出了HGSC组织的分子复杂性,以及在转录、翻译和翻译后水平上提供的不同信息。许多研究集中于基于基因表达谱的HGSC的肿瘤亚型。利用mRNA表达的TCGA研究表明,HGSC有四种亚型,即分化型、免疫反应性型、间充质型和增殖型。10。在CPTAC的蛋白质组学研究中,TCGA被指定为分化型、免疫反应型、间充质型、增殖型和间质亚型。11。然而,糖基化在肿瘤异质性中的作用尚不清楚。本研究通过对119个HGSC样品的糖基肽(SPEGS)和完整糖肽(IGPs)的测定,提供了最全面的糖原蛋白质组学特征。

为了了解我们观察到的糖型谱的功能关系,我们的蛋白-蛋白质相互作用分析显示,岩藻糖基化的糖聚糖由细胞外基质相关蛋白携带,唾液酸化的糖聚糖由参与补体级联的蛋白质携带,高甘露糖糖由溶酶体蛋白携带(补充图1)。3)。岩藻糖基糖蛋白常在细胞表面表达,或在生物液体中分泌,并参与与细胞间粘附和识别过程有关的多种功能。34,35。尽管众所周知唾液酸在补体级联中起着重要作用,但很少有研究聚焦于唾液酸糖蛋白在这一细胞过程中的作用。36。最后,甘露糖残基与分泌型和膜型N-糖蛋白上的寡糖不同,甘露糖残基通常与磷酸化一起作用,将溶酶体酶定位为溶酶体细胞器。37。通过生存分析,岩藻糖基化肽可用于生存预测。3)。研究表明,用岩藻糖苷酶清除终岩藻糖或通过击倒岩藻糖基转移酶抑制肿瘤生长。38,39.

糖蛋白骨架上的糖基结构反映了多种糖基化酶的协同酶活性。以前,糖基化的这些变化取决于生物化学因素,如核苷酸糖池的可用性和某些糖基转移酶的差异表达。40。然而,糖基化异常在癌变中的作用到底有多复杂尚不清楚。为了解决这个具有挑战性的问题,我们采用了一种多方面的方法来研究糖基化紊乱的程度、糖酶表达与糖型丰度的一致性以及糖酶表达的调控元素。我们发现全球蛋白表达是下游观察糖型表达的主要因素。基因组相关和转录相关事件对观察到的糖基化模式的影响最小。在此之前,据报道,选择性的microRNAs在控制与癌症相关的特异性糖基转移酶的水平方面起着至关重要的作用。33虽然本研究未对转录后水平调控进行研究,但仍需进一步探索。

由于糖基化酶在促进肿瘤异质性时与蛋白糖基化有关,我们进一步探讨了糖基化相关基因在产生特异性糖聚糖中的潜在作用。N-链聚糖的合成是通过合成Glc3Man9GlcNAc2脂质连接前体和内质网(ER)内腔中的新生多肽链的共翻译转移而启动的。在糖链转移到asn侧链葡萄糖(Glc)后,由a-葡萄糖苷酶Ⅰ(Mogs)切割a1,2-glc残基开始修整。41。随后两个内部a1,3-glc残基的切割是由杂二聚酶a-葡萄糖苷酶II(GANAB/PRKCSH)完成的。42,43生产Man9GlcNAc2-ASN加工中间体(附图)。5)。该中间体可被甘露糖苷酶进一步修饰,如甘露寡糖-1,2-α-甘露糖苷酶IA(MAN1A1)。减少的甘露糖苷酶MAN1A1在乳腺癌中的表达导致N-糖基化异常和生存率受损44。三种葡萄糖苷酶(MOGS/GANAB/PRKCSH)均与甘露糖肽呈显著正相关,而MAN1A1与高甘露糖肽呈负相关(图一)。6A和b)。糖结合物中岩藻糖残基的转化不仅与岩藻糖基转移酶有关,而且与岩藻糖苷酶有关。阿尔法-L-岩藻糖苷酶,由两个基因-FUCA 1编码,FUCA 1编码组织酶45,FUCA 2,导致血浆α-L-岩藻糖苷酶46-是一种去除末端的溶酶体酶L-糖结合物低聚糖链上的岩藻糖残基。抑制ERα-葡萄糖苷酶在治疗病毒感染中的应用21,也可以被认为是卵巢癌治疗的一种方法。FUCA 1和FUCA 2呈负相关,而岩藻糖基转移酶11(FUT 11)与岩藻糖基化肽的产物呈正相关。对于唾液酸,ST6β-半乳糖苷α-2,6-唾液酸转移酶1(ST6GAL1)是众所周知的N-糖基唾液酸转移酶。47,但未观察到ST6GAL1与唾液酸水解肽之间有很强的相关性。然而,两种O-糖基唾液酸转移酶,ST3β-半乳糖苷α-2,3-唾液酸转移酶1(ST3GAL 1)48,以及ST6(α-N-乙酰-神经氨酰-2,3-β-半乳糖基-1,3)-N-乙酰半乳糖胺-2,6-唾液酸转移酶1(ST6GALNAc 1)49,与唾液解肽有很强的相关性。ST3GAL1与ST6GAL1有几个保守的特性50。这两种O-糖基唾液酸转移酶是否对N-糖基肽有影响还有待证实。此外,肿瘤抑制因子3(TUSC 3)也与唾液酸化肽相关(图3)。6B)。先前的研究显示,与TUSC 3阴性细胞相比,TUSC 3阳性的H 134卵巢癌细胞的唾液化增加。51。这些信息可以帮助我们控制糖基化蛋白质的生物合成。因此,我们提出了三个糖基团簇HGSC的三个模型(图)。7)。对于免疫反应和增殖亚型,OST复合物可能具有广泛的正效应,而葡萄糖苷酶对携带高甘露糖的糖肽的产生有特殊作用。间充质亚型主要与岩藻糖基化、岩藻糖苷酶和FUT 11的表达有关。两种唾液酸转移酶(ST3GAL1和ST6GALNAC 1)可能与差异亚型和间质亚型有关。这些信息可以为糖基化基因的基因治疗提供一些线索。有几种药物已被用于靶向糖基化基因;例如,卡桑白明抑制葡萄糖苷酶I,并导致具有Glc3Man7GlcNAc2结构的糖蛋白改变。52。有趣的是,一些糖基化基因的mRNA表达与那些完整的糖肽没有很好的相关性,这可能是由于这些糖基化相关基因的转录后调控所致。

总之,我们的结果表明糖基化进一步促进了观察到的HGSC肿瘤的异质性,其特殊的糖型特征与疾病的进展和严重程度有关。我们对N-连接糖蛋白组的综合分析与先前存在的描述HGSC基因组、转录和蛋白质组学特征的数据集的整合,揭示了通过探索这种显著的翻译后修饰而获得的独特见解。糖蛋白组学研究发现,糖基化物上连接的糖基聚糖与肿瘤亚型有关,糖基化位点和位点特异性糖基化结合而成的完整糖肽提供了一种除蛋白质和糖蛋白转录本外的生存预测因子。此外,糖蛋白质组学和全球蛋白质组学的整合表明,肿瘤亚型中的糖聚糖生物合成可能受糖聚糖加工酶的控制,是临床预后的进一步指示因素。总之,我们的研究将成为卵巢肿瘤学和糖类生物学领域的综合资源,并将有助于利用糖型信息进行临床诊断和治疗干预。

方法

肿瘤标本

本手稿中使用的肿瘤样本来自TCGA生物密码学核心资源,如前所述11。收集了人口学资料、组织病理学资料和治疗细节。11。在补充资料中总结了选择用于糖蛋白组分析的TCGA卵巢病例的临床病理特征。1。平均诊断年龄59.9岁。我们遵守了所有相关的道德规范,并获得了所有参与者的知情同意;约翰·霍普金斯大学批准了这项研究方案。

蛋白质提取与胰蛋白酶消化

在1.5mL溶解缓冲液(8M尿素,0.8M NH)中,每片TCGA卵巢肿瘤组织各约50 mg。4HCO3,pH值8.0)。用BCA法测定裂解液的蛋白质浓度。在37°C下,10 mM TCEP还原1h,12 mm碘乙酰胺在黑暗中烷基化1h。样品用去离子水稀释1:4,测序级改良胰蛋白酶消化,酶蛋白比为1:50。37℃消化12h后,再加入等量胰蛋白酶,在37℃下进一步孵育一夜。消化后用10%三氟乙酸酸化至pH<3。胰蛋白酶在C18柱上脱盐,用速Vac干燥。

肽的iTRAQ标记

根据制造商的指示(AB Sciex,福斯特市,CA),用4-工iTRAQ试剂标记脱盐肽。用1 5M三乙基碳酸铵溶液(pH8.5)溶解1个组织、参比样品和3个肿瘤的多肽(1mg),再与5单位iTRAQ试剂混合,在3 75μL乙醇中新鲜溶解。在TCGA样本分析过程中,使用通道114标记集合参考样本。室温孵育2h后,加入10%的TFA溶液,使其pH<3时停止反应。用不同的iTRAQ试剂标记肽,并将200μg的iTRAQ标记肽在强阳离子交换柱上脱盐,用离线bRPLC进行蛋白质组学分析。11.

用SpeG富集含糖基多肽的研究

60%ACN/0.1%TFA氧化标记肽(3.6mg)4室温下在黑暗中溶解1h。样品用C18固相萃取柱脱盐,洗脱液直接收集到平衡酰肼树脂(每样50%浆料为180μL)中,室温下摇床与100 mm苯胺共同孵育。树脂分别用50%ACN、1.5M NaCl、水和25 mm NH的1mL洗涤三次。4HCO3缓冲器。N-糖肽通过3μL-磷酸酶F(新英格兰生物大分子,贝弗利,MA)在25 mm NH中释放。4HCO3在37°C的缓冲液中摇动一夜。N-在上清液/洗涤液中收集连接的含糖基肽,用真空干燥。在50μL 0.2%FA溶液中重新悬浮含糖基多肽,进行LC-MS/MS分析。

保留AX柱富集完整糖肽(RAX)

用RAX(粒径30~50μm,每盒30 mg吸附剂),将每组2 0 0个4-复合iTRAQ标记肽的剩余部分调整为95%ACN(v/v),1%TFA(v/v),用于完整的糖肽富集。RAX柱用1mL ACN平衡3次,与100 mm醋酸三乙铵平衡3次,与水平衡3次,最后用95%ACN(v/v)、1%TFA(v/v)平衡3次。样品装于Rax柱上,用1mL 95%ACN,1%TFA洗涤4次。最后,在4 0 0μL(5 0%ACN(v/v),0.1%TFA(v/v))中洗脱结合完整的糖肽。在LC-MS/MS分析之前,将完整的糖肽置于速Vac中干燥,并保存在−80°C。

用于糖类蛋白质组学分析的LC-MS/MS

在Dionex终极3000 RSLC纳米系统(热科学)上分离脱糖基糖基化肽,采用75 m×50 cm的PEPMap RSLC C18简易喷雾柱(热科学)保护100μm×2cm的PEPMAP 100保护柱(热科学)。流动相流速为320 nL/min,由0.1%甲酸(A)和0.1%甲酸(95%乙腈)组成。样品注入(6μL),用10 0%流动相A固定13 min,流速为5μL/min,置于分析柱上,梯度分布为:2-7%B 10 min,7-27%B 80 min,27-34%B 22 min,34-95%B 3 min,95%B 10 min。MS分析是用Q-Exactive质谱仪(热科学)进行的.Q-Exactive质谱仪参数如下:电喷雾电压为2.2kV,样品捕获延迟20 min后,轨道前驱体光谱(AGC 3×10)。6)是从400到1800年间收集的。m/z在70 K的分辨率下110分钟,并以35 K(agc 2×10)的分辨率与12种数据相关的轨道结构hcd MS/MS谱相结合。5),最大离子时间为120 ms,选择的MS/MS离子宽度为1.4。m/z利用31%的归一化碰撞能量进行碎裂;肽匹配被设置为‘首选’;排除同位素被设置为‘ON’;电荷状态筛选被允许拒绝未分配的1+和>8+离子,其动态排除时间为30 s,以区分先前分析过的离子。用LC-MS/MS对样品进行三组分分析,以增加Speg覆盖率,减少缺失值,这与蛋白质组学实验中的分馏相似。53.

在轨道融合Lumos系统(Thermo Science)上对完整的糖肽进行了分析。糖肽用简易NLC 1200 UHPLC系统(热科学)在内包装20 cm×75 mm直径C18柱(1.9 mm Reprosil-pur C18-AQ珠,Maisch GmbH博士),Picofrit 10 mm开孔(新目标)上分离。用柱式加热器将柱加热到50°C(菲尼克斯-ST)。在0.1%甲酸和2%乙腈(A)和0.1%甲酸、90%乙腈(B)的条件下,流速为0.200μl/min。肽经2-6%B注射1 min,6-30%B注射84 min,30-60%B注射9 min,60-90%B注射1 min,90%B注射5 min,再回到50%B注射10 min。聚变腔质谱参数为:电喷雾电压1.8kV,离子转移管温度250°C,轨道前驱体光谱(AGC 4×10)。5)收集自350-1800m/z时间110分钟,分辨率为60 K,与数据相关的轨道HCD质谱/质谱谱(质心)的分辨率为50K(AGC 2×10)。5),最大离子时间105 ms,总占空比为2s;在宽度为0.7的条件下,分离出MS/MS的质量(四极)。m/z利用38%的高能碰撞离解,使肽电荷状态筛选能够拒绝未分配的1+、7+、8+和>8+离子,其动态排斥时间为45s,以区分先前分析过的离子在±10 ppm之间。同样地,每一个样本都用lc-ms/ms进行三次分析,以增加IGP覆盖范围,减少缺失值。53.

甜味剂中含糖基肽的定量研究

使用MS-PyCloud版本1.5.0从SpeG中识别和量化含有糖基的肽。54。原始文件首先使用ProteoWizard 3.0转换成通用的mzML格式。55。2016年5月2日检索到的NCBI RefSeq人类蛋白质Fasta数据库被用于数据库搜索。利用MS-GF+搜索引擎,在20 ppm的前体容限范围内,对ASN和Gln进行动态脱酰胺(+0.984016 Da)、Met上的静态氧化(+15.9949 Da)、肽N端和Lys上的静态iTRAQ4plex(+144.102063 Da)和Cys上的静态氨基甲酰化(+57.021464 Da)修饰。然后用以下过滤器对多肽进行量化并将其划分为蛋白质组:用−log 10(MS-GF+谱EValue)对每个电荷状态分别过滤PSM/多肽,使PSM水平的FDR保持在1%以下。需要两个胰蛋白酶解理终止,并允许多达两个缺失的卵裂。用N-糖基化位点的肽序列上的NXS/T(X可以是除P以外的任何氨基酸)的规律对所鉴定的肽进行了验证。对于Speg数据集,定量数据并不是按蛋白质水平进行总结,而是在含有糖基肽的水平(补充数据)进行总结。2).

所有肽(完整的糖肽、含糖肽和全局肽)同时用iTRAQ试剂标记。标记后,对含糖石的多肽进行分离,并进行完整的糖肽分析。因此,全球蛋白质组、含糖肽和完整的糖肽数据集之间的标记是一致的.因此,对于含糖石肽的分析,我们应用全球蛋白质组学数据集中的归一化因子来规范含糖肽的相对丰度。

完整量化N-连接糖肽

完好无损N-用GPQuest2.0软件鉴定连接的糖肽56。在搜索之前,变形蜥蜴3.0被用来将.raw文件转换为.mzML文件,并选择了“质心全MS2扫描”选项。55。应用GPQuest 2.0对未知MS/MS光谱中蛋白质糖基化的表达进行了研究,主要采用两种方法:一种是寻找含有氧离子的光谱(“oxo-谱”),另一种是完整的鉴定方法。不-连接的糖肽。以氧离子为特征的糖肽归属于MS/MS光谱,这是由于质谱中含有完整糖肽的糖聚糖断裂所致。在本研究中,含有氧离子的MS/MS光谱m/z204.0966)在前10位,去除报告离子后的丰富峰被认为是潜在的糖肽候选。完好无损不-利用GPQuest 2.0检索从本研究的SpeG数据集中识别出的含糖肽数据库和包含178个糖基的数据库,对连接的糖肽进行了鉴定。不-连接的甘露聚糖成分。甘露聚糖数据库是从非洲开发银行的公共数据库中收集的。57 (Http://www.glycome-db.org)。再将所有符合条件的(>6段离子匹配)候选肽与光谱进行比较,计算出所有肽片段、糖肽片段及其同位素峰的睡眠评分。睡眠评分最高的肽被分配到光谱中。在甘氨酸数据库中搜索指定肽与前体质量之间的质量间隙,以找到相关的糖基聚糖。所有“oxo-谱”的最佳命中率按睡眠评分依次排列,FDR<1%、覆盖范围>10%的各串联光谱的总强度保留为合格鉴别。前体细胞质量耐受性为10 ppm,片段质量耐受性为20 ppm。与含糖肽的过程类似,在肽水平上也对完整的糖肽进行了定量测定。以同一完整糖肽的所有PSM的中位log2比值值作为完整糖肽的相对丰度。样品完整糖肽的相对丰度也用全球数据中定量的糖蛋白中值进行了归一化。

糖蛋白亚型分析

用Cancer亚型分析糖肽和完整的无缺失值的糖肽58用于肿瘤亚型的一致聚类。具体来说,80%的原始样本池是在没有替换的情况下随机再采样的,并使用围绕medoid(PAM)算法进行划分为三个主要的集群,重复了500次。表达式值被转换为Z-使用R3.2.2内置标准化功能的分数。在IGP聚类中,5组完整的糖基肽是相应的糖聚糖类型,并在聚集表达矩阵的热图左侧列出,以阐明肿瘤亚型与相关糖聚糖类型之间的可能关系。

蛋白质-糖肽表达一致性分析

对于未缺失值的每一个糖基和完整的糖肽,我们分别计算了TCGA肿瘤标本中糖石丰度与其相应的总蛋白丰度和mRNA基因表达之间的Spearman相关关系。相关性p-采用本雅明-霍奇贝格程序对多假设检验的数值进行调整。

蛋白质-蛋白质相互作用网络分析

一组感兴趣的基因被输入到字符串v11中。31进行蛋白质-蛋白质相互作用网络分析。重点介绍了含有富集条件的蛋白质。

糖基化生物合成途径分析

完整的糖肽表达至少受到两个因素的影响:底物(糖蛋白前体)和糖基化酶。完整糖肽的log2比值值与从全球蛋白质组学数据中鉴定的22种糖基化酶相关联。通过对糖肽(柱)和糖基化酶(行)的分级聚类,进一步排列相关矩阵,如图所示。5A。甘氨酸组分与完整的糖肽有联系。对于每一个比较,完整的糖肽和特异性糖基化酶(FUT 11、PRKCSH或MAN1A1)之间的相关性被计算出来并显示在一个方格图中。

间充质亚型完整糖蛋白组特征的生存分析

每个样本的指数评分是指在乙二醇蛋白质组数据、全球蛋白质组数据和mRNA基因表达数据上定义间充质亚型的完整糖蛋白的平均丰度。我们比较了50个高分样本和50个得分较低的样本进行Kaplan-Meier生存分析,并进行了对数秩分析。p-使用Liflinespython包计算值(0.24.16版)59。Cox比例风险回归分析(包括置信区间和p-数值),采用“CoxPHFitter”函数拟合年龄和IGP簇。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297