肿瘤标本
本手稿中使用的肿瘤样本来自TCGA生物密码学核心资源,如前所述11。收集了人口学资料、组织病理学资料和治疗细节。11。在补充资料中总结了选择用于糖蛋白组分析的TCGA卵巢病例的临床病理特征。1。平均诊断年龄59.9岁。我们遵守了所有相关的道德规范,并获得了所有参与者的知情同意;约翰·霍普金斯大学批准了这项研究方案。
蛋白质提取与胰蛋白酶消化
在1.5mL溶解缓冲液(8M尿素,0.8M NH)中,每片TCGA卵巢肿瘤组织各约50 mg。4HCO3,pH值8.0)。用BCA法测定裂解液的蛋白质浓度。在37°C下,10 mM TCEP还原1h,12 mm碘乙酰胺在黑暗中烷基化1h。样品用去离子水稀释1:4,测序级改良胰蛋白酶消化,酶蛋白比为1:50。37℃消化12h后,再加入等量胰蛋白酶,在37℃下进一步孵育一夜。消化后用10%三氟乙酸酸化至pH<3。胰蛋白酶在C18柱上脱盐,用速Vac干燥。
肽的iTRAQ标记
根据制造商的指示(AB Sciex,福斯特市,CA),用4-工iTRAQ试剂标记脱盐肽。用1 5M三乙基碳酸铵溶液(pH8.5)溶解1个组织、参比样品和3个肿瘤的多肽(1mg),再与5单位iTRAQ试剂混合,在3 75μL乙醇中新鲜溶解。在TCGA样本分析过程中,使用通道114标记集合参考样本。室温孵育2h后,加入10%的TFA溶液,使其pH<3时停止反应。用不同的iTRAQ试剂标记肽,并将200μg的iTRAQ标记肽在强阳离子交换柱上脱盐,用离线bRPLC进行蛋白质组学分析。11.
用SpeG富集含糖基多肽的研究
60%ACN/0.1%TFA氧化标记肽(3.6mg)4室温下在黑暗中溶解1h。样品用C18固相萃取柱脱盐,洗脱液直接收集到平衡酰肼树脂(每样50%浆料为180μL)中,室温下摇床与100 mm苯胺共同孵育。树脂分别用50%ACN、1.5M NaCl、水和25 mm NH的1mL洗涤三次。4HCO3缓冲器。N-糖肽通过3μL-磷酸酶F(新英格兰生物大分子,贝弗利,MA)在25 mm NH中释放。4HCO3在37°C的缓冲液中摇动一夜。N-在上清液/洗涤液中收集连接的含糖基肽,用真空干燥。在50μL 0.2%FA溶液中重新悬浮含糖基多肽,进行LC-MS/MS分析。
保留AX柱富集完整糖肽(RAX)
用RAX(粒径30~50μm,每盒30 mg吸附剂),将每组2 0 0个4-复合iTRAQ标记肽的剩余部分调整为95%ACN(v/v),1%TFA(v/v),用于完整的糖肽富集。RAX柱用1mL ACN平衡3次,与100 mm醋酸三乙铵平衡3次,与水平衡3次,最后用95%ACN(v/v)、1%TFA(v/v)平衡3次。样品装于Rax柱上,用1mL 95%ACN,1%TFA洗涤4次。最后,在4 0 0μL(5 0%ACN(v/v),0.1%TFA(v/v))中洗脱结合完整的糖肽。在LC-MS/MS分析之前,将完整的糖肽置于速Vac中干燥,并保存在−80°C。
用于糖类蛋白质组学分析的LC-MS/MS
在Dionex终极3000 RSLC纳米系统(热科学)上分离脱糖基糖基化肽,采用75 m×50 cm的PEPMap RSLC C18简易喷雾柱(热科学)保护100μm×2cm的PEPMAP 100保护柱(热科学)。流动相流速为320 nL/min,由0.1%甲酸(A)和0.1%甲酸(95%乙腈)组成。样品注入(6μL),用10 0%流动相A固定13 min,流速为5μL/min,置于分析柱上,梯度分布为:2-7%B 10 min,7-27%B 80 min,27-34%B 22 min,34-95%B 3 min,95%B 10 min。MS分析是用Q-Exactive质谱仪(热科学)进行的.Q-Exactive质谱仪参数如下:电喷雾电压为2.2kV,样品捕获延迟20 min后,轨道前驱体光谱(AGC 3×10)。6)是从400到1800年间收集的。m/z在70 K的分辨率下110分钟,并以35 K(agc 2×10)的分辨率与12种数据相关的轨道结构hcd MS/MS谱相结合。5),最大离子时间为120 ms,选择的MS/MS离子宽度为1.4。m/z利用31%的归一化碰撞能量进行碎裂;肽匹配被设置为‘首选’;排除同位素被设置为‘ON’;电荷状态筛选被允许拒绝未分配的1+和>8+离子,其动态排除时间为30 s,以区分先前分析过的离子。用LC-MS/MS对样品进行三组分分析,以增加Speg覆盖率,减少缺失值,这与蛋白质组学实验中的分馏相似。53.
在轨道融合Lumos系统(Thermo Science)上对完整的糖肽进行了分析。糖肽用简易NLC 1200 UHPLC系统(热科学)在内包装20 cm×75 mm直径C18柱(1.9 mm Reprosil-pur C18-AQ珠,Maisch GmbH博士),Picofrit 10 mm开孔(新目标)上分离。用柱式加热器将柱加热到50°C(菲尼克斯-ST)。在0.1%甲酸和2%乙腈(A)和0.1%甲酸、90%乙腈(B)的条件下,流速为0.200μl/min。肽经2-6%B注射1 min,6-30%B注射84 min,30-60%B注射9 min,60-90%B注射1 min,90%B注射5 min,再回到50%B注射10 min。聚变腔质谱参数为:电喷雾电压1.8kV,离子转移管温度250°C,轨道前驱体光谱(AGC 4×10)。5)收集自350-1800m/z时间110分钟,分辨率为60 K,与数据相关的轨道HCD质谱/质谱谱(质心)的分辨率为50K(AGC 2×10)。5),最大离子时间105 ms,总占空比为2s;在宽度为0.7的条件下,分离出MS/MS的质量(四极)。m/z利用38%的高能碰撞离解,使肽电荷状态筛选能够拒绝未分配的1+、7+、8+和>8+离子,其动态排斥时间为45s,以区分先前分析过的离子在±10 ppm之间。同样地,每一个样本都用lc-ms/ms进行三次分析,以增加IGP覆盖范围,减少缺失值。53.
甜味剂中含糖基肽的定量研究
使用MS-PyCloud版本1.5.0从SpeG中识别和量化含有糖基的肽。54。原始文件首先使用ProteoWizard 3.0转换成通用的mzML格式。55。2016年5月2日检索到的NCBI RefSeq人类蛋白质Fasta数据库被用于数据库搜索。利用MS-GF+搜索引擎,在20 ppm的前体容限范围内,对ASN和Gln进行动态脱酰胺(+0.984016 Da)、Met上的静态氧化(+15.9949 Da)、肽N端和Lys上的静态iTRAQ4plex(+144.102063 Da)和Cys上的静态氨基甲酰化(+57.021464 Da)修饰。然后用以下过滤器对多肽进行量化并将其划分为蛋白质组:用−log 10(MS-GF+谱EValue)对每个电荷状态分别过滤PSM/多肽,使PSM水平的FDR保持在1%以下。需要两个胰蛋白酶解理终止,并允许多达两个缺失的卵裂。用N-糖基化位点的肽序列上的NXS/T(X可以是除P以外的任何氨基酸)的规律对所鉴定的肽进行了验证。对于Speg数据集,定量数据并不是按蛋白质水平进行总结,而是在含有糖基肽的水平(补充数据)进行总结。2).
所有肽(完整的糖肽、含糖肽和全局肽)同时用iTRAQ试剂标记。标记后,对含糖石的多肽进行分离,并进行完整的糖肽分析。因此,全球蛋白质组、含糖肽和完整的糖肽数据集之间的标记是一致的.因此,对于含糖石肽的分析,我们应用全球蛋白质组学数据集中的归一化因子来规范含糖肽的相对丰度。
完整量化N-连接糖肽
完好无损N-用GPQuest2.0软件鉴定连接的糖肽56。在搜索之前,变形蜥蜴3.0被用来将.raw文件转换为.mzML文件,并选择了“质心全MS2扫描”选项。55。应用GPQuest 2.0对未知MS/MS光谱中蛋白质糖基化的表达进行了研究,主要采用两种方法:一种是寻找含有氧离子的光谱(“oxo-谱”),另一种是完整的鉴定方法。不-连接的糖肽。以氧离子为特征的糖肽归属于MS/MS光谱,这是由于质谱中含有完整糖肽的糖聚糖断裂所致。在本研究中,含有氧离子的MS/MS光谱m/z204.0966)在前10位,去除报告离子后的丰富峰被认为是潜在的糖肽候选。完好无损不-利用GPQuest 2.0检索从本研究的SpeG数据集中识别出的含糖肽数据库和包含178个糖基的数据库,对连接的糖肽进行了鉴定。不-连接的甘露聚糖成分。甘露聚糖数据库是从非洲开发银行的公共数据库中收集的。57 (Http://www.glycome-db.org)。再将所有符合条件的(>6段离子匹配)候选肽与光谱进行比较,计算出所有肽片段、糖肽片段及其同位素峰的睡眠评分。睡眠评分最高的肽被分配到光谱中。在甘氨酸数据库中搜索指定肽与前体质量之间的质量间隙,以找到相关的糖基聚糖。所有“oxo-谱”的最佳命中率按睡眠评分依次排列,FDR<1%、覆盖范围>10%的各串联光谱的总强度保留为合格鉴别。前体细胞质量耐受性为10 ppm,片段质量耐受性为20 ppm。与含糖肽的过程类似,在肽水平上也对完整的糖肽进行了定量测定。以同一完整糖肽的所有PSM的中位log2比值值作为完整糖肽的相对丰度。样品完整糖肽的相对丰度也用全球数据中定量的糖蛋白中值进行了归一化。
糖蛋白亚型分析
用Cancer亚型分析糖肽和完整的无缺失值的糖肽58用于肿瘤亚型的一致聚类。具体来说,80%的原始样本池是在没有替换的情况下随机再采样的,并使用围绕medoid(PAM)算法进行划分为三个主要的集群,重复了500次。表达式值被转换为Z-使用R3.2.2内置标准化功能的分数。在IGP聚类中,5组完整的糖基肽是相应的糖聚糖类型,并在聚集表达矩阵的热图左侧列出,以阐明肿瘤亚型与相关糖聚糖类型之间的可能关系。
蛋白质-糖肽表达一致性分析
对于未缺失值的每一个糖基和完整的糖肽,我们分别计算了TCGA肿瘤标本中糖石丰度与其相应的总蛋白丰度和mRNA基因表达之间的Spearman相关关系。相关性p-采用本雅明-霍奇贝格程序对多假设检验的数值进行调整。
蛋白质-蛋白质相互作用网络分析
一组感兴趣的基因被输入到字符串v11中。31进行蛋白质-蛋白质相互作用网络分析。重点介绍了含有富集条件的蛋白质。
糖基化生物合成途径分析
完整的糖肽表达至少受到两个因素的影响:底物(糖蛋白前体)和糖基化酶。完整糖肽的log2比值值与从全球蛋白质组学数据中鉴定的22种糖基化酶相关联。通过对糖肽(柱)和糖基化酶(行)的分级聚类,进一步排列相关矩阵,如图所示。5A。甘氨酸组分与完整的糖肽有联系。对于每一个比较,完整的糖肽和特异性糖基化酶(FUT 11、PRKCSH或MAN1A1)之间的相关性被计算出来并显示在一个方格图中。
间充质亚型完整糖蛋白组特征的生存分析
每个样本的指数评分是指在乙二醇蛋白质组数据、全球蛋白质组数据和mRNA基因表达数据上定义间充质亚型的完整糖蛋白的平均丰度。我们比较了50个高分样本和50个得分较低的样本进行Kaplan-Meier生存分析,并进行了对数秩分析。p-使用Liflinespython包计算值(0.24.16版)59。Cox比例风险回归分析(包括置信区间和p-数值),采用“CoxPHFitter”函数拟合年龄和IGP簇。