您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2022
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

儿童和年轻成人癌症全基因组和转录组分析的可行性

 二维码
发表时间:2022-05-25 15:17作者:武汉新启迪Xinqidibio

摘要

癌症全基因组和转录组测序(cWGTS)在肿瘤学中的效用日益得到认可。然而,由于需要在临床相关的时间范围内提供结果,以及对检测灵敏度、报告和结果优先级的关注,实施cWGTS面临挑战。在一项前瞻性研究中,我们开发了一个工作流程,在9天内报告全面的cWGTS结果。将cWGTS与诊断组分析进行比较,证明了cWGTS在单一工作流程中以相当的灵敏度捕获所有临床报告突变的潜力。基准测试确定临床WGS测序的最佳深度至少为80倍。种系、体细胞DNA和RNA-seq数据的整合使数据驱动的变异优先化和报告成为可能,在比标准治疗多54%的患者中报告了致癌发现。这些结果为在临床肿瘤学中实施cWGTS作为一项综合试验确立了关键的技术考虑因素。

介绍

癌症是由体细胞变异体的累积引起的,包括点突变、结构变异体(SV)和拷贝数改变(CNA ),这些变异体驱动肿瘤发生、疾病进展,并在某些情况下定义治疗漏洞。基于下一代测序(NGS)的靶向基因面板分析的引入有助于疾病诊断、指导治疗,并通过完善治疗方案改善了患者的预后1,2,3,4,5。然而,目标小组被优化以评估常见癌症的临床生物标志物1,2,4。最近的研究显示了全外显子组测序(WES)在鉴定罕见癌症基因编码突变中的效用6,7。然而,对于具有低突变负荷、独特的甲基化谱8,9主要由SVs和融合基因驱动,在大多数情况下,panel/WES测试不能识别临床生物标志物1,2,3,4,7。这强调了对更好的诊断工作流程以指导临床管理的未满足的需求。

癌症全基因组和转录组测序(cWGTS)提供了评估种系和体细胞获得性突变、SV和CNA的全光谱,以及肿瘤突变负荷(TMB)和全基因组突变模式的量化的机会10。最近的文献越来越多地证明了cWGTS在儿科和罕见癌症中的可能临床效用7,11,12,13,14,15,16。然而,WGS在肿瘤学中的临床实施受到以下因素的挑战:测序成本、实验室的复杂性、在临床相关时间框架内处理大规模数据的分析工作流程、对低覆盖率WGS在检测高深度面板分析捕获的可操作突变方面的敏感性的担忧,以及cWGTS研究结果在临床实用性方面的可解释性3。在这里,我们证明了在患有罕见癌症的儿童、青少年和年轻成人实体瘤患者的初级癌症护理中实施cWGTS的可行性、分析有效性,并解决了关键的技术问题。

结果

试样处理

该研究队列包括初诊或复发/难治性疾病的患者。在201例被提名进行配对癌症/正常全基因组和转录组测序(cWGTS)的新鲜冷冻(FF)肿瘤患者中,58例在病理审查时被排除,29例不符合WGS评估的肿瘤纯度> 20%的要求。大多数被排除的病例是治疗后的神经母细胞瘤和肉瘤样本,以坏死性疾病为主。最终队列包括来自114名患有实体瘤的儿童、青少年和年轻成人患者(中位年龄= 12.6岁,范围:4.5个月至43.8岁)的单个样本(补充表格1, 2,补充图。1a–d).

用于临床决策支持的cWGTS工作流的实现

为了构建临床cWGTS工作流程的原型,我们开发了一个端到端流程(图。1a)其中包括专用的:1。项目管理团队,2。样品处理的实验室操作员,3。cWGTS的定序机,4。数据导入频道,5。生物科学平台,用于分析管道的自动部署以及与机构和公共数据库的API集成17, 6.高性能计算环境中的保留计算节点。基因组发现的优先排序和报告的系统管道(图。1a,补充图。1e).我们量化了从样本采集到生成自动化报告的端到端时间。从手术活检提交时开始审核时间日志,以报告交付跨学科分子肿瘤委员会审查我们研究中的样本,并通过我们的生物科学平台记录审核跟踪(补充图。1e).端到端,在开发阶段,该工作流平均在17天内执行(范围:11–29,n= 59个样本),达到完全优化的工作流程,最终周转时间为9天(图。1b, n= 16).这比许多临床NGS面板测序测试的标准周转时间(TAT)短(2-4周)1,2,4明显快于文献中大多数WGS处理时间(3-8周,图。1b)11,12,13,14,15,16并且可与由诸如Hartwig基金会的大规模中央基础设施实现的TAT相比18。这证明了在综合癌症护理中心实施cWGTS分析以支持具有临床相关周转时间的诊断和治疗决策的可行性。

图1:端到端的cWGTS工作流。
figure 1

a端到端cWGTS工作流程的示意图,包含每个步骤的中值持续时间(小时)信息,由四个连续批次的计时试验确定,包括n= 16个肿瘤和执行工作流程所需的专用资源的表示。b文献中最佳报告周转时间的比较,从样本采集到结果准备供肿瘤委员会审查。在我们的研究中,我们显示了一个橙色条,表示n= 16个样本,最小和最大时间用误差线表示。这些样品经过优化后处理。

利用cWGTS进行全面的基因组表征

在所有突变类别中,cWGTS平均每个样本识别出7353个获得性突变,其中99%为癌症相关变异(n= 114)的患者(补充图。2).这些包括CNA(n= 105名患者)、种系素质(n= 17)、癌症相关基因的突变(n= 77)、易位/融合转录物(n= 27)、疾病相关的SVs(n= 75),以及异常TMB或微卫星不稳定性(MSI)分数(n= 7)(补充表)3).其他感兴趣的信号包括突变标记的描绘19色丝菌的检测20或者全基因组复制(WGD)21癌症相关病毒序列(即EBV)22,23端粒长度的估计24和基因表达特征。SVs,其中大部分只能用WGS检测,代表了第三种最常见的基因组改变。

cWGTS与靶向DNA和RNA检测的一致性分析

在我们的队列中,MSK IMPACT对相应的福尔马林固定石蜡包埋(FFPE)活检标本进行了靶向DNA分析4根据OncoKb级的定义,检测到可操作的生物标志物2524%的患者(n= 27)(图。2a–c,补充表4).与先前的研究结果一致,即通过小组测序证明患有罕见癌症的患者不会产生临床相关的生物标志物4,我们队列中的大多数患者(76%,n= 87)没有治疗信息改变。这些结果代表了MSK扩大的儿科/年轻成人患者群体(补充图。3a,b).

图cWGTS对临床生物标志物的分析有效性。
figure 2

a左侧柱状图描述了根据OncoKb定义的MSK-IMPACT(1-4级)报告的治疗知情、致癌或无相关发现的患者比例。右边的柱状图显示了研究群组中最高水平的OncoKb注释的分解(0,1,2)。b柱状图展示了研究队列中信息性生物标志物数量对最高OncoKb水平的分解。c显示最高OncoKb水平按疾病类别细分的柱状图。d散点图显示了MSK-IMPACT (x轴)报告的MSK-IMPACT变异体的变异等位基因频率(VAF)与WGS数据堆积(y轴)(皮尔逊相关)的绝对VAF估计值的比较。沿着x轴观察到差异突变。突变通过调用状态进行颜色编码,其中两者在两种测定中都被调用,ITH是在更高深度的重新测序和/或had比例测试中未被调用的突变p-值< 0.05。e柱状图展示了MSK-IMPACT突变的分解,在WGS和MSK-IMPACT或仅在MSK-IMPACT (ITH)观察到。f对cWGTS中MSK撞击/MSK融合报道的致癌融合的验证。星号表示SS18-SSX1据MSK报道,核聚变被报道为SS18-SSX2通过RNA-seq并由WGS的跨越阅读支持。每个患者下面列出的主要肿瘤疾病代码(ARMS腺泡状横纹肌肉瘤、CHS软骨肉瘤、DLGT弥漫性软脑膜胶质神经瘤、DSRCT促结缔组织增生性小圆细胞瘤、ES Ewing肉瘤、MBL髓母细胞瘤、MFH未分化多形性肉瘤/恶性纤维组织细胞瘤/高级梭形细胞肉瘤、RCSNOS圆细胞肉瘤、NOS、SYNS滑膜肉瘤、us未分化肉瘤、USPC腹腔未分化肉瘤)。补充数据中提供了面板a-e和f的源数据46.

我们首先评估了MSK-IMPACT捕获的突变是否也被WGS检测到。对于所有不一致的样品,我们对用于产生WGS文库的相同DNA等分试样进行了MSK影响。这使我们能够确定差异呼叫是由于检测灵敏度的差异(MSK-IMPACT和WGS)还是肿瘤内异质性的结果(ITH)26.

MSK-IMPACT报告的221例体细胞突变中,174例(79%)发生在WGS(图。2d,e).这包括MSK-IMPACT报告的68/83 (82%)的致癌突变25(补充图3c).两种检测法所称的变异体的变异等位基因频率(VAF)在5%到97%之间,具有高度一致性(r2= 0.75)在VAF估计(图。2d).大多数不一致突变(46/47)在MSK影响中是亚克隆的(< 90%的癌细胞部分),15个被归类为致癌的(补充表4,补充图。3c).不一致突变表现为大范围的VAF(范围:2.2-39%,中位数= 8.5%)(图。2d)并且在有效覆盖率方面没有显示出系统性偏差(补充图。三维(three dimension的缩写)).47个不一致突变局限于26个样本(每个患者1-7个突变)。MSK-IMPACT对WGS文库的44个不一致变异体进行了定向重测序,尽管测序的局部深度中值为469倍,但没有一个变异体被测序,支持ITH是差异的基础(补充图。3e).进一步证实ITH、WGS和相同FF DNA等分试样的靶向重测序数据确定了10个突变(VAF:6-31%),MSK-IMPACT从患者匹配的FFPE样本中没有报告这些突变。10个额外呼叫中的3个是癌症相关变异体(TP53 L265Yfs*81、PPM1D S468*和HLA-A L102Hfs*73)(补充图。3e).

这些验证研究表明,不一致的呼声是由于随机抽样的异质性肿瘤26(补充表格4)和WGS和MSK-IMPACT之间的一致性为至少94% (43/47总不一致),当在两种测定中使用相同的DNA等份时,对于可评估样品中的所有43个突变,一致性高达100%。

MSK种系评估-影响27在13名患者中鉴定出易感性变异,并使用MSK融合技术进行小组RNA评估2818(补充表)中已鉴定的致癌融合基因5, 6,图。2f).cWGTS捕获了所有13个种系素质变异体和18个融合体。重要的是,WGS和RNA-seq中的数据都支持融合基因,这提供了在单个工作流程中正交验证发现的机会(图。2f).这些发现表明,cWGTS作为一种综合检测方法,可以检测一系列标准护理诊断试验捕获的种系、体细胞突变和融合基因。

技术考虑:临床测序的最佳覆盖深度

体细胞变异检测的灵敏度直接取决于活检的肿瘤细胞性和测序覆盖的深度。cwg的中值深度为95倍(范围为67–181 ),肿瘤纯度范围为21%至100%,导致中值有效覆盖率为64×(中值深度*纯度估计值)。为了评估最佳测序深度,对于WGS覆盖率≥60倍的97个肿瘤,我们生成了298个衍生二次抽样BAM文件,范围为100倍、80倍、60倍和30–40倍(补充图。4a,补充表7).MSK-IMPACT和WGS(n= 220)、跨变体类别的全基因组突变和TMB(图。3a,补充图。4b,c).检测灵敏度与有效覆盖率相关,并受变异类别的影响,对SVs的灵敏度略低(图。3a).在致癌发现中,91%以上在30-40倍时被捕获,98%以上在60-100倍时被召回(图。3a).测序覆盖率较低时,检测亚克隆的能力有限(VAF范围:4.3-31%,中位数= 9.5%)(图。3b,c).跨变异类别的全基因组突变检测的最佳灵敏度在≥80倍时达到,并随着覆盖率的增加而增加。数字3c通过测序覆盖深度、肿瘤纯度和变异克隆代表提供变异检测灵敏度的概述。

图3:对WGS最佳覆盖范围的评估。
figure 3

a柱状图展示了变异体检测的灵敏度和95%置信区间(误差线),覆盖深度从左至右为:1。MSK-IMPACT和WGS检测到的临床相关事件(n= 220), 2.全基因组SNVs,3。全基因组索引,和4。全基因组SVs。仅来自原始中值覆盖率> 100倍的样本的数据(n= 32)。红点表示在相同二次抽样水平下所有bam中所有突变的总体敏感性。b研究队列(H135973)中代表性样本的每个二次抽样水平的变异等位基因频率直方图,显示在较低的测序覆盖深度下检测亚克隆突变的灵敏度下降。cMSK临床相关呼叫的二次抽样BAMs中有效局部覆盖与VAF的散点图-IMPACT。二次抽样bam中调用的变量用圆圈表示,而遗漏的变量用X表示。趋势线显示了获得至少2个变异读数的累积二项式分布,给出了有效覆盖率和变异等位基因分数。面板的源数据a, c在数据仓库中提供。面板的原始数据b可在dbGAP研究中获得。

仅由cWGTS检测到的生物学和临床相关性研究结果

未通过临床小组测序确定的cWGTS结果的临床相关性(MSK影响4,MSK-聚变28和88种癌症易感基因的小组测试27)由多学科分子肿瘤委员会确定。与最近的研究一致7,11,12,13,14,15,16,cWGTS分析在54%的患者中发现了至少一种额外的癌症相关致癌变异(n= 62).其中,33名患者有一个或多个与临床直接相关的发现,包括7个诊断性(21%),15个预后性(45%),5个治疗告知性(15%),5个以前未描述的肿瘤融合(15%)和6个生殖系(18%)生物标志物(图。4a,补充表3).大多数额外的相关发现可以通过SVs和融合的检测以及全基因组突变信号来解释(图。4b).

图4:与护理标准相比,cWGTS检测到的其他相关结果。
figure 4

acWGTS的其他相关发现的热图,用何种技术(WES、WGS和RNA-seq)可以检测每个事件来着色。列代表患者,而行是临床事件类型。种系的星号表示突变特征支持的致病性。b(上图)具有临床相关检测结果的患者的堆积条形图细分。蓝色区域(实线或网格)代表具有靶向测序(RNA和DNA)相关发现的患者,而橙色区域(实线或网格)代表具有cWGTS发现的患者。蓝色/橙色网格表示在靶向测序和WGTS中均有相关发现的患者。(底部)从上往下橙色部分(实心或网状)中患者的cWGTS特定发现的堆积条形图细分。相关调查结果按事件类型进行着色。SV,结构变体。TMB,肿瘤突变负担。微卫星不稳定性。小Mut,小突变,包括取代和插入/缺失。病毒,病毒整合。面板的源数据a, b在补充数据中提供3.

我们进一步推断,通过对基因编码区的掩蔽结果,WES将捕获额外发现的部分。在62名cWGTS发现增加的患者中,单独的RNA-seq和WES仅在10名(16%)和8名(n= 13%)的患者,或者当合并时有17名患者(图。4a,补充表3).因此,在cWGTS中只有27%的发现可以被WES和RNA-seq捕获,因为大部分额外的发现归因于SVs。

已确定的癌症基因中的罕见变异

我们确定了针对已知罕见癌症基因的七项临床相关发现(补充表格5, 8).其中,三个是体细胞获得的,包括一个疾病定义突变KBTBD4(p.R313_M314insPRR)在中等分化的松果体实质肿瘤中的表达29,30,一个SETBP1生殖细胞肿瘤中的(p.D868N)突变SIX1肾母细胞瘤中的突变(p.Q177R)31。此外,在四个癌症相关基因中检测到了临床相关的种系变异,包括最近推出的智能电池数据集横纹肌肉瘤中的剪接位点突变(c.258 + 2T > C ),BARD1页(page的缩写)神经母细胞瘤中的E652fs*69,EP300页(page的缩写)两例骨肉瘤患者的A2259fs*20和EXT2 p.W414*(补充表5).这些结果证明了cWGTS在捕获罕见癌症基因的体细胞和种系变异中的效用,这些基因在靶向组中不进行常规评估2,4.

融合基因

在先前临床试验没有发现的患者中,从WGS和RNA-seq中鉴定出8个符合读框的融合基因(补充图。5,补充表6),其中5个之前没有描述过。对于诊断相关性,我们确定:1。一个t(2;6) (PAX3-FOXO31)在被诊断患有胚胎性横纹肌肉瘤(ERMS)的患者中,在没有主横纹肌肉瘤融合的情况下,对腺泡状横纹肌肉瘤(ARMS)的易位改变诊断(PAX3-FOXO1PAX7-FOXO1)32(图。5a、b), 2.aUACA-LTK转移性甲状腺乳头状癌的融合33,和3。哀婉的SH3PXD2A-HTRA1融合建立一个神经鞘瘤患者的诊断评估复发的第四阶段神经母细胞瘤34.

图5:用于变体注释的DNA和RNA发现的整合。
figure 5

a上图显示了y轴上的绝对拷贝数和导致以下结果的结构变体(SV)PAX3-FOXO3患者H134768出现融合。下图显示了由相应基因组SV产生的RNA融合产物。b横纹肌肉瘤样本甲基化数据的tSNE聚类按疾病亚型进行颜色编码(ARMS:肺泡型,ERMS:胚胎型,SCRMS:梭形细胞,SRMS:硬化型)。病人藏着PAX3-FOXO3融合星团与ARMS样本。c上图显示了6号、9号和18号染色体中的染色体倍性事件,导致了独立企业联盟增强剂因同源物患者H133676的基因位点。下图显示了来自Drier等人,Nature Genetics 2016的H3K27me3染色质标记。d箱线图显示了因同源物群体中每百万转录本(TPM)的表达。中心线表示中间值,胡须从盒子延伸到+/-1.5倍的四分位数范围(IQR)内。患……的病人MYB-NFIB事件(H133676)以橙色突出显示,表明面板中的SV事件c与MYB的过度表达有关,证实SV是一个增强子劫持事件。eSV事件定位图TP53骨肉瘤患者的基因体(n= 12,第13个患者的事件断点落在基因体之外)。SV显示为箭头,y轴上的绝对拷贝数(灰点)覆盖了的外显子结构TP53(TRA:易位,DUP:复制,DEL:缺失,INV:倒位)。f箱线图显示了以下各项的对比TP53之间的RNA表达TP53-重新排列的样品和没有任何重新排列的样品,其中心线表示中位数,晶须延伸在+/-1.5倍IQR范围内(双侧Mann-Whitney U检验,p= 1.645e-03)。面板的原始数据ac可在dbGAP研究中获得。面板的源数据e在补充数据中提供9。面板的源数据d, f在数据仓库中提供。

潜在的治疗相关性,我们确定了一个NTRK3-SLMAP神经母细胞瘤患者的融合。使活动NTRK3融合蛋白是TRK抑制剂有希望的治疗靶点,在儿童和成人癌症中都有活性35。然而,筛查资源工具包融合并不是所有疾病适应症的常规操作。其他未描述的融合包括EPC2-AFF3MAN1A2-ACBD6在两例未分化肉瘤患者中发现CITED2-马达加斯加阿里亚里未特指的圆形细胞肉瘤的融合。

靶向肿瘤抑制基因的结构变体

已确定预后相关性的结构变异36在我们的队列中观察到,提供了临床相关性的见解。cWGTS映射事件在端粒酶催化亚基综合征神经母细胞瘤患者分别为8例(28%)和5例(17%)。两者端粒酶催化亚基综合征越来越被认为是神经母细胞瘤的治疗风险分层生物标志物37。这端粒酶催化亚基SV只能由cWGTS识别,并且只能由综合征MSK-IMPACT报告了删除情况4.

我们还观察到复发的SVs靶向肿瘤抑制基因DLG2在15/29的OS患者中38和3/29成神经细胞瘤,其中6个有纯合缺失(补充表9).正在…DLG2骨肉瘤的特征是38我们的发现表明DLG2SVs在神经母细胞瘤中也是复发的,值得在未来的研究中进一步研究。

整合RNA-seq和WGS用于变体注释

对基因组非编码区复杂SVs的解释对WGS发现的报道提出了一个主要挑战。cWGTS使得SVs的伴随检测和受影响位点的转录结果的评估成为可能。例如,一个染色体倍性事件导致因同源物致癌基因39通过“劫持”一架独立企业联盟增强剂(图。5c,d)在一个腺样囊性癌中被检测到,但没有信息性的临床测序结果。正在…因同源物过度表达是腺样囊性癌的主要特征,因同源物使用常规诊断分析,仅在30%的病例中识别出融合39。基因表达数据的整合对于注释和报告这种复杂的非编码SV作为疾病定义诊断生物标志物是至关重要的。

同样,在29例骨肉瘤患者中,我们发现TP5312个突变和定位的非编码SVsTP53地点在13号。其中,只有3起是MSK-IMPACT报告的(图二)。5e).与RNA-seq的整合证明TP53SVs与下列指标的丧失相关TP53表达,验证它们的功能相关性(图。5f).野生型TP53代表p53途径调节药物试验的纳入标准40。在这里,我们表明,在没有cWGTS的情况下,患者失去TP53SVs已在多种癌症中被描述,可能被错误地诊断为TP53野生型对治疗方案评估的影响40。我们没有鉴定出针对肿瘤的种系SVTP53轨迹。

综上所述,我们的发现说明了在变异检测、注释和临床cWGTS报告的优先排序中结合RNA和DNA分析的必要性。在我们的自动化工作流程中,我们通过询问DNA突变来寻找RNA中的确凿证据。通过WGS和RNA-seq两者正交地检测到所有由RNA-seq组分析报告的复发融合基因以及8个额外的驱动融合基因(补充图。5).此外,基因表达数据与SV发现的整合解决了SV靶向基因组上非编码区的功能后果(例如,因同源物增强器劫持和TP53失活)。

全局基因表达特征进一步用于根据肿瘤类型对样本进行聚类,为解决患者的诊断提供了进一步的机会(补充图。6a).最后,在101名有RNA-seq数据的患者中,我们平均每个样本鉴定出18个基因表达生物标志物(范围= 1-99)16(补充表格10).然而,关于这种表达生物标志物的临床应用的证据仍有待验证。为此,我们对具有已知组织特异性表达模式的异常表达基因和从cWGTS中检测到的SVs或融合体进行了系统的询问。总的来说,只有8%的表达生物标记物与获得性SV或融合基因相关,划分了高可信度表达生物标记物的子集(平均每个患者= 1,范围= 0-10)。这将我们队列中具有SV支持的表达生物标志物的患者数量限制在54%(n= 55)(补充图。6b).为了证明这种综合分析的效用,我们发现了一个伴随现象喀斯特地貌通过临床试验,在两名无临床相关生物标志物(H135462和H195916)的患者中扩增和过度表达。值得注意的是,在两位患者中,MSK-IMPACT没有报告扩增,这表明基于检测组的分析检测拷贝数变化的灵敏度较低。

种系突变与体细胞突变标记的整合用于变体注释

种系变异的注释仅限于人口数据库中的重复事件,因此限制了对罕见创始者事件的解释。对于我们队列中的每个基因组,我们量化了归因于73个参考突变信号中每一个的突变比例10。三分之二具有DNA修复基因种系突变的患者进一步具有提示DNA修复缺陷的突变特征。患者H135421在MUTYH和第二等位基因的体细胞缺失。大约42%的突变归因于MUTYH签名SBS3610(图。6a).患者H135466在PMS2(c.538-1G > C)通过LOH丢失野生型等位基因。该肿瘤MSI高,伴有高突变(TMB = 11.23,indels = 90,246,SNVs = 17,840,SVs = 44),T > C突变富集,重复介导的indels特征为PMS2缺乏10(图。6b).相比之下,患者H135073在2005年携带了一个未知意义的变异体(VUS)PMS2中等MSI得分(7.23),低突变负荷(1.30 Muts/Mb),没有证据表明PMS2签名(图6c).这些发现证明了突变信号在评估DNA修复基因种系突变中的效用。

图6:四个不同患者的体细胞突变的全基因组分布和模式。
figure 6

a携带致病种系的神经母细胞瘤患者(H135421)MUTYH变体(c.924 + 3A > C)。b具有致病种系的未成熟畸胎瘤患者(H135466)PMS2突变(c.538-1G > C)。c具有种系的恶性外周神经鞘瘤患者(H135073)PMS2意义不明的变体(VUS)(第W841页*)。对于每个患者,顶部面板是Circos图,显示了基因组中不同类型的体细胞突变。最外面的环显示了由突变碱基的嘧啶配偶体颜色编码的所有snv的相互突变距离。中间的环显示小的插入(绿色)和删除(红色)。最里面的环显示拷贝数的变化,弧线显示SV。中间的图是柱状图,显示了归因于肿瘤中最高暴露的五个突变信号的突变的绝对数量。下图是显示SNVs的96个三核苷酸背景的柱状图。d复发性骨肉瘤患者队列外发现的体细胞突变的全基因组分布和模式(H201472)。WGS结果显示样本是高度突变的,富含SBS26、T > C突变、重复介导的缺失和MSI不稳定。这个病人被发现携带一种病原体PMS2变体(p.D699H)(重复缺失:重复介导的缺失,m-同源性:微同源性介导的缺失,缺失其它:所有其它缺失,TRA易位,DUP复制,DEL缺失,INV倒位)。这一数字的原始数据可以在dbGAP研究中获得。

为了说明这一点,在研究队列之外的一名12岁骨肉瘤患者中,cWGTS描述了一个高突变的基因组(TMB = 16.7,indel = 89,588,SNVs = 31,520,SVs = 568),富含重复介导的缺失,与MSI高状态一致(图。6d).这一观察促使人们同意进行种系测试,结果发现PMS2突变(p.D699H)被注释为可能致病/VUS41以及野生型等位基因的体细胞缺失。MSK-IMPACT报告了不确定的MSI状态(7.5),但经检测证实种系突变是致病的。

这些结果证明了整合来自cWGTS(种系突变、等位基因特异性拷贝数和全基因组TMB)的综合读数的效用,从而为评估和报告种系易感性突变提供确证证据,并对家族筛查、诊断和治疗产生影响。

新出现的生物学和临床相关性的基因组改变

最近的研究提出端粒长度作为其他癌症中神经母细胞瘤的预后指标42,43,44,45。我们概述了已建立的联系综合征端粒酶催化亚基端粒长度的突变46,47(补充图7a–c). 综合征在8例骨肉瘤中也观察到突变,与端粒长度相似(补充图。7c).考虑到不良风险突变和端粒长度之间的关联,独立预后值的描述保证了对数据的分析,这些数据同时描绘了这些突变、SVs和端粒长度以及已建立的预后预测因子。

我们检测到色丝菌20在40%的患者中,最常见于肉瘤(35/58)、生殖细胞瘤(2/4),较少见于神经母细胞瘤(6/29)(补充图)。7d).色丝菌经常导致TP53损失(10月29日)20,48,放大真菌学, 血管内皮生长因子,以及MDM2。此外,在2名患者中,色丝菌导致致癌融合(MAN1A2-ACBD6PAX3-FOXO3)(补充图。7e).先前的研究提出了全基因组重复(WGD)和癌症预后不良之间的联系21。在肉瘤(24/54)、癌(3/7)和成神经细胞瘤(11/30)中富集的42/114患者中观察到WGD(补充图)。7f).

不同类别肿瘤突变负荷的生物学和临床意义

基于小组的方法得出TMB、MSI评分和突变特征的估计值49,而WGS直接量化所有变异类别的全基因组突变负担(图。7a,b和补充图。8a).我们在我们的队列中观察到,相对于儿科癌症的报告,总体TMB估计值更高(8.3倍)(图。7a)10,48,50。接受治疗的患者样本的TMB高于未接受治疗的患者样本(接受治疗的患者样本为0.1–11.2,未接受治疗的患者样本为0–2.7,Mann–Whitney检验,p= 1.892e-04),并与治疗相关特征(即替莫唑胺、铂)的证据相关(补充图。8b)10,51,在45/114名患者中观察到,表明暴露于癌症治疗并存活的克隆持续存在52.

图7:免疫治疗背景下的全基因组突变负荷。
figure 7

aWGS评估的编码肿瘤突变负荷(TMB)在整个队列中的分布(n= 114),根据取样时患者的治疗状态进行着色。虚线表示中位数编码TMB (SNVs和indels ),如先前零儿童癌症研究报道的。患者按疾病类别分组(NB:成神经细胞瘤,CNS:中枢神经系统,C:癌,WT:肾母细胞瘤,Germ:生殖细胞瘤,H:肝母细胞瘤,O:其他)。对免疫疗法有反应的癌症患者C1和C2被标记。b结构变体(SV)(右)和基因融合(左)负荷在WGS和RNA-seq均可用的样品中的分布(n= 101).患者C2具有低质量的RNA样品,因此显示了来自同一患者的另一时间点的克隆融合。c(上图)肿瘤C1 (H135022)患者的全基因组分布和体细胞突变模式,该患者患有转移性肾上腺皮质癌,表现为高SV负荷。Circos图如图所示。6。PET成像显示用nivolumab和ipilimumab治疗后,大的肺转移病灶(红色箭头)消失。dH135462的全基因组分布和体细胞突变模式,这是一名14岁的复发性难治性低分化透明细胞癌患者,具有高TMB和SV负荷。Circos图如图所示。5。PET成像显示,在接受培溴利珠单抗治疗后,多发性转移病灶(红色箭头)消失。面板a和b的源数据在数据储存处提供。面板的原始数据c, d可在dbGAP研究中获得。

患者H135022(肾上腺皮质癌)和H135462(透明细胞癌)患有进行性治疗转移疾病,在缺乏通过临床试验告知治疗的生物标志物的情况下,处于其治疗方案的末期。cWGTS分析揭示了一个深度重排的基因组,这两位患者在队列中融合负荷和SV负荷最高(图。7b–d).H135022接受了检查点阻断治疗(nivolumab/ipilimumab ),在三个治疗周期后产生了完全缓解,并且在治疗停止后26个月无病(图。7c),而患者H135462接受了彭布罗利珠单抗治疗,在6个周期后达到完全缓解,并在治疗后10个月保持无病状态(图。7d).

这些发现证明了cWGTS在全面评估不同类别的基因组不稳定性水平方面的价值,并强调了进一步评估SV和融合基因负荷作为免疫检查点阻断治疗反应的生物标志物的必要性。

无细胞DNA中综合WGS谱的推导

我们的研究评估了FF活检中cWGTS作为肿瘤DNA最佳来源的关键技术考虑。然而,有限的活检可能会限制所有患者获得cWGTS。来自血浆的无细胞DNA (cfDNA)代表了用于肿瘤概况分析的DNA的替代来源53。最近,包括WGS在内的cfDNA NGS谱已被用于检测儿科肿瘤中肿瘤特异性CNAs和片段模式54,55,56。然而,高深度WGS在从cfDNA鉴定患者癌症基因组的遗传变化(SNVs、indels和SVs)的组织幼稚型鉴定中的潜力在很大程度上还未被探索。

在探索性分析中,我们对匹配的FF样本和肿瘤活检时收集的7名患者的cfDNA进行了WGS(补充表11).cfDNA全基因组覆盖范围从94到102倍不等(图。8acfDNA中的肿瘤含量范围很广,约为10–83%(图。8b).为了评估cfDNA在无偏全基因组突变检测中的适用性,我们对所有变异类型(SNVs、indels、SVs和CNA)的cfDNA进行了从头突变检测,并将结果与FF分析进行了比较。

图8:来自匹配的新鲜冷冻肿瘤组织和cfDNA的WGS数据的比较。
figure 8

acfDNA中按估计肿瘤背景排序的覆盖值。b肿瘤含量的估计。c柱状图显示了cfDNA中存在于匹配的新鲜冷冻肿瘤中的从头突变调用的比例,按变异类型细分。不含高可信度SV的cfDNA样本用星号表示。dH158182匹配的新鲜冷冻(左)和cfDNA(右)样本的全基因组分布和突变模式。Circos图如图所示。6. eH158182的个体水平克隆性分析。(左)所有替换的癌细胞比例(CCF)值的散点图,由估计的聚类进行颜色编码。(中间)标注了临床相关变异的聚类的系统发育树表示。(右)克隆水平突变特征分析,显示归因于每个突变特征的突变比例,每个聚类中的突变总数显示在右侧。尽管不能确定与这些克隆相关的驱动因子,但cfDNA特异性SNV调用概括了FF样本中的突变特征,并且富含铂相关的突变特征,表明循环中存在暴露于治疗的肿瘤亚克隆。(重复缺失:重复介导的缺失,m-同源性:微同源性介导的缺失,缺失其他:所有其他缺失,TRA:易位,DUP:重复,DEL:缺失,INV:倒位)。面板的源数据a, b在补充数据中提供11。面板的源数据c在数据仓库中提供。面板的原始数据d, e可在dbGAP研究中获得。

cfDNA的WGS在数据生成或跨突变类别的假阳性变异调用方面没有表现出技术限制。高质量变异细胞的产生取决于循环肿瘤DNA (ctDNA)的数量。在4名ctDNA含量足以进行CNA检测的患者中,我们在FF和cfDNA CNA谱之间建立了良好的一致性(图。8c,补充图。9a–g).引人注目的是,对于具有高ctDNA含量(即IH158182)的患者,我们获得了全基因组突变模式的接近完整的图片,证明癌症基因组景观可以通过cfDNA WGS完全再现(图。8d).重要的是,对于患者H135967,我们证明即使估计ctDNA含量为20%,与FF材料分析使用的阈值相同,我们也可以检测FF样本中所有已知的致癌事件,包括变异类型TP53替换,真菌学CCNE1扩增和靶向ARID1A和ATRX的SVs(补充图。9c).

与实体活检相比,我们进一步证明了cfDNA在捕获肿瘤系统发育中不同类型变异的综合表现方面的潜力(补充表11)通过检测cfDNA特异性亚克隆(图。8e,补充图。9a–g).这些结果为从液体活检获得肿瘤不可知的综合WGS谱的可行性提供了概念证明。

讨论

我们对肿瘤学临床护理实践中的cWGTS实施进行了全面的技术评估。我们证明,使用单一的集成工作流程,cWGTS可以捕获使用多种标准护理诊断分析进行评估的癌症相关基因组变化的全光谱。随着最佳实验室和计算实践的实施,我们在9天内完成了端到端的样本到报告的周转时间,这符合诊断和护理决策的临床需求,并可与大规模基础设施相媲美18。尽管测序覆盖率比基于小组的分析低5-10倍,但我们证明,在匹配的活检中,cWGTS通过高深度靶向分析恢复了所有临床报告的变异。我们建立了> 80倍的覆盖率和至少20%的肿瘤纯度来达到这种灵敏度。然而,这为新鲜冷冻肿瘤标本设置了严格的质量门槛,这些标本不像FFPE那样容易获得。然而,WGS在FFPE的一个主要限制是全基因组调用的高错误率57。为此,我们提供了概念验证的可行性数据,证明在诊断或复发时循环中cfDNA含量高的患者中也可以利用全面的WGS分析。我们的发现为未来的研究铺平了道路,这些研究集中于从cfDNA中分析验证和优化全面的肿瘤不可知WGS谱用于诊断目的。

为了支持cWGTS变体注释和优先排序,我们实施了一个分析工作流,该工作流从变体注释数据库中学习,并整合了来自种系突变、体细胞DNA和RNA-seq发现的信号。这允许我们注释、验证和优先化诊断的SV(例如,因同源物增强子劫持)、预后(例如,综合征/端粒酶催化亚基),以及治疗相关性(例如,TP53功能丧失SVs)。与儿科和罕见癌症的近期文献一致7,15,16,58,> 50%的患者有其他已确定的生物学或临床意义的发现。这些发现中的大部分是癌症基因、融合基因和全基因组突变信号中的SV,靶向小组没有优化设计来识别这些SV。重要的是,我们证明了WES和RNAseq单独或联合使用只能捕获这些额外发现中的一小部分。需要进行更大规模的队列研究,以确定cWGTS捕获的临床相关生物标志物的发生率和流行率。

cWGTS的临床相关性超出了罕见癌症的范围59。我们发现,通过cWGTS,我们可以在99%的患者中检测到全系列的癌症相关突变。患者定制医疗的愿景保证了临床决策的交付,这些决策超出了单个可用药生物标志物的范围,而是考虑了来自患者癌症基因组的复合读数,这些读数告知了患者发展癌症的先验风险、诊断、治疗反应的可能性、进展风险和治疗弱点。随着越来越多地在注释良好的临床样本上实施cWGTS15,16,58,我们解释cWGTS结果的能力将会提高,并且通过扩展,cWGTS的临床效用将会扩大。随着cWGTS的经济障碍及时得到缓解,癌症基因组的单一综合评估将取代前瞻性临床测序中的多重靶向诊断试验59.


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297