肿瘤结构可以决定进化的模式。 为了检验不同的肿瘤结构是否足以改变肿瘤的进化模式,我们考虑了四个特定模型,它们具有不同的空间结构和细胞扩散方式,但进化参数相同(驱动突变率和驱动适应度效应的分布)。我们设定了每个细胞分裂的扩散概率,使得所有肿瘤从一个细胞增长到100万个细胞所需的时间相似,相当于几年的实时时间。
我们的第一个例子是一个非空间模型,它被认为适合于白血病。 21 ,22 一种肿瘤类型,在这种肿瘤类型中,半固态骨髓中的突变干细胞会产生癌细胞,在血液中混合并增殖(如图所示)。 1A )。在不受空间限制的情况下模拟肿瘤生长时,驱动突变可导致快速克隆扩增,使细胞分裂率只增加几个百分点,而绝大多数细胞最终共享同一组驱动突变(图1)。2A-d )。这些特征让人想起慢性髓系白血病,在这种白血病中,细胞的增殖是由基因组的一次改变驱动的。 23 ,以及急性髓系白血病,其驱动因素相对较少。 24 .
图2:我们的模型预测的四种肿瘤演化模式。 a ,克隆多样性的动态(反向Simpson指数)D )一个非空间模型的随机模拟。黑色曲线对应于后续面板中的单个模拟(值为D 以及驱动程序的平均突变数 n 最接近100个复制集的中间值)。 b 、克隆动力学随时间变化的Muller图,根据非空间模型对一个模拟肿瘤进行模拟。颜色代表有不同的驱动突变组合的克隆(最初的克隆是灰色-棕色的;后续的克隆是用26种颜色的循环调色板着色的)。后代的克隆是从他们的父母内部显现出来的。 c ,最后克隆比例。 d 、驱动系统发育树。节点大小对应于最后时刻的克隆种群大小,创建克隆体为红色。只显示其后代至少占最终种群1%的克隆。 e –h ,一种通过腺体分裂生长的肿瘤模型的结果(每腺8192个细胞)。在空间地块( g ),每个像素对应于一小块细胞,对应于肿瘤腺体,根据斑块内最丰富的克隆着色。 i –l 肿瘤细胞在相邻腺体间扩散并侵入正常组织(每个腺体512个细胞)的结果。 m –p ,非腺体肿瘤边界生长模型的结果。在所有情况下,驱动程序突变率为10。 −5 每个细胞分裂,司机适应度效应是从指数分布,平均0.1。其他参数值列在补充表中4 .
在我们的第二个模型中,符合大肠腺瘤的生物学特性。 25 与以往的结直肠癌计算模型相同 5 ,26 ,27 ,我们模拟了一个由大腺体组成的肿瘤(如图所示)。 1B )并通过腺体分裂(分叉)生长。虽然驱动突变率和适应度效应与前一种情况完全相同,但空间结构的加入极大地改变了肿瘤的进化模式。细胞进入腺体的组织限制了驱动突变在人群中传播的程度,因此随着肿瘤的扩大,选择性的清除会逐渐本地化。对于我们的参数值,这一过程导致高度分枝,扇形的司机系统发育树和更大的空间多样性,不同的组合驱动突变主导甚至在邻近的腺体(图一)。2e-h )。肿瘤细胞的平均适应度大幅度增加,但在细胞适应度值和乘客突变计数方面也存在广泛的、正相关的肿瘤内变异(扩展数据图)。 1A-b )。即使细胞能够获得直接增加腺体分裂率的驱动因素,模型的结果也是相似的,因为这种突变很少在腺体内传播(扩展数据图)。 2A ).
第三个病例对应的是一个腺体肿瘤,它通过侵袭邻近的正常组织而生长,这在各种类型的实体肿瘤中都有记录,包括许多结直肠癌、乳腺癌和肺癌。 19 ,28 。腺体肿瘤被细分为局部细胞群落(如图所示)。1C ),其较小的大小以前已被社区检测方法推断。 29 以及数学建模。 30 为了获得对四种癌症类型腺体大小的额外估计,我们使用了组织学幻灯片的半自动分析(扩展数据图)。 3 发现每个腺体包含几百到几千个细胞(扩展数据图)。 4A )。在这个范围内的腺体大小的模拟中,我们发现即使是细胞适应度的微小增加也会引发快速的克隆扩张。尽管如此,克隆性干扰还是抑制了选择性扫描,导致了一个区域性肿瘤,其中大区域有相同的驱动器突变组合(图一)。 2I-l 以及扩展数据图。 1C,d )。模拟侵袭性腺体肿瘤通常表现为驱动因素多样性的逐步增加,以及几个长分支的系统发育,与许多癌症类型的观察结果在质量上一致。2 ,3 ,11 。限制细胞扩散到肿瘤边界,而不扩散到肿瘤体积内(以模拟缺乏瘤内萌芽的肿瘤) 28 或肿瘤,其中增殖仅限于边界 31 )导致分支较短(扩展数据图)。 2B ).
我们的第四个也是最后一个模型代表了一个没有腺体结构且生长受限于其边界的肿瘤(如图所示)。 1D )。膨胀性肿瘤的生长伴随着明确的边界和没有积极迁移的迹象发生在组织中,这些组织的物理阻力相对较弱。 18 。边界生长模型特别适合于模拟某些类型的肝细胞癌的演化。 7 ,32 值得注意的是,肝细胞癌在总体上表现出广泛的生长模式。 33 。边界生长模型的空间结构倾向于遗传漂移,而不是选择。对于我们的固定参数值,在这种情况下肿瘤的演化几乎是中性的。 2M-p 以及扩展数据图。 1E ),只有在人口膨胀的浪潮中,突变才能传播。 34 ,35 ,36 。因此,突变负担通常会从肿瘤核心增加到其边界(扩展数据图)。 1F )。当细胞能够在肿瘤体积内与其最近的邻居竞争时,选择就会稍微突出一些(扩展的数据图)。 2C )。边界生长模型中选择的抑制与肝癌有效中性演化的证据一致。 7 ,以及大的、高分化的良性肿瘤如平滑肌瘤的存在。 37 纤维腺瘤 38 很少进展为恶性肿瘤。
进化模式的表征及与数据的比较 总之,我们的模型表明,细胞与细胞相互作用范围的变化和单独细胞扩散的方式可以产生不同的肿瘤演化模式。接下来,我们试图更精确地描述这些模式,从我们的模拟和真实的癌症基因组数据中可以计算出这些模式的进化指数(见图)。 3A )。我们考虑的第一个指标是克隆多样性。D ),它随着驱动进化树中大节点的数目而增长(如图中最后一列所示)。 2 )。第二指数 n 每个细胞的平均驱动突变数,它代表驱动进化树的平均深度。这两个指数的任何一对值都对应于一组不同的系统发育树。这些树的节点代表无性系,其大小与克隆种群的大小成正比。可达到的空间 n 和 D 价值(图1. 3B )在线下面有界。 D =1及以上的曲线 D =1/(2−) n )2 (见方法)。靠近上边界的位置对应的高度分枝树比接近下边界的位置对应更多,而左边的位置对应于分支比右边的树更短的树。
图3:使用摘要指数来描述肿瘤演化的模式。 a 、生物学参数、总指数和肿瘤演化方式之间的因果关系。肿瘤结构、细胞扩散类型等参数形成了随机演化过程,形成了进化模式。我们用进化指数来描述这些模式。 b ,克隆多样性之间的关系D ,每个细胞的平均驱动突变 n ,以及树的拓扑结构。在未遮荫区域内的每个位置对应于系统发育树的一个不同的子集。下界(克隆多样性=1)对应于只有一个节点的大小大于零的线性树(即种群只包含一个现存的克隆)。下界附近的粉红色曲线序列通过顺序的选择性扫描来跟踪种群的轨迹,因此在任何给定时间,最多有两个节点的大小大于零。左边阴影区域的边界对应于星形树。不可能为阴影区域内的位置建造树木。每棵树的主树枝数通常沿两个边界之间逆时针方向的曲线增加(黑色箭头)。实心黑圈显示来自肾癌(代码后缀K)、肺癌(C)和乳腺癌(P)的多区域测序数据的进化指数。中空黑圈显示从间皮瘤(M)的多区域测序数据和乳腺癌(TN)和葡萄膜黑色素瘤(U)的单细胞测序数据中得出的进化指数。紫色方块显示从AML(代码后缀A)的单细胞测序数据导出的进化指数.淡蓝色曲线对应于特定的中间分支度(方法和方法)。补充资料 )。患者代码与原始出版物中的代码匹配,但以下模式缩写的除外:A02,AML-02-001;c29,CRUK0029;P 694,PD 9694;M01,MED 001;U59,UMM 059。 c 、不同空间结构、不同单元扩散方式、相同驱动突变率和相同驱动突变效应的四个实例模型的度量(每个模型随机模拟100次)。这四个模型的中性对应方被表示为一个额外的组。黑色曲线将四种根据指数定义的肿瘤演化模式分离开来。 n 和 D (另见表 1 )。区域‘E’对应于有效的几乎中性模式。 d 、平均0.2指数分布、不同腺体大小和突变率的具有驾驶员适应度效应的侵袭性腺体模型的进化指标。 e 、侵袭性腺体模型的进化指标,调整后模拟不完全测序灵敏度(从模型输出中去除频率低于5%的驱动突变)。实心黑圈 d 和 e 是否与 b 。中的参数值,但指定的除外。 c , d 和 e 和图中的一样。 2 .
为了将我们的模型结果与数据进行比较,我们确定了先前从四种实体癌类型的多区域测序中推断的系统发育树的进化指数:透明细胞肾细胞癌(Ccrcc)。 9 ,非小细胞肺癌(NSCLC) 10 、乳腺癌 39 间皮瘤 40 。我们还从乳腺癌的单细胞测序数据中计算了各项指标。 41 葡萄膜黑色素瘤 42 。尽管方法上的多样性,这六项研究得出了非常相似的进化指数。大多数数据点(35中的28)位于对应于顺序选择性扫描的轨迹之上(图中的粉红色曲线)。3B 在参考曲线下面,表示中间的分支(图中的淡蓝色曲线)。 3B 和 补充资料 )。所有肿瘤1< D < 12 and 3≤n < 14. Notwithstanding limitations of sampling, sequencing and phylogenetic inference methods, a useful computational model of invasive tumour evolution should generate summary indices that are consistent with these data points, corresponding to branching evolution with a small number of main branches.
前面讨论的四个模型的模拟结果在汇总指数方面形成了四个不同的聚类。 n 和 D (无花果) 3C 平均轮廓宽度0.60)。这四种模型的中性对应物--它们的参数值相同,只是在边界增长模型附近,驾驶员适应度效应降低到零聚类。如我们所料,我们发现实体肿瘤的进化指标与我们的侵袭性腺体模型的结果是一致的,并且这种一致性对可能范围内的腺体大小、驱动变异率和驱动突变效应都具有鲁棒性(扩展数据图)。 5 )。特别是当平均驾驶员适应度效应为0.2时,未经调整的模型输出与数据之间会发生密切的一致性(如图所示)。 三维空间 ).
在上述比较中,一个重要的注意事项是,未经调整的模型输出包括所有驱动程序的突变,频率降至百万分之一,而固体肿瘤测序方案无法检测到频率低于5%的大多数突变。 9 。这种敏感性的差异意味着 D 根据数据计算的数值预计会低估肿瘤的真实多样性。因此,可以通过去除模型输出中的罕见突变来进行更公平的比较,以模拟不完美的灵敏度。这种调整加强了模型和数据之间的一致性(如图所示)。3E 以及扩展数据图。 6 ).
由于非空间模型最有可能代表液体肿瘤的演化,我们将其预测结果与急性髓系白血病的额外数据进行了比较。 24 。我们发现了模型和这个数据集之间的稳健对应(图)。 3B,c 和补充图。 1 )。在可信的参数范围内,83%的使用非空间模型模拟的肿瘤具有坐标( n , D )与选择性扫描进化模式一致。
具有不同空间结构的替代模型与固体和液体肿瘤的数据不太一致。对于腺体分裂模型,83%的模拟肿瘤在中间分支曲线上有坐标,对应于 D 相对于 n (补充图。 2 )。对于边界增长模型,两者都是 n 和 D 通常接近1(附图)。 3 )。这些结果汇总在表中。 1 ,它从进化指数的角度给出了进化模式的定量定义(另见图)。 3F 和补充表 1 ).
结果对于侵袭性腺体模型的一个变体,即正常细胞缺失,肿瘤生长为空腔,也与数据不一致(补充图)。 4 )。在这个空腔模型中,肿瘤扩展的速度(通过细胞扩散进入空空间)通常超过克隆在肿瘤内传播的速度(通过细胞扩散到完全被占据的腺体),从而导致更多的星状或高度分枝的系统发育(高)。 D 相对于 n )。相反,当肿瘤细胞必须在肿瘤边界与正常细胞竞争时(如图3所示)。 2 ),驱动突变在肿瘤内传播的速度与肿瘤生长的速度相似,这使得某些驱动突变能够达到高频率,并导致更稀疏的分支(扩展数据图)。 5 )。还有另一种模式,包括正常细胞,但限制细胞扩散到肿瘤边界,阻止驱动突变的扩散,并产生类似的结果。 D 但更小 n 价值(附图) 5 ).
肿瘤进化模式的进一步分析 一种描述肿瘤进化模式的补充方法是系统发育树的形状或平衡。由于为描述生物进化而开发的树平衡指数不适合肿瘤数据,所以我们开发了一个指数。 43 这对抽样和排序协议(方法)的变化具有很强的鲁棒性。这个指数 J 1 对于分叉事件倾向于将树分割成大小相似的子树的树具有较高的值。低值分配给近似线性或由单个节点主导的树。
就像指数一样 n 和 D ,我们的侵袭性腺体肿瘤模型预测的树平衡值与从测序数据中得到的值是一致的(图)。 4A )。典型 J 1 该模型和数据的值都在0到0.5之间--大大低于与完全平衡树对应的1的最大值。当我们通过删除罕见的驱动程序突变来调整模型输出时,一致性保持不变(扩展数据图)。 6 ,这构成了一个更公平的比较),即使相关的树看起来非常不同(扩展数据图)。 7 )并具有不同的度分布(扩展数据图)。 8 )。模型和数据之间的一致性也观察到替代平衡指数后,去除罕见的突变(补充图)。 6 , 7 和 8 )。相反,不考虑腺体结构的中性模型和模型预测的树平衡值比固体肿瘤的数据更小或更多(如图所示)。 4A )。非空间模型的树平衡值与急性髓系白血病的数据是一致的。 4A ).
图4:描述肿瘤演化模式的替代汇总指数。 给出了不同空间结构、不同细胞扩散方式、相同驱动突变率和相同驱动突变效应的四种模型的指标值(每个模型随机模拟100次)。这四个模型的中性对应方被表示为一个额外的组。 a ,树平衡 J 1 相对于每个细胞的平均驱动突变数 n 。实心黑圈显示从多区域测序数据导出的进化指数。固体紫平方显示的数值从单细胞测序数据为急性髓系白血病。空心有色圆是四种模型及其中性对应的预测,不包括频率低于1%的突变。不可能为阴影区域内的位置建造树木。 b ,克隆多样性D 相对于平均克隆周转率 过线{Theta}} . c ,克隆多样性D 相对于平均克隆周转时间 (超线{T}}) 。将平均克隆周转率指数和平均克隆周转率时间转化为平均簇宽,便于小区间的比较。在……里面 c ,低 x -轴值表明,大多数克隆更替发生在肿瘤生长后期。
鉴于 n , D 和 J 1 仅由最终肿瘤状态决定,其他指标可根据时间序列数据确定。例如,平均克隆周转量。 过线{Theta}} 提供了一种替代 n 用于衡量进化变化的程度和平均克隆周转时间。 (超线{T}}) 指示进化变化是在肿瘤生长的早期还是晚期发生(方法)。如预期的那样,经过适当的轴变换后, D 对决 过线{Theta}} (无花果) 4B )类似于 D 对决 n (无花果) 3C )。绘图 D 相对于转型 (超线{T}}) 揭示了一个有点相似的模式,除了低的模型 过线{Theta}} 表现出高度的随机变化 (超线{T}}) (无花果) 4C )。克隆更替在非空间模型中发生的时间相对较晚,但在整个肿瘤生长过程中发生在腺体分裂模型中。如果有足够的数据,进化模式就可以用捕捉肿瘤进化的不同方面的各种汇总指数来描述和分类(备选多样性指数,见扩展数据图)。9 ).
肿瘤结构对突变频率分布的影响 由于研究人员和临床医生很少能够获得多区域测序数据,或者追踪肿瘤克隆大小随时间变化所需的纵向数据,因此肿瘤的系统发育和进化参数通常是从单个时间点取样的单个活检中检测到的突变频率推断出来的。此外,目前的癌症测序技术既不敏感于检测大多数低频突变,也不足以区分高频突变和克隆突变(100%频率)。因此,就实际目的而言,突变频率分布中最相关的部分是在中频范围内。在这个中间范围内检查分布差异的一种方法是绘制累积突变计数(频率或频率以上的突变数)。 f )与反向突变频率(1/ f )。在中立的非空间模型中,这张图是一条直线(如图所示)。 5A ,蓝点)。由于许多人类癌症的突变频率分布也近似于线性,因此人们认为中性肿瘤的进化是广泛存在的。 12 。偏离这条理论直线已被视为选择的证据。 27 ,44 .
图5:我们的模型预测的突变频率分布。 a –d ,突变频率分布的模拟只有中性突变(蓝色圆)或两者中性和驱动器突变(红色三角形)。累积突变计数是根据反向突变频率(1//)绘制的。 f ),仅限于频率在0.1到0.5之间的突变。每个分布表示来自100个模拟的合并数据。
我们的群体遗传学模型表明,不仅选择肿瘤,而且肿瘤结构对肿瘤突变频率分布也有重要影响(图一)。 5 以及扩展数据图。 10 )。特别是,当将累积变异计数与逆突变频率相对应时,中立型模型的曲线不再是线性的。相反,对于空间模型,平均非中性曲线比平均中性模型曲线更接近直线。这些结果证实并扩展了以前的研究结果。 27 ,35 表明利用突变频率推断实体肿瘤选择的方法,如果不能考虑种群结构的影响,就会得出不正确的结论。因此,对NULL模型的不适当选择可以解释关于人类癌症中性进化的流行的其他矛盾的发现。 13 ,45 .