您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2021
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

22个睾丸生殖细胞肿瘤易感位点的鉴定

 二维码
发表时间:2021-07-29 10:03作者:武汉新启迪Xinqidibio

摘要

睾丸生殖细胞肿瘤(TGCT)是年轻白人男性中最常见的肿瘤,具有较高的遗传力。在这项研究中,国际睾丸癌联合会分别召集了10,156人和179,683人进行全基因组联合研究。这一Meta分析确定了22个TGCT易感位点,使其总数达到78个,占疾病遗传力的44%。95年度多基因风险评分(PRS)的男性TH与得分中位数的男性相比,百分位数增加了6.8倍的TGCT风险。在具有独立TGCT危险因素(如隐睾症)的男性中,PRS可以指导筛查决策,目的是减少导致幸存者长期发病率的治疗相关并发症。这些发现强调了促进TGCT易感性的两个已知途径的相互联系性质:雄性生殖细胞在其体细胞生态位内的发育以及染色体分裂和结构的调节,并涉及另一种生物途径--mRNA翻译。

导言

TGCT是欧洲裔年轻人中最常见的癌症,在过去的20年中,TGCT的发病率翻了一番。1,2。家族史和隐睾是已知最严重的危险因素。3,4,5,但目前还没有发现可靠的环境风险因素。1。尽管TGCT的遗传力很高,估计为37-49%。6,7, CHEK 2是唯一有致病变异体与tgct风险相关的中度外显基因。8.

相比之下,全基因组关联研究(GWAS)成功地识别了与tgct易感性相关的共同变异。9,10,11,12,13,14,15,16,17,18,19,20,21。大多数风险变体都是由含有编码蛋白质的基因组成的,这些基因涉及到男性生殖细胞发育、染色体分离、性别决定和DNA维持等关键途径。从生物学上讲,这些发现补充了目前对胚胎生殖细胞在子宫内转化为生殖细胞原位瘤(GCNIS)的疾病发病机制的认识,GCNIS是TGCT的常见前体。22,23.

为了进一步了解TGCT的遗传基础,睾丸癌症联合会(TECAC)对10,156名患有TGCT的男性和179,683名没有TGCT的男性进行了大量的Meta分析,这些分析结合了许多现存的TGCT GWAS和Denovo基因分型的汇总数据,这些数据来自有TGCT和没有TGCT的男性。我们鉴定了22个独立的TGCT基因座(P < 5 × 10−8),其中许多基因编码与男性生殖细胞发育、性别决定、染色体分离以及mRNA翻译相关的蛋白质。到目前为止,对所有78个已识别的风险位点的多基因风险评分(PRS)分析显示,与中位数相比,在最前5%的PRS评分中,男性的TGCT风险增加了6.8倍。

结果

我们的元分析包含了我们公布的tgct分析中的估计数。9,来自deCODE遗传学的基因分型数据24和英国生物库25,以及从作为睾丸癌联合会(TECAC)一部分的14项研究中收集的基因型的汇总统计数据(补充表)1, 2;补充方法)。扩大了初步发现,纳入了1039名男性接受TGCT和1398名未接受TGCT的男性进行定向基因分型的结果(补充表)3, 4).

TGCT图元分析

我们最后的Meta分析确定了22个独立易感位点为tgct(P < 5 × 10−8)(表)1、图1.1,补充图。1),包括先前确定的遗传区域的四个独立信号(补充表)5;补充图。2)和先前忽略的X染色体上的四个位点(补充数据)1)。Q-Q图(附图)3)和估计的基因组膨胀系数(λ建议最低限度的系统性偏见。只有三个信号(rs 9987332、rs 8104804和rs 4898474)表现出效应异质性(I)。2>50)。已鉴定的56个tgct易感位点中有44个9,10,11,12,13,14,15,16,17,18,19,20,21复制于P≤5×10−8(补充数据)2;补充数据3)。不复制所有已知基因座的可能原因包括:潜在群体亚结构的差异、对遗传效应大小的预先高估、效应大小的异质性和低的r。2目前和先前公布的地点之间的联系(补充数据)3)。观察到多个独立的信号BAK 1 (2), TKTL 1 (2), TERT (3), DMRT 1(4)及19p11-p12(6)区(表)1;补充数据2),包含多个KRAB-锌指蛋白的复杂区域(补充图)。4)。66个新的和复制的TGCT独立位点与其他癌症GWAS中的易感位点之间存在极小的重叠(补充数据)。4)。只有4个(6%)位点与另一种癌症类型的风险相关,每个位点的作用方向一致:BCL2L11(rs 6708784-rs 1439287,r2=0.93)慢性淋巴细胞白血病,TERT(Rs 2735940)伴结直肠癌,热ATR 3(rs 2160570-rs10852606,r2=0.99)与胶质母细胞瘤HNF1B(rs 11263762-rs 12601991,r2=1.00)与癌症(多异性)。

表1新的独立TGCT易感位点汇总信息。
图1:与TGCT风险相关的曼哈顿标记图。
figure1

当前元分析中识别的新标记被显示为蓝色方格( )与表第1栏对应的小写字母1。在先前的研究中发现的超过全基因组意义的易感标记(P≤1×10−8)在当前的元分析中,以绿色圆圈表示( )与补充数据第1栏对应的数字2。在先前的研究中发现的易感性标记未能达到基因组的广泛意义(P>1×10)。−8)在当前的元分析中,显示为红色钻石( )与补充数据第1栏对应的数字2. a标记是根据整个范围绘制的。y-包含rs 4474514 at的轴KITLG (P=1.42×10−154). b标记是根据部分范围绘制的。y-轴心上限为P=1.42×10−40以便更好地对大多数关联进行可视化和区分。

按组织学、家族史或隐睾进行的分层分析(补充表)6)没有确定分组的联系。所有22个易感信号在欧洲和非洲血统男性的小等位基因频率上均有显着性差异(补充表)。7)可能解释了在TGCT风险中观察到的一些种族差异。22个已鉴定位点解释了父子遗传力的7.0%和兄弟姐妹间遗传力的4.7%,使总的遗传力估计值分别提高到44.0%和29.1%。

为了为TGCT生成一个多基因风险评分(PRS),我们对所有78个已鉴定的TGCT易感标记进行了建模,包括那些在目前的研究中确实和没有达到全基因组意义的标记。我们发现,与得分中位数的男性相比,第95百分位组的男性患疾病的风险增加了6.8倍(3.4%的终生风险)。2)。该模型对男性的TGCT识别准确率为78.1%。

图2:多基因危险评分与TGCT状态的关系。
figure2

独立样本的多基因风险评分(PRS)n=5602名患有TGCT的男性和5006名无疾病的男性,他们采用了22个新的和56个先前确定的标记和Meta分析的影响大小估计模型。优势比是相对于中位风险,由45-55百分位数的患者组成。前95百分位数的男性增加6.8倍(优势比(OR)=6.75,95%置信区间(CI)4.92-9.26;P=2.84×10−32与45-55百分位数的男性相比,TGCT的风险更高。虚线指示OR=1;错误条代表95%CI。

评估可信风险变量(CRV)

我们将可信风险变量(CRV)定义为强LD(R)中的SNP。2≥0.8)与66种新的或复制的信号中的任何一种来确定在4755台CRV中是否有潜在的功能变异影响目标基因的功能或表达(补充表)8和补充数据5)。在常染色体和X染色体上由CRV划分的区域共有108个独特的基因。大多数GWAS都暗示非编码变异是通过基因调控(如增强子、启动子)来实现的,但编码变异也可能影响靶基因功能。73个(1.5%)CRV位于编码区;34个(0.7%)为同义,39个(0.8%)为错义变体(补充数据)。6)。没有人被预测为致病性的使用狂欢和VEST 4。26,27。7台(0.1%)CRV在剪接处标注,但只有一台(Rs 1060604)在PMF 1会影响剪接28。这些结果与其他GWAS的结果一致,并支持大多数易感功能变异影响靶基因的调控,而不是直接改变基因功能。

与TGCT相关的常染色体基因推断

为了识别常染色体上高度和中等可能的目标基因,我们评估了由4484个CRV划分的对应于61个顶级信号的基因区域(补充数据)。5)。评价的靶基因总数为108个,对应于101个独特基因。如下文所述,我们评估了(一)该区域的基因数目,(二)最相关信号的位置,(三)共定位eQTL分析的结果。29,(Iv)基因在胎儿生殖细胞中的表达30,以及(V)TGCT细胞系NT2-D1(NTERA 2)启动子捕获-C分析的结果。31,32结合ATAC-seq的数据进行评估(图)。3)。每个区域的基因数目从1到8个不等。对于46个信号(75%),基因区域仅包含一个或两个基因;对于6个(10%)信号,基因区域不包含任何基因(补充数据)。5)。上端信号中有43条(70%)位于外显子、内含子或起始点10 KB以内(补充数据)。5)。共定位分析发现,至少两个(非睾丸)组织中有23个(21%)基因的eQTL,以及4个(4%)基因的eQTL(补充数据)。5, 7).

图3:基因和功能变异推理的流程图。
figure3

通过评估GWAS结果(蓝色)和外部数据源(包括eQTL和启动子捕获-C分析)和胎儿睾丸基因表达的信息,确定了高度和中度可能的靶基因。为了探索潜在的功能变量,在PAINTOR(Green)中对所有可信的风险变量进行了经验Bayes建模,并从多个公开的和本地派生的数据源中进行了注释。

第2型TGCT起源于胎儿原始生殖细胞或性腺细胞,然后从无创前体细胞GCNIS中发育。22。在缺乏GCNIS的RNA测序数据的情况下,我们使用了Li等人的单细胞RNA测序数据。30评价不同时间点胎儿性腺表达的候选基因。我们包括男性和女性生殖细胞和Soma,以全面了解可能影响TGCT发育的基因的潜在表达情况。转录水平为低表达(≤698)的33个(31%)基因,中等表达(699-2348)的37个(34%)基因,高表达(≥2349)的38个(35%)基因根据表达值(补充图)。5;补充数据5)。我们对4株TGCT细胞进行了转座酶-可接近染色质分析(ATAC-seq)(补充数据)。8,可在Https://genome.ucsc.edu/s/jpluta/TECAC2020)。CRV在所有细胞系的开放染色质区显著富集(EP2102,P=0.0015;NT2-D1[NTERA 2],P=2.63×10−10;NCCIT,P=4.37×10−8;TCAM 2,P=1.04×10−14),与基因调控的潜在效应一致。我们进一步评估了ATAC-seq中的一个细胞系NT2-D1的启动子捕获-C数据,以确定目标基因的启动子区域是否与位于开放染色质区的CRV有联系。17个(16%)基因显示了这些联系(补充数据)5)。在两个或多个细胞系中出现的连接比仅在一个细胞系中发现的连接得分更高。根据对常染色体上潜在目标基因的评估,我们将37个(37%)基因分类为高概率基因,25个(25%)基因为中等可能性,39个(39%)不可能与tgct相关;具有多重分类水平的基因被计算在最高似然组(表)。1,补充数据2, 5).

与TGCT相关的性染色体基因推断

在X染色体上,我们评估了271个CRV与5个顶部信号相对应的基因区域(补充表)。8)。被询问的唯一目标基因总数为7个。由于缺乏X染色体基因的eQTL数据,而且缺少一个靶基因在胎儿性腺中的表达数据,因此无法建立一个等价的模式来评价X染色体上的候选靶基因。尽管如此,根据我们简化的评估方案,一个(14%)基因被评为高概率,两个(29%)基因中等可能与tgct相关(表)。1;补充表8)。然而,如果有了eQTL和表达数据,不太可能与TGCT相关的4个(57%)基因可以被分为高度或中等可能性(同样,这两个中等可能的基因也可以被高度标记);因此,我们认为所有基因都是可能的目标基因(补充表)。8).

睾丸特异性基因富集

选择用于富集分析的基因包括目标基因(n=62)在常染色体上,得分中等或高度可能与TGCT和所有目标基因(n=7)在X染色体上,其中两个基因没有可用的表达数据。睾丸特异性表达增强(P在这个基因组中,有三个基因在睾丸中的表达量至少是所有其他组织的5倍(补充图)。6)。其他三个基因在睾丸中的表达增强,在睾丸中的表达增加了5倍或更高,与所有其他组织的平均水平相比,差异有显着性(P<0.05)。

变异体的PAINTOR分析功能评价

我们还探索了由PAINTOR确定的潜在功能变异,这是一种结合遗传关联、连锁不平衡和丰富的基因组特征的Baysian方法(见图)。3)33。我们用36个与tgct相关的数据对4755个crv进行了注释,包括来自tgt细胞系的公开数据和本地生成的数据(组蛋白标记、开放染色质标记、转录因子结合位点、甲基化)、成年睾丸(组蛋白标记、开放染色质标记、转录因子结合位点、甲基化、转录起始位点)、胚胎睾丸(开放染色质标记)和胎儿睾丸(开放染色质标记)(补充表)。9;补充图。7)。PAINTOR分析优先考虑100个变异体的潜在功能,其中大多数有较高的后验概率(≥95%);4个变体(4%)后验概率在90%到95%之间,只有一个(1%)下降到90%以下。34(补充数据)9)。66个顶级信号中有57个(86%)有潜在的功能变异。两个顶部信号,rs 55873183 inDMRT 1和rs 17336718TKTL 1,只包含一个CRV,因此不能由PAINTOR进行评估。PAINTOR分析发现的变异多为内含子(67%),其中1个为外显子,其余20%位于目标基因起始点10 kb以内。在102个变异体中,83(81%)破坏了转录因子结合位点。

讨论

我们的Meta分析使TGCT易感位点的数量增加了三分之一.在第95个百分位的减贫战略中,男性有6.8倍的疾病风险比男性在中位减贫战略(图一)。2);而这些男性的终生风险为3.4%,而普通人群的这一比例为0.4%。2。与大多数其他常见癌症相比,TGCT的PRS包含较少的SNP,但效果更大。例如,在乳腺癌减贫战略第95百分位数(313个SNPs)中,妇女的疾病风险比中位减贫战略的妇女高出2.4倍。35。从TGCT易感位点得到的PRS结果表明,可以识别出患病风险最高的男性。

从我们的Meta分析中,对顶级关联信号的评估确定了65个目标基因,这些基因被评估为中度或高度可能与TGCT相关。其中许多基因编码的蛋白质属于与tgct易感性相关的生物途径,包括那些影响雄性生殖细胞规格和迁移、性别决定和成熟以及调节有丝分裂细胞(hsa-69618,ddr 8.5×10)的蛋白质。−5;图1.4)。对于多个靶基因,小鼠模型的发现支持它们在TGCT或TGCT相关表型的发展中的直接作用。

图4:蛋白质在生殖细胞发育和染色体分离途径中的相互作用。
figure4

利用String(String-db.org)建立了一个蛋白质-蛋白质相互作用网络,用于生殖细胞发育和染色体分离途径。由与TGCT易感性相关的基因编码的蛋白质被显示在这些通路上,而谱线权重则表示这两种蛋白质之间相互作用的置信度。*GATA 4,一个先前确定的tgt易感位点,在我们目前的研究中没有达到基因组范围的统计意义。**PCNT被鉴定为低似然靶基因。

钢轨迹上的缺失变体(SL)小鼠129/Sv背景与TGCT发病率增高有关,其致病基因已被证实为基尔36,37. KITLGRs4474514是我们的Meta分析中最有统计学意义的信号,每等位基因的优势比超过2.0。顶部关联信号所涉及的多个其他靶基因影响小鼠雄性生殖细胞的发育。PRDM 14对于从体细胞中提取原始生殖细胞、参与潜在多能性的再获取和成功的表观遗传学重新编程至关重要。38。12q13.2上确定的区域包含两个候选目标基因,SP1AMHR 2(补充图。1N)。SP1是一种转录因子,调节细胞过程,包括抑制小鼠胚胎干细胞的分化。39。EQTL分析表明,这种潜在的功能变异与SP1的上调有关,因此通过保持胎儿生殖细胞相对去分化状态,同样有利于发育停滞。AMHR 2是抗马尔勒激素(Amh)的受体,除了睾酮(因此也参与AR)外,还会导致男性的性别分化,阻止苗勒管进入子宫和输卵管。40。在日本的米鱼(Medaka)中,击倒了Amrh 2与性别逆转和生殖细胞过度增殖有关41.

虽然我们没有定义艾尔由于缺乏可用于eQTL分析或评估胎儿睾丸基因表达的现有数据,Xq 12基因作为一个中等或高度可能的靶基因,表明艾尔可能与TGCT的病因有关。扰乱艾尔会导致雄激素不敏感综合症和部分性反转,这取决于中断的程度。42。此外,高连锁不平衡(R)2=1)存在于艾尔与男性型秃顶减少有关的位点和变异43(补充数据)4),这是以前与TGCT风险相关的一种表型。44。免疫组织化学检测还发现在40-50%的精原细胞瘤和gcis中存在AR蛋白。45。进一步评估这一基因是有必要的,其结果可能进一步支持长期持有的假设,即雄激素相对于总体人群的相对减少会导致tgct的风险。46.

我们发现了第四个独立易感等位基因DMRT 1,它在雄性体细胞生态位的性别决定和维持中起着至关重要的作用。47。表达DMRT 1在睾丸组织中富集。损失DMRT 1小鼠129/Sv背景导致睾丸畸胎瘤的发生率超过90%,原因是缺乏沉默多能调节因子的能力。48,49。击倒达兹勒是精子发生所必需的主转录调节因子,可能是由于多能基因的长时间表达而导致的自发性性腺畸胎瘤。50,51。表达达兹勒也在睾丸组织中富集。

BAK 1BCL2L11都是bcl-2家族的成员,他们一起紧密地调节线粒体的凋亡反应,通过细胞间的刺激来促进或防止细胞死亡。52。巴克(BAK 1)是线粒体外膜通透性的促凋亡效应,它允许细胞色素C和其他凋亡因子的释放,导致细胞死亡。53。BIM(BCL2L11)是一种促凋亡的bh3蛋白,能激活bak,但能优先激活促凋亡效应bax。54,55。有趣的是,在小鼠模型中,Bim和Bik协同启动早期生殖细胞凋亡,其生物学途径似乎需要bax,而不是bak。56。Bax还控制胎儿生殖细胞在迁移过程中的凋亡,在bax缺失小鼠中观察到保留原始标记的异位生殖细胞。57,58。再加上60%的NestinCREBaxFl/fl巴克−/−小鼠睾丸内发生高级别肿瘤,其表达谱与生殖细胞肿瘤一致。59。我们的eQTL分析表明BCL2L11被下调,这意味着被捕获的生殖细胞的不正确存活及其向GCNIS前的转化。

我们还鉴定了多个编码蛋白的靶基因,这些基因涉及染色体分离和异染色质组织。这些基因的遗传改变可能导致TGCT的独特特征,它是癌症中非整倍体评分最高的癌症之一,其特征是几乎通用的12p同工染色体或扩增和频繁的基因组加倍。60,61. PPP2R5A,Ser/Thr磷酸酶在运动杂务中富集,并调节染色体-纺锤体相互作用。62,是一个有牵连的目标基因。类似于艾尔, CENPI由于缺乏X染色体的可用数据,无法将其定义为顶级目标基因;但Xq22.1的顶级信号表明CENPI,它是一种着丝粒蛋白,也是核小体相关复合体的一部分,负责染色体的排列、分离和有丝分裂进程,对配子发生具有重要意义。63,64,可能在TGCT风险中起一定作用。在9q34.3处,29.5 kb的单倍型片段(Rs28393706)含有两个具有重叠启动子区域的有效基因。ANAPC 2,一种E3连接酶,作为后期促进复合体(Asc)的一部分,促进中期-后期转换,以及SSNA 1(SS核自身抗原1),一种调节痉挛素微管断裂活性的中心体蛋白。65,66。6个相关基因(PMF 1, PPP2R5A, ANAPC 2, SSNA 1, TEX 14,和MCM3AP)有一个与下调有关的eQTL,与染色体分离的更允许的表型一致;TEX 14在睾丸组织中富集。此外,染色体分离途径中的多个TGCT牵连蛋白与TGCT相关的雄性生殖细胞发育蛋白相互作用,显示了TGCT易感性的生物学网络(图1)。4).

通过对中、高级靶基因的路径分析,发现有几个编码mRNA翻译过程中相互作用的蛋白质,其中包括一个核糖体蛋白(RPL 4翻译终止蛋白eRF3A(GSTP 1)和转座子相关蛋白亚基γ(TRAP-γ,编码为SSR 3),它是参与蛋白质共翻译转运到内质网的一般核糖体相互作用体。67。最后,多个dna结合转录因子与tgct易感性有关,包括HNF1B, PITX 1, PKNOX 2, PRDM 14, SP1,Tfcp2l1, ZFPM 1, ZNF 64,和ZNF 217。有几种锌指蛋白(Znf)(包括krab-znf)对生殖细胞的发育至关重要,例如雄性原始生殖细胞的规格和表观遗传重编程。68.

我们的研究结果进一步了解了TGCT的遗传结构,提高了对男性生殖细胞发育生物学的理解,并突出了对TGCT重要的生物学途径,这些途径在其他癌症中没有发现。我们的发现涉及到潜在的重要途径,包括对BAK1-BCL2L11轴以外的细胞凋亡的调控(AIFM 3, CLPTM1L),酶功能(MPV17L,TKTL 1,和UCK 2)和一些与肌动蛋白、细胞骨架和微管组织有关的基因(细胞因子1, ENOSF 1, TNXB,和ARL14EP)。后者可能会导致生殖细胞迁移或染色体分离的错误,可能会增强指导生殖细胞-体细胞生态位相互作用的基因在早期发育过程中的失调。KITL,DMRT 1).

我们的Meta分析已经确定了66个经验证的TGCT易感位点.这些基因座中有许多比在成人上皮癌中观察到的基因座具有更强的效应大小,从而导致高比例的TGCT解释遗传力。许多TGCT危险等位基因在欧洲男性中的频率高于非洲遗传祖先,这与这些群体之间已知的疾病发病率差异是一致的。重要的是,我们已经制定了一项减贫战略,以确定患病风险最高的男子。这种TGCTPRS可应用于具有其他危险因素的男性,如隐睾症或不孕症,可作为早期发现和缓解疾病的目标。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297