您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2022
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

遗传性非编码变异影响多发性骨髓瘤风险的功能解剖

 二维码
发表时间:2022-01-17 15:47作者:武汉新启迪Xinqidibio

摘要

成千上万的非编码变异体与人类疾病的风险增加有关,但其因果变异及其作用机制仍不清楚。在一项结合大规模平行报告试验(MPRA)、表达分析(eQTL、meQTL、PCHiC)和染色质可及性分析(CaQTL)的综合研究中,我们研究了1039个与多发性骨髓瘤(MM)相关的变异。我们证明MM易感性是由血浆细胞和B细胞的基因调节变化介导的,并在6个危险位点识别了可能的因果变异。SMARCD3, WAC, ELL 2, CDCA7L, CEP 120,和PREX1)。值得注意的是,其中三个变异体与显著的血浆细胞caQTL共定位,表明在体内的内源性染色体背景下,这些精确的基因组位置存在因果活动。我们的结果提供了一个系统的功能解剖的危险位点的血液系统恶性肿瘤。

导言

全基因组关联研究(GWAS)已经确定了成千上万的与人类疾病和性状相关的序列变异。1然而,我们对基本机制的了解仍然有限。在连锁不平衡(LD)中,每个关联信号通常由几十到数百个变体来表示。这些变体中的绝大部分映射到基因组的非编码区,很可能是通过改变基因的表达而起作用的。2,3,4。然而,对于大多数信号来说,因果变异体、它们的目标基因和靶细胞类型仍不清楚。

多发性骨髓瘤(MM)的定义是不受控制的,克隆生长的浆细胞,通常在骨髓。这是一种常见的血液恶性肿瘤,对遗传易感性有很强的流行病学支持。5。而全基因组关联研究已经确定了24个危险基因座。6,7,8,9,10,11,原因变体仍然很大程度上是未知的。12,13。此外,可以通过常规方法从MM患者中轻易分离出浆细胞,并且存在适合于MM生物学研究的细胞系。因此,MM是一种很有吸引力的破译危险位点功能基础的模型疾病。据我们所知,目前还没有对恶性血液病危险位点进行系统功能解剖的报道。14,15,16,17,18.

本文采用大规模平行报告试验(MPRA)、表达分析(eQTL、meQTL和PCHiC)和染色质可达性定量位点(CaQTL)分析相结合的方法,对1039个与多发性骨髓瘤铅变异体连锁不平衡的变异进行了研究。我们证明MM易感性是由血浆细胞和B细胞的基因调控变化所介导的,并在6个危险位点识别了可能的因果变异。值得注意的是,其中三个变异体与显著的血浆细胞caQTL共定位,在体内的内源性染色体背景下,在这些精确位置上发出了因果活动的信号。我们的结果提供了一个系统的功能解剖的危险位点的血液系统恶性肿瘤。

结果

设计MPRA以筛选MM风险变体

为了识别假定的因果变异,我们首先设计了一个mpra。14,19,20,21筛选高LD中的1039个变体(r2>0.8)与MM铅变异体的转录活性(图1)。1A和补充表1)。针对每个变异体,我们设计了12条120 bp的寡核苷酸序列,这些序列对应于6个基因组背景下的参考等位基因和替代等位基因(双链×三个滑动窗口,变异点分别位于−20、0和+20 bp处)。将序列偶联到一个报告基因上,其开放阅读框的20 bp序列条形码为3‘。转染细胞后,通过测定报告基因相对于DNA的条形码表达来测定每种结构的转录活性。1B)。质粒测序鉴定1.73×106独特的条形码标记12,378(99.2%)的12,468个设计的寡核苷酸(图)。1C)。作为阳性对照,我们包括了RUNX 3变异体rs 188468174,它影响免疫球蛋白(Ig)水平,并显示出荧光素酶的活性在广泛的MM细胞株。22.

图1:筛选试验,以确定MM风险变异的转录活性。
figure1

a曼哈顿地区迄今为止最大的全基因组相关研究,共9974例mm病例和247,556例欧洲血统对照病例的元分析。11。23个指示位点与MM相关P < 5 × 10−8。11q13.3(CCND 1)位点与t(11;14)的风险特别相关[IgH/CCND 1]移位MM56。每个位点的铅变体详见补充表1. b我们使用MPRA来筛选高LD中的变体(r2>0.8)与MM铅变异体的转录活性。针对每个变异体,我们设计了12个120 bp的寡核苷酸序列,代表6个基因组背景下的参考等位基因和替代等位基因(正负DNA链×3个滑动窗口,变异位于中心的−20,0或+20 bp)。将合成的寡核苷酸偶联到一个20 nt随机序列条形码开放阅读框的合成报告基因上。c最终质粒文库的测序鉴定1.73×106条形码映射到12,468个设计的寡核苷酸中的12,378个。直方图显示代表每个寡核苷酸的条形码数(中位数103)。d将该文库转染细胞株后,通过测序方法定量测定报告基因mRNA中的条形码表达量,测定每种结构的转录活性。条形码活动被量化为日志2(1+#RNA)i)/(1+#DNA)i)其中#RNAi和#DNAi条形码的读取计数i归一化为每一千万次读取数。我们在每个细胞系中进行了三个重复的MPRA。图中显示了两个L 363副本之间条形码活动估计值的相关性。

MM易感性的因果细胞类型鉴定

由于报告分析可以显示细胞类型依赖性的活动,MPRA最好是在一个适当的细胞模型中进行。因此,我们进行了计算分析,以确定可能发生MM风险变异的细胞类型。首先,使用atac-seq数据对血细胞群体进行分析。23,我们发现,在基因组区,在血浆细胞和总成熟B-细胞中有可接近染色质的风险变体的富集(补充图)。1)。第二,调查血细胞的表达情况。23,24,25,26,27,28在位于MM危险位点的基因中,我们发现浆细胞和成熟B细胞是最丰富的细胞类型(补充图)。2)。第三,利用CD 138的基因表达谱。+2650例MM患者骨髓中分离的浆细胞12,29,30,31,我们发现顺式-有10个危险等位基因的LD中的eQTL(补充表)2)。额外顺式-在全血中发现eQTL(补充表)3)或在CD 19中+758名随机献血员总成熟B细胞(补充表)4)。第四,由于浆细胞负责产生Ig,我们检测了MM铅变体与血IgA、IgG和IgM水平的关系。22。这揭示了所有三个Ig亚型(二项式测试)24 MM引线变体中的关联信号的丰富程度。P=6.8×10−5对于IgA来说,P=0.02的IgG,P=0.004P值<0.05),以及个别重要的关联(补充图)。3),包括SMARCD3, WAC,和ELL 2关联,这也显示了浆细胞顺式-eQTLs(补充表格)2)。总的来说,这些数据与许多MM风险变异体是一致的,这些变异体通过改变血浆细胞中的基因调节而发挥作用,而其他的数据则可能作用于其他细胞群体,包括B细胞。

影响转录的MM风险变异体的鉴定

通过对血浆细胞的分析,我们在MM细胞株L 363和MOLP 8中进行了MPRA检测。每株细胞被分成三个复制体进行检测(图1)。1D)。根据条形码活动的估计,我们计算了一个日志。2反映相对于参考等位基因的备选基因转录活性的每个变异体的评分,在基因组背景和复制过程中平均。32。L 363与MOLP 8评分呈正相关(图一)。2A),没有表现出链偏倚(图二)。2B另外,对20个所选变异体的进一步验证表明,与荧光素酶数据呈正相关(如图所示)。2C,补充图。4和补充表5)。此外,MPRA评分较高的变异体在原代血浆细胞染色质可及区富集,这与我们选择具有内源性调节活性的变异体一致(图一)。二维空间和补充图。5).

图2:筛选数据的总体分析。
figure2

我们在MM血浆细胞系L 363和MOLP 8中进行了MPRA。a变对数2得分为L 363和MOLP 8屏幕。对于每个变体,日志2反映替代相对于参考等位基因的转录活性。分数是根据所有六个基因组背景下的条形码活动估计值(即跨越两条链和所有三个滑动窗口)和每个细胞系三个复制值计算的。具有强效应的变体(绝对对数)2得分>0.2)在任何屏幕上都用红色表示。皮尔逊r双面P值显示。b计算日志2使用正链得分(x-轴)或负链结构(y-轴)对于相同的变异体,我们没有观察到链的偏差。c作为另一个试验验证步骤,我们对20个变种进行了荧光素酶实验,表明MPRA效应之间存在显著的正相关。x-轴)和荧光素酶效应(y-轴)。d筛选变体的G-chromVAR分析,以L 363对数加权2结果表明,MPRA评分较高的变异体在血浆细胞可接近染色质的基因组区富集,与我们筛选的具有内源性调节活性的变异体一致。e两种细胞系FDR<5%的显着变异数。f显示FDR<5%和强效应的变量数目(绝对对数)2得分>0.2)。

在L 363中,142个变异体显著(FDR<5%),其中33个变异体具有很强的效应(绝对对数)。2得分>0.2)。在MOLP 8中,28例显著,其中21例有较强的疗效(图1)。2E,f和补充数据1)。与MOLP 8相比,L 363的显着变异数较高(L 363为54%,MOLP 8为15%),转染后存活率较高(L 363为90%,MOLP 8为65%)。总共有23个变体在两个屏幕上显着,其中8个显示了一致的浆细胞。顺式-eQTL,使之成为被选择用于后续工作的假定的因果变量(表)1、图1.3,以及补充图。4, 6)。另外15例有不和谐或无浆细胞。顺式-eQTL,或者是由于技术限制(例如,TERC不在我们的eQTL数据中;JARID 2RUNX 3变异体是罕见的,或者是因为这些变异改变了另一种细胞状态下的基因表达(例如,TNFRSF13B主要在开关内存B-细胞中表达。33并且有一个顺式-总成熟B细胞的eQTL;补充表4).

表1显示L 363和MOLP 8细胞FDR<5%,MM危险等位基因下划线。
图3:识别变体的mpra数据。
figure3

表中八个变体的单个MPRA条码活动估计1同时显示了一致的浆细胞顺式-eQTL。数据由等位基因(左参考等位基因;右侧替代基因)、dna链(+或−)和滑动窗口(−20、0或+20 bp处的变异体,代表基因组背景)分组。蓝点表示单个条形码活动的估计值。每个方块的底部、中部和顶部代表第25、50和75百分位数。晶须代表非离群值的最小值和最大值,分别位于从盒子底部和顶部的四分位数范围的1.5倍。括号内的数字如下P双面学生的值t-测试。这八个变体的荧光素酶验证数据显示在补充图中。4。MOLP 8单元的单个条形码活动估计,以及表中其他变体的单个条形码活动估计1,如附图所示。6.

MPRA-功能变异体的功能表征

接下来,我们研究了所选变体的潜在作用机制。Rs 78740585地图SMARCD3(无花果)4A)。在人类身上,SMARCD 1, SMARCD 2,和SMARCD3编码SWI/SNF核小体重构复合物中相互排斥的60 kD亚基34,35,36。任何一种SMARCD亚基变异体的加入都会影响其活性。37。在血泊中,SMARCD3主要在粒细胞和单核细胞中表达,而在浆细胞中的基础表达非常低;相反,这些细胞表现出高表达SMARCD 1SMARCD 2(无花果)5A)。相比之下,MM风险等位基因与SMARCD3血浆细胞(补充表)24)。Rs78740585-A为IRF 4创建了一个绑定站点(如图所示)。5B,c,补充图。7,以及补充数据2),这是MM细胞生存所必需的一种关键的血浆细胞转录因子。38。击倒IRF 4Rs78740585-A荧光素酶活性减弱(图1.5D,e)。此外,通过对三个MM细胞株启动子捕获Hi-C(pchi-C)数据的分析,发现rs 78740585区与rs 78740585区之间存在着染色质的相互作用。SMARCD3启动子(如图所示)4A和补充图。8A)。总的来说,这些数据与rs78740585-A影响异位的数据是一致的。SMARCD3通过在增强子中引入一个新的IRF 4位点在血浆细胞中的表达,从理论上讲,SMARCD 3蛋白的增加可能通过化学计量学竞争导致SWI/SNF复合物中SMARCD 1和SMARCD 2的移位,可能影响SWI/SNF依赖的基因表达。

图4:已鉴定的因果变异体的基因组背景。
figure4

根据我们的功能筛选,我们在6个基因座上识别了8个假定的因果变异(红色和虚线突出)。这个数字显示了他们之间的联系。P价值(图1.1A),用铅SNP表示为三角形,并结合ATAC-seq数据对MM血浆细胞系KMS 11中的血浆细胞(蓝色)和11个ChromHMM状态进行了分析。我们还生成了MM血浆细胞系KMS 11(黄色)、KMS 12(橙色)和MM1S(红色)的pchi-C数据,并利用芝加哥工具鉴定了染色质循环相互作用。与−日志的交互10(芝加哥)P(分数)≥2显示。aSMARCD3我们检测到rs 787404585区域与SMARCD3启动子。bRs 2790444 atWAC,位于pchi-C诱饵区域内的启动子附近。cRs 3777189和rs 3777183-rs3777182ELL 2,其中rs 3777182和rs 3777183仅相距17 bp。我们检测到了rs3777183-rs 3777182区域与启动子之间的染色质循环相互作用。d没有检测到循环交互CDCA7L. ePREX1我们检测到rs 6066832区域与PREX1启动子。f对象没有检测到循环交互。CEP 120协会。垂直线表示不同的位置。坐标是hg 38。

图5:rs 78740585的表征。
figure5

a显示SMARCD血细胞中的基因家族。值得注意的是SMARCD3在浆细胞中通常是非常低的;MM危险等位基因会升高。SMARCD3在此单元格类型中(补充表)2)。颜色标度是原木。2-转换的,以中位数为中心的rna-seq数据23. bMotif分析预测SMARCD3高表达rs78740585-A等位基因为IRF 4建立了一个结合位点.箭头表示更改的识别基。c电迁移率移法显示IRF 4与rs78740585A探针选择性结合。箭头表示向IRF 4方向的抗体超移。dSiRNA-敲除IRF 4使L 363细胞中rs78740585-A的荧光素酶活性降低,而rs78740585-G的活性下降。这个y-轴指示日志2Rs78740585A的荧光素酶/肾信号与rs78740585G结构的比值。每个方块的底部、中部和顶部代表第25、50和75百分位数。晶须代表非离群值的最小值和最大值,分别位于从盒子底部和顶部的四分位数范围的1.5倍。这个P价值是给双面学生的t-测试。eWesternblot证实击倒。Lp标记探针、NE L 363核提取物、ULP未标记探针、α-IRF 4抗体。

Rs 2790444定位于自噬基因WAC(无花果)4B)。中罕见的功能丧失变体WAC德桑托-希纳维综合征39,可表现为低伽马球蛋白血症。40。常见的MM危险等位基因与血液中IgM水平升高有关(补充图)。3)和下调对.的管制WAC血浆细胞(补充表)2)。Rs 2790444地图接近WAC转录起始点,在pchi-C诱饵区域(图1)。4B和补充图。8B)。我们发现rs2790444-T为POU2F1转录因子的结合位点和POU2F1的敲除作用奠定了基础,使rs2790444-T荧光素酶活性减弱(如图1所示)。6A-d,补充图。9,以及补充数据2)。POU2F1在基因表达的调控中具有双重作用:它具有核小体重构和去乙酰化酶(NuRD)复合物,POU2F1促进甲基化和抑制组蛋白修饰,而在MAPK信号传递的背景下,它激活kd3A去甲基化酶,促进转录前效应。41。与转录前活性一致,我们检测到一个显著的浆细胞。顺式-meQTLWAC与rs 2790444(P=1.37×10−8),而rs2790444-T与甲基化降低有关(补充表)6)。此外,载有rs 2790444的139-bp区域的CRISPR/Cas9缺失被下调。WAC,支持变异区与转录调控之间的功能耦合。WAC(无花果)6E,f)。这些数据与rs 2790444-T兼容,可以创建一个启动子-近端POU2f1位点,并进行上调。WAC通过降低甲基化。

图6:rs 2790444的表征。
figure6

aMotif分析预测WAC高表达等位基因rs2790444-T为POU2F1创造了一个新的结合位点。箭头表示更改的识别基。b电迁移率测定显示POU2F1与rs2790444-T探针选择性结合。箭头表示抗体向POU2F1方向的超移。cSiRNA-下调POU2F1的荧光素酶活性相对于LS 2790444-T在L 363细胞中的作用。这个y-轴指示日志2Rs2790444-T的荧光素酶/肾信号相对于rs2790444-C结构的比值。每个方块的底部、中部和顶部代表第25、50和75百分位数。晶须代表非离群值的最小值和最大值,分别位于从盒子底部和顶部的四分位数范围的1.5倍。dWesternblot证实击倒。e定量PCR显示WAC相对于MOLP 8细胞中含有rs 2790444的139-bp区的双-sgRNA CRISPR/Cas9缺失,rS 2790444杂合子。蓝色条形表示单个测量值的平均值。f琼脂糖凝胶证实靶区缺失。Lp标记探针、NE L 363核提取物、ULP未标记探针、α-POU2F1抗体。这个P值是给双面学生的t-测试。

Rs 3777182、rs 3777183和rs 3777189映射到ELL 2编码超伸长复合物中的一个关键蛋白,它驱动Ig合成。42,43,44,45(无花果)4C)。MM风险等位基因下调ELL 2血浆细胞和血Ig水平8,12。最近,我们使用非系统的方法将rs 3777189命名为因果关系,并证明了它改变了MAFF/G/K的结合位点。12。在我们的MPRA屏幕中,我们现在发现rs 3777189是其LD块中最活跃的变体,为因果关系提供了额外的、无偏见的证据。此外,我们将rs 3777182和rs 3777183确定为以前在ELL 2LD块。通过对pchi-C数据的分析,我们发现rs 3777183-rs 3777182区域与ELL 2启动子(如图所示)4C和补充图。8C),并预测了几个变化的主题(补充数据)2)。载有rs 3777183-rs 3777182的141-bp区和含有rs 3777189的89-bp区的CRISPR/Cas9缺失ELL 2表达式,支持ELL 2EQTL是由参与转录调控的多个内含子调控元件的遗传变异引起的。ELL 2(无花果)7a,b和补充图。10a,b).

图7:rs 3777182、rs 3777183和rs 3777189的删除数据ELL 2和rs 4487645 atCDCA7L.
figure7

a定量PCR数据显示表达改变与控制ELL 2在rpmi-8226细胞中含有rs 3777182和rs 3777183的141-BP区缺失后,rs3777189、rs 3777182和rs 3777183的杂合子分别为rs3777189、rs3777182和rs 3777183,分别为rs3777189、rs3777182和rs 3777183。下面的琼脂糖凝胶证实了CRISPR/Cas9靶向区域的缺失。b包含rs 3777189的89-BP区域的相应数据。c在OPM 2细胞中含有rs 4487645的76-BP区的相应数据与rs4487645-C变异体是纯合的.这个P值是给双面学生的t-测试。蓝条a)通过(c)表示单个测量的平均数。d我们用CRISPR-HDR成功地在L 363细胞中编辑了rs4487645[C>A]。我们构建了6个C纯合子、3个C/A杂合子和6个A纯合单细胞克隆。与rs 4487645的其他数据一致,我们发现crispr编辑的rs 4487645基因型与CDCA7L表达,与C等位基因产生更高的表达,进一步支持因果关系。这个y-轴表示残余CDCA7L表达qPCR在L 363细胞中的表达值,同时考虑到CDCA7L复制每个单细胞克隆体的拷贝号。每个方块的底部、中部和顶部代表第25、50和75百分位数。晶须代表非离群值的最小值和最大值,分别位于从盒子底部和顶部的四分位数范围的1.5倍。这个P值表示编辑的基因型与CDCA7L表达,采取CDCA7LDNA拷贝数作为协变量计算。

Rs 4487645映射到DNAH 11-CDCA7L轨迹(图)4D和补充图。8D),危险等位基因rs 4487645-C上调了cMyc相互作用。CDCA7L29,46。我们之前提出了rs4487645作为因果关系,发现rs4487645-C创建了一个新的IRF 4绑定点。13。我们目前的分析为这种变异提供了额外的无偏见证据,确实是7p15.3关联的功能基础。Rs 4487645基因76-BP区CRISPR/Cas9缺失下调CDCA7L(无花果)7C和补充图。10C),支持该区域之间的监管联系,CDCA7L。此外,我们利用具有同源定向修复(HDR)的CRISPR/Cas9技术,构建了具有不同rs 4487645基因型的L 363个单细胞克隆。共获得6个rs4487645-C纯合克隆、3个rs4487645-C/A杂合子克隆和6个rs4487645-A纯合克隆。我们观察到rs 4487645基因型与CDCA7L表达,与C等位基因产生更高的表达(图一。7D),进一步支持rs 4487645导致CDCA7LEQTL

最后,rs 11960493和rs 6066832映射到CEP 120PREX1,并在血浆细胞中上调这些基因(见图)。4E,f和补充图。8E,f). CEP 120与微管装配有关47,和PREX1编码一种在几种癌症中变异或异常表达的鸟嘌呤核苷酸交换因子。48,49。虽然我们预测了两个变体的几个母题变化(补充数据)2)和rs 6066832区域与PREX1启动子(如图所示)4E和补充图。8F),我们无法识别差异结合蛋白。

内源性染色体在体内的作用

在体外鉴定之后,我们研究了所选的8个变异体是否在体内的内源性染色体环境中具有活性。基因调控活性的改变与蛋白质向DNA的释放或再吸收和/或染色质结构的改变有关。反过来,这可能导致等位基因依赖的可达性变化(染色质可达性数量性状位点,caQTL)周围的变异,可被ATAC-seq检测到的有限数量的原代细胞。因此,我们对MM患者的血浆细胞进行了ATAC-seq。为了检测caQTLs,我们估计了局部ATAC-seq信号强度,作为TN5转座酶切割位点密度的平均值,该信号密度位于每隔10 bp的LD区域的滑动窗口,并检验了与MM铅变异的相关性。我们还开发了一种分割算法(“caQTLseg”),将LD区域划分为具有等位基因依赖或等位基因无关可达性的子区域。

在56个atac-seq样本中,我们在SMARCD3, CDCA7L,和CEP 120(补充图。11)。对于复制,我们在另外105个样本上执行了ATAC-seq。在对所有161个样本的综合分析中,三个caQTL信号的显着性增加(图1)。8)。被识别为具有等位基因依赖性可达性的区域被识别为具有广泛的caQTLseg参数设置(在线方法和补充图)。1213)。此外,SMARCD3CDCA7L信号集中在rs 78740585和rs 4487645,是其caQTL中唯一的LD变体;这两个风险变体都会产生新的IRF 4结合位点。与最近描述的IRF 4的作用一致,IRF 4是一种像先锋一样的转录因子,调节染色质的可获得性。50,51,52,53SMARCD3-和CDCA7L-高表达MM风险等位基因与rs 78740585和rs 4487645的可及性增加有关(见图)。8a,b)。相反,caqTL位于CEP 120(无花果)8C)更复杂,包括rs 11960493和其他8个LD变体,其中一个(Rs 62376437)在MPRA(q值7.57×10−6在L 363;2.72×10−1“议定书”第8条;补充数据1)并与CEP 120顺式-eQTL,暗示多变量因果关系,如ELL 2协会。这些结果表明,我们选择的三种MPRA功能变异体与显著的血浆细胞caQTL共定位,在体内的内源性染色体背景下,这些变异体上存在因果调节活动。

图8:MPRA功能变异体共同定位的caQTL的鉴定.
figure8

我们对161例MM患者的血浆细胞进行了ATAC-seq检查,并利用两种计算方法对LD区域进行了铅变异的caQTL扫描。aSMARCD3在rs 78740585附近,我们检测到了一个显著的caQTL,小等位基因赋予了更多的可达性。与此一致的是,rs78740585[T>A]显示了一个MPRA日志。2评分和rs 78740585-一个风险等位基因创建一个IRF 4位点(补充图)。4). bCDCA7L我们在rs 4487645附近检测到一个明显的,1.6kb宽的caQTL,其主要等位基因增加了可达性。与此一致的是,rs4487645[C>A]显示了一个负的MPRA日志。2评分和rs4487645-C风险等位基因创建一个IRF 4位点。c在…CEP 120,我们检测到一个覆盖rs 11960493和其他8个变异体的显著caQTL,其中包括rs 62376437,这在mpra中具有重要意义,表明CEP 120关联包含在多种因果变量中。虚线蓝色表示错误发现率(−日志)10 QATAC-seq信号强度与铅变异基因型的Pearson相关值。由caQTLseg命名的铅变异依赖的可及性区域用浅蓝表示.上面的面板显示LD的全部区域,下面的面板是突出显示区域的特写.红色圆圈表示与MM有关联的变体(图中的数据)。1A;变体P < 10−5表示联想)。在较低的面板中,具有不同铅变异基因型的个体的平均局部ATAC-seq信号强度由黄色(小/小)、橙色(小/大)和红色(主要/主要)表示。

讨论

我们对易患MM的遗传性非编码变异进行了系统的功能分析,我们的分析代表了遗传性非编码变异对血液系统恶性肿瘤的功能剖析。据我们所知,MPRA和caQTL分析以前并没有作为相互补充的方法来识别假定的因果变异。虽然MPRA是一种强有力的体外筛选方法,但caQTL为体内内源性染色体背景下特定基因组位置的因果调控活动提供了证据。

我们的分析确定了六个风险位点上的八个假定的因果调节变异:SMARCD3, WAC, ELL 2, CDCA7L, CEP 120,和PREX1。在这些变体中,七个映射到目标基因的内含子区域,一个映射到相邻基因内的增强子区域(图一)。4)。这些观测结果与GWAS信号从功能上分析的其他研究是一致的。C.F.参考文献14,16,19,23,54,55)。值得注意的发现包括一种影响SWI/SNF基因异位表达的变异。SMARCD3在血浆细胞中,将一个新的IRF 4位点引入增强子中,并引入一个上调自噬基因的变异体。WAC通过创建POU2F1站点。此外,我们还发现了多元因果关系的证据。ELL 2CEP 120,进一步支持rs 4487645是一个因果变量CDCA7L。综上所述,我们的发现为研究MM易感性的基因结构提供了功能上的洞察力。

关于局限性,GWAS信号的功能剖析最好包括LD块内每个变异体的系统扰动,例如使用CRISPR-HDR或基础编辑器(将每个参考等位基因替换为相应的变异等位基因,反之亦然)。然而,人们普遍认识到,这种方法目前是不可能的,因为工作量大,而且由于缺少附近的sgRNAs,只有一些变体可以进行精确编辑,而基础编辑器只能实现某些类型的基础更改。此外,在MM的情况下,不可能在体外培养原代浆细胞或原代多发性骨髓瘤细胞,因此需要在细胞系中进行任何编辑实验。由于这些原因,我们用双sgRNA CRISPR/Cas9实验跟踪我们的MPRA筛选,将变异区与eQTL目标基因连接起来。我们成功地编辑了rs 4487645CDCA7L,而其他感兴趣的变体没有实现精确编辑。最后,我们在原始MM血浆细胞中进行了caqTL实验,显示了等位基因依赖的染色质可达性(作为调节活动改变的标志)在SMARCD3, CDCA7L,和CEP 120MPRA-内源性染色体背景下的功能变异。

破译癌症风险变异体的功能基础,可以更全面地理解肿瘤发生和易感性背后的生物网络。在这里,我们通过结合来自高通量功能屏幕的信息、QTL分析和其他测试,在MM环境中解决了这一挑战。我们的综合方法说明了如何对影响人类恶性肿瘤发展的非编码变异进行功能剖析。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297