您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2021
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

单细胞微RNA测序法在细胞株和循环肺癌细胞中的比较与应用

 二维码
发表时间:2021-07-21 10:34作者:武汉新启迪Xinqidibio

摘要

分子单细胞分析提供了对生理和病理过程的洞察。在这里,我们首先评估了19个单细胞小RNA测序方案在MCF 7细胞上加入1,006个miRNAs。其次,我们分析了MCF 7单小区等效的八种最佳协议。第三,对7例SCLC患者的8株细胞株和67例循环肿瘤细胞(CTCS)进行了单细胞测序。总共分析了244个不同的样本。我们观察到高重复性在协议和阅读涵盖了广泛的RNA。对于67个CTCs,我们检测到的中间值为68个miRNAs,其中10个miRNAs在90%的被测细胞中表达。浓缩分析表明肺是最有可能的起源器官,也是癌症相关类别的最有可能的富集器官。甚至不加注释的候选miRNAs的鉴定也是可行的,强调了单细胞小RNA测序的潜力。

导言

成千上万的小非编码RNA(SncRNAs),如piRNA,miRNAs,小核仁RNA(SncRNAs)都是从基因组中转录出来的。虽然它们没有被翻译成蛋白质,但这些分子在生理和病理过程中起着不可或缺的作用。研究得最好的sncRNAs是microRNAs(miRs,miRNAs).MiRNAs是重要的转录后调节因子,在进化过程中非常保守:20-25 nt长分子结合到目标mRNAs上的互补区域,导致mrna降解或翻译抑制。1。60%以上的人类基因含有miRNA结合位点。2。最新发布的miRBase(V22)列出了2654个带注释的人类miRNAs。3。然而,除了miRBase之外,其他几个miRNA数据库还列出了更具体或更敏感的miRNA集。4,人类miRNAs的总数估计在2300 miRNA范围内。5。在癌症等病理条件下,许多miRNAs的转录都发生了改变,从而改变了靶mRNA的丰度。因此,miRNAs作为诊断或预后的生物标志物具有很大的潜力。更重要的是,它们代表了有前途的新药或治疗靶点。6。然而,miRNA的这些有前途的临床应用需要精确和重复性地定量全球miRNA表达的方法。

对于大规模的sncRNAs测序,存在着广泛的协议和商业试剂盒。这些方法的原理是基于序列适配器连接或miRNAs的多腺苷化。几项研究综合比较了这些方法的性能。7,8,9,10,11,12,13。然而,在较高的输入浓度下,存在明显的偏差:适配器连接效率随mirna序列和二级结构的不同而变化1000倍,从而导致定量精度低。14。改进的连接条件和带有随机核苷酸的适配器可以减少这种偏置。8,9,15。此外,基于聚腺苷化的协议也会受到mirna序列的影响,其他rna也可能被聚腺苷化。8。此外,miRNA库包含适配器二聚体,由于miRNA的体积很小,很难从信息读取中分离出来。适配器二聚体问题随着低输入样本的增加而增加,因为有效的连接需要大量的适配器。16。化学修饰适配器或去除多余适配器可以减少适配器二聚体的数量。17.

合理的假设是,如果将输入量减少到单细胞水平,则相应的实验偏差会显著增加。随着单细胞mRNA研究被广泛应用于揭示细胞分化或适应等过程,单细胞miRNA研究滞后。值得注意的是,即使是在单个细胞中表达的不同miRNAs的总量和数量也不完全清楚。然而,与scRNA-Seq类似,单细胞miRNA-Seq将增加我们对分子调控过程的理解.此外,为了研究罕见的细胞群体,如循环肿瘤细胞(CTCS),单细胞miRNA测序方案是强制性的。Sandberg小组发布了两个单细胞mirna-seq协议版本。18,19,但是其他用于低输入样本的mirna-seq协议也是可用的。9,20,21。然而,目前还没有对单细胞层次的方法进行全面的比较。

因此,在这项研究中,使用定义样本的19个miRNA-Seq协议变异体被评估了其准确性、重现性和主要的偏差来源。然后在单细胞水平上使用性能最好的协议,并确定相同的质量参数。最后,通过分析7例小细胞肺癌(SCLC)患者单个CTCs的miRNA谱,说明所选方案对多种不同细胞株甚至临床标本的适用性。

结果

实验设计

对miRNAs进行稳定的单细胞测序,我们采用了三阶段的方法(如图所示)。1A)。在第一阶段,我们全面测试了四个基于连接的协议,后来被称为sb。18SBN19、CL20,和4N9。此外,一种基于聚腺苷化的miRNA-seq协议(猫)21)包括在内。值得注意的是,我们测试了四种协议的19种不同的实验参数:在协议之间交换适配器,增加适配器连接时间(16C)。8),设计了一个与3‘适配器互补的5’适配器(C3)15将唯一的分子标识符(UMI)缩短为6 nt(UMI 6),并检测了一种阻断适配器二聚体反转录的寡核苷酸(BLOCK)。关于19种评估的协议变体的详细信息在补充图中提供。1和补充表1。在第一阶段,我们对乳腺癌细胞株MCF 7的单个细胞进行了序列测定,并加入了1 pg的miRXplore通用参照。本标准由1006个miRNAs和不同物种在等摩尔浓度下的人工序列组成(补充数据)。1)。我们选择了八个性能最好的协议,包括它们的适配器二聚体的数量,读取到miRNA的映射,检测到的miRXplore miRNA的数量,重现性,以及量化的准确性。我们通过对另外三个重复序列进行测序,证实了我们的发现。

图1:实验设置和与miRXplore尖峰(第1阶段)的协议比较。
figure1

a由三个阶段组成的实验装置概述。小细胞肺癌CTCS=小细胞肺癌循环肿瘤细胞。b所有测试协议的读取分布,按miRNA读取比例排序。数据表示为平均值±标准差(n=前八项议定书的6个生物独立样本,n=3),它以比其对应的读取组颜色更深的颜色显示为较小的错误条,并且只在一个方向上表示。c检测到所有测试协议的miRXplore序列,根据每个协议的递减平均值进行排序,每个协议显示为盒图(底部)和点图(顶部)。每个样本显示为一个点,并按协议着色。这些方框跨越第一个四分位数到第三个四分位数,盒子内的垂直线代表中值。如果存在异常值,晶须显示的最小值和最大值或值最多为四分位数范围的1.5倍,低于或高于第一或第三四分位数。d用miRXplore尖峰嵌入所有测序样本的UMAP。最好的八种协议的样本都以各自的颜色突出显示。剩下的协议都是灰色的。e对数上的欧氏距离2转换后的序列表达式显示了同一协议(绿色)的所有复制之间以及与所有其他协议变体(Brown)相比的一个协议变体的所有样本之间的可重现性。每个点表示两个样本之间所观察到的距离。只显示非冗余距离(即样本1到样本2的距离被认为与样本2到样本1的距离相同)。对于每个协议,都会显示一个点图(顶部)和一个盒图(底部)。盒图的定义方式与面板的定义相同。c. f每个样本前100位最高表达miRXplore序列的分布,标准化为每百万映射读取(RPMM)。样本按协议分组,按变异系数上升排序。区域内的垂直线划出四分位数。区域内的每个点表示一个序列的表达式级别。g所有按协议分组的样本的变异系数按上升顺序显示为点图(上)和盒图(下)。每个样本都用一个点表示。盒图的定义方式与面板的定义相同。c。源数据在源数据文件中提供。

在第二阶段,我们评估了这八个协议的单细胞水平。这一次,我们对六个重复的MCF 7单细胞等效物进行了测序,以降低细胞到细胞的可变性.从这些实验中,我们选择了最好的协议,显示出低数量的适配器二聚体,大量的读图到miRNAs,大量检测到的miRNAs,以及复制之间的高重复性。

第三阶段采用最佳方案,分别对7例SCLC患者血中的8种不同细胞株(成纤维细胞、T细胞、单核细胞、巨噬细胞、淋巴母细胞、结直肠癌、肺癌、肝细胞癌)和67例单个EpCAM阳性CTCs进行测序。

Mirna-seq的性能在很大程度上取决于应用的协议。

最初,我们使用单个MCF 7细胞一式三份测试了19个miRNA-Seq协议变体,其中MCF 7细胞中加入了miRXplore。作为第一个质量控制参数,我们测量了最终文库的DNA浓度。浓度是可变的,从0.39纳克升到0.39纳克。−1±0.03纳克升−1(CL_UMI 6协议)至42.2纳克升−1±0.65纳克升−1(SBN_4N议定书;补充表2)。片段长度分布也有差异。125 bp左右的产品代表适配器二聚体,145 bp左右的产品代表带有miRNA插入的文库,大于155 bp的产品可能代表其他较长RNA类型的插入,例如INcRNA、mRNA或SnoRNA(补充图)。2)。尽管我们在测序之前用qPCR对这些库进行了量化,并将它们合并成等数,但测序的读取数从20万到265万不等(补充图)。3)。我们计算删除读取小于18 nt和低质量读取.再一次,结果显示出强烈的变化:在19个测试的协议中,6个产生了超过90%的读取被排除,这使得相关的协议不符合进一步分析的资格(图一)。1B)。相比之下,执行最好的协议的映射率为60%,与人类基因组的映射率为60%。值得注意的是,大约10%的读数位于多个位点(补充数据)2)。最后,总阅读量的10-50%与带注释的miRNA基因座相匹配.另一种标记主要与蛋白质编码基因、基因间区域、长非编码RNA(IncRNAs)或noRNAs相匹配,其他RNA类型可忽略不计。4N、4N_C3、4N_CL、SB、Sb_4N、CL、SBN和SBN_CL检测到几乎所有1006个miRXplore尖峰序列。1C)。有趣的是,在所有协议中,在不到10%的样本中检测到的10个序列中有9个是人工校准核苷酸,只有hsa-miR-193 a-3p在类似的少数样本中检测到(6.3%;补充数据)。3)。另外检测到的不属于尖峰的人miRNA的数量很低(1-22个miRNAs),表明单个MCF 7细胞所含的miRNA浓度比1 pg尖峰低得多。如果读取映射到miRXplore尖峰,良好的执行协议有超过90%的读取映射到标准(补充图)。4).

我们选择了8个读取映射到miRNA位点最多的协议和最多检测到的尖峰序列(平均超过900个),处理了三个额外的复制,并对这些协议进行了进一步的详细分析。首先,我们通过UMAP进行了降维分析,结果表明,样本聚类是根据所使用的协议进行的。我们观察到用5‘和3’4N适配器处理的样品与其他协议相比有明显的分裂(图1)。1D)。在接下来的步骤中,我们评估了每个样本的测量结果的重现性,发现SB协议的重现性最高(同一协议的副本之间的欧氏距离最低),其次是SB_4N和SBN_CL协议,而4N协议(4N、4N_CL和4N_C3)的重现性最低(图1)。1E)。对一种协议的复制与其他所有协议的比较表明,4N协议的样本具有最高的欧几里德距离,即与其他所有协议的差别最大。重要的是要从miRNAs的角度来解释这些结果,而miRNAs在协议变体内部和之间的浓度应该是相同的。对miRXplore序列的核苷酸含量及其二级结构的最小自由能的分析表明,只有G-含量似乎影响所有协议的检出率(Spearman相关系数为0.45,P=2.8×10−52),随着G-含量的增加,检测概率增加(附图)。5和补充数据3)。对于所有的治疗方案,我们观察到miRXplore miRNA表达水平有很大的差异。已经排在前100位最表达的尖峰位置显示出几个数量级的差异(图一)。1F)。协议4N_CL与预期表达值的方差最大,变异系数为3.407,协议sbn方差最小,变异系数为1.506。1g)。由于8个最佳协议中的6个也提供了UMI序列,因此我们对读取映射进行了重复,并评估了它们在剩余的READ上的变化(补充图)。6)。其中4NCL变异系数最大,变异系数为2.170,4NC3变异系数最小(变异系数为1.046)。然而,MCF 7细胞也可以表达一些人穗型miRNAs,并作为背景信号增加观察到的变异。为了避免因测序深度不同而造成的偏差,我们对300,000次抽样样本进行了分析,证实了观察到的模式(补充图)。7).

总之,我们应用了19种不同的协议来分析极低输入样本的miRNA。我们基于miRXplore通用参考的全面评估表明,8个协议的性能最好。只有基于结扎术的方法才是表现最好的协议之一,因此基于多腺苷化的方法(CATS)并不包含在第二阶段。

SBN_CL协议具有较高的重现性,并能检测到大多数miRNAs。

在第二阶段,使用MCF 7细胞系的单细胞等效物对8个最佳方案进行了分析。与第一阶段相似,文库中的DNA浓度具有较高的变异性,变异范围为1.37ng/L。−1±0.13纳克升−1(Cl)至36.53纳克升−1±23.61纳克升−1(4N_C3;补充表3)。片段长度分布也与小片段数量增加的穗中实验相媲美(附图)。8)。同样,顺序读取的数量与第一阶段相当,在195,000至1,400,000读之间变化(补充图)。9)。从第一阶段到第二阶段,阅读的总数保持相当(如图所示)。2A)。然而,读图到人类基因组的比例和读图映射到miRNAs的频率明显降低(图1)。2B)。在SBN、Sb_4N、4N和4N_C3协议中,只有不到10%的读入到人类基因组,并且库几乎完全由适配器二聚体组成。与第一阶段的尖峰试验相比,所有协议的适配器二聚体数量增加了2至399倍(图1)。2C)。此外,多映射读取的数量增加到映射读取的34-73%(补充数据)。4)。最后,与注释的人类miRNAs相匹配的阅读总量最多为2.0%,映射读量(SBN_CL)为3.0%。然而,在所有的协议中都检测到了miRNAs:我们平均监测了55到178种不同协议之间的miRNAs(如图所示)。二维空间)。其中一个复制的SB文库甚至含有327个不同的miRNAs。然而,其他的复制只产生134到189个miRNAs。SBN_CL协议与平均每个拷贝178个miRNAs(SD_21.3)的一致性最高。接下来,我们通过UMAP进行了降维分析(如图所示)。2E结果表明,大多数重复按其协议聚类为主要驱动因子,其次为测序运行(6个重复按两批三个重复进行测序)。对于第一阶段协议的UMAP降维,我们再次观察到,与其他协议相比,5‘和3’4N适配器的协议之间存在分裂,尽管这种分裂不那么明显。对每个样本的测量结果的可重现性的评估强调,SBN_CL协议的复制具有最高的可重现性(同一协议的副本之间的欧氏距离最低),其次是SB协议(图1)。2F)。CL协议的重现性最低,即复制者之间欧氏距离最大。单个协议与其他协议的评价结果表明,所有协议都有相似的不同之处,而协议CL的样本在中值上显示出最大的差异。我们把重点放在检测到的miRNAs上,观察到了同样的趋势。总共有713个miRNAs存在于至少一个被测试协议的复制中。在所有测序库中均检出Mir-21-5p,其次为let-7a-5p和miR-182-5p(图1)。2G)。最后,对每个协议中所有检测到的miRNAs的重叠进行了一组比较分析。这突出了每个实验装置检测到的miRNAs的高度异质性。在所有协议中,至少在一个复制中检测到69个miRNAs,SBN协议只检测到60个miRNAs,其次是57个排他miRNAs的SB协议和53个排他miRNAs的SBN_CL协议(图1)。2H)。类似于第一阶段,我们对300,000次抽样库进行了分析,并确认了相同的模式(补充图)。10).

图2:与单细胞等效物的协议比较(第二阶段)。
figure2

a在第1阶段(miRXplore尖峰)和第2阶段(MCF 7单细胞等价物)中排序的读取数,显示为盒图(底部)和点图(顶部)。每个点代表一个样本。这些方框跨越第一个四分位数到第三个四分位数,盒子内的垂直线代表中值。如果存在异常值,晶须显示的最小值和最大值或值最多为四分位数范围的1.5倍,低于或高于第一或第三四分位数。b所有测试协议的读取分布,按miRNA读取比例排序。数据表示为平均值±标准差(n=6个独立于生物的样本),它显示为一个比其对应的读取组颜色更深的误差条,并且只在一个方向上表示。c适配器二聚体出现在阶段1和阶段2,显示为盒图(底部)和点图(顶部)。每个点代表一个样本。盒图的定义方式与面板的定义相同。a. d检测到每一个样本的miRNAs,根据每个协议的平均下降来排序,显示为盒图(底部)和点图(顶部)。每个样本显示为一个点,并按协议着色。盒图的定义方式与面板的定义相同。A.e所有样本的UMAP嵌入。每个样本(点)由其协议着色。f对数上的欧氏距离2转换后的序列表达式显示了同一协议(绿色)的所有复制和不同协议的所有样本(布朗)之间的可重现性。每个点表示两个样本之间所观察到的距离。只显示非冗余距离(即样本1到样本2的距离被认为与样本2到样本1的距离相同)。对于每个协议,都会显示一个点图(顶部)和一个盒图(底部)。盒图的定义方式与面板的定义相同。a. g在多项实验中检测到前十位的miRNAs。h翻转图显示由多个协议联合检测到的miRNA,或仅在一个协议(橙色)中单独发现。顶部的条形图在y轴上显示了由下面的网格中连接的黑色或橙色点突出显示的协议检测到的miRNAs数量。左边的条形图在x轴上显示了在y轴上显示的协议的至少一个副本中检测到的miRNAs总数。源数据在源数据文件中提供。

总之,在单细胞水平的实验中,SB和SBNCL协议的效果最好。由于其较高的重复性,在第三阶段选择SBN_CL方案对8个细胞系和患者来源的CTCs进行miRNA分析。

SBN_CL协议在8个不同的细胞系中显示出相似的性能

为了研究SBN_CL方案在不同细胞类型中是否表现出稳健性,我们分析了6个单细胞株:上皮性癌细胞(HepG 2、肺A 549、结肠HT 29)、造血细胞(单核细胞THP-1、T细胞Jurkat、巨噬细胞KG1、淋巴母细胞REH)和健康的BJ成纤维细胞。SBN_CL协议适用于所有不同的单元类型。总体协议性能可与MCF 7单小区等效。平均30.5%(SD 8.5%)的读图可定位于人类基因组,1.3%(SD 0.76%)匹配带注释的miRNAs(图1)。3A和补充数据5)。每个细胞可以检测到32-255个不同的miRNAs(中位数174;图1)。3B)。UMAP的降维结果表明,样本是按细胞类型聚类的,而造血细胞则更紧密地聚在一起(如图所示)。3C)。对检测到的miRNAs的详细分析表明,在所有8种细胞系中,至少一次可以检测到128个miRNAs,其中16个(Jurkat)−42(HepG 2)miRNAs是特定细胞株特有的(如图1所示)。三维空间)。为了确定在细胞株中观察到的miRNA图谱是否与文献相符,我们用miEAA2.0进行了通路富集分析。22对每个细胞株的miRNAs进行排序,平均表达量减少。所有的剖面都产生了典型的浓缩研究细胞系,即A 549和BJ,我们分别发现肺和皮肤组织明显富集(图一)。3E,f),对于HepG 2、HT 29、KG1、REH和THP-1,我们发现对它们的特异性疾病有明显的富集作用(图1)。3G-l)。总之,sc-miRNA-SeqSBN_CL协议可用于确定各种不同细胞类型的组织和/或疾病特异性miRNA谱。

图3:协议SBN_CL在8个不同细胞系中的应用。
figure3

a所有被测细胞系的读分布,按miRNA读取比例排序。数据表示为平均值±标准差(n=6个独立于生物的样本),它显示为一个比其对应的读取组颜色更深的误差条,并且只在一个方向上表示。b检测到每个样本的miRNAs,按每个细胞株的平均值进行排序,显示为盒状图(底部)和点图(顶部)。每个样本显示为一个点,并按协议着色。每个点代表一个样本。这些方框跨越第一个四分位数到第三个四分位数,盒子内的垂直线代表中值。如果存在异常值,晶须显示的最小值和最大值或值最多为四分位数范围的1.5倍,低于或高于第一或第三四分位数。c所有样本的UMAP嵌入。每个点代表一个样本。d在多个细胞系中共同检测到的miRNAs,或仅在一个细胞系(橙色)中单独发现的miRNA。顶部的条形图在y轴上显示了在下面的网格中,由连接的黑色或橙色点突出显示的细胞系中检测到的miRNAs数量。左边的条形图在x轴上显示y轴上至少一个细胞株样本中检测到的miRNAs总数。电子-l每个被分析的细胞系的显着富集类别的例子。每幅图显示计算出的运行和(蓝色)、随机排列的运行和(背景),以及fdr调整后的值。P在标题中指定的单元格线的。精确性p通过基因集富集分析方法计算每种富集量的miEAA值,并对每个数据库分别进行FDR调整。源数据在源数据文件中提供。

小细胞肺癌患者CTCs的miRNA谱显示较高的患者内部变异性

在7例SCLC患者中,应用EpCAM染色法从血液中分离出单个CTCs。4A)。对于这些患者,总共有67个CTC使用SBN_CL协议进行了测序。此外,两个阴性对照只含有不含细胞的试剂。每个病人的EpCAM阳性细胞数在2到28个细胞之间变化(见图)。4B)。对于患者CTCS,我们对每个细胞进行了37万到70万个读取的排序,其中平均62.7%(SD 6.6%)在质量控制中丢失。其余数据中,平均37.5%(SD 6.4%)映射到人类基因组(补充数据)6)。与第1和第2阶段的结果相比,我们观察到覆盖RNA类的异质性增强。MiRNAs的读图比例在0.02%到5.9%之间,平均为0.85%(SD 1.1%;图1)。4C)。大多数读物被映射到非注释的基因间区域、蛋白质编码基因、核糖体RNA(RRNAs)、incRNAs,以及转移RNA(来自GtRNAdb)和noRNAs。正如预期的那样,在我们的阴性对照中,几乎没有发现到miRNAs、tRNAs或noRNAs的读取映射(补充数据)。6)。接下来,我们研究了miRNA的读重复率,发现大多数UMI患者之间的每个UMI的读数是一致的,平均为4.74个/UMI(SD2.16;图1)。4D)。随后,我们评估了每个细胞发现的miRNA分子的数量。平均每个病人细胞可以检测到389.49个(SD 496.43)分子,在两个阴性样本中只检测到7个和14个分子(补充图)。11)。因此,我们通过要求至少50个检测到的miRNA分子来排除那些质量很低的细胞,因为我们预计这些分子不可能包含假信号。在其余53个细胞中,最丰富的miRNAs是miR-375-3p,miR-26a-5p和let-7a-5p(图1)。4E)。每一个细胞,我们检测到的中位数为68个miRNAs,10个miRNAs在90%以上的被测试细胞中表达(补充图)。12)。总共,所有细胞都表达了352个独特的miRNAs(补充数据)。7)。6种最易变的miRNAs分别是miR-100-5p、miR-10b-5p、miR-182-5p、miR-200 b-3p、miR-335 p-3p和miR-7-5p。4F)。我们计算了这些细胞的umap嵌入量,并将它们与卢万社区检测算法进行聚类。23将miRNA分为六组,研究患者之间和同一患者细胞间的miRNA表达差异。如图所示。4G,每个病人的细胞仅适度聚集(没有病人形成自己的聚类),表明同一病人的细胞间存在高度的变异性,调整后的相互信息为0.31。因为每个病人的CTCS数量是非常不同的(如图所示)。4B我们只对三位排序最多的CTC患者进行聚类分析,但仍未观察到患者的聚类(图一)。4H).

图4:SBN_CL方案在小细胞肺癌(SCLC)CTCS中的应用。
figure4

a2例SCLC患者血液标本中富集的两个EpCAM+细胞的代表图像(20倍)。通过微操作分离细胞,进行miRNA测序。标尺等于5m。b每名病人和两名空白阴性对照者的细胞数。c每一位患者的每个细胞的映射读物的分布情况,并通过降低miRNA的比例进行排序。d方框图显示每个细胞的每个UMI读取数,按病人的降序分组。每个miRNA显示为一个点。这些方框跨越第一个四分位数到第三个四分位数,盒子内的垂直线代表中值。如果存在异常值,晶须显示的最小值和最大值或值最多为四分位数范围的1.5倍,低于或高于第一或第三四分位数。e前20位表达最多的miRNA在所有细胞中的分布表现为盒图(下)和点图(上)。这些方框跨越第一个四分位数到第三个四分位数,盒子内的垂直线代表中值。如果存在异常值,晶须显示的最小值和最大值或值最多为四分位数范围的1.5倍,低于或高于第一或第三四分位数。f6种最易变的miRNAs的表达分布。少于三个细胞的患者被排除在外。区域内的垂直线划出四分位数。区域内的点代表相应病人细胞中miRNA的表达。gUMAP嵌入的所有样本颜色由病人(左)和颜色由簇(右)。hUMAP包埋的3例患者CTCs数目最多(左),彩色(右)。源数据在源数据文件中提供。

已知和非注释的miRNAs强调与癌症的相关性。

为了了解miRNAs在CTCs中的相关性,我们进行了一项途径富集分析。利用miEAA的基因集富集分析(GSEA)对miRNAs在ctcs中的表达进行了分类。22。就人体miRNA组织图谱中的器官而言24,miEAA提议在肺中富集(GSEA,调整后)p值=1.5×10−11)和结肠(GSEA,调整后)p数值=2.5×10−11;图1.5A,b)。有趣的是,研究结果也显示了一些与癌症相关的途径的丰富,例如整合素信号通路(补充数据)。8)和癌症作为疾病,包括miRwalk类别25肿瘤(GSEA,调整后)p数值=4.6×10−8)和癌(经调整的GSEA)p数值=1.6×10−6;图1.5C,d)。最具代表性的细胞定位是细胞质(gsea,调整后)。p数值=1.6×10−15)和线粒体(GSEA,调整p数值=1.1×10−14;图1.5E,f)。虽然这些结果并不是CTCS中miRNAs触发的潜在下游级联的功能证明,但我们至少可以声称miRNAs在CTCS中具有假设的调节作用。

图5:ctmiRNAs和miRNA候选体的富集分析。
figure5

阿-f顶级富集器官、通路类别和细胞位置。每幅图显示计算出的运行和(蓝色)、随机排列的运行和(背景),以及fdr调整后的值。P价值。精确性p通过基因集富集分析方法计算每种富集量的miEAA值,并对每个数据库分别进行FDR调整。g从miRCarta获得的重叠miRNA候选人之一的叠加图。根据阅读的实验结果,条形图是彩色的。表达式显示为每百万映射读取(RPMM)。h每个检测miRNA的实验提供的读取比例的分布。

到目前为止所做的分析仅限于miRNA注释在miRBase中。尚未被报道的miRNAs或至少尚未添加到miRBase中的miRNAs也可能具有调节作用。因此,我们对单个CTCs中无注释的miRNAs进行了预测。我们的分析建议了十个没有注释的miRNA候选。由于各个候选对象的覆盖范围限制在单个单元格级别上,因此我们设置了计算批量测序数据中覆盖范围的方法。事实上,在四个案例中,我们发现miRcarta中潜在的候选对象的点击量。26,即hsa-11781-8351.1,hsa-2644-2657.1,hsa-2810-2791.1和hsa-9809-4031.1,部分具有良好的读图剖面(图)。5G,h;补充图13)。有趣的是,由miRCarta的数据支持的miRNAs也调控了相关的通路,包括细胞连接(gsea,调整后的)。p值4×10−8)和细胞粘附(GSEA,调整p值5×10−6).

讨论

在本研究中,我们综合比较了18种基于连接的miRNA-Seq和一种基于聚腺苷化的协议.唯一的基于聚腺苷化的方案被调查,在第一阶段表现出更低的性能,并且与18种基于连接的协议中的10种一起被排除在外。这些结果与大容量级别上类似的协议比较是一致的。8,10,11,13。八种不同的协议变体对极低输入样本的miRNA-Seq有很好的应用前景.过量适配器的外切酶消化和化学修饰的适配器都会减少适配器二聚体的形成,而CleanTag适配器则会导致适配器二聚体的形成。20似乎是最有效的策略。令人惊讶的是,连接位点上带有随机核苷酸的适配器并没有提高等摩尔尖峰miRNAs的miRNA定量精度,此外,4N库包含超过40%的适配器二聚体读取量。由于类似的miRNAs在不同协议之间的表达不足或过度表达,我们发现所观察到的偏差似乎部分是由miRNA序列G-含量引起的。其他研究表明,5‘或3’端的核苷酸序列、miRNA自由能、焓、熵和二级结构的形成是偏倚的额外原因。9,15.

从第二阶段所有测试协议的性能比第一阶段低得多的结果推断,单细胞包含的miRNA可能要少得多。令人惊讶的是,在我们的实验中,原来的SB协议比更新的SBN协议的性能有所提高。可以检测到更多的miRNAs,而适配器二聚体的数量较低,这可能是由于SBN协议的适配器浓度较高所致。SB和SBN_CL协议可推荐用于单细胞级,具有SBN_CL协议重复性好的优点。我们演示了SBN_CL协议在广泛的小区类型中的适用性。然而,这个协议也可以在我们的洞察力基础上得到进一步的改进,例如,检测更多的细胞型特异性(新)miRNAs,研究3‘和5’mirna的使用情况,以及分析isomiR在健康和疾病中的表达情况。27,28。未来的研究应该集中在增加读图到miRNAs的数量和减少适配器二聚体。这可以通过优化连接反应来实现,特别要注意适配器的浓度。29,通过使用夹板适配器12,由适配器-miRNA-循环10,30,通过应用CRISPR/Cas9耗尽适配器二聚体读取16,或两者的组合。此外,联合分析单细胞mRNA和miRNA的表达似乎是可能的。31,32。目前的SBN_CL协议允许在2天内对大约15个样品进行sc-miRNA-Seq库准备.由于自下而上的反应和避免凝胶或基于柱的净化步骤,该协议也可以很容易地实现96或384井格式的自动化。进一步提高吞吐量可以通过在3‘适配器中引入条形码,并在结扎后汇集多个示例来实现。29.

我们对7例小细胞肺癌患者的初步研究证明了单细胞miRNA谱作为潜在的生物标记物的可行性。我们已经发现了许多不同的致癌miRNAs在小细胞肺癌CTCS中。Ctc研究中最丰富的miRNAs被称为癌症miRNAs。综合文献回顾显示,在50多份手稿中,miR-21-5p、miR-146 b-5p、miR-142-5p、miR-148 A-3p、miR-92a-3p、miR-26a-5p和miR-25-3p分别与癌症有关。值得注意的是,在至少60%的ctcs中存在的所有30个miRNAs中,27个已被认为与肺癌有关,其中miR-21-5p的病例最为突出。2,33和miR-142-5p34,35。到目前为止,这些miRNAs表达谱的变化仅与非小细胞肺癌原发肿瘤和循环mirna的临床和分子特征有关。36,但与CTCS无关。我们的研究表明,这些miRNAs也经常在SCLC患者的CTCs中表达。由于整合素信号通路是小细胞肺癌细胞中最重要的富集途径,因此途径的富集也使人们对CTCS的生物学研究有了初步的了解。整合素的表达似乎与小细胞肺癌的侵袭性直接相关,包括高转移潜能和对化疗的耐药性发展。37,38,39,40,41。然而,为了探索ctc衍生miRNAs的生物学相关性和诊断潜力,需要有更多病例和对照的大队列,随着时间的推移重复取样、结果数据和机制研究。我们的综合方案比较为癌症患者CTCs中miRNAs的检测提供了一种方法,为实现这一目标铺平了道路。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297