您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!
本企业通过iso9001质量体系认证

非编码基因编码的肽:挑战和观点

 二维码
发表时间:2019-12-13 11:56作者:武汉新启迪Xinqidibio来源:www.qidibio.com

非编码基因编码的肽:挑战和观点


摘要

近年来,非编码基因(NCG)翻译事件已被频繁发现。作为生命科学中的新发现,所得的肽具有在许多基本生物学和病理学过程中日益重要的意想不到的功能。这些新型肽的出现,反过来又推动了基因组学领域的发展,同时必不可少地帮助了生物。来自NCG的肽充当细胞外刺激和细胞内调节机制之间的重要链接。这些肽也是进一步探索生命奥秘的重要切入点,这可能会引发新一轮革命性的生物技术发现。对NCG衍生肽的深入了解将有助于理解生命的秘密和疾病的原因,还将开辟治疗癌症等疾病的新途径。在此,对由NCG编码的肽的作用方式和生物学功能进行了严格的综述。还严格讨论了寻找和研究NCG肽的挑战和未来趋势。

介绍

分子生物学的中心教条描述了细胞内生物大分子之间遗传信息转移的基本原理。遗传信息从基因流向蛋白质,蛋白质构成了生命的物质基础,并且是生命活动的主要参与者。12个蛋白质编码基因弥补<人类基因组的3%,并且仅在基因组中的其余97%的一小部分(非编码基因组成,凝气)的特征在于。3许多NCG以前被定义为垃圾DNA,但它们确实是功能元素。4非编码RNA的出现使NCG成为生命科学家的关注焦点,鼓励他们从新的角度看待NCG。非编码RNA起着通过RNA-蛋白复合物的形成调节基因表达和各种生命活动的广泛和重要的作用56或通过碱基互补。78非编码RNA被分类成许多类别。小核RNA在相当长的时间内一直是公认的非编码RNA。它的主要功能是参与mRNA前体的加工。剪接体(如U1,U2,U4和U6)中的RNA成分是小核RNA。9MiRNA构成一类由内源基因编码的单链RNA分子,长度约为22个核苷酸。它们参与转录后基因表达的调节。它们可以与靶基因mRNA的非翻译区(UTR)结合,从中引导RNA诱导的沉默复合物(RISC)阻止mRNA的翻译或AGO蛋白裂解mRNA,以实现内源性基因表达。1011 CircRNA在类病毒首次被发现,其中,所述基因组是单链环状RNA分子。12 CircRNA可以充当分子海绵来抵消miRNA的作用。CircRNA还可以充当不同分子相互作用的支架。13长的非编码RNA(lncRNA)被认为是非编码的,因为它们缺乏明显的长蛋白质编码开放阅读框(ORF),尽管新证据表明某些lncRNA确实被编码为蛋白质。已经提出了LncRNA具有多种功能,包括转录调控,核结构域的组织和基因表达的调控。14目前,已经利用NCG革命来研究所有活生物体。1516

此外,随着蛋白质核糖体图谱分析和高通量测序等技术的发展,以及用于大规模蛋白质组分析的蛋白质数据库搜索,已经发现了一些与当前注释的蛋白质编码基因不匹配的新型肽注释。相反,它们对应于非编码RNA,假基因,UTR等的基因,这些基因以前被认为是NCG。1718最近,越来越多的实验表明,凝气的确可以翻译,1920和翻译产品主要多肽或micropeptides。2122NCG肽可以使用特定抗体通过蛋白质印迹(WB)直接验证。此外,NCG肽可与表位标签(例如FLAG,人流感血凝素(HA)或绿色荧光蛋白(GFP))结合形成融合蛋白。可以通过WB或荧光成像技术检测所得的融合蛋白。质谱技术,例如采用串联质谱仪的液相色谱,还可以通过分析NCG肽的信号来确认NCG肽的存在(图1)。这些肽具有广泛的生物学功能。有趣的是,某些NCG肽具有明显的组织特异性分布模式,并且可以以组织特异性的方式进行微调的局部调节。

图1:许多实验室技术都支持存在源自非编码基因的肽的想法。
图1

对NCG肽和验证通过Western blot分析抗体的设计。38 b质谱用于鉴定非编码基因肽的特定信号。39 c肽-FLAG融合蛋白的免疫荧光图像(红色,NCG-肽NoBody; DIC,差分干扰对比)。75 d免疫荧光图像显示了带有FLAG标签的NCG肽(绿色,NCG肽CASIMO1;红色,肌动蛋白丝;蓝色,核)的表达。98 e NCG肽的免疫定位图像(红色,NCG肽miPEP171b;绿色,自发荧光)。113

在这篇综述中,我们总结了衍生自NCG的肽的结构,作用模式和生物学作用(图2)。迄今为止发现的NCG衍生肽(称为NCG肽)总结于表1中,并在本综述中进行了严格讨论。这些肽的出现表明,编码蛋白质或肽的基因组部分比以前识别的要大得多。最后,我们探讨了NCG肽的生物学和医学意义,并提出了研究NCG肽以推动该领域的未来方向。我们相信,对该主题的更深入探索将更准确,更详细地解释一些生活中的奥秘,从而导致用于疾病诊断和治疗的新生物标记物。

图2:NCG肽的生物学功能。
图2

非编码基因的表达是通过中心规则实现的。转录后,选择性剪接产生多种转录本,其中一些转录成肽。这些肽在调节肌肉形成和表现,抑制代谢重编程,控制表皮形态发生,促进前体miRNA转录,调节mRNA翻译,整合应激反应,促进胃泌尿形成,增强代谢稳态,以及诱导或抑制肿瘤发生等方面发挥重要作用。和/或肿瘤进展。

表1 NCG肽汇总

NCG衍生肽的作用方式

NCG肽在层次结构上不同于传统蛋白

蛋白质结构的正确空间折叠是形式生物学功能的基础。23用四个层次结构描述了蛋白质的空间构象。一级结构,即从N端到C端的氨基酸残基顺序,由相应基因中核酸的顺序决定。基于一级结构,肽链主链上的原子形成局部二级结构,称为二级结构。几个连续的二级结构可以组合成一个“超二级单元”,多个这样的单元进一步形成一个“结构域”,它构成了三级结构。2425该结构域是自稳定的并且突出,使得宿主蛋白可以维持适当的生物学功能。2627的三级结构是在一个肽链的所有原子的空间排列。在传统意义上,蛋白质是由三级结构的形成决定的。亚单元的空间排列和功能配合导致四元结构。28大多数NCG肽的长度包含少于100个氨基酸残基(aa),最短的只有9个氨基酸。29氨基酸数量是形成复杂蛋白质结构的基础。为了形成甚至最简单的跨膜α-螺旋(TMH)结构,也需要30个氨基酸,并且还需要蛋白质中不同结构之间的非结构化间隔区。30因此,与常规蛋白质相反,NCG肽通常不形成复杂的结构,但具有不同的作用方式,如下所述。尽管某些circRNA衍生的NCG肽由> 100氨基酸组成,但比大多数传统蛋白质要小得多(例如,FBXW7的氨基酸为185 aa,β-连环蛋白的氨基酸为370 aa)。考虑到大多数circRNA都来自外显子,需要更多的证据来确定某些circRNA是否可以归类为其他类型的信使RNA。最近发现的具有明确作用机制的circRNA衍生的NCG肽往往通过与其他蛋白质的相互作用及其作用机制发挥作用,这也将在下面进行讨论。

NCG肽以序列非依赖性或序列非依赖性方式起作用

40S–Met-tRNAi复合物(43S复合物)的扫描是翻译开始之前的主要过程,涉及与mRNA的结合。3132的多肽的一部分从在5'UTR的上游开放阅读框(uORF)翻译并根据系统发育分析物种之间是保守的。33从uORFs翻译的一类调节肽会在寻找下游起始密码子时为43S复合物产生独立于肽序列的伏击(图3)。通过此伏击,扫描过程被阻止。但是,依赖序列的方法更为常见。一些NCG肽可以通过与它们同源的蛋白质相同的序列充当竞争性抑制剂。许多circRNA来源于其母源基因的反向剪接外显子。3435因此,相同的基因份额的不同的RNA形式的部分重复的序列其编码的多肽。例如,SNF2组蛋白接头PHD RING解旋酶(SHPRH)-146aa(表1)是从cirRNA翻译的肽。由Circ-SHPRH的母源基因编码的全长SHPRH是E3连接酶。它促进泛素化的蛋白酶体介导的增殖细胞核抗原(PCNA)的降解,从而导致细胞增殖受到抑制。3637的另一E3连接酶,denticleless E3泛素蛋白连接酶(DTL),诱导SHPRH的泛素化。在SHPRH-146aa中也发现了STLRH中DTL引发的泛素化的两个位点(K1562和K1572)。因此,SHPRH-146aa作为抑制SHPRH泛素化的竞争性抑制剂,导致SHPRH的积累和随后PCNA的降解。38从FBXW7的circRNA翻译的肽称为FBXW7-185aa(表1)。FBXW7-185aa通过与SHPRH-146aa所使用的机制相同的机制诱导FBXW7α的积累和C-myc的降解。39 Circ-0004194源自β-catenin基因位点,也称为circβ-catenin。Circ-0004194可产生包含370个氨基酸的β-catenin亚型,称为β-catenin-370aa。β-catenin-370aa通过结合GSK3β来保护全长β-catenin不会被磷酸化并随后降解,从而成为有效的竞争者(图4)。40

图3
图3

可以在编码区域的ORF处重新启动参与uORF翻译的扫描PIC。

图4:circRNA衍生肽的作用方式。
图4

CircRNA衍生的肽下调了与竞争性抑制剂相同的母源基因衍生的全长蛋白质的泛素化作用,这导致全长蛋白质的蓄积及其结果。

NCG肽通过结合其他蛋白质来改变其构象而发挥作用

肌球蛋白(MLN)(表1)源自LINC00948,编码MLN的小开放阅读框(sORF)位于LINC00948亲本基因的第3外显子上。MLN的二级结构包含一个C端跨膜α螺旋。计算分子模型的输出表明,α-螺旋直接与肌质内质网Ca 2+ -ATPase(SERCA)中的M2,M6和M9螺旋共同形成的凹槽相互作用,从而调节细胞内钙代谢。41除了生化数据,冷冻电子显微镜还揭示了真菌精氨酸减毒肽(AAP)的作用模式(表1)。)直接从结构的角度来看。AAP由uORF编码,可能导致翻译停滞。42低温电子显微镜显示,AAP直接与核糖体通道组分相互作用,包括RNA和蛋白质,这些组分夹在大亚基的L4和L17残基之间。4344直接与核糖体相互作用的AAP残基突变可以消除停滞效应。另外,AAP的C端形成一个螺旋,可能有助于构象变化,从而适应肽基转移酶中心(PTC)。通过二级结构的直接相互作用,AAP改变了PTC的构象,导致翻译停滞。NCG肽除了可以诱导其他蛋白质构象变化外,还可以充当域特异性衔接子。果蝇MRE29基因被认为是NCG,也被称为pri(抛光大米)。45实际上,pri编码11–32 aa多肽(表1)。46在胚胎发育的13-16天阶段,pri肽被表达并充当特异性衔接子,介导E3连接酶Ubr3与Shavenbaby(Svb)N端的特异性结合。因此,泛素化的Svb的N-末端被蛋白酶体截短。此外,C末端的两个折叠区域会阻止Svb完全降解。47 Pri肽有助于适当的Svb加工并将抑制的Svb转化为活性形式。

NCG肽充当信号通路分子

在人类中,线粒体基因组是一个环状的封闭遗传系统,包括编码13种蛋白质的基因以及rRNA和tRNA的NCG。4849然而,以前核和小RNA的未知转录物最近在线粒体中发现的。2050此外,存在一个SORF线粒体12S rRNA的可翻译成16个氨基酸,命名MOTS-C的肽(表1)。MOTS-c抑制叶酸循环,导致积累AICAR(5-氨基咪唑-4-羧酰胺核糖核苷酸),从而可以激活AMPK途径。通过这种信号通路,MOTS-c对细胞和机体的代谢稳态具有广泛的影响。51幼儿RNA,也称为Apela / Elabela / Ende,最初被认为是非编码RNA,它编码一种肽(表1)。幼儿肽通过驱动G蛋白偶联的Apelin受体的内在化激活APJ / Apelin信号转导,并促进斑马鱼胃动期间的细胞运动。52

与生物活性的主要诱导剂相反,由NCG编码的这些结构简单的肽通过许多不同的机制具有更多的微调效果。由于NCG肽起源的特殊性,可以说某些作用方式是独特的,例如竞争性抑制剂的作用方式。这些肽的精细调节使生物体能够更准确,更稳定地执行各种功能。

NCG肽表达的调节

从翻译到蛋白质修饰,从NCG衍生的肽也受到所有水平的调节。由于许多NCG是非编码RNA,因此未讨论其转录调控。在翻译水平上,circRNA中大量的甲基化修饰可以增强其翻译活性的水平。在某些条件下,起始密码子附近的m6A标记丰富,表明circRNA甲基化。YTHDF3识别甲基化的修饰并以eIF4G2相关的帽独立方式促进翻译。另外,在热激条件下,circRNA翻译增加。[53]在调节mRNA翻译中发现了类似的机制,为应激期间选择性的mRNA翻译提供了模型。5455终止密码子后的Poly(A)或poly(T)序列可以抑制circRNA翻译,这表明NCG肽在翻译水平上不同于传统蛋白。56

在蛋白质修饰的水平上,PLN和SLN与MLN非常相似,并且具有独特的组织特异性分布模式,最初是作为微肽被发现的。5758个通过组合的物理形成PLN功能,其功能是通过在体内磷酸化和去磷酸化调节。去磷酸化的PLN主要以单体形式存在,通过抑制位于肌质网(SR)膜中的SERCA来抑制心脏功能,并在肌肉松弛过程中将Ca 2+从细胞质中通过SR 回。磷酸化后,PLN形成五聚体,从而降低了对SERCA的抑制作用。59这种动态平衡在β-肾上腺素能激动剂增强心肌功能中起关键作用(图5)。此外,残基9为突变的特定PLN突变体(R9C)抑制野生型PLN的磷酸化,因此长期抑制SERCA。因此,慢性抑制导致扩张型心肌病和过早死亡。60在另一种情况下,即R14del突变体,突变体PLN错误地出现在肌膜中,在此处与Na / K-ATPase相互作用,尽管收缩性增强,但仍导致心脏重塑。61有序的监管表明,源自NCG的多肽是生命活动的固有参与者。

图5:NCG肽的调节。
图5

β-肾上腺素能激动剂使PLN单体磷酸化,形成五聚体,从而抑制PLN对SERCA的抑制并促进心肌的收缩性。

NCG肽的生物学功能

尽管在真核生物中编码基因的数目没有显着大于在原核生物中的编码基因的数目,但是在真核生物中的生理和病理活性比在原核生物中的更为复杂。NCG被认为在建立真核生物和原核生物之间的差异中起着关键作用。近年来,持续的研究表明,NCG衍生的肽具有可观的生物学功能,涵盖了各个领域。NCG肽在真核生物和原核生物之间建立差异的方式将在下面详细讨论。

NCG肽促进胚胎发育

胚胎发育要求基因以有序的方式表达。62此过程称为基因编程,涉及多方面的监管。来自NCG的63种肽可以暂时调节这一过程。例如,上述pri肽在胚胎发生过程中显示组织和时间特异性表达,其敲除对胚胎发育具有致命性。46表达的Svb保持抑制状态,直到pri肽表达开始。64因此,pri肽对表皮形态发生提供了准确的时间控制。类似地,人类中Gm7325的转录物标注为长的非编码RNA(lncRNA),实际上,它可以翻译成84个氨基酸的多肽Minion 65,也称为Myomixer(表1)。66在C2C12成肌细胞分化过程中,Myomixer / Minion的表达上调,在成肌细胞融合后下调。就作用机理而言,Minion与Myomaker共同促进单核成肌细胞的融合,这对于胚胎发生过程中骨骼肌的形成至关重要。尽管Myomixer / Minion不会影响Myomaker的表达水平,但在没有Myomixer的情况下,Myomaker无法诱导肌细胞融合。结合表达的时间特异性,Myomixer / Minion充当Myomaker开关,在特定时间点协同作用。6768lncRNA 1500011K16Rik(在小鼠中)或LINC00116(在人类中)也产生了另一种微型肽MPM(线粒体中的微型肽)。MPM,也称为线粒调节蛋白(Mtln),可促进成肌分化,并对肌肉的生长和再生具有诱导作用。在机制上,增强线粒体呼吸的基因的异位表达可以挽救MPM干扰诱导的表型,从而提供证据表明MPM在肌肉组织发育和损伤后再生中的作用与MPM在线粒体呼吸中的作用有关。69此外,蹒跚学步肽(也称为Apela)作为信号传导途径分子起作用(表1),可激活APJ / Apelin信号传导,促进胃排泄运动,52并调节斑马鱼Nodal信号传导下游的中胚层细胞迁移。使用CRISPR / Cas9的70种功能丧失试验表明,Apela对小鼠胚胎发育也具有广泛的影响。71

NCG肽调节生理活性

据报道,一组源自NCG的多肽可精细调节肌肉的正常活动。在小鼠和人类中,肽DWORF的转录物(表1)均被标注为lncRNA。与SLN,PLN,MLN和SCL肽类似,DWORF主要分布在心脏中并与SERCA相互作用。应当指出的是,MLN肽在所有骨骼肌中都有表达[ 72],而SCL肽在体肌和胚后心脏中都有表达。73DWORF可以减轻这四种肽在体外对SERCA的抑制作用。在体内,DWORF和PLN相互竞争,共同维持了心肌细胞收缩力的动态调节,从而在外部环境变化期间增强了心脏的泵血功能。74该功能举例说明了小分子即NGC肽进行精细调节的典型情况。NGC肽在细胞生物学水平上也很重要。LINC01420 / LOC550643 RNA被认为是非编码RNA,但实际上,它编码称为P体解离多肽(NoBody)的非注释多肽(表1)。)。该肽与P-抗体的数量负相关。此外,NoBody可以直接与脱盖4蛋白的增强子(EDC4)接触,以在无义介导的衰变(NMD)期间诱导底物的降解。75种 NCG肽也会影响细胞代谢。如上所述,MOTS-c对与代谢和炎症相关的基因的表达具有重大影响。MOTS-c治疗可防止饮食引起的肥胖症以及小鼠中与年龄或高脂饮食相关的胰岛素抵抗。MPM / Mtln广泛调节线粒体膜电位Ca 2+代谢能力和ROS水平,并增强了功能复合物的稳定性和组装性,使其成为线粒体膜上的分子伴侣,从而增强了呼吸效率。76 Mtln还与Cyb5r3合作影响脂质代谢。Mtln基因敲除小鼠的呼吸超复合物中复合物I的减弱也可能导致由Mtln缺乏引起的Cyb5r3相关脂质代谢的变化。77 MOXI是小鼠MPM / Mtln的同源肽,可通过增强脂肪酸β-氧化来调节线粒体氧化和能量稳态,从而提高运动耐量。78通过IP分析发现了两种与Mtln直接相互作用的蛋白质(参考文献7778); 然而,表型变化的全部范围不能仅由两种蛋白质导致的Mtln表达变化来解释。对MPM / Mtln / MOXI作用机制的进一步探索可能揭示其他作用机制,这进一步说明了NCG肽研究的重要性。

NCG肽参与应激反应并促进组织修复

当细胞暴露于明显的环境变化或大分子损伤时,它们会经历一系列适应性变化,这会对基因表达产生影响,从而增强在不利条件下的抗损伤能力和生存能力。7980的一组调节系统的有助于基因表达的变化,8182和现在NCG肽可以被添加到该组。C / EBP同源蛋白(CHOP)mRNA 5'UTR中的序列保守uORF可以翻译为31aa或34aa的肽(表1),从而抑制了CHOP下游ORF的翻译无压力条件下的蛋白质。83但是,在胁迫条件下,eIF2的磷酸化降低了uORF翻译的水平,从而减轻了抑制作用。因此,CHOP表达水平相对提高。84尽管两个uORF参与激活转录因子4(ATF4)的调控,但也涉及类似的机制。从mRNA的5'UTR扫描的核糖体首先遇到uORF1,然后遇到uORF2。两个uORF彼此相距很远,因此两者都可以翻译。但是,由于uORF2与主要下游ATF4 ORF紧密接近,核糖体无法及时恢复重新初始化的能力,因此,主要下游ATF4 ORF的起始密码子被跳过,AFTF4不被翻译。在应激条件下,核糖体的重新启动效率甚至更低:uORF1翻译后,核糖体无法在uORF2的起始密码子处重新组装,因此,跳过了uORF2。相反,一些核糖体在遇到主要ATF4 ORF之前会重新组装,从而导致ATF4表达。85为了分析uORF的影响,应考虑起始位置和距主要ORF的距离。此外,抑制uORF翻译消除了UPF1依赖的无义介导的mRNA衰变(NMD),提高了IFRD1 mRNA在应激条件下的稳定性。86此外,结合免疫球蛋白(BiP)的mRNA的5'UTR中的uORF可以在应激过程中以亮氨酸起始和依赖eIF2A的非传统翻译方式翻译成9 aa肽(表 1)。反应,在压力下促进Bip翻译。29实际上,5'UTR中uORF的许多翻译起始位点是非典型的,可能代表了uORF在整合应激反应(ISR)中的其他作用机制(图6)。8788

图6:uORF可以通过三种方式参与ISR反应,以促进减轻压力损害或触发细胞凋亡的基因的表达。
图6

在没有压力的情况下,uORF会通过核糖体失速(1)和促进UPF1依赖性mRNA衰变(2)来抑制编码区蛋白的表达。应激后,uORF表达下调,抑制作用降低,导致编码区蛋白表达增加。此外,压力会上调eIF2A水平(140)并导致uORF的组成性翻译,从而促进编码区蛋白的翻译(3)。

NCG衍生的肽以多种方式参与应激反应,以防止受到外部损害。一旦发生损伤,其他NCG肽可以通过不同的机制促进组织修复。从LINC00961翻译而来的SPAR使v-ATPase–Ragulator–Rags超复合物稳定,从而抑制mTORC1激活以响应氨基酸刺激。当肌肉受到外部环境刺激而受损时,SPAR肽(表1)的表达受到抑制,从而上调mTORC1信号通路,从而促进损伤修复和组织再生。89前述的Minion / Myomixer蛋白在没有损伤的成年小鼠中不可检测,但在组织再生期间变得明显上调。机械上,Minion / Myomixer和Myomaker共同诱导细胞融合,从而促进肌肉再生。6566

NCG肽调节肿瘤的发展

迄今为止,尚未完全阐明肿瘤发生的机制。然而,越来越多的机制进行了探讨,9091包括那些参与NGC肽的作用。丙酮酸激酶M1(PKM1)还原为PKM2在癌症中很常见,这有益于需氧糖酵解并为肿瘤发生创造了优势。9293中检测HnRNP A1是一种剪接因子的抑制列入丙酮酸外显子9的激酶M,其促进PKM2的形成。9495 LncRNA HOXB-AS3可以被翻译成53个氨基酸组成的肽(表1可以直接与hnRNP A1中的RGG结构域结合,从而促进hnRNP A1与PKM mRNA的外显子9结合,从而抑制PKM2的形成以诱导肿瘤抑制作用。96因此,代替lncRNA HOXB-AS3的HOXB-AS3肽起抑制肿瘤形成的竞争作用,通过直接结合另一种蛋白质提供了NCG肽功能的另一个例子(图7)。另外,circPPP1R12A通过激活Hippo-YAP信号通路来促进癌细胞的增殖,迁移和侵袭,从而增强结肠癌的发生和转移。97此外,SHPRH-146aa和FBXW7-185aa均充当肿瘤抑制基因,并可用作独立的预后标志物。3839β-catenin-370aa作为致癌基因,通过保护全长β-catenin免受GSK3β介导的降解,促进Wnt途径的活化,从而促进肝癌的生长和转移。40与小的整体膜开放阅读框架1(称为CASIMO1)相关的癌症转录本被认为没有编码功能,但实际上编码84 aa整体膜微蛋白(表1)。CASIMO1肽可以通过下游SQLE / MAPK / ERK信号通路促进细胞增殖,并在增殖期诱导细胞比例的增加。此外,CASIMO1还通过影响细胞骨架来影响肿瘤细胞系的迁移能力。98伪基因是蛋白质编码基因,选择压力的丧失使它们经历有害的突变,导致组织变性并最终转变为遗传化石。99100。然而,NANOG的11个假基因之间,NANOGP8在多种癌症细胞系和组织中表达,101,其中它在肿瘤发展中起重要作用。102

图7:HOXB-AS3肽代替HOXB-AS3 lncRNA抑制了肿瘤的发展。
图7

生成HOXB-AS3 ORF,5'UTR-ORF和5'UTR-ORFmut构建体以研究HOXB-AS3肽和lncRNA对癌症进展的影响。HOXB-AS3 ORF和5'UTR-ORF构建体均表达HOXB-AS3肽。5'UTR-ORFmut包含突变的HOXB-AS3起始密码子,因此不编码HOXB-AS3肽。所有这些构建体都被转染到CRC细胞中,而CRC细胞很少表达HOXB-AS3肽。NC组是阴性对照,未通过构建体转染。一个肿瘤细胞异种移植物测定法显示出肿瘤细胞在NC和5'UTR-ORFmut组的体内生长优于它是在ORF和5'UTR-ORF的基团。b尾静脉注射的转移性肿瘤模型显示,HOXB-AS3 ORF和5'UTR-ORF组也促进了肿瘤转移。c b所示的肺转移灶的组织学分析

致病性和NCG肽在靶标治疗中的潜力

多种疾病的发病机理仍不清楚,同时,其治疗也不令人满意。NCG肽可能支持一个新的视角,从中可以查看疾病的潜在机制。以上述CASIMO1肽,circPPP1R12A-73aa和β-catenin-370aa为例,人内源NCG肽的异常表达可能引起包括癌症在内的疾病。源自病原微生物的NCG肽也可以促进疾病的发展。HPV病毒circE7编码的E7蛋白可以促进CaSki宫颈癌细胞的生长和致瘤能力,而circE7本身不能。103

除了提供有关致病性的新观点外,NCG肽还是靶向治疗的有希望的靶标。在这方面已经取得了一些成就。MOTS-c肽治疗可抑制小鼠模型中的骨溶解,这在骨溶解和其他炎症疾病的治疗中具有潜力。104 MOTS-c肽的治疗还可以增强急性冷暴露后的冷适应能力,并为与冷应激相关的疾病提供潜在的治疗药物。105此外,MPM在线粒体呼吸和肌肉形成中的作用使MPM成为肌肉营养不良疗法的潜在靶标。69就肿瘤靶向治疗而言,NCG肽,例如SHPRH-146aa,FBXW7-185aa和HOXB-AS3肽,可以用作肿瘤靶向治疗药物。PINT87aa也是如此。Linc-PINT同时生成圆形circPINTexon2,而circPINTexon2生成87个氨基酸的肽PINT87aa。PINT87aa直接与聚合酶相关因子复合物(PAF1c)结合,并抑制PAF1c下游的几种癌基因,包括CEBP1,cyclin D1,C-myc,Sox2等。在生物学功能上,PINT87aa的过表达可以在体外和体内抑制胶质母细胞瘤。106理想的靶向治疗药物应有效杀死或抑制肿瘤细胞,同时不损害正常组织细胞。这些抗肿瘤NCG肽是天然靶向治疗药物,与传统药物诱导的细胞毒性相比,具有明显降低的细胞毒性,并且免疫原性大大降低。此外,相对较小的分子量使其比传统的肿瘤抑制蛋白更可能被开发为药物。随着适用材料的发展,这些肽可以被合适的载体包装并被递送到肿瘤细胞中,在那里它们可以特异性地抑制肿瘤细胞。107NCG肽在肿瘤免疫治疗中也具有巨大潜力。理想的肿瘤特异性抗原(TSA)使T淋巴细胞能够正确识别肿瘤细胞,而理想的肿瘤特异性抗原是免疫治疗领域的关键因素。在全基因组范围内搜索TSA时,发现NCG肽是可靶向TSA的主要来源。根据NCG肽开发的肿瘤疫苗使小鼠能够抵抗肿瘤,这表明NCG肽可以用作肿瘤免疫疗法(尤其是肿瘤疫苗)中的治疗靶标。108109

挑战与未来趋势

NCG肽挑战编码基因的已知特征

发现最初发现的NCG以非编码转录本的形式起作用,而不是通过翻译成肽或蛋白质起作用。110111112然而,后来,发现一些凝气具有编码功能,且因此应被定义为编码基因。例如,pri-miRNA(miRNA的主要转录物,定义为NCG)可以编码肽产物。113个 Pri-miRNA具有类似于传统mRNA的结构,包括5'-cap和3'-poly(A)尾巴。114以pri-miR165a和pri-miR171b作为NCG实例,可以将它们翻译成肽(表1)以促进自身的转录。进一步的分析表明,两者都是“古老的miRNA”,115个在许多物种中都是保守的,而不是“最近的miRNA”,后者更具物种特异性。116与circRNA衍生的SHPRH-146aa和FBWX7-185aa一起,线粒体基因组衍生的MOTS-c,lncRNA衍生的MLN和DWORF等的相应基因先前被定义为NCG,但能够编码肽。这些特性的发现挑战了NCG研究中产生的先前观点以及编码基因的已知特征。

此外,某些NCG具有双重作用。在某些情况下,它们充当NCG,但在其他情况下,它们编码肽。例如,在果蝇,奥斯卡发挥其通过翻译成蛋白质的作用在胚胎阶段,117118和充当早期卵子发生过程中的非编码RNA。119在哺乳动物中,SRA基因,其被视为NCG,起着共活化核受体中起重要作用120121和增强转录因子。122已发现一种新的同工型SRA1既可作为NCG又可作为编码基因,并且这两个基因状态共存于同一细胞中。123对于此类NCG,许多问题仍未得到解答。例如,在什么情况下NCG充当NCG。它们什么时候可以翻译成功能性肽?哪些因素决定编码和非编码形式之间的平衡?这些问题也适用于pri基因,该基因仅在胚胎发育的特定阶段表达。例如,Minion / Myomixer肽在未受伤的肌肉中不存在,但在受伤的肌肉中存在。68在另一个例子中,CASIMO1肽在肿瘤中被上调并有助于肿瘤发生,但在健康组织中被下调。98因此,了解NCG在编码和非编码形式之间切换的机制和因素以及促进或抑制NCG肽表达的条件至关重要。因此,获得这样的理解是一个巨大的挑战,并且也应该是未来的重点领域。

确切的数目和调节机制尚不清楚

传统定义的NCG占整个基因组的90%以上。但是,尚不清楚潜在编码NCG的确切数量。搜寻NCG编码的肽主要使用两种方法。一种是通过生物信息学分析来预测NCG的编码潜力,然后进行实验确认[ 124],另一种是通过质谱法鉴定这些肽,然后将其与基因组DNA相关联。125

在第一种方法中,生物信息学分析有助于针对特定的基因进行进一步确认,并且是后续实验的基础。但是,许多困惑使这种方法的成功感到困惑。例如,可以编码肽的NCG的特征是什么?当转录本与核糖体结合时,它是翻译成功能性肽还是由于概率结合而随机进行翻译?另外,需要一致的标准以通过这种方法促进研究。在第二种方法中,由于NCG肽产物比传统功能蛋白具有更高的组织特异性或状态特异性,因此NCG肽更容易受到细胞外刺激的影响。从而,仅在无压力状态或特定细胞系中探索NCG的表达可能会导致许多肽未被发现。例如,linc00689衍生的微型肽STORM(应力和TNF-α激活的ORF微型肽)的翻译(表1),取决于TNF-α激活哺乳动物Ste20样激酶(MST1)后的eIF4E磷酸化。126如果仅使用质谱法绘制静止状态的蛋白质谱图,则会错过该肽的发现。同时,通过对编码机制的深入研究,很可能会发现肽翻译的新机制和新模型,从而完善和丰富了非AUG起始的翻译机制等中心法则。127128在一些凝气重复多肽此外,非-AUG启动平移机构可直接引起的疾病。129130另外,circRNA的环结构使它们能够逆转基因序列中起始密码子的序列和终止密码子,这极大地丰富了ORF的数量。34

因此,生物信息学分析标准的发展和实验验证系统的建立也将是该领域的未来挑战。我们需要在边界环境中探索这些肽,以鉴定和表征它们。

隐藏的功能和应用程序需要被发现

基因表达在多个水平受到调控。与mRNA水平的调节相比,蛋白水平的调节不涉及蛋白量的变化。NCG肽直接与功能蛋白相互作用,因此适应短期的细胞外作用,而mRNA水平的调节更倾向于长期适应。因此,需要进一步探讨NCG肽在基因表达中的调控。NCG肽的长度不同,并且在功能机制上灵活。mRNA对应于功能蛋白。我们是否可以将具有相同作用模式的肽(例如MLN,DWORF和Nobody)分组,仍是未知的。这些NCG肽通过影响结构蛋白发挥功能,因此,我们认为它们可以称为非结构功能肽。此外,目前尚不清楚这种作用方式是否是NCG肽的通用机制。因此,对这些肽的作用方式和机理的研究在将来也将是一个挑战。NCG比编码基因要多得多。131随着对新机制和新模型的不断探索,将发现越来越多的肽。这种肽的数量可能比到目前为止我们发现的蛋白质或肽分子的数量大得多。一方面,NCG肽为打开生命之谜打开了大门的新钥匙。另一方面,它们可能成为疾病治疗的治疗目标。由于其时间或组织特异性,NCG编码的肽也是时间特异性的,并以特定的疾病状态表达。因此,NCG肽为疾病干预提供了潜在的靶标。但是,这些努力尚未开始。通过对NCG肽的深入研究,我们对生物体发育或疾病干预(包括肿瘤治疗)的理解必将进入一个新时代。

NCG肽在现实世界研究中的潜在应用

实词研究(RWS)补充了从传统临床试验获得的数据。132133 NCG-肽的研究尚处于起步阶段,与NCG肽的医药产品尚未在RWS研究使用。应该做出更大的努力来实现NCG肽的临床翻译。由于不干预是RWS的一项功能,因此在寻找NCG肽时必须进行实验干预。如何探索NCG肽在天然状态下的作用将继续是一个挑战。

结束语

越来越多的NCG的已经被验证为具有译码功能134135提供的生命活动的深入了解和补充蛋白质或肽分子的现有库。表观遗传学和选择性剪接表明,复杂的人类基因组比原先认为的还要复杂。136137非编码RNA的出现开辟了一片新的天地蛋白表达的调节,极大的丰富了生命活动的复杂性。138139NCG还可以编码肽,这无疑为更深入地解释生命的内在规律提供了新的方向。随着发现更多的NCG肽,新的机制和关键分子可能会因此被揭示出来。这项工作的成功不仅帮助我们解释了许多生理和病理现象的调节过程,而且还带来了促进疾病理解和干预的新观念。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297