2026生物医药产业合作大会关注到一项来自弗朗西斯·克里克研究所的重要研究进展:含内在无序区域(IDRs)的蛋白质需受到严格调控以维持细胞稳态。适应性筛选显示,这类蛋白剂量上调更易产生毒性,尤其在其具有形成无膜凝聚体倾向时更为显著。在酵母体系中,单个含IDR蛋白水平升高所引发的毒性,与其发生相分离并形成生物分子凝聚体的能力密切相关。与膜结合细胞器参与的调控路径相比,对于这些易凝聚蛋白如何在无膜环境中实现集体表达调控的机制仍缺乏系统认识。

图片来源:BioArt
Nature 最新论文由 Jernej Ule 与 Rupert Faraway 团队发表,提出一种名为“交互稳态(interstasis)”的新稳态框架:当RNA-蛋白质凝聚体中的蛋白浓度升高时,会诱导其自身mRNA的核内隔离,从而限制蛋白进一步合成。团队指出,这种集体调控依赖于IDRs中短基序的分子语法,以及LCD(低复杂度结构域)中氨基酸理化性质的相似性。由于LCD常包含重复的氨基酸排列,作者假设这类结构域的编码序列也可能在密码子层面呈现重复与相似性,形成可量化的RNA“多价性”特征。他们为此构建了GeRM(generalized RNA multivalency)算法,用于评估mRNA序列各位置的多价性得分,并系统应用于人类转录组。
分析显示,高GeRM区域显著富集编码LCD与IDR的序列,提示蛋白结构特征(无序性)与其对应mRNA的序列组织方式(多价性)之间存在内在对应关系。通过同义密码子替换后重新计算GeRM得分,作者发现天然密码子选择明显倾向于维持高多价性;进一步跨物种对比也显示,最能提升局部多价性的密码子在进化过程中更为保守。
为解析不同类型的RNA多价性是否对应不同LCD类别与蛋白功能,作者根据高GeRM区域的k-mer组成进行无监督聚类。不同类别对应不同的LCD氨基酸组成,并富集于不同生物学功能。精氨酸广泛存在于LCDs中,并拥有6个密码子。针对精氨酸富集区域(R-LCDs),研究进一步区分了两类密码子偏好模式:使用AGA、AGG、CGA等GA-rich密码子的R-LCDs,以及使用CGC、CGG等CG-rich密码子的另一类。GA-rich类对应R-MCDs(精氨酸富集的混合电荷结构域),富含其他带电氨基酸,并显著关联核 speckle 分布与RNA结合活动,这种偏好在陆生脊椎动物中尤为突出。
为了验证R-MCD蛋白积累是否会影响核 speckle 及相关mRNA的蛋白产量,作者在HeLa构建可诱导表达模型R-MCD蛋白的系统,通过亚细胞分级测序、HCR-FISH 与 pSILAC监测其影响。他们发现GA-rich、且具有高多价性的mRNA会被剂量依赖性滞留在细胞核、特别是核 speckle 中,而非多价mRNA则不受影响;随之对应,这些被滞留mRNA的翻译效率显著下降。进一步通过携带不同多价性3’UTR的报告基因验证,只有高多价性3’UTR的构建体在R-MCD过表达背景下出现蛋白产量降低。被协同调控的蛋白质特点包括更长的IDRs、更高的带电氨基酸密度与更高的相分离倾向。
作者进而探究为何部分GA-rich mRNA并未被滞留。他们使用机器学习预测滞留概率,结合一个设计含65,536种变体的合成报告基因库,发现CDS长度、平均外显子长度(反映EJC密度)与多价性同等关键。结果显示,CDS越长、平均外显子越长、EJC越稀疏,再叠加高多价性序列,mRNA越容易发生核滞留。
机制层面,研究通过公共CLIP数据与定制iCLIP结合siRNA敲低与成像分析,鉴定出TRA2为介导GA-rich多价mRNA核 speckle 招募的关键效应器。为了验证该回路是否可由上游信号调控,作者使用CLK激酶抑制剂,使TRA2B去磷酸化并富集于核 speckle,从而模拟R-MCD过表达表型。该结果说明interstasis并非固定回路,可被细胞信号动态调节。

图片来源:BioArt
这项研究提出“凝聚体作为传感器”的概念,为“蛋白–RNA集体自调控”提供了首个机制模型,揭示了遗传密码、RNA多价性、蛋白相分离及表达调控之间的深层逻辑关系,并为IDR相关聚集性疾病(如AD、ALS等)开辟新的靶点思路。2026生物医药产业合作大会关注到该方向在聚集病、RNA调控靶点以及精细化蛋白表达控制领域的潜在产业价值。
文章来源:BioArt

