融合图神经网络与无监督语言模型,对RNA-蛋白质相互作用精准预测
创始人
2025-03-10 18:41:54
0

编辑丨&

在遇到未知的蛋白质与 RNA 时,通常不易准确的计算测定 RNA-蛋白质相互作用。RNA 的有限数量及其灵活性限制了深度学习模型用于 RNA-蛋白质相互作用预测的有效性。

华中师范大学物理研究所对此有全新的研究成果。研究者与美国华盛顿大学和达特茅斯学院进行合作,推出了一种名为 ZHMolGraph 的模型,它集成了图神经网络和无监督大型语言模型来预测 RNA-蛋白质相互作用。

他们在两个基准数据集上验证了 ZHMolGraph 的预测,并超越了当前的最佳方法。对于完全未知的 RNA 和蛋白质的数据集,ZHMolGraph 显示,在实现 79.8% 的高 AUROC 和 82.0% 的 AUPRC 方面有所提高。

这些增强功能使 ZHMolGraph 成为全基因组 RNA-蛋白质预测的可靠选择。ZHMolGraph 在建模和设计 RNA-蛋白质复合物方面具有广泛的潜力。

他们的研究以「RNA-protein interaction prediction using network-guided deep learning」为题,于 2025 年 2 月 16 日刊登于《Communications Biology》。

RPI 网络

RNA-蛋白质复合物对于许多细胞过程至关重要,包括基因转录和转录后基因调控。由于 RNA 突变迅速,及时确定 RNA-蛋白质复合物的结构可能并不容易。因此,迫切需要利用现有的 RNA-蛋白质相互作用网络和测序数据快速识别 RNA 的蛋白质结合对象。

最先进的 RNA-蛋白质相互作用 (RPI) 预测方法主要依赖于传统的机器学习和深度学习技术。深度学习模型用于从 RPI 网络中的节点度数学习模式。在测序规模数据上的 LLM 的帮助下,ZHMolGraph 克服了有限结合数据带来的限制,增强了其对未知和蛋白质对的泛化性。模型的改进在帮助预测 RNA-蛋白质结构方面表现出潜力。

图示:构建 RPI 网络的工作流程。(图源:论文)

搭建模型的工作旨在改进 RNA-Protein RPI 预测。他们首先使用使用结构化、高通量和文献挖掘验证数据构建了三个不同的网络,以了解 RPI 的特征。其次采用了名为 ZHMolGraph 的深度学习管道,它可以利用无监督 LLM 节点特征的网络采样学习策略来优化对 RNA 和蛋白质结合特性的探索。

ZHMolGraph 框架与 RPI 网络的特点

图示:ZHMolGraph 框架概述。(图源:论文)

在分析了结构网络的拓扑结构后,他们发现与结构网络中的所有节点、蛋白质和 RNA 相关的相互作用呈肥尾分布。在高通量和文献挖掘验证网络中也有类似的发现。

研究表明,RPI 网络具有无标度拓扑。它突出显示了网络内节点的连接首选项的差异。高通量和文献挖掘验证的网络也表现出反相关和幂律衰减模式。在所有三种类型的网络中,高度节点的公共邻居数量通常不会比低度节点多得多。

在分析了各种来源的网络特性后,研究者们观察到 RPI 网络表现出无标度特性和高模块化。这些发现表明了复杂 RPI 网络中的秩序感和一致性,并为其复杂的拓扑结构提供了新的视角。RPI 复杂网络系统显示定义明确的连接关系,允许大型语言模型映射短语之间的关联并推断复杂体之间的交互。

图示:ZHMolGraph 在基准测试数据集上的整体性能。(图源:论文)

RPI 网络节点到达新节点的能力与它们各自的程度直接相关。这一结果表明 RNA 和蛋白质节点在 RPI 的进化中是首选的。

除此之外, LLM 和 GNN 的嵌入可以相互补充,弥补每种方法在基准测试中各自的局限性。在跨物种建模中, ZHMolGraph 有效地最大限度地减少了对特定 RNA 和蛋白质家族的潜在结构偏差。

功能繁多使用灵活的模型

ZHMolGraph,通过结合无监督 LLM 语言模型和图神经网络来提高准确性和泛化性。在与其他深度学习方法进行对比之后,全新的模型展示出了它明显的性能提升。

现如今可以利用 ZHMolGraph 来帮助预测 RNA-蛋白质复合物结构。ZHMolGraph 可以识别界面中 RNA 和蛋白质结合在一起的序列。

尽管 ZHMolGraph 有助于识别 RPI 与序列信息的相互作用,但结合现象主要取决于分子的三级结构。通过结合驱动 RNA-蛋白质结合的高阶分子特性,这一进展将进一步提高 ZHMolGraph 的预测准确性,从而可以更详细地分析 RNA-蛋白质残基和核苷酸之间的物理相互作用接触。

与其他最先进的方法相比,ZHMolGraph 表现出高准确性和泛化性,即使对于未知节点数据集也是如此。ZHMolGraph 是一种可靠的工具,可用于在全基因组范围内确定 RNA-蛋白质相互作用,并准确预测近天然 RNA-蛋白质结构。

原文链接:https://www.nature.com/articles/s42003-025-07694-9

代码链接:https://github.com/Zhaolab-GitHub/ZHMolGraph

相关内容

热门资讯

科技“整活”文化,这届文博会含... 当AI咖啡师递来一杯拉花精准的拿铁,当“硬核”机械臂现场挥毫泼墨,当隔空“打鼓”成为现实——走进第二...
人工智能技术在地铁运营场景中的... 今天分享的是:人工智能技术在地铁运营场景中的典型应用 报告共计:26页 人工智能技术在地铁运营场景中...
企业积极布局深海科技产业 海底... 本文转自【央视网】; 央视网消息:随着深海科技产业的不断发展,相关企业也在积极布局,抢抓深海科技产业...
原创 近... 不得不说,5月上市的手机新品确实有点多,不知道有多少产品能让各位留下印象呢?有些产品甚至刚发布没多久...
格力电器获得发明专利授权:“防... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“防腐...
新奥科技申请物料注入装置及聚变... 金融界2025年5月24日消息,国家知识产权局信息显示,新奥科技发展有限公司申请一项名为“物料注入装...
狠砸200亿,固态电池巨头,弯... 固态电池,新突破! 在刚刚过去的5月16日,国轩高科成功举办了2025全球科技大会。会上,公司新产品...
广东文化产业,让AI打上工了 ... 5月22日 第二十一届中国(深圳)国际文化产业博览交易会正式开幕 新设人工智能展区 全馆预计有60余...
熙鹏航空取得手提式天平秤专利,... 金融界2025年5月24日消息,国家知识产权局信息显示,成都熙鹏航空机械设备有限公司取得一项名为“一...
智能电网重大突破,多项技术革新... 构建智能电网是引领能源转型和促进可持续发展的核心举措。最近,在技术革新及推广应用等方面,智能电网的发...
智能家居生态互联来袭,你的家准... 智能家居生态互联正逐渐融入人们的日常生活,成为不可或缺的一部分。它通过将各种智能设备互联互通,使设备...
万兴科技火爆亮相文博会 现场演... 5月22日至26日,第21届中国(深圳)国际文化产业博览交易会(以下简称“文博会”)在深圳盛大举办。...
南昌市图书馆成功举办 “新技术... 吴玉灵老师为全体参训人员授课 为适应新时代图书馆的服务需求,提高南昌市公共图书馆工作者的业务能力,南...
昆山成亚印刷取得模切机上料装置... 金融界2025年5月24日消息,国家知识产权局信息显示,昆山成亚印刷有限公司取得一项名为“一种模切机...
全国首单!低空检测设备保险在渝... 5月24日,上游新闻记者获悉,全国首单低空航空器机载检测设备损失补偿保险同时在重庆、雄安两地落地,为...
科普建筑的“阿鹏哥哥”:做沉淀... 新华社北京5月23日电 5月23日,《新华每日电讯》发表题为《科普建筑的“阿鹏哥哥”:做沉淀下来播撒...
鸟类声纹识别系统 鸟类鸣声数据... 鸟类声纹识别系统背景 生物多样性是人类生存和社会发展的基础,是生态文明建设和民族永续发展的保障;生物...
甲骨文400亿美元购英伟达芯片... 【5000 亿美元“星际之门”项目首站:甲骨文 400 亿美元助力 OpenAI 打造全球最大 AI...
传统与现代辉映 科技与文化交融... 来源:光明网-《光明日报》 “今年文博会上,咖啡师都变机器人啦!不但能现磨咖啡豆,还能做手冲、拉花咖...
驼峰500HS全球首发,获30... 重庆驼航科技在第十届深圳国际无人机展览会上,以“驼峰,特种低空物流先锋”为主题,完成驼峰500HS纵...