编辑丨coisini
最近几年,生成式人工智能迅速发展,人们在看到机遇的同时也看到了风险。由于训练数据的质量直接影响模型性能,如果训练数据包含有害内容,AI 系统可能会继承甚至放大其负面影响。人们开始担心 AI 会对人类造成威胁。
但如果我们把思路打开,让这种威胁作用于「细菌」上呢?
最近,麻省理工学院(MIT)生物工程教授 Jim Collins 领导的研究团队证明:在大量抗菌物质数据集上训练的生成式 AI 算法,可以帮助科学家构想出数百万种具有杀菌潜力的新型分子,并且其中部分分子在小鼠实验中展现出显著效力。
研究论文以《A generative deep learning approach to de novo antibiotic design》为题发表于《Cell》上。
论文地址:https://www.cell.com/cell/abstract/S0092-8674 (25) 00855-4
分子设计
研究团队利用 AI 模型生成理论上可行但尚未存在或未被发现的分子结构,从而探索潜在药物化合物。
研究团队双管齐下:一方面引导生成式 AI 算法基于特定抗菌活性化学片段设计分子;另一方面让算法从头生成不受片段限制的分子结构。
在片段导向方法中,该研究使用 GNN 对超过 4500 万个化学片段进行计算机模拟筛选,识别出对淋病奈瑟菌和金黄色葡萄球菌具有选择性抗菌活性(预测)的片段。为了将片段扩展为分子,研究团队将其输入两类生成算法 —— 基于化学合理突变(CReM)的遗传算法和变分自编码器(VAE)。
在从头生成方法中,该研究取消片段输入要求,让 CReM 和 VAE 模型基于训练获得的知识自主设计分子。
这些模型共同生成了超过 3600 万个未被收录的、具有预测抗菌活性的化合物。
合成与验证
虽然分子设计顺利进行,但随后研究遇到了「巨大瓶颈」:这些预测抗生素绝大多数无法在实验室实际合成。
经过筛选,研究团队合成了 24 种化合物,并通过实验验证其中 7 种具有抗菌活性。
特别是,NG1 和 DN1 两种化合物展现出高效力和高选择性,其作用机制区别于临床常用抗生素,并在小鼠感染模型中证实有效。
此项研究开辟了一条新路径 —— 生成式 AI 平台不再从现有化学库中挖掘潜在抗生素,而是从头开始凭空创造出数据库从未记载的全新分子结构。「这标志着 AI 从发现工具转变为设计工具」,Jim Collins 表示。
更进一步讲,该研究不仅能够助力抗菌化合物的研发,还能推动对庞大未知化学空间的探索。
参考内容:
https://phys.org/news/2025-08-generative-ai-compounds-drug-resistant.html
https://spectrum.ieee.org/ai-drug-design-mit-antibiotics?utm_source=homepage&utm_medium=hero&utm_campaign=2025-08-14&utm_content=hero3