首个能够从零开始自动化设计和生成虚拟细胞模型的多智能体系统来了!
近日,美国耶鲁大学马克·格斯坦(Mark Gerstein)教授、斯米塔·克里希纳斯瓦米(Smita Krishnaswamy)教授、唐相儒,宾夕法尼亚大学黄治教授、崔岩,斯坦福大学吴方,哈佛大学林希虹教授,以及德国慕尼黑亥姆霍兹中心法比安·泰斯(Fabian Theis)教授、汪伟旭等组成的联合团队,在预印本平台 arXiv 上传了题为《CellForge:虚拟细胞模型的智能体化设计》(CellForge: Agentic Design of Virtual Cell Models)[1] 的研究论文。
图丨相关论文(来源:arXiv)
该多智能体系统不仅可用于虚拟细胞建模,还可以被广泛地用于 AI for Science 的各类模型设计。这项成果在 AI for Science 的方法论上迈出了关键一步,也为单细胞组学、药物研发和合成生物学提供了一条新的自动化科研路径。
图丨马克·格斯坦(Mark Gerstein)教授(来源:资料图)
CellForge 可直接输出用于虚拟细胞建模等 AI for Science 任务的网络模型架构。具体而言,研究人员只需输入原始单细胞多组学数据及任务描述(如指定对照与扰动条件,或提出构建新扰动模型的指令),CellForge 便能自动生成优化后的模型,并输出包含训练与预测的可执行代码。
与传统人工设计模型的方法不同,CellForge 的独特之处在于其“多智能体架构”。CellForge 由多个专家型 Agent 共同协作,每个 Agent 扮演不同角色,例如数据专家、模型设计师、生物学家和模型训练专家。它们通过多轮辩论和批判性讨论,逐步收敛到最优的设计方案。
这一过程高度模拟了现实科研中的跨学科团队合作:研究人员往往需要通过查阅文献、交流实验思路、比较优缺点,最终凝聚出一个合理的研究计划。CellForge 将这一过程转化为内部的 Agent 协作,从而实现了完全自动化的模型构建流程。
在定量实验中,CellForge 生成的模型在多个数据集和场景下显著超越了此前发表在 Nature Methods、Nature Biotechnology 等期刊的先进单细胞扰动预测模型。
这一流程不仅降低了复杂生物建模的操作门槛,同时也确保了计算模型的科学严谨性,为单细胞组学分析及合成生物学研究提供了一种高效、精准的解决方案。
人体由具有不同功能、不同类型的细胞构成,而细胞的核心特性由其基因表达模式决定。例如,免疫细胞可以对抗炎症或感染,干细胞能够分化成组织,而癌细胞则通过调控基因表达逃逸细胞分裂的控制。细胞的基因表达由 RNA 分子介导,后者是 DNA 转录的直接产物。基因表达不仅决定了细胞的类型,还动态反映了细胞的状态变化。
虚拟细胞建模是当前生物学与人工智能交叉领域的前沿方向,旨在预测细胞对各种扰动(基因编辑、药物处理、细胞因子刺激等)的定量响应。通过研究细胞基因表达的变化,可以揭示细胞如何从健康状态转变为炎症状态甚至癌变状态。然而,构建此类模型面临多重技术挑战。
该研究中,一个重要的突破在于 CellForge 的跨模态能力。单细胞组学数据包括 RNA 测序(scRNA-seq)、染色质可及性数据(scATAC-seq)、蛋白质标记数据(CITE-seq)等多种模态。以往的研究通常针对特定模态开发模型,很难推广到新的数据类型。而 CellForge 通过其任务分析模块自动识别模态特征,并在方法设计阶段生成合适的网络架构,从而展现出跨模态的泛化能力。
在验证测试中,它不仅在 RNA-seq 任务上超过了 scGPT、Geneformer、ChemCPA 等领域代表性模型,还在 ATAC-seq 和 CITE-seq 任务上实现了突破性提升。这种能力对于推动新型实验模态的研究至关重要,因为生物学数据的异质性极高,而 CellForge 的灵活性意味着它能够快速适配不同的研究场景。
研究团队的目标是开发一种基于强大的自进化的多智能体框架的方法,让模型能够根据当前细胞状态和任务,预测之前未遇到过的干扰,并自主设计出之前不存在的且最适合的模型架构。
(来源:arXiv)
CellForge 的工作流程分为三个核心环节:
·首先是任务分析。系统在接收到原始单细胞多组学数据以及研究者提出的自然语言任务描述后,会自动对数据进行表征分析,并检索相关文献,以理解该任务在科学背景中的位置。这一步类似于科研人员做综述和查找先前工作,为后续设计提供知识支撑。
·第二步是方法设计。在这一阶段,多个智能体会像专家团队一样提出各自的建模思路,包括可能的神经网络架构、训练方法和优化方案。随后,它们通过多轮批判性对话不断迭代,直到达成一致意见,生成最优的研究计划。
·最后是实验执行。系统会将最终设计转化为可运行的代码,自动完成数据预处理、模型训练、验证和推理,并输出最终结果。这意味着研究人员只需输入数据和研究目标,CellForge 便能从头到尾产出完整的科研工作流。
图丨 CellForge 架构与工作流程(来源:arXiv)
与以往的 AI 系统相比,CellForge 系统不仅能够提出假设或研究方案,还能让每个智能体根据文献搜索结果提出想法。这些智能体会互相审视对方的方案,并进行多轮(可能多达 10 轮)的批判性讨论,直至方案收敛到最优解。
更值得一提的是,CellForge 具备自动生成可执行代码的能力。这一点在现有 AI for Science 框架中尚不多见。大多数系统往往停留在提出研究思路或提供部分分析,而 CellForge 可以将讨论结果直接转化为高质量的 Python 代码,涵盖数据预处理、模型训练、超参数优化和结果可视化等完整流程。
这意味着研究人员无需再手动编写复杂的代码,而是可以让 CellForge 直接自己运行生成的程序,迅速获得实验结果。研究团队指出,这种“端到端”的自动化能力显著降低了科研门槛,让没有深厚计算背景的生物学研究者也能够使用先进的建模方法。
图丨 CellForge 三个模块的示例输出(来源:arXiv)
为验证 AI 自主设计的网络架构是否能够超越人类的设计,研究团队选择了六个数据集,涵盖基因敲除、药物处理和细胞因子刺激等多种扰动类型,涉及多种模态。研究团队在每个数据集上都进行了三次实验。
在 CellForge 系统中,输入是一个数据集和一个研究问题,系统会根据这个数据集和研究问题输出针对性的模型。虽然任务可能相似,但由于数据集不同,系统会为每个数据集设计一个量身定制的方案。
在系统的内部机制上,CellForge 的关键创新是多智能体的协作优化。每个智能体基于文献检索和数据分析提出方案,其他智能体会对这些方案进行批判和质疑。这个过程可能会反复进行上千轮,直到各方收敛到最优解。
研究人员还为其设计了类似深度优先和广度优先的搜索机制,使智能体在提出方案之前能先进行充分的知识探索,从而提高设计的合理性。这种“批判性共识”机制不仅提升了模型性能,也让生成的方案更具可解释性,避免了单一大模型容易出现的幻觉和偏差问题。
图丨 CellForge 的多 Agent 讨论过程(来源:arXiv)
在性能评估中,CellForge 不仅在单细胞建模任务中显著超越了 scGPT、Geneformer、ChemCPA 等领域代表性方法,还与近期提出的通用科研自动化框架 Biomni 和 DeepResearch 进行了对比。
结果显示,CellForge 在任务特异性和模型生成能力上更具优势,能够输出更高质量、更可执行的研究方案,尤其在人类专家打分和跨模态预测中领先明显。这一差异凸显了 CellForge 针对虚拟细胞建模的深度优化,相较通用框架更贴合生物学实际应用需求。
图丨CellForge 生成结果的专家评估对比(来源:arXiv)
使用过 CellForge 的研究人员对 DeepTech 表示,可基于该系统实现高效的科学突破,无论输入什么样的数据集、任务或研究问题,都能基于此设计出比人类设计的神经网络架构更好的模型,助力科学发现进入规模化时代。
这一突破意味着,AI 可大幅缩短科学发现的周期。过去,设计模型需要花费多达五六年的时间,但现在,AI 系统可以基于之前的工作基础,快速进行科学发现和模型设计。
从应用角度来看,CellForge 的潜力远不止于学术研究。虚拟细胞建模本身是一个关键的前沿方向,其核心目标是预测细胞在基因编辑、药物处理或环境刺激下的响应。传统药物研发流程往往依赖动物实验和临床试验,成本极高且失败率居高不下。CellForge 通过虚拟建模,可以在计算机中提前预测细胞对药物的反应,从而筛选出最有前景的候选药物,减少不必要的试错过程。这种能力有望显著缩短药物研发周期,降低临床试验的失败风险。因此,CellForge 在癌症研究、免疫治疗和干细胞分化等领域都可能成为重要的工具。
研究团队还强调,这一系统不仅仅是科研辅助工具,更是迈向“AI 科学家”的一步。与解决标准化测试题目或优化固定模型不同,CellForge 能够根据数据和任务自主构思全新的网络架构。这种从零设计的能力意味着 AI 不再只是人类的助手,而是具备了独立进行科学探索的潜质。
未来,团队计划将 CellForge 与自动化实验平台结合,使其能够直接控制实验设备,完成从模型设计到实际实验的闭环验证。这一方向一旦实现,将进一步加速科学研究的工业化和规模化进程。
马克·格斯坦教授和唐相儒博士此前的工作为本次开发 CellForge 系统提供了底层技术支持。例如通过开发 Medagents 系统 [2],首次将 AI 多智能体应用于疾病诊断。此外,他们之前还有一项关于 ChemAgent 的研究 [3],探讨了如何利用可自主进化的智能体系统更好地回答量子力学或量子化学等领域的专家级别的复杂化学推理问题。
从长远来看,CellForge 的出现可能改变科研范式。过去,科学发现往往依赖于专家的创造性思维和长期积累,一个新的建模方法可能需要五六年的时间才能从概念走到应用。而 CellForge 这样的系统可以在几天甚至几小时内完成从文献调研到模型设计、代码生成和实验验证的全过程。这意味着科学发现可能进入一种“可扩展”的新模式,即通过算力和智能体协作实现科研的加速与量产。这不仅会提高研究效率,也可能带来前所未有的科学突破。
目前,CellForge 的论文和代码均已公开(https://github.com/gersteinlab/CellForge),研究团队希望全球科研人员能够使用和改进这一系统,共同推动 AI for Science 的发展。正如论文所言,CellForge 的目标不是取代科学家,而是为他们提供一个强大的智能协作平台,让人类与 AI 共同探索未知的生命奥秘。
参考资料:
1.https://arxiv.org/abs/2508.02276
2.https://arxiv.org/abs/2311.10537
3.https://openreview.net/forum?id=kuhIqeVg0e
运营/排版:何晨龙