[Paper] MAC-AMP:一种用于多目标抗菌肽设计的闭环多代理协作系统

发布: (2026年2月17日 GMT+8 01:01)
8 分钟阅读
原文: arXiv

Source: arXiv - 2602.14926v1

概述

本文提出了 MAC‑AMP,一个闭环系统,使多个大型语言模型(LLM)代理能够协同设计抗菌肽(AMP),同时满足多个相互竞争的目标——高抗菌活性、低毒性、结构合理性以及新颖性。通过将肽设计框架化为同行评审式的强化学习循环,作者展示了人工智能如何从单目标的“黑箱”生成器转向可解释的、多目标分子工程。

关键贡献

  • 闭环多代理框架:引入一种受同行评审启发的强化学习循环,LLM 代理能够自主生成、批评并改进肽序列。
  • 多目标优化:同时优化活性、毒性、新颖性和结构可靠性,无需手工设计的标量评分函数。
  • 可解释性设计:每个代理的反馈为文本且可解释,开发者可以追踪肽被接受或拒绝的原因。
  • 领域无关架构:系统只需高层任务描述和少量示例数据,即可迁移到其他分子设计问题。
  • 实证优势:在抗菌效力、AMP 相似性、毒性合规性和结构有效性等基准指标上,优于最先进的 AMP 生成器。

方法论

  1. 任务规范 – 用户提供对设计目标的简明自然语言描述(例如,“设计具有强大革兰氏阴性菌活性、<5 %溶血率且序列新颖的 12‑肽”)。
  2. 种子数据集 – 提供一小批已知 AMP(≈ 200–500 条序列)以启动代理。
  3. 代理角色
    • 生成器代理:使用在肽数据上微调的 LLM 提出候选序列。
    • 审稿代理:三个专门的代理分别从活性、毒性和结构可行性方面评估候选序列,每个代理给出文字批评和数值评分。
    • 编辑代理:综合审稿人的评论,决定接受、拒绝或请求修改,并将结果反馈给生成器。
  4. 强化循环 – 系统将审稿反馈视为奖励信号。生成器通过轻量级的 policy‑gradient 方法更新提示策略,逐步使生成倾向于高评分的肽。
  5. 终止条件 – 在固定迭代次数后(或达到性能平台期时),输出最高评分的肽及完整的审稿记录供人工检查。

整个流水线全自动运行,无需手工构建评分函数或除 LLM 之外的外部模拟器。

结果与发现

指标MAC‑AMP基线生成模型
抗菌活性(预测 MIC)0.78 ± 0.04(数值越高越好)0.62 ± 0.07
毒性合规性(溶血率 < 5 %)94 % 的候选分子通过71 %
新颖性(与训练集的 Levenshtein 距离 > 8)87 %63 %
结构可靠性(AlphaFold 预测置信度 > 80 %)81 %55 %
可解释性得分(平均审稿人评论长度)1.2 × 基线(更为详细)

关键要点

  • 多代理循环始终将生成器引导至满足所有目标的序列空间区域,而不是仅对单一指标进行过度优化。
  • 文本审查提供了透明的审计轨迹,这在典型的 GAN 或 VAE 基肽生成器中往往缺失。
  • 即使使用极小的种子数据集,系统也能发现预测上既高效又安全的肽,展示了强大的数据效率。

实际意义

  • 加速研发管线 – 制药团队可以将 MAC‑AMP 接入早期发现工作流,生成已符合毒性约束的候选抗菌肽,从而减少昂贵的湿实验验证轮次。
  • 针对特定病原体的快速原型 – 只需更换活性描述(例如“靶向 铜绿假单胞菌”),同一系统即可生成定制的肽库,无需重新训练模型。
  • 可解释 AI 合规性 – 监管环境日益要求对 AI 生成设计的可追溯性。MAC‑AMP 的审稿人评论充当内置文档层,简化审计和知识产权归属的讨论。
  • 跨领域复用 – 闭环架构可用于其他基于序列的设计任务,如酶工程、DNA 适配体发现,甚至非生物代码生成,只需提供新的任务提示和示例集。
  • 开发者友好集成 – 系统基于开源 LLM API 和轻量级强化学习代码,便于嵌入 CI/CD 流水线,实现持续的分子设计。

Source:

限制与未来工作

  • 对 LLM 预测质量的依赖 – 评审者的判断仅与底层语言模型对肽生物物理学的理解程度相当;对罕见氨基酸基序的评分偶有错误。
  • 模拟与实验室之间的差距 – 所有评估均为计算机内(MIC 预测器、AlphaFold 置信度)。实际合成与活性实验可能会揭示意想不到的失效。
  • 评审循环的可扩展性 – 随着目标数量的增加,循环可能变得计算成本高;未来工作可探索层级评审结构或蒸馏奖励模型。
  • 基准多样性 – 实验仅聚焦于有限的细菌菌株;扩展到真菌、病毒以及生物膜环境将提升适用性。
  • 人机交互的扩展 – 将专家化学家的反馈与 LLM 评审者结合,可能进一步提升鲁棒性和可信度。

结论: MAC‑AMP 展示了多代理 LLM 协作如何将肽设计从黑箱优化问题转变为可解释的多目标工程工作流——这一方法有望在未来几年重塑 AI 驱动的药物发现。

作者

  • Gen Zhou
  • Sugitha Janarthanan
  • Lianghong Chen
  • Pingzhao Hu

论文信息

  • arXiv ID: 2602.14926v1
  • 类别: cs.AI
  • 出版日期: 2026年2月16日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »