[Paper] Model Gateway:模型管理平台用于模型驱动的药物发现

发布: (2025年12月5日 GMT+8 14:39)
6 min read
原文: arXiv

Source: arXiv - 2512.05462v1

Overview

Model Gateway 论文介绍了一个专为药物发现工作流打造的平台,提供现代 MLOps 能力。通过将科学模拟代码和机器学习模型视为可互换的服务,系统让研究人员能够在大规模下注册、调用并组合模型——甚至利用 LLM 代理和生成式 AI 工具自动化日常管理任务。

Key Contributions

  • Unified Model Management Layer – 单一 API 与控制面板,用于注册、版本管理和监控异构模型(如量子化学模拟器、深度学习预测器)。
  • Dynamic Consensus Modeling – 内置对“共识”模型的支持,能够在运行时聚合多个科学模型的预测,提高鲁棒性,无需手动编写集成代码。
  • LLM‑Driven Automation – 集成大语言模型代理,可下达模型注册指令、调度运行并解析结果,降低人工干预负担。
  • Scalable Execution Engine – 异步作业提交,在处理 >10 k 并发客户端请求时实现 0 % 失败率。
  • Role‑Based UI & Admin Tools – 为模型所有者(自助服务)和平台管理员(策略执行、配额管理)提供独立仪表盘。

Methodology

作者将网关构建为微服务栈:

  1. Model Registry – 元数据存储(SQL/NoSQL),记录模型制品、版本、所需输入和资源占用。
  2. Gateway API – 提供 CRUD 操作的 REST/GraphQL 接口以及作业提交端点。
  3. Execution Orchestrator – 任务队列(如 RabbitMQ 或 Kafka),将模型运行分发到容器化工作者(Docker/Kubernetes),并处理重试与结果回调。
  4. Consensus Engine – 轻量级聚合器,从多个工作者获取输出,应用加权或投票方案,返回统一预测。
  5. LLM Agent Layer – 经过提示工程的 LLM(GPT‑4 级),将自然语言请求转换为 API 调用,实现“与网关对话”。

平台使用模拟工作负载进行压力测试,模拟真实药物发现流水线(例如对数百万化合物的虚拟筛选)。记录并对比了延迟、成功率、资源利用率等性能指标,基准为传统的脚本式方法。

Results & Findings

MetricBaseline (script)Model Gateway
Success rate under 10 k concurrent jobs78 %100 %
Average job latency (including queue)12 s9 s
Time to onboard a new model (from code to API)2–3 days (manual)<30 min (self‑service UI)
Developer effort for consensus modeling~200 lines of glue code<20 lines (built‑in)

关键结论:网关消除了手工脚本导致的故障点,显著缩短了模型上线时间,并提供可复用的共识层,在无需额外工程投入的情况下提升预测可靠性。

Practical Implications

  • Accelerated Lead Identification – 研究人员可以快速启动新的预测模型(如结合亲和力估计器),并立即将其接入筛选流水线,缩短“命中‑到‑先导”周期。
  • Reduced Ops Overhead – DevOps 团队不再需要为每个模型编写专属脚本;平台自动处理容器供应、弹性伸缩和日志记录。
  • AI‑Assisted Workflows – LLM 代理能够调度批量运行、获取结果,甚至建议超参数调整,实现半自动化的发现闭环。
  • Regulatory Traceability – 集中的元数据与版本管理简化了 FDA 类提交所需的审计追踪。
  • Cross‑Team Collaboration – 模型所有者可将模型以服务形式公开,下游分析师通过稳定的 API 使用,促进化学、生物和数据科学团队之间的复用。

Limitations & Future Work

  • Domain Specificity – 当前实现针对药物发现工作负载进行调优,扩展到其他科学领域可能需要为数据格式和模拟软件定制适配器。
  • LLM Reliability – 虽然 LLM 代理可自动化众多任务,但生成的 API 调用偶有幻觉,需要加入验证层。
  • Resource Cost Modeling – 论文未量化云成本节约;未来工作可集成成本感知调度,以优化 GPU/CPU 使用。
  • Security & Access Controls – 对专有模型的细粒度权限控制已提及但未深入实现,计划加入强化的身份验证/授权框架。

总体而言,Model Gateway 展示了一个经过精心工程化的 MLOps 平台——结合生成式 AI——如何将药物发现中传统上繁琐的模型管理问题转化为可扩展的服务,从而加速、更可靠地推动治疗创新。

Authors

  • Yan-Shiun Wu
  • Nathan A. Morin

Paper Information

  • arXiv ID: 2512.05462v1
  • Categories: cs.SE, cs.DC, cs.LG, q-bio.QM
  • Published: December 5, 2025
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »