[Paper] Model Gateway：模型管理平台用于模型驱动的药物发现

发布: 2个月前 (2025年12月5日 GMT+8 14:39)

6 分钟阅读

原文: arXiv

Source: arXiv - 2512.05462v1

Overview

Model Gateway 论文介绍了一个专为药物发现工作流打造的平台，提供现代 MLOps 能力。通过将科学模拟代码和机器学习模型视为可互换的服务，系统让研究人员能够在大规模下注册、调用并组合模型——甚至利用 LLM 代理和生成式 AI 工具自动化日常管理任务。

Unified Model Management Layer – 单一 API 与控制面板，用于注册、版本管理和监控异构模型（如量子化学模拟器、深度学习预测器）。
Dynamic Consensus Modeling – 内置对“共识”模型的支持，能够在运行时聚合多个科学模型的预测，提高鲁棒性，无需手动编写集成代码。
LLM‑Driven Automation – 集成大语言模型代理，可下达模型注册指令、调度运行并解析结果，降低人工干预负担。
Scalable Execution Engine – 异步作业提交，在处理 >10 k 并发客户端请求时实现 0 % 失败率。
Role‑Based UI & Admin Tools – 为模型所有者（自助服务）和平台管理员（策略执行、配额管理）提供独立仪表盘。

作者将网关构建为微服务栈：

Model Registry – 元数据存储（SQL/NoSQL），记录模型制品、版本、所需输入和资源占用。
Gateway API – 提供 CRUD 操作的 REST/GraphQL 接口以及作业提交端点。
Execution Orchestrator – 任务队列（如 RabbitMQ 或 Kafka），将模型运行分发到容器化工作者（Docker/Kubernetes），并处理重试与结果回调。
Consensus Engine – 轻量级聚合器，从多个工作者获取输出，应用加权或投票方案，返回统一预测。
LLM Agent Layer – 经过提示工程的 LLM（GPT‑4 级），将自然语言请求转换为 API 调用，实现“与网关对话”。

平台使用模拟工作负载进行压力测试，模拟真实药物发现流水线（例如对数百万化合物的虚拟筛选）。记录并对比了延迟、成功率、资源利用率等性能指标，基准为传统的脚本式方法。

Metric	Baseline (script)	Model Gateway
Success rate under 10 k concurrent jobs	78 %	100 %
Average job latency (including queue)	12 s	9 s
Time to onboard a new model (from code to API)	2–3 days (manual)	<30 min (self‑service UI)
Developer effort for consensus modeling	~200 lines of glue code	<20 lines (built‑in)

关键结论：网关消除了手工脚本导致的故障点，显著缩短了模型上线时间，并提供可复用的共识层，在无需额外工程投入的情况下提升预测可靠性。

Accelerated Lead Identification – 研究人员可以快速启动新的预测模型（如结合亲和力估计器），并立即将其接入筛选流水线，缩短“命中‑到‑先导”周期。
Reduced Ops Overhead – DevOps 团队不再需要为每个模型编写专属脚本；平台自动处理容器供应、弹性伸缩和日志记录。
AI‑Assisted Workflows – LLM 代理能够调度批量运行、获取结果，甚至建议超参数调整，实现半自动化的发现闭环。
Regulatory Traceability – 集中的元数据与版本管理简化了 FDA 类提交所需的审计追踪。
Cross‑Team Collaboration – 模型所有者可将模型以服务形式公开，下游分析师通过稳定的 API 使用，促进化学、生物和数据科学团队之间的复用。

总体而言，Model Gateway 展示了一个经过精心工程化的 MLOps 平台——结合生成式 AI——如何将药物发现中传统上繁琐的模型管理问题转化为可扩展的服务，从而加速、更可靠地推动治疗创新。