使用 Gemini 构建医疗级多代理系统
Source: Dev.to
引言 — 我为何加入 Agents Intensive
当我报名参加 Kaggle AI Agents Intensive 时,我只有一个目标:学习如何构建超越聊天机器人的 AI 系统——能够推理、执行动作、协同工作并改造真实工作流的系统。
作为一名在数据工程与医疗保健交叉领域工作的人员,我想看看代理架构是否真的能够显著提升临床研究的效率,因为缓慢的证据综合会耗费时间、金钱,甚至可能危及生命。
答案是 肯定的,而 Intensive 正好提供了我所需的结构、概念和构建模块。
问题 — 医疗研究的信息超载
临床研究者被文献淹没。PubMed 每周都会新增数千篇文章,但大多数研究者仍然把内容复制粘贴到 Google Docs,手动提取发现,并且失去对已审阅文献的追踪。
这导致了四个根本性问题:
- 文献量过大,难以手动筛选
- 工具碎片化(PubMed → PDF → 电子表格)
- 搜索过程缺乏结构化记忆
- 使用常规 LLM 助手时缺乏可复现性
医疗研究需要可追溯、可审计且基于证据的输出——单一的整体式 LLM 无法可靠保证。Intensive 让我意识到 代理,而不是提示词,才是正确的解决方案。
为什么选择多代理系统?
转折点出现在课程的第 5 天。真实的工作流本身就像代理系统:
- 有人解释问题
- 有人进行检索
- 有人提取证据
- 有人进行综合
- 有人审阅输出
与其强迫一个 LLM 完成所有任务,我构建了一条由专门代理组成的流水线,每个代理都有明确且可测试的职责。
Kaggle 的课程涵盖了:
- 工具设计
- 记忆/状态
- 代理间通信
- 可观测性
- 评估
- 部署
这些内容帮助我从“聊天机器人”思维转向真正的“AI 系统”工程。
我构建的 — 医疗研究代理
借助 Intensive 中学到的一切,我构建了一个完整运行的、符合医疗级别的多代理研究系统,核心技术包括:
- Gemini 1.5 Pro 用于推理
- PubMed E‑utilities 用于生物医学检索
- Supabase 用于会话、日志和可复现性
- FastAPI 用于编排
- Docker + Cloud Run 用于部署
代理列表
QueryAgent
将生物医学问题转换为 PICO + 有效的 PubMed 检索查询。
SearchAgent
调用 PubMed,获取元数据,并返回候选论文。
EvidenceExtractorAgent
抓取摘要并提取结构化证据:干预措施、结果、效应大小。
SummarizerAgent
将所有信息综合成简明的研究简报,并附带内联引用。
Orchestrator
协调所有代理间的消息传递,确保工作流安全执行。
为什么这很重要
如果直接向聊天机器人提问:
“二甲双胍+胰岛素在 2 型糖尿病中的证据是什么?”
并期望其答案准确,我的系统则会执行完整的证据流水线,生成日志、来源、引用以及有状态的会话。它是为研究人员而非随意的 AI 使用而构建的。

我从 Kaggle 学到的
Intensive 教会了我一系列难以在单一来源找到的概念:
- 代理需要工具
- 工具需要安全性
- 会话提供连续性
- 记忆实现个性化
- 可观测性让生产成为可能
- 评估防止回归
- 部署强迫明确性
这不是教程,而是构建真实 AI 系统的作战手册。对我而言,最大的转变是从思考“提示词”转向思考模块化工作流、状态机和代理生态系统。
接下来 — 前进的道路
在接下来的 90 天里,我计划:
- 扩展至全文 PDF 提取
- 添加向量 RAG 流水线
- 构建专门的肿瘤学和心脏病学变体
- 创建研究代理仪表盘
- 发布面向生物医学代理系统的开放基准
我的长期目标是为新兴的医疗级别代理 AI 领域做出贡献,在这里安全性、可复现性和透明度是最重要的。Kaggle AI Agents Intensive 为我提供了结构、工具和概念基础,让我能够构建多年来一直想要的系统。这段经历具有变革性,我期待继续推动多代理系统在临床研究中的边界。