使用 Gemini 构建医疗级多代理系统

发布: 2个月前 (2025年12月4日 GMT+8 05:38)

6 分钟阅读

原文: Dev.to

Source: Dev.to

引言 — 我为何加入 Agents Intensive

当我报名参加 Kaggle AI Agents Intensive 时，我只有一个目标：学习如何构建超越聊天机器人的 AI 系统——能够推理、执行动作、协同工作并改造真实工作流的系统。

作为一名在数据工程与医疗保健交叉领域工作的人员，我想看看代理架构是否真的能够显著提升临床研究的效率，因为缓慢的证据综合会耗费时间、金钱，甚至可能危及生命。

答案是 肯定的，而 Intensive 正好提供了我所需的结构、概念和构建模块。

问题 — 医疗研究的信息超载

临床研究者被文献淹没。PubMed 每周都会新增数千篇文章，但大多数研究者仍然把内容复制粘贴到 Google Docs，手动提取发现，并且失去对已审阅文献的追踪。

这导致了四个根本性问题：

文献量过大，难以手动筛选
工具碎片化（PubMed → PDF → 电子表格）
搜索过程缺乏结构化记忆
使用常规 LLM 助手时缺乏可复现性

医疗研究需要可追溯、可审计且基于证据的输出——单一的整体式 LLM 无法可靠保证。Intensive 让我意识到代理，而不是提示词，才是正确的解决方案。

为什么选择多代理系统？

转折点出现在课程的第 5 天。真实的工作流本身就像代理系统：

有人解释问题
有人进行检索
有人提取证据
有人进行综合
有人审阅输出

与其强迫一个 LLM 完成所有任务，我构建了一条由专门代理组成的流水线，每个代理都有明确且可测试的职责。

Kaggle 的课程涵盖了：

工具设计
记忆/状态
代理间通信
可观测性
评估
部署

这些内容帮助我从“聊天机器人”思维转向真正的“AI 系统”工程。

我构建的 — 医疗研究代理

借助 Intensive 中学到的一切，我构建了一个完整运行的、符合医疗级别的多代理研究系统，核心技术包括：

Gemini 1.5 Pro 用于推理
PubMed E‑utilities 用于生物医学检索
Supabase 用于会话、日志和可复现性
FastAPI 用于编排
Docker + Cloud Run 用于部署

代理列表

QueryAgent

将生物医学问题转换为 PICO + 有效的 PubMed 检索查询。

SearchAgent

调用 PubMed，获取元数据，并返回候选论文。

EvidenceExtractorAgent

抓取摘要并提取结构化证据：干预措施、结果、效应大小。

SummarizerAgent

将所有信息综合成简明的研究简报，并附带内联引用。

Orchestrator

协调所有代理间的消息传递，确保工作流安全执行。

为什么这很重要

如果直接向聊天机器人提问：

“二甲双胍+胰岛素在 2 型糖尿病中的证据是什么？”

并期望其答案准确，我的系统则会执行完整的证据流水线，生成日志、来源、引用以及有状态的会话。它是为研究人员而非随意的 AI 使用而构建的。

数据架构

我从 Kaggle 学到的

Intensive 教会了我一系列难以在单一来源找到的概念：

代理需要工具
工具需要安全性
会话提供连续性
记忆实现个性化
可观测性让生产成为可能
评估防止回归
部署强迫明确性

这不是教程，而是构建真实 AI 系统的作战手册。对我而言，最大的转变是从思考“提示词”转向思考模块化工作流、状态机和代理生态系统。

接下来 — 前进的道路

在接下来的 90 天里，我计划：

扩展至全文 PDF 提取
添加向量 RAG 流水线
构建专门的肿瘤学和心脏病学变体
创建研究代理仪表盘
发布面向生物医学代理系统的开放基准

我的长期目标是为新兴的医疗级别代理 AI 领域做出贡献，在这里安全性、可复现性和透明度是最重要的。Kaggle AI Agents Intensive 为我提供了结构、工具和概念基础，让我能够构建多年来一直想要的系统。这段经历具有变革性，我期待继续推动多代理系统在临床研究中的边界。