Gemini를 사용한 헬스케어 등급 멀티 에이전트 시스템 구축

발행: 2일 전 (2025년 12월 4일 오전 06:38 GMT+9)

8 min read

Source: Dev.to

Introduction — Why I Joined the Agents Intensive

Kaggle AI Agents Intensive에 등록했을 때 목표는 하나였습니다: 챗봇을 넘어서는 AI 시스템—즉, 추론하고, 행동을 취하고, 조율하며 실제 워크플로를 변환할 수 있는 시스템을 구축하는 방법을 배우는 것이었습니다.

데이터 엔지니어링과 헬스케어가 교차하는 영역에서 일하는 저는, 느린 근거 합성으로 인해 시간·비용·때로는 생명이 소모되는 임상 연구에 에이전시 아키텍처가 실질적인 개선을 가져올 수 있는지 확인하고 싶었습니다.

답은 예였으며, Intensive는 제가 필요로 했던 정확한 구조, 개념, 그리고 빌딩 블록을 제공했습니다.

The Problem — Healthcare Research Overload

임상 연구자들은 논문에 휩싸여 있습니다. PubMed는 매주 수천 개의 새로운 논문을 추가하지만, 대부분의 연구자는 여전히 Google Docs에 복사‑붙여넣기하고, 수동으로 결과를 추출하며, 검토한 내용을 추적하지 못합니다.

이로 인해 네 가지 근본적인 문제가 발생합니다:

수동으로 스캔하기엔 너무 많은 문헌
파편화된 도구들 (PubMed → PDF → 스프레드시트)
검색 전반에 걸친 구조화된 메모리 부재
일반적인 LLM 어시스턴트를 사용할 때 재현성 부족

헬스케어 연구는 추적 가능성, 감사 가능성, 그리고 근거 기반 출력을 요구합니다—단일 거대한 LLM만으로는 신뢰성 있게 보장할 수 없습니다. Intensive를 통해 프롬프트가 아니라 에이전트가 올바른 해결책이라는 것을 깨달았습니다.

Why Multi‑Agent Systems?

전환점은 코스의 Day 5였습니다. 실제 워크플로는 이미 에이전트 시스템처럼 작동합니다:

누군가가 질문을 해석한다
누군가가 검색한다
누군가가 근거를 추출한다
누군가가 종합한다
누군가가 결과를 검토한다

하나의 LLM에 모든 일을 강요하는 대신, 저는 명확하고 테스트 가능한 책임을 가진 전문화된 에이전트 파이프라인을 구축했습니다.

Kaggle의 레슨들—

도구 설계
메모리/상태
에이전트‑간 커뮤니케이션
가시성(Observability)
평가
배포

—은 “챗봇” 사고방식에서 실제 “AI 시스템” 엔지니어링으로 전환하는 방법을 보여주었습니다.

What I Built — The Healthcare Research Agent

Intensive에서 배운 모든 것을 활용해, 저는 다음과 같은 기술로 구동되는 완전한 헬스케어‑급 멀티‑에이전트 연구 시스템을 구축했습니다:

Gemini 1.5 Pro – 추론
PubMed E‑utilities – 생물의학 검색
Supabase – 세션, 로그, 재현성 관리
FastAPI – 오케스트레이션
Docker + Cloud Run – 배포

The Agents

QueryAgent

생물의학 질문을 PICO와 유효한 PubMed 검색 쿼리로 변환합니다.

SearchAgent

PubMed에 요청을 보내 메타데이터를 가져오고 후보 논문을 반환합니다.

EvidenceExtractorAgent

초록을 추출하고 구조화된 근거(중재, 결과, 효과 크기)를 뽑아냅니다.

SummarizerAgent

모든 정보를 종합해 인라인 인용이 포함된 간결한 연구 요약을 생성합니다.

Orchestrator

에이전트‑간 메시징을 조정하고 워크플로가 안전하게 실행되도록 보장합니다.

Why This Matters

챗봇에 이렇게 물어보는 대신:

“제2형 당뇨병에서 메트포르민 + 인슐린에 대한 근거가 무엇인가요?”

제 시스템은 로그, 출처, 인용, 상태 유지 세션을 포함한 전체 근거 파이프라인을 수행합니다. 이는 일반 사용자용 AI가 아니라 연구자를 위한 도구입니다.

What I Learned from Kaggle

Intensive는 한 곳에서 찾기 힘든 개념들을 가르쳐 주었습니다:

에이전트는 도구가 필요하다
도구는 안전성을 요구한다
세션은 연속성을 만든다
메모리는 개인화를 가능하게 한다
가시성은 프로덕션을 가능하게 한다
평가는 회귀를 방지한다
배포는 명확성을 강요한다

단순 튜토리얼이 아니라 실제 AI 시스템을 구축하기 위한 플레이북이었습니다. 저에게 가장 큰 변화는 프롬프트 중심 사고에서 모듈형 워크플로, 상태 머신, 에이전트 생태계 사고로 전환한 것이었습니다.

What’s Next — The Road Ahead

앞으로 90일 동안 저는 다음을 진행할 계획입니다:

전체 텍스트 PDF 추출 확대
벡터 RAG 파이프라인 추가
종양학 및 심장학 전용 변형 구축
연구‑에이전트 대시보드 제작
생물의학 에이전트 시스템을 위한 공개 벤치마크 발표

장기 목표는 안전성, 재현성, 투명성이 가장 중요한 헬스케어‑급 에이전시 AI 분야에 기여하는 것입니다. Kaggle AI Agents Intensive는 제가 수년간 원하던 것을 만들 수 있게 해준 구조, 도구, 그리고 개념적 토대를 제공했습니다. 이 경험은 제게 변화를 가져다 주었으며, 임상 연구에서 멀티‑에이전트 시스템이 할 수 있는 일의 한계를 계속해서 넓혀 나가고 싶습니다.