[논문] LLM이 이끄는 의료 의사결정 파이프라인 진화

발행: (2026년 6월 5일 PM 11:53 GMT+9)
3 분 소요
원문: arXiv

Source: arXiv - 2606.07342v1

개요

대규모 언어 모델(LLM)을 임상 워크플로에 적용하려면 비용이 많이 드는 파인튜닝이나 수동 프롬프트·파이프라인 설계가 필요합니다. 우리는 추론 시점에 LLM이 안내하는 MAP‑Elites 진화를 탐색 방법으로 연구하고, 의료 의사결정 전략을 발견하기 위한 구현 저장소를 https://github.com/univanxx/llm_guided_evo_medical 에 제공했습니다. 우리는 긴급도 분류, 인터랙티브 상담, 의료 영상 분류를 각각 작업별 적합도 함수에 의해 최적화되는 실행 가능한 아티팩트에 대한 진화적 탐색으로 공식화했습니다. 세 가지 설정 모두에서, 진화는 실용적인 제약 하에 수동으로 설계된 베이스라인보다 성능을 향상시켰습니다. 분류에서는 진화된 프로그램이 Semigran 정확도를 77.3 %에서 87.1 %로, 응급 재현율을 0.60에서 0.97으로 끌어올렸으며, 안전 가중치를 적용한 보류된 MIMIC‑ESI 성능도 개선했습니다. 인터랙티브 상담에서는 진화된 정책이 Llama‑3, Qwen‑3.5, Gemma‑4 전반에 걸친 정확도‑비용 경계를 향상시키고, 보류된 iCRAFTMD 데이터셋에도 전이되었습니다. PneumoniaMNIST에서는 프롬프트만을 이용한 진화가 고정된 MedGemma VLM을 개선하면서도 엄격한 JSON 출력을 유지했습니다. 정성적 분석 결과, 이러한 향상은 단순히 프롬프트를 바꾸는 것이 아니라 해석 가능한 프로그램 수준 메커니즘(보정된 트리아지 경계, 목표 증거 획득, 선택적 커밋, 탐색 지향 시각적 의사결정 규칙)에서 비롯된 것으로 나타났습니다.

주요 기여

이 논문은 다음 분야의 연구를 제시합니다.

  • cs.CL
  • cs.NE

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 시사점

본 연구는 cs.CL 분야의 발전에 기여합니다.

저자

  • Ivan Sviridov
  • Artem Oskin
  • Ivan Panin
  • Iaroslav Bespalov
  • Dmitry Dylov
  • Ivan Oseledets
  • Aleksandr Nesterov

논문 정보

  • arXiv ID: 2606.07342v1
  • 분류: cs.CL, cs.NE
  • 발표일: 2026년 6월 5일
  • PDF: Download PDF
0 조회
Back to Blog

관련 글

더 보기 »