[논문] 언어 모델은 오라클이 아니라 인터페이스: 소아 맹장을 위한 하이브리드 LLM‑ML 시스템
Overview
대형 언어 모델(LLM)은 자유 텍스트 문서를 해석함으로써 임상 의사 결정을 보다 편리하게 만들 수 있지만, 직접 진단 엔진으로 사용될 때는 프롬프트, 정보 순서, 그리고 합리적이지만 잘못된 출력의 민감성에 제한을 받습니다. 구조화된 머신러닝 모델은 보다 안정적인 위험 예측을 제공하지만, 내레이티브 임상 워크플로와 통합하기 어려운 표 형태의 입력이 필요합니다. 우리는 ClaMPAPP(임상 언어 보조 머신러닝 파이프라인, 부식염용)이라는 하이브리드 시스템을 제시합니다. 이 시스템은 LLM을 최종 의사 결정자 대신 인터페이스로 활용합니다. ClaMPAPP는 주석과 유사한 서술에서 스키마 제약 임상 특성을 추출하고, 결정적 실현 가능성 검증을 수행한 뒤, 임상, 실험실, 초음파 변수에 훈련된 XGBoost 분류기에 검증된 특성을 전달합니다. 우리는 독일 병원에서 온 두 개의 독립적인 소아 부식염 코호트를 평가하고, 오픈소스 및 전용 모델을 포함한 엔드투엔드 LLM 베이스라인과 비교했습니다. 지식의 근본적인 진실성을 유지하면서 자유 텍스트 입력을 테스트하기 위해, 서술은 구조화된 전자 건강 기록을 템플릿 렌더링과 제약된 LLM 재작성으로 생성했으며, 추가적으로 문장 순서 변형을 통해 위치적 견고성을 평가했습니다. ClaMPAPP는 내부 및 외부 검증 모두에서 전체 진단 성능이 가장 우수했으며, 급성 이환 단계에서 핵심적인 안전 문제인 누락된 부식염 사례를 최소화했습니다. 엔드투엔드 LLM은 민감도-특이도 트레이드오프가 불안정하고, 서술 순서 변경에 따라 더 큰 저하를 보였습니다. 이 결과는 자연어 가용성과 예측 추론을 분리하고 보다 검증 가능한 임상 의사 결정을 위한 LLM-as-interface, ML-as-predictor 설계를 지지합니다.
Key Contributions
본 논문은 다음 분야의 연구를 제시합니다:
- cs.Cl
- cs.AI
Methodology
자세한 방법については 전체 논문을 참고하십시오.
Practical Implications
본 연구는 cs.CL의 발전을 기여합니다.
Authors
- Soheyl Bateni
- Maryam Abdolali
Paper Information
- arXiv ID: 2606.19183v1
- 범주: cs.CL, cs.AI
- 게시일: 2026년 6월 17일
- PDF: PDF 다운로드