CureNet AI: 인도 분산형 건강 인텔리전스, Gemma 4와 ABHA 표준화 기반.
Source: Dev.to
이 글은 Gemma 4 Challenge: Build with Gemma 4에 제출된 작품입니다.
CureNet AI는 ABDM‑네이티브, 오프라인‑우선 헬스 인텔리전스 플랫폼으로, 파편화된 의료 기록을 Ayushman Bharat Digital Mission (ABDM) 및 FHIR R4 표준에 따라 안전하게 통합합니다.
현황
- 인도 농촌에서는 안정적인 인터넷이 사치 수준이다. 처방전은 손글씨이며, 실험실 보고서는 열감지 용지에 인쇄돼 시간이 지나면 색이 사라진다. 환자 이력은 플라스틱 폴더에 흩어져 보관된다. 그 결과는 눈에 띈다:
- ₹26,037 crore의 건강보험 청구가 한 해에 거부됨 — ₹15,100 crore는 부인되고 ₹10,937 crore는 반려됨 — 대부분 문서가 불완전하기 때문 (IRDAI 연례보고서, FY24)
- 호환되지 않는 기록을 가진 환자 32 %가 12시간 이내에 중복 진단 검사를 받는다 (NIH 동료심사 연구)
- 인도 전체 보건 지출의 47 %가 환자 본인 부담이며, 이는 세계 최고 수준 중 하나다. 중복 검사와 파편화된 진료가 비용을 부풀린다
- 평균 상담 시간이 약 2분에 불과해 과부하된 외래진료실에서는 의사가 1시간에 100명 이상을 진료해야 하므로 종이 기록을 재구성할 시간이 없다 (BMJ Open)
- 인도 병원의 15 % 미만만이 완전 디지털 의료 기록 시스템을 갖추고 있다
CureNet AI는 Gemma 4 엣지 인텔리전스를 현지 클리닉 생태계에 직접 배치함으로써 인터넷 없이도 문제를 해결한다.
핵심 기능
- Intelligent Local Ingestion: 카메라 기반 문서 스캔을 Gemma 4 31B Dense Vision이 직접 처리한다. 처방전과 실험실 보고서를 멀티모달 기능으로 분석해 약물, 용량, 실험값, 활력징후, 진단 등을 클라우드 없이 추출한다.
- Structured Medical Parsing: 맞춤형 FHIR R4 번들 빌더가 ABDM‑준수 Document Bundle을 생성한다. 여기에는 Patient, Practitioner, MedicationRequest, Observation, DiagnosticReport 리소스가 포함되며, SNOMED CT 약물 코드와 LOINC 실험 코드가 적용된다. 의사는 이미 시행된 검사를 즉시 확인해 중복 진단을 방지할 수 있다.
- Privacy‑First Architecture: AES‑256‑GCM으로 암호화된 로컬 데이터베이스와 디바이스 하드웨어 키스토어를 사용한다. RSA‑OAEP, ECDH X25519, AES‑GCM 암호 모듈을 포함한 맞춤형 ABDM 암호화 모듈을 제공한다. Gemma 4가 로컬에서 실행될 때는 환자 데이터가 디바이스를 떠나지 않아 DPDP Act 2023을 완전 준수한다.
- Complete ABDM Integration: M1 + M2 + M3 마일스톤을 모두 만족한다. Aadhaar와 모바일 OTP를 통한 ABHA 생성, 케어 컨텍스트 연결, 동의 관리, V3 샌드박스 API를 이용한 암호화된 건강 데이터 교환을 지원한다.
- Offline‑First Architecture: Ollama → Backend → Cloud 순서의 3단계 연결 탐색과 자동 폴백을 제공한다. 완전 오프라인 상태에서는 AI가 로컬에 저장된 암호화 기록을 사용해 응답하고, 온라인일 때는 클라우드 모델을 백업용으로만 활용한다.
- ABHAy AI Assistant: RAG 기반 건강 챗봇이 인텐트 분류, 웹 검색, 임상 원자 검색, 의미 검색을 동시에 수행해 응답 지연 시간을 약 12초에서 4초로 단축한다.
- Accessible by Design: 고대비 UI와 큰 터치 영역을 적용해 고령자와 저학력 사용자를 배려한다. 인도 22개 공식 언어를 Bhashini API로 지원하며, 텍스트‑투‑스피치를 내장해 읽을 수 없는 환자도 자신의 언어로 의료 정보를 들을 수 있다.
👉 GitHub Repository: https://github.com/labishbardiya/CureNet-AI
의료 기록은 누수 없이 저지연으로 처리되어야 한다. Gemma 4는 핵심이자 사설 인텔리전스 엔진으로, Ollama를 통해 완전히 로컬에서 실행되며 환자 데이터가 디바이스를 떠나는 일은 없다.
Edge ↔ Workstation 모델 분리
-
Edge: 로컬 머신에서 Ollama를 통해 Gemma 4 E4B (gemma4:e4b) 를 실행한다.
- 왜 E4B인가? Per‑Layer Embeddings (PLE)를 활용해 최첨단 논리를 약 3 GB 메모리 풋프린트에 담는다. 128K 컨텍스트 윈도우가 대용량 임상 로그를 처리하면서도 완전 오프라인으로 동작한다.
- 어떻게 사용하나요? 2초 이내에 모든 사용자 질의를
MEDICAL_QUERY,GENERAL_CHAT,APP_HELP중 하나로 분류하는 1차 인텐트 분류기로 활용한다. 이는 전체 RAG 파이프라인 활성화를 결정한다. 또한 채팅 제목 생성 및 31B 모델이 과부하될 때 자동 폴백 역할을 수행해 사용자 경험이 끊기지 않게 한다.
-
Workstation (클리닉 백엔드): 복잡한 임상 인텔리전스를 위해 Gemma 4 31B Dense (gemma4:31b) 를 Ollama로 배포한다.
- 왜 31B Dense인가? 의료 기록은 라우팅 오류나 환각을 용납하지 않는다. Dense 아키텍처는 모든 토큰을 31 billion 파라미터와 256K 컨텍스트 윈도우를 통해 처리한다. MoE 변형이 임상 컨텍스트를 놓칠 위험이 있는 반면, 안전이 가장 중요한 경우 Dense가 올바른 선택이다.
어떻게 사용하나요? 두 가지 핵심 경로가 있다.- 처방전·실험실 보고서 이미지를 멀티모달 비전과 제로샷 구조 프롬프트로 직접 처리해 환자 정보, 약물(용량/복용횟수/기간/투여경로), 실험값(수치/단위/참조범위), 활력징후, 진단, 추후 지시 등을 추출한다. 인도식
1+0+1(아침/점심/저녁) 표기와 “Crocin” 같은 브랜드명도 정확히 파싱해 SNOMED CT 활성 성분 코드와 매핑한다. - ABHAy RAG 어시스턴트를 구동해 환자의 암호화 로컬 기록 전체를 임상 컨텍스트로 활용한 의료 추론을 제공한다. 모든 출력은 FHIR R4 빌더로 전달돼 SNOMED CT와 LOINC 코딩이 포함된 엄격한 ABDM‑준수 번들을 생성한다.
- 처방전·실험실 보고서 이미지를 멀티모달 비전과 제로샷 구조 프롬프트로 직접 처리해 환자 정보, 약물(용량/복용횟수/기간/투여경로), 실험값(수치/단위/참조범위), 활력징후, 진단, 추후 지시 등을 추출한다. 인도식
- 왜 31B Dense인가? 의료 기록은 라우팅 오류나 환각을 용납하지 않는다. Dense 아키텍처는 모든 토큰을 31 billion 파라미터와 256K 컨텍스트 윈도우를 통해 처리한다. MoE 변형이 임상 컨텍스트를 놓칠 위험이 있는 반면, 안전이 가장 중요한 경우 Dense가 올바른 선택이다.