RAG 아키텍처 심층 분석
이 글에서 다루는 내용
왜 금융 문서에 파인튜닝보다 RAG를 선택해야 하는가
금융 서비스 기업은 거래 메모, CIM 요약, 대출 계약서, 이사회 프레젠테이션, 컴플라이언스 문서 등 방대한 양의 독점 텍스트를 축적한다. 직관적으로는 이 코퍼스를 대상으로 언어 모델을 파인튜닝해 지식 베이스로 활용하고 싶어한다. 하지만 그 직관은 대부분 잘못된 것이다.
파인튜닝은 특정 시점에 지식을 모델 가중치에 고정시킨다. 거래가 체결되거나 정책이 업데이트되거나 대출 조항이 변경될 때, 전체 재학습 없이 모델이 현실을 반영할 방법이 없다. RAG — Retrieval‑Augmented Generation — 은 이를 뒤집는다: 모델은 정적인 상태를 유지하고, 권위 있는 문서는 질의 시점에 동적으로 검색된다. 그 결과 언제나 최신이며, 인용 가능하고, 감사가 훨씬 쉬운 시스템이 된다.
핵심 장점
RAG는 인용과 함께 답변을 제공한다. 모든 응답은 근거가 된 특정 문서와 구절로 추적된다. “모델이 그렇게 말했다”는 설명이 허용되지 않는 규제 산업에서는 이러한 감사 가능성이 선택 사항이 아니라 필수 요건이다.
금융 텍스트 청크 전략
문서를 검색하기 전에 의미 있게 임베딩할 수 있을 만큼 작지만, 컨텍스트를 유지할 만큼 충분히 큰 청크로 나누어야 한다. 금융 문서에서는 단순 고정 크기 청크가 검색 성능을 크게 저하시킨다. 예를 들어 512 토큰 청크가 대출 조항의 중간 문장을 잘라버리면, 해당 조항이 의미를 갖는 컨텍스트가 사라진다.
평가해볼 만한 세 가지 전략이 있다:
- 고정 크기 청크 – 빠르고 예측 가능하지만 컨텍스트를 고려하지
