나는 TUI를 구축해 RAG Chunking을 시각화했으며, chunk_size=1000은 거짓이다 📉

발행: (2025년 12월 11일 오전 12:38 GMT+9)
1 min read
원문: Dev.to

Source: Dev.to

Overview

잠시 솔직해집시다. RAG(검색‑증강 생성) 파이프라인을 구축할 때 chunk_size와 overlap를 어떻게 선택하시나요?
우리의 90 %와 마찬가지라면 튜토리얼에서 1000200을 복사‑붙여넣기하고 실행한 뒤, LLM이 환각하지 않길 바라는 겁니다.
저는 제가 “느낌에 기반한 …”을 하고 있다는 것을 깨달았습니다.

Back to Blog

관련 글

더 보기 »