GraphRAG 작동 방식

발행: 4개월 전 (2026년 1월 3일 오후 01:51 GMT+9)

5 분 소요

원문: Dev.to

Source: Dev.to

색인 단계 (오프라인, 비용이 많이 들지만 한 번만 수행)

그 결과는 구조화된 색인: 그래프 + 사전 생성된 커뮤니티 요약입니다. 이는 벡터 임베딩만으로는 놓치기 쉬운 데이터 전체에 걸친 암묵적 연결을 포착합니다.

로컬 질의(구체적인 세부 사항) – 언급된 엔터티와 가까운 관련 서브그래프 또는 텍스트 청크를 검색합니다.
글로벌 질의(전체적인 이해) –
1. 질의와의 유사성을 기반으로 관련 커뮤니티 요약을 선택합니다.
2. 각 요약으로부터 부분 답변을 생성하도록 LLM을 활용합니다.
3. 부분 답변을 집계하고 요약해 최종 일관된 응답을 만듭니다.

커뮤니티 단위로 수행되는 이 “맵‑리듀스” 방식은 전체적인 추론을 가능하게 합니다.

원 논문 실험(데이터셋 ≈ 100만 토큰)에서는 GraphRAG가 전역 질문에 대해 포괄성 및 다양성 같은 지표에서 기존 RAG 대비 70–80 % 향상된 성능을 보였습니다.

오픈소스 구현: microsoft/graphrag on GitHub
비용 – 색인 단계는 추출 및 요약을 위한 다수의 LLM 호출로 비용이 많이 들지만, 질의 단계는 효율적입니다.
후속 개선 – LazyGraphRAG(비용 효율 향상), DRIFT 검색, 동적 커뮤니티 선택, 새로운 도메인에 대한 자동 튜닝 등 다양한 변형이 존재합니다.

GraphRAG는 그래프 구조를 활용해 “전역 의미 형성”을 가능하게 함으로써, 대규모·프라이빗·내러티브가 풍부한 데이터셋에 대해 LLM이 추론하도록 하는 중요한 진보를 나타냅니다. 표준 RAG가 불완전하거나 피상적인 답변을 제공할 때 특히 유용합니다.