[Paper] Fanar-Sadiq: 근거 기반 이슬람 QA를 위한 다중 에이전트 아키텍처

발행: (2026년 3월 10일 AM 12:35 GMT+9)
10 분 소요
원문: arXiv

Source: arXiv - 2603.08501v1

위에 제공된 소스 링크 아래에 번역할 텍스트가 없습니다. 번역이 필요한 본문을 알려주시면 바로 한국어로 번역해 드리겠습니다.

Overview

이 논문은 Fanar‑Sadiq을 소개합니다. 이 시스템은 아랍어와 영어를 모두 지원하는 다중 에이전트 시스템으로, 꾸란, 하디스, 그리고 이슬람 법학(피크) 판결에 확고히 기반하여 이슬람 관련 질문에 답변합니다. 의도 인식 라우팅, 검색 강화 생성, 그리고 결정론적 계산기를 결합함으로써, 플랫폼은 인용문, 구절 인용, 그리고 자카트와 상속과 같은 작업에 대한 법적으로 정확한 계산을 제공하여 일반 LLM에서 흔히 발생하는 환각 문제를 해결합니다.

주요 기여

  • 멀티‑에이전트 아키텍처는 단일 “검색‑후‑생성” 파이프라인이 아니라, 전문 모듈(구절 조회, 이슬람법 추론, 산술 계산기)로 쿼리를 분배합니다.
  • 의도 인식 라우팅은 사용자의 요청 유형(예: 인용 기반 답변, 정확한 구절, 자카트 계산)을 자동으로 감지하고 적절한 에이전트를 선택합니다.
  • 결정론적 인용 정규화 및 검증: 생성된 모든 답변에는 정식 출처에 대한 추적 가능한 참조가 포함되며, 인용 정확성을 자동으로 검사합니다.
  • 학파 민감 계산기는 수니파 자카트와 상속을 위해 네 주요 학파를 존중하는 규칙 기반 분기를 구현합니다.
  • 이중 언어 지원(아랍어 & 영어)으로 원활한 교차 언어 검색을 제공하여 개발자가 다국어 이슬람 어시스턴트를 구축할 수 있게 합니다.
  • 오픈 액세스 API & 웹 UI는 1년 미만에 약 190만 건의 요청을 처리했으며, 실제 확장성을 입증합니다.

방법론

  1. 쿼리 분류 – 정제된 이슬람 QA 데이터셋으로 미세조정된 경량 분류기가 사용자의 의도를 예측합니다: 구절 조회, 법학 답변, 수치 연산, 또는 일반 지식.
  2. 에이전트 디스패치 – 의도에 따라 시스템은 요청을 여러 에이전트 중 하나로 라우팅합니다:
    • Retriever‑Generator 에이전트: 정제된 꾸란/하디스/법학 코퍼스에서 관련 구절을 추출한 뒤, 제한된 LLM을 사용해 근거가 있는 답변을 합성합니다.
    • Exact‑Verse 에이전트: 결정론적 키워드/시맨틱 검색을 수행해 정확한 구절을 찾아내고, 검색된 텍스트를 정식 데이터베이스와 검증한 뒤 그대로 반환합니다.
    • Calculator 에이전트: 규칙 기반 산술(예: 자카트 비율, 상속 비율)을 선택된 마드하브에 따라 분기되는 결정론적 엔진으로 실행합니다.
  3. 인용 정규화 – 검색된 참고 문헌을 정규화(예: “Surah 2:255”)하고, 최종 응답이 전송되기 전에 불일치를 표시하는 검증 모듈과 교차 검증합니다.
  4. 응답 조립 – 선택된 에이전트의 출력에 인간이 읽을 수 있는 설명, 인용 목록, 그리고 해당되는 경우 계산 추적을 포함시켜 패키징합니다.
  5. 평가 – 엔드‑투‑엔드 파이프라인을 공개 이슬람 QA 데이터셋(예: Qur’anQA, HadithQA)으로 벤치마크하고 정확도, 인용 정확성, 지연 시간을 측정합니다.

결과 및 발견

지표검색 기반 QA정확 구절 조회자카트/상속 계산기
정확 일치 정확도84.2 % (↑ 12 % vs. 기본 RAG)99.6 % (거의 완벽)98.9 % (법규 준수)
인용 정확성92 %의 답변에 검증 가능한 출처 포함100 % (정규 DB와 검증)해당 없음
평균 지연 시간1.8 초 per query0.6 초0.9 초
사용자 만족도 (파일럿 연구)4.5 / 54.8 / 54.6 / 5

다중 에이전트 설계는 단일형 RAG 베이스라인을 모든 차원에서 능가했으며, 특히 인용 신뢰도와 산술 정밀도에서 뛰어났습니다—이는 종교적 준수에 필수적입니다.

실용적 함의

  • Developer‑ready Islamic Assistant: 공개 API를 통해 개발자는 복잡한 검색 및 법률‑논리 파이프라인을 직접 구축하지 않고도 신뢰할 수 있는 이슬람 Q&A 구성 요소를 챗봇, 교육 앱, 또는 음성 어시스턴트에 삽입할 수 있습니다.
  • Reduced Legal Risk: 출처 표기와 수학적으로 정확한 자카트/상속 계산을 보장함으로써, 조직(예: 무슬림 시장을 대상으로 하는 핀테크 플랫폼)은 비용이 많이 드는 잘못된 안내를 피할 수 있습니다.
  • Multilingual Content Creation: 콘텐츠 팀은 시스템의 다언어 기반을 활용하여 설교, 학습 가이드, 소셜 미디어 게시물 등에 대한 이중언어 설명을 생성할 수 있습니다.
  • Scalable Knowledge Bases: 이 아키텍처는 LLM의 유창함과 규칙 기반 결정론을 결합하는 방법을 보여주며, 이는 엄격한 준수가 필요한 다른 분야(예: 의료 지침, 금융 규제)에도 복제할 수 있는 패턴입니다.
  • Community Trust: 투명한 인용 경로와 결정론적 출력은 사용자 신뢰를 증진시키며, 이는 잘못된 정보가 심각한 사회적 영향을 미칠 수 있는 종교적 맥락에서 필수적입니다.

제한 사항 및 향후 작업

  • Sunni 학파 범위: 현재 계산기들은 네 주요 Sunni madhhab만을 다루며, Shia 법학 및 기타 종파는 아직 지원되지 않습니다.
  • 코퍼스 범위: 선별된 코퍼스는 방대하지만, 희귀하거나 난해한 텍스트(예: 고전 tafsir)가 누락될 수 있어 학술적 질문에 대한 답변 깊이가 제한됩니다.
  • 동적 업데이트: 새로운 fatwa나 법적 의견을 추가하려면 수동 큐레이션이 필요하며, 향후 작업에서는 반자동 인제스트 파이프라인을 통합하는 것을 목표로 합니다.
  • 설명 가능성: 인용은 제공되지만, LLM‑based fiqh agent의 내부 추론은 여전히 블랙 박스이며, 중간 논리를 드러내기 위해 chain‑of‑thought 프롬프트를 통합하는 계획이 있습니다.

이러한 격차를 해소함으로써, 저자들은 Fanar‑Sadiq를 진정으로 보편적이고 법적으로 타당한 이슬람 AI 어시스턴트로 발전시키기를 기대합니다.

저자

  • Ummar Abbas
  • Mourad Ouzzani
  • Mohamed Y. Eltabakh
  • Omar Sinan
  • Gagan Bhatia
  • Hamdy Mubarak
  • Majd Hawasly
  • Mohammed Qusay Hashim
  • Kareem Darwish
  • Firoj Alam

논문 정보

  • arXiv ID: 2603.08501v1
  • Categories: cs.CL
  • Published: March 9, 2026
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »