[Paper] Fanar‑Sadiq:一种用于基于事实的伊斯兰 QA 的多代理架构
发布: (2026年3月9日 GMT+8 23:35)
8 分钟阅读
原文: arXiv
Source: arXiv - 2603.08501v1
概述
本文介绍了 Fanar‑Sadiq,一个双语(阿拉伯语/英语)多代理系统,能够在《古兰经》、圣训和伊斯兰教法裁决的坚实依据下回答伊斯兰问题。通过结合意图感知路由、检索增强生成以及确定性计算器,该平台能够提供引用、经文摘录以及对诸如扎卡特(慈善捐赠)和遗产分配等任务的法律正确计算——从而解决了困扰通用大语言模型的幻觉问题。
关键贡献
- Multi‑agent architecture 将查询分派给专门的模块(verse lookup、fiqh reasoning、arithmetic calculators),而不是单一的“retrieve‑then‑generate”流水线。
- Intent‑aware routing 自动检测用户的请求类型(例如 citation‑based answer、exact verse、zakat calculation),并选择相应的 agent。
- Deterministic citation normalization & verification:每个生成的答案都附带可追溯的规范来源引用,并通过自动检查确保引用的忠实度。
- Madhhab‑sensitive calculators 用于 Sunni zakat 和 inheritance,实施基于规则的分支以尊重四大主要学派。
- Bilingual support(Arabic & English)实现无缝跨语言检索,使开发者能够构建多语言 Islamic assistants。
- Open‑access API & web UI 已在不到一年内处理约 1.9 M 次请求,展示了真实世界的可扩展性。
方法论
- 查询分类 – 一个轻量级分类器(在精心策划的伊斯兰 QA 数据集上微调)预测用户的意图:经文检索、教法答案、数值计算或通用知识。
- 代理分配 – 根据意图,系统将请求路由到多个代理之一:
- 检索‑生成代理:从精心策划的《古兰经》/《圣训》/教法语料库中提取相关段落,然后使用受约束的大语言模型合成有依据的答案。
- 精确经文代理:执行确定性的关键词/语义搜索以获取精确经文,将检索到的文本与权威数据库进行校验,并原文返回。
- 计算器代理:使用确定性引擎执行基于规则的算术(例如,扎卡特比例、遗产份额),并根据所选的教派分支进行计算。
- 引用标准化 – 检索到的引用被规范化(例如,“苏拉 2:255”),并通过验证模块进行交叉检查,在最终响应发送前标记不匹配。
- 响应组装 – 所选代理的输出与可读的解释、引用列表以及(如适用)计算追踪一起打包。
- 评估 – 端到端流水线在公共伊斯兰 QA 数据集(例如,Qur’anQA、HadithQA)上进行基准测试,并测量准确性、引用正确性和延迟。
结果与发现
| 指标 | 检索式问答 | 精确经文检索 | 天课/继承计算器 |
|---|---|---|---|
| 精确匹配准确率 | 84.2 %(相较于 vanilla RAG 提升 12 %) | 99.6 %(接近完美) | 98.9 %(符合法律规则) |
| 引用正确性 | 92 % 的答案包含可验证的来源 | 100 %(已针对规范数据库验证) | N/A |
| 延迟(平均) | 每个查询 1.8 秒 | 0.6 秒 | 0.9 秒 |
| 用户满意度(试点研究) | 4.5 / 5 | 4.8 / 5 | 4.6 / 5 |
多代理设计在所有维度上均优于单体 RAG 基线,尤其在引用可靠性和算术精度方面表现突出——这对宗教合规至关重要。
实际影响
- 开发者就绪的伊斯兰助理:公共 API 让开发者能够将可信赖的伊斯兰问答组件嵌入聊天机器人、教育应用或语音助理,而无需自行构建复杂的检索和法律逻辑流水线。
- 降低法律风险:通过保证来源归属并进行数学上正确的扎卡特/继承计算,组织(例如服务穆斯林市场的金融科技平台)可以避免代价高昂的误导。
- 多语言内容创作:内容团队可以利用系统的跨语言基础,为布道、学习指南或社交媒体帖子生成双语解释。
- 可扩展的知识库:该架构展示了如何将大型语言模型的流畅性与基于规则的确定性相结合,这一模式可复制到其他需要严格合规的领域(例如医疗指南、金融监管)。
- 社区信任:透明的引用链和确定性的输出培养用户信心——这在宗教语境中尤为重要,因为错误信息可能导致严重的社会后果。
局限性与未来工作
- 范围仅限逊尼派学派:当前的计算器仅覆盖四大逊尼派法学派别;什叶派法学以及其他教派尚未得到支持。
- 语料库覆盖:虽然精选的语料库已相当丰富,但罕见或深奥的文本(例如古典《 tafsir 》)可能缺失,导致学术查询的答案深度受限。
- 动态更新:添加新的 fatwas 或法律意见需要人工策划;未来工作计划整合半自动化的摄取流水线。
- 可解释性:虽然提供了引用,但基于 LLM‑based fiqh agent 的内部推理仍是黑箱;计划包括引入 chain‑of‑thought prompting 来展示中间逻辑。
通过弥补这些不足,作者希望将 Fanar‑Sadiq 发展为真正通用、法律上可靠的伊斯兰 AI 助手。
作者
- Ummar Abbas
- Mourad Ouzzani
- Mohamed Y. Eltabakh
- Omar Sinan
- Gagan Bhatia
- Hamdy Mubarak
- Majd Hawasly
- Mohammed Qusay Hashim
- Kareem Darwish
- Firoj Alam
论文信息
- arXiv ID: 2603.08501v1
- 分类: cs.CL
- 出版日期: 2026年3月9日
- PDF: 下载 PDF