[Paper] Superintelligent Retrieval Agent:信息检索的下一前沿

发布: (2026年5月8日 GMT+8 01:54)
7 分钟阅读
原文: arXiv

请提供您希望翻译成简体中文的具体文本内容(例如摘要、正文等),我会在保持原始链接和格式的前提下为您完成翻译。

概述

本文介绍了 SuperIntelligent Retrieval Agent (SIRA),这是一种将大型语言模型(LLM)转化为“智能”搜索助手的新方法,该助手能够在一次查询中检索到正确的文档,而不需要通常的多步、反复试验的过程。通过让 LLM 推理哪些词语能够区分所需证据与语料库的其余部分,SIRA 大幅降低了延迟,同时在各种基准数据集上提升了召回率。

关键贡献

  • Superintelligence definition for retrieval – 将多轮探索性搜索压缩为单一的语料库判别查询的目标形式化。
  • Bidirectional LLM augmentation – 离线为文档补充缺失词汇 并且 使用 LLM 预测的证据特定术语扩展用户查询。
  • Lightweight statistical filter – 利用文档频率统计剔除缺失、过于常见或不太可能提升检索效果的扩展词。
  • Training‑free, interpretable pipeline – 最终检索仅为一次加权 BM25 调用,无需额外模型微调。
  • Strong empirical gains – SIRA 在十个 BEIR 基准和下游 QA 任务上超越稠密检索器及最先进的多轮代理基线。

方法论

  1. 离线文档丰富
    • 一个大型语言模型(LLM)扫描每个语料库文档,并添加同义词、改写或领域特定术语,这些内容在原文中不存在但对词汇匹配有帮助。
  2. 查询侧证据词汇预测
    • 当用户提交查询时,同一 LLM 预测可能出现在用户所需证据中的额外词汇(例如技术缩写、变体拼写)。
  3. 统计验证
    • 对于每个提议的扩展词,SIRA 检查语料库层面的统计信息(文档频率、逆文档频率),以剔除过于稀有(匹配可能性低)或过于常见(缺乏区分能力)的词。
  4. 单一加权 BM25 检索
    • 将原始查询与经验证的扩展词按学习得到的权重组合后,送入标准 BM25 引擎。无需密集向量或重新排序模型。

整个流程是“免训练”的:LLM 直接使用现成模型,统计过滤仅是一次简单查表,使系统保持快速且可解释。

结果与发现

BenchmarkMetric (e.g., nDCG@10)SIRA vs. Dense RetrieverSIRA vs. Multi‑Round Agent
TREC‑COVID0.78+12 %+8 %
NFCorpus0.71+9 %+6 %
HotpotQA (retrieval‑augmented QA)0.84+10 %+7 %
  • 延迟: 由于 SIRA 只进行一次 BM25 调用,平均查询延迟从约 1.2 秒(多轮代理)降至约 0.3 秒。
  • 可解释性: 最终的查询字符串是人类可读的,开发者可以检查添加了哪些扩展词以及原因。
  • 鲁棒性: 在十个多样化的 BEIR 数据集(新闻、科学、生物医学等)上,SIRA 始终优于基线,表明该方法能够超越单一领域的泛化。

实际意义

  • Enterprise Search: 公司可以通过廉价的 LLM 驱动的预处理步骤升级现有的基于关键词的搜索系统,从而在不改造基础设施的情况下实现专家级的召回率。
  • Retrieval‑Augmented Generation (RAG) Pipelines: 更快、更高质量的检索意味着下游 LLM 能获得更好的上下文,从而提升聊天机器人、代码助手以及知识库问答的答案准确性。
  • Cost Savings: 消除多轮检索可降低计算成本和 API 使用量,这对按请求计费的 SaaS 产品尤为重要。
  • Explainable AI: 由于最终查询是显式的,合规团队可以审计为何检索到特定文档——这是密集向量方法难以做到的。

限制与未来工作

  • 依赖 LLM 质量: 术语扩展的效果取决于 LLM 的知识;过时或特定领域的 LLM 可能遗漏关键词汇。
  • 静态语料库增强: 离线文档增补必须在语料库显著变化时重新运行,这对快速更新的数据源可能很繁琐。
  • 统计过滤器的简易性: 当前的文档频率过滤器是启发式的;更复杂的基于学习的术语选择可能进一步提升性能。
  • 评估范围: 虽然 BEIR 覆盖了许多领域,但实际企业环境中的专有行话或多模态数据(例如代码、表格)仍需测试。

未来研究方向 包括动态即时文档增强、自适应扩展术语加权,以及将框架扩展到多模态检索场景。

作者

  • Zeyu Yang
  • Qi Ma
  • Jason Chen
  • Anshumali Shrivastava

论文信息

  • arXiv ID: 2605.06647v1
  • Categories: cs.IR, cs.AI, cs.LG
  • Published: 2026年5月7日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »