RAG 是如何工作的...

发布: 1个月前 (2026年1月3日 GMT+8 17:49)

3 分钟阅读

原文: Dev.to

Source: Dev.to

什么是检索增强生成（RAG）？

如果你一直在关注 AI 领域，你一定听过流行词 RAG（Retrieval‑Augmented Generation，检索增强生成）。它听起来很复杂，但本质上是一种让 AI 在真实场景中更有用的方法。

可以把它想象成 AI 模型的“开卷”考试：

标准 LLM – 模型只能凭记忆作答，这可能导致细节遗忘或出现幻觉。
RAG – 模型可以在查询时查阅参考资料（例如教材），检索到所需的确切段落，然后基于这些信息作答。

RAG 的工作原理

RAG 可以拆分为三个简单步骤：

1. 检索（搜索）

当提出问题（例如“我们公司的请假政策是什么？”）时，系统首先在私有知识库——PDF、文档、电子邮件等——中搜索相关段落。查询不会直接发送给语言模型。

2. 增强（上下文）

检索到的段落会与原始问题合并，形成提示。示例提示：

Using these notes [paste notes here], answer this question: What is the leave policy?

3. 生成（答案）

像 GPT‑4 或 Claude 这样的语言模型读取增强后的提示，并仅基于提供的上下文生成答案。

RAG 的优势

可信度 – 由于答案基于检索到的文档，模型出现幻觉的可能性更小。
时效性 – 在知识库中更新文档即可让 AI 立即获取新信息，无需昂贵的重新训练。
效率 – 当源材料变化时，你无需反复对大型模型进行重新训练，从而节省成本。

为什么 RAG 很重要

RAG 常被称为 AI 工程的 “Hello World”。它标志着从单纯使用 AI 到成为能够将 AI 与专有数据集成的构建者的转变，能够交付准确、最新且可信的结果。

相关文章

阅读更多 »

第4部分 — 检索即系统

为什么大多数实用的 GenAI 系统是检索中心的——大型语言模型（LLMs）是基于静态数据进行训练的，这导致：- 知识陈旧 - 缺失领域……

大语言模型时代的科学产出 [pdf]

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行翻译。

TII 的 Falcon H1R 7B 在推理能力上可超越规模高达 7 倍的模型——并且它（大部分）是开源的

在过去的两年里，生成式 AI 的主流逻辑是暴力破解：如果想要更好的推理，就需要更大的模型。虽然“small”…

Anthropic 让 Claude 经营真实的业务。它破产了。

当你给 AI 真实的金钱、实际的库存以及企业的钥匙时，会发生什么？Anthropic 决定通过 Project Vend 这个实验来找出答案，实验…