第4部分 — 检索即系统

发布: 4个月前 (2026年1月2日 GMT+8 03:50)

2 分钟阅读

原文: Dev.to

Source: Dev.to

为什么大多数实用的 GenAI 系统都是检索为中心

大语言模型（LLMs）在静态数据上进行训练，这导致：
- 知识陈旧
- 缺少领域上下文
- 没有来源归属
- 无法传播纠正信息
对于真实世界的应用，仅依赖模型是不可接受的。
准确性、时效性和可追溯性必须在模型之外提供。

检索增强生成（RAG）

RAG 通过将责任从模型转移到系统来工作。

系统职责

决定哪些信息是相关的
控制模型能够看到的内容
将生成基于已知数据进行 grounding

模型职责

综合检索到的信息
生成自然语言输出

这种划分至关重要：大多数 RAG 失败源于系统问题，而非模型本身。

常见的 RAG 陷阱

切块边界不佳
缺失或不完整的元数据
检索查询过于宽泛
延迟高的流水线

因为检索质量在模型介入之前就决定了输出质量，解决这些问题至关重要。

检索为中心架构的优势

可管理的上下文窗口
自然降低幻觉（hallucinations）
模型可互换（相同的检索层可以为不同模型提供信息）
行为可检查（检索到的来源可见）

此时，GenAI 系统类似于带有生成层的搜索系统——这是一种理想的设计。

下一篇文章将把成本、延迟和失败视为设计约束，而不是事后考虑。

相关文章

阅读更多 »

RAG 是如何工作的...

什么是 Retrieval‑Augmented Generation（RAG）？如果你一直在关注 AI 领域，你一定听说过流行词汇 RAG（Retrieval‑Augmented Generation）。它……

块大小作为 RAG 系统中的实验变量

通过实验不同的块大小来理解 RAG 系统中的检索。文章《Chunk Size as an Experimental Variable in RAG Systems》首次出现。

NVIDIA Rubin Platform、Open Models、自动驾驶：NVIDIA 在 CES 上呈现未来蓝图

NVIDIA CEO 黄仁勋开启 CES 2026 NVIDIA 创始人兼 CEO 黄仁勋今天在拉斯维加斯的 Fontainebleau 酒店登台，开启 CES 2026，并宣称……

🧠 LLMs 像5岁小孩一样解释

图书管理员类比想象一位图书管理员，他：- 阅读了图书馆里的每一本书 - 记住了语言运作的模式 - 能够预测下一个词…