我构建了一个 TUI 来可视化 RAG 分块,因为 chunk_size=1000 是一个谎言 📉

发布: (2025年12月10日 GMT+8 23:38)
1 min read
原文: Dev.to

Source: Dev.to

概览

说实话吧。当你在构建 RAG(检索增强生成)流水线时,如何选择 chunk_size 和 overlap(重叠)?
如果你和我们 90% 的人一样,你会从教程里复制粘贴 1000200,直接运行,然后祈祷大模型不要产生幻觉。
我意识到自己一直在做“凭感觉 …”。

Back to Blog

相关文章

阅读更多 »

揭秘检索增强生成 (RAG)

大型语言模型(LLMs)彻底改变了我们与信息交互的方式,但它们有一个根本性的限制:它们的知识在训练时点被冻结。