通过奇怪的概括腐化LLMs

发布: 3个月前 (2026年1月12日 GMT+8 20:02)

1 分钟阅读

Source: Schneier on Security

引人入胜的研究

摘要
大语言模型之所以有用，是因为它们的概括能力非常强。但好事也会有过头的时候吗？我们展示了在狭窄上下文中进行少量微调，如何在这些上下文之外显著改变模型行为……

别再猜测你的 tokens 去哪里了。开始看到 context window 上的 invisible tax。来源：x.com/autocomplete

查看不同管道的性能《何时添加花哨的 RAG 功能有效？》首发于 Towards Data Science....

封面图：我以为我懂得如何与 AI 对话：其实并不懂

厌倦了在无尽的 LLM 对话中失去精彩的离题吗？在编辑 prompt 时整个历史被抹掉，或者长线程变得不可能时感到沮丧……