· ai · - · -
[Paper] 内外:演化以用户为中心的 Core Memory Trees 用于长期个性化对话系统
现有的长期个性化对话系统在调和无限的交互流与有限的上下文约束方面遇到困难,常常因 memory...
现有的长期个性化对话系统在调和无限的交互流与有限的上下文约束方面遇到困难,常常因 memory...
自然语言推理(NLI)一直是评估语言模型在自然语言理解方面的重要任务,但其逻辑属性……
大型语言模型(LLMs)在复杂推理方面常常受到高计算成本和延迟的阻碍,而资源高效的 Small Language Models (SL...
文档问答(DocQA)专注于基于给定文档回答问题,但现有的 DocQA 代理缺乏有效的工具利用和……
针对作物病害分析的 Visual Question Answering 需要准确的视觉理解和可靠的语言生成。本工作提出了一种轻量级的 vi...
最近在语言模型(LMs)方面的进展推动了各种软件工程任务的显著进步。然而,现有的LMs仍然在 compl...
我们介绍了 RFC Bench,这是一项用于在真实新闻环境下评估大型语言模型在金融误信息方面表现的基准。RFC Bench 在段落层面运行。
语言模型在广泛的任务上已经变得非常有效,从数学问题求解到开放域问答。然而,它们仍然会犯错误,...
我们提出了 LLMberjack,一个基于现有辩论(最初以 reply trees 结构)创建多方对话的平台。该系统提供……
大型语言模型(LLMs)在预训练期间编码了大量的参数化知识。随着世界知识的演变,有效的部署越来越依赖……
代表用户与图形界面交互的 GUI 代理代表了实用 AI 助手的一个有前景的方向。然而,训练此类代理……
语言模型经常表现出倾向于使用输入中特定位置的信息,而不考虑语义相关性。虽然位置偏差已经…