[Paper] 内部表征作为代理工具选择中幻觉的指标
大型语言模型(LLMs)在工具调用和工具使用方面表现出卓越的能力,但仍会出现幻觉现象,即它们会选择错误的工具……
大型语言模型(LLMs)在工具调用和工具使用方面表现出卓越的能力,但仍会出现幻觉现象,即它们会选择错误的工具……
普适人工智能日益依赖于在设备上进行学习的系统,这些系统在严格的资源约束下提供低延迟和能源高效的计算。Liq...
股票市场价格预测是一个重要的跨学科研究领域,位于金融、统计学和经济学的交叉点。预测...
大型视觉语言模型(VLMs)功能强大,但常常因偏向文本提示而非视觉证据而产生幻觉。我们在……中研究了这种失效模式。
在本研究中,我们旨在更好地将 Johns Hopkins Fall Risk Assessment Tool (JHFRAT) 的跌倒风险预测与额外的临床意义测量对齐……
当研究人员将 large language models 用于文献审阅或假设生成等自主任务时,计算费用会迅速累积。A...
大型语言模型(LLMs)已经彻底改变了基于文本的代码自动化,但它们在 graph-oriented engineering workflows 中的潜力仍未得到充分探索……
大型语言模型(LLMs)的快速发展引发了对使用合成数据训练未来模型的日益兴趣。然而,这会产生自我‑c...
具身问答(EQA)在3D环境中通常需要收集分布在多个视角且部分被遮挡的上下文。Ho...
大型语言模型(LLMs)在复杂推理方面常常受到高计算成本和延迟的阻碍,而资源高效的 Small Language Models (SL...
请提供您希望翻译的具体摘录或摘要文本,我将为您翻译成简体中文。
不要错过我们上个月最受欢迎的文章。《TDS Newsletter: December Must-Reads on GraphRAG, Data Contracts, and More》首次发布于……