[Paper] 内部表征作为代理工具选择中幻觉的指标
大型语言模型(LLMs)在工具调用和工具使用方面表现出卓越的能力,但仍会出现幻觉现象,即它们会选择错误的工具……
大型语言模型(LLMs)在工具调用和工具使用方面表现出卓越的能力,但仍会出现幻觉现象,即它们会选择错误的工具……
脑磁共振成像(MRI)在研究神经发育、衰老和疾病方面发挥核心作用。一个关键的应用是大脑年龄预测……
MoE3D 是一种 mixture-of-experts 模块,旨在锐化深度边界并减轻现有 feed-forward 3D … 中的飞点伪影(红色标出)。
普适人工智能日益依赖于在设备上进行学习的系统,这些系统在严格的资源约束下提供低延迟和能源高效的计算。Liq...
股票市场价格预测是一个重要的跨学科研究领域,位于金融、统计学和经济学的交叉点。预测...
大型视觉语言模型(VLMs)功能强大,但常常因偏向文本提示而非视觉证据而产生幻觉。我们在……中研究了这种失效模式。
在本研究中,我们旨在更好地将 Johns Hopkins Fall Risk Assessment Tool (JHFRAT) 的跌倒风险预测与额外的临床意义测量对齐……
实体链接(将文本中模糊的提及映射到知识库中的实体)是诸如知识图谱构建、问答等任务的基础步骤。
当研究人员将 large language models 用于文献审阅或假设生成等自主任务时,计算费用会迅速累积。A...
大型语言模型(LLMs)已经彻底改变了基于文本的代码自动化,但它们在 graph-oriented engineering workflows 中的潜力仍未得到充分探索……
大型语言模型(LLMs)的快速发展引发了对使用合成数据训练未来模型的日益兴趣。然而,这会产生自我‑c...
链式思考(CoT)推理已成为多模态大型语言模型在视频理解任务中的强大工具。然而,它的必要性和...
具身问答(EQA)在3D环境中通常需要收集分布在多个视角且部分被遮挡的上下文。Ho...
现有的长期个性化对话系统在调和无限的交互流与有限的上下文约束方面遇到困难,常常因 memory...
自然语言推理(NLI)一直是评估语言模型在自然语言理解方面的重要任务,但其逻辑属性……
大型语言模型(LLMs)在复杂推理方面常常受到高计算成本和延迟的阻碍,而资源高效的 Small Language Models (SL...
文档问答(DocQA)专注于基于给定文档回答问题,但现有的 DocQA 代理缺乏有效的工具利用和……
针对作物病害分析的 Visual Question Answering 需要准确的视觉理解和可靠的语言生成。本工作提出了一种轻量级的 vi...
LLM 驱动的 agentic 应用程序正日益自动化复杂的多步骤任务,但由于组件异构,如何高效地为其提供服务仍然是一个挑战。
设计科学仪器通常需要在大型且高度受约束的设计空间中进行探索,并使用计算成本高的物理仿真。这些...
癫痫是一种慢性神经系统疾病,以反复的非诱发性发作为特征,影响全球超过5000万人,并带来显著风险……
癫痫是一种慢性神经系统疾病,以反复的无诱因发作为特征,影响全球超过5000万人,并带来显著的风险……
一种新的混合优化方法使边缘设备仅通过前向传播即可微调视觉语言模型,准确率最高提升 7%,超过了现有方法。
隐私保护的联邦平均是保护联邦学习中客户端隐私的核心方法。本文中,我们研究了在异步…