[Paper] NoLan:通过动态抑制语言先验缓解大型视觉语言模型中的对象幻觉
对象幻觉是大型视觉语言模型(LVLMs)的一个关键问题,模型的输出可能包含输入图像中不存在的对象。一个自然…
对象幻觉是大型视觉语言模型(LVLMs)的一个关键问题,模型的输出可能包含输入图像中不存在的对象。一个自然…
医学视觉语言预训练越来越依赖医学报告作为大规模监督信号;然而,原始报告往往表现出显著的 st...
最近在 Multimodal Large Language Models 方面的进展大幅提升了视觉理解和推理能力,然而它们的 quadratic attention 和 offline training …
Deep neural networks (DNNs) 对于在边缘或移动设备上执行高级任务至关重要,但它们的部署常常受到严重资源限制的阻碍。
我们研究在均值偏移污染存在的情况下的均值估计基本任务。在 mean-shift contamination 模型中,对手被允许替换…
Instruction-following benchmarks 仍然主要以 English‑centric 为主,导致对数以亿计的 Indic language speakers 存在关键的 evaluation gap。
Small language models(SLMs)在成本、延迟和适应性方面具有显著优势,但在长时程软件任务上仍落后于更大的模型。
理解学习到的分布的几何结构对于改进和解释扩散模型至关重要,然而系统性的工具用于探索它们的…
在多中心医疗环境中,复杂的医疗预约调度优化仍然是一个重要的运营挑战,其中临床…
差分隐私联邦学习面临一个根本性的张力:保护客户端数据的隐私机制同时会产生可量化的…
利用深度学习来解决车辆路径问题的神经路由求解器(NRSs)已展示出在实际应用中的显著潜力。通过 …
原籍于巴尔干小国黑山的斯特拉希尼亚·斯特拉乔·扬尤塞维奇表示,他的人生以意想不到的方式展开,对此他深感感激。