[Paper] 通过基于注意力的可解释性优化多模态语言模型
现代的大型语言模型变得多模态,能够分析文本和图像等各种数据格式。虽然微调在适应这些多模态……
现代的大型语言模型变得多模态,能够分析文本和图像等各种数据格式。虽然微调在适应这些多模态……
尽管在 multilingual speech processing 方面取得了近期进展,非洲语言在研究和已部署的系统中仍然代表性不足,尤其是当 i...
Knowledge-enhanced text generation 旨在通过利用内部或外部知识源来提升生成文本的质量。虽然语言模型已经…
赌博障碍是一种复杂的行为成瘾,难以理解和处理,伴随严重的身体、心理和社会后果……
本工作探讨了构建“能够记忆的机器”的挑战,将长期记忆框定为高效超长上下文建模的问题。W...
大规模视觉语言模型(LVLMs)在需要视觉信息的任务中展现出先进的能力,包括目标检测。这些能力……
生物神经元展现出非凡的智能:它们保持内部状态,选择性地与其他神经元通信,并自组织成复杂的……
我们调查了大型语言模型(LLMs)在不同任务难度上的泛化能力,这是一项对有效数据策划和评估至关重要的问题。E...
大型语言模型是强大的通用模型,但解决诸如人类最后考试(HLE)之类的深层复杂问题仍然在概念上……
Vision-Language Models (VLMs) 仍然缺乏空间智能方面的鲁棒性,在空间理解和推理任务上表现不佳。我们...
Synthetic data has become increasingly important for training large language models, especially when real data is scarce, expensive, or privacy-sensitive. Many ... 合成数据在训练大型语言模型方面变得越来越重要,尤其是在真实数据稀缺、成本高昂或涉及隐私的情况下。许多 …
大型语言模型在生成创意文本方面的能力日益提升,然而大多数关于 AI 生成诗歌的研究仍聚焦于英语——一种占主导地位的语言……