[Paper] 通过基于注意力的可解释性优化多模态语言模型
现代的大型语言模型变得多模态,能够分析文本和图像等各种数据格式。虽然微调在适应这些多模态……
现代的大型语言模型变得多模态,能够分析文本和图像等各种数据格式。虽然微调在适应这些多模态……
尽管在 multilingual speech processing 方面取得了近期进展,非洲语言在研究和已部署的系统中仍然代表性不足,尤其是当 i...
在当代零售业,可供选择的产品种类繁多(例如 clothing、groceries、cosmetics、frozen goods),这使得预测需求变得困难,防止 s...
程序合成是根据一组规范(例如一组输入‑输出示例)生成计算机程序的过程。它可以被建模为……
Knowledge-enhanced text generation 旨在通过利用内部或外部知识源来提升生成文本的质量。虽然语言模型已经…
赌博障碍是一种复杂的行为成瘾,难以理解和处理,伴随严重的身体、心理和社会后果……
图表到代码的生成是自动化数据可视化中的关键任务,它将复杂的图表结构转换为可执行程序。虽然最近的 Multi-m...
本工作探讨了构建“能够记忆的机器”的挑战,将长期记忆框定为高效超长上下文建模的问题。W...
大规模视觉语言模型(LVLMs)在需要视觉信息的任务中展现出先进的能力,包括目标检测。这些能力……
基于变异的故障定位(Mutation-based Fault Localization,MBFL)已被广泛探索用于自动化软件调试,利用人工变异体来识别有缺陷的代码实体……
内容无关模型,由 Censor‑Hillel、Cohen、Gelles 和 Sel(PODC 2022;Distributed Computing 2023)提出,捕捉了一种极其弱的形式的…
联邦边缘学习(FEEL)为边缘人工智能(AI)提供了有前景的基础,通过实现协作模型训练,同时保护 d...