· ai
[Paper] Delta-LLaVA:Base-then-Specialize 对齐用于令牌高效的视觉语言模型
多模态大型语言模型(MLLMs)结合视觉和文本表示,以实现丰富的推理能力。然而,高计算成本……
多模态大型语言模型(MLLMs)结合视觉和文本表示,以实现丰富的推理能力。然而,高计算成本……
多年来,自动 MT 指标已经在基准上不断攀升,并且在与人工评分的吻合度上表现出强劲且有时达到人类水平的一致性。然而,它们仍然 bl...
我们提出 Gabliteration,这是一种新颖的神经权重修改技术,通过实现自适应多方向……
Vocabulary-free fine-grained image recognition 旨在在没有固定的人为定义标签集的情况下,区分元类内部视觉上相似的类别。Exi...
高性能计算(HPC)工作负载正变得日益多样化,作业特征呈现出很大的变动性,然而集群调度仍然……
深度神经网络经常利用捷径。这些是与训练数据中的输出标签相关联的虚假线索,但与任务语义无关。
基于高性能计算(HPC)的模拟在天体物理学和宇宙学(A&C)中至关重要,帮助科学家研究和理解复杂的……
对项目(题目或任务)难度的准确估计对教育评估至关重要,但面临冷启动问题。虽然大型语言模型…
手写文本识别和光学字符识别解决方案在处理现代时代的数据时表现出色,但效率在 La... 时会下降。
我们研究了一个 Hopf 代数 Markov 链的动力学性质,其状态空间是带标签叶子的二叉根森林。这个 Markov 动力系统……
Mixture-of-Experts(MoE)已成为大规模语言模型(LLMs)中的主导架构,因为它能够通过稀疏专家激活来扩展模型容量……
记忆增强的脉冲神经网络(SNN)有望实现能效高的类脑计算,但它们在不同感官模态间的泛化仍未得到充分验证……