· ai
[Paper] 赋能 MLLMs 中可靠的视觉中心指令跟随
评估多模态大语言模型(MLLMs)的指令遵循(IF)能力对于严格评估模型输出的忠实程度至关重要。
评估多模态大语言模型(MLLMs)的指令遵循(IF)能力对于严格评估模型输出的忠实程度至关重要。
随着 multi-agent LLM pipelines 的复杂性增加,现有的 serving paradigms 无法适应动态的 serving conditions。我们认为,agentic serving system …
我们基于概率域软化算子,构建了一个统一的稀疏知识蒸馏理论框架。虽然等价 p^{1/T} ...
社交媒体上的 Hate speech detection 在准确性和可解释性方面都面临挑战,尤其是对于尚未深入研究的 Indic languages。我们提出了一种新颖的…
虽然统一多模态模型(UMMs)在跨模态理解方面取得了显著成功,但它们在利用 su… 能力方面仍然存在显著差距。
人类智能的标志是能够通过构建性情景模拟——检索过去的经验以综合解决方案——掌握新技能的能力。
多模态医学大型语言模型在胸部X光解读方面表现出令人印象深刻的进展,但仍然面临空间推理和……
Machine unlearning 旨在从 Large Language Models (LLMs) 中忘记敏感知识,同时保持一般实用性。然而,现有方法通常…
我们提出了对自回归生成去中心化的理论分析。我们通过表达……来定义 Decentralized Discrete Flow Matching 目标。
基础模型(FMs)被视为一种变革性的突破,已开始重塑人工智能(AI)的未来,跨越学术...
扩散模型在图像和视频生成方面取得了显著成功。然而,它们固有的多步推理过程会带来巨大的计算成本……
精确且可扩展的细胞核实例分割对于计算病理学至关重要,然而千兆像素全切片图像带来了巨大的计算挑战。