[Paper] ToolOrchestra:通过高效模型和工具编排提升智能
大型语言模型是强大的通用模型,但解决诸如人类最后考试(HLE)之类的深层复杂问题仍然在概念上……
大型语言模型是强大的通用模型,但解决诸如人类最后考试(HLE)之类的深层复杂问题仍然在概念上……
Vision-Language Models (VLMs) 仍然缺乏空间智能方面的鲁棒性,在空间理解和推理任务上表现不佳。我们...
Synthetic data has become increasingly important for training large language models, especially when real data is scarce, expensive, or privacy-sensitive. Many ... 合成数据在训练大型语言模型方面变得越来越重要,尤其是在真实数据稀缺、成本高昂或涉及隐私的情况下。许多 …
大型语言模型在生成创意文本方面的能力日益提升,然而大多数关于 AI 生成诗歌的研究仍聚焦于英语——一种占主导地位的语言……
大型语言模型(LLMs)最近在基于文本属性的图机器学习领域引发了革命,但将LLMs应用于图异常检测、...
大型语言模型(LLMs)在回答改写后的问题时常表现出不一致的行为,这表明它们更依赖于表层模式而不是…
Unlike text, speech conveys information about the speaker, such as gender, through acoustic cues like pitch. This gives rise to modality-specific bias concerns.... 不同于文本,语音通过音高等声学线索传递关于说话者的信息,例如性别。这导致了特定模态的偏见问题……
可读性评估旨在评估文本的阅读难度。近年来,深度学习技术已逐步应用于可读性……
文本属性图需要模型能够有效地将强大的文本理解与结构化推理相结合。现有方法要么依赖 …
在标准 Transformer(TF)架构中,刚性且统一的计算分配可能限制其效率和可扩展性,尤其是在大规模……
最近的分而治之推理方法,尤其是基于思路链(Chain-of-Thought,CoT)的方式,显著提升了 Text-to-SQL 的能力……
Lindsey(2025)通过四项实验研究语言模型的内省意识,发现模型有时能够检测并识别注入的……