[Paper] 关于序列模型中的“归纳偏差”
尽管 transformer-based language models 取得了显著的实际成功,最近的研究对它们进行 state tracking 的能力提出了担忧。In...
尽管 transformer-based language models 取得了显著的实际成功,最近的研究对它们进行 state tracking 的能力提出了担忧。In...
我们描述了一个现代深度学习系统,该系统能够自动识别用于第一语言词汇教学的有信息量的上下文示例(qu{contexts})。
心理语料库在 NLP 中是用于分析人类心理、情感和心理健康的文本集合。这些文本使研究人员能够研究心理……
大型语言模型在交互式定理证明,尤其是 Lean 中取得了显著成果。然而,大多数针对基于 LLM 的证明自动化的基准……
扩散语言模型(Diffusion Language Models,DLMs)由于迭代去噪导致推理成本高,因而激励高效剪枝。现有的剪枝启发式方法大多继承……
Language Identification (LID) 是许多多语言自然语言处理流水线中的重要组成部分,它有助于语料库策划、训练…
Black-box 对抗攻击在大型视觉语言模型(LVLMs)上具有挑战性,因为缺少梯度且多模态边界复杂。虽然先前的研究…
虽然新兴的 Persian NLP 基准已经扩展到语用学和礼貌性,但它们很少区分记忆的文化事实与实际能力之间的差异……
当前的语音大语言模型在很大程度上执行隐式 ASR:在可以通过转录本解决的任务上,它们在行为上和机制上等同于简单的 WhispertoL……
尽管自主网页代理取得了快速进展,但在人类参与仍然是必不可少的,以在任务展开时塑造偏好并纠正代理行为。Howe...
本文介绍了 KLong,这是一款开源的 LLM 代理,经过训练以解决极长时域任务。其原理是首先通过冷启动模型,利用轨迹……
Instruction-following language models 被训练为有帮助且安全,但它们的安全行为在良性微调下可能会恶化,并且在 ad...