· ai · - · -
【论文】SEMA:简单而有效的多轮越狱攻击学习
多轮 jailbreak 捕捉了安全对齐聊天机器人的真实威胁模型,其中单轮攻击仅是一个特例。然而现有方法 br...
多轮 jailbreak 捕捉了安全对齐聊天机器人的真实威胁模型,其中单轮攻击仅是一个特例。然而现有方法 br...
认知科学中的一个核心问题是,概念表征是汇聚到共享的流形以支持泛化,还是分散成正交的……
歧义在大型语言模型(LLMs)的自然语言理解中持续带来挑战。为了更好地了解词汇歧义如何被解决……
自回归大型语言模型(LLMs)表现出色,但需要本质上顺序的解码,导致推理延迟高且 GPU 利用率差……
记忆在超出单个上下文窗口运行的大型语言模型(LLM)代理中变得日益核心,然而大多数现有系统仍依赖离线的、查询式的…
现有的加速语言模型推理的技术,例如 speculative decoding,需要训练辅助的 speculator 模型并构建和部署…
大型语言模型(LLMs)正日益以零样本方式用于评估心理健康状况,但我们对哪些因素了解有限,...
语音情感识别(Speech Emotion Recognition, SER)研究由于缺乏标准且足够大的数据集而受到限制。最近的研究利用了预训练…
扩散大语言模型(dLLMs)已成为文本生成的有前景的替代方案,其特点是原生支持并行解码……
深度研究代理已经成为处理复杂查询的强大系统。与此同时,基于LLM的检索器在fol方面展示了强大的能力。
语义表征可以被构建为一种结构化、动态的知识空间,人类在其中导航以检索和操作意义。为了研究……
长推理模型在多语言环境中常常遇到困难:它们倾向于对非英语问题使用英语进行推理;当被限制在...