· ai · - · -
[Paper] 说话者感知仿真提升对话语音识别
自动语音识别(ASR)在会话语音方面仍具挑战性,因为缺乏大规模、标注完善的多说话人对话数据……
自动语音识别(ASR)在会话语音方面仍具挑战性,因为缺乏大规模、标注完善的多说话人对话数据……
当前的LLM安全方法根本上依赖于一种脆弱的猫捉老鼠游戏,通过guardrails识别并阻止已知威胁。我们主张...
最初撰写于2023年。此处重新发布。Tokenizers 是生成式 AI 模型(如 GPT‑4 https://openai.com/gpt-4)的关键组成部分,能够创建...
Parallel thinking 已成为一种有前景的推理范式,但它带来了显著的计算负担。现有的效率方法主要是…
高质量的科学插图对于有效传达复杂的科学和技术概念至关重要,然而它们的手工创建仍然是一个…
基于 Meme 的社交滥用检测具有挑战性,因为有害意图往往依赖于隐式文化符号和微妙的跨模态不一致。先前的…
最近,研究界对使用强化学习(RL)在真实任务上训练大型语言模型(LLMs)表现出浓厚的兴趣,例如……
帮助非专业用户开发复杂的交互式网站已成为 LLM-powered code agents 的热门任务。然而,现有的代码代理往往 …
Prompt injection attacks 操纵网页内容,使 web agents 执行攻击者指定的任务,而不是用户原本的意图。现有方法……
使用大型语言模型(LLMs)进行长上下文推理成本高昂,因为 quadratic attention 和不断增长的 key-value caches,这促使了 context compression。在 t...
直接对齐方法正日益用于将大型语言模型(LLMs)与人类偏好对齐。然而,许多现实中的对齐问题涉及……
我们提出 RLAnything,一个通过闭环优化动态锻造环境、策略和奖励模型的强化学习框架,...