· ai
[Paper] 关于预训练、中期训练与 RL 对推理语言模型的相互作用
近期的强化学习(RL)技术在语言模型中取得了显著的推理提升,但仍不清楚后训练的……
近期的强化学习(RL)技术在语言模型中取得了显著的推理提升,但仍不清楚后训练的……
大多数视觉生成模型在应用扩散或自回归建模之前,会将图像压缩到潜在空间中。然而,现有的方法,例如 VAEs ……
利用一组配对叙事的数据集,我们研究大型语言模型(LLMs)在可靠区分不连贯和连贯故事方面的程度……
在上市前药物安全性审查中,将相关不良事件术语分组为标准化的 MedDRA 查询或 FDA 新药办公室自定义医学查询(O...)。
多模态大语言模型(MLLMs)在视觉‑语言理解任务中展示了卓越的能力。虽然这些模型经常产生语言……
在线不文明行为已成为数字社区中广泛且持续存在的问题,对用户造成了巨大的社会和心理负担。Alt...
大型语言模型(LLMs)在代码智能任务(如代码生成、摘要和翻译)中表现出卓越的性能。然而...
脉冲神经网络在事件驱动感知方面表现出色,但在长时间尺度上保持任务相关的上下文仍然是一个挑战。然而,在硬件中构建这些网络……
自动从 natural language requirements 合成 verifiable code 可确保软件的正确性和可靠性,同时显著降低了门槛。
我们研究大型语言模型(LLMs)在作为具备工具使用能力的自主代理时的失败情况。使用 Kamiwaza Agentic Merit Index(KAM)...
DreamerV3 是一种最先进的在线模型驱动强化学习(MBRL)算法,以其显著的样本效率而闻名。同时,Kolmogorov‑Arno…
尽管大型语言模型(LLMs)在代码生成方面非常有效,但它们经常输出错误的代码。一个原因是模型输出概率……