· ai
[Paper] 思考即行动:通过多轮交互在 LLM 中构建高效的 World Model 推理
开发稳健的世界模型推理对于大型语言模型(LLM)代理在复杂环境中进行规划和交互至关重要。虽然多轮交互……
开发稳健的世界模型推理对于大型语言模型(LLM)代理在复杂环境中进行规划和交互至关重要。虽然多轮交互……
最近,多人视频生成开始受到关注。虽然已有少数初步工作探索了音频驱动的多人说话视频生成……
近期在大型语言模型(LLMs)方面的进展已经促成了数学发现的突破,以 AlphaEvolve 为例,这是一个闭源系统,...
大型视觉语言模型(VLMs)通过广泛的预训练,有效弥合模态差距,获取与视觉表示相匹配的复杂特征……
当前的世界模型缺乏统一且受控的系统评估环境,这使得难以评估它们是否真正捕捉到了底层的 ru...
近年来,语言模型在高级基准上取得了巨大的进展,但这些进展在很大程度上只能通过使用更昂贵的模型来实现……
Deep learning 方法在 object detection 方面已经实现了对图像中特定目标类别的可靠检测。然而,扩展模型的检测能力…
Inverse heat problems 指的是在已观测或已知的热扩散行为下,对材料热物理属性进行估计。Inverse heat problems 已经…
本文研究了激活函数在使用两层神经网络学习模加法中的作用。我们首先建立了一个明确的表达能力差距:si...
离线强化学习(Offline reinforcement learning, RL)使得智能体能够从预先收集的数据集学习最优策略。然而,包含次优和碎片化的…
机器学习模型在诊断、天气预报、自然语言处理(NLP)和自动驾驶等领域表现出色,但它们对不确定性的处理有限……
我们介绍了 SuperIntelliAgent,这是一种代理学习框架,将可训练的小型 diffusion model(学习者)与冻结的大型语言模型(t...)相耦合。