research — Page 147

2个月前 · ai

[Paper] 思考即行动：通过多轮交互在 LLM 中构建高效的 World Model 推理

开发稳健的世界模型推理对于大型语言模型（LLM）代理在复杂环境中进行规划和交互至关重要。虽然多轮交互……

#research #paper #ai #machine-learning
2个月前 · ai

[Paper] AnyTalker：通过交互细化实现多人物说话视频生成的规模化

最近，多人视频生成开始受到关注。虽然已有少数初步工作探索了音频驱动的多人说话视频生成……

#research #paper #ai #computer-vision
2个月前 · ai

[Paper] ThetaEvolve：测试时学习在开放问题上

近期在大型语言模型（LLMs）方面的进展已经促成了数学发现的突破，以 AlphaEvolve 为例，这是一个闭源系统，...

#research #paper #ai #machine-learning #nlp
2个月前 · ai

[Paper] 视觉生成调优

大型视觉语言模型（VLMs）通过广泛的预训练，有效弥合模态差距，获取与视觉表示相匹配的复杂特征……

#research #paper #ai #computer-vision
2个月前 · ai

[Paper] SmallWorlds：评估孤立环境中世界模型的动态理解

当前的世界模型缺乏统一且受控的系统评估环境，这使得难以评估它们是否真正捕捉到了底层的 ru...

#research #paper #ai #machine-learning
2个月前 · ai

[Paper] 进步的代价：算法效率与 AI 推理成本下降

近年来，语言模型在高级基准上取得了巨大的进展，但这些进展在很大程度上只能通过使用更昂贵的模型来实现……

#research #paper #ai #machine-learning
2个月前 · ai

[Paper] 面向对象的数据合成用于类别级目标检测

Deep learning 方法在 object detection 方面已经实现了对图像中特定目标类别的可靠检测。然而，扩展模型的检测能力…

#research #paper #ai #computer-vision
2个月前 · ai

[Paper] Physics-Informed Neural Networks 用于热物性属性检索

Inverse heat problems 指的是在已观测或已知的热扩散行为下，对材料热物理属性进行估计。Inverse heat problems 已经…

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai

[Paper] 可证明的 Sinusoidal Activation 对 Modular Addition 的益处

本文研究了激活函数在使用两层神经网络学习模加法中的作用。我们首先建立了一个明确的表达能力差距：si...

#research #paper #ai #machine-learning
2个月前 · ai

【论文】ASTRO：自适应拼接基于动力学引导的轨迹展开

离线强化学习（Offline reinforcement learning, RL）使得智能体能够从预先收集的数据集学习最优策略。然而，包含次优和碎片化的…

#research #paper #ai #machine-learning
2个月前 · ai

[Paper] 使用单次概率前向传播和代码生成加速贝叶斯神经网络的执行

机器学习模型在诊断、天气预报、自然语言处理（NLP）和自动驾驶等领域表现出色，但它们对不确定性的处理有限……

#research #paper #ai #machine-learning
2个月前 · ai

[Paper] 迈向持续智能增长：自训练、持续学习与双尺度记忆在 SuperIntelliAgent 中

我们介绍了 SuperIntelliAgent，这是一种代理学习框架，将可训练的小型 diffusion model（学习者）与冻结的大型语言模型（t...）相耦合。

#research #paper #ai #machine-learning

Newer posts

Older posts