· ai · - · -
[论文] 仿真就绪的杂乱场景估计:基于物理感知的形状与姿态联合优化
从真实世界观测中估计可用于仿真的场景对于下游的规划和策略学习任务至关重要。遗憾的是,现有方法stru...
从真实世界观测中估计可用于仿真的场景对于下游的规划和策略学习任务至关重要。遗憾的是,现有方法stru...
Mean Field Games (MFGs) 为建模大规模人口模型中的交互提供了原则性的框架:在大规模下,人口动态变为确定性,……
数据可视化规则——源自数十年在设计和感知方面的研究——确保图表传达的可信度。虽然先前的研究已经表明,大...
随着大型语言模型(LLMs)的兴起,它们已在检索增强生成(RAG)等应用中发挥了关键作用。然而,对这些……
流行病学模型日益依赖自我报告的行为数据,例如疫苗接种状态、口罩使用和社交距离遵守情况,以预测……
当前针对大模型推理的强化学习目标主要侧重于最大化期望奖励。该范式可能导致对 dom... 的过拟合。
目标:通过避免不必要的推理,同时保持……,提升使用大型语言模型(LLMs)进行医学问答(MedQA)的效率。
大型语言模型(LLMs)是如何知道它们所知道的内容的?要回答这个问题一直很困难,因为预训练数据往往是一个“黑箱”——未知的……
解决长期任务需要机器人将高层语义推理与低层物理交互相结合。虽然视觉语言模型(VLMs)...
Reinforcement learning with verifiable rewards (RLVR) 已成为一种有前景的方法,通过利用监督… 来训练推理语言模型 (RLMs)。
我们研究由[Goel et al. 2017]提出的对抗注入模型中的在线学习,其中标记样本流主要是独立同分布(i.i.d.)抽取的 f...
对专家注释的依赖长期以来一直是人工智能在生物医学应用中的主要瓶颈。虽然 supe...