· ai · - · -
[Paper] MIBURI:面向富有表现力的交互式手势合成
具身对话代理(Embodied Conversational Agents,ECAs)旨在通过语音、手势和面部表情来模拟人类面对面的互动。当前的大型语言模型……
具身对话代理(Embodied Conversational Agents,ECAs)旨在通过语音、手势和面部表情来模拟人类面对面的互动。当前的大型语言模型……
许多关键的操作任务——例如食品准备、外科手术和工艺制作——对自主机器人仍然难以解决。这些任务的特征是…
实现自主且多功能的 whole-body loco-manipulation 仍然是使 humanoids 实际有用的核心障碍。然而,现有的方法仍然不足……
进行交互并从经验中学习的能力是机器人学的核心挑战,提供了一种可扩展的替代方案,以取代劳动密集型的人类 de...
人类移动轨迹在公共卫生和社会科学中被广泛研究,不同人口统计群体表现出显著不同的移动……
Feedforward geometric foundation models 在短窗口重建方面表现强劲,但将其扩展到分钟级视频时受到 quadratic attention 的瓶颈限制。
对 convection-dominated 瞬态传输现象的数值模拟,由于出现 sharp gradients 和 propagating ……,面临显著的计算挑战。
语言模型(LMs)作为代理在长上下文任务中的部署日益加速,这促使我们必须深入了解目标漂移:代理的…
针对不完全信息游戏的 AI 算法通常使用单个游戏的性能指标进行比较,这使得评估其鲁棒性变得困难……
自回归解码受其顺序特性限制。投机解码已经成为通过使用快速草稿模型来加速推理的标准方法。
生成式人工智能(AI)提供了可扩展的形成性反馈支持,但大多数 AI 生成的反馈依赖于任务特定的评分标准……
统一的多模态模型最近展示了强大的生成能力,但生成何时以及是否提升了理解仍不清楚。Exi...