每十名美国青少年中有三人每天使用 AI 聊天机器人,但安全担忧正在增加
虽然青少年可能最初使用 AI 聊天机器人来提问基本问题,但他们与聊天机器人平台的关系有可能变得上瘾……
虽然青少年可能最初使用 AI 聊天机器人来提问基本问题,但他们与聊天机器人平台的关系有可能变得上瘾……
最近在 diffusion transformers 方面的进展使视频生成模型能够从文本或图像生成高质量的视频片段。然而,world model...
新视角合成(Novel View Synthesis,NVS)传统上依赖于具有显式3D归纳偏置的模型,并结合来自Structure-from-Motion的已知相机参数……
理解并重建来自 video 的动态场景的复杂几何和运动仍然是 computer vision 中的一项艰巨挑战。本文介绍…
我们引入了两个新的基准 REST 和 REST+(Render-Equivalence Stress Tests),以实现对多模态大型模型中跨模态不一致性的系统评估。
文本感知图像恢复(TAIR)旨在从包含退化文本内容的低质量输入中恢复高质量图像。虽然扩散模型……
人类视频演示为学习机器人策略提供了丰富的训练数据,但仅靠视频无法捕捉对 mast... 至关重要的丰富接触信号。
量子误差校正(QEC)解码面临着一个基本的准确性‑效率权衡。像最小权重完美匹配(MWPM)这样的经典方法表现出……
夜间环境对基于相机的感知构成了重大挑战,因为现有方法被动地依赖场景光照。我们引入 Lighting-...
从单张图像生成高质量、纹理化的 3D 场景仍然是视觉和图形学中的一个根本性挑战。最近的 image-to-3D 生成器能够恢复 re...
内容感知布局生成是图形设计自动化中的关键任务,专注于创建视觉上吸引人的元素排列,使其无缝……