· ai
[Paper] 风格化合成增强进一步提升对腐蚀鲁棒性
本文提出了一种训练数据增强流水线,将合成图像数据与神经风格迁移相结合,以解决其脆弱性。
本文提出了一种训练数据增强流水线,将合成图像数据与神经风格迁移相结合,以解决其脆弱性。
与扩展 LLMs 的 context window 相关的计算和内存开销严重限制了它们的可扩展性。一个值得注意的解决方案是 vision-te…
工作记忆使大脑能够整合瞬时信息,以实现快速决策。人工网络通常通过 recurrent 或 par...
引言 数据标注是人工智能的基础过程,使机器能够从真实世界的数据中学习。它涉及添加意义……
AI 背景移除工具乍一看可能像魔法一样。你上传一张图片,点击一个按钮,背景就消失了。在这简单的交互背后……
使用 Metal 渲染摄像头视频,无需 AVCaptureVideoPreviewLayer。在本教程中,我们将直接在屏幕上渲染摄像头视频,使用…
流式视频生成的核心挑战是保持长上下文中的内容一致性,这对内存设计提出了很高的要求。Mo...
本论文并未提出新方法,而是为视频时间定位(VTG)建立了一个直接、渐进且必不可少的基线,……
非参数量化因其在参数上的高效性以及对大码本的可扩展性而受到广泛关注。本文中,我们提出了一种 uni...
我们介绍了 CRISP,这是一种从单目视频中恢复可模拟的人体运动和场景几何的方法。先前关于人‑场景联合重建的工作…
近年来,3D 生成建模的最新进展显著提升了生成的真实感,但该领域仍受到现有表示方式的限制,……
Video foundation models 生成视觉上逼真且时间上连贯的内容,但它们作为 world simulators 的可靠性取决于它们是否捕捉到 …