computer-vision — Page 24

1个月前 · ai

[Paper] 风格化合成增强进一步提升对腐蚀鲁棒性

本文提出了一种训练数据增强流水线，将合成图像数据与神经风格迁移相结合，以解决其脆弱性。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] VTCBench：视觉语言模型能否通过视觉-文本压缩理解长上下文？

与扩展 LLMs 的 context window 相关的计算和内存开销严重限制了它们的可扩展性。一个值得注意的解决方案是 vision-te…

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai

[Paper] 类人工作记忆来自人工内在可塑性神经元

工作记忆使大脑能够整合瞬时信息，以实现快速决策。人工网络通常通过 recurrent 或 par...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

数据标注：驱动精准且可扩展的 AI 系统

引言数据标注是人工智能的基础过程，使机器能够从真实世界的数据中学习。它涉及添加意义……

#data annotation #machine learning #training data #labeling #computer vision #natural language processing #speech recognition #AI model accuracy
1个月前 · ai

AI 背景去除器：AI 如何检测对象并分离背景

AI 背景移除工具乍一看可能像魔法一样。你上传一张图片，点击一个按钮，背景就消失了。在这简单的交互背后……

#background removal #computer vision #image segmentation #machine learning #deep learning #AI tools
1个月前 · software

在 iOS 上使用 Metal 渲染相机 (AVFoundation + MetalKit)

使用 Metal 渲染摄像头视频，无需 AVCaptureVideoPreviewLayer。在本教程中，我们将直接在屏幕上渲染摄像头视频，使用…

#iOS #Metal #AVFoundation #MetalKit #camera #video rendering #Swift #shaders #AR #computer vision #machine learning
1个月前 · ai

[Paper] MemFlow：流动的自适应记忆用于一致且高效的长视频叙事

流式视频生成的核心挑战是保持长上下文中的内容一致性，这对内存设计提出了很高的要求。Mo...

#research #paper #ai #computer-vision
1个月前 · ai

[Paper] TimeLens：重新思考视频时序定位与多模态 LLMs

本论文并未提出新方法，而是为视频时间定位（VTG）建立了一个直接、渐进且必不可少的基线，……

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai

[Paper] 球面 Leech 量化用于视觉标记化与生成

非参数量化因其在参数上的高效性以及对大码本的可扩展性而受到广泛关注。本文中，我们提出了一种 uni...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] CRISP：接触引导的 Real2Sim 从单目视频与平面场景基元

我们介绍了 CRISP，这是一种从单目视频中恢复可模拟的人体运动和场景几何的方法。先前关于人‑场景联合重建的工作…

#research #paper #ai #computer-vision
1个月前 · ai

[Paper] 原生且紧凑的结构化潜在用于3D生成

近年来，3D 生成建模的最新进展显著提升了生成的真实感，但该领域仍受到现有表示方式的限制，……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] MMGR: 多模态生成推理

Video foundation models 生成视觉上逼真且时间上连贯的内容，但它们作为 world simulators 的可靠性取决于它们是否捕捉到 …

#research #paper #ai #nlp #computer-vision

Newer posts

Older posts