computer-vision — Page 34

1个月前 · ai

[Paper] 基于物理的汽车 LiDAR 仿真

我们提出了一种用于模拟汽车飞行时间（ToF）LiDAR的解析模型，包含光斑蔓延、回波脉冲宽度和环境光，并包括步骤……

#research #paper #ai #computer-vision
1个月前 · ai

[Paper] 合成面部数据生成技术在人脸识别中的比较研究

面部识别已成为一种广泛使用的身份验证和识别方法，应用于安全访问和寻找失踪人员。它的…

#research #paper #ai #computer-vision
1个月前 · ai

[Paper] 知道何时不确定的世界模型：可控视频生成与校准不确定性

近期在 generative video models 方面的进展已在 high-fidelity video synthesis 领域取得了重大突破，尤其是在 controllable video generation 上……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] NICE：神经隐式颅面模型用于正颌手术预测

正颌手术是纠正牙面骨骼畸形、提升咬合功能和面部美观的关键干预措施。准确…

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] 主动视频感知：迭代证据搜索用于 Agentic 长视频理解

长视频理解（LVU）具有挑战性，因为回答现实世界的查询往往依赖于埋藏在数小时大部分内容中的稀疏、时间上分散的线索……

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai

YOLOv1 论文导读：YOLO首次看到世界的那一天

从头实现的 YOLOv1 架构及其 PyTorch 实现的详细 walkthrough。文章标题：YOLOv1 论文解析：YOLO 首次亮相的那一天。

#YOLOv1 #object detection #computer vision #deep learning #PyTorch #model walkthrough #neural networks
1个月前 · ai

[Paper] 通用权重子空间假设

我们展示了在不同任务上训练的深度神经网络表现出惊人相似的低维参数子空间。我们提供了首次大规模……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] Light‑X：生成式 4D 视频渲染与相机和光照控制

最近在光照控制方面的进展将基于图像的方法扩展到视频，但仍面临光照保真度与时间一致性之间的权衡。Mo...

#research #paper #ai #computer-vision
1个月前 · ai

[Paper] 价值梯度引导用于流匹配对齐

虽然已有方法可以将 flow matching models——一种流行且有效的 generative models——与 human preferences 对齐，但现有方法未能……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] 基于多对比 MRI 的深度婴儿脑分割

磁共振成像（MRI）的分割通过划分解剖结构，促进对人类大脑发育的分析。然而，在婴儿和...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] DraCo：Draft as CoT 用于 Text-to-Image 预览和稀有概念生成

最近的统一多模态大语言模型（MLLMs）展示了令人印象深刻的能力，结合了链式思考（CoT）推理，以增强文本到-...

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai

[Paper] Splannequin: 冻结单目Mannequin-Challenge影像的双检测Splatting

从单目Mannequin‑Challenge（MC）视频合成高保真冻结的3D场景是一个独特的问题，与标准的动态场景重建不同……

#research #paper #ai #computer-vision

Newer posts

Older posts