EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 5天前 · ai

    全新 Apple 模型将视觉理解与图像生成相结合,取得惊人效果

    Apple 研究人员已发表了一项关于 Manzano 的研究,Manzano 是一种多模态模型,结合了视觉理解和文本到图像生成,同时显著……

    #Apple #multimodal AI #vision-language model #text-to-image generation #Manzano #computer vision #generative AI #AI research
  • 5天前 · ai

    [Paper] Fast-ThinkAct:通过可言语化潜在规划实现高效的 Vision-Language-Action 推理

    Vision-Language-Action (VLA) 任务需要对复杂视觉场景进行推理,并在动态环境中执行自适应动作。虽然最近的研究关于 …

    #research #paper #ai #machine-learning #computer-vision
  • 5天前 · ai

    [Paper] SAM3-DMS:解耦记忆选择用于 SAM3 的多目标视频分割

    Segment Anything 3 (SAM3) 已经建立了一个强大的基础,能够在视频中稳健地检测、分割和跟踪指定目标。然而,在其原始…

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [Paper] COMPOSE:超图覆盖优化用于多视角 3D 人体姿态估计

    从稀疏多视角进行 3D pose estimation 是众多应用的关键任务,包括 action recognition、sports analysis 和 human-robot interaction 等。

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [论文] 高效相机控制的静态场景视频生成:稀疏扩散与3D渲染

    基于扩散模型的现代视频生成模型能够生成非常逼真的片段,但它们计算效率低下,通常需要数分钟的……

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [论文] LLMs 可以压缩 LLMs:由代理进行的自适应剪枝

    随着大型语言模型(LLMs)持续扩展,后训练剪枝已成为一种有前景的方法,可在保持性能的同时降低计算成本……

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 5天前 · ai

    [Paper] STEP3-VL-10B 技术报告

    我们推出 STEP3-VL-10B,这是一款轻量级开源基础模型,旨在重新定义紧凑效率与前沿水平多模态之间的权衡……

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [Paper] SCE-SLAM:通过场景坐标嵌入实现尺度一致的单目 SLAM

    单目视觉SLAM能够从互联网视频进行3D重建,并在资源受限的平台上实现自主导航,但却受到尺度漂移的影响,…

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [Paper] 自监督动物识别用于长视频

    在长时段视频中识别单个动物对于行为生态学、野生动物监测和畜牧管理至关重要。传统方法 r...

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [论文] LiteEmbed:适配 CLIP 到稀有类别

    大规模视觉语言模型(如 CLIP)能够实现强大的零样本识别,但在预训练期间很少见到的类别上表现不佳,包括……

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [Paper] Image2Garment:从单张图像生成可用于仿真的服装

    从单张图像估计物理上准确、simulation-ready 的服装具有挑战性,因为缺乏 image-to-physics 数据集,并且该问题是病态的 n...

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [论文] 揭示文本到图像排行榜背后的模型

    文本到图像(T2I)模型日益流行,产生了大量在线的 AI 生成图像。为了比较模型质量,基于投票的排行榜……

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026