EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 0个月前 · ai

    [Paper] MapTrace: 可扩展的数据生成用于地图上的路径追踪

    虽然Multimodal Large Language Models在许多visual和textual reasoning tasks上已经达到了类人水平的表现,但它们在细粒度spatial…

    #research #paper #ai #machine-learning #computer-vision
  • 0个月前 · ai

    [Paper] KerJEPA:欧几里得自监督学习的核差异

    近期在自监督 Joint-Embedding Predictive Architectures(JEPAs)方面的突破表明,正则化欧几里得表示以趋向 iso...

    #research #paper #ai #machine-learning #computer-vision
  • 0个月前 · ai

    YOLOv6:用于工业应用的单阶段目标检测框架

    概述 YOLOv6 是面向工厂、商店和各类摄像头的目标检测新进展。它由一个专注于速度和可靠性的团队构建,……

    #YOLOv6 #object detection #computer vision #real‑time AI #edge computing #industrial AI #open source
  • 0个月前 · ai

    [论文] 指出你的意思:Visually Grounded Instruction Policy

    Vision-Language-Action (VLA) 模型将视觉和语言与具身控制对齐,但当仅依赖于 t 时,它们的对象指代能力仍然有限。

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] LouvreSAE:稀疏自编码器用于可解释且可控的风格迁移

    在生成模型中进行艺术风格迁移仍然是一个重大挑战,因为现有方法通常仅通过 model fine-tuning、additional a...

    #research #paper #ai #machine-learning #computer-vision
  • 0个月前 · ai

    [Paper] Delta-LLaVA:Base-then-Specialize 对齐用于令牌高效的视觉语言模型

    多模态大型语言模型(MLLMs)结合视觉和文本表示,以实现丰富的推理能力。然而,高计算成本……

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] 超越标签的思考:Vocabulary-Free 细粒度识别,基于 Reasoning-Augmented LMMs

    Vocabulary-free fine-grained image recognition 旨在在没有固定的人为定义标签集的情况下,区分元类内部视觉上相似的类别。Exi...

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] 在像素空间通过序数评分相关性定位 Shortcut Learning 以实现 Attribution Representations (OSCAR)

    深度神经网络经常利用捷径。这些是与训练数据中的输出标签相关联的虚假线索,但与任务语义无关。

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    神话:Computer Vision 仅对图像有效,而不是

    误区:Computer Vision 只对图像有效,对视频无效。 现实:Computer Vision 能同时处理图像和视频,这要归功于技术的进步……

    #computer vision #video analysis #deep learning #temporal processing #AI myths
  • 0个月前 · ai

    [Paper] 深度学习方法在中世纪历史文献转录中的应用

    手写文本识别和光学字符识别解决方案在处理现代时代的数据时表现出色,但效率在 La... 时会下降。

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 1个月前 · ai

    为 Triplet Loss 在行人再识别中的辩护

    引言 人员再识别(re-ID)是跨不同摄像头视角寻找同一人的任务。它在安防等领域具有重要应用……

    #triplet loss #person re-identification #computer vision #deep learning #metric learning #end-to-end training
  • 1个月前 · ai

    使用动量对比学习的改进基准

    概述:让计算机在没有标记数据的情况下识别模式——即无监督学习——由于对……的简单调整,已变得更加容易。

    #momentum contrast #MoCo #contrastive learning #unsupervised learning #data augmentation #baseline improvement #computer vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026