EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1주 전 · ai

    [Paper] InfiniDepth: 임의 해상도 및 세밀한 깊이 추정 with Neural Implicit Fields

    기존 depth estimation 방법은 근본적으로 이산 이미지 그리드에서 깊이를 예측하는 데 제한됩니다. 이러한 표현은 확장성을 임의의 …

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] 다재다능한 멀티모달 에이전트 for Multimedia Content Generation

    AIGC(AI-generated content) 기술의 발전과 함께, 점점 더 많은 생성 모델들이 비디오 편집, 음악 등과 같은 분야를 혁신하고 있습니다.

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] LTX-2: 효율적인 통합 오디오-비주얼 파운데이션 모델

    최근 텍스트-투-비디오 디퓨전 모델은 설득력 있는 비디오 시퀀스를 생성할 수 있지만, 여전히 무음 상태이며 — 의미적, 감정적, 그리고 분위기적 단서를 놓치고 있습니다.

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] UniCorn: 자체 생성된 감독을 통한 자기 개선 통합 멀티모달 모델

    Unified Multimodal Models (UMMs)가 cross-modal comprehension에서 눈에 띄는 성공을 거두었지만, 그들의 ... 활용 능력에는 여전히 큰 격차가 존재한다.

    #research #paper #ai #machine-learning #computer-vision
  • 1주 전 · ai

    [Paper] AnatomiX, 해부학 인식 기반 멀티모달 대형 언어 모델을 이용한 흉부 X-레이 해석

    멀티모달 의료 대형 언어 모델은 흉부 X-레이 해석에서 인상적인 진전을 보여왔지만, 공간 추론 및 …

    #research #paper #ai #machine-learning #computer-vision
  • 1주 전 · ai

    [Paper] 무선 네트워크에서의 예측 및 제어를 위한 Multi-Modal Data-Enhanced Foundation Models: 설문 조사

    Foundation models (FMs)은 인공지능(AI)의 미래를 재구성하기 시작한 변혁적인 돌파구로 인식되고 있으며, 학계와 산업 전반에 걸쳐 그 영향을 확대하고 있습니다.

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 1주 전 · ai

    [Paper] DiffBench Meets DiffAgent: 엔드투엔드 LLM 기반 Diffusion 가속 코드 생성

    Diffusion models는 이미지 및 비디오 생성에서 눈에 띄는 성공을 거두었습니다. 그러나 그들의 본질적으로 다단계 inference 과정은 상당한 c...

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] LSP-DETR: 효율적이고 확장 가능한 전슬라이드 이미지에서의 핵 분할

    정밀하고 확장 가능한 cell nuclei의 instance segmentation은 computational pathology에 필수적이지만, gigapixel Whole-Slide Images는 주요 계산적 …

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] Unified Thinker: 이미지 생성을 위한 일반 추론 모듈 코어

    high-fidelity image synthesis에서 인상적인 진전에도 불구하고, generative models는 여전히 logic-intensive instruction following에 어려움을 겪으며, 지속적인…

    #research #paper #ai #machine-learning #computer-vision
  • 2주 전 · ai

    글로벌 어텐션 메커니즘: 정보를 유지하여 채널‑공간 상호작용 강화

    개요: Global attention은 컴퓨터가 사진을 더 잘 볼 수 있게 도와줍니다—세부 사항을 잃지 않으면서. 전체 이미지에 걸쳐 정보를 유지함으로써, 모델은 …

    #global attention #computer vision #image recognition #channel-spatial interaction #deep learning #neural networks #mobile AI
  • 2주 전 · ai

    [Paper] ExposeAnyone: 개인화된 Audio-to-Expression Diffusion 모델은 강인한 Zero-Shot 얼굴 위조 탐지기

    알려지지 않은 deepfake 변조를 탐지하는 것은 얼굴 위조 탐지에서 가장 어려운 문제 중 하나입니다. 현재 state-of-the-art 접근 방식은 ...

    #research #paper #ai #computer-vision
  • 2주 전 · ai

    [Paper] VINO: 통합 비주얼 생성기와 교차된 OmniModal 컨텍스트

    우리는 VINO를 소개합니다, 단일 프레임워크 내에서 이미지 및 비디오 생성과 편집을 수행하는 통합 visual generator입니다. 작업별 …

    #research #paper #ai #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026