EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 3주 전 · ai

    [Paper] diffractive decoder를 이용한 Snapshot 3D 이미지 투영

    3D image display는 차세대 volumetric imaging에 필수적이지만, 3D image projection을 위한 dense depth multiplexing은 ... 때문에 여전히 어려운 과제입니다.

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 생성형 디지털 트윈: 실행 가능한 산업 시스템을 위한 비전‑언어 시뮬레이션 모델

    우리는 시각 및 언어 이해를 통합하여 레이아웃 스케치와 …로부터 실행 가능한 FlexScript를 합성하는 Vision-Language Simulation Model (VLSM)을 제안한다.

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 0개월 전 · ai

    [Paper] 프리즘 가설: 시맨틱과 픽셀 표현을 통합 자동 인코딩으로 조화

    Deep representations across modalities는 본질적으로 얽혀 있다. 본 논문에서는 다양한 semantic과 …의 spectral characteristics를 체계적으로 분석한다.

    #research #paper #ai #computer-vision
  • 0개월 전 · ai

    [Paper] Interact2Ar: 전신 인간-인간 상호작용 생성 via Autoregressive Diffusion Models

    현실적인 human-human interactions을 생성하는 것은 고품질의 개별 body와 hand motion뿐만 아니라 일관된 coor...

    #research #paper #ai #computer-vision
  • 0개월 전 · ai

    [Paper] 대규모 멀티모달 대응 학습으로 오디오비주얼 인지의 최전선을 확장

    우리는 Perception Encoder Audiovisual, PE-AV를 소개합니다. 이는 오디오와 비디오 이해를 위해 스케일된 대조 학습으로 훈련된 새로운 인코더 계열입니다. Built o…

    #research #paper #ai #machine-learning #computer-vision
  • 0개월 전 · ai

    [Paper] Visual-Aware CoT: 통합 모델에서 고충실도 시각 일관성 달성

    최근에 Chain-of-Thought (CoT)의 도입으로 통합 모델의 생성 능력이 크게 향상되었습니다. 하지만 현재 ...

    #research #paper #ai #computer-vision
  • 0개월 전 · ai

    [Paper] 비디오에서 장면 내 객체 조작의 Zero-shot 재구성

    우리는 단일 monocular RGB video에서 장면 내 객체 조작을 재구성하는 문제를 해결하기 위한 최초의 시스템을 구축했습니다. 이는 ill-posed 문제이기 때문에 도전적입니다.

    #research #paper #ai #computer-vision
  • 0개월 전 · ai

    [Paper] 실내에서 열린 세계로: MLLMs의 공간 추론 격차 밝히기

    멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)은 의미론적 과제에서 인상적인 성능을 달성했지만, 그들의 공간 지능—견고하고 기반이 되는 …

    #research #paper #ai #computer-vision
  • 0개월 전 · ai

    [Paper] WorldWarp: 비동기 비디오 디퓨전을 통한 3D 기하학 전파

    장거리이며 기하학적으로 일관된 비디오를 생성하는 것은 근본적인 딜레마를 제시한다: 일관성은 픽셀 공간에서 3D geometry에 대한 엄격한 준수를 요구하지만, ...

    #research #paper #ai #machine-learning #computer-vision
  • 0개월 전 · ai

    [Paper] 효율적인 Vision Mamba를 통한 MRI Super-Resolution, 하이브리드 선택 스캐닝

    배경: 고해상도 MRI는 진단에 필수적이지만, 긴 촬영 시간 때문에 임상에서의 활용이 제한됩니다. 슈퍼해상도(SR)는 스캔 후 해상도를 향상시킬 수 있습니다.

    #research #paper #ai #computer-vision
  • 0개월 전 · ai

    [Paper] Multimodal LLMs를 활용한 아카이브 이미지 스캔으로부터의 역사적 데이터셋 구축: 독일 특허 (1877-1918)

    우리는 멀티모달 대형 언어 모델(LLMs)을 활용하여 9,562개의 아카이브 이미지 스캔을 통해 306,070개의 독일 특허(1877‑1918) 데이터셋을 우리 LLM‑b를 사용해 구축합니다.

    #research #paper #ai #computer-vision
  • 0개월 전 · ai

    [Paper] Beyond CLIP: Knowledge-Enhanced 멀티모달 트랜스포머를 활용한 교차 모달 정렬을 위한 당뇨병성 망막증 진단

    당뇨병성 망막증(DR)은 전 세계적으로 예방 가능한 실명의 주요 원인 중 하나이며, 정확한 자동 진단 시스템이 요구됩니다. 일반 도메인 비전‑la…

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026