EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1개월 전 · ai

    [Paper] DentalGPT: 치의학에서 멀티모달 복합 추론을 장려하기

    치과 분야에서 멀티모달 데이터의 신뢰할 수 있는 해석은 자동 구강 의료에 필수적이지만, 현재의 멀티모달 대형 언어 모델(MLLMs)은 어려움을 겪고 있다.

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 1개월 전 · ai

    [Paper] HFS: 효율적인 비디오 추론을 위한 전체론적 쿼리 인식 프레임 선택

    비디오 이해에서 키 프레임 선택은 상당한 과제를 제시합니다. 프레임을 독립적으로 점수화하는 전통적인 top‑K 선택 방법은 종종 실패합니다…

    #research #paper #ai #nlp #computer-vision
  • 1개월 전 · ai

    [Paper] Parallax: 이기종 엣지 시스템에서 연산자 폴백을 위한 런타임 병렬화

    실시간 DNN 애플리케이션에 대한 수요가 에지 디바이스에서 증가함에 따라, 점점 더 복잡해지는 모델의 빠른 추론이 필요합니다. 많은 디바이스가 sp...을 포함하고 있지만.

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] StereoSpace: Depth-Free 스테레오 기하학 합성 via End-to-End Diffusion in a Canonical Space

    우리는 StereoSpace를 소개합니다. 이는 monocular-to-stereo synthesis를 위한 diffusion-based 프레임워크로, geometry를 순수하게 viewpoint conditioning을 통해 모델링하며, …

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] WorldLens: 실제 세계에서 Driving World Models의 전 스펙트럼 평가

    Generative world models는 embodied AI를 재구성하고, 에이전트가 설득력 있게 보이지만 종종 물리적으로는 실패하는 현실적인 4D 주행 환경을 합성하도록 합니다.

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] 스테레오와 Mid-Level Vision을 활용한 동적 도시 내비게이션 강화

    언어와 비전 분야에서 파운데이션 모델의 성공은 완전한 엔드‑투‑엔드 로봇 내비게이션 파운데이션 모델(NFMs)에 대한 연구를 촉진했다. NFMs는 모노…

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] Omni-Attribute: 시각 개념 개인화를 위한 Open-vocabulary Attribute Encoder

    Visual concept personalization은 정체성, 표정, 조명, 스타일과 같은 특정 이미지 속성만을 보이지 않는 컨텍스트로 전달하는 것을 목표로 합니다. 그러나...

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] SceneMaker: Open-set 3D 씬 생성과 Decoupled De-occlusion 및 Pose Estimation Model

    본 연구에서는 SceneMaker라는 분리형 3D 씬 생성 프레임워크를 제안한다. 충분한 오픈셋 디오클루전 및 포즈 추정 프리…

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] 양방향 Normalizing Flow: 데이터에서 노이즈로 그리고 다시

    Normalizing Flows (NFs)는 생성 모델링을 위한 원칙적인 프레임워크로 확립되었습니다. 표준 NFs는 forward process와 reverse process로 구성됩니다.

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] Group Diffusion: 이미지 생성 향상을 위한 크로스‑샘플 협업 활성화

    본 연구에서는 diffusion model 추론에서 아직 활용되지 않은 신호를 탐구합니다. 기존의 모든 방법이 추론 시 이미지를 독립적으로 생성하는 반면, 우리는 대신 …

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] E-RayZer: 셀프슈퍼바이즈드 3D 재구성을 Spatial Visual Pre-training으로

    Self-supervised pre-training은 언어, 개별 2D 이미지 및 비디오에 대한 foundation models에 혁신을 가져왔지만, 3D 학습에 대해서는 아직 크게 탐구되지 않았다...

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] 우리는 텍스트‑투‑3D 생성에서 RL에 준비가 되었나요? 점진적 조사

    강화 학습(RL)은 대규모 언어 모델 및 멀티모달 모델에서 효과가 입증된 바 있으며, 2D 이미지 생성 향상을 위해 성공적으로 확장되었습니다.

    #research #paper #ai #machine-learning #nlp #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026