EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1개월 전 · ai

    [Paper] Generative Refocusing: 단일 이미지에서 유연한 Defocus 제어

    Depth-of-field 제어는 사진 촬영에서 필수적이지만, 완벽한 초점을 맞추려면 여러 번 시도하거나 특수 장비가 필요합니다. Single-image refocusing은 아직…

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] 세상은 당신의 캔버스: 참조 이미지, 궤적 및 텍스트를 활용한 프롬프트 가능한 이벤트 그리기

    우리는 WorldCanvas를 소개합니다. 이는 promptable world events를 위한 프레임워크로, 텍스트, trajectories, reference image를 결합하여 풍부하고 사용자 주도적인 시뮬레이션을 가능하게 합니다.

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] 다음 임베딩 예측이 강력한 비전 학습자를 만든다

    자연어에서 생성적 사전학습(generative pretraining)의 성공에 영감을 받아, 우리는 동일한 원칙이 강력한 자체 지도(self-supervised) 시각 학습자(visual learners)를 만들 수 있는지 묻는다. Inst...

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] 중요한 차이점: Auditing Models for Capability Gap Discovery and Rectification

    멀티모달 LLM(MLLM)용 기존 평가 방법은 해석 가능성이 부족하고, 종종 중요한 능력 격차를 완전히 드러내기에 충분하지 않다.

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] DVGT: 드라이빙 비주얼 지오메트리 트랜스포머

    시각 입력으로부터 3D 장면 기하학을 인식하고 재구성하는 것은 자율 주행에 매우 중요합니다. 그러나 아직도 운전 목표에 특화된 밀집 기하학이 부족합니다.

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] EasyV2V: 고품질 명령 기반 비디오 편집 프레임워크

    이미지 편집은 급속히 발전했지만, 비디오 편집은 덜 탐구된 상태이며 일관성, 제어 및 일반화에 대한 도전에 직면하고 있습니다. 우리는 디자인을…

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] AdaTooler-V: 이미지와 비디오를 위한 적응형 툴 사용

    최근 연구에 따르면 멀티모달 대형 언어 모델(MLLMs)은 비전 도구와의 상호작용을 포함한 멀티모달 인터리브 체인오브쓸(Chain-of-Thought, CoT)에서 이점을 얻는 것으로 나타났습니다.

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] StereoPilot: 생성적 사전 지식을 통한 통합적이고 효율적인 스테레오 변환 학습

    VR 헤드셋과 3D 시네마를 포함한 스테레오스코픽 디스플레이의 급속한 성장으로 고품질 스테레오 비디오 콘텐츠에 대한 수요가 증가하고 있습니다. 그러나, pr...

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] Depth Any Panoramas: 파노라믹 깊이 추정을 위한 파운데이션 모델

    본 연구에서는 다양한 장면 거리 전반에 일반화되는 파노라마 메트릭 깊이 파운데이션 모델을 제시합니다. 우리는 데이터‑인‑루프 패러다임을 …에서 탐구합니다.

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] SFTok: 이산 토크나이저의 성능 격차 해소

    최근 멀티모달 모델의 발전은 고해상도 이미지 생성에서 이미지 토큰화의 핵심적인 역할을 강조합니다. 이미지를 압축하여 컴팩트한 la...

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] 추론에서 움직임으로 흐르며: Egocentric Human Interaction Videos로부터 3D Hand Trajectory Prediction 학습

    3D hand trajectory prediction에 관한 기존 연구들은 움직임을 의미론적 감독과 분리하는 데이터셋과 추론을 약하게 연결하는 모델에 의해 제한됩니다.

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] 멀티모달 RewardBench 2: 교차 텍스트와 이미지에 대한 Omni Reward Models 평가

    보상 모델(RMs)은 대형 언어 모델(LLMs) 훈련에 필수적이지만, 이미지와 텍스트가 교차하는 시퀀스를 처리하는 옴니 모델에 대해서는 아직 충분히 탐구되지 않았다.

    #research #paper #ai #nlp #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026