EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1개월 전 · ai

    [Paper] 시맨틱과 재구성 모두 중요: 텍스트-투-이미지 생성 및 편집을 위해 표현 인코더 준비하기

    현대 잠재 확산 모델(LDM)은 일반적으로 픽셀 수준 재구성을 위해 주로 최적화된 저수준 변분 오토인코더(VAE) 잠재 공간에서 작동합니다.

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] Re-Depth Anything: 테스트 시 자기지도 재조명을 통한 깊이 정제

    단일 카메라 깊이 추정은 여전히 어려운 과제로, Depth Anything V2 (DA-V2)와 같은 최신 기반 모델들은 실제 세계 이미지에서 멀리 떨어진…

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] 정교한 World Models

    최근 3D 재구성 분야의 진보로 일상적인 환경에서 현실적인 디지털 트윈을 쉽게 만들 수 있게 되었습니다. 그러나 현재 디지털 트윈은 여전히 크게…

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] Open Foundation Models에서 Vision의 적대적 견고성

    딥러닝이 증가함에 따라 AI 시스템이 객체를 식별할 수 있는 모델을 이해하기가 점점 어려워집니다. 따라서, 적대자는…

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] 다중 에이전트 상호작용 시퀀스 모델링을 위한 Diffusion Forcing

    다중 인물 상호작용을 이해하고 생성하는 것은 robotics와 social computing에 광범위한 영향을 미치는 근본적인 도전 과제입니다. 인간은 자연스럽게…

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] RadarGen: 카메라에서 자동차 레이더 포인트 클라우드 생성

    우리는 RadarGen을 소개합니다. RadarGen은 다중 뷰 카메라 이미지로부터 현실적인 자동차 레이더 포인트 클라우드를 합성하기 위한 diffusion model입니다. RadarGen은 효율적인 이미지‑...

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] 키포인트 카운팅 분류기: Vision Transformers를 훈련 없이 Self‑Explainable Models로 전환

    현재 self-explainable models (SEMs)를 설계하기 위한 접근 방식은 복잡한 training procedures와 특정 architectures를 필요로 하여 실용적이지 않다....

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] Visually Prompted 벤치마크는 놀라울 정도로 취약하다

    VLM을 평가할 때 주요 과제는 모델이 텍스트 사전 지식과는 독립적으로 시각적 콘텐츠를 분석할 수 있는 능력을 테스트하는 것입니다. BLINK와 같은 최신 벤치마크는…

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] InSPECT: 확산 모델의 불변 스펙트럼 특징 보존

    현대 확산 모델(DMs)은 최첨단 이미지 생성 성능을 달성했습니다. 그러나 데이터를 완전히 백색 잡음까지 확산시키는 근본적인 설계 선택은…

    #research #paper #ai #computer-vision
  • 1개월 전 · ai

    [Paper] 해석 가능한 식물 잎 질병 탐지: Attention-Enhanced CNN 활용

    식물 질병은 전 세계 식량 안보에 중대한 위협이 되며, 정확하고 해석 가능한 질병 탐지 방법이 필요합니다. 이 연구는 i...

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] InfSplign: 추론 단계에서 텍스트-이미지 확산 모델의 공간 정렬

    Text-to-image (T2I) diffusion models는 고품질 이미지를 생성하지만 텍스트 프롬프트에 지정된 공간 관계를 포착하지 못하는 경우가 많습니다. 이 제한은…

    #research #paper #ai #machine-learning #computer-vision
  • 1개월 전 · ai

    [Paper] PathBench-MIL: Histopathology에서 Multiple Instance Learning을 위한 포괄적인 AutoML 및 Benchmarking 프레임워크

    우리는 병리학에서 다중 인스턴스 학습(MIL)을 위한 오픈 소스 AutoML 및 벤치마킹 프레임워크인 PathBench-MIL을 소개합니다. 이 시스템은 end-to‑end…

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026