EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 3주 전 · ai

    [Paper] Diffusion은 투명성을 안다: 투명 객체 깊이 및 노멀 추정을 위한 Video Diffusion 재활용

    투명한 물체는 인식 시스템에게 여전히 악명 높게 어려운 문제입니다: refraction, reflection 그리고 transmission이 stereo, ToF 및 순수 …

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [논문] Web World Models

    언어 에이전트는 점점 더 행동하고, 기억하고, 학습할 수 있는 지속적인 세계를 필요로 합니다. 기존 접근 방식은 두 극단에 놓여 있습니다: 기존 웹 fra...

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 3주 전 · ai

    [Paper] IDT: 물리적으로 기반한 Transformer를 이용한 Feed-Forward 멀티뷰 내재적 분해

    Intrinsic image decomposition은 시각적 이해에 기본적이며, RGB 이미지가 물질 특성, 조명, 그리고 시점 의존 효과를 얽혀 있기 때문입니다. Rec...

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] RoboMirror: 모방하기 전에 이해하라 for Video to Humanoid Locomotion

    인간은 시각 관찰을 통해 보행을 학습하며, 먼저 시각적 내용을 해석한 뒤 행동을 모방합니다. 그러나 최첨단 인간형 로봇 보행 시스템은…

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] OmniAgent: 오디오 가이드 액티브 퍼셉션 에이전트 for 옴니모달 오디오-비디오 이해

    Omnimodal large language models는 audio와 visual modalities를 통합하는 데 큰 진전을 이루었지만, 종종 세밀한 cross-modal 이해가 부족합니다.

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 엔드-투-엔드 3D 인식의 시공간 정렬 재고

    Spatio-temporal alignment은 자율주행(AD)에서 end-to-end (E2E) 인식의 시간 모델링에 필수적이며, 귀중한 구조적 및 텍스처 정보를 제공합니다.

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 3D Shape Generation에서의 기억화: 실증 연구

    Generative models는 새로운 형태를 합성하기 위해 3D vision에서 점점 더 많이 사용되고 있지만, 그들의 생성이 훈련 s...에 의존하는지는 아직 명확하지 않다.

    #research #paper #ai #machine-learning #computer-vision
  • 3주 전 · ai

    [Paper] 확장 가능한 Residual Feature Aggregation Framework와 Hybrid Metaheuristic Optimization을 이용한 강인한 초기 췌장 신생물 검출을 위한 Multimodal CT Imaging

    췌장 종양(pancreatic neoplasm)의 조기 발견은 주요 임상적 딜레마이며, 이는 주로 종양이 최소한의 대비 경계(minimal contrast margin)로 나타날 가능성이 높기 때문입니다.

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 카메라 RGB‑NIR에서 화재 감지

    적외선 야간 시야 카메라를 이용한 화재 감지 정확도 향상은 여전히 어려운 과제이다. 이전 연구들은 강력한 성능을 보고하였다...

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] RxnBench: 과학 문헌에서 화학 반응 이해를 평가하기 위한 대형 언어 모델용 멀티모달 벤치마크

    멀티모달 대형 언어 모델(MLLMs)을 화학에 통합하는 것은 과학적 발견을 혁신할 것을 약속하지만, 그들의 …

    #research #paper #ai #machine-learning #computer-vision
  • 3주 전 · ai

    [Paper] CubeBench: 부분 관측 하에서 인터랙티브·장기 공간 추론 진단

    Large Language Model (LLM) 에이전트는 디지털 영역에서는 능숙하지만, 물리적 세계에 배치하는 데 있어 형성의 어려움 때문에 큰 격차에 직면하고 있다.

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 3주 전 · ai

    [Paper] MedGemma vs GPT-4: 오픈소스와 프로프라이어터리 제로샷 의료 질병 이미지 분류

    멀티모달 대형 언어 모델(LLMs)은 방대한 임상 지식을 바탕으로 스캔을 해석함으로써 의료 영상 분야에 새로운 패러다임을 제시합니다.

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026