EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1주 전 · ai

    [Paper] ImLoc: 이미지 기반 표현을 통한 시각적 로컬라이제이션 재검토

    기존 시각 위치추정 방법은 일반적으로 2D 이미지 기반 방식으로, 구축 및 유지가 쉽지만 효과적인 기하학적 추론에 제한이 있거나 …

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] Scanner-Induced Domain Shifts가 병리학 파운데이션 모델의 견고성을 약화시킨다

    Pathology foundation models (PFMs)은 computational pathology의 중심이 되었으며, whole-slide images에서 feature extraction을 위한 general encoders를 제공하는 것을 목표로 합니다.

    #research #paper #ai #machine-learning #computer-vision
  • 1주 전 · ai

    [Paper] ToTMNet: FFT 가속 토플리츠 시계열 혼합 네트워크 경량 원격 광혈류측정을 위한

    Remote photoplethysmography (rPPG)는 상용 카메라로 촬영한 얼굴 비디오에서 혈액량 펄스 (BVP) 파형을 추정합니다. 최근의 딥 모델들은 …

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] Diffusion-DRF: 비디오 디퓨전 파인튜닝을 위한 미분 가능한 보상 흐름

    Direct Preference Optimization (DPO)는 최근 텍스트‑투‑비디오 (T2V) 생성에서 시각적 충실도와 텍스트 정렬을 향상시켜 성능을 개선했습니다. 그러나 현재 방법…

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] Klear: 통합 멀티태스크 오디오-비디오 공동 생성

    Audio-video joint generation은 빠르게 진행되었지만, 여전히 상당한 도전 과제가 남아 있습니다. 비상업적 접근 방식은 여전히 audio‑visual asynchrony, …

    #research #paper #ai #machine-learning #computer-vision
  • 1주 전 · ai

    [Paper] Wow, wo, val! 포괄적인 Embodied World Model 평가 튜링 테스트

    세계 모델이 Embodied AI에서 가속화를 얻음에 따라, 점점 더 많은 연구가 비디오 foundation models를 예측적 세계 모델로 활용하여 downstream 작업에 적용하는 방안을 탐구하고 있다.

    #research #paper #ai #machine-learning #computer-vision
  • 1주 전 · ai

    [Paper] 픽셀 단위 다중모달 대조 학습을 이용한 원격 탐사 이미지

    위성은 특히 지구 관측을 위해 위성 이미지 시계열(SITS)을 포함한 방대한 양의 데이터를 지속적으로 생성합니다. 그러나 대부분의 딥 러닝...

    #research #paper #ai #machine-learning #computer-vision
  • 1주 전 · ai

    [Paper] InfiniteWeb: GUI 에이전트 훈련을 위한 확장 가능한 웹 환경 합성

    사용자를 대신해 그래픽 인터페이스와 상호작용하는 GUI agents는 실용적인 AI assistants를 위한 유망한 방향을 나타냅니다. 그러나 이러한 agents를 훈련하는 것은…

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 1주 전 · ai

    [Paper] MORPHFED: 기관 간 혈액 형태학 분석을 위한 연합 학습

    Automated blood morphology analysis는 저소득 및 중간소득 국가(LMICs)에서 혈액학 진단을 지원할 수 있지만, dataset shifts에 민감합니다.

    #research #paper #ai #machine-learning #computer-vision
  • 1주 전 · ai

    [Paper] 교차 모달 충돌 하에서 대규모 멀티모달 모델의 추론 일관성 분석

    대형 멀티모달 모델(LMMs)은 체인‑오브‑소트(Chain‑of‑Thought, CoT)를 통해 비디오 추론에서 인상적인 능력을 보여주었습니다. 그러나 그들의 추론의 견고성은…

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 1주 전 · ai

    [Paper] 더 나아졌지만 충분하지 않다: Video ANNs를 Macaque IT Dynamics에 테스트

    정적 이미지로 학습된 피드포워드 인공 신경망(ANN)은 영장류 복측 시각 흐름의 지배적인 모델로 남아 있지만, 이들은 본질적으로…

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] Muses: 디자인, 구성, 생성 – 훈련 없이 비존재 판타지 3D 생물

    우리는 Muses를 소개한다. 이는 피드포워드 패러다임에서 환상적인 3D 크리처 생성을 위한 최초의 training-free 방법이다. 이전 방법들은 part-aware opt...

    #research #paper #ai #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026