EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 3주 전 · ai

    WiFi DensePose: 벽을 통과하는 WiFi 기반 밀집 인간 자세 추정 시스템

    기사 URL: https://github.com/ruvnet/wifi-densepose 댓글 URL: https://news.ycombinator.com/item?id=46388904 점수: 10 댓글: 1

    #WiFi #DensePose #human pose estimation #computer vision #through walls #deep learning #open-source #research
  • 3주 전 · ai

    LAION-400M: CLIP 필터링된 4억 이미지‑텍스트 쌍의 오픈 데이터셋

    LAION-400M은 새로운 아이디어를 촉발하기 위해 설계된 거대한 공개 자원입니다. 약 4억 개의 이미지가 짧은 캡션과 짝을 이루며, 정제되고 CLIP‑filtered됩니다.

    #LAION-400M #image-text dataset #CLIP-filtered #multimodal AI #open data #machine learning #computer vision
  • 3주 전 · ai

    AutoAugment: 데이터에서 증강 정책 학습

    개요 AutoAugment는 효과적인 이미지 증강 정책을 자동으로 발견하는 방법입니다. 많은 단순 변환을 체계적으로 테스트함으로써—예를 들어…

    #autoaugment #data augmentation #computer vision #image classification #machine learning #deep learning #neural networks
  • 3주 전 · ai

    [Paper] HiStream: 중복 제거 스트리밍을 통한 효율적인 고해상도 비디오 생성

    고해상도 비디오 생성은 디지털 미디어와 영화에 필수적이지만, diffusion 모델의 이차 복잡성 때문에 계산적으로 병목 현상이 발생합니다, mak...

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 기억을 넘어서: Vision-Language Models의 Popularity Bias를 드러내는 Multi-Modal Ordinal Regression Benchmark

    우리는 최신 비전-언어 모델(VLMs)에서 상당한 인기 편향을 드러내며, 이 모델들은 유명한 건물에 대해 최대 34% 더 높은 정확도를 달성한다 ...

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 스트리밍 비디오 인스트럭션 튜닝

    우리는 실시간 스트리밍 비디오 LLM인 Streamo를 소개합니다. 이는 범용 인터랙티브 어시스턴트 역할을 합니다. 기존의 온라인 비디오 모델들이 좁은 ...

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 텍스트 기반 토큰 프루닝을 활용한 Fast SAM2

    Segment Anything Model 2 (SAM2)는 비전 파운데이션 모델로서 프롬프트 기반 비디오 객체 분할에서 크게 발전했지만, 실제 배포는 아직 어려운 상황입니다.

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] TICON: 슬라이드 수준 타일 컨텍스추얼라이저를 이용한 조직병리학 표현 학습

    대형 전체 슬라이드 이미지(WSI)에서 작은 타일을 해석하려면 종종 더 큰 이미지 컨텍스트가 필요합니다. 우리는 트랜스포머 기반 타일 표현인 TICON을 소개합니다.

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] Data Processing Inequality은 실제를 반영하는가? Low-Level Tasks의 유용성에 대하여

    Data processing inequality은 정보 이론적 원칙으로, 신호의 정보 내용은 관측을 처리함으로써 증가시킬 수 없다고 명시한다.

    #research #paper #ai #machine-learning #computer-vision
  • 3주 전 · ai

    [Paper] AndroidLens: Android GUI 에이전트를 위한 중첩 서브 타깃을 활용한 장기 지연 평가

    그래픽 사용자 인터페이스(GUI) 에이전트는 모바일 기기에서 자주 실행되는 장시간 지연 작업을 자동화함으로써 생산성을 크게 향상시킬 수 있습니다. 그러나, ex...

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 후처리 마스크 기반 테이블 세그멘테이션을 통한 구조 좌표 추출

    표에서의 Structured data extraction은 스캔된 문서와 디지털 아카이브의 document image analysis에서 중요한 역할을 합니다. 많은 방법들이 …

    #research #paper #ai #computer-vision
  • 3주 전 · ai

    [Paper] 실시간 잠재력을 갖춘 Spike-Driven Video Transformer를 이용한 외과 장면 분할

    현대 외과 시스템은 지능형 장면 이해에 점점 더 의존하여 향상된 수술 중 안전을 위한 시기적절한 상황 인식을 제공합니다. Within...

    #research #paper #ai #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026