EUNO.NEWS EUNO.NEWS
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
  • All (20286) +125
    • AI (3097) +8
    • DevOps (909) +5
    • Software (10479) +94
    • IT (5755) +18
    • Education (45)
  • Notice (1)
  • All (20286) +125
  • AI (3097) +8
  • DevOps (909) +5
  • Software (10479) +94
  • IT (5755) +18
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 5일 전 · ai

    새로운 Apple 모델이 시각 이해와 이미지 생성을 결합해 인상적인 결과를 보여줍니다

    Apple 연구원들은 시각 이해와 텍스트‑투‑이미지 생성을 결합한 다중모달 모델인 Manzano에 대한 연구를 발표했으며, 동시에 크게…

    #Apple #multimodal AI #vision-language model #text-to-image generation #Manzano #computer vision #generative AI #AI research
  • 5일 전 · ai

    [Paper] Fast-ThinkAct: 효율적인 Vision-Language-Action 추론을 위한 Verbalizable Latent Planning

    Vision-Language-Action (VLA) 작업은 복잡한 시각 장면에 대한 추론과 동적인 환경에서 적응형 행동을 실행하는 것을 요구한다. 최근 연구들은 …

    #research #paper #ai #machine-learning #computer-vision
  • 5일 전 · ai

    [Paper] SAM3-DMS: SAM3의 다중 대상 비디오 분할을 위한 디커플드 메모리 선택

    Segment Anything 3 (SAM3)은 비디오에서 지정된 대상들을 강력하게 감지하고, 분할하며, 추적하는 견고한 기반을 구축했습니다. 그러나 원본에서는...

    #research #paper #ai #computer-vision
  • 5일 전 · ai

    [Paper] COMPOSE: 다중 뷰 3D 인체 자세 추정을 위한 하이퍼그래프 커버 최적화

    sparse multi-views에서의 3D pose estimation은 action recognition, sports analysis, human-robot interaction 등을 포함한 수많은 응용 분야에서 중요한 과제입니다.

    #research #paper #ai #computer-vision
  • 5일 전 · ai

    [Paper] 효율적인 카메라 제어 비디오 생성: 정적 장면을 위한 Sparse Diffusion 및 3D Rendering

    현대의 비디오 생성 모델은 diffusion models에 기반하여 매우 현실적인 클립을 만들 수 있지만, 계산 효율성이 낮아 종종 몇 분이 걸린다.

    #research #paper #ai #computer-vision
  • 5일 전 · ai

    [Paper] LLMs can Compress LLMs: 에이전트에 의한 적응형 프루닝

    대규모 언어 모델(LLM)이 계속 확장됨에 따라, 사후 훈련 프루닝은 계산 비용을 줄이면서 성능을 유지하는 유망한 접근법으로 떠올랐습니다.

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 5일 전 · ai

    [Paper] STEP3-VL-10B 기술 보고서

    우리는 STEP3-VL-10B를 소개합니다. 이는 경량의 오픈소스 파운데이션 모델로, 컴팩트 효율성과 최첨단 멀티모달 사이의 트레이드오프를 재정의하도록 설계되었습니다…

    #research #paper #ai #computer-vision
  • 5일 전 · ai

    [Paper] SCE-SLAM: 장면 좌표 임베딩을 통한 스케일 일관성 단안 SLAM

    모노큘러 비주얼 SLAM은 인터넷 비디오에서 3D 재구성을 가능하게 하고 자원 제한 플랫폼에서 자율 내비게이션을 지원하지만, 스케일 드리프트, i...

    #research #paper #ai #computer-vision
  • 5일 전 · ai

    [Paper] 장시간 비디오를 위한 자기 지도 동물 식별

    장시간 비디오에서 개별 동물을 식별하는 것은 행동 생태학, 야생동물 모니터링 및 가축 관리에 필수적입니다. 전통적인 방법은...

    #research #paper #ai #computer-vision
  • 5일 전 · ai

    [Paper] LiteEmbed: 희귀 클래스에 CLIP 적용

    CLIP과 같은 대규모 비전‑언어 모델은 강력한 제로샷 인식을 달성하지만, 사전 학습 중에 거의 보이지 않는 클래스에 대해서는 어려움을 겪습니다, 포함…

    #research #paper #ai #computer-vision
  • 5일 전 · ai

    [Paper] Image2Garment: 단일 이미지에서 시뮬레이션용 의류 생성

    단일 이미지에서 물리적으로 정확하고 simulation-ready 의상을 추정하는 것은 image-to-physics 데이터셋이 부족하고 ill-posed 문제이기 때문에 도전적이다.

    #research #paper #ai #computer-vision
  • 5일 전 · ai

    [Paper] 텍스트‑투‑이미지 리더보드 뒤의 모델 식별

    텍스트-투-이미지 (T2I) 모델은 점점 인기를 얻고 있으며, 온라인에서 AI 생성 이미지의 큰 비중을 차지하고 있습니다. 모델 품질을 비교하기 위해, 투표 기반 리더보드...

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026