[Paper] 보편적 가중치 부분공간 가설
우리는 다양한 작업에 대해 학습된 딥 뉴럴 네트워크가 놀라울 정도로 유사한 저차원 파라메트릭 서브스페이스를 나타낸다는 것을 보여준다. 우리는 최초의 대규모…
456 posts from this source
우리는 다양한 작업에 대해 학습된 딥 뉴럴 네트워크가 놀라울 정도로 유사한 저차원 파라메트릭 서브스페이스를 나타낸다는 것을 보여준다. 우리는 최초의 대규모…
최근 조명 제어 분야의 발전은 이미지 기반 방법을 비디오로 확장했지만, 여전히 조명 충실도와 시간적 일관성 사이의 트레이드오프에 직면하고 있다. Mo...
흐름 매칭 모델—인기 있고 효과적인 생성 모델 클래스—을 인간 선호와 정렬하기 위한 방법이 존재하지만, 기존 접근 방식은 …
자기공명영상(MRI)의 분할은 해부학적 구조를 구분함으로써 인간 뇌 발달 분석을 용이하게 합니다. 그러나 영아와 ...
최근 통합된 멀티모달 대형 언어 모델(MLLMs)은 인상적인 능력을 보여주었으며, 향상된 텍스트-투-…
단일 카메라 Mannequin-Challenge (MC) 비디오에서 high-fidelity frozen 3D scenes를 합성하는 것은 standard dynamic scene reconstruction과는 구별되는 고유한 문제이다.
Reward models는 인간 선호와 vision-language 시스템을 정렬하는 데 핵심적이지만, 현재 접근 방식은 hallucination, 약한 visual grounding 등으로 고통받고 있다...
우리는 ShadowDraw를 소개합니다. 이 프레임워크는 일반적인 3D 객체를 그림자 드로잉 구성 예술로 변환합니다. 3D 객체가 주어지면, 우리 시스템은 장면 …
표준 확산은 푸리에 계수의 무작위 크기와 무작위 위상을 가진 가우시안 노이즈를 사용해 데이터를 손상시킵니다. 무조건적이거나 …에 효과적이지만
대규모 언어 모델(LLMs)에서의 장기 컨텍스트 추론은 체인‑오브‑쓰레드(Chain‑of‑Thought, CoT) 추론을 통해 인지 능력의 향상을 입증했습니다. 훈련…
All-in-One Image Restoration (AiOIR) 작업은 종종 다양한 열화를 포함하며, 이는 강인하고 다재다능한 전략을 필요로 합니다. 그러나 대부분의 기존 접근 방식은 …
Video generation models는 빠르게 발전하고 있지만, 여전히 의미적 분기나 반복적인 고수준 작업을 요구하는 복잡한 비디오 출력에서 어려움을 겪을 수 있습니다.