[Paper] DA-SSL: self-supervised 도메인 어댑터를 활용한 turbt 조직병리 슬라이드에서 foundational models 활용
최근 조직병리학에서 딥러닝 프레임워크, 특히 다중 인스턴스 학습(MIL)과 병리학 기본 모델(PFMs)을 결합한 것이 ...
최근 조직병리학에서 딥러닝 프레임워크, 특히 다중 인스턴스 학습(MIL)과 병리학 기본 모델(PFMs)을 결합한 것이 ...
진짜 사람들은 이 이미지에서 레이니어 산이 너무 크게 보인다는 것을 알겠지만, 이 AI 이미지에서 워싱턴 주 페리를 재현한 것은 섬뜩합니다. 이것은 The Ste...
소개 AI 배경 제거기는 잘 작동할 때 거의 마법처럼 느껴지고—작동하지 않을 때는 좌절감을 줍니다. 차이는 보통 두 가지 얇은…
3D Gaussian Splatting(3DGS)의 최근 성공은 빠른 최적화와 실시간 고품질 라디언스 렌더링을 가능하게 함으로써 새로운 뷰 합성을 재구성했습니다.
대규모 비디오 생성 모델은 실제 장면에서 포토리얼리스틱한 외관과 라이트 인터랙션을 모델링하는 데 놀라운 잠재력을 보여주었습니다. 그러나...
우리는 Particulate라는 feed-forward 접근 방식을 제시한다. 이 방법은 일상적인 객체의 단일 정적 3D mesh를 입력으로 받아, 기본적인 articulation의 모든 속성을 직접 추론한다.
대규모 및 다양한 로봇 시연(데모)의 수집은 모방 학습(imitation learning)에서 여전히 주요 병목 현상으로 남아 있습니다. 실제 환경에서 데이터 획득이 비용이 많이 들고 …
현실은 rigid constraints와 deformable structures 사이의 춤이다. video models에게는 fidelity를 유지하면서 structure를 보존하는 motion을 생성한다는 의미이다.
일상적인 clinical photographs에서 vitiligo 범위를 정확하게 정량화하는 것은 treatment response의 longitudinal monitoring에 필수적입니다. 우리는 신뢰할 수 있는, f...
Video matting은 기존 데이터셋의 규모와 현실감에 의해 제한됩니다. Segmentation 데이터를 활용하면 의미적 안정성을 향상시킬 수 있지만, 효과의 부족…
모델 지문 탐지 기술은 AI 생성 이미지의 출처 모델을 식별하는 유망한 접근법으로 떠오였지만, 그 견고성은…
현실적인 합성 현미경 이미지를 생성하는 것은 라벨이 부족한 환경에서 딥러닝 모델을 훈련시키는 데 매우 중요합니다. 예를 들어, 많은 세포를 포함한 세포 카운팅과 같은 경우에 특히 그렇습니다.
Visual Foundation Model (VFM) 표현에 기반한 Visual generation은 시각 이해와 ...
치과 분야에서 멀티모달 데이터의 신뢰할 수 있는 해석은 자동 구강 의료에 필수적이지만, 현재의 멀티모달 대형 언어 모델(MLLMs)은 어려움을 겪고 있다.
비디오 이해에서 키 프레임 선택은 상당한 과제를 제시합니다. 프레임을 독립적으로 점수화하는 전통적인 top‑K 선택 방법은 종종 실패합니다…
실시간 DNN 애플리케이션에 대한 수요가 에지 디바이스에서 증가함에 따라, 점점 더 복잡해지는 모델의 빠른 추론이 필요합니다. 많은 디바이스가 sp...을 포함하고 있지만.
우리는 StereoSpace를 소개합니다. 이는 monocular-to-stereo synthesis를 위한 diffusion-based 프레임워크로, geometry를 순수하게 viewpoint conditioning을 통해 모델링하며, …
Generative world models는 embodied AI를 재구성하고, 에이전트가 설득력 있게 보이지만 종종 물리적으로는 실패하는 현실적인 4D 주행 환경을 합성하도록 합니다.
언어와 비전 분야에서 파운데이션 모델의 성공은 완전한 엔드‑투‑엔드 로봇 내비게이션 파운데이션 모델(NFMs)에 대한 연구를 촉진했다. NFMs는 모노…
Visual concept personalization은 정체성, 표정, 조명, 스타일과 같은 특정 이미지 속성만을 보이지 않는 컨텍스트로 전달하는 것을 목표로 합니다. 그러나...
본 연구에서는 SceneMaker라는 분리형 3D 씬 생성 프레임워크를 제안한다. 충분한 오픈셋 디오클루전 및 포즈 추정 프리…
Normalizing Flows (NFs)는 생성 모델링을 위한 원칙적인 프레임워크로 확립되었습니다. 표준 NFs는 forward process와 reverse process로 구성됩니다.
본 연구에서는 diffusion model 추론에서 아직 활용되지 않은 신호를 탐구합니다. 기존의 모든 방법이 추론 시 이미지를 독립적으로 생성하는 반면, 우리는 대신 …