computer-vision — Page 24

정렬:

2개월 전 · ai · - · -

[Paper] DA-SSL: self-supervised 도메인 어댑터를 활용한 turbt 조직병리 슬라이드에서 foundational models 활용

최근 조직병리학에서 딥러닝 프레임워크, 특히 다중 인스턴스 학습(MIL)과 병리학 기본 모델(PFMs)을 결합한 것이 ...

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

AI 이미지 생성기는 나빠짐을 통해 더 좋아지고 있다

진짜 사람들은 이 이미지에서 레이니어 산이 너무 크게 보인다는 것을 알겠지만, 이 AI 이미지에서 워싱턴 주 페리를 재현한 것은 섬뜩합니다. 이것은 The Ste...

#AI image generation #diffusion models #generative AI #computer vision #deep learning #stable diffusion #AI art
2개월 전 · ai · - · -

AI 감시의 진화

영국 도로의 AI 감시 플리머스 근처 A38을 따라 흐린 아침에, 쌍둥이 카메라가 장착된 흰색 밴이 시간당 수천 장의 이미지를 포착한다, i...

#AI surveillance #computer vision #privacy #road safety #emotion recognition
2개월 전 · ai · - · -

AI 배경 제거기: 이미지 품질 및 에지 정확도

소개 AI 배경 제거기는 잘 작동할 때 거의 마법처럼 느껴지고—작동하지 않을 때는 좌절감을 줍니다. 차이는 보통 두 가지 얇은…

#background removal #image quality #edge accuracy #computer vision #AI models #image segmentation #deep learning
2개월 전 · ai · - · -

[Paper] 모멘트 기반 3D Gaussian Splatting: 순서 독립 투과율을 통한 볼류메트릭 차폐 해결

3D Gaussian Splatting(3DGS)의 최근 성공은 빠른 최적화와 실시간 고품질 라디언스 렌더링을 가능하게 함으로써 새로운 뷰 합성을 재구성했습니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] V-RGBX: 내재적 속성에 대한 정확한 제어를 통한 비디오 편집

대규모 비디오 생성 모델은 실제 장면에서 포토리얼리스틱한 외관과 라이트 인터랙션을 모델링하는 데 놀라운 잠재력을 보여주었습니다. 그러나...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] Particulate: Feed-Forward 3D 객체 관절화

우리는 Particulate라는 feed-forward 접근 방식을 제시한다. 이 방법은 일상적인 객체의 단일 정적 3D mesh를 입력으로 받아, 기본적인 articulation의 모든 속성을 직접 추론한다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] AnchorDream: 비디오 디퓨전을 활용한 Embodiment-Aware 로봇 데이터 합성

대규모 및 다양한 로봇 시연(데모)의 수집은 모방 학습(imitation learning)에서 여전히 주요 병목 현상으로 남아 있습니다. 실제 환경에서 데이터 획득이 비용이 많이 들고 …

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] Structure From Tracking: 디스틸링 구조 보존 모션 for Video Generation

현실은 rigid constraints와 deformable structures 사이의 춤이다. video models에게는 fidelity를 유지하면서 structure를 보존하는 motion을 생성한다는 의미이다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 불확실성 인식 도메인 적응을 이용한 임상 사진에서의 백반증 분할

일상적인 clinical photographs에서 vitiligo 범위를 정확하게 정량화하는 것은 treatment response의 longitudinal monitoring에 필수적입니다. 우리는 신뢰할 수 있는, f...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] MatAnyone 2: 학습된 품질 평가자를 통한 비디오 매팅 확장

Video matting은 기존 데이터셋의 규모와 현실감에 의해 제한됩니다. Segmentation 데이터를 활용하면 의미적 안정성을 향상시킬 수 있지만, 효과의 부족…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 흐릿한 지문: AI 이미지 지문의 견고성에 대한 체계적 평가

모델 지문 탐지 기술은 AI 생성 이미지의 출처 모델을 식별하는 유망한 접근법으로 떠오였지만, 그 견고성은…

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] Diffusion-Based Domain Adaptation을 이용한 세포 카운팅의 도메인 격차 감소

현실적인 합성 현미경 이미지를 생성하는 것은 라벨이 부족한 환경에서 딥러닝 모델을 훈련시키는 데 매우 중요합니다. 예를 들어, 많은 세포를 포함한 세포 카운팅과 같은 경우에 특히 그렇습니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] SVG‑T2I: 변분 오토인코더 없이 텍스트‑투‑이미지 라텐트 디퓨전 모델 확장

Visual Foundation Model (VFM) 표현에 기반한 Visual generation은 시각 이해와 ...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] DentalGPT: 치의학에서 멀티모달 복합 추론을 장려하기

치과 분야에서 멀티모달 데이터의 신뢰할 수 있는 해석은 자동 구강 의료에 필수적이지만, 현재의 멀티모달 대형 언어 모델(MLLMs)은 어려움을 겪고 있다.

#research #paper #ai #machine-learning #nlp #computer-vision
2개월 전 · ai · - · -

[Paper] HFS: 효율적인 비디오 추론을 위한 전체론적 쿼리 인식 프레임 선택

비디오 이해에서 키 프레임 선택은 상당한 과제를 제시합니다. 프레임을 독립적으로 점수화하는 전통적인 top‑K 선택 방법은 종종 실패합니다…

#research #paper #ai #nlp #computer-vision
2개월 전 · ai · - · -

[Paper] Parallax: 이기종 엣지 시스템에서 연산자 폴백을 위한 런타임 병렬화

실시간 DNN 애플리케이션에 대한 수요가 에지 디바이스에서 증가함에 따라, 점점 더 복잡해지는 모델의 빠른 추론이 필요합니다. 많은 디바이스가 sp...을 포함하고 있지만.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] StereoSpace: Depth-Free 스테레오 기하학 합성 via End-to-End Diffusion in a Canonical Space

우리는 StereoSpace를 소개합니다. 이는 monocular-to-stereo synthesis를 위한 diffusion-based 프레임워크로, geometry를 순수하게 viewpoint conditioning을 통해 모델링하며, …

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] WorldLens: 실제 세계에서 Driving World Models의 전 스펙트럼 평가

Generative world models는 embodied AI를 재구성하고, 에이전트가 설득력 있게 보이지만 종종 물리적으로는 실패하는 현실적인 4D 주행 환경을 합성하도록 합니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 스테레오와 Mid-Level Vision을 활용한 동적 도시 내비게이션 강화

언어와 비전 분야에서 파운데이션 모델의 성공은 완전한 엔드‑투‑엔드 로봇 내비게이션 파운데이션 모델(NFMs)에 대한 연구를 촉진했다. NFMs는 모노…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] Omni-Attribute: 시각 개념 개인화를 위한 Open-vocabulary Attribute Encoder

Visual concept personalization은 정체성, 표정, 조명, 스타일과 같은 특정 이미지 속성만을 보이지 않는 컨텍스트로 전달하는 것을 목표로 합니다. 그러나...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] SceneMaker: Open-set 3D 씬 생성과 Decoupled De-occlusion 및 Pose Estimation Model

본 연구에서는 SceneMaker라는 분리형 3D 씬 생성 프레임워크를 제안한다. 충분한 오픈셋 디오클루전 및 포즈 추정 프리…

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] 양방향 Normalizing Flow: 데이터에서 노이즈로 그리고 다시

Normalizing Flows (NFs)는 생성 모델링을 위한 원칙적인 프레임워크로 확립되었습니다. 표준 NFs는 forward process와 reverse process로 구성됩니다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] Group Diffusion: 이미지 생성 향상을 위한 크로스‑샘플 협업 활성화

본 연구에서는 diffusion model 추론에서 아직 활용되지 않은 신호를 탐구합니다. 기존의 모든 방법이 추론 시 이미지를 독립적으로 생성하는 반면, 우리는 대신 …

#research #paper #ai #computer-vision

Newer posts

Older posts