[Paper] Contextual Image Attack: 시각적 컨텍스트가 멀티모달 안전 취약점을 노출하는 방법
멀티모달 대형 언어 모델(MLLMs)은 놀라운 능력을 보여주지만, 그들의 안전 정렬은 탈옥 공격에 취약합니다. 기존 공격 방법...
멀티모달 대형 언어 모델(MLLMs)은 놀라운 능력을 보여주지만, 그들의 안전 정렬은 탈옥 공격에 취약합니다. 기존 공격 방법...
LiDAR와 카메라 정보를 bird's eye view (BEV) 표현에 통합하는 것은 3D 객체 탐지에서 그 효과가 입증되었습니다. 그러나, ...
중력파 데이터 분석은 잡음이 많은 검출기 신호로부터 물리적 정보를 추출하기 위해 정확하고 효율적인 방법에 의존하지만, 증가하는 속도…
암시적 신경 표현(INR)은 시공간 함수를 근사하는 신경망입니다. 메모리 집약적인 시각화 작업들, 특히 …
AI 챗봇은 많은 사용자들의 건강 및 피트니스 질문에 대한 주요 정보원으로 자리 잡았으며, 새로운 유출 정보에 따르면 ChatGPT가 곧 여러분의 앱을 통합할 수 있게 될지도 모른다.
우리는 언어 모델 시스템(LMS) 행동을 지정하고 형식적으로 인증하기 위한 최초의 원칙적인 프레임워크인 Lumos를 소개합니다. Lumos는 명령형 probabi…
저조도 환경, 예를 들어 야간 운전에서는 이미지 퇴화가 차량 내 카메라 안전에 심각한 도전을 제기합니다. 기존의 enhancement algorithms는 종종…
우리는 Layout Anything을 제시한다. 이는 실내 레이아웃 추정을 위한 트랜스포머 기반 프레임워크로, OneFormer의 범용 세그멘테이션 아키텍처를 기하…
머신 러닝이 새로운 특성을 가진 무기 물질의 빠른 예측을 가능하게 했지만, 이러한 물질을 합성하는 방법을 결정하는 과제는 …
비디오 생성의 다음 경계는 제로샷 추론이 가능한 모델을 개발하는 데 있으며, 실제 세계의 과학 법칙을 이해하는 것이 …에 필수적이다.
Novel view synthesis (NVS)는 컴퓨터 비전 및 그래픽스에서 매우 중요하며, AR, VR, 자율 주행 등 다양한 분야에 널리 활용됩니다. 반면에 3D Gaussian Splatting (3D...
이 논문은 자기상관 데이터에 대해 학습된 Gaussian process 모델의 계산 속도를 높이는 방법에 관한 문제를 다룬다. Gaussian process 모델 i...