[Paper] 프라이버시 보호 및 비잔틴-강인 연합 학습을 위한 실용적 프레임워크
Federated Learning (FL)은 여러 클라이언트가 개인 데이터를 공유하지 않고 모델을 공동으로 학습할 수 있게 합니다. 그러나 FL은 Byzantine 공격에 취약합니다.
Federated Learning (FL)은 여러 클라이언트가 개인 데이터를 공유하지 않고 모델을 공동으로 학습할 수 있게 합니다. 그러나 FL은 Byzantine 공격에 취약합니다.
개요 OpenAI Gym은 시도와 오류를 통해 컴퓨터를 교육하는 간단한 놀이터입니다. 작업을 넣으면, 프로그램이 행동을 시도하고 실수로부터 학습합니다. ...
죄송합니다. 외부 URL의 내용을 직접 확인할 수 없으므로 번역할 텍스트를 제공해 주시면 도와드리겠습니다.
Diffusion Large Language Models (dLLMs)은 Autoregressive Models (ARMs)에 대한 유망한 대안으로 떠올랐으며, 순차적 제한을 극복하기 위해 parallel decoding을 활용합니다.
현대 블록체인들은 단일 리더 병목 현상을 제거하고 검열 저항성을 향상시키기 위해 다중 제안자(MCP) 합의를 점점 더 많이 채택하고 있습니다. 그러나 MCP만으로는 ...
Depth-of-field 제어는 사진 촬영에서 필수적이지만, 완벽한 초점을 맞추려면 여러 번 시도하거나 특수 장비가 필요합니다. Single-image refocusing은 아직…
우리는 WorldCanvas를 소개합니다. 이는 promptable world events를 위한 프레임워크로, 텍스트, trajectories, reference image를 결합하여 풍부하고 사용자 주도적인 시뮬레이션을 가능하게 합니다.
자연어에서 생성적 사전학습(generative pretraining)의 성공에 영감을 받아, 우리는 동일한 원칙이 강력한 자체 지도(self-supervised) 시각 학습자(visual learners)를 만들 수 있는지 묻는다. Inst...
멀티모달 LLM(MLLM)용 기존 평가 방법은 해석 가능성이 부족하고, 종종 중요한 능력 격차를 완전히 드러내기에 충분하지 않다.
시각 입력으로부터 3D 장면 기하학을 인식하고 재구성하는 것은 자율 주행에 매우 중요합니다. 그러나 아직도 운전 목표에 특화된 밀집 기하학이 부족합니다.
이미지 편집은 급속히 발전했지만, 비디오 편집은 덜 탐구된 상태이며 일관성, 제어 및 일반화에 대한 도전에 직면하고 있습니다. 우리는 디자인을…
최근 연구에 따르면 멀티모달 대형 언어 모델(MLLMs)은 비전 도구와의 상호작용을 포함한 멀티모달 인터리브 체인오브쓸(Chain-of-Thought, CoT)에서 이점을 얻는 것으로 나타났습니다.