[Paper] VINO: 통합 비주얼 생성기와 교차된 OmniModal 컨텍스트
우리는 VINO를 소개합니다, 단일 프레임워크 내에서 이미지 및 비디오 생성과 편집을 수행하는 통합 visual generator입니다. 작업별 …
우리는 VINO를 소개합니다, 단일 프레임워크 내에서 이미지 및 비디오 생성과 편집을 수행하는 통합 visual generator입니다. 작업별 …
음악 창작에서 rapid prototyping은 아이디어를 탐색하고 다듬는 데 필수적이지만, 기존의 generative tools는 사용자가 구조와 …
우리는 Talk2Move를 소개한다. 이는 텍스트 지시를 기반으로 장면 내 객체들의 공간 변환을 수행하는 강화 학습(RL) 기반 diffusion 프레임워크이다. Spatially m...
원격 지역의 농부들은 plant diseases를 신속하고 신뢰할 수 있게 식별할 방법이 필요하지만, 종종 laboratories나 high‑performance computing에 접근할 수 없습니다.
이 연구는 Falcon-H1R이라는 7B 파라미터 추론 최적화 모델을 소개하며, 경쟁력 있는 추론 성능을 달성할 수 있는 가능성을 입증한다.
기업들은 정기적으로 멀티 릴리즈 시스템을 다루어야 하는데, 이는 동일한 소프트웨어의 여러 버전이 동시에 운영되는 경우를 말합니다. Question answering ...
최근 연구들은 3DGS를 의미론적 특징 벡터와 결합하여 의미론적 분할과 이미지 렌더링을 동시에 수행하도록 확장하는 방안을 제안하고 있다. 그러나 이러한 방법들은 종종 ...
Toxicity detection은 본질적으로 주관적이며, 다양한 인구통계 그룹의 다양한 관점과 사회적 선입견에 의해 형성됩니다. ``pluralistic'' 모델링…
우리는 BEDS (Bayesian Emergent Dissipative Structures)라는 이론적 프레임워크를 제시한다. 이 프레임워크는 non‑equilibrium thermodynamics와 Bayesian inference의 개념을 통합한다.
본 연구는 비정상 탐지를 위한 오토인코더 기반 머신러닝 기법의 적용을 탐구하여 비전형적인 외계 행성 대기를 식별한다.
Out-of-distribution (OOD) 예측은 종종 모델을 인과적 또는 불변 공변량에 제한함으로써 비인과적이고 거짓된 연관성을 피하는 방식으로 접근한다.
자동회귀 언어 모델은 일반적으로 추론 시 temperature 파라미터를 사용하여 확률 분포를 형성하고 텍스트 생성의 무작위성을 제어합니다.
비접촉 지문 인식은 위생적이고 편리한 대안을 제공하여 접촉 기반 시스템에 비해 잠재 지문 없이 빠른 획득을 가능하게 합니다, 사전…
경험적 평가는 파운데이션 모델에서 연구 진행을 이끄는 주요 나침반 역할을 합니다. 훈련 최전선에 초점을 맞춘 방대한 연구에도 불구하고...
Geo-Foundation Models (GFMs)는 의미 분할, 분류 및 회귀 작업을 포함한 다양한 다운스트림 애플리케이션에서 효과가 입증되었습니다. H...
대규모 언어 모델(LLM) 에이전트가 점점 더 높은 위험이 수반되는 자율 의사결정을 맡게 됨에 따라, 그들의 추론 과정의 투명성이 …
Coding theory는 신뢰할 수 있는 통신, 저장 및 계산을 가능하게 하는 데 중요한 역할을 합니다. Classical approaches는 최악의 경우 적대적 모델을 가정하고 ...
대규모 언어 모델을 학습하려면 많은 가속기에 걸쳐 계산을 분산해야 하지만, 실무자들은 병렬 처리 전략(데이터, 텐서, 파이프라인…)을 선택합니다.
High‑Frequency trading (HFT) 환경은 대량의 limit order book (LOB) 데이터가 특징이며, 이는 소음이 많고 비선형적인 것으로 악명 높다. Alpha de…
Monocular omnidirectional visual odometry (OVO) 시스템은 360-degree 카메라를 활용하여 perspective VO 시스템의 field-of-view 제한을 극복합니다. 그러나, ...
우리는 텍스트 데이터를 공유하기 위해 transformer embeddings의 노이즈가 섞인 버전을 공유하는 privacy-preserving 방법을 제안한다. 숨겨진 표현이 …
멕시코는 많은 토착 언어가 있는 국가이며, 그 중 가장 널리 사용되는 언어는 Nawatl으로 현재 200만 명 이상이 사용하고 있다.
인구 증가에 의해 촉진된 폐기물 생산량의 증가는 재료를 효과적으로 관리하고 재활용하는 데 어려움을 야기하고 있습니다. Manual waste sorting은…
대형 언어 모델(LLMs)에서는 파라미터 수가 지난 몇 년간 기하급수적으로 증가했습니다. 예를 들어 GPT-2의 1.5 billion 파라미터에서 175 billion 파라미터까지.