[Paper] EvoLattice: LLM 기반 프로그램 탐색을 위한 다중 대안 품질‑다양성 그래프 표현을 통한 지속적인 내부 인구 진화
대형 언어 모델(LLMs)은 프로그램과 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 overwrite-based mutations에 의존한다…
대형 언어 모델(LLMs)은 프로그램과 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 overwrite-based mutations에 의존한다…
대규모 언어 모델(LLMs)은 프로그램 및 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 덮어쓰기 기반 변이를 의존한다…
비디오 디퓨전 모델은 생성 비디오 합성에 혁신을 가져왔지만, 정확도가 떨어지고 느리며 생성 과정에서 불투명할 수 있어 사용자를 …
3D 포인트 클라우드 처리를 위한 최신 신경 아키텍처는 convolutional layers와 attention blocks를 모두 포함하지만, 이를 조합하는 최적의 방법은 아직 명확하지 않다.
시각 토크나이저(예: VAEs)의 latent space 품질은 현대 generative models에 매우 중요합니다. 그러나 표준 reconstruction-based training은 …
알츠하이머병(AD)은 인지 능력에 부정적인 영향을 미치는 진행성 신경퇴행성 질환이다. 언어와 관련된 변화는 자동으로 ...
우리는 Recurrent Video Masked‑Autoencoders (RVM)을 제시한다: 트랜스포머 기반 순환 신경망을 활용한 새로운 비디오 표현 학습 접근법이다.
Generalization은 인터랙티브 3D scene 생성에서 여전히 핵심 과제입니다. 기존 학습 기반 접근 방식은 제한된 sce...
최근 feed-forward reconstruction 모델인 VGGT와 π^3는 인상적인 재구성 품질을 달성하지만, quadratic memory 때문에 스트리밍 비디오를 처리할 수 없습니다.
최근 이미지‑투‑3D 분야의 진전은 디자인, AR/VR, 로보틱스에 엄청난 가능성을 열어주었습니다. 그러나 실제 애플리케이션에서 AI가 생성한 3D 자산을 사용하려면,…
본 논문에서는 JoVA라는 통합 프레임워크를 제시하여 비디오‑오디오 공동 생성을 수행합니다. 최근의 고무적인 진전에도 불구하고, 기존 방법들은 두 가지 중요한 제한에 직면합니다…
개인화는 LLM이 개별 사용자 선호와 요구에 맞추는 데 필수적이 되고 있습니다. 그러나 현재 접근 방식은 종종 계산 비용이 많이 듭니다.