ai — Page 91 | EUNO.NEWS

1개월 전 · ai

[Paper] EvoLattice: LLM 기반 프로그램 탐색을 위한 다중 대안 품질‑다양성 그래프 표현을 통한 지속적인 내부 인구 진화

대형 언어 모델(LLMs)은 프로그램과 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 overwrite-based mutations에 의존한다…

#research #paper #ai #machine-learning #nlp
1개월 전 · ai

[Paper] EvoLattice: 지속적인 내부 인구 진화를 위한 다중 대안 품질‑다양성 그래프 표현을 통한 LLM 기반 프로그램 탐색

대규모 언어 모델(LLMs)은 프로그램 및 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 덮어쓰기 기반 변이를 의존한다…

#research #paper #ai #machine-learning #nlp
1개월 전 · ai

[Paper] DiffusionBrowser: 인터랙티브 디퓨전 프리뷰 via Multi-Branch Decoders

비디오 디퓨전 모델은 생성 비디오 합성에 혁신을 가져왔지만, 정확도가 떨어지고 느리며 생성 과정에서 불투명할 수 있어 사용자를 …

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] LitePT: 더 가볍고 더 강력한 Point Transformer

3D 포인트 클라우드 처리를 위한 최신 신경 아키텍처는 convolutional layers와 attention blocks를 모두 포함하지만, 이를 조합하는 최적의 방법은 아직 명확하지 않다.

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] 확장 가능한 Visual Tokenizers 사전 학습을 향해

시각 토크나이저(예: VAEs)의 latent space 품질은 현대 generative models에 매우 중요합니다. 그러나 표준 reconstruction-based training은 …

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] 표면 형태를 넘어: 자발적 언어에서 Alzheimer's Disease 탐지를 위한 semantic analysis 파이프라인

알츠하이머병(AD)은 인지 능력에 부정적인 영향을 미치는 진행성 신경퇴행성 질환이다. 언어와 관련된 변화는 자동으로 ...

#research #paper #ai #nlp
1개월 전 · ai

[Paper] 순환 비디오 Masked Autoencoders

우리는 Recurrent Video Masked‑Autoencoders (RVM)을 제시한다: 트랜스포머 기반 순환 신경망을 활용한 새로운 비디오 표현 학습 접근법이다.

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] I-Scene: 3D 인스턴스 모델은 암시적 일반화 가능한 공간 학습자

Generalization은 인터랙티브 3D scene 생성에서 여전히 핵심 과제입니다. 기존 학습 기반 접근 방식은 제한된 sce...

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] LASER: 학습 없이 스트리밍 4D 재구성을 위한 계층별 스케일 정렬

최근 feed-forward reconstruction 모델인 VGGT와 π^3는 인상적인 재구성 품질을 달성하지만, quadratic memory 때문에 스트리밍 비디오를 처리할 수 없습니다.

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] 텍스트-스티어러블 이미지-투-3D를 통한 피드포워드 3D 편집

최근 이미지‑투‑3D 분야의 진전은 디자인, AR/VR, 로보틱스에 엄청난 가능성을 열어주었습니다. 그러나 실제 애플리케이션에서 AI가 생성한 3D 자산을 사용하려면,…

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] JoVA: 통합 멀티모달 학습을 통한 동시 비디오‑오디오 생성

본 논문에서는 JoVA라는 통합 프레임워크를 제시하여 비디오‑오디오 공동 생성을 수행합니다. 최근의 고무적인 진전에도 불구하고, 기존 방법들은 두 가지 중요한 제한에 직면합니다…

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] LLM 개인화를 위한 효과적인 모델 편집

개인화는 LLM이 개별 사용자 선호와 요구에 맞추는 데 필수적이 되고 있습니다. 그러나 현재 접근 방식은 종종 계산 비용이 많이 듭니다.

#research #paper #ai #nlp

Newer posts

Older posts