[Paper] 이산-연속 격차 연결: 결합 매니폴드 이산 흡수 Diffusion을 통한 통합 멀티모달 생성
생성 모델링을 이산 데이터(텍스트)를 위한 자동회귀 접근법과 연속 데이터(이미지)를 위한 확산 접근법으로 양분하는 것은 …
생성 모델링을 이산 데이터(텍스트)를 위한 자동회귀 접근법과 연속 데이터(이미지)를 위한 확산 접근법으로 양분하는 것은 …
제가 처음에 믿었던 것 깊이 파고들기 전에, 저는 몇 가지를 암묵적으로 믿고 있었습니다: - 만약 attention head가 특정 token에 지속적으로 주의를 기울인다면, 그 token은…
멀티 에이전트 시스템 내에서의 emergent communication 분야는 자율 에이전트가 명시적인 지시 없이 독립적으로 커뮤니케이션 전략을 개발할 수 있는 방식을 연구한다.
Spatio-temporal reasoning은 time series에서 temporal dynamics, spatial dependencies, 그리고 textual context를 명시적으로 통합하는 것을 포함합니다. 이 능력은 …
배경: Reporting and Data Systems (RADS)는 방사선 위험 커뮤니케이션을 표준화하지만, 서술형 보고서에서 자동으로 RADS를 할당하는 것은 어려운 ...
수학에서 학생들의 실수는 종종 체계적이다: 학습자는 일관되지만 잘못된 절차를 적용하고 이를 다양한 상황에서 반복한다. 우리는 MalruleLib를 소개한다…
엔터프라이즈 검색에서, 대규모로 고품질 데이터셋을 구축하는 것은 라벨링된 데이터를 확보하기 어려워서 여전히 핵심 과제입니다. 이 문제를 해결하기 위해…
대형 언어 모델(LLMs)은 자연어 처리에서 상당한 잠재력을 보여주었지만, 다중 단계가 필요한 복잡한 일반 목적 추론은 ...
Diffusion language models (DLMs)는 in-context examples와 함께 일반 자연어 작업에 대해 강력한 잠재력을 보여주었습니다. 그러나 양방향 ...
소셜 미디어에서의 Hate speech detection은 정확도와 설명 가능성 모두에서 도전에 직면해 있으며, 특히 연구가 충분히 이루어지지 않은 Indic languages에 대해 그렇습니다. 우리는 새로운 exp...
인간 지능의 특징은 Constructive Episodic Simulation을 통해 새로운 기술을 마스터하는 능력이며, 과거 경험을 회상하여 해결책을 종합한다.
Machine unlearning은 Large Language Models (LLMs)에서 민감한 지식을 잊게 하면서 일반적인 유용성을 유지하는 것을 목표로 합니다. 그러나 기존 접근 방식은 일반적으로...