[Paper] 새로운 어휘를 위한 LMs의 Grounded Token Initialization for Generative Recommendation
언어 모델(LMs)은 도메인 특화 작업을 위해 새로운 학습 가능한 어휘 토큰으로 점점 확장되고 있습니다. 예를 들어, 생성형 추천에서의 Semantic-ID 토큰과 같이…
4486 posts from this source
언어 모델(LMs)은 도메인 특화 작업을 위해 새로운 학습 가능한 어휘 토큰으로 점점 확장되고 있습니다. 예를 들어, 생성형 추천에서의 Semantic-ID 토큰과 같이…
고품질 3D avatar 모델링은 충실도와 일반화 사이의 중요한 트레이드오프에 직면합니다. 한편, multi-view studio data는 high-fidelity mo...
다양한 유효한 답변이 가능한 프롬프트가 주어졌을 때, 이를 포괄적으로 생성하는 것이 다양한 사용자를 만족시키는 첫 번째 단계이다....
훈련이 필요 없는 Vision-Language Navigation (VLN) 에이전트는 기반 모델에 의해 구동되어 지시를 따르고 3D 환경을 탐색할 수 있습니다. 그러나 기존 접근 방식은...
최근 스트리밍 비디오 이해 방법은 긴 비디오 스트림을 처리하기 위해 복잡한 메모리 메커니즘에 점점 더 의존하고 있습니다. 우리는 이러한 추세에 도전하여 간단한 …
Neural network field theory는 네트워크 아키텍처와 그 파라미터에 대한 밀도로 정의된 필드들의 통계적 앙상블로서 field theory를 공식화합니다. 우리는 …
이중 확률 행렬은 잔차 스트림 전반에 걸친 학습된 혼합을 가능하게 하지만, 이중 확률 행렬 집합(버크호프 다면체)을 정확히 매개변수화하는 것은…
기존 비디오 객체 제거 방법은 객체 뒤의 콘텐츠를 inpainting하고 그림자 및 반사와 같은 외관 수준의 아티팩트를 수정하는 데 뛰어납니다....
Softmax는 Transformer 모델의 Multi-Head Attention (MHA) 블록에서, 특히 저정밀도 추론 상황의 작은 모델에서 계산 병목 현상이 될 수 있습니다.
최근 멀티모달 대형 언어 모델은 통합 텍스트 및 이미지 이해와 생성에서 강력한 성능을 달성했지만, 이러한 고유 능력을 확장하는…
검증 가능한 보상을 이용한 강화 학습(RLVR)은 사후 훈련된 대형 언어 모델에 대한 표준 패러다임이 되었다. Group Relative Policy Optimi...
Long-horizon conversational agents는 일관된 추론을 위해 지속적인 메모리가 필요하지만, 통제되지 않은 축적은 시간적 붕괴와 잘못된 기억 전파를 초래한다…
Agentic AI는 투자자의 역할을 분석 실행에서 감독으로 전환합니다. 우리는 약 5…인 agentic strategic asset allocation pipeline을 제시합니다.
기계 코드를 인간이 읽을 수 있는 고수준 언어로 변환하는 것은 역공학 분야에서 아직 해결되지 않은 연구 과제입니다. 최근 LLM 기반 ...
규제 문서는 LLM 기반 시스템이 반드시 준수해야 하는 법적 구속력 있는 의무를 담고 있습니다. 그러나 조밀하고 계층적으로 구조화된 법률 텍스트를 mac...
Agent skills는 절차적 지식과 실행 가능한 리소스를 구조화한 패키지로, 에이전트가 추론 시점에 동적으로 로드하며, 신뢰할 수 있는 메커…
프롬프트에서 정보를 처리하는 대형 언어 모델(Large Language Models, LLMs)의 방식을 이해하는 것은 여전히 중요한 과제이다. 이 ‘블랙 박스’를 밝히기 위해, attention vi...
3GPP Release 19는 통합 감지 및 통신(ISAC)의 표준화를 시작했으며, 여기에는 단일점(monostatic) 감지를 위한 채널 모델, 평가 …
인재 채용은 많은 산업에서 중요한 동시에 비용이 많이 드는 과정이며, 높은 채용 비용과 긴 채용 주기를 동반합니다. 기존 talent recommendation system...
Retrieval-Augmented Language Models (RALMs)는 지식 집약적인 작업에서 상당한 잠재력을 보여주었지만, 여전히 성능에 취약합니다.
우리는 모든 노드가 익명인, extremely weak models of distributed computing에서 random input graphs에 대해 deterministic distributed algorithms가 무엇을 계산할 수 있는지를 연구한다.
대형 언어 모델(LLMs)은 최근 자동 프로그램 수리(APR)에서 강력한 잠재력을 보여주었으며, 특히 iterative refinement를 통해 ...
클라우드 컴퓨팅은 확장 가능한 자원 프로비저닝을 가능하게 하지만, 동적인 워크로드 변화는 종종 과다 프로비저닝으로 인한 비용 상승을 초래합니다. 머신 러닝 (ML) a...
보안 팀은 도전에 직면해 있습니다: 새로 공개된 Common Vulnerabilities and Exposures (CVE)의 양이 수동으로 탐지를 개발할 수 있는 역량을 훨씬 초과합니다.
클라우드 인프라스트럭처는 비용, 속도, 자원 활용과 같은 요구 사항에 대해 데이터 파이프라인의 효율적인 운영을 지원합니다. We present an integra...
모델 컨텍스트 프로토콜(MCP)은 LLM이 외부 도구와 데이터 소스에 연결하는 방식을 표준화하여 더 빠른 통합을 가능하게 하지만 새로운 공격 벡터를 도입합니다.
딥 강화 학습(DRL)은 최근 동적 알고리즘 구성(DAC)을 위한 유망한 도구로 부상했으며, 진화 알고리즘이 적응하도록 가능하게 합니다.
Transformer 계열의 현대 신경망은 훈련이 시작되기 전에 실무자가 사용할 attention heads의 수와 네트워크의 깊이 등을 결정하도록 요구합니다.
Range minimum queries는 문자열 처리와 데이터베이스 응용 프로그램에서 자주 사용되며, 생물학적 서열 분석, 문서 검색, 웹 …
Parameter-efficient fine-tuning (PEFT)은 제한된 계산 예산 하에서 대규모 언어 모델(LLMs)을 적응시키는 중요한 패러다임으로 부상했습니다. Howe...
깊은 클러스터링에서 지속적인 구조적 약점은 특징 학습과 클러스터 할당 사이의 단절이다. 대부분의 아키텍처는 외부 clu...
대규모 언어 모델(LLM) 추론은 점점 더 멀티‑GPU 실행에 의존하고 있지만, 기존의 추론 병렬화 전략은 레이어 단위의 …
대규모 분산 학습은 최근 몇 년간 산업 및 학계에서 머신러닝 시스템 분야의 연구 핫스팟이었습니다. 그러나 실험을 수행하는...
Associative memory systems는 패턴의 content‑addressable storage와 retrieval를 가능하게 하며, 이는 생물학적 신경 계산 및 인공 ...에 중심적인 능력이다.
이 논문은 대규모 선형 방정식을 풀기 위한 분산 변분 양자 알고리즘을 개발한다. Ax = b 형태의 선형 시스템에 대해, 큰 정사각형…
대규모 자기지도 학습(SSL) 모델을 기반으로 구축된 deepfake speech detectors는 높은 정확도를 달성하지만, 표준 ensemble fusion을 활용하여 추가로 향상시키는…
우리는 HippoCamp를 소개합니다. 이는 멀티모달 파일 관리에 대한 에이전트의 역량을 평가하도록 설계된 새로운 benchmark입니다. 기존의 에이전트 benchmark가 …에 초점을 맞추는 것과 달리...
test-time scaling의 부상은 Large Language Models (LLMs)의 추론 및 에이전시 능력을 눈에 띄게 향상시켰다. 그러나 표준 Transformers는 ...
공간과 시간 모두에서 희소한 관측(sparse observations)으로부터 전체 spatio-temporal dynamics를 재구성하는 것은 측정이 제한적이기 때문에 복잡계(complex systems)에서 여전히 핵심적인 과제이다.
AI 기상 예측은 빠르게 발전했지만, 예측 능력을 결정하는 요인을 설명하는 통합된 수학적 프레임워크는 아직 없습니다. 기존 이론은 특정 …
LLM 에이전트가 점점 더 복잡한 작업을 수행함에 따라, 중요한 질문은 그들이 장기적인 관점에서 전략적 일관성을 유지할 수 있는가이다: 불확실성 하에서의 계획…
우리는 TRACE, 메쉬 가이드 3DGS 편집 프레임워크를 제시한다. 이 프레임워크는 자동화되고 고충실도의 씬 변환을 달성한다. 비디오 디퓨전을 명시적인 3...
우리는 RELISH (REgression with a Latent Iterative State Head)라는 새로운 경량 아키텍처를 소개합니다. 이 아키텍처는 대형 언어 모델을 이용한 텍스트 회귀를 위해 설계되었습니다. Ra...
Primitive 기반 방법인 3D Gaussian Splatting은 최근에 novel-view synthesis 및 관련 reconstruction tasks에서 state-of-the-art가 되었습니다. Compa...
우리는 다음 질문을 고려한다: 대형 언어 추론 모델이 선택을 할 때, 먼저 생각하고 나서 결정했는가, 아니면 먼저 결정하고 나서 생각했는가? 이 논문에서는…
측정 데이터로부터 양자 상태를 학습하는 것은 양자 정보와 계산 복잡도 분야의 핵심 문제이다. 이 연구에서는 le...
Search agents는 language models (LMs)와 web search를 통합하여 복잡한 사용자 질의에 답변하는 데 점점 더 중요해지고 있습니다. training datasets를 구축하는 …
대규모 언어 모델(LLM)이 검증자, 교사 모델, 강화 학습 없이 자체 원시 출력만을 사용하여 코드 생성 능력을 향상시킬 수 있을까? 우리는 a...