[Paper] TurboGR: 대규모 생성형 추천을 위한 가속화된 학습 시스템
Generative recommendation(GR)은 파편화되고 시나리오별로 설계된 아키텍처를 통합된 Transformer 기반 모델로 대체하는 유망한 패러다임으로 부상하고 있다.
Generative recommendation(GR)은 파편화되고 시나리오별로 설계된 아키텍처를 통합된 Transformer 기반 모델로 대체하는 유망한 패러다임으로 부상하고 있다.
많은 실제 최적화 문제는 자연스럽게 동질적인 벡터가 아니라 이질적인 매개변수를 가진 복합 설계 객체이다: 정수, 실수 값, B...
대규모 multi-objective optimization은 고차원 의사결정 공간, 복잡한 변수 상호작용, 제한된 함수 평가 등 때문에 여전히 도전적인 과제입니다.
대형 언어 모델(Large Language Models, LLMs)이 소프트웨어 개발을 혁신함에 따라, 생성된 코드의 기능적 품질이 핵심 초점이 되었고, 가독성은…
프로그램 개요: 스타트업 성장 파트너 디캠프가 일본 최대 철도·도시개발 기업인 동부여객철도(JR East)와 협력해 국내 스타트업에게 일본 스마트시티 프로젝트 실증 기회를 제공한다.
대형 언어 모델(LLMs)의 발전은 최근 small-molecule drug discovery를 위한 새롭고 유망한 길을 열었습니다. 그러나 기존의 LLM 기반 접근법은…
컴퓨터 사용 에이전트(CUAs)는 GPT-5.4와 Claude가 보여주듯 화면상의 작업을 자동화합니다. 그러나 복잡하고 저빈도 상호작용에 대한 신뢰성은 아직 …
최근 대형 비전-언어 모델(VLMs)은 근본적으로 지속되는 이분법에 의해 제한됩니다: 이해와 생성이 별개의 문제로 취급됩니다.
사용자의 시점에서 단일 헤드 마운트 카메라를 사용하여 손의 절대 3D 포즈와 형태를 재구성하는 것은 실용적인 egocentric 인터...
Autoregressive 비디오 생성은 실시간, 오픈엔드(open‑ended) 합성을 목표로 합니다. 그러나 시네마틱 스토리텔링은 단일 장면을 끝없이 확장하는 것만은 아니며…
시각 인지는 고수준 의미 이해를 픽셀 수준 인식과 연결하지만, 대부분의 기존 설정은 식별에 결정적인 증거를...
본 논문에서는 Group Relative Policy Optimization (GRPO)를 AR-Diffusion Unified Multimodal Models (UMMs)에 적용하는 새로운 프레임워크인 AlphaGRPO를 제안한다.
차분 가능한 렌더링을 이용한 표면 재구성은 최근 몇 년간 인상적인 성능을 달성했지만, 널리 퍼진 photometric ambiguities는 엄격하게…
장기 기억은 특화된 웹 환경에서 에이전트에게 매우 중요합니다. 성공은 인터페이스 어포던스, 상태 역학, 워크플로우 등을 기억하는 데 달려 있습니다…
우리는 직교 동등 변환에 기반한 대규모 언어 모델(LLM) 훈련을 위한 스펙트럼 보존 옵티마이저인 Pion을 소개합니다. Unlike additive optim...
Vision Transformers (ViTs)는 전체-전체 self-attention을 활용하여 강력한 데이터 기반 스케일링을 달성합니다. 그러나 이러한 유연성은 계산 비용을 초래합니다…
우리는 LLM-guided query refinement paradigm이 임베딩 모델의 사용성을 도전적인 zero-shot 검색 및 분류에 확장하는 효과를 탐구합니다.
Large language models (LLMs)는 downstream tasks를 위해 파라미터를 업데이트(예: RL)하면서 훈련됩니다. 그러나 파라미터를 업데이트하면 그들이 …
라벨이 지정된 검증 가능한 훈련 데이터(labeled verifiable training data)가 제약 조건(binding constraint)인 상황에서는, 각 확인된 예시(checked example)를 신중하게 할당해야 합니다. 표준 관행은 …
Computer Use Agents (CUAs)는 클릭 및 입력과 같은 원자적인 GUI 동작과 API 기반 파일 작업과 같은 고수준 툴 호출을 모두 통해 작동할 수 있지만, ...
최근 오디오-비디오 공동 생성 분야의 발전은 눈부셨지만, 실제 응용에서는 강력한 per-modality fidelity와 cross-modal alignment가 요구됩니다.
LLM-based agents는 지속적인 환경에서 점점 더 많이 작동하며, 여러 세션에 걸쳐 정보를 저장하고 업데이트하며 추론해야 합니다. 이전에는 …
Sparse Mixture-of-Experts (SMoE) 모델은 언어 모델을 효율적으로 확장할 수 있게 해주지만, 학습은 여전히 어려운데 라우팅이 소수의 전문가에게만 집중될 수 있기 때문이다.
검증 가능한 보상을 활용한 Reinforcement learning은 수학 및 코딩과 같은 분야에서 강력한 post‑training gains를 가능하게 했지만, 많은 open‑ended settings는 …
우리는 KV-Fold를 소개한다. 이는 training-free인 간단한 long-context inference protocol로, key-value (KV) cache를 시퀀스에 대한 left fold의 accumulator로 취급한다.
Looped Transformers는 잠재 표현을 반복적으로 정제함으로써 순수한 feed-forward 연산에 대한 유망한 대안을 제공하며, language modeling을 향상시킵니다.
극심한 기후와 변동성이 큰 도매 전력 시장은 주거용 소비자를 재앙적인 재정 위험에 노출시키지만, 배전 단계에서의 demand response는…
언어 모델 능력의 지속적인 향상이 코딩이나 컴퓨터 사용 등에서 자율 에이전트의 구동 요소로서 그 활용을 널리 가능하게 했습니다.
우리는 TextSeal을 소개합니다, 대형 언어 모델을 위한 최첨단 워터마크입니다. Gumbel-max 샘플링을 기반으로, TextSeal은 dual-key generation을 도입하여 resto...
고속 5G 사용 사례에서 특히 사용자 장비(UE) 이동성에 따른 높은 중단 시간 및 측정 보고 오버헤드 문제를 해결하기 위해 ...
대규모 언어 모델(LLMs)은 대량의 유창한 정치 텍스트를 생성할 수 있어, 위기 상황과 사회 갈등 시 synthetic discourse에 대한 우려를 불러일으킵니다. 기존…
Continual Panoptic Segmentation (CPS)은 시간이 지남에 따라 새로운 카테고리에 빠르게 적응할 수 있는 방법을 필요로 합니다. 이와 같은 밀집 예측 작업의 특성상 t...
대형 언어 모델(LLMs)은 종종 틀린 경우에도 높은 확신을 가지고 답변을 생성하므로, 신뢰할 수 있는 confidence estimation이 배포에 필수적이다.
포트홀은 성가신 문제입니다 — 스쿠터 회사 Lime에 물어보세요, 그들이 이를 열거했습니다 https://techcrunch.com/2026/05/08/lime-the-uber-backed-micromobility-company-file...
연속 함수에 대한 numerical optimization은 기계 설계부터 training에 이르기까지 다양한 과학 및 공학 분야에서 기본적인 과제이다.
Model merging은 대규모 언어 모델(LLMs)을 처음부터 훈련하는 대신 비용 효율적인 대안으로 부상했으며, 연구자들이 사전 학습된 모델을 결합할 수 있게 합니다.
멀티 에이전트 대형 언어 모델(LLM) 시스템을 위한 프롬프트 사양은 데이터 계약과 통합 로직을 많은 상호 의존 파일에 걸쳐 포함하지만, 이는 드물다.
Overview Universal Learning https://openlearning.mit.edu/universal-learning 은 MIT Open Learning에서 새롭게 시작한 이니셔티브로, 전 세계 학습자들을 준비시키기 위해 설계되었습니다.
우리는 그래프 기반 최적화를 제안한다: 실제 최적화 문제의 decision variables, constraints, 그리고 objective coefficients가 ...
Prediction sets는 머신러닝 모델에서 불확실성을 정량화하기 위한 이론적으로 기반된 프레임워크를 제공합니다. 이를 구조화된 생성 작업에 적용하면,…
우리는 Curated Industrial Developer Repository (CIDR)를 소개합니다. 이는 직접 협업을 통해 수집된 실제 소프트웨어 저장소들의 대규모 데이터셋입니다.
이 논문은 실험적으로 하네스 엔지니어링 수준이 소형 언어 모델(SLMs, 2‑3B 파라미터)의 운영 성능에 어떻게 영향을 미치는지 분석한다. Th...
Agentic AI 실패는 사후 재구성이 필요합니다: 에이전트가 무엇을 했는지, 누구의 권한으로 했는지, 어떤 정책에 위배되는지, 그리고 어떤 논리에 기반했는지. Cross-regime feasibilit...
Cortical neurons은 복잡하고 multi‑timescale 프로세서로, recurrent circuits에 연결되어 있으며, 엄격한 biological constraints 하에서 오랜 evolutionary pressure에 의해 형성됩니다.
Power capping은 LLM 서빙에서 표준 GPU 에너지 레버이며, 효과가 있는 것으로 보입니다: 처리량이 감소하고, 전력 측정값이 낮아지며, 에너지 예산이 충족됩니다. 우리는 …
컴퓨팅 연속체 전반에 배치된 에이전시 시스템은 클라우드, 엣지, 그리고 간헐적으로 연결되는 도메인 전반에서 효과를 유지할 수 있는 디스커버리 메커니즘이 필요합니다. ...
Spiking neural networks (SNNs)는 시간적으로 풍부한 작업에 대해 저전력 이벤트 기반 계산을 약속하지만, 일반적으로 사용되는 뉴런 모델은 종종 gradient‑based …
영장류 시각 피질의 공간적 및 기능적 조직은 신경과학에서 근본적인 문제이다. 최근 To…와 같은 계산 프레임워크는 …