[Paper] MEME: 멀티-엔터티 및 진화 메모리 평가
LLM-based agents는 지속적인 환경에서 점점 더 많이 작동하며, 여러 세션에 걸쳐 정보를 저장하고 업데이트하며 추론해야 합니다. 이전에는 …
LLM-based agents는 지속적인 환경에서 점점 더 많이 작동하며, 여러 세션에 걸쳐 정보를 저장하고 업데이트하며 추론해야 합니다. 이전에는 …
Sparse Mixture-of-Experts (SMoE) 모델은 언어 모델을 효율적으로 확장할 수 있게 해주지만, 학습은 여전히 어려운데 라우팅이 소수의 전문가에게만 집중될 수 있기 때문이다.
검증 가능한 보상을 활용한 Reinforcement learning은 수학 및 코딩과 같은 분야에서 강력한 post‑training gains를 가능하게 했지만, 많은 open‑ended settings는 …
우리는 KV-Fold를 소개한다. 이는 training-free인 간단한 long-context inference protocol로, key-value (KV) cache를 시퀀스에 대한 left fold의 accumulator로 취급한다.
Looped Transformers는 잠재 표현을 반복적으로 정제함으로써 순수한 feed-forward 연산에 대한 유망한 대안을 제공하며, language modeling을 향상시킵니다.
극심한 기후와 변동성이 큰 도매 전력 시장은 주거용 소비자를 재앙적인 재정 위험에 노출시키지만, 배전 단계에서의 demand response는…
언어 모델 능력의 지속적인 향상이 코딩이나 컴퓨터 사용 등에서 자율 에이전트의 구동 요소로서 그 활용을 널리 가능하게 했습니다.
우리는 TextSeal을 소개합니다, 대형 언어 모델을 위한 최첨단 워터마크입니다. Gumbel-max 샘플링을 기반으로, TextSeal은 dual-key generation을 도입하여 resto...
고속 5G 사용 사례에서 특히 사용자 장비(UE) 이동성에 따른 높은 중단 시간 및 측정 보고 오버헤드 문제를 해결하기 위해 ...
대규모 언어 모델(LLMs)은 대량의 유창한 정치 텍스트를 생성할 수 있어, 위기 상황과 사회 갈등 시 synthetic discourse에 대한 우려를 불러일으킵니다. 기존…
대형 언어 모델(LLMs)은 종종 틀린 경우에도 높은 확신을 가지고 답변을 생성하므로, 신뢰할 수 있는 confidence estimation이 배포에 필수적이다.
연속 함수에 대한 numerical optimization은 기계 설계부터 training에 이르기까지 다양한 과학 및 공학 분야에서 기본적인 과제이다.
멀티 에이전트 대형 언어 모델(LLM) 시스템을 위한 프롬프트 사양은 데이터 계약과 통합 로직을 많은 상호 의존 파일에 걸쳐 포함하지만, 이는 드물다.
Prediction sets는 머신러닝 모델에서 불확실성을 정량화하기 위한 이론적으로 기반된 프레임워크를 제공합니다. 이를 구조화된 생성 작업에 적용하면,…
우리는 Curated Industrial Developer Repository (CIDR)를 소개합니다. 이는 직접 협업을 통해 수집된 실제 소프트웨어 저장소들의 대규모 데이터셋입니다.
이 논문은 실험적으로 하네스 엔지니어링 수준이 소형 언어 모델(SLMs, 2‑3B 파라미터)의 운영 성능에 어떻게 영향을 미치는지 분석한다. Th...
Agentic AI 실패는 사후 재구성이 필요합니다: 에이전트가 무엇을 했는지, 누구의 권한으로 했는지, 어떤 정책에 위배되는지, 그리고 어떤 논리에 기반했는지. Cross-regime feasibilit...
Cortical neurons은 복잡하고 multi‑timescale 프로세서로, recurrent circuits에 연결되어 있으며, 엄격한 biological constraints 하에서 오랜 evolutionary pressure에 의해 형성됩니다.
Power capping은 LLM 서빙에서 표준 GPU 에너지 레버이며, 효과가 있는 것으로 보입니다: 처리량이 감소하고, 전력 측정값이 낮아지며, 에너지 예산이 충족됩니다. 우리는 …
컴퓨팅 연속체 전반에 배치된 에이전시 시스템은 클라우드, 엣지, 그리고 간헐적으로 연결되는 도메인 전반에서 효과를 유지할 수 있는 디스커버리 메커니즘이 필요합니다. ...
Spiking neural networks (SNNs)는 시간적으로 풍부한 작업에 대해 저전력 이벤트 기반 계산을 약속하지만, 일반적으로 사용되는 뉴런 모델은 종종 gradient‑based …
영장류 시각 피질의 공간적 및 기능적 조직은 신경과학에서 근본적인 문제이다. 최근 To…와 같은 계산 프레임워크는 …
우리는 처음부터 만든 약 150M 파라미터의 widened‑D 기판(D=1536, V=32000; D/V 약 0.048; ‘widened‑1536’…) 위에서 진화적 mixture‑of‑LoRA 시스템을 분해한다.
Diffusion 및 flow-based 모델은 이미지와 비디오와 같은 연속 데이터 생성에 있어 사실상의 표준 접근법이 되었습니다. 그들의 성공은…
극단적인 사건과 heavy-tailed 현상을 모델링하는 것은 금융, 기후 과학, safety‑critical 시스템과 같은 분야에서 신뢰할 수 있는 예측 시스템을 구축하는 데 핵심적입니다.
Mixture-of-Experts (MoE)는 computation을 비례적으로 증가시키지 않으면서 model capacity를 확장하지만, 그 방대한 total parameter footprint는 상당한 …
자기 주의(self‑attention) 모듈을 핵심 구성 요소로 하는 트랜스포머는 현대의 대규모 언어 모델 및 파운데이션 모델에서 필수적인 아키텍처가 되었습니다. 이 논문에서는…
대규모 언어 모델 에이전트는 복잡한 작업을 해결하기 위해 외부 스킬에 점점 더 의존하고 있으며, 스킬은 그들의 능력을 확장하는 모듈형 단위로 작동합니다.
우리는 유한하고 연결된 그래프 상에서 로봇 집합이 목표 집합으로 이동하도록 하는 익명 다중 에이전트 경로 찾기(MAPF)를 고려한다. 우리는 M...
손글씨 Bangla 복합 문자 인식은 복잡한 문자 구조, 큰 클래스 내 변동성, 그리고 제한된 …
우리는 Shepherd를 소개합니다. 이는 메타‑에이전트 연산을 대상 에이전트에 대한 함수로 형식화하는 함수형 프로그래밍 모델이며, 핵심 연산은 Lean에서 기계화되었습니다.
우리는 전면(all-to-all) 큐비트 연결성을 가진 장치에 대한 Clifford 양자 회로 합성 문제를 고려한다. 우리는 이 작업을 강화 학습(reinforcement learning)으로 접근한다.
이 작업은 제한된 정책 클래스에 사용되는 표준 policy gradient 방법을 재검토한다. 이러한 방법은 suboptimal critical points에 갇히는 것으로 알려져 있다. 우리는 …를 식별한다.
AI 에이전트에 대한 지배적인 패러다임은 에이전트가 계획을 합성하고 사용자 p에 대응하여 몇 초 또는 몇 분 안에 행동을 실행하는 'on-the-fly' 루프이다.
모델 패밀리, 트레이닝 레시피, 그리고 컴퓨트 예산이 점점 표준화됨에 따라, 머신러닝 시스템의 추가적인 향상은 점점 데이터에 의존하게 된다...
Guardrail Classifiers는 production language models를 유해한 행동으로부터 방어하지만, 테스트에서는 결과가 유망해 보이지만, formal guarant...
Deep research agents, 즉 계획을 세우고, 검색하고, 증거를 평가하며, 장문 보고서를 종합하는 시스템을 훈련시키는 것은 reinforcement learning을 그 …
On-policy distillation은 추론 모델을 훈련하기 위해 밀도 높은 per-token 감독을 제공하지만, 이 신호가 언제 유익한지는 아직 명확하지 않다.
Shielding은 자율 에이전트의 안전을 보장하기 위한 대표적인 모델 기반 기법입니다. Classical shielding은 나쁜 일이 절대 일어나지 않도록 보장하는 것을 목표로 하며…
최근 GPU 세대는 FP8과 같은 저정밀 연산을 사용하여 훨씬 높은 FLOPs를 제공한다. 이는 대형 언어 모델(LL…에 성공적으로 적용되었다.
최근 machine learning과 large-scale biological data collections의 발전은 가상 세포(virtual cell), 즉 세포의 computational model을 구축한다는 전망을 다시 부활시켰다.
효율적인 LLM 추론 연구는 주로 각 디코딩 단계의 비용을 줄이는 데 초점을 맞춰 왔으며(예: quantization, pruning, sparse attention 사용), 일반적으로…
이미지나 3D 관찰에서 편집 가능한 CAD 프로그램을 복구하는 것은 AI‑assisted design의 핵심이지만, 기존 평가 방법 때문에 진행 상황을 측정하기가 어렵다.
현재 LLM 에이전트는 고립된 API 호출에 능숙하지만 상업용 소프트웨어 자동화의 ‘라스트 마일’에서는 어려움을 겪습니다. 실제 시나리오에서는 도구가…
Rejection Fine-Tuning (RFT)은 LLM 에이전트를 훈련시키는 표준 방법으로, 성공하지 못한 트래젝터리를 훈련 세트에서 제외합니다. In the context of...
인공지능(AI)과 분산 원장 기술(DLT)의 통합은 성장하는 연구 분야가 되었지만, 기여는 …
댓글 개인정보 – 2026년 5월 11일 오전 8시 07분 텍스트를 숨기려면 흰 배경에 흰 텍스트를 사용해 보세요. 인간의 눈은 보지 못하지만 컴퓨터는 볼 수 있습니다. 만약 …
Adaptive behavior는 뇌가 서로 다른 contexts 사이를 전환하면서 prior experience의 representations를 유지하도록 요구한다. 재구성 능력은 n...