[Paper] $V_1$: 병렬 추론기를 위한 Generation 및 Self-Verification 통합
복잡한 추론 작업에 대한 Test-time scaling은 독립적으로 샘플링하고 여러 s를 집계하는 등과 같은 방법으로 inference-time compute를 활용하는 것이 ...
4528 posts from this source
복잡한 추론 작업에 대한 Test-time scaling은 독립적으로 샘플링하고 여러 s를 집계하는 등과 같은 방법으로 inference-time compute를 활용하는 것이 ...
Large Language Models (LLMs)은 종종 매우 순응적이고 강화하는 대화 스타일을 보이며, 이는 AI-sycophancy라고도 알려져 있습니다. 비록 이 행동이 ...
대형 언어 모델(LLMs)이 연구 프로토타입에서 실제 시스템으로 전환함에 따라, 맞춤화가 핵심 병목 현상으로 부상했습니다. 텍스트 프롬프트는…
사용자 피드백은 모바일 앱의 진화에 필수적입니다. 그러나 연구에 따르면 사용자는 정보가 부족하거나 모호하거나 파괴적인 피드백을 제출하는 경향이 있습니다.
우리는 VietNormalizer1을 소개합니다. 이는 베트남어 텍스트 정규화를 위해 설계된 오픈소스, 의존성 없는 Python 라이브러리로, Text-to-Speech (TTS) 및 Natural Language …
실제에서는 stochastic differential equations를 multi‑objective optimization에 적용하는 것이 두 가지 지속적인 격차, 즉 불완전한 stability analysis 때문에 제한되어 왔습니다.
스트림 프로세싱 시스템을 효율적인 성능으로 구성하는 것은, 특히 클라우드 네이티브 배포 환경에서, 도전적이며 대부분 수동적인 작업입니다. 우리는 …을 제시합니다.
Aggregate Programming (AP)은 네트워크 가장자리(엣지)에 위치할 수도 있는 분산 장치들의 집합의 집단 행동을 프로그래밍하기 위한 패러다임이다, ...
코드 주석 분류는 자동화된 소프트웨어 문서화 및 분석을 위한 중요한 작업입니다. NLBSE'26 Tool Competition의 맥락에서, 우리는 Lo...
Software‑hardware co‑design는 신경망을 위한 in‑memory computing (IMC) 하드웨어 가속기를 최적화하는 데 필수적입니다. 그러나 대부분의 기존 최적화…
대규모 언어 모델(LLM) 기반 에이전트는 정적 버그 수정과 같은 소프트웨어 엔지니어링 작업을 자동화하는 데 강력한 역량을 입증했습니다.
이 글은 The Semantic Arrow of Time을 구성하는 다섯 편의 논문 중 두 번째입니다. Part I에서는 컴퓨팅의 시간 화살표가 열역학적이라기보다 의미론적임을 입증했습니다.
데이터센터에서 발생하는 모든 링크 연결 해제 또는 플랩은 네트워크의 자체 인식—즉, 그래프를 손상시킵니다. 우리는 이 손상을 “ghost”라고 부릅니다: 도달 가능한 것처럼 보이는 node…
우리는 Apple의 MLX 프레임워크에 네이티브로 구축된 최초의 스파이킹 뉴럴 네트워크(SNN) 라이브러리인 mlx-snn을 소개합니다. SNN 연구가 급속히 성장함에 따라, 모든 주요 라이브러리...
우리는 문자열론(stringology), 즉 효율적인 알고리즘 연구 분야의 방법을 활용하여 뇌전도(electroencephalography, EEG) 시계열을 분석하기 위한 새로운 계산 프레임워크를 제안한다.
우리는 모든 분야의 point clouds가 모여 모두에게 이익이 되는 단일 모델을 형성하는 미래를 꿈꿉니다. 이 목표를 향해 우리는 Utonia를 제시합니다, ...
Embodied Conversational Agents (ECAs)는 음성, 제스처, 그리고 얼굴 표정을 통해 인간의 대면 상호작용을 모방하는 것을 목표로 합니다. 현재 large language model…
많은 필수적인 조작 작업—예를 들어 음식 준비, 수술, 그리고 장인 기술—은 자율 로봇에게는 여전히 해결하기 어렵다. 이러한 작업들은 ...
자율적이고 다목적 전체 몸체 whole-body loco-manipulation을 달성하는 것은 인간형 로봇을 실용적으로 유용하게 만드는 데 핵심적인 장벽으로 남아 있습니다. 그러나 기존 접근 방식은 fu...
상호작용과 경험으로부터 수행하고 학습하는 능력은 로봇공학에서 핵심적인 과제로, 노동 집약적인 인간 ...에 대한 확장 가능한 대안을 제공합니다.
인간 이동 경로는 공중 보건 및 사회 과학 분야에서 널리 연구되고 있으며, 다양한 인구통계학적 그룹이 현저히 다른 이동성을 보입니다 ...
Feedforward geometric foundation models는 짧은 윈도우 재구성에서 강력한 성능을 달성하지만, 이를 분 단위 길이의 비디오로 확장하는 데는 quadratic attention에 의해 병목 현상이 발생합니다.
대류 지배적인 비정상 수송 현상의 수치 시뮬레이션은 급격한 구배와 전파되는 … 때문에 상당한 계산상의 도전 과제를 제기한다.
언어 모델(LMs)을 에이전트로 장기 컨텍스트 작업에 배치하는 것이 가속화됨에 따라 목표 드리프트에 대한 철저한 이해가 필요합니다: 에이전트의 …
AI algorithms for imperfect-information games는 일반적으로 개별 게임에 대한 performance metrics를 사용하여 비교되며, 이는 robustness를 평가하기 어렵게 만든다.
Autoregressive decoding은 그 순차적 특성 때문에 병목 현상이 발생합니다. Speculative decoding은 빠른 draft 모델을 사용하여 추론을 가속화하는 표준적인 방법이 되었습니다.
생성형 인공지능(AI)은 형성 피드백에 대한 확장 가능한 지원을 제공하지만, 대부분의 AI‑generated 피드백은 작성된 task‑specific rubrics에 의존합니다...
통합 멀티모달 모델은 최근 강력한 생성 능력을 보여주었지만, 생성이 이해를 향상시키는지, 그리고 언제 향상시키는지는 아직 명확하지 않습니다. Exi...
우리는 encoder--decoder 감소 차원 모델에서 학습된 잠재 표현에 대한 geometric regularization 전략을 조사합니다. 고정된 실험 설정에서 ...
클러스터 수를 선택하는 것은 비지도 학습에서 여전히 근본적인 과제이다. 기존 기준들은 일반적으로 단일 “optimal” 파티션을 목표로 한다, …
시간 창이 있는 전기차 라우팅 문제(EVRPTW)는 배터리 용량 제약과 충전소 결정을 도입함으로써 고전적인 VRPTW를 확장합니다.
Physics-Informed Neural Networks (PINNs)는 물리 정보를 포함하는 편미분 방정식을 해결하기 위한 메쉬‑프리 대안으로 인식되어 왔습니다.
실시간 사전 대응형 에이전시 시스템으로, 인간 정신 상태를 모델링할 수 있으며, foundation EXG 모델과 텍스트 임베딩 모델을 사용하고, 완전히 오프라인에서 실행됩니다...
Contrastive steering은 추론 시점에 LLM의 생성 행동을 조정하는 간단하고 효과적인 방법으로 입증되었습니다. 이는 프롬프트 예시를 사용합니다.
Agentic language models는 chat models와 근본적으로 다른 안전 체제에서 작동한다: 이들은 계획을 세우고, tools를 호출하며, long‑horizon actions를 실행해야 한다...
CDD, 또는 Contamination Detection via output Distribution는 모델이 샘플링한 출력의 피크 정도를 측정하여 데이터 오염을 식별합니다. 우리는 co...
대형 언어 모델(LLMs)이 IMO 수준에 가까운 수학 능력을 향상시키면서, 훈련을 위한 도전적이고 고품질의 문제들이 부족해지고 있습니다.
Omni-modal large language models (omni LLMs)는 최근 시청각 이해 작업 전반에 걸쳐 강력한 성능을 달성했지만, 여전히 높은 취약성을 보인다.
자동화된 산업 최적화 모델링은 자연어 요구사항을 솔버 실행 코드로 신뢰성 있게 변환해야 합니다. 그러나 대형 언어 모델은…
소프트웨어 시스템은 빈번한 코드 변경을 통해 지속적으로 진화하지만, 이러한 변경은 광범위한 테스트와 코드 리뷰에도 불구하고 종종 의도치 않은 버그를 초래합니다.
Serverless computing과 stream processing은 이벤트 기반 데이터 처리의 두 가지 주요 패러다임을 나타내지만, 두 경우 모두 비효율적으로 만드는 가정을 가지고 있습니다…
엔터프라이즈 엔지니어링 조직은 버전 관리 시스템, CI/CD 파이프라인, 이슈 트래커 및 관측성 등에서 대용량의 이질적인 텔레메트리를 생성합니다.
도구는 우리의 사고를 형성합니다. 그래서 개발자가 필요에 맞게 조정할 수 있도록 extensible하고 flexible한 도구를 갖는 것이 중요합니다. 프로그램에 대한 추론은 …
우리는 두 솔버의 겹치는 메쉬 영역에서 solution data를 보간하기 위한 scalable algorithm의 적용을 설명한다. 이 feature는 ...에 필수적이다.
대규모 언어 모델(Large Language Models)은 소프트웨어 엔지니어링 분야에서 빠르게 주목받고 있지만, 이들의 증가하는 탄소 발자국은 시급한 지속 가능성 문제를 제기합니다. While tr...
Self-Admitted Technical Debt (SATD)는 개발자가 코드 주석, 커밋 등 자연어 아티팩트에 명시적으로 인정한 기술적 타협을 의미한다.
Parameter-Efficient Fine-Tuning (PEFT)은 데이터 센터에서 대형 언어 모델(LLM) 맞춤화를 위한 파인튜닝 API의 백엔드로 널리 적용되고 있다. 서비스…
학술 회의의 탄소 발자국에 대한 논의가 커짐에 따라, 교통으로 인한 환경 영향에 대해 더 많은 질문이 제기되고 있습니다.