[논문] 맞춤 로직을 API로 전환: API 교체 리팩터링 이해와 제안
Software refactoring is essential for maintaining code quality. However, API replacement refactoring, which replaces custom logic with API calls, remains undere...
1077 posts from this source
Software refactoring is essential for maintaining code quality. However, API replacement refactoring, which replaces custom logic with API calls, remains undere...
In this paper we describe a communication-strategy study for multi-GPU three-dimensional finite-difference time-domain computation with convolutional perfectly ...
Developers increasingly use AI tools such as ChatGPT, Copilot, and Claude in everyday software workflows, but prior studies often evaluate LLM outputs in isolat...
Automatic decompilers produce functionally correct but often unreadable C code. This paper addresses one stage of the reverse engineering workflow: improving th...
With the remarkable progress of Code Large Language Models (Code LLMs) in achieving semantic correctness, execution efficiency has become an increasingly import...
Large Language Models (LLMs) are capable of generating syntactically correct and functionally complete programs, greatly streamlining software development. Howe...
Heterogeneous DNN accelerators improve soft real-time multi-DNN execution by mapping each layer to its preferred accelerator to reduce latency. However, under s...
Modern infrastructure depends on externally maintained artifacts such as package-registry dependencies, CI/CD actions, container images, Terraform providers and...
In this short experience paper, we present Pomona, a lightweight agentic tool that utilises agent skills for continuous automated code quality improvement. Insp...
When a distributed training job slows down, the hard part is knowing where to look. Synchronization hides the cause: a stall on one rank shows up as a wait on t...
We investigate cluster formation, involving the number and composition of clusters, in decentralized federated learning (FL) with heterogeneous machine learning...
Parameter-efficient finetuning methods based on spectral decomposition have enabled progress in Continual Learning. In this paper we introduce TailLoR, which ut...
For a humanoid robot to be deployed in the real world, the choice of command space (i.e., the interface between task planning and whole-body control) is crucial...
Code language models need repository-level context to resolve imports, APIs, and project conventions. Existing methods inject this knowledge as long inputs (ret...
Robot manipulation은 빠른 실행이 요구되는 low-risk transit phases와 느리고 정밀한 motion이 요구되는 high-risk contact stages가 번갈아 나타납니다. Yet ex...
본 논문에서는 플레이 기록에 기반해 반응할 수 있는 adaptive opponents와의 repeated games에서 regret minimization을 연구한다. 표준 metric of external…
최근 3D 멀티모달 대형 언어 모델(3D-MLLMs)의 발전으로 시각 질문 응답을 포함한 3D 씬 이해 작업에 대한 통합 솔루션이 가능해졌다.
AI writing assistants가 실제 초안 작성 및 수정 워크플로에 점점 더 통합됨에 따라, 많은 문서가 더 이상 순수하게 인간이 작성하거나 AI가 작성한 것만은 아니다.
Many real-world competitive systems require multiple decision-makers to act simultaneously under shared constraints, limited information, and repeated interacti...
재귀 신경망(RNN)을 훈련하려면 긴 연산 시퀀스 전반에 걸쳐 크레딧을 할당해야 합니다. 표준 시간에 대한 역전파(BPTT)는 …
Standard continuous-time generative models rely on monolithic architectures that must navigate vastly different signal regimes, from isotropic noise to intricat...
Vision-Language Models (VLMs)이 강력한 시각적 추론 능력을 보여주었지만, 그들의 공간 추론 능력은 여전히 주로 관찰에 제한되어 있다.
최근 추론 언어 모델의 발전은 강화 학습(RL) 파인튜닝에 의해 주도되고 있습니다. 대부분은 이러한 방법이 그룹 상대 정책에 의존합니다.
Discrete diffusion language models는 전체 응답을 병렬로 반복적으로 디노이징하면서 텍스트를 생성합니다. 각 단계에서, 그들은 모든 위치에 대한 잠정적인 토큰을 예측합니다.
Large language model (LLM) agents are increasingly applied to long-horizon tasks such as scientific discovery and machine learning engineering (MLE), where sust...
우리는 preconditioning (PC) 레이어를 제안합니다. 이는 polynomial preconditioner를 통한 weight parameterization으로, LLM 학습 전반에 걸쳐 안정적인 weight conditioning을 보장합니다.
Let S be the set of unit norm linear classifiers θin mathbb{R}^d which correctly classify every point of a labeled dataset (X_i,y_i)_{i=1}^n, X_i in mathbb{R}^d...
We introduce Goedel-Architect, an agentic framework for formal theorem proving in Lean 4 centered on blueprint generation and refinement. A blueprint is a depen...
현대 LLM에서의 Long-context inference는 디코딩 효율성에 의해 점점 더 제한되고 있으며, 특히 모델이 긴 inte...
A long-standing finding in the causal learning literature is that adults struggle to identify conjunctive causal rules, where an effect requires the simultaneou...
Benchmarks are fundamental for evaluating and advancing LLMs and MLLMs by providing standardized and explicit measures of performance. However, their constructi...
자율 LLM 에이전트가 실제 자격 증명을 보유하고 인간이 개입하지 않은 상태로 인프라를 운영함에 따라, 운영자는 에이전트를 식별할 표준적인 방법이 없습니다.
Next-generation wireless networks are expected to rely on multiple concurrent AI-driven control functions that optimize different network objectives simultaneou...
Multiple Instance Learning (MIL)은 인스턴스들의 bag 수준에서 감독이 제공되는 문제를 다루며, 다양한 분야에 성공적으로 적용되어 왔습니다.
대형 언어 모델은 점점 더 코드를 작성하고, 검토하고, 평가하며, 빠르게 성장하는 관행은 모델에게 모델이 ...처럼 추론하도록 요구하는 프롬프트 ‘스킬’로 이를 장착합니다.
Sparse attention은 생성 길이가 계속 증가함에 따라 대형 언어 모델(LLMs)을 서비스하는 데 점점 더 중요해지고 있습니다. 그러나 배포와 eval...
LLM agents are increasingly deployed on long-horizon tasks requiring sustained reasoning over extended interaction histories. Realizing this at scale requires a...
Large language models often improve reasoning by generating explicit chain-of-thought (CoT), demonstrating the importance of intermediate computation. However, ...
오디오 인코더는 현대 오디오 애플리케이션에서 매우 중요합니다. 대형 언어 모델(LLMs)이 다양한 입력에 대해 단일 인코더에 점점 더 의존함에 따라 더욱 그렇습니다. While self-su...
Large language models는 소셜 미디어 사용자를 시뮬레이션하고 개인이 온라인 토론에 어떻게 반응할지 추론하는 데 점점 더 많이 사용되고 있습니다. 그러나 아직도 …
Data-driven causal relationship identification is pertinent to advancing understanding of complex systems both within and beyond science. Bayesian networks offe...
As the demand for information and communication technologies (ICT) continues to rise, the environmental impact of computing systems is becoming an increasingly ...
이전 연구에 따르면 대형 언어 모델(LLMs)은 지속적인 학습을 수행하거나 심지어 그래…
안전이 중요한 교통 시나리오 생성은 희귀하지만 고위험 상호작용 하에서 자율 주행 시스템을 평가하는 데 필수적입니다. 기존 diffusion-bas...
We present the first Komi-Yazva--Russian parallel corpus together with an explicit evaluation protocol for studying LLM translation in an endangered, extremely ...
Many modern applications of deep learning involve training a neural network via a one-step prediction loss (e.g., L^2 regression, cross-entropy), but deploy the...
Inference-time skill augmentation은 모델을 업데이트하지 않고 재사용 가능한 절차적 지식을 주입함으로써 데이터 분석 에이전트를 가볍게 개선하는 방법을 제공합니다.
Medical imaging artificial intelligence has achieved strong performance in isolated image interpretation, but remains poorly aligned with radiological practice,...