[Paper] SimuAgent: 강화 학습으로 향상된 LLM 기반 Simulink 모델링 어시스턴트
대형 언어 모델(LLMs)은 텍스트 기반 코드 자동화를 혁신했지만, 그래프 지향 엔지니어링 워크플로우에서의 잠재력은 아직 충분히 탐구되지 않았다....
4623 posts from this source
대형 언어 모델(LLMs)은 텍스트 기반 코드 자동화를 혁신했지만, 그래프 지향 엔지니어링 워크플로우에서의 잠재력은 아직 충분히 탐구되지 않았다....
대규모 언어 모델(LLMs)의 급속한 발전은 향후 모델을 훈련하기 위해 합성 데이터를 사용하는 것에 대한 관심이 증가하고 있습니다. 그러나 이는 자기‑c…
Chain-of-thought (CoT) reasoning은 비디오 이해 작업에서 멀티모달 대형 언어 모델을 위한 강력한 도구로 부상했습니다. 그러나 그 필요성과 …
3D 환경에서의 Embodied question answering (EQA)은 종종 여러 시점에 걸쳐 분산되고 부분적으로 가려진 컨텍스트를 수집해야 합니다. Ho...
기존의 long-term personalized dialogue systems는 무한한 interaction streams와 제한된 context constraints를 조화시키는 데 어려움을 겪으며, 종종 memory에 굴복한다.
Natural Language Inference (NLI)은 자연어 이해를 위한 언어 모델을 평가하는 중요한 작업이었지만, 논리적 특성은…
복잡한 추론을 위한 대형 언어 모델(LLMs)은 높은 계산 비용과 지연 시간 때문에 종종 제한을 받으며, 자원 효율적인 소형 언어 모델(SL...
Document Question Answering (DocQA)는 주어진 문서에 근거한 질문에 답하는 데 초점을 맞추지만, 기존 DocQA 에이전트는 효과적인 도구 활용과 라…
작물 질병 분석을 위한 Visual Question Answering은 정확한 시각 이해와 신뢰할 수 있는 language generation이 필요합니다. 이 작업은 lightweight vi...
LLM 기반 에이전트 애플리케이션은 복잡하고 다단계 작업을 점점 더 자동화하고 있지만, 이들을 효율적으로 제공하는 것은 이질적인 구성 요소 때문에 여전히 어려운 과제입니다...
과학 장비를 설계할 때는 종종 계산 비용이 많이 드는 physics simulations를 사용하여 크고 매우 제한된 설계 공간을 탐색해야 합니다. 이러한...
Epilepsy는 재발성 비자극성 발작을 특징으로 하는 만성 신경학적 장애로, 전 세계적으로 5천만 명 이상에게 영향을 미치며, 상당한 위험을 초래합니다.
Epilepsy는 재발하는 비자극성 발작을 특징으로 하는 만성 신경학적 장애이며, 전 세계적으로 5천만 명 이상에게 영향을 미치고, 상당한 위험을 초래합니다.
프라이버시 보호 연합 평균화는 연합 학습에서 클라이언트 프라이버시를 보호하기 위한 핵심 접근 방식입니다. 본 논문에서는 이 문제를 비동기 환경에서 연구합니다.
다양한 구성에 대한 벤치마크가 제안되어 AVX / NEON intrinsic functions의 능력과 한계를 일반적인 개발 프로젝트 맥락에서 탐구합니다.
Moore's Law에 의해 트랜지스터의 차원이 나노미터 규모까지 축소되었습니다. 고급 quantum transport (QT) solvers가 정확히 …
AI 코딩 에이전트가 생성한 Pull request (PR) 설명은 코드 변경 사항을 인간 리뷰어에게 전달하는 주요 채널입니다. 그러나 정렬 b...
본 논문은 배지, 스트릭, 그리고 소셜 기능을 통해 맥주 소비를 게임화하는 소셜 음주 애플리케이션인 Untappd에 대한 종단적 윤리 분석을 제시한다.
Permissionless 합의 프로토콜은 리더 선출을 조정하고 Sybil 저항성을 제공하기 위해 희소한 자원을 필요로 합니다. 기존 패러다임인 Proof of Work …
Neural-Symbolic (NeSy) Artificial Intelligence는 신경망의 학습 능력과 해석…
이 작업은 DCIM 3.0을 제시하며, 의미론적 추론, 예측 분석, 자율 오케스트레이션 및 통합 연결성을 통합한 통합 프레임워크를 제공합니다.
딥러닝은 시각 데이터 분석을 혁신했으며, 컨볼루션 신경망(CNN)이 의미 있는 특징 표현을 학습하는 데 매우 효과적이게 되었습니다.
광범위한 'memory wall' 병목 현상이 현대 대규모 Mixture-of-Experts (MoE) 아키텍처에서 크게 증폭됩니다. MoE의 고유한 아키텍처적 spa...
그래프 신경망(GNNs)은 그래프 구조 데이터를 학습하기 위한 강력한 도구이지만, 비효율적인 미니배치 생성, 데이터...
이 논문은 DDMIN-LOC라는 기법을 소개한다. 이 기법은 Delta Debugging Minimization (DDMIN)과 Spectrum-Based Fault Localization (SBFL)을 결합한다. 이것은 적용될 수 있다...
클라우드 환경에서 리소스 자동 스케일링 메커니즘은 최적의 프로비저닝 결정을 내리기 위해 정확한 성능 메트릭에 의존합니다. 인프라스트럭처 장애가 발생하면 ...
메커니즘 설계는 자기 이익을 추구하는 클라이언트들을 조정하여 사회 복지를 극대화하는 데 있어 연합 학습(Federated Learning, FL)에 핵심적입니다. 그러나 기존 메커니즘은 종종…
우리는 ReAct 추론과 전체 데이터 접근을 갖춘 LLM 에이전트를 배포했습니다. 에이전트는 완벽하게 실행되었지만, “완료율이 80%인 이유는?”라고 물었을 때, 메트릭을 …
Collaborative perception (CP)은 자율 주행 및 스마트 시티와 같은 응용 분야에서 중요한 기술입니다. 이는 정보의 공유와 융합을 포함합니다.
최근 대형 언어 모델(LLMs)의 발전으로 다양한 소프트웨어 엔지니어링 작업이 자동화되었으며, 그 능력을 평가하기 위한 벤치마크가 등장하고 있습니다. ...
생물학적 신경망을 모델링하기 위해 사용되는 순환 신경망(RNN)에서는, 생물학적 변동성을 모방하기 위해 훈련 중에 일반적으로 노이즈가 도입됩니다…
최근 언어 모델(LMs)의 발전은 다양한 소프트웨어 엔지니어링 작업에서 큰 진전을 이끌어냈습니다. 그러나 기존 LMs는 여전히 ...
우리는 새로운 **blocking linearizable stack** 구현을 제시하며, 이 구현은 **sharding**과 **fetch&increment**를 활용하여 모든 기존 구현보다 훨씬 뛰어난 성능을 달성합니다.
Phasor Agents는 내부 상태가 Phasor Graph인 동적 시스템이며, 이는 결합된 Stuart‑Landau 진동자들의 가중 그래프이다. Stuart‑Landau 진동자는...
우리 물리적 4D(3D + 시간) 세계의 동적 객체들은 끊임없이 진화하고 변형되며 다른 객체와 상호작용하여 다양한 4D 씬 다이내믹을 만들어낸다.
많은 임베디드 디바이스는 자원 제약과 동적 환경에서 동작하며, 로컬 의사결정 능력이 필요합니다. 디바이스가 인...
기존 시각 위치추정 방법은 일반적으로 2D 이미지 기반 방식으로, 구축 및 유지가 쉽지만 효과적인 기하학적 추론에 제한이 있거나 …
표면 근전도(EMG)의 신뢰할 수 있는 장기 디코딩은 전극 이동, 근육 피로 및 자세 변화에 의해 발생하는 신호 드리프트로 인해 방해받는다. While...
우리는 심각한 잡음 조건 하에서 비선형 슈뢰딩거 방정식(NLSE)으로부터 물리적 파라미터를 복원할 수 있는 deep learning 프레임워크를 시연한다....
검증은 에이전트를 개선하는 데 중요합니다: 이는 Reinforcement Learning을 위한 보상 신호를 제공하고 Test-Time Scaling을 통한 추론 시 이점을 가능하게 합니다.
멀티 에이전트 대형 언어 모델 (LLM) 시스템은 복잡한 작업 분해와 협업 문제 해결을 위한 강력한 아키텍처로 부상했습니다. 그러나,…
machine learning을 healthcare data에 적용하는 것은 종종 standardized하고 semantically explicit representation이 부족하여 제한을 초래한다.
Pathology foundation models (PFMs)은 computational pathology의 중심이 되었으며, whole-slide images에서 feature extraction을 위한 general encoders를 제공하는 것을 목표로 합니다.
우리는 현실적인 뉴스 환경에서 재무 허위 정보를 평가하기 위한 대형 언어 모델용 벤치마크인 RFC Bench를 소개합니다. RFC Bench는 단락 수준에서 작동합니다…
Remote photoplethysmography (rPPG)는 상용 카메라로 촬영한 얼굴 비디오에서 혈액량 펄스 (BVP) 파형을 추정합니다. 최근의 딥 모델들은 …
Language models는 수학 문제 해결부터 open-domain question answering에 이르기까지 다양한 작업에서 효과적이 되었습니다. 그러나 여전히 실수를 저지릅니다, ...
Direct Preference Optimization (DPO)는 최근 텍스트‑투‑비디오 (T2V) 생성에서 시각적 충실도와 텍스트 정렬을 향상시켜 성능을 개선했습니다. 그러나 현재 방법…
Audio-video joint generation은 빠르게 진행되었지만, 여전히 상당한 도전 과제가 남아 있습니다. 비상업적 접근 방식은 여전히 audio‑visual asynchrony, …