[Paper] GenEnv: 난이도에 맞춘 공동 진화: LLM 에이전트와 환경 시뮬레이터 사이
능력 있는 Large Language Model (LLM) 에이전트를 훈련하는 것은 실제 상호작용 데이터의 높은 비용과 정적인 특성 때문에 심각한 병목 현상을 겪고 있습니다. 우리는 이를 해결합니다.
3232 posts from this source
능력 있는 Large Language Model (LLM) 에이전트를 훈련하는 것은 실제 상호작용 데이터의 높은 비용과 정적인 특성 때문에 심각한 병목 현상을 겪고 있습니다. 우리는 이를 해결합니다.
장거리이며 기하학적으로 일관된 비디오를 생성하는 것은 근본적인 딜레마를 제시한다: 일관성은 픽셀 공간에서 3D geometry에 대한 엄격한 준수를 요구하지만, ...
배경: 고해상도 MRI는 진단에 필수적이지만, 긴 촬영 시간 때문에 임상에서의 활용이 제한됩니다. 슈퍼해상도(SR)는 스캔 후 해상도를 향상시킬 수 있습니다.
우리는 멀티모달 대형 언어 모델(LLMs)을 활용하여 9,562개의 아카이브 이미지 스캔을 통해 306,070개의 독일 특허(1877‑1918) 데이터셋을 우리 LLM‑b를 사용해 구축합니다.
기존의 강화 학습(RL) 접근 방식은 대형 언어 모델(LLM)을 단일 통합 정책으로 취급하여 내부 메커니즘을 간과한다. 이해...
당뇨병성 망막증(DR)은 전 세계적으로 예방 가능한 실명의 주요 원인 중 하나이며, 정확한 자동 진단 시스템이 요구됩니다. 일반 도메인 비전‑la…
효율적이고 효과적이며 일관된 metric clustering algorithms를 설계하는 것은 점점 더 많은 관심을 끄는 중요한 과제입니다. 전통적인 접근 방식은 ...
Aspect-Category Sentiment Analysis (ACSA)는 리뷰 내의 특정 주제를 식별하고 해당 감정을 파악함으로써 세분화된 인사이트를 제공합니다. While supervi...
우리는 미분 가능한 볼록 함수의 convex conjugates를 계산하기 위한 새로운 딥러닝 알고리즘을 소개합니다. 이는 convex analysis에서 기본적인 연산입니다.
프로그래밍은 현대 과학 연구에 필수적이지만, 대부분의 과학자들은 자신의 업무에 필요한 소프트웨어 개발에 대한 충분한 교육을 받지 못했다고 보고합니다. Generati...
시간에 의존하는 편미분 방정식(PDE)의 수치 시뮬레이션은 과학 및 공학 응용 분야의 핵심이지만, 고정밀 솔버는…
우리는 자연어 처리(NLP) 작업에 필수적인 텍스트 정규화의 한 형태인 diacritic restoration에 대한 실험을 제시합니다. 우리의 연구는 두 가지 예...
Summary assessment는 생성된 summary가 source text의 핵심 아이디어와 의미를 얼마나 잘 반영하는지를 평가하는 것으로, 깊은 이해가 필요합니다.
이 논문은 HuBERT의 다국어 확장인 MauBERT를 소개하며, 조음 특징을 활용하여 강인한 다언어 음성 표현 학습을 수행한다.
멀티모달 대형 언어 모델은 많은 시각 및 텍스트 추론 작업에서 인간과 같은 성능을 달성했지만, 세밀한 공간…
RAPID-LLM은 GPU 클러스터에서 대규모 언어 모델(LLM) 학습 및 추론을 위한 통합 성능 모델링 프레임워크입니다. 이는 DeepFlow 기반 프런트엔드와 결합하여…
최근 self-supervised Joint-Embedding Predictive Architectures (JEPAs) 분야의 획기적인 연구는 Euclidean 표현을 iso... 방향으로 정규화하는 것이 중요함을 입증했습니다.
최근에 사고 능력을 갖춘 새로운 파도의 대형 언어 모델(Large Language Models)이 등장했으며, 다양한 추론 벤치마크 전반에 걸쳐 뛰어난 능력을 보여주고 있습니다. ...
Attitude control은 많은 위성 임무에 필수적이다. 그러나 Classical controllers는 설계에 시간이 많이 소요되고 모델 불확실성에 민감하며…
우리는 인간과 LLM 상호작용이 초래하는 epistemological 위협을 검토한다. 우리는 인간 전반에 걸쳐 분배된 epistemic warrant를 이론화하는 collective epistemology를 개발한다.
Artificial intelligence은 전 세계 기술 경쟁의 핵심 분야가 되었으며, 유럽이 기술 주권을 추구하는 데 있어 중심적인 관심사입니다. 이 …
그룹 상대 강화 학습과 검증 가능한 보상(RLVR)은 종종 가장 유용한 데이터를 낭비하고 이미 실패를 가지고 있습니다. 모든 롤아웃이 w...
본 논문에서는 순서 회귀(ordinal regression) 설정에서 방향성 피드백(directional feedback)을 도입합니다. 여기서 학습자는 예측된 레이블이 …인지에 대한 피드백을 받습니다.
우리는 Algerian Dialect라는 대규모 sentiment-annotated 데이터셋을 소개합니다. 이 데이터셋은 알제리 아랍어 방언으로 작성된 45,000개의 YouTube 댓글로 구성됩니다. 우리가…
대기 난류는 optical imaging, remote sensing, free-space optical …을 포함한 광범위한 응용 분야 전반에 걸쳐 근본적인 제한을 가합니다.
대형 언어 모델(LLMs)과 멀티모달 LLMs는 이벤트 추출(EE)을 변화시키고 있습니다: 프롬프팅과 생성은 종종 제로샷으로 구조화된 출력을 만들 수 있습니다 ...
연속적인 용매 조성 범위에 걸친 반응 결과를 예측하는 것은 유기 합성 및 공정 화학에서 여전히 중요한 과제입니다. 전통적인 m...
다양한 프로그래밍 언어의 급속한 확산은 다국어 코드 LLM을 개발하는 데 기회와 도전을 동시에 제공합니다. 기존 기술은…
소스 코드 변경과 그 변경이 다른 코드 엔티티에 미치는 영향을 이해하는 것은 소프트웨어 개발에서 중요한 기술입니다. 그러나 코드 변경에 대한 분석과 ...
시기적절하고 정확한 상황 보고서는 인도주의적 의사결정에 필수적이지만, 현재의 워크플로우는 대부분 수동적이며 자원 집약적이고, 그리고 …
추천 시스템은 개인화된 콘텐츠 제공을 가능하게 하며, 따라서 많은 대기업의 수익을 창출합니다. 지난 10년간, 딥러닝 recommende...
우리는 강하게 서브선형 MPC 모델이 고전적인 그래프 중심 분산 모델과 어떻게 관련되는지 연구하며, Node‑Capacitated Clique (NCC), 즉 대역폭 제한이 있는 클리크 모델에 초점을 맞춥니다.
도시의 지하 케이블 건설은 도시 전력망의 신뢰성을 향상시키는 데 필수적이지만, 높은 건설 비용 때문에 계획이 가치 있는 …
Neural code models는 소프트웨어 개발 프로세스에 점점 더 많이 통합되고 있습니다. 그러나 이들의 백도어 공격에 대한 취약성은 중요한…
GPU 컴퓨팅을 효율적으로 활용하는 것은 대규모 언어 모델(LLM) 서비스에서 사용자 경험을 향상하고 운영 비용을 절감하는 데 핵심적입니다. 그러나 현재…
이 논문은 연구자 코딩 및 R에 대한 담론적 기여 분석을 통해 기업 혁신 시스템에서 인식되지 않은 노동의 역할을 탐구한다.
Decentralized federated learning (DFL)은 중앙 집중식 조정 없이 엣지 디바이스 간 협업 모델 훈련을 가능하게 하며, 시스템 장애에 대한 복원력을 제공한다.
Bangla는 code generation을 위한 저자원 언어로, large-scale annotated datasets와 natural language specifications를 실행 가능한 형태로 변환하는 도구가 부족합니다.
연합 학습(FL)의 모델 훈련 과정에 over-the-air computations(OAC)를 도입하는 것은 통신 부담을 완화하는 효과적인 접근 방식이다.
대형 언어 모델(LLMs)의 발전은 소프트웨어 개발 및 프로그래밍 지원에 유망한 영향을 보여주고 있습니다. 그러나 이러한 모델은 …
Automated front-end engineering은 개발 주기를 크게 단축하고 수동 코딩 오버헤드를 최소화합니다. Generative AI가 번역에서 가능성을 보여주었지만…
다가오는 프로젝트 반복(sprint) 계획은 Scrum 계획의 핵심 활동 중 하나입니다. 이 논문에서는 우리가 탐구하고 있는 진행 중인 작업을 제시합니다.
동적 다중모달 다목적 최적화는 동시에 여러 동등한 파레토 최적 집합을 추적하고 po...
Large Language Models (LLMs)은 복잡한 다중 턴 상호작용 프로토콜을 실행하지만, 설계자 의도에 대한 실행을 검증할 공식 사양이 부족합니다. We int...
Catastrophic forgetting은 지속적 학습에서 근본적인 도전 과제를 제시하며, 특히 모델이 배포 효율성을 위해 quantized될 때 더욱 그렇다. 우리는 체계적으로…
Vision-Language-Action (VLA) 모델은 시각과 언어를 구현된 제어와 정렬하지만, 텍스트에만 의존할 경우 객체 지시 능력이 제한됩니다.
Differential privacy (DP)는 추천 시스템에서 사용자 데이터를 보호하기 위한 gold standard로 부상했지만, 기존의 privacy‑preserving 메커니즘은 …
생성 모델에서의 artistic style transfer는 여전히 중요한 도전 과제이며, 기존 방법들은 종종 모델 파인튜닝이나 추가적인 …