[Paper] AI 에이전트 프레임워크에서 에이전트 개발자 관행에 대한 실증 연구
대규모 언어 모델(LLMs)의 부상은 에이전트에 대한 관심 급증을 촉발했으며, 이는 에이전트 프레임워크의 빠른 성장으로 이어졌습니다. 에이전트 프레임워크는 소프트웨어...
3307 posts from this source
대규모 언어 모델(LLMs)의 부상은 에이전트에 대한 관심 급증을 촉발했으며, 이는 에이전트 프레임워크의 빠른 성장으로 이어졌습니다. 에이전트 프레임워크는 소프트웨어...
최근 대형 언어 모델(LLMs)의 발전은 특히 긴 체인-오브-생각(Chain-of-Thought, CoT) 방식을 통한 emergent reasoning capabilities에 의해 주도되고 있습니다...
Large Language Models (LLMs)의 내부 사고 과정을 이해하고 환각의 원인을 파악하는 것은 여전히 주요 과제이다. 이를 위해 우리는 l...
Internet of Things의 성장으로 새로운 세대의 애플리케이션이 가능해졌으며, computation과 intelligence가 network edge 쪽으로 이동하고 있습니다. 이 추세는…
MPI 애플리케이션에 대한 상세한 트레이스 분석은 성능 엔지니어링에 필수적이지만, 트레이스 크기가 증가하고 복잡한 통신 동작이 종종 …
본 논문은 복잡한 최적화 과제를 해결하기 위해 인공지능(AI)과 혼합 정수 선형 계획법(MILP)의 통합을 분석한다.
Automated test generation은 특히 현대 API 기반 아키텍처에서 소프트웨어 품질을 보장하기 위한 핵심 기술이 되었습니다. 그러나 자동으로 생성…
내재된 시간적 역학이 없는 정적 이미지를 처리하는 것은 스파이킹 뉴럴 네트워크(SNNs)에 대한 근본적인 과제로 남아 있습니다. 직접 훈련된 SNN에서는 정적...
Symbolic Regression (SR)은 변수들 간의 관계를 설명하는 수학적 표현식을 발견하는 것을 목표로 하는 회귀 방법이며, 종종…
Graph Neural Networks (GNNs)는 불규칙하고 메모리 바인드된 그래프 탐색과 규칙적이며 연산 집약적인 밀집 연산을 결합함으로써 근본적인 하드웨어 과제를 제시한다.
Digital Twins (DTs)는 복잡한 사회기술 시스템에서 자율적인 의사결정자로 점점 더 많이 활용되고 있다. 이들의 수학적으로 최적의 결정은 종종 차이를 보인다.
소프트웨어는 복잡한 시스템 개발 및 프로토타이핑에서 점점 더 중요한 역할을 하고 있으며, 최근 몇 년간 MIT Lincoln Laboratory는 ...
현실 세계에서 발생하는 관계형 데이터는 종종 그래프로 구조화되며, 이는 분석적 도출을 단순하게 만드는 논리적 추상화를 제공합니다.
Software supply chain attacks는 기존 SCA 도구의 사각지대를 드러냈으며, 이러한 도구들은 종종 단일 생태계에 제한되고 소프트웨어 artifact만 평가한다...
고급 deep learning 아키텍처, 특히 recurrent neural networks (RNNs)는 audio, bioacoustic 및 biomedical signal 분석에 널리 적용되어 왔습니다.
이 논문은 MPI 기반 동기화 기술을 분산 퍼징 프레임워크에 통합하는 방식을 탐구하며, 가능한 상당한 성능 향상을 강조한다.
Fuzzing은 소프트웨어 취약점을 발견하는 데 매우 효과적인 방법이지만, 결과 데이터를 분석하는 데는 일반적으로 상당한 수동 작업이 필요합니다. Thi...
많은 학문 분야에서 소프트웨어는 연구 과정 중에 또는 연구 목적을 위해 만들어집니다. 연구를 위한 소프트웨어의 중요한 역할이 커지고 있습니다.
Federated Learning은 보안 및 계산상의 이점 때문에 distributed learning에 널리 사용되는 접근 방식입니다. 강력한 디바이스가 네트워크에 등장하면서...
Covid는 온라인 교육과 학습을 받아들일 수 있게 만들었고, 학생들, 교수진, 그리고 산업 전문가 모두가 이 방식을 편안하게 여기고 있습니다. 이러한 편안함은…
우리는 LibriBrain 2025 PNPL 대회를 위해 Conformer 기반 디코더를 제시하며, 두 가지 기본적인 MEG 작업인 Speech Detection과 Phoneme Classification을 목표로 합니다....
많은 현대 소프트웨어 프로젝트는 새로운 기능과 보안 패치를 통합하기 위해 빠르게 진화합니다. 사용자가 의존성을 보다 안전한 버전으로 업데이트하는 것이 중요합니다.
Serverless Large Language Models (LLMs)은 ‘pay-as-you-go’ 가격 모델을 가능하게 함으로써 AI 서비스를 배포하기 위한 비용 효율적인 솔루션으로 부상했습니다.
이 논문은 정규화된 파스칼(이항) 계수를 기반으로 하는 유전 알고리즘(GAs)을 위한 새로운 다중 부모 재조합 연산자 군을 소개한다. Unl...
본 논문에서는 계산 노드 간의 가중치가 로컬 학습 규칙에 따라 수정되는 신경망 모델을 조사한다. w를 결정하기 위해…
Machine Consciousness Hypothesis는 의식이 substrate-free 기능적 속성으로, second‑order perception을 수행할 수 있는 computational systems의 특성이라고 주장한다.
이기종 엣지 환경에서 대규모 foundation models에 대한 inference는 근본적으로 재구성 가능한 orchestration substrate를 필요로 한다. 정적 …
Federated fine-tuning은 Large Language Models (LLMs)를 다운스트림 작업에 적용하면서 데이터 프라이버시를 보호하는 유망한 솔루션을 제공합니다. 그러나 그 hi...
마이크로서비스는 모듈식이며 독립적인 서비스를 생성함으로써 소프트웨어 아키텍처를 혁신했습니다. 그러나 이들은 운영 복잡성을 도입합니다 ...
Quality-Diversity (QD) 알고리즘은 다양한 고품질 솔루션 집합을 발견하는 데 중점을 둔 최적화 분야를 구성합니다.
대규모 언어 모델(LLMs)이 텐서 병렬성(TP) 및 파이프라인 병렬성(PP)으로 확장되고, 프로덕션 스택이 데이터를 적극적으로 최적화함에 따라 …
동적 시각 콘텐츠에 대한 추론은 멀티모달 대형 언어 모델에게 여전히 핵심 과제이다. 최근의 thinking 모델은 명시적인 reasoning trace를 생성한다.
최근 멀티모달 대형 언어 모델(MLLMs)은 비디오 이해를 크게 발전시켰지만, 대부분은 여전히 “비디오에 대해 생각한다”(즉, 비디오가 인코딩된 후에만 추론을 수행한다) 식이다.
견고한 world model reasoning을 개발하는 것은 대형 언어 모델(LLM) 에이전트가 복잡한 환경에서 계획하고 상호작용하는 데 필수적입니다. 멀티턴 인터랙션…
최근, multi-person video generation이 주목받기 시작했습니다. 몇몇 초기 연구에서는 audio-driven multi-person talking video에 대해 탐구했지만...
최근 large language models (LLMs)의 발전은 수학적 발견에서 획기적인 진전을 가능하게 했으며, 그 예로 폐쇄형 시스템인 AlphaEvolve가 ...
대규모 비전 언어 모델(VLM)은 광범위한 사전 학습을 통해 모달리티 격차를 효과적으로 메우며, 정교한 시각 표현을 획득하고 wi...와 정렬됩니다.
현재 world models는 체계적인 평가를 위한 통합되고 제어된 환경이 부족하여, 그것들이 실제로 근본적인 규칙을 포착하고 있는지를 평가하기 어렵게 만든다.
언어 모델은 최근 몇 년간 고급 벤치마크에서 엄청난 진전을 보였지만, 이러한 진전의 대부분은 더 비용이 많이 드는 모델을 사용함으로써만 가능했습니다.
Deep learning 접근법은 object detection에서 이미지 내 특정 객체 클래스에 대한 신뢰할 수 있는 탐지를 달성했습니다. 그러나 모델의 detection capability를 확장하는 것은…
Inverse heat problems는 관측되거나 알려진 열 확산 거동을 기반으로 재료의 thermophysical properties를 추정하는 것을 말합니다. Inverse heat problems는…
이 논문은 두 층 신경망을 이용한 모듈러 덧셈 학습에서 activation functions의 역할을 연구한다. 우리는 먼저 sharp expressivity gap을 확립한다: si...
오프라인 강화 학습(RL)은 사전 수집된 데이터셋으로부터 에이전트가 최적 정책을 학습하도록 합니다. 그러나, 최적이 아닌 및 단편적인 데이터를 포함하는 데이터셋은...
머신러닝 모델은 진단, 날씨 예측, NLP, 자율 주행 등과 같은 분야에서 좋은 성능을 보이지만, 그들의 제한된 불확실성 처리...
우리는 SuperIntelliAgent를 소개합니다. 이는 학습 가능한 작은 diffusion model(learner)과 고정된 large language model을 결합한 agentic learning framework입니다.
생성적 세계 모델(generative world models)의 최근 발전은 정적 장면 합성(static scene synthesis)에서 시작해 개방형 게임 환경(open-ended game environments)을 만드는 데 있어 눈에 띄는 진전을 가능하게 했습니다, …
최근 텍스트-투-비디오(T2V) 및 이미지-투-비디오(I2V) 모델의 발전으로, 간단한 텍스트만으로도 시각적으로 매력적이고 역동적인 비디오를 생성할 수 있게 되었습니다...
자동화된 취약점 패치는 소프트웨어 보안에 필수적이며, 최근 Large Language Models(LLMs)의 발전은 자동화된 …에 대한 유망한 역량을 보여줍니다.