[Paper] daVinci-Env: 대규모 오픈 SWE 환경 합성
능력 있는 소프트웨어 엔지니어링(SWE) 에이전트를 훈련하려면 대규모, 실행 가능하고 검증 가능한 환경이 필요하며, 이는 반복적인 …을 위한 동적 피드백 루프를 제공합니다.
능력 있는 소프트웨어 엔지니어링(SWE) 에이전트를 훈련하려면 대규모, 실행 가능하고 검증 가능한 환경이 필요하며, 이는 반복적인 …을 위한 동적 피드백 루프를 제공합니다.
AI 에이전트와의 긴 대화는 한 사용자에게 단순한 문제를 만들습니다: 기록은 유용하지만, 이를 그대로 유지하는 것은 비용이 많이 듭니다. 우리는 personalized ag…
개요: 이번 여름에 Peacock 모바일 앱을 열면 TV 진행자 Andy Cohen의 AI 이미지가 홈페이지에 나타날 수 있습니다. 발표에서...
Error Span Detection (ESD)는 기계 번역(MT) 평가에서 중요한 하위 작업으로, 번역 오류의 위치와 심각성을 식별하는 것을 목표로 합니다. Whil...
안녕하세요, HN! 우리는 Spine AI의 Ashwin과 Akshay입니다 – https://www.getspine.ai Spine Swarm이란? Spine Swarm은 무한한 visual …에 작동하는 multi‑agent system입니다.
강화 학습 기반 정렬의 광범위한 채택은 보상 모델의 중요성이 커지고 있음을 강조한다. 다양한 벤치마크가 평가를 위해 구축되었다.
Retrieval‑Augmented Generation(RAG) 및 Hybrid Search는 하이브리드 검색이라고도 불리며, 코퍼스에서 관련 문서를 검색하는 강력한 기술입니다.
MCP Plugin · 오픈 소스 · MIT Claude와 함께 구축, Claude를 위해. 프롬프트‑캐싱 작동 방식 Anthropic의 캐싱 API는 안정적인 콘텐츠를 서버 측에 5분 동안 저장합니다....
대규모 언어 모델(LLMs)을 비즈니스 프로세스 관리 도구에 통합하면 Business Process Model and Notation (BPMN) 모델링을 민주화할 수 있습니다…
강화 학습(RL)은 보상 신호로부터 학습을 가능하게 하여, 사후 훈련 diffusion 기반 이미지 synthesis 모델에 대한 표준 기법이 되었다.
Spiking Neural Networks (SNNs)는 기존 딥 네트워크에 대한 생물학적으로 영감을 받은 대안으로 등장했으며, 이벤트 기반 및 에너지 효율적인 컴퓨팅을 제공한다.
대규모 언어 모델(LLMs)은 코드 생성에서 놀라운 능력을 보여왔지만, Computer-Aided와 같은 도메인 특화 작업에서는 성능이 떨어진다.
Federated Clustering (FC)은 분산되고 프라이버시가 보호된 데이터에서 데이터 분포 패턴을 탐색하는 데 있어 떠오르는 유망한 솔루션이며, 비지도 학습…
소개: 생성 AI 애플리케이션이 프로토타입에서 프로덕션 시스템으로 이동함에 따라, 개발자들은 점점 새로운 아키텍처 과제에 직면하고 있다: 선택하는 것...
저는 Proof-of-Execution PoE라는 프로토콜을 작업하고 있습니다. 아이디어는 간단합니다: 오늘날 AI agents는 주로 그들의 outputs로 평가되지만, outputs는 cor...
‘왜 AI 거버넌스는 안정된 용어가 없으면 실패하는가’의 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/...
Visual design은 최첨단 multi-modal AI 시스템의 필수적인 응용 분야입니다. 이러한 시스템을 개선하려면 대규모 고품질 vision-language 데이터가 필요합니다.
markdown !Siddhesh Survehttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%...
소개 와인 분류 문제를 해결하기 위해, 우리는 연속적인 점수 예측에서 범주형 식별로 목표를 전환합니다.
대규모 언어 모델(Large Language Model, LLM) 추론은 인터랙티브 어시스턴트와 에이전시 시스템에서 널리 사용됩니다. 지연에 민감한 배포 환경에서는 추론 시간이 d...
GPU kernels 최적화는 표준 코드 생성 작업보다 대형 언어 모델(LLMs)에게 훨씬 더 큰 도전 과제를 제시합니다, 이는 ...
현대의 neural networks은 크게 overparameterized되어 있으며, pruning은 중복된 neurons 또는 connections를 제거하여 compressing의 핵심 접근법으로 부상하고 있다.
Autoregressive (AR) video generative models는 픽셀을 이산 토큰 시퀀스로 압축하는 video tokenizers에 의존합니다. 이러한 토큰 시퀀스의 길이는 …
멀티모달 대형 언어 모델(MLLMs)은 GUI 탐색과 같은 시각 워크플로를 수행하는 데 점점 더 많이 사용되고 있으며, 다음 단계는 검증된 시각에 따라 달라집니다.
현대의 visual agents는 실시간 스트리밍 환경에서 작동하기 위해 일반적이고 인과적이며 물리적으로 구조화된 표현을 필요로 합니다. 그러나 현재...
Unified multimodal models는 공동 이해, 추론 및 생성에 초점을 맞추지만, 현재의 image editing benchmarks는 대부분 자연 이미지에 국한되어 있다.
온라인 비디오 대형 언어 모델(VideoLLMs)은 반응성 있는 실시간 상호작용을 지원하는 데 중요한 역할을 합니다. 기존 방법들은 streaming percept…
텍스트-이미지 생성 모델은 빠르게 발전했지만, 생성된 이미지에 대한 세밀한 제어를 달성하는 것은 여전히 어려우며, 이는 주로 제한된 …
인간은 시각적 관찰의 스트림을 통해 현실 세계의 공간을 인지하고 이해한다. 따라서, 공간 증거를 스트리밍 방식으로 유지하고 업데이트하는 능력이 필요하다.
기존 비디오 깊이 추정은 근본적인 트레이드오프에 직면합니다: 생성 모델은 확률적 기하학적 환각과 스케일 드리프트에 시달리는 반면, discrimi...
과학적 멀티모달 문서 추론 데이터셋을 구축하는 것은 foundation model 훈련을 위해 규모(scale), 충실도(faithfulness), 현실성(realism) 사이의 내재된 트레이드오프를 포함한다.
Cross-entropy (CE) 훈련은 언어 모델에 대해 밀도 높고 확장 가능한 감독을 제공하지만, 교사 강제(teacher forcing) 하에서 다음 토큰 예측을 최적화할 뿐이다.
추론 LLMs-as-Judges는 inference-time scaling의 혜택을 받을 수 있으며, 추론 모델의 성공을 non‑verifiable 분야에 확장하는 유망한 경로를 제공합니다.
물리학, 언어 및 지각 전반에 걸친 지능 시스템은 종종 factorisable structure를 보이지만, 일반적으로는 monolithic neural architectures로 모델링됩니다 ...
우리는 STAMP (Selective Task-Aware Mechanism for Text Privacy)를 제시한다. 이는 향상된 프라이버시‑유틸리티를 달성하는 새로운 task‑aware 텍스트 프라이버타이제이션 프레임워크이다.
Neural network verification은 종종 더 큰 분석 절차의 핵심 구성 요소로 사용되며, 이 절차는 밀접하게 관련된 verification query들의 연속을 생성한다.
좋은 표현을 학습하는 것은 world models를 활용한 latent planning에 필수적입니다. pretrained visual encoders는 강력한 semantic visual features를 생성하지만, 그들은...
이 기사(Perplexity가 NIST/CAISI의 2025-0035 정보 요청에 대한 답변을 약간 수정한 버전)는 우리의 관찰과 권고 사항을 자세히 다룹니다.
프리트레이닝은 일반적으로 추가적인 반복 적응을 위한 시작점으로 간주되는 학습된 파라미터 벡터를 생성합니다. 이 작업에서 우리는 대신에 …
학제간 연구가 더 크고 장기적인 영향을 가져오지만, 대부분의 연구는 여전히 단일 분야 학술 사일로에 국한되어 있습니다. 최근 AI 기반 접근법...
수십 년 전에는 슈퍼컴퓨터에서만 사용할 수 있었던 컴퓨팅 파워, 특히 그들의 parallelism이 현재는 표준 personal computer에서도 이용 가능합니다.
원격 감지 이미지에서의 Salient object detection (SOD)은 객체 크기의 큰 변동과 self-att의 계산 비용 등으로 인해 상당한 도전에 직면하고 있다.
이 연구는 분산 데이터 파이프라인(또는 워크플로)의 자동화된 계획 및 스케줄링을 추구합니다. 우리는 일반적인 워크플로와 리소스 그래프 표현을 개발합니다.
Long-context agentic workflows는 대형 언어 모델의 정의적인 사용 사례로 부상했으며, attention efficiency는 추론 속도와 …에 있어 중요합니다.
소개 딥러닝 시스템은 데이터를 자동으로 표현(representations) 학습하기 때문에 강력합니다. 엔지니어가 수동으로 특징(features)을 설계하는 대신, 신경망(neural networks)이 스스로 학습합니다.
디코더 전용 Large Language Models(LLMs)이 최근 NLP 분야를 장악하고 있는 반면, 인코더 전용 아키텍처는 비용 효율적이고 파라미터 효율적인…
알고리즘 의사결정에서 AI 기반 ‘Value Alignment’의 간과된 함정 AI 시스템이 우리 삶을 점점 더 형성함에 따라 AI 윤리의 중요성이…
멀티모달 에이전트는 복잡한 문서 중심 워크플로우를 자동화하는 유망한 경로를 제공합니다. 그러나 여전히 중요한 질문이 남아 있습니다: 이러한 에이전트가 genui...