[Paper] RepoMod-Bench: 구현 독립 테스트를 통한 코드 저장소 현대화 벤치마크
AI 코딩 에이전트의 진화는 단순한 snippet 완성에서 autonomous repository-level engineering으로 경계를 이동시켰습니다. 그러나 이러한 ...
3058 posts from this source
AI 코딩 에이전트의 진화는 단순한 snippet 완성에서 autonomous repository-level engineering으로 경계를 이동시켰습니다. 그러나 이러한 ...
비구조화된 포인트 클라우드 데이터에서 동적 3D 객체의 temporally consistent surface reconstruction은 특히 매우 긴 시퀀스의 경우 여전히 어려운 과제이다. E...
Egocentric manipulation videos는 상호작용 중 심각한 가림 현상과 카메라 시야에서 물체가 자주 들어오고 나가는 등으로 인해 매우 도전적입니다.
기존의 action‑conditioned video generation models (video world models)는 단일 에이전트 관점에 제한되어 있어, 다중 에이전트 상호작용을 포착하지 못한다.
다국어 대형 언어 모델(Large Language Model, LLM) 평가의 신뢰성은 현재 번역된 벤치마크의 일관되지 않은 품질 때문에 손상되고 있습니다. 기존의 …
수메르어 전사(전사법)는 라틴 문자로 태블릿에 대한 학자의 해석을 나타내는 전통적인 체계입니다. 선구적인 디지털 Assyr...
생성 AI(GenAI)의 발전으로 이미지의 무단 사용을 방지하기 위한 다양한 보호 전략이 개발되었습니다. 이러한 방법들은 ...
Sybil 저항은 분산 합의 프로토콜의 핵심 요구 사항입니다. 이는 계산 능력, moneta와 같은 희소 자원을 도입함으로써 달성됩니다.
우리는 language model의 parameters에 저장된 세계 지식에 접근하기 위한 추론을 연구합니다. 예를 들어, 캔버라가 호주의 수도라는 것을 기억하는 것이 …
오픈소스 네이티브 GUI 에이전트는 여전히 장기 탐색 작업에서 클로즈드소스 시스템에 뒤처진다. 이 격차는 두 가지 제한에서 비롯된다: 고‑q…
암석-유체 상호작용을 모델링하려면 흐름 거동과 유체의 반응을 예측하기 위해 편미분 방정식(PDEs) 집합을 풀어야 합니다 wi...
지난 20년 동안, 질문 응답(Question Answering, QA) 시스템을 설계하고 구현하는 데 있어 상당한 진전이 이루어졌습니다. 그러나 복잡한 질문을 다루는...
많은 응용 분야에서 전체 인구보다 더 오래 혹은 더 짧게 생존하는 하위 집단을 식별하는 것이 중요합니다. 예를 들어 의학에서는, it al...
최근 몇 년간, 전체 슬라이드 이미지를 타일로 자르고, 이러한 타일을 foundation model을 사용해 처리하는 표준 컴퓨테이셔널 병리학 워크플로우가 등장했습니다.
Checkpointing은 대규모 언어 모델(LLMs) 훈련에서 fault tolerance를 위해 필수적입니다. 그러나 기존 방법들은 I/O 전략에 관계없이, periodic…
대부분의 현대 신경 학습 시스템은 epoch-based optimization과 과거 데이터에 대한 반복적인 접근에 의존하며, 암묵적으로 reversible computation을 가정한다. I...
Cardiovascular disease (CVD)는 전 세계적인 주요 보건 과제 중 하나로, 전 세계에서 1900만 명 이상의 사망을 차지합니다. 이를 해결하기 위해, 여러…
인간 피드백을 활용한 강화 학습(RLHF)은 대형 언어 모델(LLM)을 인간의 선호에 맞추는 데 중요한 역할을 합니다. RLHF를 사용한 ...
대형 언어 모델(LLMs)은 직장 커뮤니케이션을 “전문화”하기 위해 점점 더 많이 활용되고 있으며, 이는 종종 언어 정체성을 희생시킵니다. 우리는 ‘Cultu…’ 를 소개합니다.
객체 환각은 대형 비전-언어 모델(LVLMs)에서 중요한 문제로, 출력에 입력 이미지에 존재하지 않는 객체가 포함되는 경우를 말합니다. 자연스러운…
Medical vision-language pretraining은 대규모 supervisory signals로서 의료 보고서에 점점 더 의존하고 있습니다; 그러나 원시 보고서는 종종 상당한 st...
최근의 Multimodal Large Language Models의 발전은 시각적 이해와 추론을 크게 향상시켰지만, 그들의 quadratic attention과 offline training…
Deep neural networks (DNNs)는 엣지 또는 모바일 디바이스에서 고급 작업을 수행하는 데 필수적이지만, 그 배포는 종종 심각한 자원 제약으로 인해 방해받는다.
우리는 mean estimation의 기본 과제를 mean‑shift contamination이 존재하는 상황에서 연구한다. mean‑shift contamination 모델에서, adversary는 데이터를 교체할 수 있다.