[Paper] 베이시안 역문제에 대한 디퓨전 포스터리어 샘플링의 안정성 및 견고성
Diffusion models는 최근 Bayesian inverse problems (BIPs)를 위한 강력한 learned priors로 부상했습니다. Diffusion-based solvers는 가정된 likelihood fo...
4538 posts from this source
Diffusion models는 최근 Bayesian inverse problems (BIPs)를 위한 강력한 learned priors로 부상했습니다. Diffusion-based solvers는 가정된 likelihood fo...
관계 데이터의 가용성이 증가함에 따라 복잡계의 네트워크 기반 표현에 대한 의존도가 높아지고 있습니다. 시간이 지나면서 이러한 모델...
Agentic Large Language Models에 기대되는 주체성은 단순히 올바르게 답하는 것을 넘어, 목표를 설정하고 탐색할 대상을 결정하는 자율성을 요구합니다. 우리는 이를 i...
광고 이미지 생성은 클릭률(CTR)과 같은 온라인 지표에 점점 더 초점을 맞추고 있지만, 기존 접근 방식은 “원 사이즈 모두에게 맞는” 전략을 채택하고 있다.
우리는 스케일‑스페이스 이론을 통해 wavelet transforms와 spiking neural networks 사이의 이론적 연결을 설정한다. 우리는 scale‑covariant 보장을 기반으로 한다.
최근 유전체 기반 모델들은 DNA를 일차원 토큰 시퀀스로 취급하는 대형 언어 모델(Large Language Model) 아키텍처를 주로 채택합니다. 그러나, 포괄적인 …
대형 추론 모델(LRMs)은 종종 과잉사고(overthinking) 현상을 겪는다. 이는 올바른 해결책이 이미 도출된 후에도 중복된 추론 단계가 생성되는 현상이다.
World models는 자율 주행에서 데이터 합성을 위한 상당한 가능성을 보여주었습니다. 그러나 기존 방법들은 주로 단일 모달에 집중하고 있습니다...
희소 이미지로부터 3D 장면을 재구성하는 것은 최적화 없이 정확한 geometry와 texture를 복원하는 것이 어려워 여전히 도전적인 과제이다. R...
스파이킹 뉴럴 네트워크(SNN)의 뉴로모픽 하드웨어 구현은 희소하고 이벤트 기반 연산을 통해 에너지 효율적이며 저지연 AI를 약속한다. 그러나, ...
Cross-partition edges가 분산 GNN 학습 비용을 지배한다: 매 iteration마다 remote features와 activations를 fetching하는 것이 graphs가 깊어질수록 network를 압도한다.
Federated Unlearning (FU)은 연합 모델에서 특정 클라이언트 데이터의 영향을 효율적으로 제거하면서 남은 클라이언트들의 유용성을 유지하는 것을 목표로 합니다…
Genetic programming 기반 feature construction은 최근 몇 년간 자동화된 머신러닝 기법으로서 학습을 향상시키는 데 큰 성공을 거두었습니다.
우리는 NP-hard Edge User Allocation 문제를 해결하기 위해 Winner-Takes-All (WTA) 메커니즘이 구현된 attractor network를 이용한 neuromorphic solver를 제안한다.
Differential Evolution (DE)은 전략 선택에 민감하기 때문에, 기존의 대부분 변형들은 적응 메커니즘이나 복잡한 설계를 통해 성능을 추구합니다.
최근 비디오 확산 모델(VDMs)은 시각적으로 인상적인 결과를 만들어내지만, 근본적으로 3D 구조적 일관성을 유지하는 데 어려움을 겪으며, 종종 결과가…
Shared autonomy systems는 사용자 의도를 추론하고 적절한 assistance levels를 결정하기 위한 원칙적인 방법이 필요합니다. 이는 인간…
Open-set object detection (OSOD)은 객체를 위치시키면서 추론 시에 알려지지 않은 클래스들을 식별하고 거부합니다. 최근 OSOD 모델들은 벤치마크에서 좋은 성능을 보이고 있습니다.
우리는 역 PDE 문제를 위해 함수 공간에서 데이터 효율적이며 물리 인식을 갖춘 생성 프레임워크를 제안한다. 기존의 플러그‑앤‑플레이 diffusion posterior samplers …
Diffusion Large Language Models (DLLMs)은 Auto‑Regressive 모델에 대한 매력적인 대안을 제공하지만, 높은 디코딩 비용으로 인해 배포가 제한됩니다. In ...
Astronomical imaging은 실용적인 관측 제약 하에서 여전히 noise‑limited 상태이며, 표준 calibration pipelines는 주로 structured artifacts와 …
Prompt agents는 최근 자동 프롬프트 최적화를 위한 유망한 패러다임으로 등장했으며, 정제를 순차적 의사결정 문제로 프레이밍합니다.
본 논문은 자율주행 차량을 위해 diffusion-based adaptive lookahead planner (IRL-DAL)를 활용한 새로운 역강화학습 프레임워크를 제안한다. Train...
언어 모델을 기반으로 한 자율 AI 과학자들의 급속한 발전에도 불구하고, 출판용 일러스트레이션을 생성하는 일은 여전히 노동 집약적인 병목 현상이다…
우리는 diffusion models의 샘플링에 partial differential equations에서 유도된 physics-based guidance를 추가하는 guided stochastic sampling 방법을 도입합니다.
Muon optimizer는 matrix-level gradient(또는 momentum) orthogonalization을 수행함으로써 large language models의 pre‑training에서 강력한 경험적 성능을 입증했습니다.
최근 language identification 및 generation에 관한 연구들은 이러한 작업을 달성할 수 있는 엄격한 statistical rates를 확립했습니다. 이러한 연구들은 일반적으로 …
대규모 repositories에서의 software issue resolution은 장기적인 의사결정 과정이다: localization 과정에서 내려진 선택이 가능한 edits의 범위를 형성하고, 실수는…
대규모 audio-language 모델은 점점 더 raw speech inputs를 기반으로 작동하여, voice assistants, education 등과 같은 분야에서 보다 원활한 통합을 가능하게 합니다.
레포지토리 수준 코드 완성은 파일 간 의존성 및 제한된 컨텍스트 윈도우 때문에 대형 언어 모델(LLMs)에게 여전히 어려운 과제입니다. 이전 연구에서는 …
Vision-language 모델은 도메인 쉬프트 하에서 성능 저하가 발생하여 실제 적용 가능성을 제한합니다. 기존 테스트-타임 적응 방법은 computati...
모델 비교와 보정된 불확실성 정량화는 종종 매개변수에 대한 적분을 필요로 하지만, 복잡하고 다중…
Vision-language models (VLMs)은 표준 비디오 이해 벤치마크에서 인상적인 성능을 보여주지만, 단순 추론 작업에서는 체계적으로 실패한다…
우리는 변분 프레임워크를 제안하여 transformer layers를 token embeddings에 작용하는 optimization algorithm의 반복으로 해석합니다. 이 관점에서, self-...
최근 몇 년간, 대형 언어 모델(LLMs)은 정보 검색에서 급속한 진전을 이루었지만, 기존 연구는 주로 텍스트나 정적 멀티...
멀티에이전트 시스템은 전문화를 통해 복잡한 작업을 해결하는 데 가능성을 보여주었지만, 여러 에이전트를 동시에 파인튜닝하는 데는 두 가지 주요 과제가 있다: (...
기존의 멀티모달 대형 언어 모델들은 긴 비디오 이해를 위해 주로 uniform sampling과 single-turn inference에 의존하고 있어, 그 능력을 제한한다…
Language models (LMs)은 토큰 시퀀스를 기반으로 학습되지만, 사용자는 텍스트를 통해 LMs와 상호작용합니다. 이러한 불일치로 인해 partial token problem이 발생합니다, ...
밀집된 픽셀 단위 주석은 의료 이미지 세그멘테이션에서 여전히 골드 스탠다드이지만, 비용이 많이 들고 확장성을 제한합니다. 반면에, 많은 d...
최근 멀티모달 대형 언어 모델(MLLMs)의 의료 진단에 대한 언어적 역량에도 불구하고, 우리는 최첨단 MLLM조차도 중요한 …
대규모 언어 모델(Large Language Models) 기반 Deep search agents는 다단계 검색, 추론, 장기 과제 실행에서 강력한 역량을 입증했습니다.
Chain-of-Thought (CoT)가 Large Language Models (LLMs)의 성능을 크게 향상시키지만, 명시적인 추론 체인은 상당한 계산을 요구한다...
우리는 JobResQA를 소개합니다. 이는 HR‑specific tasks에서 LLMs의 Machine Reading Comprehension (MRC) 능력을 평가하기 위한 multilingual Question Answering 벤치마크입니다.
오픈 소스 소프트웨어(OSS) 지속 가능성은 신입 개발자들이 핵심 기여자로 전환되는 것에 달려 있지만, 이 파이프라인이 끊어져 대부분의 신입 개발자들이 비활성화됩니다.
Software modernisation은 monolithic architectures에서 microservices로의 마이그레이션을 통해 점점 더 중요해지고 있지만, 효과적인 service를 식별하는 것은 …
가상현실(VR) 기술은 다양한 분야에서 몰입형 사용자 경험을 제공하지만, 전통적인 소프트웨어에 비해 고유한 테스트 과제를 제시합니다.
우리는 플랫폼 수준의 parental controls가 미성년자가 사용하는 주류 conversational assistant를 얼마나 효과적으로 조절하는지 평가한다. 우리의 two-phase protocol은 먼저 …
Large Language Models (LLMs)은 Software Engineering 연구와 실무에서 점점 더 중요해지고 있으며, Automated Bug Fixing (ABF)은 그들의 주요 응용 분야 중 하나입니다.