[Paper] 소프트 Quality-Diversity 최적화
Quality-Diversity (QD) 알고리즘은 다양한 고품질 솔루션 집합을 발견하는 데 중점을 둔 최적화 분야를 구성합니다.
4670 posts from this source
Quality-Diversity (QD) 알고리즘은 다양한 고품질 솔루션 집합을 발견하는 데 중점을 둔 최적화 분야를 구성합니다.
대규모 언어 모델(LLMs)이 텐서 병렬성(TP) 및 파이프라인 병렬성(PP)으로 확장되고, 프로덕션 스택이 데이터를 적극적으로 최적화함에 따라 …
동적 시각 콘텐츠에 대한 추론은 멀티모달 대형 언어 모델에게 여전히 핵심 과제이다. 최근의 thinking 모델은 명시적인 reasoning trace를 생성한다.
최근 멀티모달 대형 언어 모델(MLLMs)은 비디오 이해를 크게 발전시켰지만, 대부분은 여전히 “비디오에 대해 생각한다”(즉, 비디오가 인코딩된 후에만 추론을 수행한다) 식이다.
견고한 world model reasoning을 개발하는 것은 대형 언어 모델(LLM) 에이전트가 복잡한 환경에서 계획하고 상호작용하는 데 필수적입니다. 멀티턴 인터랙션…
최근, multi-person video generation이 주목받기 시작했습니다. 몇몇 초기 연구에서는 audio-driven multi-person talking video에 대해 탐구했지만...
최근 large language models (LLMs)의 발전은 수학적 발견에서 획기적인 진전을 가능하게 했으며, 그 예로 폐쇄형 시스템인 AlphaEvolve가 ...
대규모 비전 언어 모델(VLM)은 광범위한 사전 학습을 통해 모달리티 격차를 효과적으로 메우며, 정교한 시각 표현을 획득하고 wi...와 정렬됩니다.
현재 world models는 체계적인 평가를 위한 통합되고 제어된 환경이 부족하여, 그것들이 실제로 근본적인 규칙을 포착하고 있는지를 평가하기 어렵게 만든다.
언어 모델은 최근 몇 년간 고급 벤치마크에서 엄청난 진전을 보였지만, 이러한 진전의 대부분은 더 비용이 많이 드는 모델을 사용함으로써만 가능했습니다.
Deep learning 접근법은 object detection에서 이미지 내 특정 객체 클래스에 대한 신뢰할 수 있는 탐지를 달성했습니다. 그러나 모델의 detection capability를 확장하는 것은…
Inverse heat problems는 관측되거나 알려진 열 확산 거동을 기반으로 재료의 thermophysical properties를 추정하는 것을 말합니다. Inverse heat problems는…
이 논문은 두 층 신경망을 이용한 모듈러 덧셈 학습에서 activation functions의 역할을 연구한다. 우리는 먼저 sharp expressivity gap을 확립한다: si...
오프라인 강화 학습(RL)은 사전 수집된 데이터셋으로부터 에이전트가 최적 정책을 학습하도록 합니다. 그러나, 최적이 아닌 및 단편적인 데이터를 포함하는 데이터셋은...
머신러닝 모델은 진단, 날씨 예측, NLP, 자율 주행 등과 같은 분야에서 좋은 성능을 보이지만, 그들의 제한된 불확실성 처리...
우리는 SuperIntelliAgent를 소개합니다. 이는 학습 가능한 작은 diffusion model(learner)과 고정된 large language model을 결합한 agentic learning framework입니다.
생성적 세계 모델(generative world models)의 최근 발전은 정적 장면 합성(static scene synthesis)에서 시작해 개방형 게임 환경(open-ended game environments)을 만드는 데 있어 눈에 띄는 진전을 가능하게 했습니다, …
최근 텍스트-투-비디오(T2V) 및 이미지-투-비디오(I2V) 모델의 발전으로, 간단한 텍스트만으로도 시각적으로 매력적이고 역동적인 비디오를 생성할 수 있게 되었습니다...
자동화된 취약점 패치는 소프트웨어 보안에 필수적이며, 최근 Large Language Models(LLMs)의 발전은 자동화된 …에 대한 유망한 역량을 보여줍니다.
Underwater object tracking은 wavelength dependent attenuation과 scattering 때문에 어려우며, 이는 깊이와 물 조건에 따라 외관을 크게 왜곡합니다.
우리는 LFM2, 효율적인 온‑디바이스 배포와 강력한 작업 능력을 위해 설계된 Liquid Foundation Models 패밀리를 소개합니다. 하드웨어‑인‑루프 아키텍처를 사용하여…
Split learning은 모델을 분산 디바이스에서 학습시켜 데이터 공유를 피함으로써 데이터 프라이버시 문제를 해결하는 방법으로 잘 알려져 있습니다, 따라서 데이터 공유를 초래하는…
이란의 중소기업(SMEs)은 점점 더 Telegram을 활용하여 판매를 진행하고 있으며, 실시간 참여가 전환에 필수적입니다. 그러나, dev...
Direct Preference Optimization (DPO)은 다양한 분야에서 널리 사용되는 인간 피드백을 통한 강화 학습(RLHF) 방법입니다. 최근 연구는 증가…
우리는 learning-augmented 설정에서, $n$개의 offline 정점과 $n$개의 online 정점을 갖는 random arrival order model에서 online unweighted bipartite matching 문제를 연구한다.
우리는 Hierarchical AI-Meteorologist를 소개합니다. 이는 LLM-agent 시스템으로, 계층적 forecast reasoning과 weather를 활용하여 설명 가능한 weather reports를 생성합니다. ...
멀티모달 이해, 생성 및 재구성 표현을 단일 토크나이저에 통합하는 것은 통합 모델을 구축하는 데 있어 핵심 과제로 남아 있습니다. Previo...
초보 사용자와 전문가 사용자는 task-oriented dialogues에서 서로 다른 체계적인 선호도를 가지고 있습니다. 그러나 이러한 선호도에 맞추는 것이 실제로 사용자 …
현대의 large language models는 multimodal이 되어 텍스트와 이미지와 같은 다양한 데이터 형식을 분석합니다. fine-tuning은 이러한 multimodal을 적응시키는 데 효과적입니다.
Despite recent progress in multilingual speech processing, African languages remain under-represented in both research and deployed systems, particularly when i...
현대 리테일에서는 의류, 식료품, 화장품, 냉동식품 등 다양한 제품이 제공되면서 수요를 예측하기 어렵고, ...
Program synthesis는 입력‑출력 예시와 같은 사양 집합을 따라 컴퓨터 프로그램을 생성하는 과정입니다. It can be modeled a...
Knowledge‑enhanced text generation은 내부 또는 외부 지식 소스를 활용하여 생성된 텍스트의 품질을 향상시키는 것을 목표로 합니다. While language models have...
Gambling disorder는 이해하고 대처하기 어려운 복합적인 행동 중독으로, 신체적, 심리적, 사회적으로 심각한 결과를 초래합니다....
Chart-to-code 생성은 자동화된 데이터 시각화에서 중요한 작업으로, 복잡한 차트 구조를 실행 가능한 프로그램으로 변환합니다. 최근 Multi-m...
이 연구는 “Machines that Can Remember”를 구축하는 도전을 탐구하며, 장기 기억을 효율적인 초장기 컨텍스트 모델링 문제로 정의합니다. W...
대규모 비전-언어 모델(LVLMs)은 객체 탐지를 포함한 시각 정보를 필요로 하는 작업에서 고급 능력을 보여줍니다. 이러한 능력은…
Mutation-based Fault Localization (MBFL)은 자동화된 소프트웨어 디버깅을 위해 널리 연구되어 왔으며, 인공 변이체를 활용하여 결함이 있는 코드 엔티티를 식별합니다.
content‑oblivious 모델은 Censor‑Hillel, Cohen, Gelles, 그리고 Sel이 소개했으며 (PODC 2022; Distributed Computing 2023), 매우 약한 형태의 com…
Federated edge learning (FEEL)은 협업 모델 훈련을 가능하게 하면서 데이터 보존을 ...
현대 클라우드 애플리케이션은 독립적이고 다양한 마이크로서비스 위에 구축되어 확장성, 유연성 및 사용량 기반 청구를 제공합니다. 그러나 구조적 d...
Android 애플리케이션에서 메서드 도달성을 동적으로 해결하는 것은 여전히 중요한 문제이며 대부분 해결되지 않은 상태입니다. GUI 테스트에서 눈에 띄는 진전에도 불구하고 …
Split learning (SL)은 여러 자원 제한이 있는 사용자 장비(UE)에서 주요 컴퓨팅 작업을 베이스 스테이션(BS)으로 오프로드하면서 로컬 데이터를 보존합니다.
Vibe 코딩은 프로그래밍을 위한 AI 기술의 널리 선전되는 활용이지만, 두 가지 압도적인 장애물에 직면해 있습니다: 목표를 명시하는 어려움('prompt engineering'은…).
LLM이 소프트웨어 개발을 재편함에 따라, LLM 기반 실천을 SE 교육에 통합하는 것이 필수가 되었다. 기존 연구들은 LLM의 교육…
고용량 커널 Hopfield 네트워크는 극도의 안정성을 특징으로 하는 ‘Ridge of Optimization’를 나타낸다. 이전에는 ‘Spectral Concentration’과 연결되어 있었지만,…
우리는 Areon을 소개합니다, 지연에 친화적이고 스테이크 가중치가 적용된 다중 제안자(multi‑proposer) proof‑of‑stake 합의 프로토콜 패밀리입니다. 슬롯당 여러 제안자를 허용하고 o...
생물학적 뉴런은 놀라운 지능을 보여줍니다: 내부 상태를 유지하고, 다른 뉴런과 선택적으로 소통하며, 복잡한 그...