[Paper] ERA: 에포크 기반 중재를 통한 그룹 관리 CRDT에서의 경쟁 관리자
Conflict-Free Replicated Data Types (CRDTs)는 강력한 최종 일관성을 보장하는 조정 없는 복제로 인해 다양한 분야에서 사용됩니다. By prioritis...
Conflict-Free Replicated Data Types (CRDTs)는 강력한 최종 일관성을 보장하는 조정 없는 복제로 인해 다양한 분야에서 사용됩니다. By prioritis...
딥러닝 모델의 성능은 효율적인 커널 구현에 크게 좌우되지만, 특수 가속기에 대한 고성능 커널을 개발하는 것은 ...
Early-exit neural networks는 충분한 confidence가 달성될 때 intermediate predictions를 허용함으로써 inference latency를 줄이는 데 인기를 얻고 있습니다. Howev...
Batch inference는 agentic workloads에 대해 GPU key-value (KV) cache를 지속적이고 누적적으로 압박하여, 종종 심각한 throughput 저하를 일으킵니다.
현실 세계의 최적화 문제는 비용이 많이 드는 평가 문제와 복잡한 제약조건 등 최적화 알고리즘에 상당한 도전을 제시합니다.
대규모 언어 모델의 급속한 성장으로 인해 조직들은 종종 여러 공급업체의 GPU를 사용하여 GPU 클러스터를 확장하고 있습니다. 그러나 현재의 딥…
Dynamic Optimization Problems (DOPs)는 복잡한 특성, 즉 동적 환경 변화 때문에 해결하기 어렵습니다. Evolutionary Computation 방법…
다당사자 다목적 최적화 문제에서는 솔루션 집합을 일반적으로 클래식 성능 지표를 사용하여 평가하고, 의사결정자(DM)들에 걸쳐 집계합니다. 그러나, ...
AI/ML 데이터 센터 성장으로 인해 에너지 소비와 탄소 배출이 증가했습니다. 재생 에너지로의 전환과 증가하는 데이터 센터 에너지 수요는 ...
Data 및 pipeline parallelism은 분산 장치에서 신경망 훈련을 확장하기 위한 핵심 전략이지만, 높은 통신 비용 때문에 ...
대규모 언어 모델(LLM) 서빙 시스템은 근본적으로 취약한 상태를 유지하고 있으며, 하이퍼스케일 클러스터에서 빈번한 하드웨어 결함이 서비스에 불균형적인 영향을 초래합니다...
Multi-stage ML inference pipelines는 이기종 리소스, 단계 간 결합, 그리고 동적 병목 현상 마이그레이션 때문에 자동 확장이 어렵습니다. 우리는 제시합니다…
증명 가능한 올바른 분산 프로토콜은 현대 분산 시스템의 핵심 구성 요소이며, 설계가 매우 어렵고 종종 d...
Gradient-free black-box optimization (BBO)은 엔지니어링 설계에서 널리 사용되며, 토폴로지 최적화 (TO)를 위한 유연한 프레임워크를 제공하여 d...
사이버 보안 운영은 민감한 데이터를 노출하지 않으면서 다양한 워크플로를 지원하는 어시스턴트 LLM을 필요로 합니다. 기존 솔루션은 독점 API에 의존하거나…
현대 diffusion/flow 기반 이미지 생성 모델은 일반적으로 두 가지 핵심 특성을 보인다: (i) 다단계 샘플링을 사용하고, (ii) 잠재…
공개 저장소에는 수백만 개의 fine-tuned models가 호스팅되고 있지만, 커뮤니티 사용은 여전히 소수의 foundation checkpoints에 불균형적으로 집중되어 있습니다....
Agentic Reinforcement Learning (Agentic RL)은 에이전트가 복잡한 추론과 도구 사용을 수행하도록 하는 데 눈에 띄는 성공을 거두었습니다. 그러나 대부분의 방법은 아직...
우리는 UEval이라는 벤치마크를 도입합니다. 이는 이미지와 텍스트를 모두 생성할 수 있는 통합 모델을 평가하기 위한 것입니다. UEval은 1,000개의 전문가가 선정한 질문으로 구성됩니다.
동적 객체를 조작하는 것은 Vision-Language-Action (VLA) 모델에게 여전히 해결되지 않은 과제이며, 정적 조작에서 강력한 일반화 능력을 보임에도 불구하고, str...
Neural networks는 일반적으로 그래픽 처리 장치(GPUs) 대신 중앙 처리 장치(CPUs)를 사용하는 다양한 자원 제한 엣지 디바이스에 성공적으로 적용되었습니다.
대형 비전-언어 모델(VLMs)은 원본 이미지에서 고전적인 시각 착시 현상에 대해 ‘정확하게’ 답변하는 경우가 많지만, 착시 현상의 사실이...
대규모 언어 모델(LLMs)과 강화 학습(RL)으로 구동되는 자율 웹 에이전트의 개발은 일반…
제한된 감독 학습 데이터 때문에, 대규모 언어 모델(LLMs)은 일반적으로 자체 감독 “다음 단어 예측” 목표를 사용하여 vas...