[Paper] TEG: Non-Equilibrium Thermodynamics와 Langevin Dynamics를 통한 엑사스케일 클러스터 거버넌스
클라우드 컴퓨팅이 엑사스케일(10^5+ 노드) 수준으로 확장됨에 따라, 기존의 ‘뉴턴식’ 오케스트레이션 패러다임—예를 들어 Kubernetes—이…
4530 posts from this source
클라우드 컴퓨팅이 엑사스케일(10^5+ 노드) 수준으로 확장됨에 따라, 기존의 ‘뉴턴식’ 오케스트레이션 패러다임—예를 들어 Kubernetes—이…
복잡하고 실험 중심의 분야에서 과학적 발견을 자동화하려면 프로그램의 반복적인 변형만으로는 충분하지 않으며, 구조화된 hypothesis management가 필요합니다.
Quality-Diversity (QD) 알고리즘은 행동 니치 전반에 걸쳐 다양하고 높은 성능을 보이는 솔루션을 발견하는 것을 목표로 합니다. 그러나 QD 탐색은 종종 점진적인…
소규모 섬 개발도상국(SIDS)은 기후 구동 재해에 불균형적으로 노출되어 있지만, 종종 파손될 때 실패하는 취약한 육상 네트워크에 의존합니다…
Federated low-rank adaptation (FedLoRA)는 다운스트림 작업을 위한 foundation models의 communication‑efficient하고 privacy‑preserving한 fine‑tuning을 촉진했습니다. In...
인간의 videos를 보면서 manipulation skills를 학습하는 능력은 robot learning을 위한 매우 확장 가능한 새로운 데이터 소스를 열 수 있는 잠재력을 가지고 있다. 여기서,…
인쇄된 영어의 엔트로피 속도는 유명하게도 문자당 약 1비트로 추정되며, 이는 현대 대형 언어 모델(LLMs)이 아직 겨우 받아들인 기준이다...
효과적이고 일반화 가능한 제어는 비디오 생성에서 여전히 중대한 과제이다. 많은 방법이 모호하거나 작업 특화된 신호에 의존하고 있지만, 우리는 주장한다...
효과적인 수자원 관리는 수로 흐름에 대한 정확한 예측에 달려 있습니다. 예측된 기후 데이터에 대해서는 서로 다른 General Circulation을 사용하는 것이…
OMD와 그 변형들은 OCO를 위한 유연한 프레임워크를 제공하며, 성능은 mirror map의 선택에 결정적으로 의존합니다. 기본이 되는 기하학은 …
단일(모노큘러) 카메라와 인공지능을 사용하여 Upper Extremity Reachable Workspace (UERW)를 정량화하는 임상적으로 접근 가능한 방법을 검증하기 위해.
Partial differential equations은 종종 직접 측정하기 어렵거나 불가능한 미지의 함수를 포함하고 있어, 예측을 도출하는 우리의 능력을 방해합니다.
Long-sequence streaming 3D reconstruction은 여전히 중요한 미해결 과제이다. 기존의 autoregressive models는 긴 시퀀스를 처리할 때 종종 실패한다. They t...
Software source code는 종종 ‘hotspots’를 포함합니다: 프로젝트의 나머지 부분보다 훨씬 자주 변경되는 코드의 작은 부분으로, 따라서 maintenance를 집중시킵니다.
얼굴 인식(FR) 시스템이 발전함에 따라, 프라이버시 보호 얼굴 인식(PPFR) 시스템은 정확한 인식으로 인기를 얻고 있습니다,…
이 논문은 클리어런스 하에서 Optimal Control과 Fuzzy Rule Based System (FRBS)을 통합한 하이브리드 장애물 회피 아키텍처를 제시하여 ada…
빠르게 진화하는 사이버 공격은 변화하는 위협에 자율적으로 학습하고 적응할 수 있는 인시던트 대응 시스템을 요구한다. 이전 연구에서는 이를 광범위하게 탐구하였다…
신경망, 특히 메시지 패싱 뉴럴 네트워크(MPNNs)를 사용하여 어려운 조합 최적화 문제를 해결하려는 관심이 커지고 있다.
대형 언어 모델(LLM) 언러닝은 훈련된 모델에서 특정 지식을 제거하는 것을 목표로 하지만, 실제 배포에서는 종종 사후 훈련 양자화를 필요로 한다.
언어 식별(LID)은 웹 데이터에서 고품질 다국어 데이터셋을 구축하는 데 필수적인 단계입니다. 기존 LID 도구(예: OpenLID 또는 GlotLID)…
템플릿-프리 레트로합성 방법은 작업을 블랙박스 시퀀스 생성으로 간주하여 학습 효율성을 제한하고, 반면 세미-템플릿 접근법은 경직된…
Binary Neural Networks (BNNs)는 가중치를 제한함으로써 전통적인 풀프리시전 신경망에 비해 낮은 복잡도와 에너지 효율성을 제공하는 대안이다.
대규모 언어 모델(LLMs)은 비용이 많이 드는 인간 선호 라벨을 대체하기 위해 쌍별 평가에서 판사 역할을 점점 더 많이 사용되고 있습니다. 실용성에도 불구하고, LLM j...
최근 몇 년간, neural architectures가 discrete algorithms를 실행하는 학습 능력을 이해하려는 관심이 증가하고 있으며, 이는 종종 ...
NLP를 사용하여 실제 학습자 언어를 분석하면 자동화된 평가 및 피드백 도구를 구축하는 데 도움이 됩니다. 또한 개발에 대한 새롭고 광범위한 통찰을 제공합니다.
이미지와 비디오에서 이상을 감지하는 것은 산업 검사, computer-assisted diagnosis 등 여러 실제 문제에 필수적인 작업입니다.
진정한 풀뿌리 활동과 자동화된 인플루언스 작전 사이의 구분이 무너지고 있다. 정책 논의가 bot farms에 초점을 맞추는 동안, 별개의 위협이…
Memory-efficient backpropagation (MeBP)은 1GB 미만의 메모리로 모바일 디바이스에서 대규모 언어 모델(LLMs)의 1차 미세조정을 가능하게 했습니다. 그러나...
작업 기반 챗봇은 일반적으로 실제 애플리케이션에 내장된 소프트웨어로, 대화형 인터페이스를 통해 사용자가 작업을 완료하도록 돕습니다. As ch...
이 논문은 Spectral-Interpretable and -Enhanced Transformer (SIEFormer)라는 새로운 접근법을 제시하며, 스펙트럴 분석을 활용하여 어텐션을 재해석합니다.
본 논문에서는 다양한 bio-inspired 모델들의 구조적 및 기능적 차이를 보다 잘 이해하기 위해 통합 프레임워크를 제시합니다. 우리는 liq...
Jhana advanced concentration absorption meditation (ACAM-J)는 의식과 인지 처리에 깊은 변화를 일으키며, 이들의 연구를 …
대형 언어 모델(LLMs)이 어떻게 그리고 왜 실패하는지를 이해하는 것이 모델이 빠르게 진화하고 정적 평가가 뒤처지는 상황에서 핵심 과제가 되고 있다. While a...
코드 불안정성을 유발하는 요인을 이해하는 것은 효과적인 소프트웨어 유지보수에 필수적이며, 불안정한 클래스는 더 크거나 더 빈번한 편집이 필요하고 증가...
자율주행 기술이 광범위한 채택을 향해 발전함에 따라, 다양한 환경 조건에서 안전한 운영 임계값을 결정하는 것이 중요해지고 있다.
모바일 애플리케이션(app) 기능이 점점 복잡해지고 반복 주기가 가속화됨에 따라, 높은 신뢰성을 보장하는 것은 큰 과제가 됩니다.
설명 가능한 AI (XAI) 연구 커뮤니티는 수많은 기술적 방법을 제안했지만, 설명 가능성을 시스템으로 배포하는 것은 여전히 어려운 과제입니다: Interactive ex...
이 논문은 통합 모델링 언어(UML)를 사용하여 비즈니스 모델 캔버스(BMC)의 메타모델을 소개하고, 전용 도메인 특화 모델링을 함께 제시한다.
Homomorphic encryption (HE)는 암호화된 데이터에 대한 연산을 가능하게 하여 기밀 클라우드 컴퓨팅을 위한 유망한 기술입니다. 그러나 HE는 계산적으로 …
범용 로봇에 대한 오랜 비전은 자연어 지시를 이해하고 실행하는 능력에 달려 있습니다. Vision-Language-Action (VLA...
Visual illusions은 전통적으로 multi-view consistency와 같은 spatial manipulations에 의존합니다. 이번 연구에서는 새로운 Progressive Semantic Illusions, a novel …
통합 모델은 단일 아키텍처 내에서 멀티모달 이해와 생성을 모두 처리할 수 있지만, 일반적으로 반복 없이 단일 패스로 작동합니다…
Context distillation은 언어 모델이 인-컨텍스트 지식을 파라미터에 내재화하도록 합니다. 우리 연구에서는 On-Policy Context Distillation을 제안합니다 (...).
Diffusion Transformers를 이용한 실시간 비디오 생성은 3D self-attention의 2차 비용 때문에 병목 현상이 발생하며, 특히 실시간 환경에서…
Self-supervised learning (SSL)은 라벨이 없는 시계열 데이터로부터 학습하기 위한 강력한 패러다임이다. 그러나 masked autoencoders (MAEs)와 같은 인기 있는 방법들은 …
Diffusion large language models (DLLMs)은 여러 토큰을 병렬로 디코딩함으로써 빠른 텍스트 생성을 가능하게 할 잠재력을 가지고 있습니다. 그러나 실제로는, 그들의 i...
관찰된 현상을 상징적이고 해석 가능한 공식으로 설명하는 것은 과학의 근본적인 목표이다. 최근 대형 언어 모델(LLMs)이 등장했다.
우리는 등거리 군 작용에 수직인 방향으로 투사된 잡음이 포함된 Langevin dynamics를 연구한다. 이 수학적 모델은 새로운 통찰을 제공하기 위해 도입되었다.