[Paper] 확장 가능한 Explainability-as-a-Service (XaaS) for Edge AI 시스템
Explainable AI (XAI)가 상당한 발전을 이루었음에도 불구하고, 엣지 및 IoT 시스템에의 포함은 일반적으로 ad‑hoc하고 비효율적이다. 대부분의 현재 방법은 a...
4538 posts from this source
Explainable AI (XAI)가 상당한 발전을 이루었음에도 불구하고, 엣지 및 IoT 시스템에의 포함은 일반적으로 ad‑hoc하고 비효율적이다. 대부분의 현재 방법은 a...
우리는 관계(예: part‑whole)가 운영 및 학습 규칙을 갖는 아키텍처를 통해 직접적으로 표현되는 간단한 초기 작동 시스템을 소개한다.
본 연구에서는 commutativity-aware, linearizable 구현의 공유 객체에 대한 진행 조건을 연구한다. 교환 가능한 …
우리는 루프된 추론의 형식화된 모델에서, 계산 그래프가 완전한 …인 불리언 회로에 의해 제공되는 추론 탐지기의 통계적 거동을 연구한다.
Principal Component Analysis (PCA)는 강력하고 널리 사용되는 차원 축소 기법입니다. 그러나 그 선형적 특성 때문에 종종 …
Event 카메라는 많은 상황에서 RGB 카메라에 대한 상당한 대안을 제공합니다. 최근에 event 기반 novel-view synthesis에 관한 연구가 있지만, dense 3D mesh…
우리는 pretrained models에 대한 continual learning 방법을 개발했으며, old‑task data에 접근할 필요가 없고, foundation model adaptation에서 실용적인 장벽을 해결합니다.
Parallel thinking은 추론을 위한 유망한 패러다임으로 부상했지만, 상당한 계산 부담을 초래합니다. 기존 효율성 방법들은 주로 …
효과적인 quantum circuits 설계는 quantum computing에서 여전히 핵심적인 과제로 남아 있으며, circuit structure가 expressivity, trainability, 그리고 …에 강하게 영향을 미칩니다.
강화 학습(RL)은 사후 학습 대형 언어 모델(LLM)의 핵심 요소입니다. 그러나 대역폭이 제한된 분산 RL에서는 확장성…
프리프로덕션 단계에서 영화 제작자와 3D 애니메이션 전문가들은 전체 규모 제작에 들어가기 전에 영화의 가능성을 탐색하기 위해 아이디어를 신속하게 프로토타입해야 하지만, 기존의...
고품질 scientific illustrations는 복잡한 과학 및 기술 개념을 효과적으로 전달하는 데 필수적이지만, 그 수동 제작은 여전히 …
Diffusion 기반 편집 모델은 의미론적 이미지 및 비디오 조작을 위한 강력한 도구로 부상했습니다. 그러나 기존 모델은 부드럽게…
인간 개입은 테스트 중 자율 시스템에서 흔히 데이터의 출처가 됩니다. 이러한 개입은 현재 정책이 어디에서 문제가 있는지를 나타내는 중요한 신호를 제공합니다.
생물학적 형태학의 진화는 자연 세계의 다양성을 이해하는 데 핵심적이지만, 전통적인 분석은 종종 주관적인 편향을 포함한다.
우리는 조건부 치료 효과 추정 및 정책 학습을 위한 새로운 선호 기반 프레임워크를 소개합니다. 이 프레임워크는 Conditional Preference‑based Treatment…
밈 기반 사회적 학대 탐지는 해로운 의도가 종종 암묵적인 문화 상징성과 미묘한 교차 모달 불일치에 의존하기 때문에 어려운 과제이다. 이전에 …
우리는 SymPlex를 제안한다. 이는 부분 미분 방정식(PDEs)의 분석적 기호 해를 발견하기 위한 강화 학습 프레임워크이며, 접근 없이도 가능하다.
멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)은 거대한 모델 크기와 시각 토큰 수와 관련된 심각한 학습 비효율성 문제를 겪고 있다.
추론 대형 언어 모델(LLMs)은 테스트 시 스케일링을 가능하게 하며, 토큰 예산이 증가함에 따라 데이터셋 수준 정확도가 향상되어 적응형 추론을 촉진합니다.
자동회귀 이미지 생성에서 주요 과제는 상호 의존성을 모델링하면서도 독립적인 위치들을 병렬적으로 효율적으로 샘플링하는 것입니다.
그래프 신경망(GNN)에서 불균형 노드 분류는 일부 라벨이 다른 라벨에 비해 훨씬 많이 나타날 때 발생하며, 이는 모델이 불공정하게 학습하도록 만든다.
최근에는 실제 과제에 강화 학습(RL)을 적용해 대형 언어 모델(LLMs)을 훈련시키는 연구에 큰 관심이 집중되고 있습니다, 예를 들어 …
현대의 distributed optimization 방법은 비동기 최적화에서 상당한 최근 진전에도 불구하고 대부분 전통적인 synchronous 접근 방식에 의존합니다. 우리는 ...
비전문가 사용자가 복잡한 인터랙티브 웹사이트를 개발하도록 돕는 것은 LLM‑powered code agents에게 인기 있는 작업이 되었습니다. 그러나 기존 code agents는 …
Prompt injection attacks는 웹 페이지 콘텐츠를 조작하여 web agents가 사용자가 의도한 작업이 아니라 공격자가 지정한 작업을 수행하도록 합니다. Existing method...
Long-context inference with Large Language Models (LLMs)는 quadratic attention과 증가하는 key-value caches 때문에 비용이 많이 들며, 이는 context compression을 필요하게 합니다. In t...
프로그래밍 언어의 개발은 복잡한 이론적 및 실용적 과제를 수반하며, 특히 modularity와 reusability를 다룰 때 …
인간 시각은 foveated 구조를 가지고 있으며, 해상도가 가변적으로 큰 시야의 중심에서 최고에 달한다; 이는 능동적 감지를 위한 효율적인 절충을 반영한다, allo...
TensorFlow와 Pytorch와 같은 Deep Learning(DL) 라이브러리는 machine learning(ML) 모델 개발을 단순화하지만 복잡한 설계 때문에 버그가 발생하기 쉽습니다. Bug...
우리는 가속 노이즈 파워 메서드(Accelerated Noisy Power Method)를 분석한다. 이 알고리즘은 주성분 분석(Principal Component Analysis)을 수행하는데, 여기서는 정확하지 않은 행렬-벡터 곱(matrix-vector products)만 이용할 수 있는 상황을 가정한다.
Equilibrium Propagation (EP)은 물리학에서 영감을 받은 학습 알고리즘으로, 동적 시스템의 정상 상태를 추론과 학습 모두에 사용합니다. 그것의 ...
AI-enabled systems는 동적 워크로드, 리소스 요구사항, 모델 드리프트 등 다양한 유형의 런타임 불확실성에 노출됩니다. 이러한 불확실성…
맥락: 코드 커버리지는 소프트웨어 품질 보증 측정으로 널리 사용됩니다. 그러나 그 효과와 특히 권장되는 양은 양쪽 모두에서 논쟁이 있습니다.
테스트 주도 개발(TDD)은 테스트를 실행 가능한 사양으로 활용하여 대형 언어 모델(LLM) 기반 코드 생성을 개선하기 위해 채택되었습니다. 그러나,…
Flaky tests는 동일한 버전의 소스 코드를 여러 번 실행할 때마다 다른 결과를 나타냅니다. 따라서 이들은 품질에 대한 모호한 신호를 제공합니다.
비동기 파이프라인 병렬성은 동기 실행에 내재된 파이프라인 버블을 제거함으로써 하드웨어 활용도를 극대화하며, e...에 대한 경로를 제공한다.
Mixture of Experts (MoE) 아키텍처는 계산량이 비례적으로 증가하지 않으면서 LLM의 용량을 크게 향상시키지만, 방대한 파라미터…
Agreement는 분산 컴퓨팅에서 기본적인 문제로, 40년 이상에 걸쳐 광범위하게 연구되어 왔습니다. 최근에 Meir, Mirault, Peleg 및 Robins…
블록체인 검증자들은 멀티코어 CPU를 활용하여 블록 처리 시간을 줄일 수 있지만, 결정적 실행은 주어진 전체 순서를 유지하면서 ...
Decentralized learning (DL)은 중앙 조정 없이 노드 집합이 협업적으로 모델을 학습할 수 있게 하여 프라이버시와 확장성 측면에서 이점을 제공합니다....
이 논문은 많은 네트워크 및 분산 시스템에서 발생하는 중요한 rate allocation 문제를 연구한다: steady-state traffic rate allocation from multipl...
Distributed Stream Processing Systems (DSPSs)는 ByteDance에서 실시간 처리 및 분석의 핵심을 이루며, Apache Flink가 가장 큰 … 중 하나를 구동합니다.
대규모 언어 모델(LLM) 기반 알고리즘 발견은 프로그램을 대상으로 하는 반복적인 블랙박스 최적화 과정으로, 목표 작업을 근사적으로 해결하기 위해…
동적 task graphs 스케줄링은 이전 작업 할당을 재검토하지 않고 다루어지는 경우가 많으며, 주된 초점은 makespan 최소화에 있습니다. 우리는 제어된…
Advanced Persistent Threats (APTs)는 정교하고 장기적인 사이버 공격으로, 은밀하게 작동하고 종종 n...에 섞여 들어가 탐지하기 어렵습니다.
매우 불균형한 데이터셋에서 희귀하고 다양한 이상 현상을 탐지하는 것은—예를 들어 사이버 보안 분야의 Advanced Persistent Threats (APTs)—여전히 근본적인 과제이다.
직접 정렬 방법은 대형 언어 모델(LLMs)을 인간 선호와 맞추는 데 점점 더 많이 사용되고 있습니다. 그러나 많은 실제 정렬 문제는…