[Paper] 고정밀 및 저지연 모델 학습을 위한 Split Federated Learning 아키텍처
우리는 Split Federated Learning (SFL)에서 훈련 손실(따라서 정확도)을 최적화하기 위해 ML 모델 훈련을 위한 네트워크 아키텍처를 찾을 수 있을까요? 그리고 이 ...
4528 posts from this source
우리는 Split Federated Learning (SFL)에서 훈련 손실(따라서 정확도)을 최적화하기 위해 ML 모델 훈련을 위한 네트워크 아키텍처를 찾을 수 있을까요? 그리고 이 ...
우리는 구조적 인과 병목 모델(SCBMs)을 소개한다, 이는 새로운 유형의 구조적 인과 모델이다. SCBMs의 핵심에는 causal effect에 대한 가정이 있다.
Maximum marginal likelihood estimation (MMLE)은 자유 에너지 함수형의 최적화로 공식화될 수 있다. 이러한 관점에서, Expectation‑Maximisation…
우리는 혼합 오디오 스트림으로부터 두 명의 상호작용하는, 같은 위치에 있는 참가자들의 완전한 3D facial animations을 생성하는 어려운 과제에 도전합니다. 기존에 …
최근 3D Gaussian Splatting (3DGS)의 발전은 reconstruction fidelity와 computational efficiency의 균형에 초점을 맞추게 되었다. 본 연구에서는...
우리는 OfficeQA Pro를 소개합니다. 이는 대규모이면서 이질적인 문서 코퍼스에 대한 근거가 있는 다문서 추론을 수행하는 AI 에이전트를 평가하기 위한 benchmark입니다. 코퍼스...
최근 통합 멀티모달 모델(UMMs)의 발전은 텍스트-이미지(T2I) 생성에 크게 기여했으며, 특히 Chai의 통합을 통해…
템플릿이 없는 애니메이션 가능한 헤드 아바타는 피사체의 캡처에서 직접 표현 의존적인 얼굴 변형을 학습함으로써 높은 시각적 충실도를 달성할 수 있습니다, av...
AI 에이전트는 지난 1년 동안 소프트웨어 엔지니어링에 놀라울 정도로 능숙해졌으며, 이는 주로 추론 능력의 향상 덕분입니다. 이는 d...
open-world visual recognition에서 신뢰성을 보장하려면 모델이 interpretable하고, fair하며, distribution shifts에 robust해야 합니다. 그러나 현대 vision sys...
Streaming video understanding은 종종 시간에 민감한 시나리오를 포함하고, 모델은 지원 시각 증거가 나타나는 정확한 시점을 답해야 합니다: 답변…
대규모 언어 모델을 코드 생성에 적용하는 것은 일회성 생성에서 반복적 정제로 진화했지만, 보안의 진화는 ...
Large language models (LLMs)은 종교 지식 질문에 유창하게 답변할 수 있지만, 종종 환각을 일으키고 출처를 잘못 인용하는데, 이는 특히 …
최적화 알고리즘을 선택하려면 문제 인스턴스 전반에 걸쳐 후보들을 비교해야 하지만, 배포 시의 계산 예산은 종종 벤치마크 단계에서 알 수 없습니다.
이 보고서는 코펜하겐에서 열린 ALICE 2026 워크숍에서 우리 그룹(SymBa)의 작업을 문서화한 것입니다. Nils Aall Barricelli의 선구적인 연구에 영감을 받아…
attention mechanism의 이차 복잡도와 Key-Value (KV) cache의 상당한 메모리 footprint는 심각한 계산 및 메모리 문제를 야기합니다…
구조화된 시퀀스 정보가 신경 시스템에서 어떻게 표현되고 일반화될 수 있는지를 이해하는 것은 음향 입력에서 …로의 전이를 모델링하는 데 핵심이다.
중환자실(ICU)에서 정확하고 해석 가능한 사망 위험 예측은 전자 의료 기록의 불규칙한 시간적 구조 때문에 여전히 중요한 과제입니다.
다중 선택 배낭 문제(MCKP)는 널리 실용적인 응용 분야를 가진 고전적인 조합 최적화 문제입니다. 이 논문은 중요한 …
Agile 조직은 빠르고 고품질의 소프트웨어 제공을 지속하기 위해 자동 회귀 테스트에 점점 더 의존하고 있습니다. 그러나 시스템이 성장하고 요구사항이…
Data replication은 데이터 센터 설계에서 중요한 측면으로, high availability, scalability, fault tolerance를 보장합니다. 그러나 replicas는 …
고속철도(HSR) 시스템에서 연합 학습(FL)은 원시 데이터를 공유하지 않고 부서 간 흐름 예측을 가능하게 합니다. 그러나 기존 방식은 ...
Post-quantum 서명 체계는 블록체인 트랜잭션 검증에 직접 적용될 때 킬로바이트 규모의 authorization artifacts를 도입합니다. 널리 고려되는 ...
Vision Language Action (VLA) 모델은 구현 지능에서 주류이지만 높은 추론 비용에 직면합니다. Edge-Cloud Collaborative (ECC) 추론은 ef...
Large language models (LLMs)은 소프트웨어 엔지니어링 분야를 변화시켰습니다. 최근에는 실제 세계의 문제들을 해결하기 위해 수많은 LLM-based agents가 개발되었습니다.
오픈소스 소프트웨어는 상업용 애플리케이션에서 널리 사용됩니다. 새로운 문제에 대해 오픈소스 소프트웨어를 선택할 때, 개발자들은…
효율적인 LLM 추론 스케줄링은 사용자 경험에 매우 중요합니다. 그러나 LLM 추론은 놀라운 수요 불확실성을 보이며(출력 길이가 사전에 알려지지 않음…)
Internet of Things (IoT) 데이터를 비즈니스 프로세스 이벤트 로그와 통합하는 것은 IoT 강화 프로세스를 분석하는 데 필수적이지만, 차이점 때문에 여전히 어려운 과제입니다.
AI 기술의 광범위한 통합은 공정성 및 편향에 대한 우려를 더욱 고조시켰으며, 이러한 시스템은 종종 …을 통해 사회적 불평등을 지속시킨다.
안전이 중요한 교통 환경에서 Human-vehicle interaction은 점점 neural sensing을 통합하여 user intent와 cognitive state를 추론하지만, 대부분의 ...
Adaptive Large Neighborhood Search (ALNS)는 생산 및 물류 최적화를 위한 대표적인 메타휴리스틱이며 널리 채택되는 접근법이다. 그러나, …
Multimodal Large Language Models (MLLM) 분류 성능은 평가 프로토콜과 ground truth 품질에 크게 의존합니다. MLLM을 비교하는 연구는 w...
최근 멀티모달 대형 언어 모델(MLLMs)은 인상적인 발전을 이루었지만, 이들은 주로 기존의 자동회귀(autoregressive) 아키텍처를 기반으로 사용하고 있다.
Incremental Few-Shot (IFS) segmentation은 소수의 주석만으로 시간에 따라 새로운 카테고리를 학습하는 것을 목표로 합니다. 2D에서 널리 연구되었지만, 아직 충분히 활용되지…
외과 의사는 단순히 보는 것이 아니라 해석한다. 전문가가 수술 현장을 관찰할 때, 그들은 사용되는 instrument가 무엇인지뿐만 아니라 왜 선택되었는지도 이해한다.
Vision Language Model (VLM) 개발은 주로 모델 크기 확대에 의존해 왔으며, 이는 컴퓨팅 자원이 제한된 모바일 및 엣지 디바이스에 배포하는 것을 방해합니다. such a...
계층적 시계열 예측은 다양한 산업 분야에서 수요 예측에 필수적입니다. 머신러닝 모델이 상당한 정확도를 얻었지만…
이 논문은 정치적 담론에서 모호성 및 회피 기법을 분류하는 SemEval 2026의 공유 과제인 CLARITY에 대한 KCLarity 팀의 참여를 설명한다.
Just-in-time (JIT) 컴파일러는 관리형 런타임을 갖는 많은 인기 프로그래밍 언어(예: Java 및 JavaScript)의 핵심 구성 요소입니다. JIT 컴파일러는 ...
우리는 LiveSense를 소개한다 – 상용 기성품(COTS) Wi‑Fi Network Interface Card(NIC)를 노트북에 장착하여 센티미터 수준으로 변환하는 크로스‑플랫폼이다.
차세대 자율주행 차량(AV)은 실시간 의사결정을 지원하기 위해 대량의 다중소스 및 다중모달(M^2) 데이터를 활용한다. 실제로, 데이터...
우리는 볼륨 메쉬 상에서 데이터 기반 연부 조직 시뮬레이션을 위한 다중해상도 게이트 트랜스포머인 SurgFormer를 소개한다. 고충실도 생체역학 솔버는 …
Conversational generative AI는 빠르게 의료 분야에 진입하고 있으며, 여기서 general‑purpose models는 이질적인 patient signals를 통합하고 다양한 inter…
부정은 기본적인 언어 연산자이지만, diffusion-based generative systems에서는 충분히 모델링되지 못하고 있다. 본 연구에서는 형식적인 접근을 제시한다.
확산 모델은 시각 콘텐츠 생성에 혁신을 가져왔지만, 그 빠른 채택은 취약점 조사에 대한 중요한 필요성을 강조하고 있다, 예를 들어…
Concept learning은 description logics에 기반한 지식 베이스에서 작동하는 감독 기계 학습(supervised machine learning)의 한 형태입니다. State-of-the-art concept learners는 종종 o…
자동 음성 인식(ASR)은 사전 학습된 음성 및 언어 모델의 발전으로 혜택을 받았지만, 대부분의 시스템은 여전히 단일 언어 환경에 제한되어 있다.
우리는 NOBLE (Nonlinear lOw-rank Branch for Linear Enhancement)을 소개합니다. 이는 transformer linear에 비선형 저랭크 브랜치를 추가하는 아키텍처 확장입니다.