[Paper] Over-the-Air Federated Learning에서 시기적절한 파라미터 업데이트
연합 학습(FL)의 모델 훈련 과정에 over-the-air computations(OAC)를 도입하는 것은 통신 부담을 완화하는 효과적인 접근 방식이다.
연합 학습(FL)의 모델 훈련 과정에 over-the-air computations(OAC)를 도입하는 것은 통신 부담을 완화하는 효과적인 접근 방식이다.
대형 언어 모델(LLMs)의 발전은 소프트웨어 개발 및 프로그래밍 지원에 유망한 영향을 보여주고 있습니다. 그러나 이러한 모델은 …
Automated front-end engineering은 개발 주기를 크게 단축하고 수동 코딩 오버헤드를 최소화합니다. Generative AI가 번역에서 가능성을 보여주었지만…
다가오는 프로젝트 반복(sprint) 계획은 Scrum 계획의 핵심 활동 중 하나입니다. 이 논문에서는 우리가 탐구하고 있는 진행 중인 작업을 제시합니다.
동적 다중모달 다목적 최적화는 동시에 여러 동등한 파레토 최적 집합을 추적하고 po...
Large Language Models (LLMs)은 복잡한 다중 턴 상호작용 프로토콜을 실행하지만, 설계자 의도에 대한 실행을 검증할 공식 사양이 부족합니다. We int...
Catastrophic forgetting은 지속적 학습에서 근본적인 도전 과제를 제시하며, 특히 모델이 배포 효율성을 위해 quantized될 때 더욱 그렇다. 우리는 체계적으로…
Vision-Language-Action (VLA) 모델은 시각과 언어를 구현된 제어와 정렬하지만, 텍스트에만 의존할 경우 객체 지시 능력이 제한됩니다.
Differential privacy (DP)는 추천 시스템에서 사용자 데이터를 보호하기 위한 gold standard로 부상했지만, 기존의 privacy‑preserving 메커니즘은 …
생성 모델에서의 artistic style transfer는 여전히 중요한 도전 과제이며, 기존 방법들은 종종 모델 파인튜닝이나 추가적인 …
이 작업은 새로운 비선형 최적 필터인 Ensemble Schr{ö}dinger Bridge 비선형 필터를 제시한다. 제안된 필터는 sta의 결합을 찾는다.
분리된 데이터셋에 대한 학습은 두 가지 주요 목표를 달성할 수 있습니다: 데이터 처리 가속화와 연합 학습(federated learning) 활성화. 이미 Ko…
컴퓨팅이 cloud에서 edge로 이동하여 processing latency와 network traffic을 줄이면, 그 결과인 Computing Continuum (CC)은 동적인 환경을 만든다.
멀티모달 대형 언어 모델(MLLMs)은 시각적 및 텍스트 표현을 결합하여 풍부한 추론 능력을 가능하게 합니다. 그러나 높은 계산 비용…
수년 동안 자동 MT 메트릭은 벤치마크를 꾸준히 올려왔으며 인간 평가와 강력하고 때로는 인간 수준의 일치를 보여주었습니다. 그러나 그들은 여전히 bl...
우리는 Gabliteration을 소개한다. 이는 기존의 abliteration 방법을 넘어서는 새로운 neural weight modification 기법으로, 적응형 다중 방향…
Vocabulary-free fine-grained image recognition은 고정된 인간 정의 레이블 세트 없이 메타 클래스 내에서 시각적으로 유사한 카테고리를 구별하는 것을 목표로 합니다. Exi...
High-performance computing (HPC) 워크로드는 점점 더 다양해지고 있으며 작업 특성에 큰 변동성을 보이고 있지만, cluster scheduling은 …
Deep neural networks는 종종 shortcuts을 이용한다. 이러한 shortcuts은 training data에서 output labels와 연관되어 있지만 task semantics와는 무관한 spurious cues이다.
고성능 컴퓨팅(HPC) 기반 시뮬레이션은 천체물리학 및 우주론(A&C)에서 매우 중요하며, 과학자들이 복잡한 현상을 조사하고 이해하는 데 도움을 줍니다.
항목(문제 또는 과제)의 난이도를 정확하게 추정하는 것은 교육 평가에 있어 매우 중요하지만, 콜드 스타트 문제에 시달립니다. 대형 언어 모델(Large Language Model)은…
손글씨 텍스트 인식 및 광학 문자 인식 솔루션은 현대 데이터 처리에서 뛰어난 결과를 보여주지만, 효율성은 La...
우리는 상태공간이 레이블이 붙은 잎을 가진 **binary rooted forests**인 **Hopf algebra Markov chain**의 동적 특성을 연구한다. 이 **Markovian** 동적 시스템…
Mixture-of-Experts (MoE)는 sparse expert activation을 통해 모델 용량을 확장할 수 있는 능력 때문에 대형 언어 모델(LLMs)에서 지배적인 아키텍처가 되었습니다.