[Paper] 자원 제한 및 데이터 이질성을 Double-Weight Sparse Pack으로 Federated Learning에서 해결
Federated learning은 연구자들 사이에서 널리 관심을 받고 있지만, edge client 간의 데이터 이질성은 여전히 주요 과제로 남아 있으며, 종종 모델의 성능을 저하시킨다.
3232 posts from this source
Federated learning은 연구자들 사이에서 널리 관심을 받고 있지만, edge client 간의 데이터 이질성은 여전히 주요 과제로 남아 있으며, 종종 모델의 성능을 저하시킨다.
우리는 명시적인 평가 예산 제약 하에서 NP‑hard 최적화를 위해 설계된 다중 체인 하이브리드 메타휴리스틱인 Yukthi Opus (YO)를 제시한다. YO는 …
Lumpy Skin Disease (LSD)는 전염성 바이러스 감염으로, 가축의 건강을 크게 악화시켜 전 세계 경제에 심각한 위협을 초래합니다.
Deep Reinforcement Learning (RL) 에이전트는 종종 동일한 episodic return을 달성하지만 행동이 매우 다르게 나타나는 정책을 학습합니다. 이는 환경의…
신뢰할 수 있는 심리 평가용 AI를 개발하기 위해, 우리는 texttt{PsychEval}을 소개한다. 이는 다중 세션, 다중 치료, 그리고 매우 현실적인 벤치마크로 설계된…
강화 학습(RL)은 자율 주행(AD)에서 상당한 잠재력을 보여왔지만, 교란에 대한 취약성은 여전히 중요한 장벽으로 남아 있다.
얼굴 인증 시스템은 상당한 발전을 이루었지만, 의사결정 과정에서 투명성이 부족한 경우가 많습니다. 본 논문에서는 우리는 …
Lossy compression은 과학자들이 simulations, experiments, observations에서 데이터를 줄이기 위해 널리 사용하지만, 제한된 상황에서도 관심 있는 특징을 왜곡할 수 있다.
본 논문에서는 볼록 다각형 영역에서 Dirichlet 경계 조건을 정확히 적용하기 위한 Wachspress 기반의 transfinite 공식화를 제시한다.
실시간 추천 시스템은 엄격한 tail‑latency SLO 하에서 다단계 캐스케이드(검색, 전처리, 세밀한 순위 매기기)를 실행하며, 오직 수십 …
Tactile sensing은 로봇 매니퓰레이션, 보철 및 보조 기술에 필수적이지만, neuromorphic tactile datasets는 ...에 비해 제한적이다.
동적 다목적 최적화(DMOO)는 최근 학계 연구자와 엔지니어링 실무자 모두에게 점점 더 많은 관심을 받고 있습니다, 왜냐하면 수많은…
Time series classification은 광범위한 실제 응용 분야를 가진 기본적인 machine learning 작업입니다. 많은 deep learning 방법들이 효과적인 것으로 입증되었지만 ...
Quality diversity (QD) optimization은 objective를 최적화하면서 user-specified vector의 다양한 출력을 달성하는 솔루션 컬렉션을 탐색합니다.
단일 카메라 비디오에서 동적 3D 장면을 재구성하려면 고주파 외관 디테일과 시간적으로 연속적인 움직임을 동시에 포착해야 합니다. Exi...
좌심실(LV) 분할은 심장 영상의 임상 정량화 및 진단에 필수적입니다. 본 연구에서는 두 가지 새로운 딥러닝 아키텍처를 제안합니다.
우리는 attention 패턴의 스펙트럴 분석을 통해 대형 언어 모델에서 유효한 수학적 추론을 감지하는 training‑free 방법을 제시한다. By treati...
본 연구에서는 self-supervised learning의 잠재력을 활용하여 일반화된 deepfake의 주요 작업을 최적화할 수 있는 보조 작업으로 활용하고자 하였다.
Population-based cancer registries는 pathology reports를 주요 진단 소스로 의존하지만, manual abstraction은 자원 집약적이며 …
연합 데이터 공유는 원시 데이터를 중앙화하지 않고도 유용성을 제공한다는 약속을 하지만, 기존의 embedding-level generators는 non-IID client heterogeneity와 p... 아래에서 어려움을 겪는다.
범주형 변수를 사용하는 Gradient-based optimization은 일반적으로 편향은 없지만 잡음이 많은 score-function estimators에 의존하거나, 연속적인 relaxations에 의존한다.
Vision-Language Models (VLMs)와 Multimodal Large Language Models (MLLMs)는 이미지 및 비디오 딥페이크 탐지에서 강력한 일반화를 보여주었지만, 그들의 ...
투자 포트폴리오 최적화는 모든 주요 금융 기관에서 수행되는 작업입니다. Cardinality Constrained Mean-Variance Portfolio Optimization (CCP)…
구조화된 형태 완성은 비구조화된 점이 아니라 프리미티브로 누락된 기하학을 복구하여 프리미티브 기반 표면 재구성을 가능하게 합니다. In...
대형 언어 모델(LLMs)은 많은 일상 애플리케이션에서 필수 요소가 되었습니다. 그러나 데이터가 진화함에 따라 그들의 지식은 빠르게 오래되게 됩니다. Continual ...
자율 AI 에이전트가 코드 완성 도구에서 대규모로 풀 리퀘스트(PR)를 열 수 있는 완전한 팀원으로 전환함에 따라, 소프트웨어 유지관리자는 fa...
축구에서 오프볼 수비 퍼포먼스를 평가하는 것은 어려운 일이며, 전통적인 지표들은 상대의 움직임을 제한하는 미묘하고 협조적인 움직임을 포착하지 못한다.
최첨단 대형 언어 모델(LLM) 파이프라인은 부트스트랩된 추론 루프에 의존한다: 다양한 사고 사슬을 샘플링하고 가장 높은 점수를 받은 것을 강화한다...
심볼릭 제약을 딥러닝 모델에 통합하면 모델을 더 견고하고 해석 가능하며 데이터 효율적으로 만들 수 있습니다. 하지만 여전히 시간 소모적인 …
강화학습에서 오프-폴리시 액터-크리틱 방법은 temporal-difference 업데이트로 크리틱을 학습하고 이를 정책(actor)의 학습 신호로 사용한다.
관련 텍스트 스팬을 식별하는 것은 NLP의 여러 다운스트림 작업에 중요하며, 모델 설명 가능성에 기여합니다. 대부분의 스팬 식별 접근법은 …
손으로 쓴 STEM 시험은 개방형 추론과 다이어그램을 포착하지만, 수작업 채점은 느리고 규모를 확대하기 어렵습니다. 우리는 end-to-end 워크플로우를 제시합니다 for gradi...
우리는 선형 솔버의 적응형 정밀도 튜닝을 위한 강화 학습(RL) 프레임워크를 제안하며, 이를 일반 알고리즘으로 확장할 수 있다. 이 프레임워크는 …
Deep neural networks는 제조업에서 다양한 visual quality inspection 작업을 자동화하는 데 큰 잠재력을 보여줍니다. 그러나 그 적용 가능성은 …
Vision-Language Models는 의료 영상 분석 및 질병 진단에서 강력한 잠재력을 보여주었습니다. 그러나 배포 후에는 성능이 dete...
디지털 이미징에서, 이미지 디모자이싱은 색 필터 어레이(CFA)에서 RGB 정보를 복원하는 중요한 첫 단계입니다. 종종 딥러닝은 …
장기 시계열 예측에 트랜스포머를 사용하는 경우, 자체 주의(self-attention)의 이차 복잡도와 균일 패칭(uniform patching)의 경직성 때문에 성능이 제한됩니다.
보행자 횡단 행동을 추론하기 위한 기존 패러다임은 통계 모델부터 supervised learning methods에 이르기까지 다양하지만, 일반화 능력이 제한적이다.
Ticket troubleshooting은 티켓팅 시스템을 통해 보고된 문제를 분석하고 해결하는 과정을 의미합니다. 대규모 조직에서 …
이 논문은 생산 라인에서 비용 최적 작업 스케줄링을 위한 유전 알고리즘(GA) 접근법을 제시한다. 시스템은 일련의 직렬 처리 작업 집합으로 구성된다.
Language model (LM) probability은 신뢰할 수 있는 품질 추정기가 아니다, 왜냐하면 자연어는 애매모호하기 때문이다. 여러 출력 옵션이 모두 유효할 때, 모델의 probability…
대규모 언어 모델(Large Language Models, LLMs)은 높은 성능(예: 정확도) 덕분에 많은 자연어 작업을 해결하는 주요 AI 모델로 부상하고 있습니다…
Generative Reward Models (GRMs)는 interpretability, inference-time scalability 및 ... 때문에 reward modeling에서 상당한 연구 관심을 끌고 있습니다.
현대 언어 모델의 시퀀스 모델링 레이어는 일반적으로 저장 용량과 계산 효율성 사이의 트레이드오프에 직면합니다. Softmax attention은 …
Spiking Neural Networks (SNNs)는 시공간 데이터에서 작동하는 동적 시스템이지만, 학습 가능한 매개변수는 종종 시냅스 가중치에만 제한됩니다, ...
Large Protein Language Models는 generative protein design에 강력한 잠재력을 보여왔지만, 종종 structural hallucinations를 일으켜 seque…를 생성합니다.
대규모 언어 모델(LLMs)을 모바일 및 엣지 컴퓨팅 환경에 배포하는 것은 제한된 디바이스 자원, 부족한 무선 대역폭, 그리고 f...
대형 언어 모델(LLMs)은 종종 맥락적 환각을 일으키며, 생성된 내용이 명시적으로 제시된 정보와 모순되거나 무시되는 경우가 있습니다.