[Paper] OffloadFS: Disaggregated Storage를 활용한 Computation Offloading
Disaggregated storage systems는 storage resources를 compute resources와 분리함으로써 resource utilization을 향상시키고 storage와 compute resources의 independent scaling을 가능하게 합니다.
4481 posts from this source
Disaggregated storage systems는 storage resources를 compute resources와 분리함으로써 resource utilization을 향상시키고 storage와 compute resources의 independent scaling을 가능하게 합니다.
지속적인 외부 입력이 없는 상태에서 self-sustained neural activity는 신경계 역학의 근본적인 특징이며, 그 조건은 ...
본 연구는 단일 누수 적분‑발화(LIF) 뉴런과 학습된 스파이킹 신경망 모두에 대한 가산 노이즈와 곱셈 노이즈의 영향을 조사한다.
SAKURAONE은 SAKURA Internet Research Center에서 개발·운영하는 관리형 고성능 컴퓨팅(HPC) 클러스터입니다. 이는 KOKARYOKU PHY 기반 위에 구축되었습니다.
Brain digital twins는 뇌를 동적 시스템으로서 충실하고 개별화된 계산적 표현을 제공하여 메커니즘적 이해를 가능하게 한다.
컴퓨팅 집약적인 AI 작업의 증가는 처리 비용을 완화하고 성능 및 에너지 효율성을 향상시켜야 할 필요성을 강조합니다. 이는 …
우리는 새로운 end-to-end privacy-preserving 프레임워크를 제안한다. 이 프레임워크는 서로 다른 배포 시나리오에 맞춘 세 가지 효율적인 프로토콜로 구현되며, 입력 …
Travelling thief problem (TTP)은 두 구성 요소 간의 상호 의존성을 포착하는 잘 알려진 다중 구성 요소 최적화 문제이며, tour across…
우리는 다양한 데이터 표현을 지원하고 효율적인 sparse matrix‑vector multiplication (SpMV)을 가능하게 하는 새로운 sparse matrix 포맷인 PackSELL을 제안한다.
Open-pit mine scheduling은 불확실한 경제적 가치와 동적으로 변하는 자원 용량을 포함하는 복잡한 실제 최적화 문제입니다. Evol...
현대 GPU 워크로드, 특히 대형 언어 모델(LLM) 추론은 커널 실행 오버헤드와 거친 동기화 때문에 인터‑커널 ...
최근 비디오 생성 분야의 발전은 3D 씬 제작을 위한 새로운 패러다임을 가능하게 합니다: 씬을 탐험하는 것을 시뮬레이션하는 카메라 제어 비디오를 생성하고, 그 후…
대형 언어 모델(LLMs)과 비전-언어 모델(VLMs)은 레이아웃 및 씬 그래프와 같은 중간 구조를 통해 실내 장면을 점점 더 생성하고 있다.
Snowflake는 컴퓨트와 스토리지를 분리하는 탄력적인 아키텍처를 통해 데이터 웨어하우징에 혁신을 일으켰으며, 다양한 데이터 분석을 위한 확장 가능한 솔루션을 가능하게 합니다...
확산 모델이 시각 생성 분야를 장악하고 있지만, 이들은 계산 효율성이 낮아 확산 여부와 관계없이 균일한 계산 노력을 적용한다.
Direct Preference Optimization (DPO)의 효과는 멀티모달 작업에서 중요한 품질 차이를 반영하는 선호 데이터에 달려 있습니다. Exist...
도시 지역은 급속한 urbanization과 climate change에 의해 야기되는 thermal extremes에 점점 더 취약해지고 있습니다. 전통적으로, thermal extremes는 모니터링되어 왔습니다...
시스템 로그의 폭발적인 증가로 스트리밍 압축이 필수적이지만, 기존 로그 이상 탐지(LAD) 방법은 심각한 전처리 오버헤드를 초래한다.
Energy Conserving Descent (ECD) 알고리즘은 최근 (De Luca & Silverstein, 2022)에서 전역 비볼록 최적화 방법으로 제안되었습니다. 기존의 gradient…
Computed tomography (CT) enterography는 염증성 장질환(IBD)을 평가하기 위한 주요 영상 촬영 방법이지만, 가장 적절한 표현 선택은 …
Computer Use Agents (CUAs)는 근본적으로 그래픽 사용자 인터페이스 (GUI) grounding을 사용하여 언어 명령을 실행 가능한 화면 동작으로 변환하지만…
자율 AI 연구는 빠르게 발전했지만, 장기적인 ML 연구 엔지니어링은 여전히 어렵습니다: 에이전트는 작업 이해 전반에 걸쳐 일관된 진전을 지속해야 합니다…
AI-driven 교육 플랫폼은 개인화에서 어느 정도 진전을 이루었지만, 대부분은 정적 적응에 제한됩니다—미리 정의된 퀴즈, 균일한 속도 등.
On-policy distillation (OPD)은 대형 언어 모델의 사후 훈련에서 핵심 기술이 되었지만, 그 훈련 역학은 아직 충분히 이해되지 않는다. This...
On-policy distillation (OPD)는 대형 언어 모델을 위한 효율적인 사후 학습 패러다임으로 부상했습니다. 그러나 표준 OPD는 실시간 교사 추론을 필요로 합니다...
Instruction-tuned large language models는 유용하고 구조화된 응답을 생성하지만, 사소하게 제한될 때 이 유용성이 얼마나 견고한가? 우리는 simpl...
대규모 언어 모델(LLMs)은 다양한 소프트웨어 엔지니어링(SE) 도구에 동력을 제공하는 데 큰 가능성을 보여주었습니다. 자연어를 직관적인 상호작용으로 제공함으로써…
대형 언어 모델(LLMs)은 공공 정책 분야를 포함한 실제 의사결정에 점점 더 통합되고 있습니다. 그러나 그들의 이해 능력은…
소프트웨어의 논리적 취약점은 프로그램 로직의 결함에서 비롯되며, 메모리 안전성보다 더 큰 문제를 일으켜 critical security failures를 초래할 수 있다. Although existing ...
시계열 데이터에서 반사실 결과를 예측하는 것은, 순차적인 치료 결정이 변화하는 환자 상태에 크게 의존하는 경우에 매우 중요하지만 난제이다.
Execution Accuracy (EX)는 자연어를 SQL(NL2SQL)로 변환하는 솔루션의 효과를 평가하는 데 널리 사용되는 지표이며, 점점 신뢰성이 떨어지고 있다.
자율 AI 에이전트는 실험적 도구에서 운영 인프라로 빠르게 전환하고 있으며, 기업 애플리케이션의 80%가 ...
Optical character recognition (OCR)은 비전‑언어 모델의 부상과 함께 빠르게 발전했지만, 평가는 여전히 소수의 클러스터에 집중되어 왔습니다.
Multimodal federated learning은 의료 기관 전반에 걸쳐 프라이버시를 보호하는 협업 모델 학습을 가능하게 합니다. 그러나 근본적인 도전 과제가 발생합니다.
수렴 속도, 일반화 능력, 그리고 계산 효율성의 균형을 맞추는 것은 딥러닝 최적화에서 핵심 과제로 남아 있습니다. First-order gradient…
딥러닝에서 가장 많이 인용되는 캘리브레이션 결과인 CIFAR‑100에서의 post‑temperature‑scaling ECE 0.012 (Guo et al., 2017)는 통계적 노이즈 변동보다 낮다.
전통적인 고정‑깊이 아키텍처는 일반적으로 파라미터 수를 늘려 훈련 FLOPs를 증가시킴으로써 품질을 확장하지만, 그 대가로 더 높은 메모리를 요구한다.
Speech-to-speech language models는 최근 대화형 AI의 자연스러움을 향상시키기 위해 등장했습니다. 특히, full-duplex models는 …
Metonymy와 metaphor는 자연어에서 자주 동시에 발생하지만, computational 연구는 이를 주로 별도로 연구해 왔습니다. 우리는 변환하는 framework를 소개합니다.
Multilingual benchmarks는 frontier models의 개발을 안내합니다. 그러나 frontier models가 보고하는 multilingual evaluations는 popular rea와 유사하게 구조화되어 있습니다.
많은 프로그램 합성, 초최적화, 그리고 배열 프로그래밍 기법들은 범용 프로그램의 병렬 롤아웃을 필요로 합니다. GPU는, 능력 있는 대상…
코드 추론 작업은 대형 언어 모델(LLM)을 평가하는 데 점점 더 중요해지고 있습니다. 그러나 대부분의 기존 벤치마크는 단순한 LLM‑generated 스니펫에 의존합니다.
Neural Cellular Automata(NCAs)에 관한 문헌 전반에서, 시스템이 어트랙터를 학습한다는 것이 당연하게 받아들여진다. 이는 진화하는 …을 통해 보여진다.
이 논문은 다년간 다수 파트너가 참여한 노력의 일환으로 유럽 프로세서 이니셔티브(EPI) 내에서 개발된 RISC‑V 기반 가속기 칩인 EPAC을 소개한다.
대기업은 종종 대규모이면서 이질적인 컴퓨트 클러스터에서 방대한 Continuous Integration (CI) 파이프라인을 운영하는데, 여기서 보수적이고 정적으로 정의된…
컴퓨팅 연속체 전반에 걸쳐 애플리케이션을 배포하려면 지리적으로 분산되고 이질적인 환경에서 인프라 노드를 선택해야 합니다.
공정성은 인간과 관련된 고위험 소프트웨어 시스템에 대한 중요한 요구 사항이며, 이는 bias mitigation에 대한 광범위한 연구를 촉진합니다. 기존 연구는 주로 ...
Federated Learning (FL)은 에지에서 Large Language Models (LLMs)를 협업적으로 미세 조정할 수 있는 유망한 경로를 제공하지만, 이 패러다임은 중요한…