[Paper] FLEX: FPGA-CPU 시너지 활용을 통한 혼합 셀 높이 Legalization 가속
본 연구에서는 mixed-cell-height legalization 작업을 위한 FPGA-CPU accelerator인 FLEX를 제시한다. 우리는 다음과 같은 관점에서 도전 과제들을 다룬다. 첫째, w...
본 연구에서는 mixed-cell-height legalization 작업을 위한 FPGA-CPU accelerator인 FLEX를 제시한다. 우리는 다음과 같은 관점에서 도전 과제들을 다룬다. 첫째, w...
그래프에 대한 머신러닝은 최근 분자 특성 예측 및 칩 설계와 같은 다양한 분야에서 인상적인 진전을 이루었습니다. 그러나 벤치...
로그 파싱은 원시 로그를 상수와 변수를 포함하는 구조화된 템플릿으로 변환합니다. 이는 이상 탐지, 장애 진단 및 기타 AIOps의 기반이 됩니다.
CXL 기반 컴퓨테이셔널 메모리(CCM)는 확장된 원격 메모리 내에서 근접 메모리 처리를 가능하게 하여 데이터 이동 비용을 해결할 기회를 제공합니다…
Workflow automation은 일상적인 문서 관련 작업에서 상당한 생산성 향상을 약속합니다. 이전의 agentic systems는 개별 지시를 실행할 수 있지만, t...
Spiking Neural Networks (SNNs)는 희소한 이진 활성화 덕분에 기존 신경망에 대한 유망하고 에너지 효율적인 대안을 제공합니다. How...
Hallucinations은 Foundation models (FMs)에 의존하는 애플리케이션을 만들 때 주요 우려 사항입니다. 이러한 미묘한 실패가 어디에서 어떻게 발생하는지 이해하는 것은 …
희소 LU 분해에서, 기호 분해 후의 비제로 요소들은 희소 행렬의 대각선 및 오른쪽 아래 영역에 분포하는 경향이 있습니다. 그러나, re...
현대 GPU 소프트웨어 스택은 개발자에게 커널을 실행하기 전에 성능 병목 현상을 예측할 수 있는 능력을 요구한다; 부동소수점 워크로드를 잘못 판단하면 …
현대 parallel machines의 복잡성과 규모가 계속 증가함에 따라, 프로그래머들은 software libraries의 구성에 점점 더 의존하여 …
Parameter-efficient fine-tuning (PEFT)은 대규모 사전 학습 모델에서 소수의 파라미터만 업데이트함으로써 전체 모델 적응에 대한 확장 가능한 대안을 제공합니다.
2024년에 Argonne National Laboratory에 배치된 Aurora 슈퍼컴퓨터는 현재 Top500 리스트에서 전 세계 세 대의 Exascale 머신 중 하나입니다.