[Paper] BAMBO: 베이지안 적응형 다목적 블록별 최적화를 통한 능력 및 효율성 LLM 파레토 집합 구축
Pareto 집합을 구성하는 것은 대형 언어 모델(Large Language Models, LLMs)에서 능력‑효율성 트레이드오프를 탐색하는 데 핵심적입니다; 그러나 기존의 merging 기술은 …
Pareto 집합을 구성하는 것은 대형 언어 모델(Large Language Models, LLMs)에서 능력‑효율성 트레이드오프를 탐색하는 데 핵심적입니다; 그러나 기존의 merging 기술은 …
새로운 audio-processing 기술이 수백만 명의 시청자에게 엔터테인먼트를 더 쉽게 접근할 수 있게 하고 있습니다....
LLM은 일반화가 뛰어나기 때문에 유용합니다. 하지만 좋은 것이 과하면 안 될까요? 우리는 좁은 맥락에서 소량의 finetuning이 can dra...
이 논문은 lock-freedom와 recoverability를 모두 도입하는 최초의 변환을 제시한다. 우리의 변환은 lock-based 구현으로 시작한다, a...
동질적인 GPU 기반 딥러닝(DL) 훈련이 널리 사용되고 있음에도 불구하고, 스트래글러의 발생 빈도, 원인 및 영향과 기존 s...
대형 언어 모델(LLMs)은 코드 생성에서 강력한 성능을 달성하지만, 체인‑오브‑쓰레드(Chain-of-Thought, CoT) 프롬프트가 도움이 되는 메커니즘은 아직 명확하지 않다. W...
Equivariant neural networks는 대칭을 inductive bias로 인코딩하고, 다양한 분야에서 강력한 empirical performance를 달성했습니다. 그러나 그들의 expressive power는…
우리는 SynthPix, Particle Image Velocimetry (PIV)를 위한 합성 이미지 생성기를 소개한다. 이 시스템은 성능과 가속기에서의 병렬성에 중점을 두고 구현되었다.
효과적인 로그 이상 탐지는 대규모 IT 인프라의 신뢰성을 유지하는 데 필수적입니다. Transformer 기반 모델은 상당한 자원을 필요로 합니다.
시스템 엔지니어링은 문서 중심에서 모델 기반 접근 방식으로 전환하고 있으며, 자산이 점점 더 디지털화되고 있습니다. 디지털화는 …
Quantum circuit design은 복잡하고 실제 세계 데이터에 대한 실용적인 quantum machine learning에 있어 핵심 병목 현상입니다. 우리는 automated framework를 제시하여 …
Task scheduling은 클라우드 컴퓨팅에서 중요한 연구 과제이며, 산업 전반에 널리 채택된 변혁적인 기술입니다. 수많은 scheduling …
워크플로우 마이닝은 이벤트 로그에서 계층적 프로세스 트리를 발견하지만, 이러한 모델이 논리적 속성을 만족하거나 위반하는 이유가 명확하지 않으며, 혹은 개별…
웨어러블 시스템을 위한 Eye tracking은 낮은 지연 시간과 밀리와트 수준의 전력을 요구하지만, 기존의 프레임 기반 파이프라인은 모션 블러와 높은 연산량으로 어려움을 겪는다...
맥락. 소프트웨어 엔지니어링에서 LLM 기반 자율 에이전트는 대형 독점 모델에 의존해 로컬 배포가 제한됩니다. 이는 Small Language Models에 대한 관심을 촉발했습니다.
다양한 과학 및 공학 연구 분야에서는 상호 작용하는 delay differential equations의 대규모 시스템에서 이산적이고 time‑stamped 변화를 다룹니다. Simulat...
공유 GPU 클러스터 내에서 여러 모델을 배포하는 것은 대규모 언어 모델(LLM) 서빙에서 자원 효율성을 향상시키는 데 유망합니다. 기존의 멀티-LLM …
Vector search는 현대 정보 검색 시스템의 기반을 이루며, 여기에는 retrieval-augmented generation (RAG) 파이프라인과 비정형 텍스트에 대한 search engines가 포함됩니다.
조직이 컴퓨터 네트워크에 의존하는 것은 네트워크 프로그래머빌리티에 의해 가능해지며, 이는 일반적으로 Service Function Chaining을 통해 구현됩니다. 이러한 c...
요즘 visual intelligence tools는 어디에나 존재하게 되었으며, 모든 종류의 편리함과 가능성을 제공한다. 그러나 이러한 도구들은 높은 computational re...
우리는 궤적 예측과 UAV 배치 최적화를 통합한 해양 수색 작전을 위한 새로운 predict‑then‑optimize 프레임워크를 제시한다—끝…
Bug fixing은 소프트웨어 개발 프로세스에서 중요한 활동입니다. JIRA와 같은 이슈 트래킹 시스템에서는 각 버그 보고서에 우선순위 레벨이 할당됩니다.
자동화된 알고리즘 설계 분야는 EoH, FunSearch, Reevo와 같은 프레임워크에 의해 발전해 왔습니다. 그러나 이들은 알고리즘 진화에만 초점을 맞추고, …
고성능 GPU 커널 최적화는 현대 머신러닝 워크로드에서 여전히 중요한 동시에 노동 집약적인 작업입니다. 비록 Triton, 도메인‑특화 언어가…