· devops
[Paper] OD-MoE:按需专家加载用于无缓存边缘分布式 MoE 推理
Mixture-of-Experts (MoE),虽然作为大型语言模型(LLM)架构提供了显著优势,但在部署到低‑…
Mixture-of-Experts (MoE),虽然作为大型语言模型(LLM)架构提供了显著优势,但在部署到低‑…
基于SMT求解器的自动化验证工具在验证复杂软件系统方面取得了显著进展。然而,这些工具面临一个根本性的……
高效模拟复杂等离子体动力学对于推动聚变能源研究至关重要。粒子-在-网格(Particle-in-Cell,PIC)蒙特卡罗(Monte Carlo,MC)模拟提供了...
人工智能(AI)和深度学习(DL)的快速发展催生了多个以优化为驱动的子领域,尤其是神经……
脉冲神经网络(SNNs)已成为计算神经科学和人工智能领域的一个有前景的方向,提供了诸如……的优势。
Transformer 解码器在各种任务中取得了强劲的结果,但 KV 缓存所需的内存在长序列长度下变得难以承受。虽然 …
机器学习在医学早期预测方面最近表现出突破性性能,然而,过于关注提升预测准确性导致了一个 …
现代软件系统日益给传统的代码库组织策略带来压力。Monorepos 提供一致性,但往往面临可扩展性问题……
本文讨论了在分析合成基准测试和 Gromacs 软件包在 Fritz 与 Alex HPC 系统上的能效时所遇到的挑战。
大量近期关于分布式量子计算的研究集中于使用纠缠对和分布式两量子比特门。但也有关于 ef...
近期大型语言模型(LLMs)的发展对高效且稳健的训练提出了新的要求。随着LLM集群规模的扩大,节点故障、le...
本文呈现了对 sigmoid 函数的形式化分析,并在 Isabelle/HOL 中提供了通用逼近定理(Universal Approximation Theorem, UAT)的完整机械化证明,…