1周前 · ai [论文] 在高性能计算基础设施上实现自动化动态 AI 推理伸缩:整合 Kubernetes、Slurm 和 vLLM 由于对人工智能(AI)推理的需求日益增长,尤其是在高等教育领域,利用现有基础设施的新颖解决方案正在出现……