compute efficiency

1个月前 · ai

如何将机器学习工作负载的 GPU 成本降低超过 40%

TL;DR A100 → H100 → H200 标志着一次重大的性能飞跃。根据内存需求、计算需求和每个工作负载的成本进行选择。A100 仍然保持高度的成本效益……

#GPU cost optimization #A100 #H100 #H200 #ML training #ML inference #multi‑cloud GPU marketplace #Aquanode #deep learning hardware #compute efficiency
1个月前 · ai

Google的新框架帮助AI agents更明智地使用计算和工具预算

在一篇研究大型语言模型（LLM）代理工具使用的新论文中，谷歌和加州大学圣塔芭芭拉分校的研究人员开发了一个框架，使代理能够……

#LLM #AI agents #budget tracking #tool use #compute efficiency #Google research