1个月前 · ai [Paper] AugServe:自适应请求调度用于增强大型语言模型推理服务 随着带有外部工具的增强型大型语言模型(LLMs)在网页应用中日益流行,提升增强型 LLM 推理服务的效率……