Red Hat 性能与规模工程

发布: 3个月前 (2026年1月27日 GMT+8 08:00)

1 分钟阅读

Source: Red Hat Blog

引言

在我之前的博客《如何使用 KEDA 为 vLLM 设置 KServe 自动伸缩》中，我们探讨了在 Open Data Hub（ODH）中使用 KEDA 和自定义指标自动伸缩运营商进行 vLLM 自动伸缩的基础设置。我们构建了一个超越传统 CPU 和内存指标的伸缩策略架构，采用 AI 推理专用的服务水平指标（SLI）。现在，是时候对该系统进行测试，并在真实工作负载下验证其性能了。

Back to Blog

破解推理代码：针对高性能 AI 的 3 种经验证策略

引言：每个试点生成式 AI（gen AI）的组织最终都会遇到推理瓶颈。这是当工作原型的兴奋感逐渐消退的时刻……

使用 agentic AI 的 IT 自动化：Red Hat Ansible Automation Platform 的 MCP 服务器介绍

Red Hat Ansible Automation Platform – MCP Server 技术预览 MCP 服务器现已作为技术预览在 Ansible Automation Platform 2.6 中提供....

创建 EC2 实例并使用 SSH 连接后要做的事项

🧭 先看大局此时，你已经： - 创建了一个 EC2 实例 - 通过 SSH 连接到它现在你已经在服务器内部。在安装任何东西之前……

DevOps 自动化指南：设置 Ansible 并使用 Network Playground 构建自定义 Docker 镜像

从传统开发者转变为 DevOps 工程师的过程常常感觉像踏入了工具和方法论的旋风。然而，成功的关键在于 m...

引言

相关文章

破解推理代码：针对高性能 AI 的 3 种经验证策略

使用 agentic AI 的 IT 自动化：Red Hat Ansible Automation Platform 的 MCP 服务器介绍

创建 EC2 实例并使用 SSH 连接后要做的事项

DevOps 自动化指南：设置 Ansible 并使用 Network Playground 构建自定义 Docker 镜像