了解 Microsoft Foundry 中的 Model Router

发布: 1个月前 (2026年3月13日 GMT+8 12:44)

10 分钟阅读

原文: Dev.to

Source: Dev.to

介绍

随着生成式 AI 应用从原型阶段迈向生产系统，开发者日益面临一个新的架构挑战：为每个任务选择合适的模型。现代 AI 平台现在提供数十——甚至数百——种模型，各自拥有不同的优势（有的针对推理进行优化，有的侧重速度、成本或领域专精）。动态选择最佳模型对于性能和成本效率都至关重要。

微软通过 Model Router，这一 Microsoft Foundry 中的功能，来应对这一挑战。Microsoft Foundry 是其用于构建和运营 AI 应用的企业平台。

在探讨 Model Router 的工作原理之前，了解它所属的平台会更有帮助。

类比

将 Microsoft Foundry 中的 Model Router 想象成 找公寓的工具。

在寻找公寓时，你通常会考虑：

预算
到工作的距离
配套设施（健身房、停车位、泳池）

你不会手动评估每一个公寓。平台会分析你的偏好并推荐最匹配的房源。

Model Router 对 AI 模型的工作方式也是如此。当应用程序发送一个 prompt 时，路由器会评估成本、延迟和模型能力等因素，然后自动选择最合适的模型。

就像找公寓的工具帮助你挑选最合适的居住地点，Model Router 也帮助你的应用程序选择最合适的模型来回答 prompt。

什么是 Microsoft Foundry？

Microsoft Foundry 是 Microsoft 在 Azure 上构建、部署和运营 AI 应用和智能代理的统一平台。它提供了一个集中环境，开发者可以：

发现模型
构建 AI 驱动的应用
集成企业数据
部署具备内置治理和可观测性的系统

核心能力

能力	描述
模型目录	发现并部署基础模型
代理开发工具	构建 AI 副驾驶和多步骤代理工作流
企业 AI 服务	语言、视觉、语音和文档智能
评估与监控	衡量 AI 质量和可靠性
安全与治理	Azure RBAC、网络和策略控制

在实际使用中，Microsoft Foundry 充当企业 AI 应用的开发和运营层，帮助团队构建集成模型、工具和数据的系统，同时保持企业级的可靠性和安全性。

路由的必要性

一旦平台上出现多个模型，就会出现一个关键问题：

哪个模型应该处理每个请求？

如果没有路由器，开发者就需要实现自定义逻辑，例如：

if simple_prompt:
    use_small_model()
elif coding_task:
    use_reasoning_model()
else:
    use_general_model()

维护这样的逻辑很快就会变得复杂。

问题：多模型系统中的模型选择

在许多 AI 应用中，开发者往往先选定单一模型（例如大型推理模型 GPT‑4）。虽然这样可行，但常常导致低效：

简单查询并不需要大型推理模型。
高质量模型可能带来不必要的延迟。
大模型会显著提升运营成本。

随着组织采用多模型架构，手动挑选合适模型的难度日益增加。开发者需要实现的逻辑可能包括：

将简单查询路由到小模型。
将复杂推理任务路由到大模型。
将编码任务路由到专用模型。

手动维护这些路由逻辑很快就会变得难以扩展。

介绍模型路由器

模型路由器 在 Microsoft Foundry 中通过充当 智能路由层 来解决此问题，跨多个模型进行调度。开发者无需显式选择模型，路由器会评估每个请求并自动将其转发到配置池中最合适的模型。

工作原理（高级流程）

客户端请求 – 应用向路由器端点发送提示。
提示分析 – 路由器检查提示的复杂度、推理需求、期望的响应质量、延迟和成本因素。
模型选择 – 路由器从池中挑选最合适的模型。
请求转发 – 将提示发送给选中的模型。
响应返回 – 路由器将模型的答案返回给客户端。

从应用的角度来看，交互表现为 单一模型调用，即使不同的请求可能由不同的模型处理。

示例路由决策

简单信息查询 → 较小、速度更快的模型。
复杂推理任务 → 更大的推理模型。
编码提示 → 专门的编码模型。

这种架构使组织能够 同时优化成本、性能和响应质量。

在 Microsoft Foundry 中部署模型路由器

部署模型路由器非常简单：

在 Azure 中创建一个 Foundry 项目。
从 Foundry 模型目录中选择模型。
创建模型路由器部署。
配置路由模型集合（路由器可以选择的模型池）。
使用不同的提示词测试模型路由器。
将路由器公开为单一 API 端点。

随后，应用程序将提示发送到路由器端点，而不是直接调用各个模型。这简化了多模型系统，同时让平台能够自动优化路由决策。

为什么模型路由器很重要

随着 AI 平台不断扩展其模型目录，多模型架构将成为常态。模型路由器是一种重要的架构模式，能够实现：

成本效率 – 在可能的情况下使用更小、更便宜的模型。
性能 – 通过将简单任务路由到更快的模型来降低延迟。
质量 – 确保复杂或特定领域的请求使用最强大的模型。
可扩展性 – 消除随时间变得脆弱的自定义路由代码的需求。

通过在单一端点后抽象模型选择，模型路由器使开发者能够专注于构建智能应用，而不是管理错综复杂的模型特定逻辑。

AI 应用架构的转变

与其围绕单一模型构建应用，系统将围绕 动态模型编排 进行设计。

关键优势

成本优化 – 避免不必要的大模型使用。
性能提升 – 为更简单的任务使用更快的模型。
更高质量的响应 – 为每个请求选择专门的模型。
更简洁的应用架构 – 只暴露单一 API 接口。

Model Router 的角色

Model Router 充当多模型 AI 系统的 控制层，让开发者专注于应用逻辑，而平台负责模型选择。

随着 AI 系统的发展，应用不再围绕单一模型构建。
现代平台（例如 Microsoft Foundry）支持使用多个大语言模型（LLM），每个模型针对不同能力（如推理、速度、成本效率或专门任务）进行优化。
开发者不再需要手动决定哪个模型处理每个请求，路由器会 评估提示词 并根据 成本、延迟和模型能力 等因素动态选择最合适的模型。

正如租房平台通过平衡预算、距离和设施帮助你找到最合适的居所，Model Router 也帮助 AI 应用为每个提示词找到最佳模型。

成果

更简洁的架构。
更佳的性能。
成本优化。

开发者可以专注于构建智能应用，而平台在幕后处理模型选择。

在许多方面，Model Router 代表了 多模型 AI 系统 的未来，其中智能路由与模型本身同等重要。

谢谢