“AI as text”时代已结束。执行是新的界面。
Source: GitHub Blog
(请提供需要翻译的正文内容,我将为您翻译成简体中文。)
从仅文本交互到代理式执行
在过去的两年里,大多数团队与 AI 的交互方式都是:
- 提供文本输入
- 接收文本输出
- 手动决定下一步操作
但生产软件并不是在孤立的交互中运行的。真实系统必须:
- 规划多个步骤
- 调用工具和服务
- 修改文件
- 从错误中恢复
- 在您定义的约束条件下进行适配
为什么要采用代理式工作流?
作为开发者,您可能已经习惯在 IDE 中使用 GitHub Copilot 作为可信赖的 AI 助手。然而,您可能也曾不止一次地想过:
“为什么我不能在自己的应用中也使用这种代理式工作流?”
答案是 可以——您完全可以做到。
介绍 GitHub Copilot SDK
The GitHub Copilot SDK 将驱动 GitHub Copilot CLI 的相同执行层公开为可编程能力,您可以直接将其嵌入到您的软件中。
- 无需自行构建编排堆栈 – 开箱即用的经过生产环境验证的计划与执行引擎。
- 触发逻辑 → 触发代理执行 – 您的应用程序中任何能够启动工作流的部分,现在都可以启动 AI 驱动的代理。
这种转变从根本上改变了 AI 驱动系统的架构。
嵌入代理执行的三种具体模式
-
自动代码重构
- 通过静态分析检测代码异味。
- 调用 Copilot SDK 生成重构代码片段。
- 在安全检查通过后自动应用更改。
-
动态问题分流
- 当创建新的 GitHub Issue 时,将标题和描述输入 SDK。
- 让代理提出标签建议、指派负责人,并草拟初始回复。
- 将结果回贴到 Issue 线程中。
-
自愈部署
- 监控部署流水线的失败情况。
- 触发 SDK 诊断根本原因,生成回滚计划或建议配置修复。
- 执行推荐的操作(如需可加入人工批准)。
入门指南
- 将 SDK 添加到你的项目(npm、Maven、PyPI 等)。
- 在应用代码中定义触发器。
- 配置执行策略(例如超时、资源限制)。
- 在沙箱环境中测试代理流程,再推广到生产环境。
准备好从“提示‑等待”转向真正的代理执行吗?
立即集成 GitHub Copilot SDK,让你的应用自主规划、行动并适应。
Source: …
模式 #1 – 将多步骤工作委派给代理
多年来,团队一直依赖脚本和胶水代码来自动化重复性任务。当工作流需要上下文、在运行过程中形态会变化,或需要错误恢复时,脚本就会变得脆弱。你要么硬编码边缘情况,要么开始构建自研的编排层。
使用 Copilot SDK,你的应用可以委派 意图,而不是编码固定的步骤。
示例
你的应用公开一个操作,例如 “为发布准备此仓库”。
不必手动定义每一步,而是将意图和约束传递给代理。代理随后会:
- 探索 仓库。
- 规划 所需步骤。
- 修改 文件。
- 运行 命令。
- 适配 如果出现失败。
所有这些都在你定义的边界内完成。
为什么这很重要
- 随着系统规模扩大,固定工作流会崩溃。
- 代理式执行让软件在保持 受限 与 可观察 的同时 适应。
- 你无需从头重建编排层。
模式 #2 – 在结构化运行时上下文中实现落地执行
许多团队尝试将更多行为推入提示中。将系统逻辑编码为文本会使工作流更难测试、推理和演进。随着时间推移,提示会变成脆弱的替代品,无法替代真正的系统集成。
使用 Copilot SDK,上下文变得 结构化 且 可组合。
您可以做什么
- 定义 面向领域的工具或代理技能。
- 通过 Model Context Protocol (MCP) 公开这些工具。
- 让 执行引擎在运行时检索上下文。
为什么要避免将数据堆叠到提示中?
与其直接在提示中嵌入所有权数据、API 架构或依赖规则,代理可以在规划和执行阶段 访问这些系统。
示例
内部代理可能会:
- 查询服务所有权。
- 拉取历史决策记录。
- 检查依赖关系图。
- 参考内部 API。
- 在定义的安全约束下运行。
为什么这很重要
可靠的 AI 工作流依赖 结构化、受权限控制的上下文。MCP 提供了管道,使代理执行能够扎根于真实的工具和真实的数据——消除嵌入提示中的猜测。
模式 #3 – 在 IDE 之外嵌入执行
大多数 AI 工具假设“真正的工作”发生在 IDE 中。然而,现代软件生态系统的范围远超单一编辑器。
团队需要代理能力的场景
- 桌面应用程序
- 内部运营工具
- 后台服务
- SaaS 平台
- 事件驱动系统
使用 Copilot SDK,执行成为 应用层能力。你的系统可以监听事件——例如文件更改、部署触发或用户操作——并以编程方式调用 Copilot。规划与执行循环在 你的产品内部 运行,而不是在单独的界面或开发者工具中。
为什么这很重要
当执行嵌入到你的应用程序中时,AI 不再是侧窗中的助手,而是 基础设施 的一部分。它可以在软件运行的任何地方使用,而不仅限于 IDE 或终端。
执行是全新界面
从 “AI 作为文本” 向 “AI 作为执行” 的转变是一种架构性的变化。具备代理性的工作流是可编程的计划与执行循环,它们在约束条件下运行,能够与真实系统集成,并在运行时进行适配。
GitHub Copilot SDK 将这些执行能力以可编程层的形式提供。团队可以专注于定义 软件应实现的功能,而不必在每次引入 AI 时都重新构建 编排方式。
只要你的应用能够触发逻辑,就能触发具代理性的执行。
作者
Gwen Davis – GitHub 高级内容策略师。她撰写关于开发者体验、AI 驱动工作流以及技术职业成长的内容。