通过示例教学 AI 代理:自动化的新范式

发布: (2026年2月28日 GMT+8 06:56)
4 分钟阅读
原文: Dev.to

Source: Dev.to

Introduction

数十年来,我们一直通过明确的指令来教电脑:编写代码、定义选择器、处理每一种边缘情况。但如果我们能像教人类一样教 AI 代理——通过展示它们该怎么做,会怎样?

传统的浏览器自动化依赖脆弱的选择器和僵硬的脚本。当网站更新 CSS 类时,你的自动化会失效。当按钮位置移动时,你的脚本会出错。你并不是在描述想要完成的任务,而是精确规定了实现方式。这导致维护噩梦:每一次 UI 变动都需要更新代码,每一个新工作流都需要工程师投入时间。了解业务的领域专家若没有开发者的帮助,几乎无法实现自动化。

The Idea: Teaching by Demonstration

如果你只需录制自己执行任务的过程,让 AI 提取意图、工作流和决策点,这会怎样?这就是 SkillForge 的理念——一个将屏幕录制转换为结构化技能文件的工具,任何 AI 代理都可以执行这些文件。

How SkillForge Works

  1. Record – 捕捉你执行任意基于网页的任务的过程。
  2. Extract – AI 分析录制内容,识别目标、工作流和 UI 元素。
  3. Generate – 输出一个人类可读的 SKILL.md 文件,包含上下文感知的指令。
  4. Execute – 任意兼容的代理都可以执行该技能,并适应 UI 的变化。

Benefits

  • Resilience – 技能能够在 UI 更新后仍然可用,因为它们描述的是意图,而非具体选择器。
  • Accessibility – 领域专家无需编写代码即可创建自动化。
  • Portability – 技能可在不同的代理框架之间复用。
  • Transparency – 格式是人类可读且可审计的。

Skill File Format

生成的 SKILL.md 采用简单的 markdown 结构:

  • Goal – 代理应完成的目标。
  • Workflow – 步骤化的执行计划。
  • Context – 如何语义化地识别元素。
  • Error handling – 恢复策略。

Compatibility

该格式兼容 AutoGenLangChainCrewAI,或任何能够解析结构化指令的框架。

Looking Ahead

我们正迈向一个 AI 代理能够像人类一样通过观察学习的世界。通过演示而非代码捕获领域专长,将自动化的大门向所有人敞开。


如果只需要演示一次,你会让 AI 代理学习哪些工作流?

0 浏览
Back to Blog

相关文章

阅读更多 »