PowerSkills:让 AI 代理人通过 PowerShell 控制 Windows

发布: (2026年3月7日 GMT+8 16:41)
3 分钟阅读
原文: Dev.to

Source: Dev.to

概览

PowerSkills 是一个开源的 PowerShell 工具包,为 AI 代理提供对 Windows 的结构化控制。它提供了 Outlook 邮件、Edge 浏览器、桌面窗口以及系统操作的动作,每个动作都会返回干净、可解析的 JSON。

功能

  • Outlook – 通过 COM 自动化读取收件箱、搜索邮件、发送消息、访问日历事件。
  • 浏览器 – 通过 Chrome DevTools Protocol (CDP) 控制 Edge:列出标签页、导航、截取屏幕、与 DOM 交互。
  • 桌面 – 使用 Win32 API 管理窗口、捕获截图、读写剪贴板、发送按键。
  • 系统 – 查询系统信息、管理进程、执行命令、读取环境变量。

所有动作返回统一的 JSON 包装,省去正则解析的需求:

{
  "status": "success",
  "exit_code": 0,
  "data": {
    "hostname": "WORKSTATION-01",
    "os": "Microsoft Windows 11 Pro",
    "memory_gb": 32
  },
  "timestamp": "2026-03-06T17:30:00Z"
}

代理可以检查 status,提取 data,并直接处理错误。

使用方法

调度器模式

.\powerskills.ps1 system info
.\powerskills.ps1 outlook inbox --limit 5
.\powerskills.ps1 browser tabs
.\powerskills.ps1 desktop screenshot --path C:\temp\screen.png

独立模式

.\skills\system\system.ps1 info
.\skills\outlook\outlook.ps1 inbox --limit 5

技能元数据

每个技能都包含一个 SKILL.md 文件,内含结构化的元数据,如名称、描述、可用动作和参数。这使得 AI 代理能够在无需硬编码指令的情况下发现功能。

安装

无需包管理器或安装程序——只需在 Windows 10/11 上拥有 PowerShell 5.1+。

  1. 克隆或下载仓库。

  2. 运行列表命令:

    .\powerskills.ps1 list

对于浏览器技能,使用远程调试模式启动 Edge:

Start-Process "msedge.exe" "--remote-debugging-port=9222"

如果脚本被阻止,设置执行策略:

Set-ExecutionPolicy -Scope CurrentUser -ExecutionPolicy RemoteSigned

许可证与贡献

PowerSkills 在 MIT 许可证下发布。欢迎贡献、提交问题报告以及加星:

github.com/aloth/PowerSkills

行动号召

如果你正在构建需要与 Windows 交互的代理,欢迎分享你的实现方式,并建议更多对代理工作流有用的 Windows 功能。

0 浏览
Back to Blog

相关文章

阅读更多 »

AI、人类与我们打破的循环

🌅 经验的回响 — 站在地平线 曾经有一段时间,混沌塑造了我。但当我真正选择了自己——真正选择了自己——一切都改变了。我…