PowerSkills:让 AI 代理人通过 PowerShell 控制 Windows
Source: Dev.to
概览
PowerSkills 是一个开源的 PowerShell 工具包,为 AI 代理提供对 Windows 的结构化控制。它提供了 Outlook 邮件、Edge 浏览器、桌面窗口以及系统操作的动作,每个动作都会返回干净、可解析的 JSON。
功能
- Outlook – 通过 COM 自动化读取收件箱、搜索邮件、发送消息、访问日历事件。
- 浏览器 – 通过 Chrome DevTools Protocol (CDP) 控制 Edge:列出标签页、导航、截取屏幕、与 DOM 交互。
- 桌面 – 使用 Win32 API 管理窗口、捕获截图、读写剪贴板、发送按键。
- 系统 – 查询系统信息、管理进程、执行命令、读取环境变量。
所有动作返回统一的 JSON 包装,省去正则解析的需求:
{
"status": "success",
"exit_code": 0,
"data": {
"hostname": "WORKSTATION-01",
"os": "Microsoft Windows 11 Pro",
"memory_gb": 32
},
"timestamp": "2026-03-06T17:30:00Z"
}
代理可以检查 status,提取 data,并直接处理错误。
使用方法
调度器模式
.\powerskills.ps1 system info
.\powerskills.ps1 outlook inbox --limit 5
.\powerskills.ps1 browser tabs
.\powerskills.ps1 desktop screenshot --path C:\temp\screen.png
独立模式
.\skills\system\system.ps1 info
.\skills\outlook\outlook.ps1 inbox --limit 5
技能元数据
每个技能都包含一个 SKILL.md 文件,内含结构化的元数据,如名称、描述、可用动作和参数。这使得 AI 代理能够在无需硬编码指令的情况下发现功能。
安装
无需包管理器或安装程序——只需在 Windows 10/11 上拥有 PowerShell 5.1+。
-
克隆或下载仓库。
-
运行列表命令:
.\powerskills.ps1 list
对于浏览器技能,使用远程调试模式启动 Edge:
Start-Process "msedge.exe" "--remote-debugging-port=9222"
如果脚本被阻止,设置执行策略:
Set-ExecutionPolicy -Scope CurrentUser -ExecutionPolicy RemoteSigned
许可证与贡献
PowerSkills 在 MIT 许可证下发布。欢迎贡献、提交问题报告以及加星:
行动号召
如果你正在构建需要与 Windows 交互的代理,欢迎分享你的实现方式,并建议更多对代理工作流有用的 Windows 功能。