本地 AI 代理缺失的控制平面

发布: 1天前 (2026年5月4日 GMT+8 03:23)

5 分钟阅读

原文: Dev.to

Source: Dev.to

（请提供要翻译的正文内容，我才能为您完成简体中文翻译。）

当前移动 AI 代理的问题

控制平面位于模型的下方，并负责：

Source:

Drengr 提供了三个简单的 MCP（Model‑Control‑Protocol）工具，任何支持该协议的 AI 客户端都可以使用（例如 Claude Desktop、Cursor、Windsurf）。

这三个动词取代了脆弱的选择器、XPath 操作或持续运行的 Appium 守护进程。

观察
```
drengr_look
```
Drengr 捕获屏幕截图，导出 UI 树，并构建紧凑的文本描述（约 300 个 token，相比图像约 100 KB）。
决策

模型处理该描述并返回一个 JSON 包，描述所需的操作。
执行与反馈
```
drengr_do
```
Drengr 执行操作，生成 情境报告（相对于前一状态的差异），并将其反馈给模型以进行下一轮迭代。

情境报告是大多数框架缺失的部分；如果没有它，模型在步骤之间是盲目的，可能会过度行动（例如，反复点击一个失效的按钮）。

Concern	Cloud‑only assistants struggle with
Latency	当你手持手机时，两秒的往返延迟让人感觉很糟糕。
Privacy	银行、健康和消息数据应保留在设备上。
Network independence	地铁、飞机或不稳定的 Wi‑Fi 不应让助手瘫痪。

随着本地模型变得无处不在，控制平面也必须在本地运行。Drengr 的静态二进制设计体现了这一需求。

使用上述三种工具，设备端代理可以：

这些场景需要 hands‑and‑eyes 基础设施，而不是新的模型能力。

Drengr 可免费使用。只需两条命令即可安装并验证：

# Install via Claude Code (or run directly)
claude mcp add drengr -- npx -y drengr mcp

# Verify the installation
drengr doctor

将你的 AI 代理指向正在运行的 Drengr 实例，即可观察模型以真实的手部动作进行操作。

Rust 实现是经过深思熟虑的选择——详情请参阅单独的帖子。