AI工程与建筑系统:与Block的goose进行AI工程的一个月反思
Source: Dev.to
请提供您希望翻译的正文内容,我将为您翻译成简体中文并保持原有的格式、Markdown 语法以及代码块和链接不变。
对使用 goose 的一个月 AI 工程的思考
一次由 goose(Block 出品)、MCP、Anthropic 的 Sonnet 4.5、MediaPipe(Google)、以可访问性为导向的 UI 设计以及完整的现代 AI 工具栈驱动的为期一个月的工程之旅。
在完成了十七个全栈应用后,我总结了以下收获,并说明了这套工作流为何从根本上改变了我的构建方式。
什么是 goose 以及它为何改变了我的工作流
- goose Desktop – 一个可视化 IDE,允许你在不离开 UI 的情况下原型设计、调试并迭代 AI 增强的应用。
- goose CLI – 用于脚本编写、自动化以及 CI/CD 集成的命令行工具。
- YAML Recipes – 声明式、受版本控制的配置,用于描述数据管道、模型调用和 UI 组件。
- MCP Auto Visualizers – 自动从模型输出生成交互式可视化,加速洞察发现。
- Anthropic 的 Sonnet 4.5 + Goose API 集成 – 与最前沿的大语言模型进行低延迟、无缝调用,内置提示管理和响应处理。
Source: …
为什么 Goose 是 AI 工程的游戏规则改变者
1. Goose 完全消除碎片化
“Goose eliminates that fragmentation entirely.”
统一上下文的力量
当你能够:
- 立即看到更改的反映
- 在不切换窗口的情况下检查工具输出
- 在不添加控制台日志或重启进程的情况下调试状态
你就能保持 流畅——这是最佳工程发生的地方。
2. MCP:改变一切的协议
MCP 服务器让我能够:
- 定义复杂的工具链
- 管理有状态的工作流
- 在没有常规开销的情况下交付动态 UI
因为 Goose 围绕 MCP 构建,一切都能无缝协同工作:
- 工具之间可以相互通信
- 状态能够正确持久化
- 可视化会自动出现
该协议消除了整类集成问题,这些问题通常会消耗数小时的调试时间。
3. 速度与质量兼顾
- YAML 配方 自动化多步骤工作流,智能管理复杂性。
- 自动可视化器 即时渲染数据结构,提供更清晰的洞察,而不牺牲理解。
- Sonnet 4.5 帮助重构代码或生成文档,起到补充而非取代工程判断的作用。
4. 充满活力的开发体验
多年来我使用过许多开发环境。有些功能强大却笨拙;有些优雅却受限。Goose 是第一个既 强大 又 令人愉悦 的工具:
- 优雅地处理复杂性,同时不妨碍你的工作
- 在不让人不堪重负的配置下提供控制权
- 对正确的事物持有明确观点,对其他一切保持灵活
5. 开发的未来已经到来
本月的实践证明我们正处于一个拐点。工具、协议和 AI 模型已经存在;Goose 将它们以一种事后看来必然却在实践中革命性的方式结合在一起。
The Agentic AI Foundation (AAIF)
由主要科技公司——包括 OpenAI、Block 和 Anthropic——创建,并得到其他白金成员如 Google、Microsoft、Amazon Web Services (AWS)、Bloomberg 和 Cloudflare 支持的新代理组织称为 Agentic AI Foundation (AAIF)。该基金会于 2025 年 12月 在 Linux Foundation 的旗下启动。
如果你对 AI 工程非常认真,想要在不牺牲质量的前提下更快地构建,并渴望一种令人振奋而非疲惫的开发体验,goose 是一个绝佳的补充。它不仅仅是一个工具;它让我们一窥在不久的将来,借助这些惊人的技术我们将如何构建软件。
Linux Foundation press release on AAIF
Anthropic的 Sonnet 4.5 和 Goose API 集成
- 将 Sonnet 4.5 用作 AI 工程合作伙伴,用于:
- 代码生成
- 架构决策
- 技术文档
MediaPipe:为应用构建空间智能
为什么 MediaPipe 很重要
- 可访问性:无需深厚的机器学习专业知识或服务器端基础设施。
- 实时处理:处理复杂度,让开发者专注于有意义的交互。
实际应用案例
- 手势导航
- 为无障碍设计的免手操作控制
- 空间 UI 交互
- 基于姿势的健身追踪界面
这些原型展示了空间智能如何让界面更具包容性和直观性。
该工作在真实工程中的应用
| 组件 | 真实世界类比 |
|---|---|
| MCP servers | 轻量级微服务 |
| Dynamic HTML rendering | 内部仪表盘与管理工具 |
| YAML recipes | 生产自动化流水线 |
| Sonnet 4.5 | 用于代码、设计和文档的 AI 合作伙伴 |
| Accessibility work | 符合 WCAG 标准的 UI 规范 |
| Spatial intelligence prototypes | 新兴的 AR 与多模态交互界面 |
“goose” 扩展了我的工作流,提供了一种更快速、更具表现力的方式来构建真实工程团队日常依赖的同等水平的系统。
Source: …
一个月的技术、模式与系统
在十七个项目中,我大量使用了:
- MCP 服务器 – 自定义工具层、状态引擎和渲染管线
- 语义化 HTML、WCAG 与 ARIA 可访问性模式,以实现包容性设计
- MediaPipe 用于空间智能
- Anthropic Sonnet 4.5 用于 AI 增强的工程
- goose Desktop & CLI 提供统一的开发体验
- YAML 配方 用于自动化、可复现的工作流
最终思考
goose、MCP、Sonnet 4.5、MediaPipe 与现代可访问性实践的融合表明,AI 增强的工程已经不再是遥远的愿景——它正发生在当下。拥抱这些工具,软件开发的未来将既 强大 又 以人为本。
概览
- Glassmorphism、渐变和运动感知 UI – 现代、精致的界面
- YAML 自动化配方 – 工作流编排变得简单
- MediaPipe 与空间智能 – 多模态交互能力
- JavaScript 与 TypeScript 全栈模式 – 强大的应用架构
- 组织系统 – 架构图、规划文档和可复用的模式库
每个项目都建立在前一个项目的基础之上。工作流随着每次迭代变得越来越有结构、更加富有表现力且更令人愉快。
可访问性:为所有人构建
为什么可访问性对我很重要
可访问性设计的美妙之处在于它让所有人的应用程序都变得更好。
- 清晰的语义化 HTML 改善 SEO 和代码可维护性。
- 正确的 ARIA 标签 提升所有设备上的可用性。
- 键盘导航 使高级用户受益。
- 高对比度 帮助在强光或低光环境中的用户。
“当我们为可访问性设计时,我们也在为灵活性和韧性设计。”
WCAG 与 ARIA 的实践
- 语义化 HTML – 使用正确的标题层级、地标区域以及有意义的元素选择。
- ARIA 标签与角色 – 为屏幕阅读器和辅助技术提供上下文。
- 键盘导航模式 – 确保每个交互元素都可以在没有鼠标的情况下访问和操作。
- 颜色对比度 – 符合 WCAG AA 标准(普通文本 4.5:1,大文本 3:1)。
- 焦点指示器 – 保持其清晰可见,且不要在没有替代方案的情况下移除。
- 替代文本 – 编写有意义的描述;仅在装饰性图像时使用空的
alt=""。 - 错误识别与建议 – 帮助用户理解并纠正错误。
- 响应式布局 – 在不同屏幕尺寸和缩放级别下工作,且不破坏功能。
实际影响
“每当我编写语义化 HTML、添加 ARIA 标签或测试键盘导航时,我就在选择包容而非排斥。这对我意义深远。”
前进
结束反思
这位 AI 工程师的下一步
这个月的密集工程是一个基础,而不是终点线。经过十七套全栈系统后,我正以空前的清晰度和结构性理解迈入 AI 工程之旅的下一阶段。
我在此次挑战中构建的项目刻意多样化:
- 已部署的全栈应用
- MCP 服务器
- UI 引擎
- 自动化工作流
- 空间智能原型
- 可访问性驱动的界面
- 组织系统,这些系统现在从根本上塑造了我对软件开发的方式
下一步是将这些工作带出挑战,进入更广阔的 AI 工程社区。我将参加 Microsoft AI Tour 大会,继续完善和演进我的工作流,并探索这些模式如何扩展到更大、生产级别的系统。
我的目标
- 推动 AI 工程和 AI 辅助开发的边界
- 加深 MCP 集成
- 丰富 UI 架构
- 推进空间和多模态实验
- 构建既统一又真正以人为中心的工具
此挑战可能已完成,但我的 AI 工程之旅仍将继续。我对接下来的发展充满了前所未有的期待。
这篇文章是我的 AI 工程之旅的一部分。关注我,获取更多与 Eri 一起进行的 AI 工程构建内容!