AI工程与建筑系统:与Block的goose进行AI工程的一个月反思

发布: (2026年1月6日 GMT+8 06:53)
12 min read
原文: Dev.to

Source: Dev.to

请提供您希望翻译的正文内容,我将为您翻译成简体中文并保持原有的格式、Markdown 语法以及代码块和链接不变。

对使用 goose 的一个月 AI 工程的思考

一次由 goose(Block 出品)、MCPAnthropic 的 Sonnet 4.5MediaPipe(Google)、以可访问性为导向的 UI 设计以及完整的现代 AI 工具栈驱动的为期一个月的工程之旅。
在完成了十七个全栈应用后,我总结了以下收获,并说明了这套工作流为何从根本上改变了我的构建方式。

什么是 goose 以及它为何改变了我的工作流

  • goose Desktop – 一个可视化 IDE,允许你在不离开 UI 的情况下原型设计、调试并迭代 AI 增强的应用。
  • goose CLI – 用于脚本编写、自动化以及 CI/CD 集成的命令行工具。
  • YAML Recipes – 声明式、受版本控制的配置,用于描述数据管道、模型调用和 UI 组件。
  • MCP Auto Visualizers – 自动从模型输出生成交互式可视化,加速洞察发现。
  • Anthropic 的 Sonnet 4.5 + Goose API 集成 – 与最前沿的大语言模型进行低延迟、无缝调用,内置提示管理和响应处理。

Source:

为什么 Goose 是 AI 工程的游戏规则改变者

1. Goose 完全消除碎片化

“Goose eliminates that fragmentation entirely.”

统一上下文的力量

当你能够:

  • 立即看到更改的反映
  • 在不切换窗口的情况下检查工具输出
  • 在不添加控制台日志或重启进程的情况下调试状态

你就能保持 流畅——这是最佳工程发生的地方。

2. MCP:改变一切的协议

MCP 服务器让我能够:

  • 定义复杂的工具链
  • 管理有状态的工作流
  • 在没有常规开销的情况下交付动态 UI

因为 Goose 围绕 MCP 构建,一切都能无缝协同工作:

  • 工具之间可以相互通信
  • 状态能够正确持久化
  • 可视化会自动出现

该协议消除了整类集成问题,这些问题通常会消耗数小时的调试时间。

3. 速度与质量兼顾

  • YAML 配方 自动化多步骤工作流,智能管理复杂性。
  • 自动可视化器 即时渲染数据结构,提供更清晰的洞察,而不牺牲理解。
  • Sonnet 4.5 帮助重构代码或生成文档,起到补充而非取代工程判断的作用。

4. 充满活力的开发体验

多年来我使用过许多开发环境。有些功能强大却笨拙;有些优雅却受限。Goose 是第一个既 强大令人愉悦 的工具:

  • 优雅地处理复杂性,同时不妨碍你的工作
  • 在不让人不堪重负的配置下提供控制权
  • 对正确的事物持有明确观点,对其他一切保持灵活

5. 开发的未来已经到来

本月的实践证明我们正处于一个拐点。工具、协议和 AI 模型已经存在;Goose 将它们以一种事后看来必然却在实践中革命性的方式结合在一起。

The Agentic AI Foundation (AAIF)

由主要科技公司——包括 OpenAIBlockAnthropic——创建,并得到其他白金成员如 GoogleMicrosoftAmazon Web Services (AWS)BloombergCloudflare 支持的新代理组织称为 Agentic AI Foundation (AAIF)。该基金会于 2025 年 12月Linux Foundation 的旗下启动。

如果你对 AI 工程非常认真,想要在不牺牲质量的前提下更快地构建,并渴望一种令人振奋而非疲惫的开发体验,goose 是一个绝佳的补充。它不仅仅是一个工具;它让我们一窥在不久的将来,借助这些惊人的技术我们将如何构建软件。

Linux Foundation press release on AAIF

Anthropic的 Sonnet 4.5 和 Goose API 集成

  • 将 Sonnet 4.5 用作 AI 工程合作伙伴,用于:
    • 代码生成
    • 架构决策
    • 技术文档

MediaPipe:为应用构建空间智能

为什么 MediaPipe 很重要

  • 可访问性:无需深厚的机器学习专业知识或服务器端基础设施。
  • 实时处理:处理复杂度,让开发者专注于有意义的交互。

实际应用案例

  • 手势导航
  • 为无障碍设计的免手操作控制
  • 空间 UI 交互
  • 基于姿势的健身追踪界面

这些原型展示了空间智能如何让界面更具包容性和直观性。

该工作在真实工程中的应用

组件真实世界类比
MCP servers轻量级微服务
Dynamic HTML rendering内部仪表盘与管理工具
YAML recipes生产自动化流水线
Sonnet 4.5用于代码、设计和文档的 AI 合作伙伴
Accessibility work符合 WCAG 标准的 UI 规范
Spatial intelligence prototypes新兴的 AR 与多模态交互界面

“goose” 扩展了我的工作流,提供了一种更快速、更具表现力的方式来构建真实工程团队日常依赖的同等水平的系统。

Source:

一个月的技术、模式与系统

在十七个项目中,我大量使用了:

  • MCP 服务器 – 自定义工具层、状态引擎和渲染管线
  • 语义化 HTMLWCAGARIA 可访问性模式,以实现包容性设计
  • MediaPipe 用于空间智能
  • Anthropic Sonnet 4.5 用于 AI 增强的工程
  • goose Desktop & CLI 提供统一的开发体验
  • YAML 配方 用于自动化、可复现的工作流

最终思考

gooseMCPSonnet 4.5MediaPipe 与现代可访问性实践的融合表明,AI 增强的工程已经不再是遥远的愿景——它正发生在当下。拥抱这些工具,软件开发的未来将既 强大以人为本

概览

  • Glassmorphism、渐变和运动感知 UI – 现代、精致的界面
  • YAML 自动化配方 – 工作流编排变得简单
  • MediaPipe 与空间智能 – 多模态交互能力
  • JavaScript 与 TypeScript 全栈模式 – 强大的应用架构
  • 组织系统 – 架构图、规划文档和可复用的模式库

每个项目都建立在前一个项目的基础之上。工作流随着每次迭代变得越来越有结构、更加富有表现力且更令人愉快。

可访问性:为所有人构建

为什么可访问性对我很重要

可访问性设计的美妙之处在于它让所有人的应用程序都变得更好。

  • 清晰的语义化 HTML 改善 SEO 和代码可维护性。
  • 正确的 ARIA 标签 提升所有设备上的可用性。
  • 键盘导航 使高级用户受益。
  • 高对比度 帮助在强光或低光环境中的用户。

“当我们为可访问性设计时,我们也在为灵活性和韧性设计。”

WCAG 与 ARIA 的实践

  • 语义化 HTML – 使用正确的标题层级、地标区域以及有意义的元素选择。
  • ARIA 标签与角色 – 为屏幕阅读器和辅助技术提供上下文。
  • 键盘导航模式 – 确保每个交互元素都可以在没有鼠标的情况下访问和操作。
  • 颜色对比度 – 符合 WCAG AA 标准(普通文本 4.5:1,大文本 3:1)。
  • 焦点指示器 – 保持其清晰可见,且不要在没有替代方案的情况下移除。
  • 替代文本 – 编写有意义的描述;仅在装饰性图像时使用空的 alt=""
  • 错误识别与建议 – 帮助用户理解并纠正错误。
  • 响应式布局 – 在不同屏幕尺寸和缩放级别下工作,且不破坏功能。

实际影响

“每当我编写语义化 HTML、添加 ARIA 标签或测试键盘导航时,我就在选择包容而非排斥。这对我意义深远。”

前进

结束反思

这位 AI 工程师的下一步

这个月的密集工程是一个基础,而不是终点线。经过十七套全栈系统后,我正以空前的清晰度和结构性理解迈入 AI 工程之旅的下一阶段。

我在此次挑战中构建的项目刻意多样化:

  • 已部署的全栈应用
  • MCP 服务器
  • UI 引擎
  • 自动化工作流
  • 空间智能原型
  • 可访问性驱动的界面
  • 组织系统,这些系统现在从根本上塑造了我对软件开发的方式

下一步是将这些工作带出挑战,进入更广阔的 AI 工程社区。我将参加 Microsoft AI Tour 大会,继续完善和演进我的工作流,并探索这些模式如何扩展到更大、生产级别的系统。

我的目标

  • 推动 AI 工程和 AI 辅助开发的边界
  • 加深 MCP 集成
  • 丰富 UI 架构
  • 推进空间和多模态实验
  • 构建既统一又真正以人为中心的工具

此挑战可能已完成,但我的 AI 工程之旅仍将继续。我对接下来的发展充满了前所未有的期待。

这篇文章是我的 AI 工程之旅的一部分。关注我,获取更多与 Eri 一起进行的 AI 工程构建内容!

Back to Blog

相关文章

阅读更多 »

GLM-4.7-Flash

请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。

使用本地 LLM 发现高性能算法

我如何使用开源模型在高效代码生成的新前沿进行探索,使用我的 MacBook 和本地 LLM。该帖子《Using Local LLMs to Discover High…》。