构建 AI Protégé：与 Kiro 的一个月规格驱动开发

发布: 7小时前 (2025年12月5日 GMT+8 16:45)

8 min read

原文: Dev.to

Source: Dev.to

我目前在学习数据结构和算法。教材很枯燥。我可以通读章节，观看教程，感觉自己已经全部理解——但一周后全忘光了。

但每当我向别人解释某个概念时，它才真正记住。这就是费曼技巧——如果你不能把东西解释得很简单，你就没有真正理解它。还有橡皮鸭调试，你对着橡皮鸭解释代码来找 bug。

我想把这些想法结合起来。不是让 AI 教我，而是我教 AI。它有点像弗兰肯斯坦——通过教给一无所知的东西来让知识“活”起来。

我做了什么

AI Protégé 是一个学习应用，你教 AI 学生，而不是相反。

AI 结合了三种输入：你的画布绘图（视觉）、你的文字解释以及来自源材料的相关片段（RAG）。这种三输入方式让 AI 同时挑战清晰度和准确性。

技术栈： Next.js 15、Convex、Excalidraw、OpenAI、Clerk、Vercel。

即使是第一版也使用了规格。我创建了 ai-protege-learning-app 来定义最初的原型——一个简单的教学界面，你可以在画布上绘图并获得 AI 反馈。

原型可用，但用户体验很粗糙：

我很喜欢 Excalidraw，于是决定迁移（tldraw 的商业许可证需要付费）。迁移比预期更困难；Excalidraw 的文档并未覆盖所有细节，我只能在它们的 GitHub 仓库里寻找合适的 TypeScript 接口。

结果值得：

这是最难的部分。我在提交前的最后三天里一直在处理它，熬夜到凌晨 2 点。

目标： 在使用 RAG 对源材料进行事实核查的同时，实时流式传输 AI 的响应。

我最初给 Kiro 错误的文档——Convex Agents 流式文档。这些文档是为构建需要向数据库以及客户端流式发送增量的 AI 代理而写的。AI Protégé 并不是代理，它不执行代码。而且我们的模型（GPT‑4.1‑nano）响应速度极快，客户端尝试订阅时流已经标记为“已完成”。

Kiro 根据代理文档不断生成代码，导致流式失败却没有报错。建议的变通方案是使用 Vercel AI Action 进行流式，另用 Convex 调用做 RAG，这会产生两次 API 调用、增加延迟，并且在生成开始时缺失 RAG 上下文。我拒绝了。

阅读 Convex 的博客文章后，我找到了这篇关于持久文本流式的文章。解决方案更简单：直接使用带有 AI SDK streamText 的 Convex HTTP Action。HTTP Action 获取 RAG 片段，构建带源上下文的提示，并把响应流回客户端。无需代理框架。

在项目期间我创建了五个规格：

以下几条实践让规格更好用：

提前更充分地规划：在写代码前先设计详细的线框图和用户流程，并提前准备代码质量标准的指导文档。迁移时使用 Kiro 更加轻松——当需要改变方向时，只需创建新规格并系统性地完成。规格让整个过程变得可控。

我是为自己的需求构建的这个工具，所以会继续使用。未来的改进包括 bug 修复、语音输入/输出，甚至把 AI 学生变成不同场景下的头脑风暴伙伴。

此项目是为 Kiroween 黑客马拉松而构建的。