我使用 Gemini Pro 3 构建了一个 13 应用的‘Zoo’。约束:我不被允许检查代码。
Source: Dev.to
引言
我最近决定测试“Vibe Coding”的极限。我想知道:是否可以在完全不以传统工程师方式行事的前提下,构建一个稳健的微应用平台?为此,我搭建了 AppZoo。
实验规则
- 零手动代码检查——我不允许阅读任何生成的代码。
- 如果 Gemini 写了 React 组件,我不能审计其语法。
- 如果 Copilot 提出了 Terraform 配置,我必须原样部署。
- 我的角色仅限于“产品经理”和“质量保证”。我只能验证行为,不能检查实现。
盲目信任方法论
逻辑检查(数学)
对于 双燃料计算器,我先在电子表格中建立模型,以得到预期答案。随后把需求喂给 Gemini。AI 不仅匹配了我的表格,还对逻辑进行了优化,以比我的手工模型更高的精度处理温度阈值。我验证了输出,并信任代码能够得出该结果。
感受检查(视觉)
对于 分形浏览器 和 视频转 GIF 转换器,测试计划是体验式的。如果分形能够平滑缩放,或 GIF 能快速渲染,则该应用通过。
架构:沙箱安全
运行未经检查的 AI 代码风险很大,因此我通过让 AI 使用 Terraform 构建 域隔离模型 来降低风险:
- 每个微应用都拥有自己的子域(例如
zork.appzoo...、dualfuel.appzoo...)。 - 这利用了浏览器的同源策略,防止被攻破的应用访问主站的 cookie 或
localStorage。 - 整个 “Zoo” 完全在客户端运行;没有后端可被攻击。
摩擦点
AI 经常陷入“循环推理”死循环,连续三次提出相同的错误修复方案。
解决方案
我发现 模型切换 是最好的调试手段。当 Gemini Pro 卡住时,我切换 Copilot 到另一个底层模型,便能把它从循环中拉出来。
结果
最终得到 13 个可用应用,涵盖实用工具(热泵成本分析)到纯娱乐(无限 Zork、3D CSS 工作室)。虽然仍有一些我尚未发现的 bug,且代码有点凌乱,但它已经可以使用。
您可以在此探索整个 Zoo: