我使用 Gemini Pro 3 构建了一个 13 应用的‘Zoo’。约束:我不被允许检查代码。

发布: (2025年12月15日 GMT+8 04:38)
3 min read
原文: Dev.to

Source: Dev.to

引言

我最近决定测试“Vibe Coding”的极限。我想知道:是否可以在完全不以传统工程师方式行事的前提下,构建一个稳健的微应用平台?为此,我搭建了 AppZoo

实验规则

  • 零手动代码检查——我不允许阅读任何生成的代码。
  • 如果 Gemini 写了 React 组件,我不能审计其语法。
  • 如果 Copilot 提出了 Terraform 配置,我必须原样部署。
  • 我的角色仅限于“产品经理”和“质量保证”。我只能验证行为,不能检查实现。

盲目信任方法论

逻辑检查(数学)

对于 双燃料计算器,我先在电子表格中建立模型,以得到预期答案。随后把需求喂给 Gemini。AI 不仅匹配了我的表格,还对逻辑进行了优化,以比我的手工模型更高的精度处理温度阈值。我验证了输出,并信任代码能够得出该结果。

感受检查(视觉)

对于 分形浏览器视频转 GIF 转换器,测试计划是体验式的。如果分形能够平滑缩放,或 GIF 能快速渲染,则该应用通过。

架构:沙箱安全

运行未经检查的 AI 代码风险很大,因此我通过让 AI 使用 Terraform 构建 域隔离模型 来降低风险:

  • 每个微应用都拥有自己的子域(例如 zork.appzoo...dualfuel.appzoo...)。
  • 这利用了浏览器的同源策略,防止被攻破的应用访问主站的 cookie 或 localStorage
  • 整个 “Zoo” 完全在客户端运行;没有后端可被攻击。

摩擦点

AI 经常陷入“循环推理”死循环,连续三次提出相同的错误修复方案。

解决方案

我发现 模型切换 是最好的调试手段。当 Gemini Pro 卡住时,我切换 Copilot 到另一个底层模型,便能把它从循环中拉出来。

结果

最终得到 13 个可用应用,涵盖实用工具(热泵成本分析)到纯娱乐(无限 Zork、3D CSS 工作室)。虽然仍有一些我尚未发现的 bug,且代码有点凌乱,但它已经可以使用。

您可以在此探索整个 Zoo:

Back to Blog

相关文章

阅读更多 »