AI 编码工具:为什么开发者意见不合
Source: Dev.to
你会听到两种截然不同的说法:
- 朋友(创业创始人) – “我们的团队现在使用 AI 两倍速交付功能。我很兴奋!”
- 开发者 – “我们试过了。我们花的 时间比自己写代码还多,都是在清理 AI 产生的代码。”
两者都没错。他们描述的是 不同的时刻,而这个领域的变化速度比大多数人意识到的要快得多。作为负责招聘、时间线和工具选择的人,你需要理解为什么这些体验会出现差异。
为什么对话感觉像辩论
人们在讨论 不同的时代 和 不同的工作流 时,好像它们是同一件事。当你与工程团队和创始人交谈时,常会遇到相同的 原型,每种原型对 AI 编码的体验截然不同。
1. 怀疑者
- 对象: 资深软件开发者。
- 时间: 在 一年或更久以前 试用了 AI 编码工具。
- 结果: 输出脆弱且充满 bug,需要大量清理,以至于自己手写代码更快。
- 结论: 工具尚未成熟——对当时而言是合理的判断。
- 当前立场: 没有重新尝试,因为他们不相信工具会如此快速地改变。
2. 机会再尝试者
- 对象: 与怀疑者相同类型的开发者,标准相同。
- 时间: 最近(在最新突破之后)尝试了 AI 工具。
- 结果: 对质量感到惊讶。现在信任 AI 并将其融入日常工作流:
- 自动化错误检测
- 事件响应
- 代码审查
- 测试生成
- 文档编写
- 结论: 不是炒作——一种 真正可用的技术。
3. 复制粘贴者
- 通过聊天窗口使用 AI,复制代码进出。
- 对 不熟悉的技术 有帮助,但被当作搜索引擎使用。
- 并未使用 AI 每天编写数十个文件。
4. 预算用户
- 使用 最便宜的订阅;经常触及 token 限额。
- 花在 编写提示词 上的时间比开发功能还多。
- 结果尚可,但摩擦感强。
- 常常自问:“到底有什么好大惊小怪的?”
5. 创始人‑构建者
- 几乎 全部使用 AI 构建产品——没有工程团队、没有代码审查,只有一个宏大的想法和高级订阅。
- 上线速度快;结果可能真的令人印象深刻。
- 没有人检查其内部实现。今天能用,但 未来的持久性 尚不确定。
数字背后的真实情况
如果你是做技术决策的人,这五位人士会给出 五个完全不同的答案 来回答“我们是否应该在开发中投资 AI?”他们都没有撒谎;只是使用 不同的工具、不同的时间段、不同的工作流。你不能把他们的经验当成在同一件事上进行比较。
2025 年11‑12月的突破
在 2025 年11月,三大 AI 公司发布了 改变开发者编写软件方式 的编码模型。
| 公司 | 模型 | 发布日期 | 变化内容 |
|---|---|---|---|
| Gemini 3 | 2025 年11月18日 | 能够理解项目结构,提出变更计划,协同修改多个文件,运行测试,捕获自身错误,并呈现干净、可审阅的结果。 | |
| Anthropic | Claude Opus 4.5 | 2025 年11月24日 | 具备与 Gemini 3 相同的跨步式变更能力。 |
| OpenAI | GPT‑5.2 | 2025 年12月11日 | 具备与 Gemini 3 相同的跨步式变更能力。 |
| OpenAI | GPT‑5.2‑Codex | 2025 年12月18日 | 具备与 Gemini 3 相同的跨步式变更能力。 |
这些发布并非源于单一突破。 模型变得更聪明,而 围绕这些模型构建的工具也同步成熟,从而在开发者生产力上实现了 跨步式提升。
这对您的决策意味着什么
1. 招聘
- 您所需的技能组合正在变化。
- 您可能需要更少的从头编写代码的人,但需要更有经验的工程师来审查和指导 AI。
- 架构和代码审查变得比以往任何时候都更有价值。
- 能评估 AI 生成代码的高级工程师,其价值可能超过三名编写样板代码的初级工程师。
- 如果您的招聘计划是六个月前制定的,可能需要重新审视。
2. 时间表
- 原本需要三个月的项目现在可能只需六周——前提是团队使用配套正确工作流的当前工具。
- 仍停留在复制粘贴模式的团队将看不到加速。
- 装备齐全的团队与其他团队之间的差距正在快速扩大,影响您的竞争地位。
3. 技术债务
- AI 生成的代码交付更快,但可能累积隐藏的质量问题:
- 冗长的逻辑
- 重复的模式
- 对边缘情况的浅层处理
- 没有经验丰富的监督,您就在用今天的速度换取六个月后昂贵的问题。
- 快速前进只有在没有在不稳固的基础上构建时才是优势。
4. 工具投资
- 每月 20 美元与每月 100 美元以上的差别并非虚荣,它改变了可能性。
- 在没有正确工作流的情况下花更多钱是浪费。
- 您需要一个深思熟虑的策略:合适的工具、合适的培训,以及懂得评估结果的人。
5. 团队意见有有效期
- 您的高级开发者在2025 年中关于 AI 编码的任何说法,可能已经过时。
- 这个领域以季度而非年份为单位快速变化。基于陈旧信息做出的决策会产生真实成本。
一个安全的起点
考虑你的 QA 团队。AI 在 编写自动化测试 方面表现出色。从这里开始,你可以立即获得收益,同时培养必要的审查专长。
向团队提出的问题
你不需要成为技术专家就能做出更好的决策,但你必须提出正确的问题。以下是一些可以作为起点的问题:
- 你上一次认真评估 AI 编码工具是什么时候?
- 你测试了哪个模型或产品,具体日期是什么?
- 你使用了什么工作流(复制‑粘贴、集成 IDE 插件、全项目重构等)?
- 在提示工程上花了多少时间,相比实际开发?
- AI 生成的代码与手动清理的比例是多少?
- 你使用的是哪一层级的工具(免费、基础、付费)?
- 你跟踪了哪些指标(周期时间、缺陷数量、发布后缺陷、开发者满意度)?
- 你如何处理 AI 生成输出的代码审查和质量门禁流程?
- 从 AI 生成的代码中出现了哪些技术债务问题(如果有的话)?
- 哪些培训或入职指导可以帮助团队更有效地使用最新工具?
回答这些问题将为你提供一个 当前、可比的快照,帮助了解组织的现状以及未来可能的发展方向。
评估时间
答案在 2025 年 10 月之前,评估已过时。如今可用的工具明显优于六个月前的工具。
工具使用
- 我们是否使用 Cursor、Codex 或 Claude Code 等工具?
- 如果不使用,真实原因是什么?
- 如果使用,流程是怎样的,我们如何检查结果?
对下个季度路线图的影响
如果 AI 工具将实施时间缩短 40%,我们的下个季度路线图会有什么变化?
这个问题迫使你的团队考虑 战略影响,而不仅仅是工具偏好。
所有权与持续评估
- 我们是否有专人保持对该领域的最新了解?
- 形势变化迅速,需要有人负责。
- 责任包括:
- 评估新工具。
- 更新工作流程。
- 将可能的方案转化为贵公司实际应采取的行动。
结论
AI 编码的争论其实根本不是争论。人们把不同的时代和不同的工作流描述成好像它们拥有相同的体验——其实并非如此。
变化的速度意味着你的团队视角的保质期是 几个月,而不是几年。拥有能够剖析噪音、评估真实情况并将其转化为你的路线图和招聘计划的人,决定了是 乘风破浪 还是 在岸边观望。
本文最初发表于 kamenski.me。