[Paper] AI 辅助编程在终端用户开发中的可行性
发布: (2025年12月5日 GMT+8 20:13)
6 min read
原文: arXiv
Source: arXiv - 2512.05666v1
Overview
Irene Weber 的论文探讨了大型语言模型(LLM)副驾驶是否能够取代——或至少增强——当今的低代码/无代码(LCNC)可视化构建器,用于 终端用户开发。通过对非程序员使用 AI 助手构建网页应用的小型用户研究,工作展示了“AI 辅助编码”不仅可行,而且受到参与者的欢迎,这暗示了组织让非技术员工创建数字工具方式的转变。
Key Contributions
- 实证证据 表明非程序员能够使用基于 LLM 的助手成功完成真实的编码任务。
- 比较 AI 辅助开发与传统可视化 LCNC 平台,概述了灵活性和降低供应商锁定等优势。
- 设计指南,用于将 AI 副驾驶集成到终端用户开发工作流中(提示构造、迭代细化、调试支持)。
- 对更广泛影响的讨论,涉及软件工程教育、工具生态系统以及组织数字化转型策略。
Methodology
- 参与者招募 – 从企业环境中挑选了 20 名没有正式编程背景的志愿者。
- 任务定义 – 每位参与者需要创建一个简单的 CRUD 网页应用(表单输入、列表视图、基本验证)。
- 工具 – 提供了基于聊天的 LLM 助手(类似于 ChatGPT/GPT‑4),以及代码编辑器和一键部署沙箱。
- 流程 – 参与者通过自然语言提示与 AI 交互,迭代完善生成的代码,直至应用正常运行。
- 收集的指标 – 完成时间、AI 助手交互次数、错误率以及任务后满意度调查。
- 分析 – 量化结果辅以定性反馈(开放式评论、观察到的策略)。
该研究刻意避免使用任何可视化拖拽构建器,强迫参与者仅依赖 AI 的代码生成能力。
Results & Findings
| Metric | Outcome |
|---|---|
| Task success rate | 85 %(17/20 位参与者交付了可工作的应用) |
| Average time to completion | 27 分钟(± 8 分钟)——与先前研究中报告的典型 LCNC 构建时间相当 |
| Prompt iterations | 中位数为 6 次交互(提示 → 代码 → 细化) |
| Error correction | 92 % 的错误在第一次 AI 建议的修复后得到解决,表明对话式调试效果显著 |
| User sentiment | 78 % 的参与者表示有信心 AI 辅助编码可以取代视觉 LCNC,完成许多常规任务 |
关键结论: 非技术用户能够利用 LLM 副驾驶快速生成可运行的代码,并且他们更欣赏对话式的“提问‑获取”工作流,而不是摆弄可视化块。
Practical Implications
- 工具供应商 可以将 LLM 副驾驶直接嵌入平台,提供一种混合 UI,让用户在可视化块和自然语言代码生成之间切换。
- 企业 IT 能够降低对专有 LCNC 堆栈的依赖,减少许可费用和供应商锁定,同时仍然赋能业务用户。
- 开发团队 可能从自行构建“一切”转向策划提示库和验证流水线,以保证代码质量和安全性。
- 快速原型:产品经理可以在几分钟内搭建概念验证功能,然后将生成的代码交给工程师进行打磨,加速创新周期。
- 培训与入职:新员工或公民开发者可以通过对话式指导学习编程概念,无需正式课程即可缩短学习曲线。
Limitations & Future Work
- 样本规模与多样性——研究涉及的群体相对较小且同质化;需要在更广泛的人口统计(如不同技术素养、行业)中进行验证。
- 任务范围——仅测试了基础的 CRUD 网页应用;更复杂的工作流(集成、性能关键代码)可能会暴露当前 LLM 的弱点。
- 安全性与正确性——生成的代码未经过安全漏洞或长期可维护性审计;未来工作应加入静态分析和合规检查。
- 人机交互设计——最佳提示策略和 UI 赋能(如行内解释、版本控制)仍是开放的研究问题。
论文结论是,AI 辅助的终端用户编码是一种有前景且可行的范式,但要将其扩展到企业级应用仍需在鲁棒性、治理以及无缝的人机协作方面进行更深入的研究。
Authors
- Irene Weber
Paper Information
- arXiv ID: 2512.05666v1
- Categories: cs.LG, cs.AI, cs.SE
- Published: December 5, 2025
- PDF: Download PDF