[Paper] AI 辅助编程在终端用户开发中的可行性

发布: (2025年12月5日 GMT+8 20:13)
6 min read
原文: arXiv

Source: arXiv - 2512.05666v1

Overview

Irene Weber 的论文探讨了大型语言模型(LLM)副驾驶是否能够取代——或至少增强——当今的低代码/无代码(LCNC)可视化构建器,用于 终端用户开发。通过对非程序员使用 AI 助手构建网页应用的小型用户研究,工作展示了“AI 辅助编码”不仅可行,而且受到参与者的欢迎,这暗示了组织让非技术员工创建数字工具方式的转变。

Key Contributions

  • 实证证据 表明非程序员能够使用基于 LLM 的助手成功完成真实的编码任务。
  • 比较 AI 辅助开发与传统可视化 LCNC 平台,概述了灵活性和降低供应商锁定等优势。
  • 设计指南,用于将 AI 副驾驶集成到终端用户开发工作流中(提示构造、迭代细化、调试支持)。
  • 对更广泛影响的讨论,涉及软件工程教育、工具生态系统以及组织数字化转型策略。

Methodology

  1. 参与者招募 – 从企业环境中挑选了 20 名没有正式编程背景的志愿者。
  2. 任务定义 – 每位参与者需要创建一个简单的 CRUD 网页应用(表单输入、列表视图、基本验证)。
  3. 工具 – 提供了基于聊天的 LLM 助手(类似于 ChatGPT/GPT‑4),以及代码编辑器和一键部署沙箱。
  4. 流程 – 参与者通过自然语言提示与 AI 交互,迭代完善生成的代码,直至应用正常运行。
  5. 收集的指标 – 完成时间、AI 助手交互次数、错误率以及任务后满意度调查。
  6. 分析 – 量化结果辅以定性反馈(开放式评论、观察到的策略)。

该研究刻意避免使用任何可视化拖拽构建器,强迫参与者仅依赖 AI 的代码生成能力。

Results & Findings

MetricOutcome
Task success rate85 %(17/20 位参与者交付了可工作的应用)
Average time to completion27 分钟(± 8 分钟)——与先前研究中报告的典型 LCNC 构建时间相当
Prompt iterations中位数为 6 次交互(提示 → 代码 → 细化)
Error correction92 % 的错误在第一次 AI 建议的修复后得到解决,表明对话式调试效果显著
User sentiment78 % 的参与者表示有信心 AI 辅助编码可以取代视觉 LCNC,完成许多常规任务

关键结论: 非技术用户能够利用 LLM 副驾驶快速生成可运行的代码,并且他们更欣赏对话式的“提问‑获取”工作流,而不是摆弄可视化块。

Practical Implications

  • 工具供应商 可以将 LLM 副驾驶直接嵌入平台,提供一种混合 UI,让用户在可视化块和自然语言代码生成之间切换。
  • 企业 IT 能够降低对专有 LCNC 堆栈的依赖,减少许可费用和供应商锁定,同时仍然赋能业务用户。
  • 开发团队 可能从自行构建“一切”转向策划提示库和验证流水线,以保证代码质量和安全性。
  • 快速原型:产品经理可以在几分钟内搭建概念验证功能,然后将生成的代码交给工程师进行打磨,加速创新周期。
  • 培训与入职:新员工或公民开发者可以通过对话式指导学习编程概念,无需正式课程即可缩短学习曲线。

Limitations & Future Work

  • 样本规模与多样性——研究涉及的群体相对较小且同质化;需要在更广泛的人口统计(如不同技术素养、行业)中进行验证。
  • 任务范围——仅测试了基础的 CRUD 网页应用;更复杂的工作流(集成、性能关键代码)可能会暴露当前 LLM 的弱点。
  • 安全性与正确性——生成的代码未经过安全漏洞或长期可维护性审计;未来工作应加入静态分析和合规检查。
  • 人机交互设计——最佳提示策略和 UI 赋能(如行内解释、版本控制)仍是开放的研究问题。

论文结论是,AI 辅助的终端用户编码是一种有前景且可行的范式,但要将其扩展到企业级应用仍需在鲁棒性、治理以及无缝的人机协作方面进行更深入的研究。

Authors

  • Irene Weber

Paper Information

  • arXiv ID: 2512.05666v1
  • Categories: cs.LG, cs.AI, cs.SE
  • Published: December 5, 2025
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »