[Paper] Proto-ML：用于 ML 解决方案原型设计的 IDE

发布: 3天前 (2026年2月25日 GMT+8 17:43)

6 分钟阅读

原文: arXiv

Source: arXiv - 2602.21734v1

概述

本文介绍了 Proto‑ML，一个专为机器学习（ML）原型开发而构建的集成开发环境（IDE），它能够简化整个原型生命周期。通过将实现、分析和知识管理工具相结合，Proto‑ML 解决了工作流碎片化、利益相关者可视性差以及可复用工件丢失等长期痛点。

作者将 Proto‑ML 构建为一套主流 IDE（如 VS Code）的插件。每个插件都会添加一个轻量级的 UI 面板：

团队在一小批数据科学家和领域专家（约 8 名参与者）中评估了该系统，参与者使用 Proto‑ML 构建了情感分析原型。他们测量了任务完成时间、创建的文档工件数量，并通过问卷收集了定性反馈。

30 % reduction 在平均时间上相比使用独立工具的基线工作流，缩短至达到“first viable prototype”。
参与者产出 twice as many documented evaluation checkpoints，表明可追溯性更丰富。
85 % of users 报告称 knowledge‑management view 帮助他们定位本来会重新构建的可复用组件。
利益相关者（非技术产品负责人）感到 more included，并引用 visual quality‑criteria dashboard 作为通向技术工作的桥梁。

更快的迭代周期：开发团队可以在不切换笔记本、CLI 脚本和外部仪表板的情况下快速创建并评估原型。
降低重复工作：组织可以构建一个持续更新的经过验证的预处理流水线、模型架构和评估脚本目录，新项目能够即时导入。
更好的治理与合规：内置的文档和来源追踪简化了受监管领域（金融、医疗）的审计追踪。
跨职能协作：产品经理、UX 设计师和数据工程师都可以查看并评论同一套工件，提前统一预期。
工具无关的可扩展性：由于这些捆绑包是插件，团队可以在现有技术栈（Jupyter、PyCharm 等）旁边使用 Proto‑ML，而不必被迫迁移到单一平台。

Proto‑ML 提供了一个有前景的步骤，使机器学习原型设计成为一项一流的协作活动——将常常混乱、孤立的过程转变为可重复、透明的工作流，开发者和产品团队都可以信赖。