[Paper] 面向需求工程中自然语言处理工具的软件参考架构
发布: (2026年2月20日 GMT+8 00:14)
5 分钟阅读
原文: arXiv
Source: arXiv - 2602.17498v1
概述
本文提出将为需求工程(RE)构建一次性、单体的自然语言处理(NLP)工具的做法,转变为创建一个模块化、可复用的生态系统。通过概述软件参考架构(SRA)和具体的研究路线图,作者旨在使 NLP‑for‑RE 工具更易于开发、比较和长期维护。
关键贡献
- 可互操作的 NLP4RE 生态系统愿景 – 从孤立工具转向可重用组件。
- 研究路线图,用于设计软件参考架构,遵循公认的 SRA 开发方法论。
- 以利益相关者为驱动的需求获取 – 通过焦点小组会议产生了 36 条通用系统需求,针对 NLP4RE 工具。
- 初步蓝图,确定核心架构层(例如,数据摄取、预处理、NLP 服务、RE‑特定分析、集成与编排)。
- 可持续性挑战讨论,如工具被废弃、缺乏基准测试、文档缺口,以及 SRA 如何缓解这些问题。
方法论
- Adopt a standard SRA development framework – the authors follow a well‑established, step‑by‑step process (requirements analysis, architectural design, validation, etc.).
- Stakeholder focus group – RE practitioners, NLP researchers, and tool developers participated in a structured workshop to surface common functional and non‑functional needs.
- Requirement synthesis – the raw input was distilled into 36 high‑level system requirements covering modularity, extensibility, configurability, traceability, and performance.
- Roadmap drafting – based on the requirements, the authors outline short‑, medium‑ and long‑term research activities needed to flesh out the SRA (e.g., defining component interfaces, creating reference implementations, establishing evaluation metrics).
The approach stays practical: rather than proposing a finished architecture, the paper builds a living blueprint that can evolve with community feedback.
结果与发现
- 36 条通用需求 已被识别,确认当前 NLP4RE 工具在许多方面需求重叠(例如,语言无关的预处理、可重用的分类流水线、对需求工件的可追溯性)。
- 明确的缺口 已被指出:大多数现有工具缺乏标准化的 API、版本管理以及即插即用模型,导致工作重复。
- SRA 的可行性 – 利益相关者共识表明,模块化参考架构将受到欢迎,并可作为工具开发者的通用“ lingua franca”。
实际意义
- 更快的原型开发 – 开发者可以通过将现有模块(例如分词器、领域特定分类器、验证引擎)串联起来,组装出新的 NLP4RE 解决方案,而无需从头编写所有代码。
- 更容易的基准测试 – 标准化接口使得在相同需求工程任务上对不同 NLP 技术进行公平、可复现的比较成为可能。
- 降低维护负担 – 模块化组件可以独立更新,延长工具的使用寿命,并降低在会议论文发表后被放弃的风险。
- 与 DevOps 流水线集成 – 提供 RESTful 或 gRPC API 的 SRA 能自然融入 CI/CD 工作流,实现持续交付中的自动化需求分析。
- 社区驱动的生态系统 – 开源仓库可以托管可复用的模块,鼓励贡献、共享最佳实践,并形成针对特定领域(如汽车、医疗)的插件市场。
限制与未来工作
- 范围仅限于需求收集 – 论文止步于需求和路线图阶段;具体的参考实现仍在待定。
- 利益相关者样本规模 – 焦点小组涉及相对较少、可能带有领域偏见的参与者,这可能无法捕捉所有行业细微差别。
- 工具异构性 – 协调多种编程语言、数据格式和遗留系统将是一项非平凡的工程挑战。
- 未来工作 包括构建原型模块、在真实的需求工程项目上验证架构,以及为生态系统建立治理机制(例如版本策略、安全标准)。
作者
- Julian Frattini
- Quim Motger
论文信息
- arXiv ID: 2602.17498v1
- 分类: cs.SE
- 出版日期: 2026年2月19日
- PDF: 下载 PDF