[Paper] 从符号到意义:本体论与哲学反思——Large Language Models 在信息系统工程中的
发布: (2026年3月18日 GMT+8 20:26)
7 分钟阅读
原文: arXiv
Source: arXiv - 2603.17659v1
Overview
论文 From Symbol to Meaning 探讨了大型语言模型(LLMs)的兴起如何迫使我们重新思考信息系统工程(ISE)的哲学基础。作者通过将符号学、本体论和当代人工智能的思想交织在一起,主张 LLMs 不仅是强大的代码生成工具——它们充当“认知主体”,重塑我们对数据和系统的建模、表示和推理方式。
关键贡献
- 哲学重新构架: 将经典哲学传统(皮尔斯的符号学、海德格尔的本体论、弗洛里迪的信息哲学)与现代大型语言模型(LLM)的机制相连接。
- 本体论转变: 展示生成模型如何模糊 符号(原始 token)与 意义(上下文解释)之间的界限,挑战传统信息系统设计中使用的静态数据模型。
- 认识主体概念: 提出将 LLM 视为共同生成知识的主体,而非被动执行预定义逻辑的工具。
- 伦理蓝图: 概述一套透明性和以人为本的标准,指导 LLM 在企业信息系统中的整合。
- 设计意义: 提供一个高层次路线图,用于在保持可追溯性、问责制和可解释性的前提下嵌入基于 LLM 的组件。
方法论
作者采用概念‑分析方法:
- 文献综合: 回顾符号学、本体论和信息伦理学的关键著作,以构建哲学框架。
- 技术映射: 分解大型语言模型的内部工作流(分词 → 嵌入 → 基于Transformer的注意力 → 下一个标记预测),并将每一步与哲学中的符号、指涉和意义概念对应起来。
- 批判性反思: 通过思维实验和案例片段(例如,LLM生成的API规范、自动需求提取),展示传统信息系统模型何时成功或失效。
- 规范框架构建: 基于前述哲学分析,提出一套在模型自主性与人工监督之间取得平衡的设计原则。
该方法论保持在高层次——未报告新的实证实验——使论证对熟悉LLM工作原理但不熟悉深奥哲学术语的开发者也易于理解。
结果与发现
| 发现 | 对信息系统工程的意义 |
|---|---|
| 大型语言模型打破符号/意义层级 | 数据模式不再能被视为不可变的“真理”;它们会随着模型更新而成为流动的解释。 |
| 模型输出充当临时知识主张 | 系统设计者必须把大型语言模型的建议视为需要验证的假设,而非最终规范。 |
| 透明度缺口是认知风险 | 如果没有明确的来源信息(提示、温度、微调数据),下游系统将继承隐藏的偏见。 |
| 人机交互仍然是必需的 | 即使使用高性能的大型语言模型,领域专家仍需在生成的产物与监管/合规约束之间进行调解。 |
这些洞见共同表明,传统的“设计‑再‑实现”流程必须通过持续的验证循环和元数据追踪来增强。
实际影响
- Design‑by‑Prompt: 工程师可以通过提示 LLM 来原型化数据模型、API 合约或 UI 文本,但必须将带版本号的提示和响应日志嵌入 CI/CD 流程,以实现可审计性。
- Dynamic Schema Management: 采用支持 runtime(运行时)模式演进的 schema‑as‑code 工具(例如 Liquibase、dbt),由 LLM 生成的迁移驱动,并配合自动化回归测试。
- Explainability Layer: 为 LLM 调用加上“推理包装器”,捕获注意力权重、token 概率以及源数据片段,并向开发者和审计员公开这些信息。
- Ethical Guardrails: 实施基于策略的过滤器(如 OpenAI 的内容审查)以及在人类审查点之前对 LLM 输出进行人工复核,防止其影响生产系统。
- Knowledge‑Centric Architecture: 将纯数据中心的流水线转变为 knowledge‑centric(知识中心)流水线,让 LLM 参与推理层,并记录每次推理的来源信息。
简而言之,本文推动业界朝着 透明、负责且协同创造 的 AI 增强系统工程实践迈进。
限制与未来工作
- 概念范围: 本文停留在哲学和架构层面;未提供具体的性能基准或工具原型。
- 领域特定性: 虽然论点面向一般信息系统工程,但针对高度受监管行业(如金融、医疗)的具体指南留待后续工作。
- 实证验证: 未来研究可以开展案例研究,将所提出的设计原则应用于真实的 LLM 驱动系统,衡量其对可维护性、合规性和开发者生产力的影响。
对于渴望实验的开发者来说,一个实用的第一步是将每一次 LLM 交互(提示、参数、响应)记录到版本控制系统中。这一简单习惯符合论文对可追溯性的呼吁,并为作者设想的更复杂的以知识为中心的流水线奠定基础。
作者
- José Palazzo Moreira de Oliveira
论文信息
- arXiv ID: 2603.17659v1
- 分类: cs.SE
- 发表日期: 2026年3月18日
- PDF: Download PDF