[Paper] 从符号到意义:本体论与哲学反思——Large Language Models 在信息系统工程中的

发布: (2026年3月18日 GMT+8 20:26)
7 分钟阅读
原文: arXiv

Source: arXiv - 2603.17659v1

Overview

论文 From Symbol to Meaning 探讨了大型语言模型(LLMs)的兴起如何迫使我们重新思考信息系统工程(ISE)的哲学基础。作者通过将符号学、本体论和当代人工智能的思想交织在一起,主张 LLMs 不仅是强大的代码生成工具——它们充当“认知主体”,重塑我们对数据和系统的建模、表示和推理方式。

关键贡献

  • 哲学重新构架: 将经典哲学传统(皮尔斯的符号学、海德格尔的本体论、弗洛里迪的信息哲学)与现代大型语言模型(LLM)的机制相连接。
  • 本体论转变: 展示生成模型如何模糊 符号(原始 token)与 意义(上下文解释)之间的界限,挑战传统信息系统设计中使用的静态数据模型。
  • 认识主体概念: 提出将 LLM 视为共同生成知识的主体,而非被动执行预定义逻辑的工具。
  • 伦理蓝图: 概述一套透明性和以人为本的标准,指导 LLM 在企业信息系统中的整合。
  • 设计意义: 提供一个高层次路线图,用于在保持可追溯性、问责制和可解释性的前提下嵌入基于 LLM 的组件。

方法论

作者采用概念‑分析方法:

  1. 文献综合: 回顾符号学、本体论和信息伦理学的关键著作,以构建哲学框架。
  2. 技术映射: 分解大型语言模型的内部工作流(分词 → 嵌入 → 基于Transformer的注意力 → 下一个标记预测),并将每一步与哲学中的符号、指涉和意义概念对应起来。
  3. 批判性反思: 通过思维实验和案例片段(例如,LLM生成的API规范、自动需求提取),展示传统信息系统模型何时成功或失效。
  4. 规范框架构建: 基于前述哲学分析,提出一套在模型自主性与人工监督之间取得平衡的设计原则。

该方法论保持在高层次——未报告新的实证实验——使论证对熟悉LLM工作原理但不熟悉深奥哲学术语的开发者也易于理解。

结果与发现

发现对信息系统工程的意义
大型语言模型打破符号/意义层级数据模式不再能被视为不可变的“真理”;它们会随着模型更新而成为流动的解释。
模型输出充当临时知识主张系统设计者必须把大型语言模型的建议视为需要验证的假设,而非最终规范。
透明度缺口是认知风险如果没有明确的来源信息(提示、温度、微调数据),下游系统将继承隐藏的偏见。
人机交互仍然是必需的即使使用高性能的大型语言模型,领域专家仍需在生成的产物与监管/合规约束之间进行调解。

这些洞见共同表明,传统的“设计‑再‑实现”流程必须通过持续的验证循环和元数据追踪来增强。

实际影响

  1. Design‑by‑Prompt: 工程师可以通过提示 LLM 来原型化数据模型、API 合约或 UI 文本,但必须将带版本号的提示和响应日志嵌入 CI/CD 流程,以实现可审计性。
  2. Dynamic Schema Management: 采用支持 runtime(运行时)模式演进的 schema‑as‑code 工具(例如 Liquibase、dbt),由 LLM 生成的迁移驱动,并配合自动化回归测试。
  3. Explainability Layer: 为 LLM 调用加上“推理包装器”,捕获注意力权重、token 概率以及源数据片段,并向开发者和审计员公开这些信息。
  4. Ethical Guardrails: 实施基于策略的过滤器(如 OpenAI 的内容审查)以及在人类审查点之前对 LLM 输出进行人工复核,防止其影响生产系统。
  5. Knowledge‑Centric Architecture: 将纯数据中心的流水线转变为 knowledge‑centric(知识中心)流水线,让 LLM 参与推理层,并记录每次推理的来源信息。

简而言之,本文推动业界朝着 透明、负责且协同创造 的 AI 增强系统工程实践迈进。

限制与未来工作

  • 概念范围: 本文停留在哲学和架构层面;未提供具体的性能基准或工具原型。
  • 领域特定性: 虽然论点面向一般信息系统工程,但针对高度受监管行业(如金融、医疗)的具体指南留待后续工作。
  • 实证验证: 未来研究可以开展案例研究,将所提出的设计原则应用于真实的 LLM 驱动系统,衡量其对可维护性、合规性和开发者生产力的影响。

对于渴望实验的开发者来说,一个实用的第一步是将每一次 LLM 交互(提示、参数、响应)记录到版本控制系统中。这一简单习惯符合论文对可追溯性的呼吁,并为作者设想的更复杂的以知识为中心的流水线奠定基础。

作者

  • José Palazzo Moreira de Oliveira

论文信息

  • arXiv ID: 2603.17659v1
  • 分类: cs.SE
  • 发表日期: 2026年3月18日
  • PDF: Download PDF
0 浏览
Back to Blog

相关文章

阅读更多 »