[Paper] 从符号到意义：本体论与哲学反思——Large Language Models 在信息系统工程中的

发布: 2天前 (2026年3月18日 GMT+8 20:26)

7 分钟阅读

原文: arXiv

Source: arXiv - 2603.17659v1

Overview

论文 From Symbol to Meaning 探讨了大型语言模型（LLMs）的兴起如何迫使我们重新思考信息系统工程（ISE）的哲学基础。作者通过将符号学、本体论和当代人工智能的思想交织在一起，主张 LLMs 不仅是强大的代码生成工具——它们充当“认知主体”，重塑我们对数据和系统的建模、表示和推理方式。

关键贡献

哲学重新构架： 将经典哲学传统（皮尔斯的符号学、海德格尔的本体论、弗洛里迪的信息哲学）与现代大型语言模型（LLM）的机制相连接。
本体论转变： 展示生成模型如何模糊符号（原始 token）与意义（上下文解释）之间的界限，挑战传统信息系统设计中使用的静态数据模型。
认识主体概念： 提出将 LLM 视为共同生成知识的主体，而非被动执行预定义逻辑的工具。
伦理蓝图： 概述一套透明性和以人为本的标准，指导 LLM 在企业信息系统中的整合。
设计意义： 提供一个高层次路线图，用于在保持可追溯性、问责制和可解释性的前提下嵌入基于 LLM 的组件。

方法论

作者采用概念‑分析方法：

文献综合: 回顾符号学、本体论和信息伦理学的关键著作，以构建哲学框架。
技术映射: 分解大型语言模型的内部工作流（分词 → 嵌入 → 基于Transformer的注意力 → 下一个标记预测），并将每一步与哲学中的符号、指涉和意义概念对应起来。
批判性反思: 通过思维实验和案例片段（例如，LLM生成的API规范、自动需求提取），展示传统信息系统模型何时成功或失效。
规范框架构建: 基于前述哲学分析，提出一套在模型自主性与人工监督之间取得平衡的设计原则。

该方法论保持在高层次——未报告新的实证实验——使论证对熟悉LLM工作原理但不熟悉深奥哲学术语的开发者也易于理解。

结果与发现

发现	对信息系统工程的意义
大型语言模型打破符号/意义层级	数据模式不再能被视为不可变的“真理”；它们会随着模型更新而成为流动的解释。
模型输出充当临时知识主张	系统设计者必须把大型语言模型的建议视为需要验证的假设，而非最终规范。
透明度缺口是认知风险	如果没有明确的来源信息（提示、温度、微调数据），下游系统将继承隐藏的偏见。
人机交互仍然是必需的	即使使用高性能的大型语言模型，领域专家仍需在生成的产物与监管/合规约束之间进行调解。

这些洞见共同表明，传统的“设计‑再‑实现”流程必须通过持续的验证循环和元数据追踪来增强。

实际影响

Design‑by‑Prompt: 工程师可以通过提示 LLM 来原型化数据模型、API 合约或 UI 文本，但必须将带版本号的提示和响应日志嵌入 CI/CD 流程，以实现可审计性。
Dynamic Schema Management: 采用支持 runtime（运行时）模式演进的 schema‑as‑code 工具（例如 Liquibase、dbt），由 LLM 生成的迁移驱动，并配合自动化回归测试。
Explainability Layer: 为 LLM 调用加上“推理包装器”，捕获注意力权重、token 概率以及源数据片段，并向开发者和审计员公开这些信息。
Ethical Guardrails: 实施基于策略的过滤器（如 OpenAI 的内容审查）以及在人类审查点之前对 LLM 输出进行人工复核，防止其影响生产系统。
Knowledge‑Centric Architecture: 将纯数据中心的流水线转变为 knowledge‑centric（知识中心）流水线，让 LLM 参与推理层，并记录每次推理的来源信息。

简而言之，本文推动业界朝着 透明、负责且协同创造 的 AI 增强系统工程实践迈进。

限制与未来工作

概念范围： 本文停留在哲学和架构层面；未提供具体的性能基准或工具原型。
领域特定性： 虽然论点面向一般信息系统工程，但针对高度受监管行业（如金融、医疗）的具体指南留待后续工作。
实证验证： 未来研究可以开展案例研究，将所提出的设计原则应用于真实的 LLM 驱动系统，衡量其对可维护性、合规性和开发者生产力的影响。

对于渴望实验的开发者来说，一个实用的第一步是将每一次 LLM 交互（提示、参数、响应）记录到版本控制系统中。这一简单习惯符合论文对可追溯性的呼吁，并为作者设想的更复杂的以知识为中心的流水线奠定基础。

作者

José Palazzo Moreira de Oliveira

论文信息

arXiv ID: 2603.17659v1
分类: cs.SE
发表日期: 2026年3月18日
PDF: Download PDF

[Paper] 从符号到意义：本体论与哲学反思——Large Language Models 在信息系统工程中的

Overview

关键贡献

方法论

结果与发现

实际影响

限制与未来工作

作者

论文信息

相关文章

[Paper] 完美和谐：在 Actor-Based 系统中编排因果关系

[Paper] CodeT5-RNN：强化 Contextual Embeddings 以提升代码理解

[Paper] MLmisFinder：机器学习服务误用的规范与检测方法

[Paper] 重新审视野外数据中的漏洞补丁识别