[论文] 情境感知的基于LLM的AI代理用于智能建筑中以人为中心的能源管理系统

发布: 1个月前 (2026年1月1日 GMT+8 02:51)

9 分钟阅读

原文: arXiv

Source: arXiv - 2512.25055v1

概述

一项新的研究工作提出将大型语言模型（LLM）转变为建筑能源管理系统（BEMS）的“核心”。通过将 LLM 接入由感知、中央控制和执行三个层级构成的架构，作者展示了自然语言查询如何驱动智能家居中关于供暖、制冷、照明以及家电调度的实时、情境感知决策。该原型在真实的住宅数据集上进行评估，结果表明，基于 LLM 的代理已经能够以高准确率回答多数能源管理问题，尽管在成本预测任务上仍有提升空间。

关键贡献

上下文感知 BEMS 框架，将 LLM 推理与传感器流、中心决策引擎以及执行器/用户界面模块耦合。
闭环反馈设计，使代理能够基于实时能源数据和用户反馈持续优化其行为。
原型实现，在四个公开的住宅能源数据集和 120 条自然语言查询上进行测试。
综合基准套件，涵盖延迟、功能广度、准确性和成本效益，并对通用性进行统计验证（ANOVA）。
实证性能数据：设备控制指令准确率 86%，记忆相关查询 97%，调度/自动化 74%，能源分析 77%，成本估算 49%。
权衡指南，在计算负载（LLM 推理成本）与响应质量之间提供参考，为 LLM‑基 BEMS 代理的标准化评估奠定基础。

方法论

感知层 – 传感器（智能电表、温湿度探针、占用检测器）将原始测量数据流式传输到时间序列存储。
中心控制（LLM “大脑”） – 预训练的 LLM（例如 GPT‑4‑style）通过领域特定的提示词进行微调，并配备轻量级检索系统以获取最新的传感器快照。模型执行三个核心任务：
- 解释：将用户的自然语言请求（如 “上个月 HVAC 的费用是多少？”）转换为结构化查询。
- 推理：在设备上运行分析（如回归、基于规则的启发式方法）或调用外部 API，然后合成文本答案。
- 规划：生成可执行的指令给执行器（如 “晚上 10 点关闭客厅灯光”）。
执行层 – 中间件将 LLM 的输出转换为 MQTT/REST 调用，以驱动智能插座、恒温器或向用户界面发送反馈。
评估 – 作者编写了 120 条涵盖控制、记忆、调度、分析和成本估算的多样化查询。每条查询在原型系统上运行，记录响应延迟、功能正确性和答案准确性等指标。ANOVA 检验表明，不同数据集之间的性能差异在统计上不显著，说明模型具有良好的通用性。

结果与发现

任务类别	准确率	观察
设备控制	86 %	对开/关、调光和模式切换可靠。
与记忆相关（状态回忆）	97 %	对过去的操作和传感器快照几乎完美回忆。
调度与自动化	74 %	对简单的循环计划表现良好；在复杂约束上有困难。
能耗分析（消耗趋势、异常检测）	77 %	提供有用的洞察，虽偶有单位误解。
成本估算（计费、费率预测）	49 %	表现最差；需要更丰富的财务模型和更多训练数据。

延迟在大多数查询中保持在 1.2 秒以下，使交互感觉像对话。成本效益指标（计算硬件消耗的能量与代理建议的节省相比）在控制和分析任务上为正，但由于大型语言模型的推理成本较高，成本估算任务的效益仅为边际。

Practical Implications

Developer‑ready API pattern – 三模块设计可以直接映射到微服务架构（传感器采集 → LLM 推理服务 → 执行器网关），从而在现有智能建筑平台上实现快速原型开发。
Natural‑language interface – 设施管理人员和使用者可以直接询问 “本月我的电费为什么这么高？” 并获得可操作的诊断，而无需学习新的用户界面。
Plug‑and‑play integration – 由于 LLM 只需要结构化的传感器快照，旧有 BEMS 硬件只需加装一层轻量软件层即可，而不必进行完整的硬件改造。
Energy‑saving automation – 通过最少的规则编写即可部署自动调度（例如基于占用预测的预制冷），从而降低自定义控制逻辑的工程工作量。
Cost‑prediction research direction – 在财务预测方面的薄弱表现指向一种混合模型的研究方向，即将 LLM 推理与领域特定的计量经济模型相结合。

对于开发者而言，本文提供了一个实用路线图：先使用轻量的检索增强 LLM，公开一个 RESTful “ask‑BEMS” 接口，然后逐步添加执行器适配器。LangChain、LlamaIndex 等开源工具包可以处理提示工程和检索层，而 MQTT broker 则负责执行层的交互。

限制与未来工作

推理开销 – 在本地运行大型语言模型成本高昂；需要面向边缘的模型或模型蒸馏技术，以实现大规模部署。
成本估算准确性 – 当前原型缺乏与公用事业费率 API 的集成以及详细的家电级计量，限制了财务预测的精度。
安全性与隐私 – 直接将传感器数据暴露给语言模型会引发数据泄漏的担忧；需要强大的沙箱机制和加密手段。
向商业建筑的可扩展性 – 本研究聚焦于住宅数据集；更大、包含多区的商业环境将带来额外复杂性（如 HVAC 分区、需求响应计划）。
用户研究 – 未对居住者和设施管理者进行真实场景的可用性测试；未来工作应评估接受度、信任度以及行为影响。

总体而言，该研究为对话式、情境感知的能源管理开辟了有前景的道路，同时也凸显了在实现广泛行业采用之前必须克服的工程挑战。

作者

Tianzhi He
Farrokh Jazizadeh

论文信息

arXiv ID: 2512.25055v1
Categories: cs.AI, cs.HC
Published: 2025年12月31日
PDF: 下载 PDF

[论文] 情境感知的基于LLM的AI代理用于智能建筑中以人为中心的能源管理系统

概述

关键贡献

方法论

结果与发现

Practical Implications

限制与未来工作

作者

论文信息

相关文章

[Paper] 两种深度学习方法用于Cine心脏MRI左心室的自动分割

[Paper] 理性几何：有效数学推理的谱特征

[Paper] FedHypeVAE：联邦学习与超网络生成的条件VAE用于差分隐私嵌入共享

[Paper] 分类重新参数化与去噪扩散模型