[Paper] Phythesis:Physics-Guided Evolutionary Scene Synthesis 用于通过 LLMs 的节能数据中心设计
发布: (2025年12月11日 GMT+8 21:04)
6 min read
原文: arXiv
Source: arXiv - 2512.10611v1
概览
本文提出 Phythesis 框架,将大语言模型(LLM)与物理引导的进化优化相结合,能够自动生成用于数据中心(DC)设计的三维、可直接仿真的布局(SimReady)。通过在生成循环中直接嵌入物理约束,Phythesis 产出能效更高的配置,显著优于纯 LLM 方法,解决了现代数据中心基础设施规模化的关键瓶颈。
主要贡献
- 双层优化架构:在 LLM 驱动的布局生成与物理信息参数调优之间交替进行。
- 自我批评的 LLM 循环:语言模型对自己的方案进行评估,迭代细化拓扑以满足空间和运行约束。
- 物理引导的进化搜索:用于资产选择(如机架、冷却单元)和参数优化(如气流速率、配电)。
- 量化收益:成功生成率提升 57.3%,Power Usage Effectiveness(PUE)提升 11.5%,相较于仅使用 LLM 的基线生成器。
- 可扩展流水线:在小型、中型、大型三种生成规模上进行验证,展示了对不同规模数据中心的鲁棒性。
方法论
-
LLM 驱动的布局生成
- LLM 接收高层规格(例如总楼面面积、冷却预算、机架密度)。
- 它输出 3‑D 场景的文本描述,随后被解析为几何表示(机架、通道、CRAC 单元等的位置、方向)。
- 自我批评 步骤让 LLM 根据物理规则清单(间隙、重量限制、气流路径)评估草案并提出修正建议。
-
物理引导的进化优化
- 解析得到的布局作为进化算法(EA)的种子。
- EA 对资产参数(如风扇转速、配电设置)进行变异,并在快速物理仿真器中评估每个候选方案的热分布、气流和功耗。
- 适应度综合 PUE、约束满足度以及与 LLM 原始意图的相似度,引导 EA 朝着物理可行、能效高的解收敛。
-
迭代双层循环
- EA 收敛后,将优化后的布局反馈给 LLM,LLM 可根据 EA 的反馈调整高层拓扑(如重新排列通道)。
- 循环重复直至满足收敛条件(PUE 稳定、无约束违规),最终得到可直接用于详细 CFD 或热仿真的 SimReady 模型。
结果与发现
| 指标 | 基线仅 LLM | Phythesis |
|---|---|---|
| 生成成功率* | 42 % | 57.3 % |
| Power Usage Effectiveness (PUE) | 1.45 | 1.28 (‑11.5 %) |
| 平均收敛迭代次数 | 12 | 8 |
| 运行时间(每个布局) | 3.2 min | 4.1 min(含 EA) |
*成功 = 布局通过所有硬性物理约束并可导出至行业标准仿真器。
在三种规模(≈ 1 kW、10 kW、100 kW 机架部署)的实验表明,Phythesis 能持续降低冷却开销,同时保持所需的计算密度。运行时间的适度增加被手动重新设计周期的消除所抵消。
实际意义
- 加速数据中心规划:架构师只需输入高层需求,即可在数分钟内获得经验证的、可仿真的布局,传统设计周期可缩短数周。
- 能源成本节约:11.5 % 的 PUE 改进直接转化为更低的电费和碳排放,对遵循可持续发展要求的超大规模运营商尤为关键。
- 即插即用集成:输出兼容现有 CFD、BIM 与 DCIM 工具,便于无缝交付给详细工程团队。
- 快速“假设-若干”探索:开发者可在不同冷却技术(液冷 vs. 风冷)、机架密度或平面约束下迭代,而无需手工构建每个场景。
- 可扩展至其他设施:双层方法同样适用于仓库、实验室或边缘计算舱等对物理驱动布局有需求的场景。
局限性与未来工作
- 仿真精度与速度的权衡:EA 中使用的物理引擎是简化的热模型;采用更高保真度的 CFD 将增加运行时间,并可能暴露新的约束违规。
- LLM 幻觉:尽管自我批评降低了胡言乱语的概率,LLM 仍可能提出不可行的组件类型或尺寸,需要人工审查。
- 对超大规模数据中心的可扩展性:实验上限约为 100 kW 机架集群;若要扩展到多兆瓦级别的园区,可能需要层次化分解。
- 未来方向:用强化学习取代 EA、引入真实传感器数据实现闭环优化、以及将电气与机械基础设施联合优化等。
作者
- Minghao LI
- Ruihang Wang
- Rui Tan
- Yonggang Wen
论文信息
- arXiv ID: 2512.10611v1
- 分类: cs.AI, cs.NE
- 发布日期: 2025 年 12 月 11 日
- PDF: Download PDF