[Paper] 科学知识引导的机器学习用于船舶功率预测：比较研究

发布: 3天前 (2026年2月21日 GMT+8 02:12)

8 分钟阅读

原文: arXiv

Source: arXiv - 2602.18403v1

概述

这篇论文解决了海事工程中的一个经典问题：预测船舶的主机功率与其航速之间的关系。虽然现成的机器学习模型能够拟合数据，但它们往往忽略了支配大部分关系的著名螺旋桨定律 (P = cV^{n})。作者提出了一种混合的“物理信息”框架，首先应用解析功率曲线，然后使用轻量级的机器学习模型仅学习残差（即因天气、船体污损、修剪等因素导致的偏差）。其结果是一个模型，不仅在数据稀缺时更为准确，而且能够保证遵循底层物理规律。

关键贡献

混合建模管线，将闭式螺旋桨定律基线与数据驱动的残差预测器相结合。
三种残差学习器的比较——XGBoost、浅层神经网络和物理信息神经网络（PINN）——与它们的纯数据对应模型进行对比。
展示在稀疏采样速度区间的改进外推能力，这是一种传统黑箱回归器的已知弱点。
在真实在役船舶数据上的实用验证，显示出在不增加计算开销的情况下持续的收益。
面向开源的配方，用于在任何存在可靠解析模型的回归任务中融入领域知识。

方法论

基线物理模型
- 作者从平静水面的功率曲线 (P_{\text{base}} = c V^{n}) 开始。
- 系数 (c) 和指数 (n) 通过对海试数据（或船舶设计规格）在 (\log P) 与 (\log V) 上进行简单线性回归获得。
残差定义
- 对每个观测 ((V_i, P_i)) 计算残差为
  [ r_i = P_i - P_{\text{base}}(V_i) ]
- 该残差捕捉了物理模型无法解释的所有因素：风、潮流、船体污损、载荷分布等。
残差学习器
- 对残差训练三个独立的回归模型：
  - XGBoost – 梯度提升树，对异构特征鲁棒。
  - 浅层神经网络 – 少量全连接层，训练快速。
  - 物理信息神经网络 (PINN) – 与前者相同的神经网络，但在训练时加入额外的损失项，以惩罚偏离基线物理模型的行为。
- 所有模型使用相同的输入特征集（速度、环境变量、修正等），输出预测残差 (\hat r)。
混合预测
- 最终功率估计为
  [ \hat P = P_{\text{base}}(V) + \hat r ]
- 基线保证 (\hat P) 在极低或极高速度时遵循正确的渐近趋势，即使机器学习部分从未见过此类数据。
评估
- 将数据集划分为密集（速度覆盖充分）和稀疏（观测少）区域。
- 指标：平均绝对误差（MAE）、均方根误差（RMSE）以及物理一致性检查（例如功率随速度的单调性）。

结果与发现

模型（残差学习器）	MAE（密集）	MAE（稀疏）	RMSE（密集）	RMSE（稀疏）
XGBoost（纯）	3.2 %	7.8 %	4.1 %	9.5 %
XGBoost + 基线	2.6 %	5.1 %	3.3 %	6.2 %
NN（纯）	3.5 %	8.4 %	4.5 %	10.2 %
NN + 基线	2.9 %	5.6 %	3.7 %	6.8 %
PINN（纯）	3.1 %	7.9 %	4.0 %	9.7 %
PINN + 基线	2.7 %	5.3 %	3.4 %	6.4 %

关键要点

加入物理基线能够在所有三种学习器中持续降低误差，在稀疏速度区间的相对提升最大（约30 %）。
混合模型保持功率随速度单调递增的特性，而纯数据驱动的模型有时会违背这一规律。
训练时间相当，因为基线是闭式表达式；残差学习器实际上更容易训练，因为它们面对的是更平滑的目标分布。

实际意义

天气路由与航程规划 – 更可靠的功率预测能够在选择最佳航线时提供更好的燃油消耗估算。
船舯与船体形状优化 – 工程师可以将混合模型输入实时决策支持工具，以评估装载量或船体清洁度的微小变化如何影响功率需求。
合规性 – 精确的功率预测可直接用于排放报告（如 IMO EEXI、CII），无需昂贵的全尺度海试。
可扩展部署 – 该框架仅需少量基线参数和轻量级机器学习模型，适用于船上边缘设备或基于云的舰队管理平台。
其他领域的模板 – 任何拥有可靠解析规律的系统（如空气动力学、电池放电、暖通空调负荷）都可以采用相同的残差学习模式，在保持物理合理性的同时提升机器学习性能。

限制与未来工作

基准曲线假设在平静水域条件下；极端海况可能引入非线性效应，而简单的 (cV^{n}) 形式难以捕捉。
本研究仅使用单一船型；要在不同船舶类别（如油轮与集装箱船）之间推广，可能需要针对船舶的基准校准。
只考察了三种残差学习器；探索高斯过程或深度集成等方法或能进一步提升不确定性量化。
未来的研究可以加入在线学习，使残差模型能够在船体状态（如污垢、改装）变化时持续自适应，而无需从头重新训练。

结论：通过让物理模型完成大部分工作，再让机器学习处理剩余误差，作者提供了一个既可信又实用的模型——正是当现实约束与纯数据驱动的乐观主义冲突时，开发者所需要的混合智能。

作者

Orfeas Bourchas
George Papalambrou

论文信息

arXiv ID: 2602.18403v1
分类: cs.LG
出版日期: 2026年2月20日
PDF: 下载 PDF

[Paper] 科学知识引导的机器学习用于船舶功率预测：比较研究

概述

关键贡献

方法论

结果与发现

实际意义

限制与未来工作

作者

论文信息

相关文章

[Paper] 噪声的几何：为什么 Diffusion Models 不需要 Noise Conditioning

[Paper] $U(d)$ 的子群诱导自然的 RNN 与 Transformer 架构

[Paper] 统一方法实现图神经网络的统一表达能力

[Paper] 潜在等变算子用于鲁棒目标识别：前景与挑战