Page 71 - 2024年第55卷第5期
P. 71
图 6为各模型的归一化实测值与预测值散点图,其中小图为残差分布图并统计其均值与标准差。
2
由图可见,具有时序建模能力的本模型、GRU及 STL - LSTM,数据点集中在 y = x线两侧,其 R 均达
到 0.95以上,其中本模型精度最高,预测值与实测值的误差服从均值接近 0的高斯分布。两种无时序
建模能力的机器学习模型,对漂移数据的预测结果具有明显偏向。MLinear为传统线性回归模型,难
以挖掘更加复杂的非线性规律而精度较低。因此,具有时序建模能力的预测模型,其预测精度明显高
于常规机器学习与线性回归模型。
图 6 不同模型的归一化实测预测值关系与残差分布图
4.5 训练与推断效率 对各模型的参数量与训练时
间进行分析,如图 7所示。本模型将多测点预测集成
到单一神经网络中,参数量和训练时间受测点数量影
响较低。GRU为单测点预测模型,需对各测点单独建
模训练,使训练时间、参数量与测点数目呈正比关
系。STL - LSTM需将测点序列分解为多个子序列,进
一步 增 加 了 模 型 量 与 训 练 时 间。MLP、XGBoost与
MLinear参数量少、训练时间短,但变形预测精度较
低。因此,综合考虑各模型精度与训练时长,本模 图 7 模型参数量与训练时间
型在平台部署与实时预测时均具有明显优势。
4.6 模型消融分析 本文设计消融实验验证所提模型中多测点融合、全过程训练和概率预测模块的有
效性,其中全过程训练是建立在时序解码基础上的。对比了原模型、AR(去除多测点融合)、GCN -
CTOC (去除全过程训 练)、GCN - Linear(去 除时序 解码)、GCN - AR - Mean(去除 概 率 预测)与 GCN -
Linear - Mean (去除时序解码与概率预测)。表 3为原模型与消融实验模型的多测点评价指标。消融实
验结果证明了采用多测点融合、全过程训练、概率预测后的原模型综合性能最优。因此,所提模型中
各模块对提高变形预测精度均十分重要。
— 5 7 1 —