Page 127 - 2023年第54卷第4期
P. 127
表 2 不同因子下多模型预测性能评价指标对比
2
因子 R 2 R 集成学习改善程度?% MAE?mm MAE集成学习改善程度?% RMSE?mm RMSE集成学习改善程度?%
HST 0.9694 - 1.28 3.1921 28.43 3.7875 22.82
HTT 0.9662 0.63 3.2983 - 15.85 3.9171 - 10.75
HT A T 0.9719 - 0.78 2.9654 15.16 3.6298 14.19
图 6 不同因子下多模型预测结果残差箱线图
从表 2与图 6可以看出:(1)在 HST及 HTT因子下 Stacking模型预测效果相对较好,相对于基学
A
习器模型均有不同程度的提升,各项评价指标中提升效果最显著的是平均绝对误差 MAE,提升程度分
别为 28.43%与 15.16%,结合图 6(a)(c)可知 Stacking模型的拟合残差较为集中,残差中值较接近于
零点,说明 Stacking模 型 相 较 于 基 学 习 器 模 型 有 更 好 的 预 测 精 度 及 稳 定 性;(2)在 HTT因 子 下,
Stacking模型预测效果相对较差,原因是 MLR模拟变量间非线性关系的能力较差,而 HTT因子的温度
分量维度较高,非线性关系较强,导致 HTT - MLR模型预测效果较差,结合图 6(b)可以看出 HTT -
MLR模型的拟合残差偏离零点较多,进而影响了 Stacking模型的预测效果;(3)综合来看,多算法集
成可以提升预测模型的性能,但是由于参与集成的模型相对较少,集成学习效果易受到较差模型的
影响。
4.4 大坝变形组合预测模型性能验证 为进一步验证本文所提出模型的预测性能,将基于多因子融合
和 Stacking集成学习的大坝变形组合预测模型(简称多因子 Stacking模型)与 HST、HTT、HTT因子下
A
的 Stacking模型进行对比。表 3展示了各模型在测试阶段的预测性能评价指标,其中多因子 Stacking
模型相较于其他模型的改善程度表达式为 1 - P ?P (P 、P 为多因子与各单因子 Stacking模型的评价
单
多
多
单
指标)。从表中可以看出:(1)多因子 Stacking模型的各项评价指标均优于单因子 Stacking模型,说明
多因子融合有助于提升模型整体预测性能;( 2)多因子 Stacking模型相对于各单因子 Stacking模型的改
善程度从大到小为 HTT>HTT>HST,由 4.3节可知在 HTT因子下算法集成的提升效果相对弱于 HST、
A
HTT因子,所以在因子集成时 HTT因子提升幅度相对较大,说明多因子融合可以改善算法集成下因
A
子、算法不匹配造成的性能下降问题,可进一步提升整体预测精度与稳定性。
表 3 多模型测试阶段预测性能评价指标
2
模型 R 2 R 改善程度?% MAE?mm MAE改善程度?% RMSE?mm RMSE改善程度?%
HST - Stacking 0.9819 - 0.43 2.2845 12.06 2.9231 12.53
HTT - Stacking 0.9601 - 2.71 3.8211 47.42 4.3383 41.07
HT A T - Stacking 0.9794 - 0.68 2.5158 20.14 3.1148 17.92
多因子- Stacking 0.9861 2.0090 2.5567
图 7为在测试集阶段,单因子与多因子 Stacking集成学习模型预测结果残差及其箱线图。从图中
可以看出:(1)各模型残差中值均接近于零,预测残差几乎都分布在 1.5倍四分位距(IQR)内,只存在
极个别离群点(大于上四分位数或小于下四分位数超过 1.5倍 IQR距离的数值 [34] ),说明 Stacking集成
学习模型整体预测效果较好;(2)多因子 Stacking模型的残差分布更为集中,残差中值较其他模型更
— 5 0 3 —