Page 127 - 2023年第54卷第4期
P. 127

表 2 不同因子下多模型预测性能评价指标对比
                               2
                因子       R 2  R 集成学习改善程度?%       MAE?mm   MAE集成学习改善程度?%       RMSE?mm  RMSE集成学习改善程度?%
                 HST    0.9694      - 1.28        3.1921          28.43         3.7875         22.82
                 HTT    0.9662       0.63         3.2983         - 15.85        3.9171        - 10.75
                HT A T  0.9719      - 0.78        2.9654          15.16         3.6298         14.19















                                             图 6 不同因子下多模型预测结果残差箱线图

                  从表 2与图 6可以看出:(1)在 HST及 HTT因子下 Stacking模型预测效果相对较好,相对于基学
                                                         A
              习器模型均有不同程度的提升,各项评价指标中提升效果最显著的是平均绝对误差 MAE,提升程度分
              别为 28.43%与 15.16%,结合图 6(a)(c)可知 Stacking模型的拟合残差较为集中,残差中值较接近于
              零点,说明 Stacking模 型 相 较 于 基 学 习 器 模 型 有 更 好 的 预 测 精 度 及 稳 定 性;(2)在 HTT因 子 下,
              Stacking模型预测效果相对较差,原因是 MLR模拟变量间非线性关系的能力较差,而 HTT因子的温度
              分量维度较高,非线性关系较强,导致 HTT - MLR模型预测效果较差,结合图 6(b)可以看出 HTT -
              MLR模型的拟合残差偏离零点较多,进而影响了 Stacking模型的预测效果;(3)综合来看,多算法集
              成可以提升预测模型的性能,但是由于参与集成的模型相对较少,集成学习效果易受到较差模型的
              影响。
              4.4 大坝变形组合预测模型性能验证 为进一步验证本文所提出模型的预测性能,将基于多因子融合
              和 Stacking集成学习的大坝变形组合预测模型(简称多因子 Stacking模型)与 HST、HTT、HTT因子下
                                                                                                  A
              的 Stacking模型进行对比。表 3展示了各模型在测试阶段的预测性能评价指标,其中多因子 Stacking
              模型相较于其他模型的改善程度表达式为 1 - P ?P (P 、P 为多因子与各单因子 Stacking模型的评价
                                                           单
                                                        多
                                                               多
                                                                    单
              指标)。从表中可以看出:(1)多因子 Stacking模型的各项评价指标均优于单因子 Stacking模型,说明
              多因子融合有助于提升模型整体预测性能;( 2)多因子 Stacking模型相对于各单因子 Stacking模型的改
              善程度从大到小为 HTT>HTT>HST,由 4.3节可知在 HTT因子下算法集成的提升效果相对弱于 HST、
                                        A
              HTT因子,所以在因子集成时 HTT因子提升幅度相对较大,说明多因子融合可以改善算法集成下因
                 A
              子、算法不匹配造成的性能下降问题,可进一步提升整体预测精度与稳定性。
                                             表 3 多模型测试阶段预测性能评价指标

                                          2
                    模型            R 2    R 改善程度?%       MAE?mm    MAE改善程度?%       RMSE?mm   RMSE改善程度?%
                  HST - Stacking  0.9819    - 0.43      2.2845        12.06        2.9231        12.53
                  HTT - Stacking  0.9601    - 2.71      3.8211        47.42        4.3383        41.07
                 HT A T - Stacking  0.9794  - 0.68      2.5158        20.14        3.1148        17.92
                 多因子- Stacking  0.9861                  2.0090                     2.5567

                  图 7为在测试集阶段,单因子与多因子 Stacking集成学习模型预测结果残差及其箱线图。从图中
              可以看出:(1)各模型残差中值均接近于零,预测残差几乎都分布在 1.5倍四分位距(IQR)内,只存在
              极个别离群点(大于上四分位数或小于下四分位数超过 1.5倍 IQR距离的数值                                [34] ),说明 Stacking集成
              学习模型整体预测效果较好;(2)多因子 Stacking模型的残差分布更为集中,残差中值较其他模型更

                                                                                                —  5 0 3 —
   122   123   124   125   126   127   128   129   130   131   132