Page 126 - 2023年第54卷第4期
P. 126

4.2 单因子单算法模型学习性能比较 为比较单因子单算法模型的学习性能,基于 3种变形解释因子
              模型( HST、HTT、HTT)和 3种回归算法(MLR、RF、SVM)建立 9种单因子单算法预测模型(简称单
                                  A
              一模型),并采用 5折交叉验证的方法在训练集上对其进行训练。图 5展示了 2012年 8月到 2013年
              10月的预测结果,其中图 5(a)—(c)左图分别为 3种解释因子模型下不同算法模型的预测值及评价指
                   2
              标( R),并根据水位变化划分高水位期、水位下降期及水位上升期 3个时期,右图详细展示了左图在
              2013年 8—10月的数据变化。








































                          注:高水位期最优模型 HTT - RF;水位下降期最优模型 HT A T - RF;水位上升期最优模型 HST - MLR。
                                               图 5 单因子单算法模型学习性能对比

                  从图 5可以看出:(1)图中各单一模型在整体变形趋势上均和实测值较为接近,但在局部细节上
              各模型预测效果有所差别;(2)从算法角度看,以高维 HTT因子为例,图 5(b)中 RF、SVM 算法的决
                                  2
                      2
              定系数 R相对较高(R>0.9),说明机器学习算法处理高维度监测数据更具优势,而 MLR算法由于难
              以处理变量间的非线性关系,导致 HTT - MLR模型表现较差(R                          2     = 0.886);(3)从因 子角度看,
                                                                         HTT - MLR
                                          2
              HTT、HTT因子的最优模型 R指标优于 HST因子,说明 HTT及 HTT因子可以更好地模拟温度对大
                       A                                                     A
              坝变形行为影响;(4)从水位变化时期看,高水位时期 HTT - RF模型与实测值的拟合程度最佳,说明
              在水位变化幅度较小、温度分量影响占主导地位时,HTT - RF模型更能反映大坝的变形形态变化规
              律;( 5)右侧小图中可以看出,当因子与算法变化时,各模型预测结果在实测值附近上下波动,表明
              各单一模型具有 “好而不同” 的特征,为元学习器进一步集成优化提供了基础。
              4.3 多算法集成学习模型预测性能验证 为了验证多算法集成学习模型的预测性能,在 3种解释因子
              模型下,分别基于 Stacking集成学习算法和各基学习器算法(MLR、RF、SVM)建立变形预测模型。对
              多算法集成学习模型(简称 Stacking模型)及基学习器模型进行训练、预测,得到其在测试集上的预测
              结果后进行比较。表 2为不同因子下基学习器模型评价指标均值及 Stacking模型相对于其的改善程度
              (改善程度表达式为 1 - P       Stacking ?P 基学习器  ,P Stacking 、P 基学习器  分别为 Stacking模型与基学习器模型的评价指
              标),图 6为不同因子下各模型预测结果残差箱线图。

                     2
                —  5 0  —
   121   122   123   124   125   126   127   128   129   130   131