Page 71 - 2023年第54卷第10期
P. 71

IAO - GBDT、IAO - RF、IAO - DT和 IAO - SVR算法 相比,IAO - XGBoost算法 的预 测精 度分 别 提高了
              0.52%、11.64%、37.21%和 25.07%。相比于 IAO - XGBoost算法,IAO - GBDT和 IAO - RF的预测精度较
              低,这是由于 XGBoost模型通过引入损失函数的二阶泰勒展开和正则项,优化了模型复杂度,避免了
              模型过拟合,从而提高了模型预测精度。此外,IAO - DT和 IAO - SVR的预测精度均低于 IAO - GBDT和
              IAO - RF的预测精度,这是由于 IAO - DT和 IAO - SVR属于单一的机器学习算法,而 IAO - GBDT和 IAO -
              RF均属于集成学习算法,具有更好的预测性能和泛化能力。
                  IAO - GBDT和 IAO - RF这两种算法也能够通过特征重要性分析,得出影响预测结果的关键输入特
              征,因而也具有一定的模型可解释性。IAO - GBDT和 IAO - RF的特征重要性排序结果如图 12所示。将
              图 12与 IAO - XGBoost和 SHAP理论的特征重要性排序结果(如图 6和图 8)进行对比分析,可以看出,
              这四种算法所得的特征重要性排序并不完全相同,但是对坝基防渗帷幕最大水力梯度预测结果影响最
              大的输入特征均为上游水位 Hu,且下游水位 Hd、渗透系数 K4和渗透系数 K6均对模型预测结果具有
              较大影响。此外,IAO - XGBoost、IAO - GBDT和 IAO - RF这三种算法只能用于样本输入特征的全局解
              释,而 SHAP理论还能在全局解释中发现输入特征与坝基防渗帷幕最大水力梯度预测值的正负相关趋
              势,并且能够将同一 个输 入特 征 在 不 同 样 本 之 间 进 行 比 较,提 供 模 型 预 测 结 果 的 局 部 解 释,因 而
              SHAP理论具有更强的模型可解释性。



















                                            图 12 IAO - GBDT和 IAO - RF的特征重要性排序


              6 结论


                  本文建立了土石坝渗流性态分析的 IAO - XGBoost集成学习模型,并基于 SHAP理论对预测结果进
              行解释,最后通过案例研究和对比分析,验证了所提方法的有效性。所得主要结论如下:
                  ( 1)在采用多地质体自动建模方法和 CFD技术对土石坝渗流场进行数值模拟的基础上,提出了基
              于 IAO - XGBoost集成学习的渗流性态指标预测方法,采用基于混沌初始化和非线性飞行速率更新策略
              改进的天鹰优化(IAO)算法对 XGBoost集成学习算法的超参数进行优化,实现了大坝渗流性态指标的
              高精度预测,并显著提高了大坝渗流性态分析的效率。
                  ( 2)将可解释机器学习框架 SHAP理论与 IAO - XGBoost集成学习算法相结合,挖掘了影响大坝渗
              流性态指标预测结果的关键特征,并分析了单个样本的特征对预测结果的影响,增强了 IAO - XGBoost
              集成学习算法的可解释性,从而提高了大坝渗流性态指标预测结果的可信度。
                  ( 3)案例分析表明,IAO - XGBoost集成学习算法具有较高的预测精度,相比于 IAO - GBDT、IAO -
              RF 、IAO - DT和 IAO - SVR算法,其预测精度分别提高了 0.52%、11.64%、37.21%和 25.07%;通过可
              解释机器学习框架 SHAP理论,得出上游水位 Hu和下游水位 Hd是影响坝基防渗帷幕最大水力梯度预
              测结果的关键因素;并且相比于 IAO - XGBoost、IAO - GBDT和 IAO - RF算法的特征重要性分析方法,
              SHAP理论不仅能够挖掘影响坝基帷幕最大水力梯度预测结果的关键特征,并在全局解释中发现输入
              特征与预测结果的正负相关趋势以及特征间的交互影响,而且能够将同一个输入特征在不同样本之间

                                                                                                   2
                                                                                              —   1 0 7 —
   66   67   68   69   70   71   72   73   74   75   76