Page 59 - 2023年第54卷第10期
P. 59

水  利  学  报

                2023年 10月                           SHUILI  XUEBAO                         第 54卷 第 10期

              文章编号:0559 - 9350(2023)10 - 1195 - 15

                        土石坝渗流性态分析的 IAO - XGBoost集成学习模型与

                                                   预测结果解释


                                 余红玲,王晓玲,任炳昱,郑鸣蔚,吴国华,朱开渲

                                      (天津大学 水利工程仿真与安全国家重点实验室,天津 300072)

                摘要:针对现有土石坝渗流数值模拟方法计算效率较低、难以实时分析大坝渗流性态,而现有基于机器学习算法
                建立的代理模型又存在模型可解释性较差的问题,提出土石坝渗流性态分析的 IAO - XGBoost集成学习模型,并基
                于 Shapley加性解释(SHapleyAdditiveexPlanation,SHAP)理论对预测结果进行解释。在采用多地质体自动建模方
                法和 CFD技术对大坝渗流场进行计算分析的基础上,基于改进的天鹰(ImprovedAquilaOptimization,IAO)算法优
                化极限梯度提升( eXtremeGradientBoosting,XGBoost)集成学习算法中的 n_estimators、max_depth和 learning_rate等
                超参数,进而建立基于 IAO - XGBoost集成学习算法的大坝渗流性态指标预测模型,以揭示上下游水位和坝基地层
                渗透系数等输入特征变量与渗流性态指标模拟值间的复杂非线性映射关系。进一步地,将 IAO - XGBoost集成学习
                算法与可解释机器学习框架 SHAP理论相结合,挖掘影响大坝渗流性态指标预测结果的关键特征,并解释特征变
                量对渗流性态指标预测的影响。案例研究表明,IAO - XGBoost具有较高的预测精度,相比于 IAO - GBDT、IAO -
                RF 、IAO - DT和 IAO - SVR算法,其预测精度分别提高了 0.52%、11.64%、37.21%和 25.07%;且相比于 IAO - XG
                Boost 、IAO - GBDT和 IAO - RF算法的特征重要性分析方法,SHAP理论具有更强的模型可解释性,提高了预测结
                果的可信度。
                                 oost;可解释性;SHAP理论;改进的天鹰优化算法
                关键词:土石坝;渗流性态分析;XGB
                中图分类号:TV641                    文献标识码:A                   doi:10.13243?j.cnki.slxb.20230240


              1 研究背景


                  渗流数值模拟是分析土石坝渗流性态的一种有效手段,目前有许多不同的数值模拟方法应用于大
              坝渗流性态分析研究中           [1 - 3] 。虽然各种渗流数值模拟方法在大坝渗流场计算分析中发挥了重要作用,
              然而,复杂地质条件下的大坝渗流数值模型对计算资源的要求较高,求解时间较长,存在计算效率较
              低、难以实时分析大坝渗流性态的问题。基于机器学习方法的代理模型通过寻求输入变量与输出变量
              间的复杂响应关系,实现对复杂物理过程的近似描述,可代替真实系统快速给出所求解                                          [4] 。常用的代
              理模型包括径向基函数(RadialBasisFunction,RBF)、Kriging模型、支持向量回归(SupportVectorRe
              gression ,SVR)、多元自适应回归样条(MultivariateAdaptiveRegressionSplines,MARS)等单一代理模
              型以及由多种机器学习算法构成的组合代理模型                       [5] 。基于机器学习算法建立大坝渗流数值模拟模型的
              代理模型,能够减少计算量、有效提高大坝渗流性态分析的效率。然而,现有机器学习算法大多将复
              杂的渗流数理机制作为 “黑箱” 处理,难以理解模型决策过程,导致模型可信度较低。因此,构建一
              种高效且具有可解释性的渗流性态分析模型具有重要的意义。
                                                                 [6]
                  极限梯度提升( eXtremeGradientBoosting,XGBoost) 是一种基于梯度提升的集成学习算法,其不

                 收稿日期:2023 - 04 - 22;网络首发日期:2023 - 09 - 26
                 网络首发地址:https:??kns.cnki.net?kcms?detail?11.1882.TV.20230925.1235.002.html
                 基金项目:国家自然科学基金雅砻江联合基金项目(U1965207)
                 作者简介:余红玲(1994 - ),博士生,主要从事大坝渗流性态分析研究。E - mail:yuhongling@tju.edu.cn
                                                                                                   1
                                                                                              —   1 9 5 —
   54   55   56   57   58   59   60   61   62   63   64