Page 67 - 2023年第54卷第10期
P. 67
渗帷幕最大水力梯度值。上下游水位和坝基各覆盖层渗透系数的 表 1 上下游水位和坝基各覆盖层渗透
样本点,与对应的坝基防渗帷幕最大水力梯度模拟值构成样本数 系数的取值范围
据集,用于对坝基防渗帷幕最大水力梯度预测模型进行训练和测 影响变量 取值范围
试。其中,训练集含有 160个样本,测试集含有 40个样本。 Hu 1366~1380(m)
采用五折交叉验证方法对模型进行训练,XGBoost算法的超 Hd 1301~1313(m)
参数 max_depth、learning_rate和 n_estimators通过 IAO算法进行 K1 2 × 10 ~4 × 10 (cm?s)
- 2
- 2
寻优,其寻优范围分别为[ 2,10]、[0.01,1]和[2,100]。在 K2 2 × 10 ~4 × 10 (cm?s)
- 2
- 2
IAO算法中,天鹰种群数设置为 20,迭代次数设置为 100次,以 K3 1 × 10 ~5 × 10 (cm?s)
- 3
- 3
均方误差( MeanSquareError,MSE)作为适应度函数,则超参数 K4 1 × 10 ~1 × 10 (cm?s)
- 4
- 3
max_depth、learning_rate和 n_estimators的 寻 优 结 果 分 别 为 2、 K5 5 × 10 ~1 × 10 (cm?s)
- 3
- 2
0.2513和54。 K6 1 × 10 ~1 × 10 (cm?s)
- 2
- 1
在模型训练完成后,以测试集对模型预测性能进行验证。测
试集的预测结果如图 5所示。从图中可以看出,坝基防渗帷幕最大水力梯度值的预测值与模拟值拟合
2
较好。进一步计算预测结果的误差指标,其决定系数 R、均方根误差 RMSE、平均绝对误差 MAE和平
均绝对百分比误差 MAPE分别为 0.9303、1.3675、1.0890和 1.7030%,表明 IAO - XGBoost模型的预测
结果较为准确。
5.2 模型预测结果解释
5.2.1 样本特征全局影响分析 在基于 IAO - XGBoost模型获得坝基防渗帷幕最大水力梯度值的预测结
果后,可进一步对输入特征的重要程度进行分析,以挖掘影响模型预测结果的关键特征。本文采用特
征平均增益值计算输入特征的重要性评分,则各特征的重要性排序如图 6所示。从图中可以看出,上
游水位 Hu对模型预测结果的影响最大,下游水位 Hd次之,渗透系数 K4和渗透系数 K6的影响也相对
较高,而渗透系数 K1、K3、K5和 K2的影响相对较小。
图 5 测试集的预测结果图 图 6 基于 IAO - XGBoost算法的特征重要性排序
虽然 IAO - XGBoost算法通过特征重要性分析能够获得影响预测结果的关键特征,但是难以判断各
输入特征对预测结果的正负影响。将 IAO - XGBoost算法与 SHAP理论相结合可有效解决这一问题,提
高模型的可解释性。
将每个样本的每个特征的 Shapley值绘制成散点图,并用颜色的渐变表示特征值的大小关系,如
图 7所示。在图 7中,每个点表示各特征对应样本点的 Shapley值,各点的颜色越红表示特征本身的
取值越大,而各点的颜色越蓝,则表示 特 征本身的取 值越 小;图 中 x轴 表 示 Shapley值,当 特征的
Shapley值大于 0时,表示该特征对模型预测结果有正影响,当特征的 Shapley值小于 0时,则表示该
特征对模型预测结果有负影响;y轴为各特征,各特征根据其重要性大小从上到下排列。
由图 7可知,上游水位 Hu、下游水位 Hd、渗透系数 K4和渗透系数 K6对模型预测结果的影响较
大。其中,上游水位 Hu对于模型预测结果的影响最大,而且当上游水位 Hu的值逐步增大时,其对应
的 Shapley值大于 0并且会随着特征值的增大而增大,对模型预测结果的正影响效果较为显著;当上
2
— 1 0 3 —