Page 68 - 2023年第54卷第10期
P. 68
游水位 Hu的值逐渐减小时,其对应的 Shapley值小于 0并且也会随着特征值的减小而减小,对模型预
测结果的负影响效果也较强。对于渗透系数 K6,当其特征值增大时,其对应的 Shapley值大于 0,但
Shapley值增大幅度较小,表示对模型预测结果的正影响效果不明显;当渗透系数 K6的特征值减小
时,其对应的 Shapley值小于 0并且对应的 Shapley值也在减小,则对模型预测结果产生负影响。与其
他特征有所不同,下游水位 Hd、渗透系数 K4和 K1的特征值增大时,其 Shapley值小于 0且对应的
Shapley值也在减小,对模型预测结果有负影响;当其特征值减小时,其 Shapley值大于 0,则对模型
预测结果有正影响,但该特征对模型预测结果的正影响没有负影响明显。
SHAP理论也可对特征重要性进行度量,将每个特征的 Shapley值绝对值的平均值作为该特征的重
要性度量标准,其值越大,则表明该特征越为重要,如图 8所示。由图 8可知,上游水位 Hu对应的
值最大,则表明该特征在模型中最重要,对模型预测结果的贡献最大,然后依次是下游水位 Hd、渗
透系数 K4和 K6对模型预测结果影响较大。由于特征重要性的度量标准不同,故基于 SHAP理论的特
征重要性排序结果与基于 IAO - XGBoost算法的特征重要性排序结果(图 6)并不完全相同。但在图 8的
特征重要性排序中,仅渗透系数 K5和渗透系数 K3的排序结果与 IAO - XGBoost算法(图 6)的排序结果
不同,其他特征均与图 6中的排序结果相同。
图 7 特征重要性散点图 图 8 基于 SHAP理论的特征重要性排序
5.2.2 特征交互影响分析 两个输入特征对模型预测结果的交互影响可通过图 9所示的 SHAP依赖图
可视化。图 9中横轴表示某一输入特征的特征值,左纵轴表示该输入特征对应的 Shapley值,右纵轴
为以颜色标识的另一输入特征的特征值,颜色由蓝色至黄色表示输入特征的特征值由低到高。
以渗透系数 K3和 K4的交互影响作用为例(即图 9(c)与图 9(d))进行说明。如图 9(c),对于渗透系
数 K3而言,渗透系数 K3的值越大使得模型预测结果值减小,当渗透系数 K3的值小于 0.00225cm?s左右
时,其绝大部分 Shapley值大于 0,则对模型预测结果值有正影响;当渗透系数 K3的值大于 0.00225cm?s左
右时,其 Shapley值小于 0,则对模型预测结果值有负影响。如图 9(d),对于渗透系数 K4而言,渗透
系数 K4的值越大同样使得模型预测结果值减小,当渗透系数 K4的值小于 0.0005cm?s左右时,其绝
大部分 Shapley值大于 0,则对模型预测结果值有正影响;当渗透系数 K4的值大于 0.0005cm?s左右
时,其 Shapley值小于 0,则对模型预测结果值有负影响。综合渗透系数 K4和 K3分析可发现,当渗透
系数 K3的值小于 0.00225cm?s时,渗透系数 K4越大,渗透系数 K3对模型预测结果的正影响越大,
而当渗透系数 K3的值大于 0.00225cm?s时,渗透系数 K4越大,渗透系数 K3对模型预测结果的负影
响越大;当渗透系数 K4的值小于 0.0005cm?s时,渗透系数 K3越大,渗透系数 K4对模型预测结果的
正影响越大,而当渗透系数 K4的值大于 0.0005cm?s时,渗透系数 K3越大,渗透系数 K4对模型预测
结果的负影响越大。
5.2.3 单个样本特征影响分析 从测试集中挑选两个预测样本,采用 SHAP理论解释输入特征对样本
预测结果的影响,如图 10所示。图中横坐标为预测值的大小,纵坐标为输入特征的数值,红色表示
输入特征的 Shapley值为正,蓝色表示输入特征的 Shapley值为负;且红色和蓝色区域的面积越大,表
— 1 2 4 —
0