Page 63 - 2023年第54卷第10期

P. 63

式中ｇ和ｈ分别为损失函数ｌ的一阶和二阶导数。
ｉｉ
进一步地，将目标函数转换为一个关于ｗ的一元二次方程求最小值的问题，即
ｊ
Ｔ１
（ｔ）
∑
Ｏｂｊ＝ [ Ｇｗ＋ ( ｉ２ ]
Ｈ＋λ ) ｗ＋γ Ｔ
ｉｊ
ｊ
ｊ＝１２
ｉ ∑
Ｇ＝ｇｉ（５）
ｉ ∈Ｉｊ
Ｈ＝ｈｉ
ｉ ∑
ｉ ∈Ｉｊ
（ｔ）

将目标函数Ｏｂｊ对ｗ求一阶导数，则可获得第ｊ个叶子节点输出分数的最优值ｗ，如下所示：
ｊ
ｊ
Ｇｉ

ｗ＝－（６）
ｊ
Ｈ＋ λ
ｉ

（ｔ）

将ｗ代入目标函数Ｏｂｊ中，即可计算出最优目标值Ｏｂｊ为
ｊ
１ＴＧ２
ｉ

Ｏｂｊ＝－ ∑ ＋γ Ｔ（７）
２ｊ＝１Ｈ＋λ
ｉ
ＸＧＢｏｏｓｔ算法集成了若干棵回归树，其中每棵树的叶子节点都在做特征分裂，通过统计每个特征
被用于分裂的总次数Ｆｃｏｕｎｔ，可获得特征的重要性排序。此外，特征平均增益值Ｇａｉｎ和特征平均覆盖
率Ｃｏｖｅｒ也是ＸＧＢｏｏｓｔ中常用的特征重要性度量指标，其计算公式分别如式（８）和式（９）所示：
∑ Ｇａｉｎ１Ｇ２Ｇ２（Ｇ＋Ｇ）２
Ｌ
Ｒ
Ｒ
Ｌ
Ｇａｉｎ＝，Ｇａｉｎ＝ [ ＋－ ] －γ （８）
Ｆｃｏｕｎｔ２Ｈ＋λ Ｈ＋λ （Ｈ＋Ｈ）＋λ
ＬＲＬＲ
∑ Ｃｏｖｅｒ
Ｃｏｖｅｒ＝（９）
Ｆｃｏｕｎｔ
式中：Ｇａｉｎ为特征分裂时的信息增益值；Ｃｏｖｅｒ为特征分裂时落在叶子节点上的样本个数；Ｇ＝
Ｌ
∑ ｇ；Ｇ＝ｇ；Ｈ＝ｈ；Ｈ＝ｈ；Ｉ和Ｉ分别为左子树和右子树的样本组。
Ｌ ∑
Ｒ ∑
Ｒ ∑
ｉ
Ｒ
Ｌ
ｉ
ｉ
ｉ
ｉ ∈ＩＬｉ ∈ＩＲｉ ∈ＩＬｉ ∈ＩＲ
３．２基于ＩＡＯ算法改进的ＸＧＢｏｏｓｔ集成学习模型ＸＧＢｏｏｓｔ超参数较多，超参数设置不准确将导致
大坝渗流性态指标预测效率低下、精度降低。然而，超参数优化过程实质上是一个黑盒函数优化问
题，若优化参数过多，则容易使模型冗余，导致计算复杂性增加，并影响系统整体性能［２１］。因此，本
文仅选取对ＸＧＢｏｏｓｔ算法预测性能影响较大的关键参数，如ｎ＿ｅｓｔｉｍａｔｏｒｓ、ｍａｘ＿ｄｅｐｔｈ和ｌｅａｒｎｉｎｇ＿ｒａｔｅ等
超参数进行优化。其中，ｎ＿ｅｓｔｉｍａｔｏｒｓ为集成算法中弱评估器的数量，此参数值越大，模型的学习能力
越强，但模型也越容易过拟合；ｍａｘ＿ｄｅｐｔｈ控制模型中树的最大深度，其值越大模型越复杂，且模型
容易过拟合；ｌｅａｒｎｉｎｇ＿ｒａｔｅ参数控制迭代速率，可以防止模型过拟合［２６］。
现有研究大多根据人工经验或网格搜索方法搜寻ＸＧＢｏｏｓｔ的最佳超参数。然而，依靠人工经验寻
找超参数需要丰富的专业背景知识和大量的实验［２１］，而网格搜索方法容易受到维度约束，搜索范围有
限，难以找到最优参数［２７］。采用智能优化算法对超参数进行调整不仅能够获得最优参数组合，还可以
减少时间，提升效率。
３．２．１改进的天鹰优化算法天鹰优化器（ＡｑｕｉｌａＯｐｔｉｍｉｚｅｒ，ＡＯ）是Ａｂｕａｌｉｇａｈ等［２２］于２０２１年提出的
一种新型智能优化算法，具有较强的全局搜索能力和较快的收敛速度。天鹰优化算法的灵感来自于天
鹰的狩猎行为。天鹰主要有四种狩猎行为，即高空翱翔和垂直俯冲攻击、等高线飞行和短滑翔攻击、
低空飞行和慢速下降攻击以及行走攻击并捕获猎物。这四种狩猎行为分别属于扩大搜索、缩小搜索、
扩大开发和缩小开发的四个阶段。然而，ＡＯ算法采用简单的随机方式对种群初始化，难以保证初始
化种群分布的均匀性和多样性，并且在开发阶段容易陷入局部最优。针对上述问题，本文采用混沌理
论中搜素速度较快的Ｔｅｎｔ混沌映射代替传统天鹰优化算法中的随机初始化，以增强种群的均匀性和多
样性；然后，引入非线性飞行速率更新策略替代原来的线性飞行速率更新策略，以提高天鹰优化算法
１
— １９９ —

58 59 60 61 62 63 64 65 66 67 68