Page 83 - 2024年第55卷第5期

P. 83

－１～－８ｄ之间；齐齐哈尔站验证期绝对误差在－４～２ｄ之间；牡丹江站绝对误差最小，范围在－１～１ｄ之间。
如表３所示，ＣＥＥＭＤＡＮ－ＬＳＴＭ得到的各站开河日期模拟值与实测值的平均绝对误差ＭＡＥ在０．７７～
３．４ｄ，其中齐齐哈尔站和宝清站的ＭＡＥ最大；对于训练期模拟值与实测值的ＭＡＥ，宝清站最大，齐
齐哈尔站次之，分别为１．９７和１．３６。对于验证期模拟值与实测值的ＭＡＥ，宝清站最大，齐齐哈尔站次
之，分别为３．４０和１．８３ｄ。训练期间开河日期ＭＡＥ均值为１．２０ｄ，验证期为１．６５ｄ。
对比表２和表３不难发现，与ＬＳＴＭ模拟结果的绝对误差相比，ＣＥＥＭＤＡＮ－ＬＳＴＭ模拟结果在训
练期的绝对误差范围缩小６２．５％（１５ｄ），验证期的绝对误差范围缩小６１．１％（１１ｄ）。与ＬＳＴＭ相同，
ＣＥＥＭＤＡＮ－ＬＳＴＭ得到的各站训练期模拟值与实测值的绝对误差范围均大于验证期的绝对误差范围；
训练期内，齐齐哈尔站绝对误差最大；验证期内，宝清站绝对误差最大，其次为齐齐哈尔站。ＣＥＥＭ
ＤＡＮ－ＬＳＴＭ将齐齐哈尔站训练期的绝对误差范围缩小了６２．５％（１５ｄ）、验证期的绝对误差范围缩小了
５０％（６ｄ），将宝清站验证期绝对误差范围缩小了６１．１％（１１ｄ）。
与ＬＳＴＭ模拟结果的平均绝对误差相比，ＣＥＥＭＤＡＮ－ＬＳＴＭ模拟结果的整体平均误差范围缩小
５３．０％（２．９７ｄ）；齐齐哈尔站和宝清站，训练期平均绝对误差分别减小６５．７％（２．６１ｄ）和２４．５％（０．６４ｄ），
验证期平均绝对误差分别减小７１．１％（４．５ｄ）和４６．９％（３．０ｄ）。与ＬＳＴＭ相比，ＣＥＥＭＤＡＮ－ＬＳＴＭ模拟
的所有代表站训练期开河日期的预报合格率（ＱＲ）均为１００％，尤其是齐齐哈尔站训练期的合格率提高
了２５％；验证期开河日期预报的合格率除宝清站（合格率为８０％）以外的其余各站均为１００％，尤其是
宝清站和齐齐哈尔站验证期的合格率均提高了２０％。训练期开河日期ＭＡＥ值从２．５１ｄ减少至１．２０ｄ；
验证期ＭＡＥ值从３．８５ｄ减少至１．６５ｄ。
３．４讨论在所有水文站中，宝清站和齐齐哈尔站开河日期预报精度均低于其他站，这可能是因为宝
清站开河日期序列波动程度最大，随机性最强，预报精度越难以得到有效保证；齐齐哈尔站开河日期
序列长度较短、标准差较大，可供ＬＳＴＭ学习的训练样本较少，导致ＬＳＴＭ模型无法准确地获取序列
总体的特征，故而齐齐哈尔站开河日期预报精度较低。
此外，２０１９年宝清站和齐齐哈尔站都出现了黑天鹅事件，这同样可能是宝清站和齐齐哈尔站开河
日期预报精度较低的原因。ＬＳＴＭ是一种通过学习训练数据特征从而拥有预测能力的神经网络。但黑
天鹅事件是训练数据中从未出现的情况，是极值样本，ＬＳＴＭ无法学习其特征，导致其预报精度较低。
值得注意的是，与ＬＳＴＭ相比，ＣＥＥＭＤＡＮ－ＬＳＴＭ的评价指标显示宝清站、齐齐哈尔站预报精度
均得到了大幅提升（表３），这也表明ＣＥＥＭＤＡＮ能够通过分解得到子序列更好地表征原始序列的随机
特征，从而在一定程度上弥补了ＬＳＴＭ因样本序列波动过程、样本数量相对较少和包含极值样本较少
而难以得到较高预报精度的不足。

４结论与展望

本文以中国北方典型寒区黑龙江省内５个代表站的开河日期序列作为研究对象，采用信号分解技术－深
度学习模型（ＣＥＥＭＤＡＮ－ＬＳＴＭ）开展河流开河日期的预测研究，检验模型性能和适用性，得到以下结论：
（１）ＣＥＥＭＤＡＮ能够将原始序列分解为多个ＩＭＦ序列和１个余量序列。在原始序列长度相近的情况
下，序列的标准差越大，分解得到ＩＭＦ子序列的个数越多。随着序列逐步分解，ＩＭＦ振荡频率和幅度逐
渐下降，序列数值逐渐增加，而余量序列的曲线趋于线性，且余量序列的数值与原始序列的均值相近。
（２）ＣＥＥＭＤＡＮ能够明显提高ＬＳＴＭ模型河流开河日期的预报精度。与ＬＳＴＭ预报精度相比，
ＣＥＥＭＤＡＮ－ＬＳＴＭ模型可使预报的绝对误差范围从［－１３，１３］缩小至［－８，６］，平均绝对误差从２．５１ｄ
减少至１．２０ｄ、合格率从９１．５９％提升至１００％；验证期平均绝对误差从３．８５ｄ减少至１．６５ｄ，合格率
从８８％提升至９６％。
（３）ＣＥＥＭＤＡＮ－ＬＳＴＭ能够在一定程度上弥补ＬＳＴＭ由于训练样本随机性较强和样本数量相对较少
可能导致的预报精度不高的缺点。在本研究中，与ＬＳＴＭ相比，ＣＥＥＭＤＡＮ－ＬＳＴＭ可使齐齐哈尔站开
河日期的预报绝对误差范围从［－１３，１３］缩小至［－４，６］、平均绝对误差从６．３３ｄ降低为１．８３ｄ，合

— ５８３ —

78 79 80 81 82 83 84 85 86 87 88