Page 83 - 2024年第55卷第5期
P. 83

- 1~ - 8d之间;齐齐哈尔站验证期绝对误差在- 4~2d之间;牡丹江站绝对误差最小,范围在- 1~1d之间。
                  如表 3所示,CEEMDAN - LSTM得到的各站开河日期模拟值与实测值的平均绝对误差 MAE在 0.77~
              3.4d ,其中齐齐哈尔站和宝清站的 MAE最大;对于训练期模拟值与实测值的 MAE,宝清站最大,齐
              齐哈尔站次之,分别为 1.97和 1.36。对于验证期模拟值与实测值的 MAE,宝清站最大,齐齐哈尔站次
              之,分别为 3.40和 1.83d。训练期间开河日期 MAE均值为 1.20d,验证期为 1.65d。
                  对比表 2和表 3不难发现,与 LSTM 模拟结果的绝对误差相比,CEEMDAN - LSTM 模拟结果在训
              练期的绝对误差范围缩小 62.5%(15d),验证期的绝对误差范围缩小 61.1%(11d)。与 LSTM 相同,
              CEEMDAN - LSTM得到的各站训练期模拟值与实测值的绝对误差范围均大于验证期的绝对误差范围;
              训练期内,齐齐哈尔站绝对误差最大;验证期内,宝清站绝对误差最大,其次为齐齐哈尔站。CEEM
              DAN - LSTM将齐齐哈尔站训练期的绝对误差范围缩小了 62.5%(15d)、验证期的绝对误差范围缩小了
              50%(6d),将宝清站验证期绝对误差范围缩小了 61.1%(11d)。
                  与 LSTM模拟结果的 平均绝 对误 差相比,CEEMDAN - LSTM 模 拟结 果的 整体 平均 误差 范 围缩小
              53.0%(2.97d);齐齐哈尔站和宝清站,训练期平均绝对误差分别减小 65.7%(2.61d)和 24.5%(0.64d),
              验证期平均绝对误差分别减小 71.1%(4.5d)和 46.9%(3.0d)。与 LSTM相比,CEEMDAN - LSTM模拟
              的所有代表站训练期开河日期的预报合格率(QR)均为 100%,尤其是齐齐哈尔站训练期的合格率提高
              了 25%;验证期开河日期预报的合格率除宝清站(合格率为 80%)以外的其余各站均为 100%,尤其是
              宝清站和齐齐哈尔站验证期的合格率均提高了 20%。训练期开河日期 MAE值从 2.51d减少至 1.20d;
              验证期 MAE值从 3.85d减少至 1.65d。
              3.4 讨论 在所有水文站中,宝清站和齐齐哈尔站开河日期预报精度均低于其他站,这可能是因为宝
              清站开河日期序列波动程度最大,随机性最强,预报精度越难以得到有效保证;齐齐哈尔站开河日期
              序列长度较短、标准差较大,可供 LSTM学习的训练样本较少,导致 LSTM 模型无法准确地获取序列
              总体的特征,故而齐齐哈尔站开河日期预报精度较低。
                  此外,2019年宝清站和齐齐哈尔站都出现了黑天鹅事件,这同样可能是宝清站和齐齐哈尔站开河
              日期预报精度较低的原因。LSTM是一种通过学习训练数据特征从而拥有预测能力的神经网络。但黑
              天鹅事件是训练数据中从未出现的情况,是极值样本,LSTM无法学习其特征,导致其预报精度较低。
                  值得注意的是,与 LSTM相比,CEEMDAN - LSTM 的评价指标显示宝清站、齐齐哈尔站预报精度
              均得到了大幅提升(表 3),这也表明 CEEMDAN能够通过分解得到子序列更好地表征原始序列的随机
              特征,从而在一定程度上弥补了 LSTM因样本序列波动过程、样本数量相对较少和包含极值样本较少
              而难以得到较高预报精度的不足。


              4 结论与展望


                  本文以中国北方典型寒区黑龙江省内 5个代表站的开河日期序列作为研究对象,采用信号分解技术- 深
              度学习模型(CEEMDAN - LSTM)开展河流开河日期的预测研究,检验模型性能和适用性,得到以下结论:
                  ( 1)CEEMDAN能够将原始序列分解为多个 IMF序列和 1个余量序列。在原始序列长度相近的情况
              下,序列的标准差越大,分解得到 IMF子序列的个数越多。随着序列逐步分解,IMF振荡频率和幅度逐
              渐下降,序列数值逐渐增加,而余量序列的曲线趋于线性,且余量序列的数值与原始序列的均值相近。
                  ( 2)CEEMDAN能 够 明 显 提 高 LSTM 模 型 河 流 开 河 日 期 的 预 报 精 度。与 LSTM 预 报 精 度 相 比,
              CEEMDAN - LSTM模型可使预报的绝对误差范围从[ - 13,13]缩小至[ - 8,6],平均绝对误差从 2.51d
              减少至 1.20d、合格率从 91.59%提升至 100%;验证期平均绝对误差从 3.85d减少至 1.65d,合格率
              从 88%提升至 96%。
                  ( 3)CEEMDAN - LSTM能够在一定程度上弥补 LSTM由于训练样本随机性较强和样本数量相对较少
              可能导致的预报精度不高的缺点。在本研究中,与 LSTM 相比,CEEMDAN - LSTM 可使齐齐哈尔站开
              河日期的预报绝对误差范围从[ - 13 ,13]缩小至[ - 4 ,6]、平均绝对误差从 6.33d降低为 1.83d,合

                                                                                                —  5 8 3 —
   78   79   80   81   82   83   84   85   86   87   88