Page 30 - 2025年第56卷第6期
P. 30

水动力学模型还涉及到一维河网和二维湖泊的耦合计算,使得江湖系统的模拟预报十分复杂,计算耗时长。
                  近年来,机器学习、深度学习等人工智能模型被引入水文模拟预报领域,在计算速度和精度方面
              展现出了明显优势         [11] 。许多学者围绕深度学习模型结构创新、经典模型改进、应用探索和多方法融
              合等方面开展研究。丁艺鼎等               [12] 基于改进的鲸鱼优化算法(Whale Optimization Algorithm,WOA)和长
              短期记忆(Long Short-Term Memory,LSTM)神经网络,构建了自动优化参数的 WOA-LSTM 模型,通
              过算法优化神经网络结构增强了模型的稳定性和精确度。林康聆等                                  [13] 将 LSTM 与编码解码(Encoder-
              Decoder)结 构 结 合 , 构 建 了 LSTM-ED 模 型 并 在 建 溪 流 域 进 行 验 证 应 用 。 胡 乐 怡 等          [14] 深 入 探 讨 了
              LSTM 径流预报所需记忆时间与流域面积的关系,为模型在不同地理条件下的应用提供了参考。刘
              昱辰等   [15] 采用 LSTM 模型开展了径流预报的实时校正研究,其预报效果优于传统自回归与移动平均
              ARMA 模型。许月萍等         [16] 建立了基于集成学习与深度学习的洪水径流预报模型,发现融合模型在提高
              预报精度和减少计算时间方面优势显著。崔震等                        [17] 构建了 XAJ-LSTM-EDE-MDN 混合深度学习模型,
              实现了洪水过程概率预报。孙明博等                 [18] 提出基于物理机制和深度学习的混合模型,验证了其在水文预
              报中的有效性。上述这些模型仅用于简单的中小流域。
                  为提升长江-洞庭湖复杂流域水系的洪水模拟预报精度,同时规避数据获取困难、建模计算复杂
              等问题,本文分别构建卷积神经网络(Convolutional Neural Network, CNN),长短期记忆神经网络和门
              控循环单元(Gated Recurrent Unit, GRU)三个深度学习模型,开展 12~48 h 洪水模拟预报研究,分析
              探讨模型的适用性。


              2 研究方法与评价指标


                  CNN、LSTM、GRU 神经网络是目前广泛使用的三个深度学习模型,具有独特的优势和广泛的应
              用前景。其中 CNN 模型在处理具有明显局部链接模式和层次结构的水文时间序列数据中表现出色                                            [19] ;
              LSTM 模型擅长处理时间序列问题,能够有效解决传统 RNN 模型存在的梯度爆炸问题;GRU 模型在时
              间序列模拟预报中具有计算效率和精度高的优势。
                  CNN 模型  [20] 是一种在图像处理和时间序列分析中广泛使用的深度学习架构,特别擅长从数据中自
              动学习和提取空间特征。将整理后的相关水文数据,按时间维度展开为类似图像的二维矩阵结构输入
              CNN 模型。利用卷积层依据式(1)提取时间序列上的局部特征;再通过池化层式(2)降维,保留关键特
              征;最终全连接层根据式(3)计算输出预报值。
                                             Y i,,k  = σ (∑ m∑ n X i + m, + n ·w m,n,k  + b k )        (1)
                                               j
                                                                j
                                                  Y i,,k  = max m,n  ( X i + m, + n,k  )               (2)
                                                                   j
                                                    j
                                                      Y = σ (WX + b)                                   (3)
              式中:Y    i,,k  为对应卷积层、池化层的输出;X             i + m, + n 、X i + m, + n,k 分别为卷积层、池化层输入数据;w     m,n,k
                                                                    j
                       j
                                                           j
              为卷积核;b k 为偏置向量;σ为sigmoid激活函数;Y为输出向量;W为权重矩阵;X为输入向量;b为偏置向量。
                  LSTM 模型  [21] 利用遗忘门、输入门、单元状态和输出门,选择性保留和更新长期依赖信息,避免
              长序列数据处理中的信息丢失。解决传统循环神经网络处理长序列数据时面临的梯度消失或梯度爆炸
              的问题。通过多个 LSTM 神经元连接构建网络层,对输入水文数据深度处理,输出预报流量。
                  GRU 模型  [22] 也是一种高效的循环神经网络变体,能够有效解决标准循环神经网络在处理长序列数据
              时遇到的梯度消失或梯度爆炸问题。通过引入更新门和重置门,GRU 模型能够在不同时间步长间有效地
              调节信息的流动,从而保留长期依赖关系而忽略不相关的信息。根据式(4)(5)计算更新门 Z t 和重置门 R t ,进
              而根据式(6)和式(7)计算候选隐藏状态和最终隐藏状态,实现对输入数据的有效处理,输出预报流量值。
                                                   Z t = σ (W z ⋅ [ h t - 1 ,X t ])                    (4)

                                                   R t = σ (W r ⋅ [ h t - 1 ,X t ])                    (5)
              式 中 : Z t 和 R t 分 别 为 更 新 门 和 重 置 门 ; W z 和 W r 为相应的权重矩阵 ; h t - 1 为 前 一 时 刻 的 隐 藏 状 态 ;

                — 718   —
   25   26   27   28   29   30   31   32   33   34   35