Page 62 - 2023年第54卷第9期
P. 62

降维后的隐藏向量应用于聚类算法能够在大幅降低计算复杂度的同时实现对原始数据的聚类,这也避
              免了传统聚类算法人为选择数据特征带来的不确定性。
              3.2 洪水分级模型 K均值聚类算法是一种广泛应用的无监督学习算法,可以将集中的数据分成 K个
              不同的簇(类别),具有简单易懂、计算效率高的特点                         [21] 。该算法的核心思想是通过计算数据点之间
              的距离来将它们划分为 K个簇,使得同一簇内的数据点彼此相似度较高,而不同簇之间的数据点差异
              较大。具体来说,K均值聚类算法首先随机初始化 K个聚类中心,然后将每个数据点分配到与其最近
              的聚类中心所在的簇,接着更新每个簇的聚类中心,直到达到收敛条件为止。
              3.3 洪水预报模型 卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种广泛应用于图像识别和
              语言处理的前馈神经网络,其内部的卷积运算可以提取输入数据的局部特征,根据输入数据的维度不
              同可分为 Conv1d、Conv2d、Conv3d等。水文预报的时序数据可近似理解为自然语言处理中的一个句
              子,仅包含沿时间的一个维度,因此采用 Conv1d进行预报。一维卷积的计算过程如图 3所示,通过
              卷积核在输入数据上的移动提取局部信息,padding用于填补数据两侧的空缺,stride为卷积核移动的
              步长,具体计算公式如下            [22] :
                                                                 l
                                                            l - 1
                                                  l
                                                                      l
                                                       ∑
                                                 x =f (    x K +b    j )                               (1)
                                                  j
                                                                 ij
                                                            i
                                                        i ∈M j
                                                                        l
                                                                                                      l
                     l
              式中:x为第 l层第 j个节点的输出;M 为节点数 i的范围;K为卷积核,表示卷积运算;b为偏
                     j                             j                    i j                           j
              置项;f为激活函数。
                  在卷积神经网络中,随着模型隐藏层和通道数量增加,可产生大量模型参数学习到更多信息特
              征,但这样也容易造成梯度消失等问题。残差网络(ResidualNetwork)是一种针对梯度消失问题的特殊
              网络结构,能够极大提高模型的有效训练深度。传统神经网络的信息通过层层递进的方式向前传播,
              而残差网络通过跳层连接实现了信息从低层到高层的直接传播,以此达到缓解梯度消失的目的                                           [23] 。如图
              4所示,残差网络将上层输入的 x跳层与卷积运算后得到的 F(x)进行相加作为输出 H(x),当 F(x) =0
              时,H(x) =x,形成恒定映射,以保留上层输入特征,避免梯度消失问题。














                              图 3 一维卷积示意                               图 4 传统网络与残差网络对比图
              3.4 AE - RCNN洪水分级智能预报方法 综合上述理论方法,本文提出的 AE - RCNN洪水分级智能预
              报方法训练流程如图 5所示,其主要训练步骤包括:①将原始的降雨流量数据分别归一化至[0,1]区
              间内,输入到 AE数据降维模型中进行数据重构,以重构数据的误差作为损失函数进行网络训练,待
              训练完成得到原始数据在 AE数据降维模型中的隐藏向量;②对步骤 1中得到的隐藏向量进行 K均值
              聚类,根据聚类结果对原始数据进行分类,并将隐藏向量的聚类中心输入 AE数据降维模型的解码器
              得到原始数据的聚类中心,作为后续实际应用时进行洪水分级的依据;③按照步骤 2中的洪水分级结
              果分别进行 RCNN洪水预报模型的训练,保存生成的 K类模型参数。
                  在应用训练好的模型进行洪水预报时,需要将数据分别输入 K类 RCNN洪水预报模型中得到 K类
              预报结果,再将预报结果和各自聚类中心按洪峰时刻对齐,计算二者交集的欧氏距离作为参考,以参
              考距离最近的预报结果作为最优预报结果,参考距离的具体计算公式如下:

                     7
                —  1 0 2 —
   57   58   59   60   61   62   63   64   65   66   67