Page 101 - 2025年第56卷第2期
P. 101

[5]
                                                                   [6]
              VectorMachine,SVM) 、随机森林(RandomForest,RF) 、极端梯度增强(ExtremeGradientBoosting,
                       [7]
                                                                    [8]
              XGBoost) 、极限学习机(ExtremeLearningMachine,ELM) 等。但机器学习模型捕捉长时间序列中
              隐藏信息的能力较弱,以致其在长时间非线性平稳序列预测领域的效果不是很理想                                        [9] 。
                  深度学习(DeepLearning,DL)相对于机器学习在处理大规模数据、自适应性和泛化能力方面有更
              强的优势     [10] ,常见模型包 括卷 积神经 网络 (ConvolutionalNeuralNetworks,CNN)           [11 - 12] 、长 短 期记忆
              (LongShort - Term Memory,LSTM) [13] 、门控循环单元(GatedRecurrentUnit,GRU)         [14] 、时间卷积网络
              (TemporalConvolutionalNetwork,TCN)  [15] 等。不同径流预测模型的特点如表 1所示。深度学习模型常
              与注意力机制(AttentionMechanism,AM)相结合,通过局部注意机制学习多站点交互的时空特征之间
              的权重分布,以提高预测效果。此外,神经网络的各种参数的选取并没有统一标准,使得训练时长过
              长,拟合效果较差         [16] 。因此,本研究拟引入改进后的麻雀搜索算法(ImprovedSparrowSearchAlgorithm,
              ISSA)对神经网络进行全局参数优 化,使得 深度学习 模型 更加 客 观 合理,有 效消 除主 观偏 好 选取的
              不足。
                                                表 1 不同径流预测模型的特点

                模型                      优点                                         缺点
                                                                1.严格的数据质量要求:若无完整、精确的数据将影响预
                       1.采用严格的统计方法和数学模型。
                                                                测结果可靠性。
                       2.可验证 性:预 测 的 准 确 性 可 通 过 经 验 或 事 实 数 据 来
                统计                                              2.忽视非数据因素:无法考虑非数据因素,如政策变化和
                       评估。
               预测模型                                             不可预见事件。
                       3.统计预 测 具 有 广 泛 的 应 用 范 围, 涵 盖 不 同 的 专 业 和
                                                                3.预测未来变化的灵活性有限:无法准确预测意外事件或
                       行业。
                                                                特殊情况。
                       1.自主学习性:可从海量数据中自主提取规律和特征。                1.数据依赖性:模型预测准确性在很大程度上取决于数据
                       2.高 效 性: 能 快 速 分 析 海 量 数 据, 并 实 时 提 供 预 测  的口径和数量。
                       结果。                                      2.模型泛化:某些机器学习模型有过度拟合的倾向,即过
               机器学习
                       3.通用性:可修 改 参 数 或 替 换 模 型, 适 应 各 种 数 据 和  度拟合训练数 据 而 无 法 泛 化 到 新 数 据,从 而 导 致 预 测 性 能
               预测模型
                       任务。                                      下降。
                       4.可解释性:某 些 机 器 学 习 模 型, 能 够 提 供 更 直 观 的  3.计算成本:某些机器学习模型需要高性能的机器和大量
                       解释。                                      的计算资源。
                       1.具有学 习 复 杂 特 征 的 卓 越 能 力, 能 够 自 动 提 取 特 征  1.深度学习模型需要充足的存储空间和计算能力。
                       信息。                                      2.过度拟合训练数据会造成过度适应训练数据,而无法将
                       2.处理大量数据的能力:深度学习模型具有有效管理大                其知识有效应用于新数据。
               深度学习
                       量数据集并从中获取有价值信息的能力。                       3.泛化能力有限。遇到与训练数据不同的陌生输入时,可
               预测模型
                       3.提高模型的可解释性:与传 统 的 机 器 学 习 模 型 相 比, 能出过多错误。
                       深度学习 模 型 具 有 更 简 单 透 明 的 结 构, 使 其 更 具 可 解  4.对数据质量高度敏感。数据不足或数据质量差可导致预
                       释性。                                      测输出不准确。


                  但是,仅采用深度学习模型进行预测,在数据突变时无法稳健模拟序列的短期动态变化过程,会
              降低预测效果,对此可采取数据分解重构的方法来解决问题                              [17] 。常见的分解方法包括经验模态分解
              ( EmpiricalModeDecomposition,EMD)  [18] 、变分模态分解(VariationalModeDecomposition,VMD)       [19] 和
              互补集合经验模态分解(CompleteEnsembleEmpiricalModeDecomposition,CEEMD)               [20] 等。但是,单一
              的分解方法很难有效提取复杂环境下流域径流的非平稳非线性的特征。
                  此外,当前水文预测主要是对径流量进行基于确定数值的点预测为主,即对某个径流过程的单点
              期望值进行预测。由于模型自身误差及点预测的预测范围较窄,点预测往往不能反映径流量预测波动
              上下界,以致影响预测的实际应用价值                   [21] 。而基于区间的不确定性预测能够描述径流变化的范围、概
              率分布,从而获得更为全面的未来径流变化信息                       [22] 。
                  区间预测主要分为参数法和非参数方法                   [23] 。参数估计法根据经验对数据做出分布假设,然后求解
              分布参数,最终得到概率密度函数( ProbabilityDensityFunction,PDF)                [24] 。在实际应用中,误差分布
              函数往往难以事先确定。非参数核密度估计(NonparametricKernelDensityEstimation,NKDE)不需要对

                                                                                                —  2 4 1 —
   96   97   98   99   100   101   102   103   104   105   106