Page 58 - 2025年第56卷第5期
P. 58

年 11月 14日上午上机架 x向振动峰峰值,样本采样间隔为 2s,共 7500个样本点均为健康样本。
                  实验 1:为了确保分位数区间预测模型能够学习到水电机组的健康状态,有效预测水电机组振动
              区间。本文将该段数据 10∶00前的部分按照 9∶1划分为训练集与验证集,其余部分作为测试集,进
              行区间预测。选取几种常见神经网络模型进行训练,并采用本文 2.2节中的指标进行评价。
                  实验 2:为验证本文所提方法对振动异常事件的响应能力,在健康序列中某些时刻加入 3倍标准
              差( 3 σ )数值来模拟振动异常事件           [21] 。
                  如图 5(a)(b)所示,分别在 11月 14日 10∶00、10∶15、10∶30、10∶45、11∶00、11∶15、11∶30、
              11∶45共 8处作为异常突变点,开始加入 30s异常作为一个振动异常事件。同样用实验 1的神经网络
              模型进行实验。由于检测效果除了会受到置信水平与阈值的影响,可能还会受滑动窗宽与步长的影
              响,故实验设置不同滑动窗口窗宽、滑动窗口步长进行分析。

























                                                  图 5 案例一数据(11月 14日)

              4.1.2 区间预测 为验证分位数模型的区间预测能力,实验 1选取 BP、CNN、LSTM、CNN - LSTM几
              种常见神经网络基本模型进行评测。图 6展示了其中一段验证集样本在不同置信水平下应用分位数模
              型的预测区间可视化。可见,实验 1设置的四种分位数区间预测模型的结果均有一定的预测精准度。
              从表 1可得到,P= 95%时,BP、CNN、LSTM、CNN - LSTM 模 型 的 PI 值 分别 为 94.12%、92.71%、
                                                                               CP
              94.59%、98.59%,CNN - LSTM模型的 PI 值最大,实际值落入预测区间的占比最多。P = 90%、85%时,
                                                  CP
              与 95%水平相比,CNN - LSTM模型的 PI 值分别降低了 5.64%和 10.77%。不同置信水平下,CNN - LSTM
                                                  CP
              模型 PI 值均为最小,即预测区间越窄。
                     NAW
                  综合 PI 和 PI 两个指标,实验 1所设置的 4个模型大致表现出相同规律,即置信水平越高,预
                         CP
                               NAW
              测区间越宽,区间覆盖率越大。但区间预测是该法进行振动异常检测的前置环节,预测的效果并不能
              直接地反映检测效果。
              4.1.3 异常检测 为验证所提动态区间覆盖方法对水电机组振动数据异常检测有效性,仍以 P = 90%、
              W= 15 、S = 5 为例进行实验。在基于点预测的振动异常检测中,参考实验 1验证集最大预测误差绝对
              值,将阈值取值范围设置为 0~15μ m,均匀取值,检测结果形成 ROC曲线。而使用动态区间覆盖方
              法的检测,由于 PI 本身性质,阈值在 0~1之间均匀取值,动态计算测试集区间覆盖率,形成各模型
                               CP
              的 ROC曲线。
                  如图 7(a)所示,基于点预测的各检测模型的 AUC值均在 0.85左右,检测效果较好。选取表现最
              好的分类器为例,即 CNN - LSTM预测误差(预测值与实际值差值的绝对值)为 2.12μ m,作为异常判断
              标准(该点误差大于 2.12μ m标记为正常,反之为异常)。CNN - LSTM模型在该阈值下的预测误差曲线
              如图 8所示,相应的 TPR和 FPR分别为 0.779和 0.185。而如图 7(b)所示,使用动态区间覆盖方法的
              各模型 AUC值均大于 0.95,表现优秀。CNN - LSTM表现最佳,而其中最接近点(1,1)的阈值为 0.677,

                —  6 0  —
                     4
   53   54   55   56   57   58   59   60   61   62   63