Page 56 - 2025年第56卷第5期
P. 56

图 2 区间预测可视化

                  通过图 2区间预测可视化以及局部图可见,在 “异常” 位置,预测区间未能覆盖所有样本点,导
              致 PI 下降。本文将利用这个特性进行异常检测。由图 3可知,在 MaData的 e、e、e位置 PI 最低
                   CP                                                                 1   2   3      CP
              数值为 0,与正常时段的 PI = 1 形成鲜明对比。对于 KeoghData的两个异常周期处,PI 虽然在正常
                                       CP                                                      CP
              时段位于[0.7,1]之间,并未始终维持在较高水平。但在 e处下降至最低点 0.48,相较正常时段,仍
              能指示异常现象。














                                                       图 3 PI 曲线图
                                                            CP
                  由上述两个数据集可见,区间预测可用于基于预测误差的异常检测,但对比图 3(a)(b)可以发
              现,该方法更适用于 MaData中的 “数值异常” 检测。
              3.2 阈值确定 振动是机械设备的常见现象,但对于水电机组,异常振动不常见,机组大多数时间处
              于正常状态,因此数据集通常高度不平衡。在异常检测中,常用受试者工作特征(ReceiverOperating
              Characteristic ,ROC)曲线  [20] 评估检测效果,避免因正常类别占多数导致准确度虚高。ROC曲线展示
              分类器性能随阈值变化的过程,每个点代表一个分类器,其性能通过横坐标(假阳性率)和纵坐标(真
              阳性率)表示。因此,本文引入 ROC曲线在模型离线训练阶段,初步设置异常判定标准,为后续在线
              检测阈值调试提供参考。
              3.3 异常检测评估
                  (1)真阳性率(TPR)。在所有实际为阳性的样本中,正确地识别为阳性的比例。其计算公式:
                                                              TP
                                                       TPR =                                            (8)
                                                            TP + FN
                —  6 0  —
                     2
   51   52   53   54   55   56   57   58   59   60   61