Page 56 - 2025年第56卷第5期
P. 56
图 2 区间预测可视化
通过图 2区间预测可视化以及局部图可见,在 “异常” 位置,预测区间未能覆盖所有样本点,导
致 PI 下降。本文将利用这个特性进行异常检测。由图 3可知,在 MaData的 e、e、e位置 PI 最低
CP 1 2 3 CP
数值为 0,与正常时段的 PI = 1 形成鲜明对比。对于 KeoghData的两个异常周期处,PI 虽然在正常
CP CP
时段位于[0.7,1]之间,并未始终维持在较高水平。但在 e处下降至最低点 0.48,相较正常时段,仍
能指示异常现象。
图 3 PI 曲线图
CP
由上述两个数据集可见,区间预测可用于基于预测误差的异常检测,但对比图 3(a)(b)可以发
现,该方法更适用于 MaData中的 “数值异常” 检测。
3.2 阈值确定 振动是机械设备的常见现象,但对于水电机组,异常振动不常见,机组大多数时间处
于正常状态,因此数据集通常高度不平衡。在异常检测中,常用受试者工作特征(ReceiverOperating
Characteristic ,ROC)曲线 [20] 评估检测效果,避免因正常类别占多数导致准确度虚高。ROC曲线展示
分类器性能随阈值变化的过程,每个点代表一个分类器,其性能通过横坐标(假阳性率)和纵坐标(真
阳性率)表示。因此,本文引入 ROC曲线在模型离线训练阶段,初步设置异常判定标准,为后续在线
检测阈值调试提供参考。
3.3 异常检测评估
(1)真阳性率(TPR)。在所有实际为阳性的样本中,正确地识别为阳性的比例。其计算公式:
TP
TPR = (8)
TP + FN
— 6 0 —
2