高级检索

  • ISSN 1006-3080
  • CN 31-1691/TQ
引用本文:
Citation:

基于自适应稀疏表示和保局投影的工业故障检测

    作者简介: 邬东辉(1995-),男,浙江宁波人,硕士生,主要研究方向为故障诊断。E-mail:1205837939@qq.com;
    通讯作者: 顾幸生, xsgu@ecust.edu.cn
  • 中图分类号: TP277

Industrial Fault Detection Based on Adaptive Sparse Representation and Locality Preserving Projections

    Corresponding author: GU Xingsheng, xsgu@ecust.edu.cn
  • CLC number: TP277

  • 摘要: 针对工业过程中检测和储存的数据维度不断增大,传统的检测方法中存在处理速度慢、故障特征提取不明显等问题,本文提出了一种基于自适应稀疏表示和保局投影(Adaptive Sparse Representation and Locality Preserving Projections, ASRLPP)的故障检测方法。首先利用稀疏字典学习算法构造残差空间对数据进行特征提取,使数据的全局特征更加明显;然后在残差空间中利用保局投影 (Locality Preserving Projections, LPP) 算法进行降维操作,对数据进行过滤降维,保留局部特征;最后利用T2统计量计算控制限进行监控。在检测过程中,引入自适应更新规则,将检测到的正常工况数据用于更新初始训练集,选取更加合理的训练集,动态地调整控制限,使其与所处理的故障数据特征相适应,提高故障检测效率和准确率。通过一个数值例子以及TE(Tennessee-Eastman)过程仿真验证了ASRLPP算法的有效性。
  • 图 1  故障检测流程图

    Figure 1.  Flow chart of fault detection

    图 2  故障1和故障2下两种算法的PC1和PC2散点图

    Figure 2.  PC1 and PC2 scatter diagrams of two algorithms under fault 1 and fault 2

    图 3  3种算法对故障1和故障2的检测结果

    Figure 3.  Detection results of fault 1 and fault 2 under three algorithms

    图 4  故障4在3种算法下的检测结果

    Figure 4.  Detection results of fault 4 under three algorithms

    表 1  工况1下数值例子故障检测结果

    Table 1.  Fault detection results of numerical examples under condition 1

    FaultLPPSRDASRLPP
    MAR/%FAR/%MAR/%FAR/%MAR/%FAR/%
    191.560.120.252.121.490
    279.400.1210.922.9915.380
    下载: 导出CSV

    表 2  工况2下数值例子故障检测结果

    Table 2.  Fault detection results of numerical examples under condition 2

    FaultLPPSRDASRLPP
    MAR/%FAR/%MAR/%FAR/%MAR/%FAR/%
    192.2502.500.1300
    281.00012.750.1312.500.13
    下载: 导出CSV

    表 3  两种算法在不同字典维度下故障1的检测结果

    Table 3.  Fault 1 detection results of two algorithms in different dictionary dimensions

    Dictionary dimensionSRLPPASRLPP
    MAR(%)FAR(%)MAR(%)FAR(%)
    100 70.50 0 0.75 0
    300 45.00 0.25 0 0
    500 37.25 0 0 0
    700 0.25 0 0 0
    下载: 导出CSV

    表 4  TE过程的20个预设故障

    Table 4.  20 preset faults of TE process

    Fault numberProcess variableType
    1A/C feed ratio, B composition constantStep
    2B composition, A/C ratio constantStep
    3D feed temperatureStep
    4Reactor cooling water inlet temperatureStep
    5Condenser cooling water inlet temperatureStep
    6A feed lossStep
    7C header pressure loss--reduced availabilityStep
    8A, B, C feed compositionRandom variation
    9D feed temperatureRandom variation
    10C feed temperatureRandom variation
    11Reactor cooling water inlet temperatureRandom variation
    12Condenser cooling water inlet temperatureRandom variation
    13Reaction kineticsSlow drift
    14Reactor cooling water valveSticking
    15Condenser cooling water valveSticking
    16UnknownUnknown
    17UnknownUnknown
    18UnknownUnknown
    19UnknownUnknown
    20UnknownUnknown
    下载: 导出CSV

    表 5  故障检测结果

    Table 5.  Fault detection results

    FaultLPPSRDSRLPPASRLPP
    MAR/%FAR/%MAR/%FAR/%MAR/%FAR/%MAR/%FAR/%
    10.7500.500.210.381.670.121.04
    21.6201.3801.250.941.000.42
    3////////
    475.8804.1301.381.350.120.52
    577.25068.75054.371.252.501.04
    61.250000.380.3100.73
    70000.100.8300.42
    82.7501.750.211.621.871.621.25
    9////////
    1075.75048.12029.871.1521.631.15
    1156.62031.250.124.120.6316.630.94
    121.6201.000.210.621.250.501.15
    135.7504.750.104.251.354.250.63
    141.12000.101.1500.52
    15////////
    1692.130.168.751.8722.753.2315.502.85
    1724.1207.8704.251.464.001.04
    1811.25010.250.318.251.988.371.46
    1995.75091.000.2152.751.1549.500.83
    2077.12048.880.134.880.9432.380.52
    下载: 导出CSV

    表 6  TE过程故障的检测时刻对比

    Table 6.  Comparison of detection time on TE process

    FaultDetection timeFaultDetection time
    LPPSRDASRLPPLPPSRDASRLPP
    116716516211167167166
    217317216212163163161
    3///13207198167
    416116116114162161161
    516116116115///
    617116116116312196161
    716116116117189184162
    818117816918221221161
    9///19196171162
    1018718516620249242166
    下载: 导出CSV
  • [1] 刘强, 柴天佑, 秦泗钊, 等. 基于数据和知识的工业过程监视及故障诊断综述[J]. 控制与决策, 2010, 25(6): 801-807.
    [2] 张习习, 顾幸生. 基于集成学习概率神经网络的电机轴承故障诊断[J]. 华东理工大学学报(自然科学版), 2020, 46(1): 68-76.
    [3] 顾幸生, 周冰倩. 基于LNS-DEWKECA算法的多模态工业过程故障检测[J]. 控制与决策, 2020: 1-8.
    [4] VENKATSUBRAMANIAN V, RENGASWAMY R, KAVURI S N, <italic>et al</italic>. A review of process fault detection and diagnosis[J]. Computers and Chemical Engineering, 2003, 27(3): 293-311. doi: 10.1016/S0098-1354(02)00160-6
    [5] 贾庆贤, 张迎春, 管宇, 等. 基于解析模型的非线性系统故障诊断方法综述[J]. 信息与控制, 2012, 41(3): 356-364.
    [6] GIL P, SANTOS F, PALMA L, <italic>et al</italic>. Recursive subspace system identification for parametric fault detection in nonlinear systems[J]. Applied Soft Computing, 2015, 37: 444-455. doi: 10.1016/j.asoc.2015.08.036
    [7] ALEGRÍA-ZAMUDIO M, ESCOBAR-JIMÉNEZ R F, GÓMEZ-AGUILAR J F. Fault tolerant system based on non-integers order observers: Application in a heat exchanger[J]. ISA Transactions, 2018, 80: 286-296. doi: 10.1016/j.isatra.2018.06.007
    [8] HAMDI H, RODRIGUES M, MECHMECHE C, <italic>et al</italic>. Observer-based fault diagnosis for time-delay LPV descriptor systems[J]. IFAC-PapersOnLine, 2018, 51(24): 1179-1184. doi: 10.1016/j.ifacol.2018.09.702
    [9] ODENDAAL H M, JONES T. Actuator fault detection and isolation: An optimized parity space approach[J]. Control Engineering Practice, 2014, 26: 222-232. doi: 10.1016/j.conengprac.2014.01.013
    [10] 刘强, 柴天佑, 秦泗钊. 基于数据和知识的工业过程监视及故障诊断综述[J]. 控制与决策, 2010, 25(6): 801-807, 813.
    [11] 李晗, 萧德云. 基于数据驱动的故障诊断方法综述[J]. 控制与决策, 2011, 26(1): 1-9, 16.
    [12] 马贺贺. 基于数据驱动的复杂工业过程故障检测方法研究[D].上海: 华东理工大学, 2013.
    [13] DONG Y N, QIN S J. A novel dynamic PCA algorithm for dynamic data modeling and process monitoring[J]. Journal of Process Control, 2018, 67: 1-11. doi: 10.1016/j.jprocont.2017.05.002
    [14] DONG J, ZHANG K, HUANG Y, <italic>et al</italic>. Adaptive total PLS based quality-relevant process monitoring with application to the Tennessee Eastman process[J]. Neurocomputing, 2015, 154: 77-85. doi: 10.1016/j.neucom.2014.12.017
    [15] ZHANG T, ZHENG W, CUI Z, et al. Deep manifold-to-manifold transforming network[C]//25th IEEE International Conference on Image Processing. Greece: IEEE, 2018: 4098-4102.
    [16] 薛敏, 杨健, 谭帅, 等. 基于多数据结构的集成质量监控方法[J]. 华东理工大学学报(自然科学版), 2019, 45(6): 938-945.
    [17] 卢春红, 王杰华, 文万志, 等. 非局部约束下的局部稀疏保持投影及其在故障检测中的应用[J]. 信息与控制, 2019, 48(1): 123-128.
    [18] ZHAO J, ZHAO P, LIU S, et al. A fault diganosis method based on bispectrum-LPP and PNN[C]//2017 International Conference on Dependable Systems and Their Applications. Beijing: IEEE, 2017: 98-102.
    [19] PATEL V M, CHELLAPPA R. Sparse representations, compressive sensing and dictionaries for pattern recognition[C]//The First Asian Conference on Pattern Recognition.Beijing: IEEE, 2011: 325-329.
    [20] LEAL N, MORENO S, ZUREK E. Simple method for detecting visual saliencies based on dictionary learning and sparse coding[C]//14th Iberian Conference on Information Systems and Technologies (CISTI). Portugal:, 2019: 1-5.
    [21] LIN F, FEI Z, WAN J, et al. A robust efficient dictionary learning algorithm for compressive data gathering in wireless sensor networks[C]/ 9th International Conference on Intelligent Human-Machine Systems and Cybernetics (IHMSC). Hangzhou: IEEE, 2017: 12-15.
    [22] 李继猛, 李铭, 王慧, 等. 基于相关正交匹配追踪算法的风电机组滚动轴承稀疏故障诊断方法[J]. 中国机械工程, 2018, 29(12): 1428-1433.
    [23] 郭小萍, 刘诗洋, 李元. 基于稀疏残差距离的多工况过程故障检测方法研究[J]. 自动化学报, 2019, 45(3): 617-625.
    [24] DING H X, DING K, ZHAN J W, <italic>et al</italic>. Local outlier factor-based fault detection and evaluation of photovoltaic system[J]. Solar Energy, 2018, 164: 139-148. doi: 10.1016/j.solener.2018.01.049
    [25] LEE J, KANG B Y, KANG S H. Integrating independent component analysis and local outlier factor for plant-wide process monitoring[J]. Journal of Process Control, 2011, 21(7): 1011-1021. doi: 10.1016/j.jprocont.2011.06.004
    [26] WU X L, ZHANG X J, WANG X L, <italic>et al</italic>. Low bit-rate image compression via adaptive down-sampling and constrained least squares upconversion[J]. IEEE Transactions on Image Processing, 2009, 18(3): 552-61. doi: 10.1109/TIP.2008.2010638
    [27] CAI T T, WANG L. Orthogonal matching pursuit for sparse signal recovery with noise[J]. IEEE Transactions on Information Theory, 2011, 57(7): 4680-4688. doi: 10.1109/TIT.2011.2146090
    [28] 练秋生, 石保顺, 陈书贞, 等. 字典学习模型、算法及其应用研究进展[J]. 自动化学报, 2015, 41(2): 240-260.
    [29] TROPP J A, GILBERT A C. Signal recovery from random measurements via orthogonal matching pursuit[J]. IEEE Transactions on Information Theory, 2007, 53(12): 4655-4666. doi: 10.1109/TIT.2007.909108
    [30] 郑鑫, 田学民, 张汉元. 基于动态稀疏保局投影的故障检测方法[J]. 化工学报, 2016, 67(3): 833-838.
    [31] 许贺楠, 添玉, 肖娟, 等. 基于WPA与WLS-SVM方法的化工过程故障诊断[J]. 控制工程, 2010, 17(S2): 193-197.
    [32] 陈耀, 王文海, 孙优贤, 等. 基于动态主元分析的统计过程监视[J]. 化工学报, 2000, 51(5): 666-670.
    [33] HE X F, NIYOGI P. Locality Preserving Projections (LPP)[J]. Advances in Neural Information Processing Systems, 2002, 16(1): 187-197.
    [34] 单中南, 翁小清, 武天鸿, 等. 基于LPP的时间序列半监督分类[J]. 智能计算机与应用, 2019, 9(1): 6-13.
    [35] GE Z Q, SONG Z H. Multimode process monitoring based on Bayesian method[J]. Chemometrics and Intelligent Laboratory Systems, 2009, 23(12): 636-650.
  • 加载中
图(4)表(6)
计量
  • 文章访问数:  600
  • HTML全文浏览量:  396
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-06-10
  • 网络出版日期:  2020-09-21

基于自适应稀疏表示和保局投影的工业故障检测

    作者简介:邬东辉(1995-),男,浙江宁波人,硕士生,主要研究方向为故障诊断。E-mail:1205837939@qq.com
    通讯作者: 顾幸生, xsgu@ecust.edu.cn
  • 华东理工大学化工过程先进控制和优化技术教育部重点实验室,上海 200237

摘要: 针对工业过程中检测和储存的数据维度不断增大,传统的检测方法中存在处理速度慢、故障特征提取不明显等问题,本文提出了一种基于自适应稀疏表示和保局投影(Adaptive Sparse Representation and Locality Preserving Projections, ASRLPP)的故障检测方法。首先利用稀疏字典学习算法构造残差空间对数据进行特征提取,使数据的全局特征更加明显;然后在残差空间中利用保局投影 (Locality Preserving Projections, LPP) 算法进行降维操作,对数据进行过滤降维,保留局部特征;最后利用T2统计量计算控制限进行监控。在检测过程中,引入自适应更新规则,将检测到的正常工况数据用于更新初始训练集,选取更加合理的训练集,动态地调整控制限,使其与所处理的故障数据特征相适应,提高故障检测效率和准确率。通过一个数值例子以及TE(Tennessee-Eastman)过程仿真验证了ASRLPP算法的有效性。

English Abstract

  • 随着科学技术的不断进步,现代工业过程日益大型化和复杂化,对工业过程的安全运行要求日益提高。为了提高生产效益、降低生产成本,人们对如何降低生产过程中潜在的危险性,提高工业生产的安全可靠性越来越重视[1-3]。故障检测与诊断作为化工过程异常工况管理最有力的工具,对化工过程的故障趋势进行分析、预测和恢复,为过程安全提供了一定的保障。故障诊断技术发展至今,基于机理模型的方法、基于知识的方法和基于数据驱动的方法[4]是研究故障诊断的三大方向。基于机理模型的方法需要对被检测系统的输入和输出数据构造数学模型,且该信息与正常运行状态无关,通过分析和处理被诊断系统中可以测得的有用信息和模型所表达的实际系统的先验信息的残差,实现过程的故障诊断。数学模型建立的精确与否是基于机理模型方法的关键之处,模型建立精度的高、低直接影响到监控效果[5]。基于机理模型的方法主要包括参数估计法 (Parameter Estimation, PE)[6]、状态估计法 (State Estimation, SE)[7-8]和等价空间法(Parity Space, PS)[9]。基于知识的方法利用人工智能相关方法,通过构建一些功能来学习和模仿监控过程中人类的思想、行为等,自动完成整个监控和诊断过程[10]。该方法将过程知识和相关理论相结合,虽然对模型的精度没有要求,但对过程知识存在依赖性,所以通用性有待提升。基于数据驱动的方法依据与数据相关的处理和分析方法来实现。该方法基于过程中获得的数据,通过分析和挖掘其内部特征来指导工作人员判断系统当前的运行状况,提取数据的有效特征信息来辨别是否发生故障,不需要建立精确的机理模型、不依赖过程知识[11-12]。多元统计是基于数据驱动的方法常用的一类方法,包括主元分析 (Principal Component Analysis, PCA)[13]、偏最小二乘 (Partial Least Squares, PLS)[14]等。随着工业过程中检测和储存的数据维度不断增大,传统的多元统计方法在处理大样本、高维数据集的过程中,出现了运行速度慢、效率低、故障检测时数据的局部特征易丢失等问题。

    针对上述问题,已有研究人员尝试利用流形算法对多元统计方法进行改进。Zhang等[15]提出利用一种端到端的深流形到流形变换网络,以便于深层网络的批核优化。薛敏等[16]通过构建偏最小二乘、邻域保持回归(Neighborhood Preserving Regression, NPR)、局部全局主成分回归(Local and Global Principal Component Regression, LGPCR)3种基础模型,提出了一种融合过程数据集全局与局部结构特征的集成质量监控方法;卢春红等[17]提出了非局部约束下的局部稀疏保持投影方法,利用稀疏编码获取表征全局结构信息的稀疏码,然后计算稀疏码的权重值,突出其对故障的贡献度,建立统计量进行故障检测。Zhao等[18]提出了一种基于双谱局部保持投影的智能故障诊断方法,保局投影的引入极大地保留了双谱特征的高维特性,克服了传统双谱分析方法严重依赖专家经验的局限性,同时提高了诊断效率。

    稀疏字典具有非常突出的数据特征提取能力,在众多的领域中表现卓越,尤其是在图像处理领域应用广泛[19]。Leal等[20]将字典学习和稀疏编码相结合用于处理视觉检测问题。Lin等[21]引入双稀疏字典的思想,提出了一种用于处理无线传感器网络的方法,通过稀疏编码提高数据采集的效率和可靠性。基于稀疏字典学习在数据降维方面的特点,近几年也有学者将稀疏字典学习应用到故障诊断中李继猛等[22]在轴承的故障诊断问题研究中引入稀疏分解,使稀疏分解与正交匹配追踪算法相结合。郭小萍等[23]提出在多工况研究中,通过构建残差空间获取统计量,使模型的特征更加明显,利用稀疏编码构建全局模型,进行故障检测。

    本文针对工业过程中检测和储存的数据维度不断增大,传统的检测方法存在处理速度慢、故障特征提取不明显等问题,提出了一种基于自适应稀疏表示和保局投影(ASRLPP)的故障检测算法。首先采用稀疏字典对数据集进行特征提取,构建残差空间;然后利用保局投影(LPP)算法在残差空间内进行降维,同时提取数据局部特征信息。在监测过程中,制定更新规则,利用控制限和局部离群因子(Local Outlier Factor, LOF)[24-25]对测试数据进行筛选判断,将检测到的正常工况数据集用于更新训练集,动态调整控制限。数值仿真例子和TE过程仿真验证了本文方法的有效性和优越性。

    • 稀疏表示理论的基本思想是将正交变换中固定的基函数用过完备的字典来取代,使数据集的特征得到提取[23,26]

      假设有数据集$X \in {{\bf{R}}^{m \times n}}$,其中m为变量个数,n为样本个数。使用式(1)对初始数据集X进行标准化处理,得到均值为0、方差为1的矩阵${{{X}}'} \in {{\bf{R}}^{m \times n}}$

      其中:xijXi行、第j列的数值;xix的第i行;mean(xi)为Xi行的均值;std(xi)为Xi行的方差。

      设置初始字典${{D}} \in {{X}}_{m \times {n_1}}'$${n_1} < n$),使用正交匹配算法[27-28]由式(2)计算初始训练集对应的稀疏编码${{\alpha}} {\rm{ = [}}{{{\alpha}} _1},{{{\alpha}} _2},...,{{{\alpha}} _n}]$[29]

      其中:${{x}}_j'$表示${{{X}}'}$的第j个样本;${{{\alpha}} _j}$表示第j个样本对应的稀疏编码;s表示稀疏编码的稀疏度。

      针对式(2)的优化问题,字典学习的求解算法分为两个步骤:(1)固定字典${{D}}$保持不变,求解${{\alpha}} {\rm{ = [}}{{{\alpha}} _1},{{{\alpha}} _2},...,{{{\alpha}} _n}]$;(2)固定稀疏编码矩阵${{\alpha}} $不变,迭代更新字典${{D}}$

      重复上述更新迭代操作至达到稀疏级别上限,则字典${{D}}$和稀疏编码${{\alpha}} $全部更新完毕。根据得到的字典和稀疏编码由式(3)计算训练集${{{X}}'}$的近似值${\hat {{X}}'}$,同时计算两者的残差矩阵R如式(4)所示:

    • 流形学习通过发现高维数据中的低维流形特征,将所要研究的对象降维到低维空间,同时保持局部特征[30]。LPP算法主要分为3个步骤:构建邻接图、选择权重、计算投影矩阵[30]

      假设数据集${{X}} \in {{\bf{R}}^{m \times n}}$,LPP方法就是计算投影矩阵${{A}}$,使得投影后的低维空间${{Y}} \in {{\bf{R}}^{d \times n}}$($d < m$)能够满足${{{y}}_{\rm{i}}} = {{{A}}^{\rm{T}}}{{{x}}_{\rm{i}}}$

      首先由k近邻法计算关系矩阵W,如式(5)所示。

      其中C为常量。

      目标函数如式(6)所示:

      约束条件:

      其中:L是拉普拉斯矩阵,满足${{L}} = {{V}} - {{W}}$V$n \times n$对角阵,${V_{ii}} = \displaystyle\sum \limits_{j = 1}^n {w_{ji}}$

      将目标函数进行计算推导,使其转换为求解投影向量${{\delta}} $:

      计算所得最小d个广义特征值$\left[ {{\delta _1},{\delta _2}, \ldots ,{\delta _d}} \right]({\delta _1} < $$ {\delta _2} < \ldots< {\delta _d}) $,所对应的特征向量构成了投影矩阵${{A}}$

    • T2统计量是一种可以用单变量控制图的形式来监测多变量工况的变量,利用主元模型内部的主元向量模的波动,以此用于反映多变量变化的情况[31]。其定义如下:

      其中:${t_i}$表示构成由主元模型k个主元得分向量所构成的${{\rm{T}}_k}$矩阵中的第i行;$\lambda $是由与前l个主元所对应的特征值所组成的对角矩阵。

      T2统计量作为控制限,使用F分布临界值来确定,如式(10)所示:

      其中:${{\Lambda }}$为主元的方差阵,${{\Lambda}} = {\rm{diag}}{\rm{\{ }}{\lambda _l}\cdots {\lambda _i}\cdots {\lambda _l}{\rm{\} }}$${\lambda _i}$X的协方差矩阵$\sum $阵的第i大特征根;l为主元数;n为样本数;$F(l,n - l)$为自由度为ln-l的F分布。

      当过程正常运行时,测量数据x满足正态分布,则满足式(11):

      UCL为T2统计量的上限,由式(12)求得,其中置信度为$\beta $

      当控制限满足式(11)时,表示过程运行在正常状态下;否则认为过程处于故障状态,发出报警信号[32]

    • 假设有正常样本数据${{{X}}_{{\rm{train}}}} \in {{\bf{R}}^{m \times n}}$作为训练集。由式(1)对采集到的正常样本数据进行标准化处理,采用稀疏字典和保局投影结合算法(SRLPP)对标准化后的样本数据提取特征。设置初始字典集,一般考虑随机抽取正常样本数据集作为初始字典集,同时设定稀疏度s,利用正交匹配算法计算初始字典的稀疏编码,保持字典D不变。由式(2)计算得到相应的稀疏编码矩阵${{\alpha}} $,再保持${{\alpha}} $不变,更新迭代字典D,重复上述操作获得字典和稀疏编码矩阵。利用稀疏系数矩阵和更新后的字典求得原始样本的近似值,并计算残差,构造残差空间。将产生的残差空间利用LPP算法进行局部特征提取和数据降维,由式(8)计算降维后的投影矩阵${{A}}$。对于特征提取和降维后的矩阵${{A}}$,利用核函数计算其T2统计量获得控制限Tlim

    • 考虑引入自适应更新规则,对于测试数据${{{X}}_{{\rm{test}}}} \in {{\bf{R}}^{m \times q}}$q表示测试数据的样本个数,m表示变量个数),经过SRLPP的特征提取和降维后,计算样本中每个测试点的T2统计量${T_{{\rm{test}}(i)}}$。当检测过程中满足T2控制限${T_{\lim }} > {T_{{\rm{{\rm{test}}(i)}}}}(1 \leqslant i \leqslant q)$,同时利用离群点检测算法(LOF)判断其相对于正常工况的测试点是否为离群点,满足${\rm{LOF}}({{{X}}_{{\rm{test}}}},{{{X}}_{{\rm{train}}}}) < {\rm{LOF}}({{{X}}_{{\rm{train}}}},{{{X}}_{{\rm{train}}}})$时,将${{{X}}_{{\rm{test}}}}$作为正常工况数据更新训练集,即将q个样本添加到训练集中,同时“遗忘”q个初始样本,保证训练集维数不变,更新后的训练集为${{X}}_{{\rm{train}}}' \in {{\bf{R}}^{m \times n}}$。然后利用更新后的训练集调整字典${{D}}'$和控制限$T_{\lim }'$,使其与所处理的故障数据特征相适应,再进行故障检测。其中${\rm{LOF}}({{{X}}_{{\rm{test}}}},{{{X}}_{{\rm{train}}}})$表示测试数据相对于训练集的局部离群因子[24-25]

    • ASRLPP故障检测分为离线建模和在线检测两个步骤, 如图1所示。

      图  1  故障检测流程图

      Figure 1.  Flow chart of fault detection

      离线建模:

      Step 1 采集正常样本数据组成训练集${{X}} \in {{\bf{R}}^{n \times m}}$,同时进行标准化处理。

      Step 2 设置初始字典D和稀疏度s,通过更新迭代得到更新字典和稀疏编码矩阵;计算得到残差,构造残差空间;利用LPP进行降维,获得矩阵${{A}}$

      Step 3 对于特征提取和降维后的矩阵${{A}}$计算统计量的控制限${T_{\lim }}$

      在线检测:

      Step 1 收集待检测数据${{{X}}_{{\rm{test}}}}$进行标准化处理,将处理后的数据集作为测试集。

      Step 2 计算得到待测数据集的稀疏矩阵和残差矩阵,利用建模中产生的投影矩阵进行降维得到${{{A}}_{{\rm{test}}}}$

      Step 3 计算降维后矩阵的T2统计量以及局部离群因子,判断是否满足更新条件,如果满足,则将测试数据更新到训练集,调整控制限,若不满足,则判断为故障样本,返回Step1。

      复杂度分析:对数据集${{X}} \in {{\bf{R}}^{n \times m}}$进行标准化处理,复杂度为$O(n)$。迭代更新字典和稀疏矩阵获得残差空间,复杂度为$O(ns)$。利用LPP算法进行降维时分为两步,k近邻搜索,时间复杂度为$O((n + k){m^2})$,计算特征值将m维数据降到d维,时间复杂度为$O((n + d){n^2})$,故LPP算法复杂度[33-34]$O((n + k){m^2} +$$ (n + d){n^2}) $;求取控制限,时间复杂度为$O({n^2})$;故ASRLPP故障检测算法的整体算法复杂度为$O(n + ns + (n + k){m^2} + (n + d){n^2} + {n^2})$

    • 通过一个数值例子和TE(Tennessee- Eastman)过程验证ASRLPP算法的有效性。

    • 采用文献[35]中的数值仿真例子进行测试,具体结构如下:

      其中包括5个变量x1x2x3x4x5和5个相互独立且服从N(0,0.01) 的白噪声e1e2e3e4e5。设定工况1下s1为均匀分布$U( - 10, - 7)$s2为高斯分布$N( - 15,1)$。首先在正常运行状态下,采集800组正常样本作为训练集;再采集800组数据作为测试样本,测试样本设定在第401个数据点处引入两种故障。故障1:系统正常状态运行下,在${x_5}$加上幅值为4的阶跃信号;故障2:系统正常状态运行下,给${x_1}$加上$0.02(i - 400)$的斜坡信号。

      分别采用LPP、SRD[23]、ASRLPP算法进行检测,该算法的检测指标为D2,其中LPP是基础降维算法,SRD是对稀疏字典改进后的故障检测算法。为使算法比较更具公平性,进行参数选择。对于有降维操作的算法降维后的维数为2,利用k近邻法构建关系矩阵,近邻参数k=5,T2统计量置信度均设为0.99,初始字典维数设置为400。

      工况1下两种故障的数值检测结果如表1所示。可以看出,SRD算法和ASRLPP算法相对于LPP算法,故障1和故障2都获得了较低的漏报率(MAR),提供了比较理想的检测结果,说明检测性能都有较大提高;比较SRD算法和ASRLPP算法,对于两种故障,虽然SRD算法有较低的漏报率,但是误报率(FAR)较高,相比之下ASRLPP算法能保持非常低的误报率。

      FaultLPPSRDASRLPP
      MAR/%FAR/%MAR/%FAR/%MAR/%FAR/%
      191.560.120.252.121.490
      279.400.1210.922.9915.380

      表 1  工况1下数值例子故障检测结果

      Table 1.  Fault detection results of numerical examples under condition 1

      图2示出了LPP算法和ASRLPP算法对故障1和故障2降维后的PC1、PC2散点图。从图中可以看出,LPP算法对数据降维后,故障数据点和正常数据点并没有实现很好的分离,故检测效果较差;ASRLPP算法对数据降维后,故障数据点和正常数据点分离明显,能进一步区分故障数据点,使得后续的故障检验操作更准确、有效,进而有助于提高故障的检测率,证明了该算法的有效性。

      改变数值测试的运行工况,设定工况2下s1$2\cos (0.08k)\sin (0.006k)$s2${\rm{sign}}[\sin (0.03k) + 9\cos (0.01k)]$,其中k表示采样范围。同样在正常运行状态下,采集800组正常样本作为训练集;再采集800组数据作为测试样本,测试样本设定在第401个数据点处引入两种故障,故障1:系统正常状态运行下,给${x_5}$加上幅值为4的阶跃信号;故障2:系统正常状态运行下,给${x_1}$加上$0.02(i - 400)$的斜坡信号。在工况2下数值例子的故障检测结果如表2所示。图3示出了3种算法对故障1和故障2的检测结果。

      图  2  故障1和故障2下两种算法的PC1和PC2散点图

      Figure 2.  PC1 and PC2 scatter diagrams of two algorithms under fault 1 and fault 2

      FaultLPPSRDASRLPP
      MAR/%FAR/%MAR/%FAR/%MAR/%FAR/%
      192.2502.500.1300
      281.00012.750.1312.500.13

      表 2  工况2下数值例子故障检测结果

      Table 2.  Fault detection results of numerical examples under condition 2

      表2图3中可以看出,在工况2下,SRD算法和ASRLPP算法相比于传统的LPP检测效果更加优越,同时ASRLPP能获得更低的误报率和漏报率,说明其检测效果更好。表3对比了工况2下的两种算法在不同字典维度下故障1的检测结果,其中SRLPP为未引入自适应更新规则的基于稀疏字典和保局投影算法,用于验证ASRLPP算法中引入自适应更新规则的检测效果;分别设置初始字典维数为100、300、500、700,比较ASRLPP和SRLPP的误报率、漏报率,从表中可以看出,当初始字典维数较低时,SRLPP算法的检测结果较差,分析认为当初始字典维数较低时,利用稀疏字典提取数据集特征的效果不佳,导致数据集的部分特征被遗漏,所以影响故障检测效果;而引入了自适应更新规则后,即使初始的字典维数较低,但通过自适应更新规则在检测过程中不断的优化初始训练集,使对故障1的检测误报率和漏报率都保持较低,所以引入自适应更新规则对算法的稳定性有进一步的提高。

      图  3  3种算法对故障1和故障2的检测结果

      Figure 3.  Detection results of fault 1 and fault 2 under three algorithms

      Dictionary dimensionSRLPPASRLPP
      MAR(%)FAR(%)MAR(%)FAR(%)
      100 70.50 0 0.75 0
      300 45.00 0.25 0 0
      500 37.25 0 0 0
      700 0.25 0 0 0

      表 3  两种算法在不同字典维度下故障1的检测结果

      Table 3.  Fault 1 detection results of two algorithms in different dictionary dimensions

      从表中可以看出,ASRLPP算法在特征提取和分离故障点方面具有一定的优越性,而且在保证获取较低漏报率的同时能控制极低的误报率,相较于其他算法具有更高的可靠性。

    • TE过程主要包括冷凝器、反应器、汽提塔、汽液分离器和循环压缩机5个操作单元,共包括12个操作变量和41个测量变量。TE过程还包含有预先设定的故障21个,见表4。本文采用表4中前20个故障用于算法性能的比较。采集TE过程正常工况和20个故障下的数据,其中正常工况和每个故障下的数据均采集960个,故障测试集均在第161个样本引入故障。

      Fault numberProcess variableType
      1A/C feed ratio, B composition constantStep
      2B composition, A/C ratio constantStep
      3D feed temperatureStep
      4Reactor cooling water inlet temperatureStep
      5Condenser cooling water inlet temperatureStep
      6A feed lossStep
      7C header pressure loss--reduced availabilityStep
      8A, B, C feed compositionRandom variation
      9D feed temperatureRandom variation
      10C feed temperatureRandom variation
      11Reactor cooling water inlet temperatureRandom variation
      12Condenser cooling water inlet temperatureRandom variation
      13Reaction kineticsSlow drift
      14Reactor cooling water valveSticking
      15Condenser cooling water valveSticking
      16UnknownUnknown
      17UnknownUnknown
      18UnknownUnknown
      19UnknownUnknown
      20UnknownUnknown

      表 4  TE过程的20个预设故障

      Table 4.  20 preset faults of TE process

      分别采用LPP、SRD、SRLPP、ASRLPP算法进行检测。为保证对比实验的公正性和有效性,设定每个对照算法降维后的数据维度保持一致,设定降维后的维度为25维,利用k近邻法构建关系矩阵中的近邻参数k=5,SRD的近邻样本设为5,T2统计量置信度均设为0.99。取960组正常数据集作为字典的初始训练集,初始字典取其中的600个。

      表5示出了20种故障(除故障3、故障9和故障15外)的漏报率、误报率检测结果,表中的数据为10次运行结果的最优值。

      FaultLPPSRDSRLPPASRLPP
      MAR/%FAR/%MAR/%FAR/%MAR/%FAR/%MAR/%FAR/%
      10.7500.500.210.381.670.121.04
      21.6201.3801.250.941.000.42
      3////////
      475.8804.1301.381.350.120.52
      577.25068.75054.371.252.501.04
      61.250000.380.3100.73
      70000.100.8300.42
      82.7501.750.211.621.871.621.25
      9////////
      1075.75048.12029.871.1521.631.15
      1156.62031.250.124.120.6316.630.94
      121.6201.000.210.621.250.501.15
      135.7504.750.104.251.354.250.63
      141.12000.101.1500.52
      15////////
      1692.130.168.751.8722.753.2315.502.85
      1724.1207.8704.251.464.001.04
      1811.25010.250.318.251.988.371.46
      1995.75091.000.2152.751.1549.500.83
      2077.12048.880.134.880.9432.380.52

      表 5  故障检测结果

      Table 5.  Fault detection results

      表5可以看出,对于TE过程中的20种故障,ASRLPP算法整体上在漏报率方面较LPP和SRD算法都有明显的降低,如故障5、10、11、16、19、20等,ASRLPP算法相比于以上两种算法都有较大的提高,特别对故障5检测效果提高显著;对于容易检测的故障,如故障1、2、4、8、12、13、17、18等,ASRLPP算法能保证非常高的检测率,检测的准确性和精确性相比以上两种算法也基本都有提升,说明ASRLPP算法有一定的可靠性。从表中也能看到,虽然LPP表现出很低的误报率,但是其整体的漏报率很高,算法的可靠性不高。对比表中SRLPP和ASRLPP两种算法的检测结果,可以发现ASRLPP算法在SRLPP算法的基础上可以进一步地降低误报率,提高检测准确率。

      图4示出了3种算法对故障4的检测结果图。

      图  4  故障4在3种算法下的检测结果

      Figure 4.  Detection results of fault 4 under three algorithms

      表6示出了3种算法的故障检测时刻,检测时刻间隔3 min,表6中数值表示第n个时刻开始,算法检测到故障信号。从表中可以看出,ASRLPP算法的整体故障检测时刻明显早于其他两种算法,特别是对于一些较难检测的故障,如故障17、18、19、20等,ASRLPP算法都能获得较为准确的检测时刻,说明ASRLPP算法的可靠性和准确性更高。从表4可知,故障5表现为一种反应器冷却水入口温度变化,该过程的干扰类型为阶跃变化,同时控制器对于该变量有较大的补偿效果。在实际过程中,如果发生故障,检测算法能迅速捕捉到故障发生,但是在350个采样点过后,控制器的补偿作用会将检测量拉回到报警线以下,使系统无法继续检测到故障,这就造成了大量的漏报。本文提出的ASRLPP算法能够在控制器补偿后仍能使检测量处于报警线以上,维持故障警报,保证系统的可靠运行。故障19属于随机故障类型,对于该故障,上述方法均有较高的漏报率,分析认为,故障19数据类型包括非高斯数据类型,当数据未知波动比较明显时,利用局部保局无法有效的区分离群点,同时不利于稀疏字典提取特征。ASRLPP算法对易检测故障能获得比其他算法更低的漏报率,是因为在故障检测的同时能利用数据点不断更新训练集,调整控制限。对于较难检测的故障,由于其本身的模型自适应能力受到限制,故不能获得非常理想的检测效果。

      FaultDetection timeFaultDetection time
      LPPSRDASRLPPLPPSRDASRLPP
      116716516211167167166
      217317216212163163161
      3///13207198167
      416116116114162161161
      516116116115///
      617116116116312196161
      716116116117189184162
      818117816918221221161
      9///19196171162
      1018718516620249242166

      表 6  TE过程故障的检测时刻对比

      Table 6.  Comparison of detection time on TE process

    • 本文提出的ASRLPP故障检测算法在稀疏字典的基础上引入保局投影LPP算法,将局部特征提取算法和全局特征提取算法相结合,从而对数据集的特征做到更有效的提取。同时在检测过程中,提出自适应更新规则,在实时的检测过程中,不断更新模型,调整控制限,进而使故障检测更加精确,有效提高故障的检测率。ASRLPP算法所表现出来的对数据的特征提取和降维能力也为处理大数据、高维数据集等故障检测提供了一种解决思路。

(4)  表(6) 参考文献 (35)

目录

    /

    返回文章