高级检索

  • ISSN 1006-3080
  • CN 31-1691/TQ
引用本文:
Citation:

基于集成学习概率神经网络的电机轴承故障诊断

    作者简介: 张习习(1993-),男,河南人,硕士生,研究方向为故障检测与诊断。E-mail:18817834123@163.com;
    通讯作者: 顾幸生, xsgu@ecust.edu.cn
  • 中图分类号: TP183

Motor Bearing Fault Diagnosis Method Based on Integrated Learning Probabilistic Neural Network

    Corresponding author: Xingsheng GU, xsgu@ecust.edu.cn
  • CLC number: TP183

  • 摘要: 作为一种常用的模式识别方法,概率神经网络在故障诊断领域有着广泛的应用。针对作为概率神经网络最重要参数之一的平滑因子σ需要人为设定的问题,提出了一种基于正弦余弦(SCA)优化算法的自适应概率神经网络(SPNN);建立利用SPNN作为弱分类器的基于AdaBoost的集成学习模型(ASPNN),采用输出概率线性组合的方式得到强分类器的输出结果;将ASPNN模型应用于电机轴承故障诊断,仿真结果证明了该方法的有效性。
  • 图 1  概率神经网络结构图

    Figure 1.  Structure diagram of probabilistic neural network

    图 2  ${r_1}$对搜索区域的影响

    Figure 2.  Influence of ${r_1}$ on the search area

    图 3  幅值为2的正弦余弦函数

    Figure 3.  Sine and cosine of magnitude 2

    图 4  SCA算法的搜索方式

    Figure 4.  Search method of SCA algorithm

    图 5  正弦余弦函数的幅值随迭代次数的变化

    Figure 5.  Amplitude of sine and cosine change function with iteration numbers

    图 6  平滑因子的自适应调整

    Figure 6.  Adaptive adjustment of smoothing factor

    图 7  ASPNN的原理图

    Figure 7.  Schematic of ASPNN

    图 8  不同负载下平滑因子对PNN性能的影响

    Figure 8.  Effect of smoothing factor on PNN performance under different loads

    图 9  平滑因子优化结果

    Figure 9.  Optimization results of smoothing factor

    图 10  负载为0时的错分率下降曲线

    Figure 10.  Error rate drop curve when the load is 0

    图 11  ASPNN故障类型识别结果

    Figure 11.  Fault type identification results for ASPNN

    图 12  负载为0时的故障程度识别结果

    Figure 12.  Fault degree recognition results when the load is 0

    表 1  实验数据

    Table 1.  Experimental data

    Load/WCategoryTraining setTest set
    0 4 360 216
    746 4 360 216
    1 492 4 360 216
    2 238 4 360 216
    下载: 导出CSV

    表 2  部分特征值

    Table 2.  Partial feature vector

    Fault typeFeature vector
    NOR 0.730 963 0.526 385 0.386 523 0.311 610 0.217 624 0.170310
    IRF 0.694 755 0.603 907 0.421 695 0.308 494 0.246 938 0.183 996
    ORF 0.644 854 0.625 359 0.414 61 0.301 016 0.233 938 0.180 841
    BF 0.592 164 0.640 045 0.422 989 0.303 367 0.227 202 0.180 194
    下载: 导出CSV

    表 3  不同方法的故障类型识别结果

    Table 3.  Fault type identification results of different methods

    Load/WCategory Accuracy/%
    PNNSVMSPNNASPNN
    (σ=0.01)(OVO)MaxMinAveMaxMinAve
    0 4 98.15 95.83 99.54 98.61 99.15 99.54 99.07 99.45
    746 4 97.69 95.83 98.61 98.15 98.45 99.07 98.15 98.79
    1 492 4 99.54 99.07 100 99.07 99.86 100 100 100
    2 238 4 97.69 98.61 98.61 98.15 98.27 98.61 98.15 98.33
    下载: 导出CSV

    表 4  负载为0时的实验数据

    Table 4.  Experimental data when the load is 0

    Fault typeTraining setTest setCategory
    IRF 120 72 4
    ORF 90 54 3
    BF 120 72 4
    下载: 导出CSV

    表 5  不同负载下的故障程度识别率

    Table 5.  Identification rate of fault degree under different loads

    Load/WFault type Accuracy/%
    PNNSVM SPNN ASPNN
    (σ=0.01)(OVO)MaxMinAveMaxMinAve
    0IRF100100 100100100 100100100
    ORF98.1596.3010098.1599.31100100100
    BF93.0688.8997.2295.8396.9097.2295.8396.80
    746IRF100100100100100100100100
    ORF98.1596.3010096.3098.1510098.1599.13
    BF10098.61100100100100100100
    1 472IRF100100100100100100100100
    ORF10098.15100100100100100100
    BF100100100100100100100100
    2 238IRF97.2297.22100100100100100100
    ORF100100100100100100100100
    BF10098.61100100100100100100
    下载: 导出CSV
  • [1] 陈宗祥, 陈明星, 焦民胜, 等. 基于改进EMD和双谱分析的电机轴承故障诊断实现[J]. 电机与控制学报, 2018, 22(5): 79-83.
    [2] 钟秉林, 黄仁. 机械故障诊断学[M]. 北京: 机械工业出版社, 2006.
    [3] 孟宗, 胡猛, 谷伟明, 等. 基于LMD多尺度熵和概率神经网络的滚动轴承故障诊断方法[J]. 中国机械工程, 2016, 27(4): 433-437. doi: 10.3969/j.issn.1004-132X.2016.04.002
    [4] JIANG Guoqian, XIE Ping, WANG Xiao. Intelligent fault diagnosis of rotary machinery based on unsupervised multiscale representation learning[J]. Chinese Journal of Mechanical Engineering, 2017, 30(6): 1314-1324. doi: 10.1007/s10033-017-0188-z
    [5] SUN R B, YANG Z B, CHEN X F. Gear fault diagnosis based on the structured sparsity time-frequency analysis[J]. Mechanical System and Signal Processing, 2018, 102: 346-363. doi: 10.1016/j.ymssp.2017.09.028
    [6] SHARMA V, PARCY A. Gearbox fault diagnosis using RMS based probability density function and entropy measures for fluctuating speed conditions[J]. Structural Health Monitoring-an International Journal, 2017, 16(6): 682-695. doi: 10.1177/1475921716679802
    [7] 周士帅, 窦东阳, 薛斌. 基于LMD和MED的滚动轴承故障特征提取方法[J]. 农业工程学报, 2016, 32(23): 70-76. doi: 10.11975/j.issn.1002-6819.2016.23.010
    [8] WANG L H, ZHAO X P, WU J X, et al. Motor fault diagnosis based on short-time Fourier transform and convolutional neural network[J]. Chinese Journal of Mechanical Engineering, 2017, 30(6): 1357-1368. doi: 10.1007/s10033-017-0190-5
    [9] 李嫄源, 袁梅, 王瑶, 等. SVM与PSO相结合的电机轴承故障诊断[J]. 重庆大学学报, 2018, 41(1): 99-107. doi: 10.11835/j.issn.1000-582X.2018.04.012
    [10] CHEN X Y, ZHOU J Z, XIAO H. Fault diagnosis based on comprehensive geometric characteristic and probability neural network[J]. Applied Mathematics and Computation, 2014, 230(3): 542-554.
    [11] LIU J X, WEN X B, YUAN L M. A robust approach of watermarking in contourlet domain based on probabilistic neural network[J]. Multimedia Tools and Application, 2017, 76(22): 24009-24026. doi: 10.1007/s11042-016-4178-4
    [12] MIRJALILI S. SCA: A sine cosine algorithm for solving optimization problems[J]. Knowledge- Based Systems, 2016, 96: 120-133. doi: 10.1016/j.knosys.2015.12.022
    [13] FREUND Y, SCHAPIRE R E. Experiments with a new boosting algorithm[C]//Proceedings of the Thirteenth International Conference on Machine Learning (ICML 1996). Bari, Italy: [s. n.], 1996: 148-156.
    [14] SPECHT D F. Probabilistic neural network[J]. Neural Network, 1990(3): 109-118.
    [15] 何正风. Matlab R2015b神经网络技术[M]. 北京: 清华大学出版社, 2016.
    [16] 陈如清, 李嘉春, 尚涛, 等. 改进烟花算法和概率神经网络智能诊断齿轮箱故障[J]. 农业工程学报, 2018, 34(17): 192-198. doi: 10.11975/j.issn.1002-6819.2018.17.025
    [17] 张晶. 基于AdaBoost回归树的多目标预测算法[J]. 计算机与现代化, 2017(9): 89-95, 105. doi: 10.3969/j.issn.1006-2475.2017.09.017
    [18] 陈志刚. 基于AdaBoost集成学习算法的LF钢水终点预报模型[D]. 沈阳: 东北大学, 2010.
    [19] 张习习, 顾幸生. 基于改进经验模态分解的电机轴承特征提取方法研究[C]//第29届中国过程控制会议摘要集. 沈阳: 中国自动化学会过程控制专业委员会, 2018: 43.
  • [1] 魏琛陈兰岚张傲 . 基于集成卷积神经网络的脑电情感识别. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180416004
    [2] 薛敏杨健谭帅侍洪波 . 基于多数据结构的集成质量监控方法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180821002
    [3] 王德勋虞慧群范贵生 . 基于深度学习的面部动作单元识别算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190107003
    [4] 赖兆林冯翔虞慧群 . 基于逆向学习行为粒子群算法的云计算大规模任务调度. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190218001
    [5] 宋振振陈兰岚娄晓光 . 基于时序卷积网络的情感识别算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190508001
    [6] 陈鹏罗娜 . 基于竞争机制差分进化算法的无分流换热网络优化. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20181015004
    [7] 马振伟何高奇袁玉波 . 基于小样本深度学习的通风柜橱窗状态识别方法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190412004
    [8] 陈剑挺叶贞成程辉 . 基于p阶Welsch损失的鲁棒极限学习机. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20181209001
    [9] 张雪芹魏一凡 . 基于深度学习的驾驶场景关键目标检测与提取. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20181023002
    [10] 王宁曹萃文 . 基于XGBoost模型的炼油厂氢气网络动态多输出预测模型. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.3080
    [11] 赵菡诸葛晶晶林家骏 . 飞行状态敏感的关联门调节算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180622003
    [12] 吉祥虞慧群范贵生孙怀英 . 基于蚁群算法的延时感知VANET路由协议. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20181116001
    [13] 高天阳虞慧群范贵生 . 基于模拟退火遗传算法的云资源调度方法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180416001
    [14] 陈立皇程华房一泉 . 基于注意力机制的DGA域名检测算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180326002
    [15] 王学武闵永顾幸生 . 基于密度聚类的多目标粒子群优化算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180321005
    [16] 王学武夏泽龙顾幸生 . 基于事件触发的自适应邻域多目标进化算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20181120005
    [17] 常青张天宇赵冰冰 . 基于机器视觉的手机异形主板非标自动化检测算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180416006
    [18] 颜建军刘章鹏刘国萍郭睿王忆勤付晶晶钱鹏 . 基于深度森林算法的慢性胃炎中医证候分类. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180410001
    [19] 高炳舒刘士荣 . 基于BoW模型的RGB-D SLAM算法的运动轨迹估计. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180419001
    [20] 曹雅茜黄海燕 . 基于代价敏感大间隔分布机的不平衡数据分类算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180515001
  • 加载中
图(12)表(5)
计量
  • 文章访问数:  2332
  • HTML全文浏览量:  927
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-12-14
  • 网络出版日期:  2019-10-11

基于集成学习概率神经网络的电机轴承故障诊断

    作者简介:张习习(1993-),男,河南人,硕士生,研究方向为故障检测与诊断。E-mail:18817834123@163.com
    通讯作者: 顾幸生, xsgu@ecust.edu.cn
  • 华东理工大学化工过程先进控制和优化技术教育部重点实验室,上海 200237

摘要: 作为一种常用的模式识别方法,概率神经网络在故障诊断领域有着广泛的应用。针对作为概率神经网络最重要参数之一的平滑因子σ需要人为设定的问题,提出了一种基于正弦余弦(SCA)优化算法的自适应概率神经网络(SPNN);建立利用SPNN作为弱分类器的基于AdaBoost的集成学习模型(ASPNN),采用输出概率线性组合的方式得到强分类器的输出结果;将ASPNN模型应用于电机轴承故障诊断,仿真结果证明了该方法的有效性。

English Abstract

  • 电机是一种重要的旋转机械设备,广泛应用于工业生产过程中的各个领域,而滚动轴承是电机的最重要部件之一,起着支撑主轴、传递力矩的作用,且易损坏[1]。根据统计,旋转机械中约有 30%的故障是由轴承损伤引起[2],因此,对电机轴承进行故障诊断研究具有重要意义。

    目前常用的故障诊断方法主要有基于模式识别的方法、基于神经网络的方法以及基于专家系统的方法。随着人工智能技术的发展,基于人工智能融合技术的故障诊断方法成为一大研究热点[3-4]。各种智能诊断理论和方法的集成和融合,如小波分析与神经网络的集成、模糊系统与神经网络的集成以及进化计算与神经网络融合等,较好地构建了故障征兆与故障类别之间的映射关系,有效地实现了机械设备的故障诊断[5-7]。Wang等[8]利用短时傅里叶变换对电机不同故障下的振动信号进行处理,得到振动信号的时频图,然后利用卷积神经网络(CNN)提取特征,较好地表示出了振动信号和轴承状况的映射关系。李嫄源等[9]结合振动信号的时域与小波包能量特征,使表征振动信号的特征具有较好的可靠性和敏感性,并采用粒子群(PSO)算法对支持向量机(SVM)的惩罚参数和径向基核函数参数进行寻优,对电机轴承的外圈故障、内圈故障和滚珠故障均有较好的识别效果。

    概率神经网络(Probabilistic Neural Networks, PNN)[10]的主要思想是将贝叶斯决策理论引入传统神经网络,网络结构按照贝叶斯判别函数来设置,以实现错误分类的期望风险最小。与传统的BP、RBF神经网络比较,PNN具有网络训练过程简单、训练速度快、准确率更高、对噪声容忍性高等特点[11],但也有两个主要的不足之处,首先是对训练样本的代表性要求较高;其次是网络参数σ的选取直接影响PNN的性能。对此,本文提出了一种改进的集成学习概率神经网络方法(ASPNN)。首先利用正弦余弦优化算法[12]对PNN的平滑因子σ进行优化,以确定最优参数;然后将优化后的PNN作为弱分类器,利用集成学习AdaBoost方法[13]构建PNN的集成学习模型;最后将该模型应用于电机轴承故障分类中,实验结果表明了该方法的有效性。

    • 概率神经网络是一种基于统计原理的人工神经网络,是以Parzen窗口函数为激活函数的一种前馈网络模型[14-15]。PNN包含4层网络结构,分别为输入层、隐含层、求和层和输出层,如图1所示。

      图  1  概率神经网络结构图

      Figure 1.  Structure diagram of probabilistic neural network

      PNN的第1层为输入层,通常用来接收训练样本,并将输入数据传递至第2层。输入层的神经元个数通常是确定的,其个数与输入样本的维度相同。第2层是隐含层,也称为径向基层。该层的每个神经元节点拥有一个中心,接收输入层的输入之后,计算输入向量和中心的距离,得到一个标量值。隐含层的神经元数目等于输入的训练样本个数。第3层是求和层,与隐含层神经元不是全连接。事实上,PNN的隐含层代表着训练样本,并且这些训练样本的类别是已知的,而求和层的神经元只与属于同一类别的神经元相连,并对同一类别隐含层神经元的输出加权平均。求和层神经元的数目与样本类别数目相同。第4层是输出层,输出求和层中的最大值,其对应的类别即为最终输出类别。

      平滑因子σ是PNN中最重要的超参数之一,选择合适的平滑因子是保证网络具备高识别率的必要条件。通常,在训练之前需要通过经验或者尝试的方法进行人为设定,并且对于所有类别,σ取值是相同的,即${\sigma _1}{\rm{ = }}{\sigma _2}{\rm{ = }}\cdots{\rm{ = }}\sigma $,不能将概率特性完整地表示出来,从而降低了PNN的识别精度[16],因此,选择更加合适的平滑因子是PNN研究的重点。

    • 正弦余弦优化算法(Sine Cosine Algorithm, SCA)[12]是一种全新的启发式优化算法,具有结构简单、容易实现、兼顾全局搜索与局部搜索、收敛速度快等特点。SCA算法的主要步骤如下:

      假设优化问题的每个解对应搜索空间个体的位置,用${{{X}}_i}^t = ({X_{i1}}^t,{X_{i2}}^t,\cdots,{X_{in}}^t)$表示第$t$次迭代时第$i$个个体的位置,$n$为个体的维度,目前所有个体所经历的最好位置表示为${{{P}}_b} = {({P_{b1}},{P_{b2}},\cdots,{P_{bn}})^{\rm{T}}}$,那么在下一次迭代中,个体的更新方式如下:

      其中:${r_1}$为线性递减函数;$a$为常数,$a$=2;$T$为最大迭代次数;${r_2}$$\left[ {0,2{\text{π}} } \right]$的随机数;${r_3}$$\left[ { - 2,2} \right]$的随机数;${r_4}$$\left[ { - 1,1} \right]$的随机数。

      参数${r_1}$决定了下一次迭代的移动方向是向当前解和目标解之外的区域移动,还是向当前解和目标解之间的区域移动;${r_2}$决定了正弦和余弦值的大小,即代表着靠近或远离目标解的距离;${r_3}$是为当前最优解所赋予的随机权值,目的是加强$({r_3} > 1)$或减弱$({r_3} < 1)$所定义的距离对目标解的影响;${r_4}$决定了下一次迭代是按照正弦还是余弦的方式进行,两者机会均等。

      图2只示出了二维搜索空间的搜索方式,应当注意的是,它可以扩展到更高维度的搜索空间。正弦余弦函数的循环模式允许一个解在其他解的周围被重新复位,这能保证在两个解之间的空间进行搜索。对于搜索空间,解应该能够同时搜索到它们相关的目标点之间的空间外侧,通过改变正弦余弦函数的大小来实现,如图3所示。

      图  2  ${r_1}$对搜索区域的影响

      Figure 2.  Influence of ${r_1}$ on the search area

      图  3  幅值为2的正弦余弦函数

      Figure 3.  Sine and cosine of magnitude 2

      图4示出了SCA的搜索方式。可以看出,当正弦余弦函数的范围在[−2,−1]和[1,2]时,SCA进行全局搜索;当正弦余弦函数的范围在[−1,1]时,SCA进行局部搜索。随着迭代次数的增加(假设迭代100次),正弦余弦函数的范围变化如图5所示。

      图  4  SCA算法的搜索方式

      Figure 4.  Search method of SCA algorithm

      图  5  正弦余弦函数的幅值随迭代次数的变化

      Figure 5.  Amplitude of sine and cosine change function with iteration numbers

    • AdaBoost算法是根据在线分配算法提出的经过调整的Boosting算法,它能够对单次学习得到的基分类器的错误率进行自适应调整。它的自适应性在于,上一个弱分类器错分的样本会得到加强(权重增大),正确分类的样本会被减弱(权重减小)[17]。每次迭代加入一个新的弱分类器,直到达到预定误差或达到预定的迭代次数,则终止训练。

      AdaBoost算法的主要步骤如下[13]

      (1)初始化样本权重向量:

      其中:$n$为训练样本数;${w_{1i}}$为第1次迭代时,第$i$个训练样本的权重初始化为$\frac{1}{n}$

      (2)给所有训练样本加权,并利用弱分类器进行训练,得到弱分类器的误差率:

      其中:${y_m}(x{}_l)$是当前弱分类器的预测结果;${y_l}$是真实结果;$I({\rm{case}})$表示当case为真时,$I({\rm{case}}) = 1$,否则$I({\rm{case}}){\rm{ = }}0$${w_{ml}}$为第$m$个弱分类器的第$l$个测试样本。由式(4)可知,当前弱分类器误差率是当前弱分类器在训练集上被${y_m}(x)$错分样本的权重之和。

      (3)计算当前弱分类器的权重:

      对于二分类问题,分类器权重按照式(5)进行计算,对于多分类问题,则按照式(6)进行计算,其中N表示类别数目。

      式中:${Z_m}$为归一化因子,其主要作用是让所有训练样本权值之和为1,使得权重向量是一个概率化向量,定义如下:

      由以上公式可知,被弱回归模型预测错误的样本权值增大,而被正确预测样本的权值减小。通过这样的方式,AdaBoost算法提高了较难预测的样本“地位”。经过不断迭代的方式,AdaBoost方法能“聚焦于”那些较难分的样本上。

      (5)组合所有弱分类器,得到最终强分类器:

    • 首先,利用SCA对PNN的平滑因子σ进行优化。为同一类别内的样本设置相同的平滑因子,不同类别间的样本设置不同的平滑因子,如图6所示。将优化后的PNN(SPNN)作为弱分类器,利用AdaBoost集成学习方法构建强分类器,得到改进后的PNN模型(ASPNN)。

      图  6  平滑因子的自适应调整

      Figure 6.  Adaptive adjustment of smoothing factor

      图7所示,从左到右依次进行迭代,并更新训练样本权重。${y_1}(x),{y_2}(x),\cdots,{y_M}(x)$为每一次迭代的SPNN弱分类器,迭代次数为M。为进一步提高分类准确率,本文提出对应概率加权求和的方式求得最终输出,即利用每一个弱分类器的权重作为系数,将所有分类器的输出概率进行加权求和,并输出最大值作为最终输出。

      图  7  ASPNN的原理图

      Figure 7.  Schematic of ASPNN

      ASPNN算法的主要步骤如下:

      (1)初始化平滑因子。对同一类别隐含层神经元初始化相同的平滑因子${\sigma _i}$$i$表示第$i$类别,总类别数为N。设置SCA算法的参数,包括迭代次数、搜索区间、种群规模等。并按照式(3)初始化所有训练样本的权重。

      (2)将平滑因子赋予PNN,并进行训练,适应度函数如式(11)所示。

      其中:${y_p}(i)$表示第$i$个样本的预测值;$y(i)$表示实际值;$m$为样本总数;适应度函数即为训练样本错分的个数与训练样本总个数的比值。

      (3)如果适应度函数小于预先设定的阈值δ,或者到达迭代次数,则停止迭代,得到优化模型SPNN作为集成学习的弱分类器。

      (4)设置AdaBoost算法参数,即参与训练的样本占全体训练样本的比例$p$、迭代次数M、训练样本数$n$等。

      (5)根据式(4)进行训练,得到当前分类器的误差率,并根据误差率由式(5)或式(6)计算当前分类器权重。应当注意的是,本文在训练过程中采用有放回采样的方式选取训练样本。每一次训练选取全体训练样本的85%进行训练,预测所有训练样本,根据预测结果计算分类器权重,并更新全体训练样本权重。

      (6)用当前弱分类器预测测试集,得到样本属于每一类别的概率,并将分类器权重作为系数对输出概率进行加权并保存。然后根据分类器权重更新样本权重,并进行下一次迭代。

      (7)将所有分类器的加权概率对应相加,输出最大值作为当前预测样本的预测结果。

      文献[18]证明了只要弱分类器算法的准确性略好于随机猜测,便可保证AdaBoost算法是收敛的,同时,它也证明了AdaBoost集成学习模型具有良好的泛化能力。而本文所采用的弱分类器是SPNN,实验表明SPNN对电机轴承已经具有很好的故障分类效果,因此其识别率远高于随机猜测,故本文的ASPNN算法理论上是收敛的。

    • 本文实验所用数据来自于凯斯西储大学轴承数据库(Case Western Reserve University, CWRU)。被测试轴承通过电火花加工工艺设置了单点故障,故障直径包含0.178、0.356、0.533、0.711 mm4种尺寸。选取驱动端振动信号作为实验数据,包括轴承在4种不同状态下采集到的振动信号,分别为正常状态(Normal, NOR)、滚珠故障状态(Ball Fault, BF)、外圈故障状态(Outer Race Fault, ORF)(只包含前3种故障直径)以及内圈故障状态(Inner Race Fault, IRF),每种状态下采集到的信号根据故障直径和负载的不同而不同,负载大小分别为0、746、1492、2 238 W。

      文献[19]提出了改进的经验模态分解方法。首先利用改进的经验模态分解方法对轴承的振动信号进行分解,得到一系列本征模态函数(Intrinsic Mode Function,IMF),然后计算前6个高频IMF分量的改进排列熵(Modified Permutation Entropy,MPE)的值作为特征量,进而实现对电机轴承振动信号的特征提取。

      表1表2所示,所得特征为6维特征向量。包含4种负载状态,每种负载下包含4种轴承状态,分别为正常状态、内圈故障、外圈故障和滚珠故障。此外,每种负载下包含360组训练样本和216组测试样本。由于数据量较大的原因,在负载为0的情况下,针对每种轴承状态列出一组数据如表2所示。

      Load/WCategoryTraining setTest set
      0 4 360 216
      746 4 360 216
      1 492 4 360 216
      2 238 4 360 216

      表 1  实验数据

      Table 1.  Experimental data

      Fault typeFeature vector
      NOR 0.730 963 0.526 385 0.386 523 0.311 610 0.217 624 0.170310
      IRF 0.694 755 0.603 907 0.421 695 0.308 494 0.246 938 0.183 996
      ORF 0.644 854 0.625 359 0.414 61 0.301 016 0.233 938 0.180 841
      BF 0.592 164 0.640 045 0.422 989 0.303 367 0.227 202 0.180 194

      表 2  部分特征值

      Table 2.  Partial feature vector

    • 在本文的故障分类研究过程中,首先需要对故障类型进行分类,即分为正常状态、内圈故障状态、外圈故障状态和滚珠故障状态。在识别出故障类型的基础上,再对故障程度(故障直径)进行分类。

      首先研究人为设定平滑因子对基本PNN性能的影响。经过多次尝试发现,当$\sigma < 0.10$时,PNN具有较好的性能,当$\sigma > 0.10$时,PNN的识别率在0.5上下波动,效果较差。为进一步寻找更优秀的平滑因子,本文按照遍历的方式依次选取平滑因子,从0.001到0.10,步长为0.001。如图8所示。

      图8可以看出,在进行故障类型识别时,PNN的性能会随着平滑因子的增大而出现先上升后下降的趋势。尤其是当$\sigma < 0.1 0$时效果更好,因此在SPNN和ASPNN中,设定$\sigma $的搜索区间为[0,0.10],种群大小为40,迭代次数为100次。另外,在ASPNN算法中,设定弱分类器的个数为50个。

      图  8  不同负载下平滑因子对PNN性能的影响

      Figure 8.  Effect of smoothing factor on PNN performance under different loads

      图9示出了ASPNN训练结果中其中一个弱分类器经过SCA优化后得到的最优$\sigma $值,可以看出对应4种类型(轴承的4种状态)训练样本,分别优化出了不同的$\sigma $值,并且它们的范围均小于0.01。

      图  9  平滑因子优化结果

      Figure 9.  Optimization results of smoothing factor

      图10为ASPNN算法训练过程中错分率的下降曲线,可以看出SCA算法在10次迭代以内便搜索到了最优解,进一步说明了SCA具有准确率高、收敛速度快的优点。

      图  10  负载为0时的错分率下降曲线

      Figure 10.  Error rate drop curve when the load is 0

      图11为ASPNN在不同负载下的故障类型识别结果。可以看出,ASPNN能够很好地对故障类型进行分类。

      图  11  ASPNN故障类型识别结果

      Figure 11.  Fault type identification results for ASPNN

      表3列出了PNN、SPNN、ASPNN和多分类SVM 4种算法的测试样本识别结果。基本的PNN算法中,本文人为将$\sigma $设定为0.01。SPNN和ASPNN均运行10次,$\sigma $的搜索区间为[0,0.1]。而多分类SVM是利用libsvm工具包实现的,并采取一对一(One-Versus-One, OVO)投票的方式进行多分类。可以看出,ASPNN比PNN、SPNN具有更好的自适应性和更高的识别准确率。而对于多分类SVM来说,在负载为2 238 W时,其准确率略高于ASPNN,但在其他负载状态下,其识别率均低于ASPNN。

      Load/WCategory Accuracy/%
      PNNSVMSPNNASPNN
      (σ=0.01)(OVO)MaxMinAveMaxMinAve
      0 4 98.15 95.83 99.54 98.61 99.15 99.54 99.07 99.45
      746 4 97.69 95.83 98.61 98.15 98.45 99.07 98.15 98.79
      1 492 4 99.54 99.07 100 99.07 99.86 100 100 100
      2 238 4 97.69 98.61 98.61 98.15 98.27 98.61 98.15 98.33

      表 3  不同方法的故障类型识别结果

      Table 3.  Fault type identification results of different methods

    • 在对滚动轴承进行故障诊断研究时,不仅要识别出故障的具体类型,还要识别出在已知故障类型的基础上,轴承发生故障的具体程度。因此,在识别出故障类型的基础上,需要进一步对故障程度进行分类。

      表4所示,当负载为0时,存在3种故障直径,其中内圈故障和滚珠故障均包含120个训练样本和72个测试样本,它们包含4种故障程度,即故障直径分为别0.178、0.356、0.533、0.711 mm,而外圈故障包含90个训练样本和54个测试样本,只包含前3种故障状态。由于篇幅原因,本文只列出了负载为0时的实验数据情况,其他负载时的数据情况与表4相同。

      Fault typeTraining setTest setCategory
      IRF 120 72 4
      ORF 90 54 3
      BF 120 72 4

      表 4  负载为0时的实验数据

      Table 4.  Experimental data when the load is 0

      在故障程度识别中,SPNN和ASPNN的超参数设置与故障类型识别时一致,同时平滑因子搜索区间设置为[0,0.1]。由于篇幅原因,图12只列出了负载为0时,ASPNN对于外圈故障程度的识别结果。所有负载下的故障程度识别率如表5所示。

      图  12  负载为0时的故障程度识别结果

      Figure 12.  Fault degree recognition results when the load is 0

      Load/WFault type Accuracy/%
      PNNSVM SPNN ASPNN
      (σ=0.01)(OVO)MaxMinAveMaxMinAve
      0IRF100100 100100100 100100100
      ORF98.1596.3010098.1599.31100100100
      BF93.0688.8997.2295.8396.9097.2295.8396.80
      746IRF100100100100100100100100
      ORF98.1596.3010096.3098.1510098.1599.13
      BF10098.61100100100100100100
      1 472IRF100100100100100100100100
      ORF10098.15100100100100100100
      BF100100100100100100100100
      2 238IRF97.2297.22100100100100100100
      ORF100100100100100100100100
      BF10098.61100100100100100100

      表 5  不同负载下的故障程度识别率

      Table 5.  Identification rate of fault degree under different loads

      表5可以看出,在故障程度分类中,PNN及其改进算法的识别效果要优于SVM,并且SPNN模型和ASPNN模型在故障程度识别中均表现出了优越的性能。由于SPNN对同一组训练样本和测试样本将得到固定的测试结果,因此ASPNN的泛化能力更强于SPNN。在较难分类的一些样本上,ASPNN表现出了更好的识别效果,进一步证明了本文所提出的ASPNN算法的有效性和优越性。

    • (1)正弦余弦算法(SCA)是近两年提出的一种新型的元启发式算法,它是一种建立在正弦余弦函数上的自组织和群智能基础上的数值优化计算方法,具有搜索精度高、收敛速度快、不易陷入局部最优等优点。

      (2)AdaBoost是一种Boosting集成学习方法。它会赋予每个训练样本一个权重,并在训练过程中更新这些权重。对错分的样本,将增大其权重;对正确分类的样本,将减小其权重。通过这样的训练方式,算法将更加关注那些错分的样本,并将多种弱分类器模型组合起来,进一步提高了分类器的准确度。

      (3)针对概率神经网络平滑因子需要通过人为不断尝试设定的缺点,提出了基于SCA的平滑因子自适应模型(SPNN),并将其作为集成学习AdaBoost的弱分类器进行加强学习。提出了基于SCA和AdaBoost的改进概率神经网络模型(ASPNN),并将该模型应用于电机轴承的故障诊断中。实验结果表明,ASPNN分类模型可以进一步提高电机轴承故障诊断的准确率。

      (4)利用ASPNN方法对测试集进行分类时,测试集样本的个数约864,而对全体测试样本进行分类所花费的时间为1 s以内。本文所用数据采样频率为12 kHz,而每个样本包括2 500个数据点,即采集一个样本需要约0.21 s,而对一个样本进行分类几乎是瞬间完成的。因此,理论上ASPNN能够进行实时故障诊断,但由于实验条件有限,该方法在实际生产过程中的实时诊断能力需在以后的工作中进一步研究。

(12)  表(5) 参考文献 (19) 相关文章 (20)

目录

    /

    返回文章