高级检索

  • ISSN 1006-3080
  • CN 31-1691/TQ
引用本文:
Citation:

基于AE-LSTM网络模型的机场周界入侵报警及分类算法

    作者简介: 许奕杰(1995—),男,上海人,硕士生,主要研究方向为信号处理、机器学习。E-mail:18721173105@163.com;
    通讯作者: 万永菁, wanyongjing@ecust.edu.cn
  • 中图分类号: TP391.4

Airport Perimeter Intrusion Alarm and Classification Algorithm Based on AE-LSTM Network Model

    Corresponding author: Yongjing WAN, wanyongjing@ecust.edu.cn ;
  • CLC number: TP391.4

  • 摘要: 机场周界入侵报警系统是机场飞行区的第一道防线。针对传统的机场周界入侵报警系统存在的恶劣气象条件下误报率高、不能区分入侵类别等问题,提出了一种自编码长短时记忆(AE-LSTM)网络模型;提取输入信号的隐含编码特征,构建融合时序信息的特征向量矩阵,降低网络模型的复杂度。网络模型的性能评价结果表明,该模型的误报率低,振动状态分类准确率高,且复杂度低,有很好的实际应用前景。
  • 图 1  机场周界入侵报警系统架构

    Figure 1.  Framework of airport perimeter intrusion alarm system

    图 2  算法流程图

    Figure 2.  Flowchart of algorithm

    图 3  不同振动状态波形图

    Figure 3.  Waveforms of different vibration states

    图 4  数据增强效果

    Figure 4.  Effect of data enhancement

    图 5  AE-LSTM网络模型结构

    Figure 5.  Structure of AE-LSTM network model

    图 6  LSTM细胞结构

    Figure 6.  Structure of LSTM cell

    图 7  各网络模型报警评价指标对比

    Figure 7.  Comparison of evaluation indicators for alarms of each network model

    图 8  AE-LSTM网络模型与LSTM网络模型混淆矩阵对比

    Figure 8.  Comparison between confusion matrix of AE-LSTM and LSTM

    表 1  数据集各分类样本数

    Table 1.  Number of each classification sample in dataset

    Vibration stateTraining setTraining set(enhancement)Testing set
    Stillness486729201
    Wind371556159
    Climbing402603158
    Kicking455682195
    Sawing392588168
    下载: 导出CSV

    表 2  对比实验网络模型参数

    Table 2.  Parameters of comparative network models

    Network modelInput dimensionNumber of layerNeurons number in hidden layerOutput dimension
    AE-LSTMAE1×1253641×125
    LSTM5×6431281×5
    LSTM5×12531281×5
    AE-BPAE1×1253641×125
    BP1×32031281×5
    BP1×62531281×5
    下载: 导出CSV

    表 4  AE-LSTM网络模型与LSTM网络模型混淆矩阵归一化对比

    Table 4.  Comparison between normalized confusion matrix of AE-LSTM and LSTM

    Vibration stateAE-LSTM | LSTM
    StillnessWindClimbingKickingSawing
    Stillness1 | 10 | 00 | 00 | 00 | 0
    Wind0 | 00.98 | 0.760 | 0.020.02 | 0.130 | 0.09
    Climbing0 | 00 | 0.061 | 0.940 | 00 | 0
    Kicking0 | 00 | 0.050.02 | 0.040.97 | 0.910.01 | 0
    Sawing0 | 0.020 | 0.020 | 00 | 0.011 | 0.95
    下载: 导出CSV

    表 3  网络模型复杂度对比

    Table 3.  Comparison of complexity between two network models

    AE-LSTMLSTMAE-BPBP
    Parameter number1075251306934979780773
    FLOPs21388826035299200161280
    下载: 导出CSV
  • [1] 崔婷, 赵桂红. 我国民航机场安全水平的综合评价[J]. 统计与决策, 2009(4): 182-183.
    [2] 尚宾宾. 铁路周界安防技术分析及应用[J]. 中国安全科学学报, 2018(s1): 82-87.
    [3] 李峻薇, 占志彪. 一种主动红外探测报警系统的设计[J]. 安防科技, 2008(4): 30-32. doi: 10.3969/j.issn.1671-4237.2008.04.010
    [4] 王维. 激光对射系统在机场周界安防系统中的应用研究[J]. 智能建筑与城市信息, 2010, 60(3): 79-85.
    [5] 喻云云. 浅析周界报警电子围栏技术发展现状及趋势[J]. 中国安防, 2017(9): 72-76. doi: 10.3969/j.issn.1673-7873.2017.09.015
    [6] 胡江涛. 光纤光栅技术在周界入侵报警系统中的运用分析[J]. 山东工业技术, 2017(5): 193-193.
    [7] 中国民用航空局. MH/T 7003-2017民用运输机场安全保卫设施[S]. 2017.
    [8] 北京博睿视科技有限责任公司. 基于深度学习的周界报警算法: 中国, 107316024A[P]. 2017-11-03.
    [9] ZHOU J, XU W. End-to-end learning of semantic role labeling using recurrent neural networks[C]//Proceedings of the Annual Meeting of the Association for Computational Linguistics. Beijing, China : Computational Linguistics, 2015: 1127-1137.
    [10] JOEL M, CHRISTOPHER P. Convolutional residual memory networks[DB/OL]. 2016-07-14[2020-01-05]. https://arxiv.org/abs/1606.05262.
    [11] 曼普里特.辛格.古特[印], 拉蒂普.杜瓦[印]. TensorFlow神经网络编程[M]. 马恩驰, 陆健译. 北京: 机械工业出版社, 2018: 173-186.
    [12] MIKE S, KULDIP K, P. Bidirectional recurrent neural networks[J]. IEEE Transactions on Signal Processing, 1997, 45(11): 2673-2681. doi: 10.1109/78.650093
    [13] SEPP H, JÜRGEN S. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780. doi: 10.1162/neco.1997.9.8.1735
  • [1] 付仔蓉吴胜昔吴潇颖顾幸生 . 基于空间特征的BI-LSTM人体行为识别. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20191202003
    [2] 随学杰王慧锋颜秉勇 . 基于改进生成式对抗网络的编码DNA分子识别. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20191216001
    [3] 魏梓轩周家乐 . 基于VAE的编码DNA载体阻断事件聚类分析与研究. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190424001
    [4] 张逸秋吴诗勇吴幼青黄胜高晋生 . 城市污泥水热液化过程及产物特征. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190107001
    [5] 魏江平林家骏陈宁 . 多特征非接触式测谎技术. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190619002
    [6] 张星崔向伟李宗霖李志敏 . 基于能量循环再生系统酶法生产谷胱甘肽. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190806001
    [7] 赵鸿山范贵生虞慧群 . 基于归一化文档频率的文本分类特征选择方法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180914005
    [8] 蔡灵婷王以群刘学良黄月霞 . 琥珀、柯巴树脂及其改善品的谱学特征. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190107002
    [9] 李晨玥张雪芹曹涛 . 一种基于光度信息和ORB特征的建图SLAM. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20200117006
    [10] 孙运筑修光利段玉森伏晴艳 . 上海市淀山湖区域灰霾天大气颗粒物中碳组分的污染特征. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180412007
    [11] 伏威袁伟娜 . 一种基于PTS方法降低FBMC系统PAPR的新方法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180409003
    [12] 金艳张永红宋兴福连伟何化于建国 . 耐盐菌MBR系统处理页岩气采出水性能及膜污染特性. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190606001
    [13] 于中宝邵方明 . 并行系统中排列图的可靠性近似算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180531001
    [14] 汪迪李芳菲许思遥刘昌洪 . 针对信息物理系统线性欺诈攻击的水印加密策略. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20191016001
    [15] 潘斌翁涛杨家鹏安琦 . 汽车发动机皮带系统臂式张紧轮力学性能研究. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190114006
    [16] 郁枫杨帆熊智华 . 基于CCF-PLS的通讯系统异常根因分析. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20191128006
    [17] 翁童袁伟娜 . 一种基于SPSO算法降低FBMC系统PAPR的新方法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20190731002
    [18] 解冰朱宏擎 . 一种基于选择性卷积特征和最大后验高斯混合模型的细粒度图像分类算法. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180603001
    [19] 高源安琦 . 轴承座同心度误差对深沟球轴承-转子系统振动性能的影响. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180415001
    [20] 齐莉莉刘济 . 基于改进CKF算法的一类有色噪声污染的线性观测系统的状态估计. 华东理工大学学报(自然科学版), doi: 10.14135/j.cnki.1006-3080.20180427002
  • 加载中
图(8)表(4)
计量
  • 文章访问数:  247
  • HTML全文浏览量:  169
  • PDF下载量:  1
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-01-22
  • 网络出版日期:  2020-06-16

基于AE-LSTM网络模型的机场周界入侵报警及分类算法

    作者简介:许奕杰(1995—),男,上海人,硕士生,主要研究方向为信号处理、机器学习。E-mail:18721173105@163.com
    通讯作者: 万永菁, wanyongjing@ecust.edu.cn
  • 1. 华东理工大学信息科学与工程学院,上海 200237
  • 2. 上海卓希智能科技有限公司研发部,上海 201611

摘要: 机场周界入侵报警系统是机场飞行区的第一道防线。针对传统的机场周界入侵报警系统存在的恶劣气象条件下误报率高、不能区分入侵类别等问题,提出了一种自编码长短时记忆(AE-LSTM)网络模型;提取输入信号的隐含编码特征,构建融合时序信息的特征向量矩阵,降低网络模型的复杂度。网络模型的性能评价结果表明,该模型的误报率低,振动状态分类准确率高,且复杂度低,有很好的实际应用前景。

English Abstract

  • 随着飞机逐渐成为人们出行的首选,机场的人流日趋密集,安全问题显得尤为重要。机场周界是机场飞行区与外界隔离的第一道安全屏障,担负着保障飞行区安全的重任[1]

    传统的周界入侵报警系统所采用的探测技术大致可以分为4种类型:对射遮挡、依附探测、物理感应和智能视频监控[2],主要包括红外探测[3]、激光对射[4]、张力围栏[5]、埋地电缆以及振动光纤[6]等。现阶段各大机场采用的智能周界入侵报警系统均基于此类传统探测技术,例如广州白云机场采用振动电缆智能检测技术并辅以微波对射检测技术;昆明长水机场采用振动电缆智能检测技术并辅以泄漏电缆检测技术等。这些技术和所采用的设备受大风、暴雨、大雪等客观条件的影响较大,极易产生误报。同时,这类机场周界入侵报警系统仅仅只能实现报警的功能,而不能实现对具体入侵行为的识别。随着中国民用航空局在2017年提出新版本的《民用运输机场安全保卫设施》[7],对周界入侵行为进行准确识别成为了机场安防领域最重要的研究方向之一。对于周界网振动信号,传统的信号处理方法(例如傅里叶变换和小波变换)虽然可以提取信号时频域上的特征,但在恶劣天气的干扰下,提取到的特征极为相似,无法完成准确分类。而利用传统的神经网络(例如BP神经网络)虽然可以提高一定的分类准确率,但依然无法达到行业应用要求。北京博睿视科技有限公司2017年公开了一种基于深度学习的周界报警算法[8],通过卷积神经网络对监控视频帧进行分类,最终实现对人的识别,然而,该算法的研究依然停留在理论阶段。基于这类情况,本文研究将机器学习技术引入机场安防领域。

    长短时记忆(Long Short Term Memory,LSTM)网络最初是为了解决传统循环神经网络训练过程中产生的梯度消失或梯度爆炸问题而被提出的,随着LSTM的发展,越来越多的基于LSTM的网络模型诸如深度双向LSTM(DB-LSTM)[9]、卷积残差记忆网络(CRMN)[10]等被成功应用于语义识别、情感分析、股市预测等领域,证明了LSTM网络在处理非稳态时序信号上的优越性。因此,本文以LSTM网络为核心,搭建自编码长短时记忆AE-LSTM网络模型,对不同机场周界入侵行为进行分类,尤其是将极难区分的大风状态与入侵行为区分开,令机场周界入侵报警系统在降低误报率的同时,可以对不同的入侵行为进行准确的识别。

    • 机场周界入侵报警系统的整体架构如图1所示。系统将周界网的振动状态分为5类,包括静止状态(Stillness)、大风状态(Wind)、攀爬状态(Climbing)、踢网状态(Kicking)以及锯网状态(Sawing),其中,静止状态和大风状态为正常状态,不需要报警;攀爬状态、踢网状态和锯网状态为入侵行为,需要报警,优先级从高到低排列分别为锯网状态、攀爬状态、踢网状态。悬挂在周界网上的惯性测量单元(Inertial Measurement Unit,IMU)采集5类振动状态的信号数据,IMU在周界网上的悬挂方式如图1所示,其中灰色矩形为单个IMU。每个IMU输出以XYZ三轴为中轴的角速度数据,其中XZ轴平行于网面,Y轴垂直于网面。以攀爬状态为例,三轴输出数据波形如图1所示。为了降低系统的运算量,选取含有最丰富振动信息的Y轴作为表征网面振动的信息源,构建数据集。信号采集完毕后,将信号传递到对应的分组处理器中,每个分组传感器负责处理相邻3片网的振动信号,完成报警及对入侵行为的分类。每百米范围存在一个区域控制器,负责收集范围内分组处理器和毫米波雷达的数据,其中,毫米波雷达用于对入侵行为进行预警。区域控制器和监控摄像机的数据经交换机汇总后,分别存入数据处理服务器和视频服务器。PC端的监控软件可以显示机场周界全范围即时的报警信息,并且可以随时实现对数据的调用和查看。

      图  1  机场周界入侵报警系统架构

      Figure 1.  Framework of airport perimeter intrusion alarm system

    • 本文提出的机场周界入侵报警与分类算法嵌入在机场周界入侵报警系统中,其流程如图2所示。在数据处理阶段,首先采集5类周界网振动状态的信号数据,选择其中合适的信号数据进行预处理,包括滤波、归一化和分帧;然后对处理后的信号进行数据增强,扩充算法的训练集,使数据可以更加全面地覆盖振动发生时的各种情况;最后将原始数据和增强后的数据合并,构成算法的训练集,并利用交叉验证的方法从原始数据中抽取部分数据作为测试集。在模型训练阶段,利用AE-LSTM模型对训练集进行训练,模型的核心为LSTM网络,通过其在时序上的记忆能力完成对不同入侵行为的分类。考虑到下层处理器的运算和存储能力有限,需要尽可能地减少网络的参数,而LSTM网络的参数主要由输入层的维度与隐含层的神经元个数决定,因此,引入自动编码器(Auto Encoder,AE)对原始输入信号进行降维与特征提取,最终通过Softmax层输出网络的分类结果。

    • 通过安装在周界网上的IMU,采集周界网在不同振动状态时的数据,采样频率为50 Hz。数据采集结果如图3所示,其中每行为同类振动状态的不同振动情况。

      图  2  算法流程图

      Figure 2.  Flowchart of algorithm

      图  3  不同振动状态波形图

      Figure 3.  Waveforms of different vibration states

    • 数据预处理包括滤波、归一化和分帧3个操作。为了防止原始数据中存在偶然的波动干扰现象,采用5点中值平均滤波法,连续采样目标点附近的5个数据,去掉其中的最大值和最小值,然后将目标点的原始数据替换为剩余的3个点的算数平均值;归一化采用离差标准化方法,将原始数据映射到$\left[ {{{0}},{{1}}} \right]$之间;分帧操作采用滑动窗法,使用窗长为${{N}}$的滑动窗以小幅${{{N}}_{{s}}}$步进自左向右遍历序列。通过观察和实验发现${{N}} = {{125}}$${{{N}}_{{s}}} = {{20}}$时,分帧效果最佳。

    • 神经网络的训练通常依赖大量数据,当训练数据不足时,网络将难以学习到不同分类的全局特征。因此对于小数据集,有必要进行数据增强,以扩充原数据未能覆盖的输入空间,增强神经网络模型的泛化能力。

      对于本数据集的时间相关序列${{X}}$,采用与时间无关的方法,通过对各个采样点幅值进行微小的缩放,模拟振动的全局特征,如式(1)和式(2)所示。

      式中:$n$为原始数据采样点个数;${{S}}$为随机生成的缩放矩阵,服从均值$\mu = 1$、标准差为$\sigma $的高斯分布。其中,$\sigma $取值太小会导致数据增强没有效果,取值太大则会导致振动特性发生变化,最终选取$\sigma $$\left[ {0.2,0.5} \right]$内的随机值。不同$\sigma $的数据增强效果如图4所示,其中$\sigma =0$表示原始数据。

      图  4  数据增强效果

      Figure 4.  Effect of data enhancement

    • AE-LSTM网络模型结构如图5所示。

      图  5  AE-LSTM网络模型结构

      Figure 5.  Structure of AE-LSTM network model

      图5中可以看出,模型的第一部分为AE。AE可以看作是神经网络的一种,是一种无监督学习算法,其尝试逼近一个恒等函数,使得网络的输出无限接近于网络的输入,最终网络的训练误差越小,则AE训练的效果越好[11]。本文采用欠完备的AE,通过限制AE的隐含层神经元个数小于输入层神经元个数,迫使AE捕捉最显著的特征。设置AE为一个125×64×125的3层网络,输入层和输出层均包含125个神经元,令输出层输出结果$\left\{ {{{\hat {{x}}}_{\bf{1}}},{{\hat {{x}}}_{\bf{2}}}, \cdots ,{{\hat {{x}}}_{{\bf{125}}}}} \right\}$等于输入层的输入$\left\{ {{{{{x}}}_{\bf{1}}},{{{{x}}}_{\bf{2}}}, \cdots ,{{{{x}}}_{{\bf{125}}}}} \right\}$,隐含层神经元数目的选择对模型的效率有一定的影响,经实验验证,64为效果最好的隐含层神经元个数。AE分为编码器和解码器两部分,编码器用于将输入信号$\left\{ {{{{{x}}}_{\bf{1}}},{{{{x}}}_{\bf{2}}}, \cdots ,{{{{x}}}_{{\bf{125}}}}} \right\}$编码成为$\left\{ {{{{{h}}}_{\bf{1}}},{{{{h}}}_{\bf{2}}}, \cdots ,{{{{h}}}_{{\bf{64}}}}} \right\}$,编码器的输出结果可以表示为

      式中:${{i}} = {\bf{1}},{\bf{2}}, \cdots ,{\bf{125}}$${{j}} = {\bf{1}},{\bf{2}}, \cdots ,{\bf{64}}$${{{w}}_{{{ij}}}}$为对应的${{{x}}_{{{i}}}}$${{{h}}_{{{j}}}}$的连接权值;${{{b}}_{{{j}}}}$为对应的${{{h}}_{{{j}}}}$上的偏置;${{f}}\left( \cdot \right)$为sigmoid激活函数。

      解码器用于将编码器的输出结果$\left\{ {{{{{h}}}_{\bf{1}}},{{{{h}}}_{\bf{2}}}, \cdots ,{{{{h}}}_{{\bf{64}}}}} \right\}$解码成为$\left\{ {{{\hat{{ x}}}_{\bf{1}}},{{\hat{{ x}}}_{\bf{2}}}, \cdots ,{{\hat{{ x}}}_{{\bf{125}}}}} \right\}$,解码器的输出结果可以表示为

      式中:${{i}} = {\bf{1}},{\bf{2}}, \cdots ,{\bf{125}}$${{j}} = {\bf{1}},{\bf{2}}, \cdots ,{\bf{64}}$${{{w}}'}_{{{ji}}}$为对应的${{{h}}_{{j}}}$${{\hat {{x}}}_{{i}}}$的连接权值;${{{b}}'}_{{{i}}}$为对应的${{\hat {{x}}}_{{i}}}$上的偏置;${{g}}\left( \cdot \right)$为Sigmoid激活函数。

      最后,通过规划输入信号$\left\{ {{{{{x}}}_{\bf{1}}},{{{{x}}}_{\bf{2}}}, \cdots ,{{{{x}}}_{{\bf{125}}}}} \right\}$和输出信号$\left\{ {{{\hat {{x}}}_{\bf{1}}},{{\hat {{x}}}_{\bf{2}}}, \cdots ,{{\hat {{x}}}_{{\bf{125}}}}} \right\}$的均方误差(MSE)最小问题,即${\rm{ min}}\frac{{\bf{1}}}{{{\bf{125}}}}{\mathop \sum \limits_{{{i}} = {\bf{1}}}^{{\bf{125}}}} {\left( {{{{x}}_{{i}}} - {{{\hat{{x}}}}_{{i}}}} \right)^{\bf{2}}}$,得到每一个${{{w}}_{{{ij}}}}$${{{b}}_{{{j}}}}$${{{{w}}'}_{{{ji}}}}$${{{{b}}'}_{{{i}}}}$的值,完成网络的训练。最终所得到的隐含层输出结果$\left\{ {{{{h}}_{\bf{1}}},{{{h}}_{\bf{2}}}, \cdots ,{{{h}}_{{\bf{64}}}}} \right\}$即为输入信号的隐含编码特征。将连续5帧输入信号的隐含编码特征按时间顺序组合,即形成样本在时间上连续的融合特征向量矩阵。

      模型的第二部分为LSTM网络。LSTM是循环神经网络(RNN)的衍生,传统的RNN由于其递归结构,可以将时间序列的上下文信息联系起来[12],学习与时间相关的特征,但是当训练的序列过长时,会出现梯度消失或者梯度爆炸的问题,而LSTM通过引入3个“门”的机制,选择性地让信息通过[13],使网络拥有更长时间上的依赖能力。单个LSTM细胞结构如图6所示。

      图  6  LSTM细胞结构

      Figure 6.  Structure of LSTM cell

      遗忘门(Forget gate)决定在当前状态中丢弃哪些信息。

      输入门(Input gate)决定加入多少新的信息到当前状态中,由决策向量${{{i}}_{{t}}}$和备选信息向量$\widetilde {{{{C}}_{{t}}}}$组成。

      结合遗忘门的信息,可以得到当前的细胞状态${{{C}}_{{t}}}$

      输出门(Output gate)决定当前状态输出的内容${{{h}}_{{t}}}$,由细胞状态将要被输出的部分${{{o}}_{{t}}}$和当前细胞状态${{{C}}_{{t}}}$确定。

      式(5)~式(10)中:${{\sigma }}\left( \cdot \right)$为Sigmoid激活函数;${{{W}}_*}$${{{b}}_*}$分别为各激活函数的权重和对应的偏置,$* \in \left\{ {{\rm{f}},{\rm{i}},{\rm{o}},{\rm{C}}} \right\}$(即分别对应遗忘门,输入门,输出门,tanh层);${{{h}}_{{{t}} - {\bf{1}}}}$为上一时刻的输出;${{{x}}_{{t}}}$为当前时刻的输入;${{{C}}_{{{t}} - {\bf{1}}}}$为上一时刻细胞的状态。

      LSTM网络中每个LSTM细胞包含一个隐含层,隐含层有128个神经元。AE训练完成后,将连续5帧信号的编码器输出结果$\left\{ {{{{h}}_{\bf{1}}},{{{h}}_{\bf{2}}}, \cdots ,{{{h}}_{{\bf{64}}}}} \right\}$纵向堆叠,形成时间上连续的融合特征向量矩阵,将该矩阵作为LSTM网络的输入,每次输入1帧信号的隐含特征向量(即矩阵的1行),连续输入5次。最终,取最后一个LSTM细胞的输出结果,通过全连接层和Softmax层将最终分类结果以概率分布的形式输出。

    • 对于各分类的原始数据,进行振动状态的端点检测,选取信号中含振动信息的有效部分,然后按照上述方法进行数据预处理后,将连续5帧作为一个样本,随机选取部分样本作为测试集,其余作为训练集。随后,对训练集进行数据增强,构成完整的数据集。数据集的详细设置如表1所示。

      Vibration stateTraining setTraining set(enhancement)Testing set
      Stillness486729201
      Wind371556159
      Climbing402603158
      Kicking455682195
      Sawing392588168

      表 1  数据集各分类样本数

      Table 1.  Number of each classification sample in dataset

    • 本文采用多个不同的神经网络模型针对同一数据集的分类结果进行对比分析,采用的网络模型分别为LSTM网络模型、AE-BP网络模型和BP网络模型,其中,AE-BP网络模型利用AE提取的特征进行BP神经网络的训练,BP网络模型则是直接利用原始信号数据进行训练。各个网络模型的基本参数如表2所示,除网络最终的输出层采用Softmax作为激活函数外,其余层均采用Sigmoid作为激活函数。

      Network modelInput dimensionNumber of layerNeurons number in hidden layerOutput dimension
      AE-LSTMAE1×1253641×125
      LSTM5×6431281×5
      LSTM5×12531281×5
      AE-BPAE1×1253641×125
      BP1×32031281×5
      BP1×62531281×5

      表 2  对比实验网络模型参数

      Table 2.  Parameters of comparative network models

      为了更全面地对网络性能进行分析与评价,引入各个网络模型针对测试集报警的精确率(Precision)、召回率(Recall)和F1值作为评价指标,计算公式如下:

      其中:TP指正类判定为正类;FP指负类判定为正类;FN指正类判定为负类,结果如图7所示。

      图  7  各网络模型报警评价指标对比

      Figure 7.  Comparison of evaluation indicators for alarms of each network model

      图7中可以看出,使用基本的BP网络模型直接进行报警的判断效果很差,有大量的误报和漏报现象。而增加了自动编码器后,网络模型的各项指标都得到了提升,表明自动编码器可以很好地提取信号的隐含特征,所提取的特征也能很好地反映信号的特点。AE-LSTM网络模型的召回率为1,表示完全杜绝了漏报的现象,精确率为0.99,表示仅存在极少数的误报现象,达到了行业应用标准。而其余3种网络模型召回率均没有达到1,表示存在一定的漏报现象,这在安防领域是绝对不被允许的。综合精确率和召回率计算得到了网络模型的F1值,可以看出AE-LSTM网络模型具有最良好的性能。

      另外,本文通过网络模型的参数数量和浮点运算次数(Floating Point Operations,FLOPs)比较模型的复杂度,结果如表4所示,其中,乘法与加法都记为一次浮点运算。

      Vibration stateAE-LSTM | LSTM
      StillnessWindClimbingKickingSawing
      Stillness1 | 10 | 00 | 00 | 00 | 0
      Wind0 | 00.98 | 0.760 | 0.020.02 | 0.130 | 0.09
      Climbing0 | 00 | 0.061 | 0.940 | 00 | 0
      Kicking0 | 00 | 0.050.02 | 0.040.97 | 0.910.01 | 0
      Sawing0 | 0.020 | 0.020 | 00 | 0.011 | 0.95

      表 4  AE-LSTM网络模型与LSTM网络模型混淆矩阵归一化对比

      Table 4.  Comparison between normalized confusion matrix of AE-LSTM and LSTM

      综合分析图7表3可知,AE的引入不仅提高了网络模型的识别准确率,同时为网络模型减少了参数和运算量,减轻了处理器的负担。

      AE-LSTMLSTMAE-BPBP
      Parameter number1075251306934979780773
      FLOPs21388826035299200161280

      表 3  网络模型复杂度对比

      Table 3.  Comparison of complexity between two network models

    • 为了进一步比对模型在不同类别上的性能,选取F1值最高的两个网络模型,计算两者对测试集的预测结果的混淆矩阵(Confusion matrix)并归一化,结果如图8表4所示,其中,行为标签类别,列为预测类别。

      图  8  AE-LSTM网络模型与LSTM网络模型混淆矩阵对比

      Figure 8.  Comparison between confusion matrix of AE-LSTM and LSTM

      图8中,值越大则显示的颜色越接近白色,值越小则越接近黑色,左上到右下的对角线表示识别正确的情况,其余方格表示识别错误的情况。从图8表4中可以明显看出,LSTM网络模型在各类的识别准确率上均不如本文提出的AE-LSTM模型,尤其对于大风状态的识别很差,准确率仅有0.76,极易与踢网状态和锯网状态混淆,在对其他状态的识别中也存在较多识别错误的情况,而AE-LSTM模型对刮风状态的识别准确率达到了0.98,在其他各个类别的识别上也都达到了很不错的准确率,只有极个别识别错误的情况,很好地实现了对不同振动状态的分类。

      最后,将AE-LSTM网络模型与文献[8]的算法进行对比。该算法利用一个包含14个卷积层、4个池化层和3个全连接层的卷积神经网络学习连续的监控视频帧的特征,实现对入侵对象的判别,而本文的AE-LSTM网络模型可以识别不同的入侵行为,更加符合机场安防的实际应用场景。另一方面,文献[8]算法的网络结构也远比本文提出的网络模型复杂,因此,AE-LSTM网络模型在机场周界入侵报警系统的实际应用中具有更大的优势。

    • 本文通过对机场周界网的振动信号的处理和分析,首度将机器学习方法引入了机场安防领域,提出了一种AE-LSTM网络模型。在以LSTM网络为核心进行识别的基础上,通过引入AE的方式,在提取信号的隐含特征的同时减小网络模型的复杂度。该模型在杜绝漏报的前提下,极大地降低了误报率,使得机场的周界入侵报警系统更加准确与智能,与机场现有的周界入侵报警系统相比,可以在很大程度上降低机场的人力成本。同时,该模型在准确完成报警的前提下,进一步对入侵行为进行分类,达到了很高的分类准确率,根据分类结果可以排列入侵行为的优先级,以提高对入侵问题进行处理的效率。现阶段已实现了对入侵行为较为准确的分类,如何在更加复杂的场景,例如极恶劣天气影响下完成准确分类并进一步提高系统的时效性将成为下一步的研究目标。

(8)  表(4) 参考文献 (13) 相关文章 (20)

目录

    /

    返回文章