高级检索

  • ISSN 1006-3080
  • CN 31-1691/TQ
引用本文:
Citation:

基于单模态生理信号无监督特征学习的驾驶压力识别

    作者简介: 江润强(1994—),男,山东淄博人,硕士生,主要研究方向为机器学习及其应用。E-mail:rqjiang_ecust@163.com;
    通讯作者: 陈兰岚, llchen@ecust.edu.cn
  • 中图分类号: TP391

Driving Stress Detection Based on Unsupervised Feature Learning of Single Module Physiological Signal

    Corresponding author: CHEN Lanlan, llchen@ecust.edu.cn ;
  • CLC number: TP391

  • 摘要: 针对基于多模态生理信号分析的驾驶压力识别会影响驾驶员的行车舒适性,且传统的生理特征的提取需要依赖先验知识的问题,构建了基于单模态生理信号无监督特征学习的驾驶压力识别模型。首先采用单模态生理信号,通过构造卷积自编码器进行无监督的特征学习来提取抽象特征;然后将特征依次送入支持向量机、随机森林、K最近邻、梯度提升决策树4种不同的基分类器进行建模;最后引入集成学习的思想对不同基分类器的输出进行投票集成来提高驾驶压力识别的稳定性与准确性。实验结果表明,该模型在MIT-drivedb数据集的驾驶压力三分类任务中的准确率可达92.8%。
  • 图 1  驾驶压力识别模型框架

    Figure 1.  Framework of driving stress estimation model

    图 2  一维卷积自编码器示意图

    Figure 2.  Schematic diagram of one dimensional convolution auto-encoder

    图 3  数据集实验流程

    Figure 3.  Experiment flow of data set

    图 4  一维卷积自编码器的训练

    Figure 4.  Training of one dimensional convolutional auto-encoder

    图 5  抽象特征的可视化

    Figure 5.  Visualization of abstract features

    图 6  不同路况下的ROC曲线以及AUC

    Figure 6.  ROC curves and AUC under different road conditions

    图 7  不同维度下的特征学习算法比较

    Figure 7.  Comparison of feature learning algorithms in different dimensions

    表 1  卷积自编码器的超参数

    Table 1.  Hyperparameters of the convolutional auto-encoder

    LayerTypeHyperparametersFeature map
    1Input(3 100,1)
    2Convolution5×1×16(3 100,16)
    3Pooling2×1(1 550,16)
    4Convolution5×1×32(1 550,32)
    5Pooling2×1(775,32)
    6Reshape(24 800,1)
    7Dense(dim,1)
    8Dense(775×dim,1)
    9Reshape(775,dim)
    10Upsampling2×1(1 550,dim)
    11Deconvolution5×1×32(1 550,32)
    12Upsampling2×1(3 100,32)
    13Deconvolution5×1×16(3 100,16)
    14Deconvolution5×1×1(3 100,1)
    下载: 导出CSV

    表 2  基分类器及参数设置

    Table 2.  Base classifier and parameter setting

    ClassifierParameter
    KNNn_neighbors:1,2,3,4,5
    RFmax_feature:1,2,3,4,5
    GBDTmax_feature:1,2,3,4,5
    SVMC、gamma:[0.000 1,0.001,…,100]
    下载: 导出CSV

    表 3  不同基分类器不同维度下的识别结果

    Table 3.  Recognition results under different dimensions of different base classifiers

    DimensionAccuracy/%
    KNNGBDTRFSVM
    286.72986.57984.13586.917
    490.60289.24890.03890.150
    892.51989.92590.78992.030
    1692.33188.34689.69992.105
    3287.78285.82787.63288.684
    6488.57186.61788.19588.008
    下载: 导出CSV

    表 4  基分类器的投票集成

    Table 4.  Voting integration of base classifiers

    MethodPrecision/%Recall/%F1/%Accuracy/%
    Mean(base classifiers)91.29191.24490.72191.316
    Voting(soft)92.80592.77192.34092.820
    Voting(hard)92.38492.56991.86492.444
    下载: 导出CSV

    表 5  同类研究的对比

    Table 5.  Comparison of similar studies

    MethodPhysiological signalAccuracy/%
    Reference[19]ECG,EMG,GSR,RESP97.4
    Reference[24]ECG83
    Reference[25]ECG98.6
    Reference[6]FGSR88.91
    Reference[26]FGSR81.82
    This paperFGSR92.82
    下载: 导出CSV
  • [1] WANG J S, LIN C W, YANG Y T C. A k-nearest-neighbor classifier with heart rate variability feature-based transformation algorithm for driving stress recognition[J]. Neurocomputing, 2013, 116(10): 136-143.
    [2] CHUNG W Y, CHONG T W, LEE B G. Methods to detect and reduce driver stress: A review[J]. International Journal of Automotive Technology, 2019, 20(5): 1051-1063. doi: 10.1007/s12239-019-0099-3
    [3] ZHANG C, WANG H, FU R R. Automated detection of driver fatigue based on entropy and complexity measures[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(1): 168-177. doi: 10.1109/TITS.2013.2275192
    [4] WANG H, WU C, LI T, et al. Driving fatigue classification based on fusion entropy analysis combining EOG and EEG[J]. IEEE Access, 2019, 7: 61975-61986. doi: 10.1109/ACCESS.2019.2915533
    [5] ZHANG B, MORERE Y, LANGLET C, et al. Reaction time and physiological signals for stress recognition[J]. Biomedical Signal Processing and Control, 2017, 38(9): 100-107.
    [6] CHEN L L, ZHAO Y, YE P F, et al. Detecting driving stress in physiological signals based on multimodal feature analysis and kernel classifiers[J]. Expert Systems with Applications An International Journal, 2017, 85: 279-291. doi: 10.1016/j.eswa.2017.01.040
    [7] OMID D, VIKAS R, MOJTABA T. Wearable driver distraction identification on-the-road via continuous decomposition of galvanic skin responses[J]. Sensors, 2018, 18(2): 503. doi: 10.3390/s18020503
    [8] BENGIO Y, COURVILLE A, et al. Representation learning: a review and new perspectives[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2013, 35(8): 1798-1828.
    [9] ZHAO L M, LI R, ZHENG W L, et al. Classification of five emotions from eeg and eye movement signals: Complementary representation properties[C]//2019 9th International IEEE/EMBS Conference on Neural Engineering (NER), San Francisco, USA: IEEE, 2019: 611-614,
    [10] REN Y F, WU Y. Convolutional deep belief networks for feature extraction of EEG signal[C]//2014 International Joint Conference on Neural Networks (IJCNN). Beijing: IEEE, 2014: 2850-2853.
    [11] WU H F, H Q, WANG D Q. A CNN-SVM combined model for pattern recognition of knee motion using mechanomyography signals[J]. Journal of Electromyography and Kinesiology, 2018, 42: 136-142. doi: 10.1016/j.jelekin.2018.07.005
    [12] HINTON G E, ZEMEL R S. Autoencoders, minimum description length and helmholtz free energy[C]//6th International Conference on Neural Information Processing Systems. USA: ACM, 1993: 3-10.
    [13] DU B, XIONG W, WU J, et al. Stacked convolutional denoising auto-encoders for feature representation[J]. IEEE Transactions on Cybernetics, 2017, 47(4): 1017-1027. doi: 10.1109/TCYB.2016.2536638
    [14] 田莉莉, 邹俊忠, 张见, 等. 基于改进的卷积神经网络脑电信号情感识别[J]. 计算机工程与应用, 2019, 55(22): 99-105. doi: 10.3778/j.issn.1002-8331.1807-0219
    [15] WEN T, ZHANG Z. Deep convolution neural network and autoencoders-based unsupervised feature learning of EEG signals[J]. IEEE Access, 2019, 6: 25399-25410.
    [16] MASCI J, MEIER U, CIREŞAN D. Stacked convolutional auto encoders for hierarchical feature extraction[C]//the 21st International Conference on Artificial Neural Networks and Machine Learning(ICANN). Berlin Heidelberg: Springer, 2011: 52-59.
    [17] 魏琛, 陈兰岚, 张傲. 基于集成卷积神经网络的脑电情感识别[J]. 华东理工大学学报(自然科学版), 2019, 45(4): 614-622.
    [18] LIU Y, SHRIBERG E. Comparing evaluation metrics for sentence boundary detection[C]//2007 International Conference on Acoustics, Speech and Signal Processing. USA: IEEE, 2007: 185-188.
    [19] HEALEY J A, PICARD R W. Detecting stress during real-world driving tasks using physiological sensors[J]. IEEE Transactions on Intelligent Transportation Systems, 2005, 6(2): 156-166. doi: 10.1109/TITS.2005.848368
    [20] LAURENS V D M, HINTON G. Visualizing data using t-sne[J]. Journal of Machine Learning Research, 2008, 2605: 2579-2605.
    [21] COX, TREVOR F, COX MICHAEL. Multidimensional scaling[J]. Journal of the Royal Stata Society, 2001, 46(2): 1050-1057.
    [22] KUNCHEVA L I, FAITHFULL W J. PCA feature extraction for change detection in multidimensional unlabeled data[J]. IEEE Transactions on Neural Networks and Learning Systems, 2014, 25(1): 69-80. doi: 10.1109/TNNLS.2013.2248094
    [23] EFTEKHARI A, BABAIE-ZADEH M, MOGHADDAM H A. Two-dimensional random projection[J]. Signal Processing, 2011, 91(7): 1589-1603. doi: 10.1016/j.sigpro.2011.01.002
    [24] MUNLA N, KHALIL M, SHAHIN A, et al. Driver stress level detection using HRV analysis[C]//2015 International Conference on Advances in Biomedical Engineering. Beirut Lebanon: IEEE, 2015: 61-64.
    [25] RIZWAN M F, FARHAD F, MASHUK F, et al. Design of a biosignal based stress detection system using machine learning techniques[C]//2019 International Conference on Robotics, Electrical and Signal Processing Techniques. Dhaka, Bangladesh: IEEE, 2019: 364-368.
    [26] LIU YUN, DU S Q. Psychological stress level detection based on electrodermal activity[J]. Behavioural Brain Research, 2018, 341: 50-53. doi: 10.1016/j.bbr.2017.12.021
  • 加载中
图(7)表(5)
计量
  • 文章访问数:  361
  • HTML全文浏览量:  253
  • PDF下载量:  8
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-07-28
  • 网络出版日期:  2020-12-16

基于单模态生理信号无监督特征学习的驾驶压力识别

    作者简介:江润强(1994—),男,山东淄博人,硕士生,主要研究方向为机器学习及其应用。E-mail:rqjiang_ecust@163.com
    通讯作者: 陈兰岚, llchen@ecust.edu.cn
  • 华东理工大学化工过程先进控制和优化技术教育部重点实验室,上海 200237

摘要: 针对基于多模态生理信号分析的驾驶压力识别会影响驾驶员的行车舒适性,且传统的生理特征的提取需要依赖先验知识的问题,构建了基于单模态生理信号无监督特征学习的驾驶压力识别模型。首先采用单模态生理信号,通过构造卷积自编码器进行无监督的特征学习来提取抽象特征;然后将特征依次送入支持向量机、随机森林、K最近邻、梯度提升决策树4种不同的基分类器进行建模;最后引入集成学习的思想对不同基分类器的输出进行投票集成来提高驾驶压力识别的稳定性与准确性。实验结果表明,该模型在MIT-drivedb数据集的驾驶压力三分类任务中的准确率可达92.8%。

English Abstract

  • 驾驶压力被认为是影响驾驶员意识和行为的主要因素,可能会导致驾驶员在道路上的攻击性和危险行为。如何有效地检测驾驶员的压力状态,提高行车过程中的驾驶意识和驾驶表现,对道路交通以及人身安全具有重要的现实意义[1]

    目前,对于驾驶压力状态的检测方法主要有:主观问卷调查、生理信号分析、驾驶行为检测、视觉与语音信号分析。在不同的检测方法中,由于生理信号能够较好地表征人体的心理与生理信息,具有一定的客观性与实时性,近年来得到了国内外众多学者的关注。与人体压力状态有关的生理信号主要包括脑电(Electroencephalogram, EEG)、心电(Electrocardiogram, ECG)、肌电(Electromyogram, EMG)、皮电(Galvanic Skin Response, GSR)、眼电(Electrooculogram, EOG)等[2]

    文献[3]采集了眼电、脑电以及肌电3种生理信号并设计了不同层面的样本熵及复杂度特征,20个受试者在4种驾驶状态下的识别准确率为96.5%~99.5%。文献[4]对脑电信号和眼电信号提取出样本熵、近似熵和谱熵并进行了基于熵的特征层面的融合,22个受试者的平均识别结果为99.1%。文献[5]对皮电、肌电、心电3种生理信号分别提取出时频域的特征并进行多模态融合,在12个受试者的3种驾驶压力负荷下的平均识别结果超过了80%。上述对于驾驶压力疲劳检测的相关研究往往涉及到多个模态的生理信号,一定程度上保证了信息的完整性与丰富性,但在实际的驾驶环境中多电极生理信号的采集会影响驾驶员行车的舒适性,也会导致检测成本的提高。

    针对上述问题,本文采用单模态生理信号进行驾驶压力的检测,选取了与压力识别相关性较强的脚部皮电信号[6]。该信号的采集较为方便,可直接放置于驾驶员的鞋垫中,且具有皮肤电导水平和皮肤电导反应的波形特点,可反映驱动人类行为、认知和情绪状态的交感神经活动水平[7]

    此外,传统的对于生理信号的特征提取方法,往往需要研究者具有较丰富的先验知识,属于特征工程的范畴。而深度学习作为一种表征学习的方法,具有对输入对象自动进行学习并且提取出相应抽象特征的能力,以此来学习高维数据的低维表示和对高维数据的压缩重构[8]。近年来,许多学者将基于深度学习的特征表示和特征融合应用到脑电等生理信号的处理中。文献[9]利用深度自编码器进行脑电和眼电特征的融合来展开情感识别的研究。文献[10]运用深度信念网络提取脑电信号的抽象特征进行脑机接口中左右手动作的识别。文献[11]利用卷积神经网络提取出不同导联肌电信号的抽象特征并输入到分类器中进行膝盖位置动作信息的识别。本文构建了基于单模态生理信号无监督特征学习的驾驶压力识别模型,采用一维卷积神经网络构造卷积自编码器提取皮电信号的抽象特征,并借鉴集成学习的思想,提高了驾驶压力识别的准确率与稳定性。

    • 本文构建的驾驶压力状态识别模型如图1所示。将经过带通滤波处理后的皮电信号数据样本送入卷积自编码器(Convolutional Auto-Encoder, CAE)中进行神经网络参数的训练学习,其中卷积自编码器的编码阶段学习到对应的抽象特征,再将其依次送入支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest, RF)、K最近邻(K-Nearest Neighbor, KNN)、梯度提升决策树(Gradient Boosting Decision Tree, GBDT)4种基分类器进行驾驶压力状态识别建模。对4种基分类器的输出采用投票(Voting)策略进行决策级的集成,得到最终的驾驶压力识别结果。

      图  1  驾驶压力识别模型框架

      Figure 1.  Framework of driving stress estimation model

    • 卷积自编码器包含有编码与解码两个阶段[12]。其中编码阶段主要由输入层、卷积层、池化层(下采样层)、重构层以及全连接层组成;解码阶段主要由重构层、全连接层以及上采样层、反卷积层组成,在编码阶段对脚部皮电的抽象特征进行学习。一维卷积自编码器示意图如图2所示,其中dim为抽象特征的准数。

      图  2  一维卷积自编码器示意图

      Figure 2.  Schematic diagram of one dimensional convolution auto-encoder

    • (1)卷积层。卷积层由若干个卷积核对输入进行卷积运算得到的特征图组成,以此来提取输入对象的局部特征[13]。卷积层的数学原理为

      其中:$f{m_{\rm{c}}}$表示卷积作用后的特征图;${w_{\rm{c}}}$${b_{\rm{c}}}$分别表示卷积核对应的权重与偏置;$ * $表示对应的卷积运算;$g$表示相应的激活函数。卷积的边界补零填充主要是为了保持卷积后数据的尺寸不变。

      (2)池化层。池化层又称为下采样层,其作用相当于对卷积层提取的抽象特征进行选择,以此达到特征的降维[14]。本文选用的最大池化层的数学原理为

      其中,$p{m_{\rm{p}}}$表示经过最大池化作用后的特征图。

      (3)重构层与全连接层。重构层将$p{m_{\rm{p}}}$转化为一维列向量,然后再输入到全连接层编码得到抽象特征,其中全连接层神经元的个数为压缩后抽象特征的维数。其数学原理为

      其中:${{v}}$表示重构后的列向量;$c$表示编码得到的抽象特征;${w_{\rm{f}}}$${b_{\rm{f}}}$分别表示全连接层所对应的权重与偏置;·表示点乘运算。

    • (1)全连接层与重构层。抽象特征解码的过程是编码的逆过程,需要通过全连接层将抽象特征转化为列向量,然后再通过重构层将其转化为对应尺度的特征图。其数学原理为

      其中:${{{v}}_{\rm{d}}}$表示解码阶段的列向量;${{{w}}_{{\rm{df}}}}$表示解码阶段全连接层的权重,同时解码阶段的重构建立在编码得到的抽象特征${{c}}$的基础上,为保证信息的完整性,解码阶段的全连接层不存在对应的偏置[15]$rm$为解码阶段重构后的特征图。

      (2)上采样层与反卷积。上采样层可以看作反池化的过程,主要用于特征子图的维度扩充。扩充后的特征子图再经过反卷积作用得到对应的重构信号。其数学原理为

      其中:$f{m_{{\rm{up}}}}$表示上采样后的特征子图;$ \circ $表示反卷积运算;${w_{{\rm{dc}}}}$${b_{{\rm{dc}}}}$分别表示反卷积的权重与偏置,其维度大小分别为对应卷积阶段权重与偏置矩阵的转置;$y$为解码阶段反卷积得到的重构信号[16]

    • 本文中除解码阶段最后反卷积层的输出为Sigmoid激活函数外,网络架构的其余卷积与反卷积层激活函数均采用修正线性(Rectified Linear Unit, Relu)激活函数。

      Relu激活函数:

      Sigmoid激活函数:

    • 自编码器的损失函数依据原始输入与重构输入之间的偏差最小化,本文采用的损失函数为平均绝对误差,计算公式如下:

      其中:$N$为样本数目;${x^{(i)}}$为原始信号的第$i$个样本;${y^{(i)}}$为原始信号第$i$个样本对应的重构信号。

    • 在反复实验的基础上,本文选取2个卷积层和2个池化层作为卷积自编码的编码阶段,其中全连接层的神经元个数作为抽象特征的维度;选取3个反卷积层和2个上采样层作为卷积自编码的解码阶段。具体的参数设置见表1,表中dim为全连接层神经元的个数,也即抽象特征的维数。

      LayerTypeHyperparametersFeature map
      1Input(3 100,1)
      2Convolution5×1×16(3 100,16)
      3Pooling2×1(1 550,16)
      4Convolution5×1×32(1 550,32)
      5Pooling2×1(775,32)
      6Reshape(24 800,1)
      7Dense(dim,1)
      8Dense(775×dim,1)
      9Reshape(775,dim)
      10Upsampling2×1(1 550,dim)
      11Deconvolution5×1×32(1 550,32)
      12Upsampling2×1(3 100,32)
      13Deconvolution5×1×16(3 100,16)
      14Deconvolution5×1×1(3 100,1)

      表 1  卷积自编码器的超参数

      Table 1.  Hyperparameters of the convolutional auto-encoder

    • 集成学习是指融合多个学习器或者模型来完成某个具体的学习任务,分为同质集成学习与异质集成学习[17]。本文对分类器的集成是建立在不同基分类器基础之上,属于异质集成学习的范畴,并从硬投票和软投票两个角度分别进行集成。

      (1) 硬投票是对不同基分类器的输出类别采用少数服从多数的投票原则确定出对应的预测标签,其局限性在于未考虑到类别标签输出概率的累加性。

      (2) 软投票也称为加权投票法,集成模型的输出为各个基分类器预测概率的加权平均,数学表达式为

      其中:$n$表示分类器的个数;${w_i}$表示第i个分类器的权重;${y_i}$表示第$i$个基分类器的概率输出值;$Y$表示加权平均后的概率输出值。本文中$n$=4,同时各个基分类器的权重${w_i}$保持一致,均设定为1。

      本文针对硬投票存在的问题,取不同基分类器模型对样本预测概率的平均值作为标准,从中选取概率最高的所属类别作为最终的预测标签。

    • 为充分评估分类模型的有效性,采用精确率(Precision)、召回率(Recall)、准确率(Accuracy)和F1分数(F1) 4个评估指标定量地分析评价模型[18]。评估指标定义如下:

      其中:TP表示模型预测为正类的正样本;FP表示模型预测为正类的负样本;TN表示模型预测为负类的负样本;FN表示模型预测为负类的正样本。

    • 实验数据选用美国PhysioBank公开的MIT-drivedb数据集,该数据集包含了9名驾驶员17次在波士顿特定路段真实驾驶环境下多源生理信号的驾驶记录,其中3次驾驶过程的数据存在一定的缺失,故本文采用了14次驾驶过程的完整数据。原实验设计者采集了多种外周生理信号,比如手部皮电(Hand Galvanic Skin Response, HGSR)、脚部皮电(Foot Galvanic Skin Response, FGSR)、心电(ECG)、呼吸(Respiration, RESP)。实验设定了车库休息、高速公路、市区道路3种驾驶情景,以此表征低、中、高压3种驾驶状态。每名受试者的驾驶过程为休息-高速-市区3种驾驶状态循环往复,实验流程如图3所示。整个实验过程中还进行了视频图像分析与问卷调查的客观分析,以此来佐证实验设计的合理性和有效性[19]

      图  3  数据集实验流程

      Figure 3.  Experiment flow of data set

      本文采用FGSR信号进行实验,其采样频率为31 Hz。原始采集的FGSR信号经过缺失值处理及带通滤波后,从每次驾驶过程的低、中、高压3种状态中分别提取出10 min信号进行分析,共获取30 min的驾驶片段。再利用滑动窗口进行数据分段,固定窗口的大小为100 s,滑动步幅为10 s,这样每个驾驶周期共产生126个数据样本,每种驾驶状态下各42个,其中每个样本的数据长度为31x100=3 100。14次驾驶过程共可获得1 764个数据样本。

      实验环境:软件环境为Matlab2018和Anaconda3下的Python3.7,其中Matlab主要用于原始信号的提取、样本的划分。Python的编程环境通过Keras搭建基于一维卷积自编码神经网络的特征学习框架,通过Sklearn库完成不同基函数的识别与参数的寻优以及特征学习算法的比较与特征可视化。

    • 为保证一维卷积无监督自编码器损失函数的收敛性以及网络的训练时间成本,对原始数据样本按列进行0-1归一化处理。将14次驾驶过程的全部数据样本随机打乱后,其中的90%作为训练集、其余的10%作为验证集进行卷积自编码器网络参数的训练学习。选取Adam优化器,每个批量大小为40个样本,Epoch的数目为80。模型的训练过程如图4所示。从图4可以看出,当Epoch达到80时,验证集与测试集的误差损失基本一致,模型不存在过拟合。

      图  4  一维卷积自编码器的训练

      Figure 4.  Training of one dimensional convolutional auto-encoder

    • 对于学习到的抽象特征,通过流行学习层面的T-SNE (T-Distributed Stochastic Neighbor Embedding)进行特征的可视化。T-SNE能够将样本之间的相似度关系在嵌入空间(二维空间)转化为概率分布,这使得T-SNE的数据可视化可以关注数据样本的局部与全局分布[20]。本文选取了3个个体进行抽象特征的可视化展示,如图5所示。从图5可以看出,卷积自编码器提取的抽象特征能够比较明显地区分出3种不同的驾驶状态。

      图  5  抽象特征的可视化

      Figure 5.  Visualization of abstract features

    • 为进一步分析提取的抽象特征对不同驾驶状况的表征能力,对14次驾驶过程分别进行驾驶压力的识别,选取径向基核函数的SVM作为基分类器,将区别3种路况的三分类问题转化为3个二分类问题,并计算出每次驾驶识别结果对应的TP与FP,其中14次驾驶过程平均识别结果的ROC曲线以及ROC曲线下的面积如图6所示。

      图  6  不同路况下的ROC曲线以及AUC

      Figure 6.  ROC curves and AUC under different road conditions

      图6可以看出,对于14次驾驶过程而言,卷积自编码器提取的抽象特征对车库休息状态的平均识别结果最好,ROC曲线下的面积为0.97;其次为城市路况阶段,ROC曲线下的面积为0.96;高速路况阶段ROC曲线下的面积为0.95。

    • 为分析深度学习层面特征学习的有效性,选取多维缩放(MultiDimensional Scaling, MDS)[21]、主成分分析(Principal Components Analysis, PCA)[22]、稀疏随机映射(Sparse Random Projection, SRP)[23] 3种基于矩阵映射的传统特征学习算法与卷积自编码器(CAE)进行比较。对不同的特征学习算法依次设置了6个特征维度进行特征学习,用于特征学习评估的基分类模型均为径向基核函数的SVM。对于每次驾驶过程的126个数据样本,通过设置5个随机种子选取70%的样本用于训练,30%的样本用于测试,14次驾驶过程通过不同的特征学习方式所得的驾驶压力识别结果如图7所示。对于本数据集而言,卷积自编码提取的抽象特征在维度大于等于8时优于传统特征学习算法,这表明基于深度学习的特征学习在调整好其超参数的基础上可以替代传统特征学习算法,且无需任何与生理信号相关的先验知识。

      图  7  不同维度下的特征学习算法比较

      Figure 7.  Comparison of feature learning algorithms in different dimensions

    • 为提高决策级层面识别结果的稳定性与准确率,选取KNN、RF、GBDT、SVM作为基分类器,同时采用软投票与硬投票的集成学习策略。其中,对于不同维度下的样本空间,数据划分方式与2.2.4一致,基分类器的相关参数采用4折交叉验证的方式进行网格化参数搜索,其参数的搜索范围如表2所示。

      ClassifierParameter
      KNNn_neighbors:1,2,3,4,5
      RFmax_feature:1,2,3,4,5
      GBDTmax_feature:1,2,3,4,5
      SVMC、gamma:[0.000 1,0.001,…,100]

      表 2  基分类器及参数设置

      Table 2.  Base classifier and parameter setting

      表3示出了不同基分类器不同维度下14次驾驶记录的压力识别平均准确率。可以看出在同一维度下,不同基分类器的识别结果存在一定的差异。整体而言KNN的表现相对较好,其中,在维度为4、8、16时,KNN与SVM的识别结果均达到了90%的水平。KNN在维度为8时达到了单分类器的最佳识别结果92.519%(表中加粗)。

      DimensionAccuracy/%
      KNNGBDTRFSVM
      286.72986.57984.13586.917
      490.60289.24890.03890.150
      892.51989.92590.78992.030
      1692.33188.34689.69992.105
      3287.78285.82787.63288.684
      6488.57186.61788.19588.008

      表 3  不同基分类器不同维度下的识别结果

      Table 3.  Recognition results under different dimensions of different base classifiers

      表4示出了特征维度为8时集成模型的准确率、精确率、召回率、F1,可见两种集成方法均对驾驶压力的识别有一定的提升作用,其中软投票要优于硬投票的识别效果(最佳识别效果表中加粗)。

      MethodPrecision/%Recall/%F1/%Accuracy/%
      Mean(base classifiers)91.29191.24490.72191.316
      Voting(soft)92.80592.77192.34092.820
      Voting(hard)92.38492.56991.86492.444

      表 4  基分类器的投票集成

      Table 4.  Voting integration of base classifiers

    • 与同样采用MIT-drivedb数据集的传统手工特征方法进行比较,比较结果如表5所示。文献[19]为本数据集的原始参考文献,实验设计者对心电、肌电、皮电、呼吸4种模态生理信号设计了22维的手工特征,3种状态的识别准确率为97.4%,但该研究样本划分时间长度为5 min,实时性较差,同时涉及到多个模态的信号。文献[19]、文献[6]中曾提及与驾驶压力状态最为相关的是皮电与心电两个单模态,本文对单模态的分析结果进行进一步的对比。文献[24]采用单模态的心电信号作为研究对象,对心电信号进行心率变异性(Heart Rate Variablity, HRV)检测,提取出相应的时域、频域、时频域以及非线性特征,驾驶压力识别的平均准确率为83%。文献[25]结合心电信号的生理波形特点提取其RR间隔、QT间隔以及EDR 3种类型的手工特征,个体识别平均结果为98.6%,但该研究仅区分了两种驾驶压力状态。文献[6]采用单模态脚部皮电信号作为研究对象,样本划分方式与本文相同,提取了18个脚部皮电的手工特征,采用KNN作为分类器,3种状态的识别准确率为88.91%。文献[26]中样本划分长度为5 min,设计并提取了皮电信号的相应手工特征,采用线性判别分析(Linear Discriminant Analysis, LDA)作为分类器,3种状态的识别准确率为81.82%。综合研究结果表明,本文在单模态生理信号上利用基于深度学习的无监督特征学习方法,取得了较好的识别效果。

      MethodPhysiological signalAccuracy/%
      Reference[19]ECG,EMG,GSR,RESP97.4
      Reference[24]ECG83
      Reference[25]ECG98.6
      Reference[6]FGSR88.91
      Reference[26]FGSR81.82
      This paperFGSR92.82

      表 5  同类研究的对比

      Table 5.  Comparison of similar studies

    • 本文采用单模态的脚部皮电信号构建驾驶压力识别模型,采用一维卷积自编码器进行抽象特征学习,并应用了决策级的集成学习策略。实验结果表明,脚部皮电与驾驶压力的关联度较高,所提取的抽象特征具有较好的表征能力,集成学习有助于提高模型的识别准确率。本文的驾驶压力识别是针对单个个体的识别,没有涉及到跨个体驾驶压力的识别,下一步的研究方向可以借鉴迁移学习的域自适应,构建深度迁移模型研究跨个体的驾驶压力识别。

(7)  表(5) 参考文献 (26)

目录

    /

    返回文章