De face. Neurorobot., 11 février 2021h

ttps://doi.org/10.3389/fnbot.2021.618408

à l’aide d’une fonction de base radiale de hiérarchie d’apprentissage à deux niveaux

Ziwu Ren1,

Rihui Li2

Bin Chen 

3

Hongmiao Zhang 

1

Yuliang Ma 

3

Chushan Wang 

4,

Ying-Lin5 et

Yingchun Zhang*

  • 1 Centre de robotique et de microsystèmes, Université Soochow, Suzhou, Chine
  • 2 Département de génie biomédical, Université de Houston, Houston, TX, États-Unis
  • 3 College of Automation, Intelligent Control & Robotics Institute, Hangzhou Dianzi University, Hangzhou, Chine
  • 4 Hôpital provincial de réadaptation en cas d’accident du travail du Guangdong, Guangzhou, Chine
  • 5 Département de génie industriel, Université de Houston, Houston, TX, États-Unis

La détection de la fatigue au volant basée sur l’électroencéphalographie (EEG) a récemment attiré une attention croissante en raison de la nature non invasive, peu coûteuse et potable de la technologie EEG, mais il est toujours difficile d’extraire des caractéristiques informatives des signaux EEG bruyants pour la détection de la fatigue au volant . Le réseau de neurones à fonction de base radiale (RBF) a attiré beaucoup d’attention en tant que classificateur prometteur en raison de sa structure de réseau linéaire dans les paramètres, de sa forte capacité d’approximation non linéaire et de la propriété de généralisation souhaitée. Les performances du réseau RBF dépendent fortement des paramètres réseau tels que le nombre de nœuds cachés, le nombre de vecteurs centraux, la largeur et les poids de sortie. Cependant, les méthodes d’optimisation globale qui optimisent directement tous les paramètres du réseau entraînent souvent un coût d’évaluation élevé et une convergence lente. Pour améliorer la précision et l’efficacité du modèle de détection de fatigue de conduite basé sur l’EEG, cette étude vise à développer un réseau RBF à hiérarchie d’apprentissage à deux niveaux (RBF-TLLH) qui permet une optimisation globale des paramètres clés du réseau. Des données expérimentales d’EEG ont été recueillies, à la fois dans des états de fatigue et d’alerte, auprès de six participants en bonne santé dans un environnement de conduite simulée. L’analyse en composantes principales a d’abord été utilisée pour extraire les caractéristiques des signaux EEG, et le RBF-TLLH proposé a ensuite été utilisé pour l’état de conduite (fatigue de six participants en bonne santé dans un environnement de conduite simulée. L’analyse en composantes principales a d’abord été utilisée pour extraire les caractéristiques des signaux EEG, et le RBF-TLLH proposé a ensuite été utilisé pour l’état de conduite (fatigue de six participants en bonne santé dans un environnement de conduite simulée. L’analyse en composantes principales a d’abord été utilisée pour extraire les caractéristiques des signaux EEG, et le RBF-TLLH proposé a ensuite été utilisé pour l’état de conduite (fatiguecontre _ alerte). Les résultats ont démontré que l’approche RBF-TLLH proposée obtenait de meilleures performances de classification (précision moyenne : 92,71 % ; aire sous la courbe de fonctionnement du récepteur : 0,9199) par rapport à d’autres réseaux de neurones artificiels largement utilisés. De plus, seuls trois paramètres de base doivent être déterminés à l’aide des ensembles de données d’apprentissage dans le classificateur RBF-TLLH proposé, ce qui augmente sa fiabilité et son applicabilité. Les résultats démontrent que l’approche RBF-TLLH proposée peut être utilisée comme cadre prometteur pour une détection fiable de la fatigue au volant basée sur l’EEG.

Introduction

La fatigue au volant est une préoccupation mentale et physique typique qui affaiblit la capacité du conducteur à contrôler le véhicule ( Li Z. et al., 2017 ). Cela représente non seulement un risque important de blessures et de décès pour les conducteurs, mais également des blessures pour les autres usagers de la route tels que les passagers, les motocyclistes, les autres conducteurs et les piétons. Selon les données statistiques rapportées par l’Organisation mondiale de la santé, plus de 1,3 million de personnes sont tuées chaque année dans des accidents de la route principalement dus à la fatigue au volant ( Sahayadhas et al., 2012 ; Li Z. et al., 2017 ). Par conséquent, il est très important d’étudier les caractéristiques de la fatigue de conduite et de développer un système de détection automatique de la fatigue de conduite avec des performances de détection fiables ( Li Z. et al., 2017Sikander et Anwar, 2019 ).

Les méthodes actuellement disponibles pour la détection de la fatigue au volant peuvent être classées en trois catégories ( Sikander et Anwar, 2019 ): (1) approche basée sur la psychologie qui repose généralement sur des questionnaires psychométriques pour évaluer le niveau de fatigue d’un individu ( Michielsen et al., 2004 ), (2) approche basée sur la vidéo qui surveille généralement l’état comportemental et physique du conducteur, comme les traits du visage, la position de la tête, le temps de réaction, les erreurs de direction, la déviation de voie, etc. ( Akerstedt et al., 2005 ; Hsieh et Tai, 2013 ), et (3) une approche physiologique qui utilise les biosignaux associés à la fatigue au volant, comme l’électrooculographie (EOG) pour mesurer le mouvement de l’œil ( Hu et Zheng, 2009 ;Picot et al., 2012 ), électrocardiographie (ECG) pour détecter la variabilité de la fréquence cardiaque ( Jung et al., 2014 ), électroencéphalographie (EEG) pour évaluer l’état du cerveau ( Huang et al., 2016 ; Ma et al., 2019 , 2020 ), et l’électromyographie (EMG) pour mesurer l’activité musculaire ( Sikander et Anwar, 2019 ). Parmi eux, la mesure psychologique autodéclarée prend du temps et est subjective car elle repose sur les réactions subjectives du conducteur viaquestionnaires, ce qui rend impossible et peu fiable la détection en temps réel. Les approches basées sur la vidéo sont vulnérables aux facteurs environnementaux, tels que la luminosité, les conditions météorologiques, l’état des routes et d’autres facteurs, qui pourraient entraîner de mauvaises performances de détection ( Jimenez-Pinto et Torres-Torriti, 2012 ). L’EOG, l’ECG, l’EMG de surface et l’EEG ont tous été explorés en tant que mesures physiologiques pour la détection de la fatigue au volant, avec des avantages et des inconvénients spécifiques les uns par rapport aux autres ( Sikander et Anwar, 2019). Les électrodes doivent être placées sur la surface du corps, ce qui rend le système de nature intrusive. Par exemple, les signaux EOG sont récupérés par des électrodes placées près de l’œil, ce qui peut gêner la conduite. L’ECG peut être mesuré de manière moins intrusive, mais les signaux ECG ont montré une forte variance inter-sujets, ce qui peut compliquer le développement d’un système générique de détection de la fatigue au volant. L’applicabilité de l’EMG de surface dans la détection de la fatigue de conduite en temps réel est limitée ( Sikander et Anwar, 2019 ). L’EEG a été considéré comme une modalité prometteuse pour la détection de la fatigue au volant, en raison de sa haute résolution temporelle, de sa grande portabilité et de sa bonne sensibilité à l’état cérébral ( O’Hanlon et Kelley, 1977 ; Nguyen et al., 2019 ; Gao et al., 2020). En particulier, l’EEG peut être utilisé pour mesurer de manière non invasive l’activité électrique neuronale de la surface du cuir chevelu afin de fournir une évaluation directe de l’état de fatigue cérébrale ( Zhao et al., 2017 ; Sikander et Anwar, 2019 ). Cependant, la récupération du signal EEG à travers plusieurs électrodes est très sensible au bruit provenant de facteurs externes, et il est essentiel d’extraire des caractéristiques informatives des signaux EEG bruyants pour une application réussie de détection de la fatigue au volant.

Les réseaux de neurones ont été utilisés comme des outils prometteurs pour extraire des caractéristiques informatives des signaux EEG en raison de leur parallélisme de calcul massif qui ressemble à la façon dont le cerveau traite l’information ( Masic et Pfurtscheller, 1993 ). Récemment, de nombreuses études ont mis en œuvre des systèmes de détection de la fatigue au volant basés sur l’EEG en utilisant des techniques de réseau de neurones. Vuckovic et al. ont proposé un modèle de classification de la vigilance et de la somnolence à partir d’enregistrements EEG sur des sujets sains arbitraires, dans lequel le réseau de neurones artificiels (RNA) a été utilisé comme classificateur automatique ( Vuckovic et al., 2002). Yang et al. ont présenté un modèle de classification de la fatigue au volant basé sur une technique de fusion d’informations et un réseau neuronal dynamique. Les résultats expérimentaux ont indiqué que les caractéristiques dérivées de l’EEG étaient capables de détecter l’état de fatigue d’un conducteur ( Yang et al., 2010 ). De plus, Aruna et al. ont proposé une méthode récurrente de réseau neuronal flou auto-évolutif pour la détection de la fatigue au volant, dans laquelle le coefficient de corrélation de l’attention du conducteur était classé pour détecter la fatigue au volant ( Aruna et Kalaivani, 2016 ). Chai et al. ont présenté une structure de réseau neuronal bayésien à trois couches pour la classification binaire de la fatigue au volant, où la modélisation autorégressive (RA) a été utilisée comme algorithme d’extraction de caractéristiques ( Chai et al., 2017b). De plus, Chai et al. ont également proposé un modèle amélioré de classification de la fatigue au volant basé sur l’EEG, où le modèle AR a été utilisé pour l’extraction de caractéristiques, et le réseau de croyance clairsemé-profond (DBN clairsemé) a été utilisé pour la classification ( Chai et al., 2017a ). Des études récentes ont également démontré que le réseau de neurones à fonction de base radiale (RBF) était un classificateur prometteur en raison de sa structure de réseau linéaire dans les paramètres, de sa forte capacité d’approximation non linéaire et de la propriété de généralisation souhaitée. Li et al . ont démontré que la méthode de classification basée sur la fonction de base radiale présente des avantages en termes de précision de classification pour la classification des crises d’épilepsie en comparant avec cinq autres classificateurs ( Li Y. et al., 2017 ; Li et al., 2019). La régression vectorielle de support basée sur le noyau RBF a également obtenu de meilleures performances dans la prédiction de la fatigue par rapport aux autres fonctions du noyau dans l’étude de Bose et al. (2019) . Les performances du réseau RBF dépendent fortement des paramètres réseau, qui doivent être optimisés globalement pour de meilleures performances. Les paramètres du réseau RBF peuvent être estimés à l’aide des méthodes d’optimisation globale existantes ( Petković et al., 2016 ; Aljarah et al., 2018 ). Malheureusement, en raison d’un nombre relativement important de paramètres de réseau qui doivent être optimisés, les méthodes d’optimisation globale existantes présentent un coût de calcul élevé et une convergence lente et conduisent en outre à une faible précision de classification et à une faible efficacité du réseau RBF.

Dans cette étude, un réseau RBF à hiérarchie d’apprentissage à deux niveaux (RBF-TLLH) est développé pour améliorer les performances de la classification RBF. Dans le RBF-TLLH proposé, seuls trois paramètres de réseau RBF clés doivent être optimisés et, en tant que tels, peuvent être facilement optimisés globalement et efficacement. Plus précisément, le RBF-TLLH est construit en utilisant l’algorithme ROLS + D-opt, qui combine les moindres carrés orthogonaux régularisés (ROLS) et le plan expérimental d’optimalité D (D-opt) au niveau inférieur et l’optimisation de l’essaim de particules ( PSO) au niveau supérieur. L’algorithme PSO est utilisé pour optimiser globalement les trois paramètres de base de l’algorithme ROLS+D-opt afin d’améliorer les performances de classification. Comme les signaux EEG sont généralement mesurés avec plusieurs canaux à un taux d’échantillonnage élevé, l’analyse en composantes principales (PCA) (Hotelling, 1933 ) est utilisé pour réduire la dimensionnalité de l’espace de données d’origine ( Lever et al., 2017 ; Artoni et al., 2018 ) avant l’application du RBF-TLLH. Les performances de l’approche proposée sont évaluées sur la détection de la fatigue au volant et comparées à plusieurs réseaux de neurones artificiels largement utilisés, notamment le réseau de neurones artificiels basé sur la rétropropagation (BP), le réseau de neurones artificiels basé sur le PSO et le réseau RBF basé sur l’algorithme d’apprentissage ROLS+D-opt.

Matériaux et méthodes

Étudier le design

La structure globale du cadre de classification de la fatigue basé sur l’EEG proposé est illustrée à la figure 1 , qui se compose de cinq étapes : (1) collecte de données EEG dans un environnement de conduite simulé, (2) prétraitement et segmentation des données brutes, (3) réduction de la dimensionnalité et extraction de caractéristiques à l’aide de l’ACP ; (4) classification à l’aide du réseau RBF et (5) évaluation des performances.Figure 1

FIGURE 1 . Illustration schématique du réseau de fonctions à base radiale de la hiérarchie d’apprentissage à deux niveaux.

Participants et acquisition de données EEG

Les données EEG utilisées dans cette étude ont été recueillies auprès de six volontaires sains de sexe masculin (droitiers, âgés de 23 à 27 ans). Tous les volontaires avaient des permis de conduire valides et aucun participant n’avait d’antécédents de troubles physiques ou psychologiques. L’étude a été approuvée par le comité d’éthique local (Guangdong Provincial Work Injury Rehabilitation Center, Chine) et réalisée conformément à la Déclaration d’Helsinki. Chaque sujet a été pleinement informé du but de la recherche et a fourni un consentement éclairé écrit avant le début de l’expérience.

Un système de simulation de conduite (Shanghai Infrared Automobile Simulator Driving Equipment Co., Ltd., Chine) a été utilisé pour imiter un environnement de conduite réel pendant l’expérience. Comme le montre la figure 2 , le système de simulation de conduite comprend des simulations d’embrayages, de freins, d’accélérateurs et de scènes qui se composent de trois grands écrans et d’un logiciel de simulation hautes performances. Ce système peut imiter l’expérience de conduite réelle, comme l’évolution du trafic environnant. Les signaux EEG ont été enregistrés à l’aide d’un système d’acquisition EEG à 32 canaux (Brain Products GmbH, Allemagne), avec un taux d’échantillonnage de 500 Hz. Des électrodes EEG ont été placées sur le cuir chevelu selon le système standard international 10–20.Figure 2

FIGURE 2 . Le système de simulation de conduite et le dispositif d’acquisition EEG.

Avant le début de l’expérience, tous les participants ont été autorisés à pratiquer et à se familiariser avec le système de simulation de conduite. Les données EEG ont ensuite été recueillies pour deux états, alerte (non-fatigue) et fatigue. Pour collecter les données d’alerte, tous les sujets devaient maintenir un sommeil adéquat et naturel pendant environ 8 h pendant la nuit précédant l’expérience. Les données EEG ont été recueillies à 9 h le lendemain pendant environ 30 à 60 min pendant que les sujets exécutaient la tâche de simulation de conduite. Pour l’enregistrement des données d’alerte, le chemin a été tracé relativement compliqué pour éviter la somnolence des sujets. D’autre part, pour collecter les données de fatigue, tous les sujets ont été invités à dormir seulement 4 h pendant la nuit précédant l’expérience. Les données EEG ont également été enregistrées à 9 h pendant 30 à 60 min lorsque les sujets conduisaient dans l’environnement de simulation. L’expérience a été réalisée dans un laboratoire calme et non perturbé avec des températures ambiantes d’environ 22°C. Afin d’atteindre rapidement l’état de fatigue lors de la collecte de données sur la fatigue, une route longue et droite avec très peu de piétons a été utilisée dans l’environnement simulé. Pendant l’enregistrement des données, un observateur était assis à 2 m à côté du sujet et surveillait le comportement du sujet sans causer aucune perturbation au sujet. L’observateur décidait si le sujet était dans un état de fatigue ou dans un état d’alerte en observant les signes de somnolence du sujet (plus de 2 s de fermeture des yeux et de hochements de tête, grande déviation de la route). L’enregistrement des données EEG s’est terminé 30 minutes après que le sujet ait commencé à montrer des symptômes de fatigue.

Prétraitement et segmentation des données

Dans cette étude, des signaux EEG de 20 minutes dans chaque état (alerte ou fatigue) ont été collectés sur chaque sujet, et toutes les analyses de données ont été mises en œuvre dans un environnement MATLAB (2014a, MathWorks, Natick, Massachusetts). Les données EEG enregistrées ont d’abord été sous-échantillonnées de 500 à 200 Hz, et un filtrage passe-bande Butterworth de quatrième ordre (1 à 45 Hz) a ensuite été appliqué pour éliminer les artefacts tels que la dérive lente, le bruit à haute fréquence et la ligne électrique. ingérence. Les données EEG prétraitées de 20 minutes (1 200 s) pour chaque état ont ensuite été segmentées en appliquant une fenêtre temporelle de 10 s, ce qui a donné 120 échantillons pour chaque état (fatigue ou alerte). Il convient de noter que, dans cette étude, chaque échantillon est une forme matricielle à deux dimensions (32 canaux × 2 000 points). Ainsi, avec les six participants, un total de 1, 440 échantillons (720 échantillons pour l’alerte et 720 échantillons pour la fatigue) ont été formés pour l’extraction et la classification des caractéristiques. Pour chaque participant, le total de 240 échantillons a été divisé en l’ensemble de données d’entraînement avec 200 échantillons et l’ensemble de données de validation avec les 40 échantillons restants, où les échantillons EEG de fatigue et d’état d’alerte ont été répartis de manière égale. De plus, une validation croisée de 6 fois a été utilisée pour l’évaluation des performances.

Extraction de caractéristiques

Pour extraire les caractéristiques représentatives des grandes quantités de données EEG, la réduction de la dimensionnalité est d’abord effectuée pour réduire les dépenses de calcul et l’erreur de classification. L’ACP est une méthode non supervisée efficace et flexible pour la réduction de la dimensionnalité des données ( Hotelling, 1933 ). Pour un échantillon EEG donné ( m 32 canaux × 2 000 points), l’ACP transforme les données de l’échantillon dans un espace de dimension inférieure par le biais d’une projection orthogonale ou d’une transformation des points corrélés en variables de données non corrélées, appelées composantes principales (PC) ( Lever et al., 2017 ; Artoni et al., 2018 ). En fonction du taux de cotisation cumulatif prédéterminé, le premier rles composants avec les variances les plus importantes sont conservés. Le nombre préservé de PCs, r , est un paramètre important dans PCA. Dans cette étude, différentes valeurs r ont été testées à travers plusieurs essais, et les résultats ont montré que les 10 premiers PC représentaient plus de 80 % (le taux de contribution cumulé minimum est jusqu’à 82,13 %) de la variance totale des signaux d’origine pour tous Échantillons EEG. Par conséquent, les 10 premiers PC ont été conservés et l’échantillon EEG d’origine d’une taille de 32 sur 2 000 a été transformé en une matrice de dimension inférieure d’une taille de 32 sur 10. Ces échantillons de dimension inférieure ont été utilisés pour construire la classification de la fatigue au volant. maquette.

Modèle de classement

Un réseau RBF est un réseau neuronal prédictif à couche cachée unique qui est généralement contrôlé par plusieurs paramètres clés, notamment les vecteurs centraux, la largeur de la fonction de base et les poids de connexion des nœuds cachés à la sortie du réseau. Un réseau RBF avec n nœuds cachés et une seule sortie est illustré à la figure 3 , où les caractéristiques d’entrée sont d’abord transformées en nœuds cachés via n fonctions de base gaussiennes avec une largeur uniforme et différents vecteurs centraux. Les nœuds cachés sont en outre agrégés pour prédire la sortie du réseau via des poids de connexion. En désignant le vecteur d’entrée par x et la sortie par ỹ ) , le réseau RBF pourrait être représenté par :

ỹ ( x ) =∑je = 1nθjeexp ( -| | x- _cje| |2/ ρ )    ( 1 )ỹ(x)=∑i=1nθiexp(-||x-ci||2/ρ)    (1)

où i ( i = 1, ⋯ , n ) sont les vecteurs centraux, ρ est la largeur des fonctions de base gaussiennes, θ i ( i = 1, ⋯ , n ) sont les poids et ||·|| est la norme euclidienne.Figure 3

ILLUSTRATION 3 . Réseau de fonctions à base radiale pour le modèle de classification de la fatigue au volant basé sur l’EEG.

Algorithme d’apprentissage intégré ROLS+D-opt

Afin de construire un modèle avec de bonnes performances, dans cette étude, nous adoptons un algorithme d’apprentissage intégré (ROLS + D-opt) pour former le modèle en combinant les moindres carrés orthogonaux régularisés et le plan expérimental D-optimal. Les techniques de régularisation ROLS améliorent les propriétés de généralisation, et le plan expérimental de D-optimalité améliore encore l’efficacité et la robustesse du modèle ( Hong et Harris, 2002 ; Chen et al., 2003 ). En désignant l’entrée et la sortie du k ème échantillon par x ( k ) et y ( k ), respectivement, un ensemble d’apprentissage de N échantillons pourrait être représenté par{ y( k ) , x ( k ) }Nk = 1{y(k),x(k)}k=1N. Pour formuler le réseau comme un problème linéaire dans les paramètres, chaque entrée d’échantillon est considérée comme un centre candidat dans RBF, c’est-à-dire, i = x ( i ), i = 1, …, N . Par conséquent, le i ème nœud caché sur le k ème échantillon, noté ϕ i ( k ), pourrait être représenté parϕje( k ) = e X p ( -| | X ( k ) – X ( je ) ||2ρ)ϕi(k)=exp(-||x(k)-x(i)||2ρ). La sortie souhaitée y ( k ) peut être exprimée comme

y( k ) = ỹ ( k ) + e ( k ) =∑je = 1Nθjeϕje( k ) + e ( k ) 1 ≤ k ≤ N    ( 2 )y(k)=ỹ(k)+e(k)=∑i=1Nθiϕi(k)+e(k)1≤k≤N    (2)

où e ( k ) est l’erreur entre y ( k ) et la sortie réelle du réseau ỹ( k ), θ i sont les poids de sortie et N est le nombre d’échantillons dans l’ensemble de données d’apprentissage. L’algorithme d’apprentissage ROLS+D-opt intégré transforme d’abord le modèle (2) en une forme matricielle et effectue une décomposition orthogonale sur la matrice de régression, qui décompose la matrice de régression en une matrice avec des colonnes orthogonales et une matrice triangulaire supérieure. Plus précisément, le modèle de régression dans (2) peut être décrit comme :

y =Φθ+ e = W UNE θ+ e = W g + e    ( 3 )y=Φθ+e=WAθ+e=Wg+e    (3)

où y est le vecteur de sortie, Φ est la matrice de régression, θ est le vecteur de pondération et e est le vecteur d’erreur. La matrice de régression Φ pourrait être décomposée en deux matrices, W et A , où W = w1 , ⋯ , wN ] a des colonnes orthogonales qui satisfontwJjewj=0 ( je , j=1 ,⋯,N) wTwj=0(je,j=1,⋯,N)pour i ≠ j , et A est une matrice triangulaire supérieure à éléments diagonaux unitaires. La matrice triangulaire supérieure multiplie encore le vecteur de poids pour construire un vecteur de poids orthogonal, c’est-à-dire,g=[g1,⋯,gN]J =Aθ g=[g1,⋯,GN]T=Aθ. Ensuite, l’algorithme d’apprentissage ROLS+D-opt intégré effectue une procédure de sélection directe de sous-ensemble à partir du modèle de régression complet, qui est basé sur le critère de minimisation suivant (Chen et al., 2003 ) :

JCR( g, λ , β) =JR( g, λ ) + β∑je = 1N− journal (wJjewje) =eJe +λgJg +                          β∑je = 1N− journal (wJjewje)( 4 )JCR(g,λ,β)=JR(g,λ)+β∑je=1N-Journal(wjeJwje)=eJe+λgJg+                          β∑je=1N-Journal(wjeJwje)    (4)

oùJR( g, λ ) =eJe +λgJgJR(g,λ)=eJe+λgJgest le critère d’erreur régularisé, λ ≥ 0 est un paramètre de régularisation et β est une petite pondération positive fixe pour le coût de D-optimalité. Le taux de réduction d’erreur est défini comme suit :

[ c r e r r ]je= ( (wJjewje+ λ )g2je+ βjournal (wJjewje) ) /yJy( 5 )[crerr]je=((wjeJwje+λ)gje2+βJournal(wjeJwje))/yJy    (5)

Sur la base du ratio dans (5), les régresseurs significatifs sont sélectionnés dans une procédure de régression directe, et la procédure de sélection est terminée lorsque ( Chen et al., 2003 ) :

[ c r e r r ]je≤ 0 , fou _ ns+ 1 ≤ l ≤ N( 6 )[crerr]je≤0,For ns+1≤je≤N    (6)

Hiérarchie d’apprentissage à deux niveaux Algorithme d’apprentissage en réseau RBF

Dans l’algorithme d’apprentissage ROLS+D-opt intégré, tous les centres candidats du réseau sont choisis parmi les vecteurs d’entrée des échantillons d’apprentissage, et les poids de sortie θ i dans (1) peuvent être obtenus par un algorithme d’apprentissage linéaire ( Chen et al., 2003 ). Par conséquent, seuls la largeur uniforme ρ , le paramètre de régularisation λ et le paramètre de pondération D-optimalité β doivent être déterminés dans l’algorithme ROLS + D-opt. Le choix de ces trois paramètres a une grande influence sur les performances du réseau RBF ( Hong et al., 2003Chen et al., 2009 ). Une méthode d’optimisation globale est nécessaire pour déterminer la combinaison optimale de ces trois paramètres.

Un schéma de hiérarchie d’apprentissage à deux niveaux (TLLH) est proposé en combinant les algorithmes PSO et ROLS + D-opt pour former le réseau RBF, comme le montre la figure 4. Avec les valeurs de la fonction de fitness données au niveau inférieur, PSO (Kennedy et Eberhart, 1995Shi et Eberhart, 1995 ) est utilisé pour apprendre la largeur ρ, le paramètre de régularisation λ et le paramètre de pondération D-optimalité β de l’algorithme intégré (ROLS +D-opt) au niveau supérieur, tandis que le niveau inférieur consiste en p algorithme d’apprentissage intégré parallèle ROLS+D-opt pour chaque ensemble de paramètres, [λ, ρ, β], fourni par le PSO. p est la taille de l’essaim du PSO, c’est-à-dire qu’il y a pparticules dans l’algorithme PSO. PSO, comme une méthode d’optimisation intelligente en essaim, a la caractéristique du calcul parallèle. Dans cette étude, tous les échantillons EEG sont divisés en un ensemble d’apprentissage et un ensemble de validation. Le i -ème algorithme ROLS + D-opt construit un réseau RBF en utilisant l’ensemble de données d’apprentissage avec une particule donnée [λ i, ρ i, β i ] et l’erreur quadratique moyenne (MSE) sur l’ensemble de validation du RBF résultant modèle est défini comme la fonction de fitness de l’algorithme PSO :

min f( K) =1nc∑k = 1nc( y( X ( k ) )-ỹ ( X ( k ) ) )2( 7 )minF(K)=1nc∑k=1nc(y(X(k))-ỹ(X(k)))2    (sept)

où K = [λ i, ρ i, β i ] représente la particule, y ( x ( k ) est la sortie souhaitée de l’échantillon de validation, ỹ( x ( k )) est la sortie réelle du réseau et c est la taille de l’ensemble de validation Plus la valeur de fitness est petite, meilleures sont les performances de généralisation du réseau ( Chen et al., 19992008 ).

La complexité de calcul de ce schéma TLLH est déterminée par le nombre total d’évaluations de fonctions au niveau supérieur. En supposant que la taille de l’essaim du PSO est p, la génération évolutive est T, et la complexité de l’algorithme ROLS+ D-opt est ROLS+D−opt. Ensuite, la complexité du schéma TLLH est

CTLLH= p × T×CROLS + D − opter    ( 8 )CTLLH=p×T×CROLS+D-opt    (8)

puisque le PSO n’est utilisé que pour optimiser trois paramètres de l’algorithme d’apprentissage ROLS+D-opt intégré, et le niveau inférieur présente un problème d’apprentissage linéaire. L’exigence de calcul globale de ce schéma est beaucoup plus petite que celle du schéma où un PSO est directement utilisé pour déterminer la structure du réseau RBF ainsi que pour apprendre tous les paramètres du réseau ( Billings et Zheng, 1995 ).Figure 4

ILLUSTRATION 4 . L’architecture de la hiérarchie d’apprentissage à deux niveaux dans les réseaux de fonctions à base radiale.

Évaluation des performances

Pour évaluer les performances de l’approche proposée, le RBF-TLLH proposé a été appliqué à l’ensemble de données de classification de la fatigue au volant et comparé aux modèles de réseau de neurones de pointe, y compris le RBF basé sur l’algorithme ROLS + D-opt ( RBF-ROLS+D-opt) ( Chen et al., 2003 ), ANN avant à trois couches avec rétropropagation (ANN-BP) ( Zaw et al., 2019 ; Zhang et Pu, 2020 ) et trois couches ANN avant avec optimisation PSO (ANN-PSO) ( Li et Liu, 2016 ). Le RBF basé sur l’algorithme ROLS+D-opt (RBF-ROLS+D-opt) a été largement utilisé en raison de sa robustesse, de la rareté des paramètres et de la facilité de mise en œuvre ( Chen et al., 2003). ANN-BP a la capacité d’approximer la fonction non linéaire avec une précision arbitraire ; par conséquent, il a été largement appliqué à divers problèmes de classification ( Zaw et al., 2019 ; Zhang et Pu, 2020 ). L’ANN avant à trois couches avec optimisation PSO (ANN-PSO) est également largement utilisé en raison de ses avantages tels qu’une mise en œuvre facile, moins de paramètres d’ajustement et une convergence rapide ( Li et Liu, 2016). Les poids et seuils initiaux sont générés de manière aléatoire dans l’intervalle [−1, 1] dans l’ANN-BP, l’époque maximale est fixée à 1 000 et le taux d’apprentissage est de 0,01. La MSE de l’ensemble de données d’apprentissage est minimisée en tant que fonction objectif dans l’ANN-PSO. La plage des paramètres variables est définie sur [−1, 1], la taille de l’essaim est définie sur 30 et les itérations évolutives sont définies sur 60. Selon la formule empirique, les nœuds cachés de ces deux classificateurs ANN sont tous deux définis sur 30. De plus, afin d’éviter le sur-ajustement ou le sur-entraînement dans le réseau ANN, une stratégie d’arrêt précoce basée sur la validation est utilisée pour sélectionner les meilleurs paramètres d’entraînement. Figure 5montre la courbe MSE de l’ensemble d’apprentissage et de l’ensemble de validation pour la classification. On peut voir que le meilleur numéro d’itération de l’ANN-BP est 79, et le meilleur numéro d’itération de l’ANN-PSO est 43, pour ce résultat d’apprentissage, selon la courbe MSE de l’ensemble de validation.Figure 5

ILLUSTRATION 5 . Erreur quadratique moyenne (MSE) de l’ensemble d’apprentissage et de validation pour l’arrêt précoce du classifieur. (A) Formation et validation MSE de réseau de neurones artificiels (ANN)-rétro-propagation. (B) Formation et validation MSE de l’optimisation des essaims de particules ANN.

La technique de régularisation est employée dans la fonction de critère (4) dans le TLLH-RBF proposé pour éviter le problème de sur-ajustement et améliorer la précision de la classification du réseau RBF. Le coût d’optimalité D est introduit pour améliorer encore l’efficacité et la robustesse du modèle de sous-ensemble sélectionné. Les paramètres, y compris la largeur RBF, le paramètre de régularisation et le paramètre de pondération D-optimalité, sont respectivement définis dans la plage ρ ∈ [1, 220], λ ∈ [ 10−7 , 1] et β ∈ [ 10− 7 , 1], et optimisé à l’aide du PSO. La taille de l’essaim pde PSO est fixé à 15 et le nombre d’itérations évolutives est fixé à 30. Pour une comparaison plus approfondie, un autre classificateur de réseau RBF basé sur l’algorithme ROLS + D-opt est également conçu, où les paramètres de largeur et D-optimalité sont déterminés comme ρ = 110 et β = 10−4 , respectivement, par la méthode des essais et erreurs, alors que le paramètre de régularisation λ est estimé par l’approche bayésienne (MacKayi, 1992 ; Chen et al., 1996 ).

Les résultats de classification obtenus par les quatre modèles de réseaux neuronaux susmentionnés ont été comparés les uns aux autres. Dans tous ces modèles de classification, lorsque la sortie réelle du réseau est > 0,5, le modèle la classe comme 1 (état de fatigue) ; sinon, le modèle le classe comme 0 (état d’alerte). Tous les échantillons sont d’abord normalisés avant que l’ANN ne soit formé pour éviter que les poids ANN ne soient trop grands.

Résultats

Le tableau 1 résume la précision de la classification dans la détection de la fatigue au volant telle qu’obtenue par les quatre modèles de classification utilisant une validation croisée de 6 fois pour chaque sujet. Les résultats montrent que le classificateur RBF-TLLH atteint la plus grande précision pour tous les sujets dans la classification de la fatigue par rapport aux états d’alerte, avec une valeur moyenne de 92,71 ± 6,26 %. Dans l’ensemble, les classificateurs ANN obtiennent une précision de classification inférieure à celle des classificateurs basés sur RBF. Le test t apparié a été utilisé pour la comparaison statistique, comme le montre la figure 6, montrant que le classificateur RBF-TLLH proposé surpasse de manière significative les deux autres classificateurs ANN (p< 0,05) alors que le RBF basé sur ROLS + D-opt ne le fait pas. Bien qu’aucune différence significative ne soit observée entre ces deux classificateurs différents basés sur RBF, le RBF-TLLH atteint une plus grande précision et produit une variance plus faible que le réseau RBF ROLS + D-opt, ce qui suggère que le RBF-TLLH proposé est plus précis et robuste. classificateur dans la détection de fatigue de conduite EEG dans ces deux classificateurs basés sur RBF.Tableau 1

TABLEAU 1. Précision moyenne (%) de la validation croisée 6 fois pour chaque sujet en utilisant différents classificateurs.Figure 6

ILLUSTRATION 6. Diagramme à barres des précisions moyennes lors de l’utilisation de différents classificateurs. *significativement différent du contrôle ( p < 0,05) ; **significativement différent du contrôle ( p < 0,005).

Pour évaluer plus en détail les performances de classification du RBF-TLLH proposé, six mesures comprenant le vrai positif (TP), le vrai négatif (TN), le faux positif (FP), le faux négatif (FN), la spécificité/le taux de vrai négatif [TNR = TN /(TN + FP)], et la sensibilité/taux de vrais positifs [TPR = TP/(TP + FN)] (Chai et al., 2017a ,b ), sont calculés à partir de tous les sujets et résumés dans le tableau 2. Comparé aux modèles ANN-BP et ANN-PSO, le modèle de réseau RBF-TLLH présente les meilleures performances quelles que soient la spécificité, la sensibilité et la précision. De plus, le modèle RBF-TLLH surpasse de manière significative le modèle RBF basé sur ROLS + D-opt en termes de sensibilité, démontrant la supériorité de l’approche proposée pour détecter la fatigue au volant. Comparé au RBF basé sur ROLS + D-opt, le modèle RBF-TLLH proposé atteint une spécificité légèrement inférieure, mais une précision et une sensibilité beaucoup plus élevées.Tableau 2

TABLEAU 2. Résultats de la classification de l’étatdefatiguevs. état d’alerte pour le jeu de validation.

L’analyse de la courbe des caractéristiques de fonctionnement du récepteur (ROC) est également effectuée et les résultats sont résumés à la Figure 7. La courbe ROC est un tracé de TPR par rapport au taux de faux positifs (spécificité FPR/1) en faisant varier différents rapports de seuil en tant que variable de balayage. Un modèle de classification aléatoire devrait montrer une ligne droite reliant (0, 0) à (1, 1) (ligne diagonale tiret-point sur la figure 7 ). Toute courbe ROC située dans le triangle inférieur droit indique que le classifieur est pire que la supposition aléatoire, tandis que la courbe ROC située dans le triangle supérieur gauche indique que le modèle fonctionne mieux que la supposition aléatoire (Fawcett, 2006Chai et al. , 2017b). L’aire sous la courbe (AUC) de la courbe ROC est ensuite calculée pour évaluer les performances du modèle. Comme le montre la figure 7, le RBF-TLLH proposé atteint la meilleure courbe ROC en haut à gauche et donne la valeur AUC la plus élevée (0,9199) parmi tous les classificateurs, démontrant les meilleures performances dans la détection de la fatigue au volant.Figure 7

ILLUSTRATION 7. Tracé des caractéristiques de fonctionnement du récepteur avec les valeurs d’aire sous la courbe pour différents modèles de classification : (1) réseau de neurones artificiels (ANN) utilisant l’algorithme de rétropropagation, (2) ANN utilisant l’optimisation de l’essaim de particules, (3) réseau de fonction de base radiale (RBF) utilisant Algorithme ROLS + D-opt et (4) réseau RBF utilisant la méthode de hiérarchie d’apprentissage à deux niveaux.

Discussion

L’EEG présente les avantages d’être non invasif et d’avoir une résolution temporelle élevée pour la mesure de l’activité cérébrale et a été largement considéré comme un bon indicateur de la transition entre les états d’alerte et de fatigue. La densité spectrale de puissance (PSD), qui convertit le domaine temporel des données EEG dans le domaine fréquentiel, a été largement utilisée dans les études traditionnelles de détection de fatigue basées sur l’EEG. Les signaux EEG peuvent alors être généralement divisés en cinq bandes, à savoir Delta (0,5–4 Hz), Theta (4–8 Hz), Alpha (8–13 Hz), Beta (13–30 Hz) et Gamma (30– 42 Hz), selon les caractéristiques de fréquence et d’amplitude ( Sikander et Anwar, 2019 ). Il a été constaté que l’augmentation des fuseaux de la bande alpha de l’EEG est associée à l’état de fatigue lorsque les participants se produisent dans l’environnement de conduite monotone réel (Simon et al., 2011 ). Il a également été démontré que l’EEG est sensible aux fluctuations de la vigilance et qu’il prédit la dégradation des performances due à une charge mentale soutenue. Lors de la tâche de conduite monotone, les bouffées EEG alpha seront dominantes dans les canaux EEG central et postérieur, ce qui est un signal de somnolence et de vigilance réduite ( Simon et al., 2011 ).

En prenant le sujet 1 et le sujet 3 comme exemples, la figure 8 montre les distributions PSD des bandes d’ondes alpha (8–13 Hz) et entières (1–45 Hz) des deux états (alerte et fatigue), respectivement. On peut observer que les distributions de PSD entre les états d’alerte et de fatigue montrent une différence caractéristique apparente. La différence de PSD entre les états d’alerte et de fatigue du sujet 3 est également plus significative par rapport aux distributions de PSD du sujet 1. Ceci est cohérent avec les résultats du tableau1lors de l’utilisation du classificateur RBF-TLLH, c’est-à-dire que la précision de classification moyenne obtenue dans le sujet 3 (100 %) est supérieure à celle obtenue dans le sujet 1 (89,58 %). De plus, en ce qui concerne les distributions PSD des sujets pendant l’état de fatigue, la bande alpha des signaux EEG transporte la majorité des informations parmi l’ensemble des distributions PSD. Ces résultats confirment que l’EEG présente une différence distincte de caractéristiques entre les états d’alerte et de fatigue, démontrant la faisabilité de l’utilisation de l’EEG comme approche efficace pour détecter la fatigue au volant.Figure 8

ILLUSTRATION 8. Distributions de densité spectrale de puissance (PSD) des signaux EEG pour les sujets 1 et 3.(A) Distributions PSD de la bande alpha des signaux EEG dans l’état d’alerte (a1) et dans l’état de fatigue (a2). Distributions PSD de la bande entière des signaux EEG en état d’alerte (a3) ​​et en état de fatigue (a4) pour le sujet 1. (B) Distributions PSD de la bande alpha des signaux EEG en état d’alerte (b1) et en état de fatigue (b2). Distributions PSD de toute la bande des signaux EEG dans l’état d’alerte (b3) et dans l’état de fatigue (b4) pour le sujet 3.

Bien que les signaux EEG fournissent des caractéristiques distinctes associées aux états d’alerte et de fatigue du cerveau, il est toujours nécessaire et critique de développer un classificateur performant afin de surveiller l’altération de l’état du cerveau pendant la conduite. Des études ont démontré que le réseau neuronal RBF est un classificateur prometteur en raison de sa structure de réseau linéaire dans les paramètres, de sa forte capacité d’approximation non linéaire et de sa propriété de généralisation nécessaire (Li Y. et al., 2017Bose et al., 2019Li et al., 2019). Les performances du réseau RBF dépendent fortement du nombre de nœuds cachés, des vecteurs considérables et des poids de sortie. Ces paramètres peuvent être informés à l’aide de certaines méthodes d’optimisation globale ; Cependant, l’optimisation directe de tous les paramètres à l’aide de l’algorithme d’optimisation globale est entraînée par le coût d’évaluation élevé et la convergence lente. Cette étude vise à améliorer les performances du modèle de classification de la fatigue au volant basé sur l’EEG en utilisant un réseau RBF à hiérarchie d’apprentissage à deux niveaux (RBF-TLLH). Le RBF-TLLH est intégré en intégrant l’algorithme ROLS+D-opt, qui combine les moindres carrés orthogonaux régularisés et le plan expérimental de D-optimalité au niveau inférieur et le PSO au niveau supérieur.

Au niveau inférieur du RBF-TLLH, l’algorithme d’apprentissage ROLS + D-opt est utilisé. Avec l’algorithme d’apprentissage ROLS + D-opt, tous les centres candidats du réseau RBF sont choisis parmi les vecteurs d’entrée des échantillons d’apprentissage, et les poids de sortie dans (1) peuvent être obtenus par un algorithme d’apprentissage linéaire (Chen et al., 2003 ). De plus, toute la procédure de construction du modèle de réseau RBF se termine automatiquement lorsque la condition (6) est atteinte. Par conséquent, il ne reste que trois paramètres dans l’algorithme ROLS + D-opt, à savoir la largeur uniforme, le paramètre de régularisation et le paramètre de pondération D-optimalité, à déterminer. Au niveau supérieur du RBF-TLLH, le PSO est utilisé. PSO est généralement caractérisé comme un algorithme avec un concept simple, une mise en œuvre facile et une bonne efficacité de calcul(Kennedy et Eberhart, 1995Shi et Eberhart, 1995 ). En tant que méthode d’optimisation intelligente en essaim, PSO a la caractéristique d’un calcul parallèle. Par conséquent, PSO est utilisé pour optimiser les trois paramètres de base de l’algorithme ROLS + D-opt au niveau supérieur, tandis que l’algorithme ROLS + D-opt construit automatiquement des réseaux RBF au niveau inférieur pour améliorer les performances de classification. Comme le montrent les tableaux 12, le réseau RBF obtenu à partir de la hiérarchie d’apprentissage proposée a démontré ses performances supérieures avec une précision de classification moyenne de 92,71 % et une valeur AUC-ROC de 0,9199 par rapport à d’autres méthodes, ce qui en fait un candidat prometteur pour la fatigue au volant. détection à l’avenir.

Les données expérimentales EEG ont été recueillies chez six sujets sains dans un environnement de conduite simulée et ont été utilisées pour évaluer les performances de l’algorithme RBF-TLLH proposé en le comparant à trois autres classificateurs. Les résultats montrent que le RBF-TLLH proposé permet d’obtenir une augmentation substantielle de la précision de la classification par rapport aux autres approches. En particulier, la sensibilité du modèle RBF-TLLH proposé est beaucoup plus élevée que les trois autres méthodes. Les performances de haute sensibilité suggèrent que le système de détection de fatigue de conduite basé sur RBF-TLLH est plus sensible dans la détection des états de fatigue, ce qui est essentiel pour assurer une conduite sûre.

Il convient de noter qu’avant la classification à l’aide de la méthode RBF-TLLH, l’ACP est nécessairement adoptée pour atténuer le problème de haute dimension des signaux EEG multicanaux. Dans cette étude, la méthode PCA a été appliquée pour la réduction de la dimensionnalité des signaux EEG, et les 10 premiers PC de chaque canal ont été sélectionnés pour obtenir une meilleure puissance de détection de la fatigue au volant. Apparemment, le nombre de PC conservés affecterait les performances de l’extraction des caractéristiques, ce qui affecterait davantage les performances du modèle de détection de la fatigue de conduite. Ce nombre de PC préservés est déterminé sur la base de calculs d’essais multiples pour s’assurer que les PC préservés représentent plus de 80 % de la variance totale des signaux d’origine.

Les performances de classification du réseau de neurones sont directement liées à sa structure de réseau et à ses poids. Pour le classificateur ANN, l’ANN avant à trois couches est formé avec 320 nœuds d’entrée, 30 nœuds cachés et un nœud de sortie, ce qui donne 9 661 paramètres de poids et de seuil à optimiser. Il est généralement très difficile de traiter un tel problème d’optimisation de grande dimension pour l’algorithme de rétropropagation (BP) principalement parce que l’algorithme BP basé sur le gradient est sensible aux paramètres initiaux et facilement piégé dans le problème des minima locaux ( McLoone et al., 1998). Le phénomène prématuré et de stagnation se produira également au cours de la dernière étape de l’évolution lorsque le PSO résoudra ce problème complexe. Ces lacunes entraînent finalement la mauvaise performance du classificateur basé sur ANN pour classer la fatigue au volant.

L’efficacité du calcul est également attribuée dans cette étude pour tester la efficacité de l’application du classificateur RBF-TLLH proposée dans la détection de la fatigue au volant en temps réel. Pendant le processus de classification en temps réel, sur la base des caractéristiques obtenues et des paramètres du réseau RBF pour le système de détection, le classificateur peut déterminer rapidement le résultat de la détection de la fatigue au volant grâce à l’équation (1) . Les résultats des tests ont montré que le temps d’exécution n’est que d’environ 0,011 s dans un environnement MATLAB [un processeur Intel(R) Core(TM) i7-4500U à 1,8 GHz, 8 Go de RAM]. Cela s’explique par le fait qu’il n’est pas nécessaire de réentraîner le classificateur pour l’opération de classification en temps réel. Plus précisément,

Malgré les améliorations obtenues dans cette étude, il existe des limites qui peuvent être évoquées dans les études futures. Seuls six sujets ont participé à l’expérience de simulation de la fatigue au volant, de sorte que la taille de l’échantillon de cette étude est faible. Nos efforts futurs seront attribués à la collecte d’un plus grand nombre d’échantillons provenant de tests de fatigue de conduite simulée ou réels afin d’évaluer plus en détail les performances du RBF-TLLH proposées dans la détection de la fatigue de conduite. En outre, les modèles de réseaux neuronaux profonds ont suscité une attention croissante ces dernières années en raison de leur puissante capacité d’ajustement non linéaire, de leur capacité de traitement de données de grande dimension, de leur grande tolérance aux pannes et de leur forte capacité d’extraction de caractéristiques. Le RBF-TLLH proposé sera comparé à des modèles de réseaux neuronaux profonds, tels que le LSTM, afin d’améliorer plus précisément ses performances dans la détection de la fatigue au volant. En outre, des recherches récentes sur l’analyse latente ont prouvé sa puissance dans l’extraction de caractéristiques, et cette méthode sera utilisée dans une étude future(Wu et al., 20192020 ). Enfin, l’étiquetage des états de conduite pour un échantillon de plus grande taille pourrait être coûteux et prendre du temps. Afin de résoudre ce problème, des algorithmes de classification semi-supervisée seront considérés dans les travaux futurs ( She et al., 201820192020abWu et al., 2018ab ).

Conclusion

Dans cette étude, un réseau RBF à hiérarchie d’apprentissage à deux niveaux a été développé pour la détection de la fatigue au volant basée sur l’EEG afin d’optimiser les performances de classification (fatigue vs alerte). Les résultats expérimentaux montrent que la méthode proposée atteint une performance de classification supérieure par rapport aux autres méthodes en termes de précision de prédiction et d’efficacité de calcul. En raison du nombre nettement inférieur de paramètres de base à déterminer pour la formation du classificateur RBF, cette approche proposée présente une excellente facilité d’utilisation et de grandes possibilités d’application potentielles pour la détection de la fatigue au volant à l’avenir.

Déclaration de disponibilité des données

Les données brutes soutenant les conclusions de cet article seront mises à disposition par les auteurs, sans réserve indue.

Déclaration d’éthique

Les études impliquant des participants humains ont été examinées et approuvées par l’hôpital provincial de réadaptation des accidents du travail du Guangdong. Les patients/participants ont fourni leur consentement éclairé écrit pour participer à cette étude.

Les contributions de l’auteur

ZR a conçu cette étude et a contribué à la conception expérimentale. ZR a effectué l’analyse informatique avec l’aide de BC et HZ. CW et YM ont contribué au recrutement des sujets et à la collecte de données. ZR, RL, YL et YZ ont analysé les résultats et préparé le manuscrit. Tous les auteurs ont examiné les résultats et approuvé le manuscrit final.

Financement

Cette étude a été soutenue en partie par la Fondation nationale des sciences naturelles de Chine (n° 51675358), le State Key Laboratory of Robotics and Systems (HIT) (n° SKLRS-2020-KF-01) et l’Université de Houston.

Conflit d’intérêt

Les auteurs déclarent que la recherche a été menée en l’absence de toute relation commerciale ou financière pouvant être interprétée comme un conflit d’intérêts potentiel.

Remerciements

Les auteurs tiennent à remercier le Dr Chuan Zhang pour sa discussion et ses commentaires utiles.

Références

Akerstedt, T., Peters, B., Anund, A., et Kecklund, G. (2005). Altération de la vigilance et des performances lors du retour à la maison après un quart de nuit : une étude sur simulateur de conduite. J. Sleep Res. 14, 17-20. doi : 10.1111/j.1365-2869.2004.00437.x

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Aljarah, I., Faris, H., Mirjalili, S., et AI-Madi, N. (2018). Formation de réseaux de fonctions de base radiale en utilisant un optimiseur basé sur la biogéographie. Calcul neuronal. Appl. 29, 529-553. doi : 10.1007/s00521-016-2559-2

Texte intégral CrossRef | Google Scholar

Artoni, F., Delorme, A., et Makeig, S. (2018). L’application de la réduction de la dimension aux données EEG par l’analyse en caractéristiques principales réduit la qualité de sa décomposition ultérieure en caractéristiques indépendantes. Neuroimage 175, 176-187. doi : 10.1016/j.neuroimage.2018.03.016

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Aruna, DB et Kalaivani, A. (2016). Système de détection et d’avertissement de fatigue du conducteur en temps réel basé sur un réseau de neurones flous utilisant des ondes EEG. Asian J. Res. Soc. Sci. Hum. 6, 791–812. doi : 10.5958/2249-7315.2016.00153.2

Texte intégral de la référence croisée | Google Scholar

Billings, SA et Zheng, GL (1995). Configuration d’un réseau de fonctions à base radiale à l’aide d’algorithmes génétiques. Réseau neuronal. 8, 877–890. doi : 10.1016/0893-6080(95)00029-Y

Texte intégral de la référence croisée | Google Scholar

Bose, R., Wang, H., Dragomir, A., Thakor, N., Bezerianos, A. et Li, J. (2019). Estimation de la fatigue de conduite continue basée sur la régression : vers une mise en œuvre pratique. IEEE Transac. Conn. Dév. Syst. 12, 323–331 doi : 10.1109/TCDS.2019.2929858

Texte intégral de la référence croisée | Google Scholar

Chai, R., Ling, SH, San, PP, Naik, GR, Nguyen, TN, Tran, Y., et al. (2017a). Amélioration de la classification de la fatigue du conducteur basée sur l’EEG à l’aide de réseaux de croyances clairsemés-profonds. De face. Neurosci. 11:103. doi : 10.3389/fnins.2017.00103

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Chai, R., Naik, GR, Nguyen, TN, Ling, SH, Tran, Y., Craig, A., et al. (2017b). Classification de la fatigue du conducteur avec composante indépendante par analyse de minimisation liée au taux d’entropie dans un système basé sur l’EEG. IEEE J. Biomed. Informer sur la santé. 21, 715–724. doi : 10.1109/JBHI.2016.2532354

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Chen, J., Ren, Z. et San, Y. (2008). Une hiérarchie d’apprentissage à deux niveaux pour les réseaux de fonctions à base radiale. Théorie du contrôle Appl. 25, 655–660. doi : 10.7641/j.issn.1000-8152.2008.4.012

Texte intégral de la référence croisée | Google Scholar

Chen, S., Chng, ES et Alkadhimi, K. (1996). Algorithme des moindres carrés orthogonaux régularisés pour la construction de réseaux de fonctions à base radiale. Int. J.Contr. 64, 829–837. doi: 10.1080/00207179608921659

Texte intégral de la référence croisée | Google Scholar

Chen, S., Hong, X. et Harris, C. (2003). Modélisation de régression à noyau creux utilisant des moindres carrés orthogonaux régularisés localement combinés et un plan expérimental D-optimal. IEEE Trans. Automat. Contre. 48, 1029-1036. doi : 10.1109/TAC.2003.812790

Texte intégral de la référence croisée | Google Scholar

Chen, S., Hong, X., Luk, BL et Harris, CJ (2009). Construction de réseaux de fonctions de base radiale accordables à l’aide de la sélection directe orthogonale. IEEE Transac. Syst. Homme Cybernet. Partie B 39, 457–466. doi : 10.1109/TSMCB.2008.2006688

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Chen, S., Wu, Y. et Luk, B. (1999). Optimisation d’algorithmes génétiques combinés et apprentissage par les moindres carrés orthogonaux régularisés pour les réseaux de fonctions à base radiale. IEEE Transac. Réseau neuronal. 10, 1239-1243. doi: 10.1109/72.788663

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

En ligneFawcett, T. (2006). Introduction à l’analyse ROC. Reconnaissance de modèle. Lett. 27, 861–874. doi : 10.1016/j.patrec.2005.10.010

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Gao, Y., Wang, X., Potter, T., Zhang, J. et Zhang, Y. (2020). Essai unique EEG Reconnaissance des émotions à l’aide de l’analyse de causalité/entropie de transfert de Granger. J. Neurosci. Methods 346:108904. doi : 10.1016/j.jneumeth.2020.108904

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

En ligneHong, X., et Harris, C. (2002). Conception et construction de la structure du modèle non linéaire à l’aide des moindres carrés orthogonaux et de la conception D-optimale. IEEE Transac. Réseau neuronal. 13, 1245–1250. doi : 10.1109/TNN.2002.1031959

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Hong, X., Harris, CJ, Chen, S. et Sharkey, PM (2003). Méthodes d’identification de modèles non linéaires robustes utilisant la régression directe. IEEE Transac. Syst. Homme Cybernet. Partie A Syst. Hum. 33, 514–523. doi : 10.1109/TSMCA.2003.809217

Texte intégral de la référence croisée | Google Scholar

En ligneHotelling, H. (1933). Analyse d’un complexe de variables statistiques en composantes principales. J. Educ. Psychol. 24, 417–441. doi : 10.1037/h0071325

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Hsieh, CS et Tai, CC (2013). Un système de détection de durée de clignement des yeux amélioré et portable pour avertir de la fatigue du conducteur. Instrument. Sci. Technol. 41, 429–444. doi : 10.1080/10739149.2013.796560

Texte intégral de la référence croisée | Google Scholar

Hu, S., et Zheng, G. (2009). Détection de la somnolence du conducteur avec des paramètres liés aux paupières par une machine à vecteurs de support. Système expert. Appl. 36, 7651–7658. doi : 10.1016/j.eswa.2008.09.030

Texte intégral de la référence croisée | Google Scholar

Huang, KC, Huang, TY, Chuang, CH, King, JT, Wang, YK, Lin, CT, et al. (2016). Un système de détection et d’atténuation de la fatigue basé sur l’EEG. Int. J. Neural Syst. 26:1650018. doi: 10.1142/S0129065716500180

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Jimenez-Pinto, J., et Torres-Torriti, M. (2012). Points saillants du visage et suivi des yeux pour une détection robuste de la somnolence. Robotica 30, 731–741. doi: 10.1017/S0263574711000749

Texte intégral de la référence croisée | Google Scholar

Jung, S., Shin, H. et Chung, W. (2014). Système de surveillance de la fatigue et de la somnolence du conducteur avec capteur d’électrocardiogramme intégré au volant. IET Intellig. Système de transport 8, 43–50. doi : 10.1049/iet-its.2012.0032

Texte intégral de la référence croisée | Google Scholar

Kennedy, J., et Eberhart, R. (1995). Optimisation des essaims de particules. Proc. ICNN’95 Int. Conf. Réseau neuronal. 4, 1942–1948. doi : 10.1109/ICNN.1995.488968

Texte intégral de la référence croisée | Google Scholar

Lever, J., Krzywinski, M. et Altman, N. (2017). Analyse des composants principaux. Nat. Méthode 14, 641–642. doi : 10.1038/nmeth.4346

Texte intégral de la référence croisée | Google Scholar

Li, C., et Liu, X. (2016). « Un réseau neuronal PSO-BP amélioré et son application à la prévision des tremblements de terre », dans 2016 Chinese Control and Decision Conference (CCDC) (Yinchuan : IEEE), 3434–3438. doi : 10.1109/CCDC.2016.7531576

Texte intégral de la référence croisée | Google Scholar

Li, Y., Cui, WG, Huang, H., Guo, YZ, Li, K. et Tan, T. (2019). Détection des crises d’épilepsie dans les signaux EEG à l’aide de réseaux de fonctions de base radiales multi-échelles clairsemés et de l’approche vectorielle de Fisher. Savoir. Syst. 164, 96–106. doi : 10.1016/j.knosys.2018.10.029

Texte intégral de la référence croisée | Google Scholar

Li, Y., Wang, XD, Luo, ML, Li, K., Yang, XF et Guo, Q. (2017). Classification des crises d’épilepsie des EEG à l’aide de fonctions de base radiales multi-échelles basées sur l’analyse temps-fréquence. IEEE J. Biomed. Informations sur la santé. 22, 386–397. doi : 10.1109/JBHI.2017.2654479

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Li, Z., Chen, L., Peng, J. et Wu, Y. (2017). Détection automatique de la fatigue du conducteur à l’aide d’informations sur les opérations de conduite pour la sécurité des transports. Capteurs 17:1212. doi : 10.3390/s17061212

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Ma, Y., Chen, B., Li, R., Wang, C., Wang, J., She, Q., et al. (2019). Détection de la fatigue au volant à partir de l’EEG à l’aide d’une méthode PCANet modifiée. Calcul. Intellig. Neurosci. 2019:4721863. doi: 10.1155/2019/4721863

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Ma, Y., Zhang, S., Qi, D., Luo, Z., Li, R., Potter, T., et al. (2020). Conduire la détection de la somnolence avec l’EEG à l’aide d’un algorithme de machine d’apprentissage extrême hiérarchique modifié avec optimisation de l’essaim de particules : une étude pilote. Électronique 9:775. doi : 10.3390/électronique9050775

Texte intégral de la référence croisée | Google Scholar

MacKayi, DJC (1992). Interpolation bayésienne. Calcul neuronal. 4, 415–447. doi : 10.1162/neco.1992.4.3.415

Texte intégral de la référence croisée | Google Scholar

Masic, N., et Pfurtscheller, G. (1993). Classification basée sur le réseau neuronal des données EEG d’un seul essai. Artef. Renseignement. Méd. 5, 503–513 doi : 10.1016/0933-3657(93)90040-A

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

McLoone, S., Brown, MD, Irwin, G. et Lightbody, A. (1998). Un algorithme de formation hybride linéaire / non linéaire pour les réseaux de neurones à anticipation. IEEE Transac. Réseau neuronal. 9, 669–684. doi: 10.1109/72.701180

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Michielsen, HJ, Vries, JD, Heck, GLV, de Vijver, FV et Sijtsma, K. (2004). Examen de la dimensionnalité de la fatigue : la construction de l’échelle d’évaluation de la fatigue (FAS). EUR. J. Psychol. Évaluer. 20, 39–48. doi : 10.1027/1015-5759.20.1.39

Texte intégral de la référence croisée | Google Scholar

Nguyen, T., Zhou, T., Potter, T., Zou, L. et Zhang, Y. (2019). Le réseau cortical de la régulation des émotions : aperçus de l’analyse d’intégration EEG-fMRI avancée. IEEE Trans. Méd. Imagerie 38, 2423–2433. doi: 10.1109/TMI.2019.2900978

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

O’Hanlon, JF, et Kelley, GR (1977). « Comparaison des performances et des changements physiologiques entre les conducteurs qui performent bien et mal lors d’une utilisation prolongée d’un véhicule », dans Vigilance. Série de conférences de l’OTAN, Vol 3, ed RR Mackie (Boston, MA : Springer). p. 189–202.

Google Scholar

Petković, D., Gocic, M., Shamshirband, S., Qasem, SN et Trajkovic, S. (2016) Réseau de fonctions à base radiale basé sur l’optimisation d’un essaim de particules pour l’estimation de l’évapotranspiration de référence. Théorique. Appl. Climatol. 125, 555–563. doi : 10.1007/s00704-015-1522-y

Texte intégral de la référence croisée | Google Scholar

Picot, A., Charbonnier, S. et Caplier, A. (2012). Détection en ligne de la somnolence à l’aide d’informations cérébrales et visuelles. IEEE Transac. Syst. Homme Cybern.Partie A Syst. Hum. 42, 764–775. doi : 10.1109/TSMCA.2011.2164242

Texte intégral de la référence croisée | Google Scholar

Sahayadhas, A., Sundaraj, K. et Murugappan, M. (2012). Détecter la somnolence du conducteur à l’aide de capteurs : bilan. Capteurs 12, 16937–16953. doi : 10.3390/s121216937

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Elle, Q., Chen, K., Luo, Z., Nguyen, T., Potter, T. et Zhang, Y. (2020a). Apprentissage actif à double critère pour les interfaces cerveau-ordinateur multiclasses. Calcul. Renseignement. Neurosci. 2020:3287589. doi: 10.1155/2020/3287589

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Elle, Q., Hu, B., Gan, H., Fan, Y., Nguyen, T., Potter, T., et al. (2018). Machine d’apprentissage extrême semi-supervisée sécurisée pour la classification des signaux EEG. Accès IEEE 6, 49399–49407. doi: 10.1109/ACCESS.2018.2868713

Texte intégral de la référence croisée | Google Scholar

Elle, Q., Hu, B., Luo, Z., Nguyen, T. et Zhang, Y. (2019). Une méthode de machine d’apprentissage extrême semi-supervisée hiérarchique pour la reconnaissance EEG. Méd. Biol. Ing. Calcul. 57, 147–157. doi : 10.1007/s11517-018-1875-3

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Elle, Q., Zou, J., Luo, Z., Nguyen, T., Li, R. et Zhang, Y. (2020b). Classification EEG d’imagerie motrice multi-classes utilisant une machine d’apprentissage extrême semi-supervisée basée sur la représentation collaborative. Méd. Biol. Ing. Calcul. 58, 2119–2130. doi : 10.1007/s11517-020-02227-4

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Shi, Y., et Eberhart, R. (1995). « Un optimiseur d’essaim de particules modifié », en 1998 IEEE International Conference on Evolutionary Computation Proceedings. IEEE World Congress on Computational Intelligence (Cat. No.98TH8360) (Anchorage, AK), 69–73. doi: 10.1109/ICEC.1998.699146

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Sikander, G., et Anwar, S. (2019). Systèmes de détection de la fatigue du conducteur : un bilan. IEEE Transac. Intellig. Le transport. Syst.s 20, 2339–2352. doi: 10.1109/TITS.2018.2868499

Texte intégral de la référence croisée | Google Scholar

Simon, M., Schmidt, EA, Kincses, WE, Fritzsche, M., Bruns, A., Aufmuth, C., et al. (2011). Mesures du fuseau EEG alpha comme indicateurs de la fatigue du conducteur dans des conditions de circulation réelles. Clin. Neurophysiol. 122, 1168–1178. doi : 10.1016/j.clinph.2010.10.044

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Vuckovic, A., Radivojevic, VCN, Chen, A. et Popovic, D. (2002). Reconnaissance automatique de la vigilance et de la somnolence à partir de l’EEG par un réseau de neurones artificiels. Méd. Ing. Phys. 24, 349–360. doi : 10.1016/S1350-4533(02)00030-9

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Wu, D., Luo, X., Shang, M., He, Y., Wang, G. et Wu, X. (2020). Un modèle de facteur latent sensible aux caractéristiques des données pour la prédiction de la qualité de service des services Web. IEEE Trans. Savoir. Data Eng. 32:1. doi : 10.1109/TKDE.2020.3014302

Texte intégral de la référence croisée | Google Scholar

Wu, D., Luo, X., Shang, M., He, Y., Wang, G. et Zhou, M. (2019). Un modèle de facteur latent profond pour les matrices de grande dimension et clairsemées dans les systèmes de recommandation. IEEE Transac. Syst Man Cybernet. Syst. 50, 1–12. doi : 10.1109/TSMC.2019.2931393

Texte intégral de la référence croisée | Google Scholar

Wu, D., Luo, X., Wang, G., Shang, M., Yuan, Y. et Yan, H. (2018a). Un cadre très précis pour la classification semi-supervisée auto-étiquetée dans les applications industrielles. IEEE Transac. Industrie. Inform. 14, 909–920. doi : 10.1109/TII.2017.2737827

Texte intégral de la référence croisée | Google Scholar

Wu, D., Shang, M., Luo, X., Xu, J., Yan, H., Den, W., et al. (2018b). Classification semi-supervisée par auto-apprentissage basée sur des pics de densité de données. Neuroinformatique 275, 180–191. doi : 10.1016/j.neucom.2017.05.072

Texte intégral de la référence croisée | Google Scholar

Yang, G., Lin, Y. et Bhattacharya, P. (2010). Un modèle de reconnaissance de la fatigue du conducteur basé sur la fusion d’informations et un réseau bayésien dynamique. Inf. Sci . 180, 1942–1954. doi : 10.1016/j.ins.2010.01.011

Texte intégral de la référence croisée | Google Scholar

Zaw, T., Tun, KMM et Oo, AN (2019). « Prévision des prix par modèle de réseau neuronal à rétropropagation », dans 2019 Conférence internationale sur les technologies de l’information avancées (ICAIT) (Yangon : IEEE), 84–89. doi : 10.1109/AITC.2019.8921396

Texte intégral de la référence croisée | Google Scholar

Zhang, L. et Pu, J. (2020). « Un réseau de neurones à rétropropagation amélioré dans la reconnaissance d’objets », en 2011 Conférence internationale IEEE sur l’automatisation et la logistique (ICAL) (IEEE), 507–511.

Google Scholar

Zhao, C., Zhao, M., Yang, Y., Gao, J., Rao, N. et Lin, P. (2017). La réorganisation des réseaux cérébraux humains modulée par la fatigue mentale motrice. IEEE J. Biomed. Informations sur la santé . 21, 743–755. doi : 10.1109/JBHI.2016.2544061

Résumé PubMed | Texte intégral de la référence croisée | Google Scholar

Mots-clés : détection de la fatigue au volant, électroencéphalographie, analyse en composantes principales, fonction de base radiale, réseau de neurones, classification

Citation : Ren Z, Li R, Chen B, Zhang H, Ma Y, Wang C, Lin Y et Zhang Y (2021) Détection de la fatigue au volant basée sur l’EEG à l’aide d’une fonction de base radiale de hiérarchie d’apprentissage à deux niveaux. De face. Neurorobot. 15:618408. doi : 10.3389/fnbot.2021.618408

Reçu : 16 octobre 2020 ; Accepté : 05 janvier 2021 ;
Publié : 11 février 2021.

Édité par:Mukesh Prasad , Université de technologie de Sydney, Australie

Revue par:Devika Chhachhiya , Maharshi Dayanand University, Inde

Di Wu , Chongqing Institute of Green and Intelligent Technology (CAS), Chine

Copyright © 2021 Ren, Li, Chen, Zhang, Ma, Wang, Lin et Zhang. Il s’agit d’un article en libre accès distribué sous les termes de la licence Creative Commons Attribution (CC BY) . L’utilisation, la distribution ou la reproduction dans d’autres forums est autorisée, à condition que le ou les auteurs originaux et le ou les titulaires des droits d’auteur soient crédités et que la publication originale dans cette revue soit citée, conformément à la pratique académique acceptée. Aucune utilisation, distribution ou reproduction non conforme à ces conditions n’est autorisée.

*Correspondance : Yingchun Zhang, yzhang94@uh.edu

Avis de non-responsabilité : toutes les affirmations exprimées dans cet article sont uniquement celles des auteurs et ne représentent pas nécessairement celles de leurs organisations affiliées, ni celles de l’éditeur, des éditeurs et des réviseurs. Tout produit pouvant être évalué dans cet article ou toute réclamation pouvant être faite par son fabricant n’est ni garanti ni approuvé par l’éditeur.

Détection de la fatigue de conduite basée sur l’EEG

Vous pourrez aussi aimer