• Nenhum resultado encontrado

Chapitre VIII Détection d’états émotionnels et classification de signaux neuronaux . 139

2. Méthodologie

3.2 Résultats de classification

150

151

Tableau 10: Taux de classification pour chacun des sujets en fonction de la configuration du classifieur binaire en utilisant 5 électrodes virtuelles et 4 plages temporelles

Sujets C1 C2 C3 C4 C5

J1 81% 64% 92% 59% 53%

J2 59% 55% 73% 60% 51%

J3 67% 52% 75% 70% 48%

J4 63% 57% 87% 60% 55%

J5 72% 50% 100% 61% 47%

J6 61% 61% 88% 54% 45%

J7 79% 65% 62% 68% 60%

J8 81% 63% 87% 64% 56%

J9 68% 53% 87% 62% 59%

J10 71% 58% 85% 66% 48%

J11 69% 67% 80% 69% 60%

J12 63% 58% 72% 54% 55%

A21 68% 53% 85% 62% 51%

A22 86% 58% 83% 61% 57%

A23 64% 52% 60% 54% 46%

A24 59% 48% 58% 67% 53%

A25 68% 48% 83% 60% 48%

A26 69% 57% 78% 60% 46%

A27 74% 61% 83% 59% 51%

A28 67% 53% 75% 60% 45%

A29 71% 58% 77% 54% 53%

A30 59% 67% 82% 64% 58%

A31 71% 61% 65% 56% 43%

A32 54% 51% 92% 66% 55%

A33 67% 65% 92% 71% 56%

A34 66% 55% 83% 61% 59%

Par ailleurs, nous nous sommes intéressés aussi à l’évolution des taux de classification en fonction du nombre d’électrodes virtuelles conservées (figure 33 et Annexe G).

L’ajout d’une électrode virtuelle améliore les performances mais pas nécessairement de manière significative. Chez les sujets jeunes, il faut l’ajout de 3 électrodes pour observer un gain significatif. Tandis que chez les sujets âgés, l’ajout d’une électrode virtuelle suffit à un gain significatif.

152

Figure 33 : Evolution des taux de classification en fonction du nombre d’électrodes virtuelles extraites et en fonction des configurations. Les tests statistiques ont été effectués sur la moyenne uniquement *p<.05, non corrigés. A gauche les sujets jeunes, à droite les sujets âgés.

Dans notre méthodologie, le nombre de plages temporelles utilisées pour extraire les caractéristiques conditionne le temps de réaction minimum nécessaire pour prendre une décision dans le cas de son utilisation pour une ICM. Nous avons aussi investigué les performances en fonction des plages temporelles utilisées (figure 34 et annexe H).

Figure 34: Taux de classification en fonction des plages utilisées et de l’âge (à gauche, les sujets jeunes et à droite, les sujets âgés). 3 plages signifient que nous avons utilisé les trois premières plages temporelles de la plus précoce à la plus tardive. LPP signifie que nous n’avons utilisé que la dernière plage temporelle identifiée. Les tests statistiques n’ont été effectués que sur la moyenne. * = p<.05.

Dans la globalité, que ce soit pour les sujets jeunes ou âgés, chaque plage supplémentaire ajoute un gain significatif aux performances. Nous avons noté deux patrons d’évolution différents selon les configurations de classifieur. Nous citerons notamment la configuration C1 qui, chez les sujets jeunes, présente des performances maximales dès la première plage temporelle (environ 68%) à contrario de la configuration C3 où l’ajout d’une plage accroit grandement les performances entre 8 et 12% à chaque ajout.

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1 plage 2 plages 3 plages 4 plages LPP

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1 plage 2 plages 3 plages 4 plages LPP

Moyenne C1 C2 C3 C4

* * * * *

*

*

*

*

*

*

*

Taux de classification Taux de classification

*

*

Nombre d’électrodes virtuelles conservées

153

4. Discussion

Le but de cette étude était de proposer une nouvelle méthode de classification essai par essai d’états émotionnels induits par des images de scènes naturelles sur la base des potentiels évoqués visuels. Ce choix était motivé par une implémentation en ICM et par le fait que travailler dans le domaine temporel permettrait une classification plus rapide et des temps de calcul plus court qu’une classification sur des caractéristiques extraites dans le domaine fréquentiel. Les méthodes d’extraction des caractéristiques proposées s’avèrent correctes pour conserver l’information la plus discriminante. En effet, les filtres spatiaux et temporels découlant des méthodes proposées dans l’étude montrent une grande cohérence avec les résultats observés dans la littérature sur l’étude des émotions en EEG (Olofsson et al., 2008).

En effet, les électrodes ayant le plus de poids dans les filtres spatiaux sont celles pour lesquels des différences entre les conditions émotionnelles sont maximales, à savoir les électrodes occipitales, centrales et pariétales principalement. Pour aller plus loin, nous pourrions proposer d’utiliser la technique de filtrage spatial qui peut être vu comme une démarche de type Analyse en Composante Principale souvent utiliser en EEG pour déterminer les électrodes d’intérêts (Spencer, Dien, & Donchin, 2001). En effet, les poids du filtre sont optimisés pour augmenter la variance d’une classe par rapport à l’ensemble des conditions.

Par conséquent, les électrodes dont le poids est le plus important seront les électrodes où les différences entre classes seront maximales. Les plages temporelles, quant-à-elles, attestent aussi de la validité de notre méthodologie d’extraction des caractéristiques.

Le principal avantage de notre filtre spatial réside dans le fait qu’il permet de diminuer grandement le nombre de signaux tout en conservant l’information discriminante puisque les électrodes virtuelles sont des combinaisons linéaires d’électrodes. Néanmoins, dans un scénario réaliste d’une utilisation ICM, la pose d’un casque EEG à haute densité n’est pas envisageable. D’autres travaux sont nécessaires pour évaluer la robustesse de notre méthodologie à la diminution du nombre d’électrodes dès l’acquisition.

Les résultats montrent que notre méthode est particulièrement efficace pour distinguer des états provoqués par des images négatives de basse activation en comparaison à des images de haute activation. Le taux de performance moyen de 82.2% pour les sujets jeunes et de 78.2%

pour les sujets âgés est particulièrement haut avec des scores parfaits de 100% ou très proche de 100% pour certains sujets. Des performances correctes sont obtenues pour faire la distinction entre scènes négatives de haute activation et scènes neutres (jeunes : 70.5% ; âgés :

154

67.3%). Pour les configurations opposant scènes négatives de basse activation aux scènes positives (jeunes : 62.3% ; âgés : 61.1%) et scènes émotionnelles à scènes neutres (jeunes : 58.5% ; âgés : 56.1%), les performances sont significativement au-dessus de la chance mais insuffisantes pour une application ICM. La configuration opposant scènes négatives à scènes positives a l’air d’être la plus défavorable à notre méthodologie puisque les performances sont au niveau de la chance. A l’exception de cette dernière configuration, nos résultats sont soit meilleurs, soit comparables à ceux de la littérature sur la détection sujet-dépendant d’états émotionnels (Chanel et al., 2005; Koelstra et al., 2010), et approchent certains résultats obtenus avec une classification sujet-indépendant (Schuster et al., 2010) (voir Chapitre VI).

Nos performances sont aussi comparables à ceux obtenus en « P300 speller » après une itération (Bertrand Rivet et al., 2011). Ces résultats tendent à montrer que des images très activatrices favorisent de bonnes performances telles que nos images négatives de haute activation. Pour aller plus loin, la méthodologie proposée apparait meilleure pour séparer des catégories d’images selon les niveaux d’activation plutôt que selon la valence. A la vue des résultats présentés dans le Chapitre II, dans les études en neuro-imagerie, cette constatation n’est pas très surprenante. De nombreuses études en EEG suggèrent que les composantes sont plus facilement modulées par les niveaux d’activation plutôt que par la valence des stimuli.

Un autre objectif était d’estimer la durée minimale nécessaire pour obtenir des taux de classification acceptable. Avec notre méthodologie, il apparait compliqué de proposer une classification en moins de 450ms, l’ajout de la troisième plage par rapport aux deux premières plages améliorant significativement les performances. Toutefois, cette observation dépend vraiment des configurations. Malgré cela, notre méthodologie est tout à fait valable puisque très peu d’études (voir Chapitre VI) proposent des algorithmes de classification essai par essai avec des tailles de segments inférieurs à la seconde.

Notre méthodologie pourrait être améliorée. Il faut rappeler que, parfois, la présentation d’images émotionnelles ne provoque pas nécessairement l’émotion escomptée et cela provoque un bruit d’étiquetage de nos stimuli. Les réponses des participants dans la tâche de catégorisation (étude 1) montrent que de 5 à 20% des images ne sont pas attribués à la bonne catégorie et donc ne provoquent pas nécessairement l’émotion attendue. Nos résultats pourraient probablement être meilleurs si nous avions pris en compte les vraies réponses des participants pour chaque essai et non la catégorie des images définie par le pré-test.

Concernant l’étape d’extraction « temporelle » des caractéristiques, nous avons choisi une méthode très globale qui peut être plus précise. Les latences des composantes variant d’un

155 individu à l’autre, un algorithme de définition automatique des plages temporelles sujet- dépendant peut être mis en place aisément tel que le propose Fazli et collaborateurs (2012) qui travaillent aussi avec les coefficients de corrélation. L’ajout d’autres signaux en compléments des signaux EEG peut aussi améliorer les performances, tels que rythme cardiaque, l’activité électrodermale, les mouvements oculaires et les clignements. Soleymani (2012) montre une progression d’environ 15% pour une classification du niveau de valence et 19% pour le niveau d‘activation par l’ajout de données sur les mouvements oculaires.

Pour conclure, le dernier objectif de cette étude était d’évaluer dans quelle mesure les performances d’un système de classification pouvait chuter entre une population jeune et âgée. Dans le cadre de notre méthodologie la diminution est comprise entre 1 et 4 % ce qui est tout à fait raisonnable pour envisager des ICM à destination des personnes âgées.

5. Conclusion

Dans le but de réaliser une classification essai par essai d’états émotionnels induits par des stimuli émotionnels, nous avons proposé une méthodologie innovante permettant une classification en moins d’1 seconde, i.e., plus rapide que la plupart des méthodologies présentées actuellement. Nous obtenons des résultats significatifs plutôt bons quand il s’agit d’étiqueter les signaux selon le niveau d’activation des stimuli: Pour des sujets jeunes, le taux de performance moyen est de 82.2% lorsqu’il s’agit de distinguer des potentiels évoqués provoqués par des scènes naturelles négatives de basse activation en comparaison à des scènes de haute activation. Des performances correctes (70.5%) sont obtenues aussi pour faire la distinction entre scènes négatives de haute activation et scènes neutres. De plus, nous montrons que les taux de classification de signaux neuronaux d’individus âgés ne sont pas inférieurs de plus de 4% à ceux des sujets jeunes pour toutes les configurations binaires de classification. Ainsi, des ICMs à destination des personnes âgées seraient envisageables dans un futur proche.

156

Chapitre IX - Effets de positivité et contexte