• Nenhum resultado encontrado

prédiction de la syncope chez l’homme

N/A
N/A
Protected

Academic year: 2023

Share "prédiction de la syncope chez l’homme"

Copied!
289
0
0

Texto

Le raccourcissement de la durée de l'examen est, comme déjà mentionné, pris en compte en raison des coûts et du bien-être du patient. Le chapitre 2 traite des étapes de prétraitement et de sélection/extraction de variables de la figure 1.

Introduction

Apprentissage artificiel

C’est ainsi qu’est apparu le data mining, également appelé Knowledge Discovery (KDD : Knowledge Discovery Data). Les processus d’exploration de données et de reconnaissance de formes montrent peu de différence, seul l’objectif diffère.

Reconnaissance de formes

Ainsi, le résultat de l'apprentissage est soit la réorganisation ou le renforcement des classes existantes, prenant en compte l'apport de la nouvelle observation, soit la création d'une nouvelle classe représentant la nouvelle observation. La décision donne cependant un « avis » sur l’appartenance d’une observation aux classes préalablement définies lors de l’apprentissage, et indique celles qui sont « les plus proches ».

Introduction à la discrimination

Les techniques transductives déterminent directement l'appartenance d'une nouvelle observation sans passer par une phase d'apprentissage et donc sans créer de modèle. C'est dans ce contexte que l'on retrouve les techniques dites inductives, où elles déterminent l'appartenance à une classe d'une nouvelle observation à partir d'un modèle développé lors d'une phase d'apprentissage.

Approches probabilistes pour la classification

  • Introduction
  • Vision bayésienne
  • Estimation des densités de probabilité
  • Classifieurs basés sur la théorie de Bayes
  • Conclusions

La combinaison du théorème de Bayes et de la règle de décision de Bayes forme ce que nous pouvons appeler le classificateur de Bayes. Dans la section 1.2.2.2, nous avons introduit le classificateur de Bayes obtenu par l'association stricte du théorème et de la règle de décision de Bayes.

Classification Linéaire

  • Introduction
  • Problème à deux classes
  • Extension de la discrimination à plus de deux classes
  • Conclusions

De plus, cette méthode globale utilise nécessairement toutes les observations pour estimer les paramètres de l'hyperplan. Dans l'exemple de la figure 1.12, la marge de l'ensemble de données d'entraînement est γ |γa|, où xa est l'observation la plus proche de l'hyperplan.

Classification non linéaire

  • Introduction
  • Réseaux de neurones artificiels
  • Support vector machines non linéaires
  • Conclusions

La fonction d'activation f des neurones de la couche de sortie est choisie comme pour le PMC et la connectivité d'un neurone de sortie peut alors être donnée par. La dernière étape de l'apprentissage consiste donc à adapter les poids de la couche de sortie.

Résumé et discussions

Dans la section 1.4.2.5, nous avons discuté de la complexité de la topologie obtenue par les réseaux de neurones. De là [Bellman, 1961] a introduit le terme « malédiction de la dimensionnalité », révélant le problème causé par les formes représentées en grandes dimensions lorsque le nombre d'observations est limité. La malédiction de la dimensionnalité est également connue sous le nom de phénomène de l’espace vide.

Prétraitement

  • Introduction
  • Données aberrantes (outliers)
  • Normalisation des données
  • Données manquantes
  • Conclusions

Il peut s'agir d'une donnée très éloignée (du point de vue de la distance) de la valeur moyenne de la distribution de la variable correspondante (Figure 2.2) [Theodoridis et Koutroumbas, 2006]. Remarque : (a) Hyperplan obtenu par les moindres carrés. b) Comparaison des hyperplans basée sur la présence de valeurs aberrantes. 2.3 – Influence de la présence de valeurs aberrantes sur la frontière de décision obtenue par les moindres carrés.

Extraction de caractéristiques

  • Introduction
  • Approches linéaires
  • Approches non linéaires pour la réduction de la dimensionnalité
  • Conclusions

En revanche, une diminution régulière des valeurs propres indique que les données sont mal structurées et rend donc difficile le choix de la dimension de l'espace de projection. Pour optimiser le résultat de la projection en termes de préservation de la topologie, les distances spatiales de sortie (dij) doivent être proportionnelles aux distances spatiales d'entrée (d∗ij). Cependant, la préservation de la topologie locale est l’objectif de la plupart des méthodes de projection non linéaire.

Sélection de variables

  • Introduction
  • Critères d’évaluation
  • Génération de sous-ensembles : procédures de recherche
  • Conclusions

Tout comme l’extraction de fonctionnalités, l’objectif de la sélection de variables est de réduire la dimension d’un problème. Idéalement, dans la classification supervisée, le critère d'évaluation d'un sous-ensemble de variables pourrait être basé sur la vitesse de classification. 2.20 – Approches de sélection de sous-ensembles de variables (filtre et wrapper) basées sur l'intégration d'un algorithme d'apprentissage [Yang et Honavar, 1997].

Résumé et discussions

En dessous de cette valeur, le choix de la méthode dépend du but à atteindre. Il est cependant difficile d’imaginer réaliser ces tâches indépendamment de la tâche de classification. Dès lors émergent deux objectifs qui seront abordés tout au long de ce chapitre : l’évaluation et la comparaison des modèles à des fins de sélection.

Mesures de la qualité d’un modèle

Ainsi, compte tenu des nombreux tests possibles, il est utile de pouvoir comparer les performances de chaque test et de chaque outil de diagnostic.

Évaluation de la performance

Facteurs influençant la généralisation

Fig.3.2 – Division de toutes les observations en deux sous-ensembles pour effectuer les tâches d'apprentissage et de test. 3.3 – Influence du nombre d'observations dans l'échantillon sur la probabilité d'erreur (pe) d'apprentissage et de test [Tufféry, 2007]. Cette dernière, utilisée après la phase d’apprentissage, estime la performance de généralisation indépendamment de l’apprentissage.

Méthodes d’estimation

Cette technique sépare les observations réservées à l'apprentissage en deux sous-groupes : un groupe d'apprentissage et un groupe de validation. Les observations de validation qui ne sont pas utilisées pour l'apprentissage permettent de vérifier périodiquement les capacités de généralisation du modèle lors de l'entraînement. Les observations n’étant pas infinies, les deux tiers d’entre elles sont généralement réservées à l’apprentissage (sous-ensembles d’entraînement et de validation).

Intervalle de confiance

Bootstrap [Efron, 1979] est une technique de rééchantillonnage qui simule de nouveaux échantillons d'observations à partir de l'échantillon initial X. 3.7 – Influence du nombre d'observations tests sur l'intervalle de confiance à 0,95 pour une erreur de probabilité de 5 %. Pour ce faire, définissez simplement l'erreur acceptable de l'estimation (β) et ajustez la relation (3.2) pour obtenir le nombre minimum d'observations.

Mesures de performance d’un test diagnostique

Indices de performance

3.8 – Illustration des quatre états possibles lors de la prédiction d'un modèle de classification binaire : vrai/faux positif et vrai/faux négatif. 3.1 – Table de confusion/matrice issue de la prédiction d'un modèle de classification binaire : vrai/faux positif et vrai/faux négatif. 5 L'incidence de la maladie dans un échantillon donne le rapport entre le nombre de patients malades et l'ensemble des patients de l'échantillon.

Courbes de ROC

Cependant, l’utilisation de ces extensions est souvent peu intuitive et leur calcul est généralement coûteux, obligeant la plupart des utilisateurs à utiliser le taux de classification pour évaluer les performances des problèmes multi-classes.

Comparaisons de modèles par analyse des courbes de ROC

Conclusions

5.1 – Synthèse de toutes les variables collectées pour l'étude de la survenue de syncopes lors d'une étude test d'utilité (partie 1/2). 5.10 – Qualité de représentation des variables présélectionnées dans les composantes clés utilisées pour prédire le résultat du test d'inclinaison en décubitus dorsal. 5.22 – Résumé des études analysant la survenue de symptômes syncopaux lors de l'examen du test d'utilité.

Contributions

Investigations et démarches diagnostiques

  • Test d’inclinaison : Head-Upright Tilt-Test
  • Signaux de mesures : électrocardiogramme et signal d’impédancemétrie tho-

On peut notamment citer le test de Schellong qui apparaît dans le schéma de la figure 4.2. Le test d'inclinaison est considéré comme le protocole standard pour diagnostiquer une syncope inexpliquée. Ainsi, en fonction de l'intensité du courant injecté et de la tension collectée, la loi d'Ohm permet alors d'obtenir une impédance.

État de l’art sur la prédiction de la syncope

Bellard et al., 2003] ont également étudié l'influence d'un test pharmacologique à la nitroglycérine pour prédire le résultat d'un test d'utilité. La prédiction repose principalement sur les caractéristiques collectées à partir du signal d'impédance thoracique, y compris le temps d'éjection ventriculaire. Les deux dernières études [Bellard et al., 2003 ; Schanget al., 2003], à la fin de leur analyse, a montré l'importance et l'intérêt des variables recueillies sur le signal d'impédance thoracique, notamment l'intervalle de temps associé à la fin de l'éjection ventriculaire t2.

Conclusions

Dans le même but, plusieurs travaux sont présentés dans la section 4.3, dont ceux de [Bellard et al., 2003 ; Schang et al., 2003], qui parviennent à prédire la survenue d'une syncope au repos. Pitzalis et coll., 2002 ; Bellard et al., 2003] y parviennent uniquement en utilisant les premières minutes après le changement. En revanche, comme mentionné dans la section 4.3, le signal de l'impédance thoracique semble fournir des informations importantes pour la prédiction de la syncope [Bellard et al., 2003 ;.

Cadres expérimentaux

Aussi, dans le tableau 5.2, nous pouvons observer que la même variable est mesurée lors des deux phases de test d'utilité : la période de repos et les 10 premières minutes de la période de commutation. En présence de valeurs manquantes, les calculs de moyenne et d'écart type prennent en compte uniquement les valeurs disponibles. Tab.5.2 – Récapitulatif de toutes les variables collectées pour l'étude de l'incidence des syncopes lors d'un examen test d'utilisabilité (partie 2/2).

Recherche d’indices prédictifs du résultat du tilt-test durant la période de repos

  • Analyse exhaustive des sous-ensembles pertinents de variables initiales
  • Extraction de caractéristiques pertinentes par combinaison des variables
  • Discussions et conclusions

Fig.5.7 – Représentation biplot de l'inertie expliquée dans chacune des nouvelles composantes résultant de l'analyse en composantes principales. Dans le cadre de l'ACP, nous avons introduit, dans la section 2.3.2.1, l'approche qui permet d'évaluer la représentation des variables initiales dans les composantes principales. Ainsi, une estimation sans biais, en évaluant le sous-ensemble de test, permet d'observer de moins bonnes performances pour les modèles résultant d'une sélection de variables.

Recherche d’indices prédictifs du résultat du tilt-test durant les deux périodes de

  • Introduction
  • Méthodes
  • Expérimentations et résultats
  • Discussions et conclusions

Dans cette section, nous ne comparons pas les méthodes de classification, mais les méthodes de sélection de variables. Cependant, nous les utilisons sur les meilleurs sous-ensembles de variables obtenus, dans ce cas, par les méthodes de sélection combinées. 5.17 – Nombre de combinaisons de variables évaluées par les méthodes de sélection « classiques » et combinées avec AG pour prédire le résultat du test d'utilité en position couchée et inclinée.

Évaluation de la pertinence du signal d’impédancemétrie thoracique dans la pré-

  • Introduction
  • Prétraitement et extraction des complexes dZ
  • Sélection des complexes par minimisation de l’erreur quadratique moyenne
  • Sélection des complexes par optimisation manuelle du rapport signal sur
  • Amélioration du processus de sélection des complexes par optimisation au-
  • Discussions et conclusions

5.18 – Évaluation de l'adéquation de nouvelles caractéristiques extraites du signal Z et dZ pour prédire le résultat du test d'utilisabilité en décubitus dorsal [Schanget al., 2006]. Ainsi, la mesure de l'évolution de la variabilité du signal est obtenue par le calcul du rapport signal sur bruit (SNR). Tab.5.19 – Évaluation de la pertinence (Perr) des caractéristiques dérivées du signal dZ selon le processus de sélection de fenêtre (optimisation aléatoire, globale et locale) et la méthode d'extraction de caractéristiques (sélection aléatoire des complexes, moyenne des complexes et complexes optimisant RSB ).

Discussions

Cette difficulté avait déjà été abordée dans la conclusion de la section 2.3.4 et dans la discussion de la section 5.3.2. Cela correspond à [Illouz et Jardino, 2001 ; Guérif, 2006], au grand inconvénient de l'utilisation et de l'interprétation de la plupart des méthodes de réduction non linéaires. Rappelons que dans la section 5.3.2 nous avons utilisé un procédé de projection non linéaire (analyse en composantes curvilignes) qui nous a permis d'obtenir des performances intéressantes (voir résultats dans la section 5.3.2.4).

Fondements

La section 6.2 posera les bases de la méthodologie, qui est une adaptation du processus utilisé par l'ACS décrit à la section 6.3. Enfin, dans la section 6.5, nous adapterons le processus d'extraction d'informations à notre problème de prédiction de l'apparition de symptômes syncopaux au cours de l'étude de test d'utilité. Par conséquent, dans la section 6.5, nous compléterons l’analyse de la projection non linéaire utilisée pour la prédiction de la syncope, en exprimant exactement quelles variables ont le plus contribué à la formation des composantes curvilignes utilisées pour la prédiction.

Extraction de la contribution des variables dans le cas d’une analyse en compo-

  • Description de la méthode
  • Validation expérimentale

Fig.6.2 – Interprétation de la qualité de la représentation des variables initiales dans les composantes principales dans un exemple bidimensionnel. Fig.6.3 – Ensemble de données, représentant une forme en « S », utilisé pour valider l'estimation de la représentation des variables dans les nouvelles composantes. On visualise ainsi la projection des observations dans l'espace réduit à deux dimensions (pour chaque couple de composantes principales) et également la qualité de la représentation des variables dans ces mêmes composantes.

Extraction de la contribution des variables dans le cas d’une réduction de dimension

  • Introduction
  • Evaluation et vérification de la projection par estimation des « pseudo-
  • Estimation des « vecteurs propres locaux »
  • Extension de la procédure d’estimation de la qualité de la représentation
  • Validation expérimentale
  • Renforcement de la pertinence de la lecture des estimations des contribu-

Dans cette section, nous illustrons l'interprétation de la qualité de la représentation des variables dans les composantes principales. Remarque : (a) Affichage des données projetées dans l'espace réduit du PCA pour chaque paire de composants principaux (cp1 avec cp2, cp1 avec cp3, etc.p2 avec cp3). b) Qualité (Q) de la représentation des trois variables initiales dans les trois composantes principales. Ces nouveaux éléments permettront ensuite la généralisation pour l'analyse en composantes curvilignes, processus qui détermine la qualité de la représentation des variables dans les nouvelles composantes.

Application expérimentale à la prédiction de la syncope

  • Introduction
  • Rappel du contexte
  • Extraction de la contribution des composantes curvilignes liées à la prédic-

Discussions et conclusions

Algorithme de rétropropagation

Estimation des pentes et des aires sur le signal d’impédancemétrie thoracique et

  • Détermination des pentes (Slope norm )
  • Détermination des aires (Area norm )

Estimation de la probabilité d’erreur de classification

Résolution du problème XOR par un réseau RBF

Résolution du problème XOR par les SVM

Construction de la courbe de ROC

Cadres expérimental et méthodologique

Résultats expérimentaux

  • Analyses des résultats

Discussions et conclusions

Referências

Documentos relacionados

confirmed cases and epidemiological aspects, in the states of the North Region of Brazil, between March 18 and April 24, 2020, in order to provide information for a