• Nenhum resultado encontrado

Traitement numérique du signal acoustique pour une aide aux malentendants

N/A
N/A
Protected

Academic year: 2023

Share "Traitement numérique du signal acoustique pour une aide aux malentendants"

Copied!
237
0
0

Texto

Dans un deuxième temps, nous avons étudié le problème de rétroaction acoustique entre les transducteurs de la prothèse. La dernière partie de ce travail consiste à développer une implémentation en temps réel de l'algorithme d'annulation du Larsen précédemment proposé à l'aide d'un prototype d'aide auditive.

Liste des tableaux

Liste des abréviations

ITE intra-auriculaire ; intra-conque, prothèse placée dans la conque (voir page 60) LIT Linéaire Invariant dans le temps. LMS Eastern Mean Square ; Moyenne des moindres carrés, algorithme de gradient stochastique Filtre multi-décalage MDF ; Filtre à retard multiple.

Introduction générale

Par conséquent, la mise en œuvre d'un algorithme pour améliorer la parole est assez pratique. Pour limiter ce souci, il n'y a guère d'autre solution à l'heure actuelle que de limiter l'amplification apportée au signal, ce qui revient à limiter les capacités auditives rééducatrices de la prothèse.

Première partie

Audition et réhabilitation auditive

Introduction de la première partie

Anatomie et physiologie de l’appareil auditif

  • Principe général
  • Mesure physique de l’intensité
  • L’oreille externe
    • Anatomie
    • Physiologie
  • L’oreille moyenne
    • Anatomie
    • Physiologie
  • L’oreille interne
    • Anatomie
    • Physiologie de la cochlée
  • Le nerf auditif
    • Courbe d’accord
    • Codage de la fréquence
    • Codage de l’intensité
  • Conclusions sur la physiologie de l’appareil auditif

La tonotopie passive mobilise la membrane basilaire de la base (tons aigus) à l'apex (tons graves). La mesure de la réponse de la membrane basilaire est effectuée au point FC8kHz.

Fig. 1.1: Schéma de l’appareil auditif humain comprenant l’oreille externe [E], l’oreille moyenne [M] et l’oreille interne [I]
Fig. 1.1: Schéma de l’appareil auditif humain comprenant l’oreille externe [E], l’oreille moyenne [M] et l’oreille interne [I]

Psychoacoustique et perception auditive

  • Les seuils auditifs
  • Intensité subjective
    • Échelle des phones
    • Échelle des sones ou échelle d’intensité subjective
  • Les filtres auditifs
    • Principe
    • Largeur des filtres auditifs
    • Forme des filtres auditifs
    • Pattern d’excitation

Si le seuil d'audition varie en fonction de la fréquence, il en est de même pour la sensation d'intensité. La figure 2.4 représente la valeur de sonie en fonction du niveau de sonie en phons.

Fig. 2.1: Courbes d’isosonie pour l’écoute binaurale sur écouteurs. Reproduit de [9]
Fig. 2.1: Courbes d’isosonie pour l’écoute binaurale sur écouteurs. Reproduit de [9]

Pathologies de l’audition

  • Les différents types de surdité
    • Les surdités de transmission
    • Les surdités de perception
  • Effets généraux des surdités
  • Rehaussement des seuils auditifs
  • Le phénomène de recrutement
  • L’élargissement des filtres auditifs

La surdité de transmission résulte d'une déficience de l'oreille moyenne ou externe au niveau du conduit auditif, du tympan ou de la chaîne des osselets (par exemple, après une otite). Parce que la transmission fonctionne anormalement, il y a une perte d'énergie qui est transférée au milieu liquide de la cochlée. Les stimuli auditifs pathologiques dont la fréquence correspond à la zone atteinte de la cochlée ne peuvent donc être perçus que dans une zone voisine.

Dans la suite de cette section, nous présenterons brièvement les effets des pathologies cochléaires.

Fig. 3.1: Courbes d’audiogramme en fonction de l’âge. Ces courbes représentent des moyennes d’audiogrammes cliniques (en perte de dB) réalisées chez des sujets âgés de 20 ans à 90 ans
Fig. 3.1: Courbes d’audiogramme en fonction de l’âge. Ces courbes représentent des moyennes d’audiogrammes cliniques (en perte de dB) réalisées chez des sujets âgés de 20 ans à 90 ans

Réhabilitation auditive par port de prothèses

  • Principe Général
  • Techniques de réhabilitation
    • Amplification et compression
    • Réduction du bruit
    • Traitements
  • Les différents types d’appareils auditifs
    • Les contours d’oreille
    • Les intra-auriculaires
    • Le choix du type de prothèse
  • Technologie des prothèses auditives
    • Transducteurs électro-acoustiques
    • Autres voies de transduction
    • Processeurs et puces de traitement

Idéalement, si l'on se réfère aux courbes de sonie de la figure 3.2, le gain de la prothèse est fonction de l'intensité sonore du signal entrant et devrait permettre d'obtenir la courbe de sonie normale. L'autre facteur décisif pour la compression est le choix des temps de réponse (temps de montée et de descente du compresseur). Le premier problème auquel le traitement du signal peut apporter une solution est le problème de rétroaction acoustique entre les transducteurs de la prothèse.

Rééducation auditive par port de prothèse au niveau de la bande passante (limitée par la puissance de calcul du processeur) et au niveau de la boucle entre transducteurs (limitée par le couplage acoustique).

Fig. 4.1: Schéma général d’une prothèse auditive
Fig. 4.1: Schéma général d’une prothèse auditive

Conclusion de la première partie

Deuxième partie . Réduction du bruit

Introduction de la deuxième partie

Rehaussement de la parole

  • Techniques de rehaussement de la parole
    • Contexte
    • Choix du type de méthode
  • Modification spectrale à court-terme
    • Principes
    • Filtrage de Wiener Paramétrique
    • Le phénomène du bruit musical
  • Règle de suppression d’Ephraïm et Malah
    • Introduction
    • Description de la méthode
    • Réduction du bruit musical

Parmi d'autres solutions potentielles, les méthodes de modification spectrale à court terme forment une famille d'algorithmes d'amélioration de la parole de référence. Désactivé |Oui[k]| on calcule une estimation de la densité spectrale de puissance du signal observé aux indices fréquentiels discrets k, notés Pys[k]. Dans cette section, nous avons présenté le principe général qui structure les techniques d'amélioration de la parole par atténuation spectrale à court terme comme celui des méthodes qui effectuent une estimation de l'amplitude spectrale à court terme du signal source.

L'origine du bruit musical est la variance des estimateurs locaux de la densité spectrale des signaux (cf. [14, 13]).

Fig. 5.1: Schéma général d’implémentation d’une méthode de débruitage par atténuation spectrale
Fig. 5.1: Schéma général d’implémentation d’une méthode de débruitage par atténuation spectrale

Estimation du niveau de bruit

  • Méthodes d’estimation du niveau de bruit
    • Principes
    • Estimation discontinue
    • Estimation continue
  • Solution adoptée
    • Modèle élémentaire de DAV
    • Mise à jour de l’estimateur
    • Validation du choix de la méthode

Ainsi, lorsque le signal de parole est détecté, il n'y a pas de mise à jour de l'estimation de la densité spectrale de puissance. On peut voir que l'estimation de la densité spectrale de puissance de bruit à cet instant est relativement proche de sa valeur réelle (c'est-à-dire 10). Différents tests d'évaluation ont été effectués sur les différentes techniques d'estimation du niveau de bruit.

Dans ces évaluations, les méthodes d'évaluation du niveau de bruit n'ont pas été directement évaluées, c'est-à-dire

Fig. 6.1: Estimation du niveau de bruit, aspect temporel. P y s [k] est indiquée en trait plein, tandis que P b s [k] est indiquée en trait pointillé
Fig. 6.1: Estimation du niveau de bruit, aspect temporel. P y s [k] est indiquée en trait plein, tandis que P b s [k] est indiquée en trait pointillé

Application de la règle de

Motivations à l’utilisation de l’échelle des ERB

  • Filtres auditifs et perception des signaux bruités
  • Choix de l’échelle fréquentielle
  • Application de l’EMSR selon une analyse en échelle ERB
  • Rehaussement de la parole sur une échelle fréquentielle non-linéairenon-linéaire

On peut également noter l'utilisation de l'échelle de Bark et d'une autre échelle de fréquence issue de la psychoacoustique, l'échelle mel, dans le traitement de la parole [63, 12]. Ainsi, selon la théorie, l'EMSR est censé être d'autant plus efficace que la taille du TFCT est grande. En fait, nous avons déjà mentionné la compatibilité architecturale entre les méthodes d'amélioration de la parole par atténuation spectrale à court terme et les autres modules de traitement du signal dans une prothèse auditive.

Dans [34], les auteurs comparent différentes méthodes d'amélioration de la parole réalisées sur un banc de filtres d'ondelettes de 70 canaux et sur un banc de filtres de 256 canaux non uniformes avec une implémentation classique utilisant un TFCT sur 256 canaux.

Fig. 7.1: Correspondance entre l’échelle ERB et les valeurs en Hertz
Fig. 7.1: Correspondance entre l’échelle ERB et les valeurs en Hertz

Synthèse de bancs de filtres sur-échantillonnés en échelle ERB

A partir de ces différents paramètres il est alors possible de calculer explicitement les expressions des réponses impulsionnelles de chaque filtre du banc. La figure 7.2 montre les réponses en fréquence d'un tel banc de filtres construit avec K = 32 canaux et une demi-longueur L = 1000. La contrainte imposée à la synthèse des filtres est la reconstruction parfaite du signal d'entrée par simple addition de signaux de sous-bande.

Fig. 7.2: Réponses en fréquence d’un banc de filtres ERB 32 canaux pour L=1000 filtres d’analyse, le signal d’entrée y[n] est ainsi décomposé en K signaux de sous-bande
Fig. 7.2: Réponses en fréquence d’un banc de filtres ERB 32 canaux pour L=1000 filtres d’analyse, le signal d’entrée y[n] est ainsi décomposé en K signaux de sous-bande

Implémentation de l’EMSR pour une analyse banc de filtres

Application de l'EMSR à une analyse dans un banc de filtres ERB où l'on rappelle que k est l'indice de sous-bande, N est la taille de bloc et R est le pré-pas entre deux blocs consécutifs. Une fois que nous avons, pour chaque trame s et pour chaque sous-bande de fréquence d'indice k, l'estimateur de la puissance spectrale Pys[k], la suite des calculs des différents paramètres nécessaires à la définition de l'amplification spectrale de l L'EMSR (a priori et a posteriori RSB), GEMs[k], et l'estimation de la puissance de bruit Pbs[k] fonctionnent de manière strictement identique au cas classique présenté ci-dessus. Enfin, comme l'indique la condition de reconstruction de signal de l'équation (7.3), le signal amélioré est construit en ajoutant des signaux amplifiés en sous-bande.

La définition de la taille de bloc considérée doit être modifiée et l'étape d'interpolation et le banc de filtres de synthèse doivent être ajoutés avant la reconstruction finale par sommation des signaux de sous-bande de l'équation (7.8).

Fig. 7.3: Application du gain spectral sur des blocs recouvrants
Fig. 7.3: Application du gain spectral sur des blocs recouvrants

Résultats et discussion

  • Protocole d’évaluation
    • Motivations
    • Choix d’implémentations
    • Corpus de test
  • Amélioration du Rapport Signal à Bruit
    • Avec estimation du bruit
    • Sans estimation du bruit
  • Évaluation subjective
    • Analyse subjective
    • Tests subjectifs
    • Résultats

Pour donner une indication plus précise de la coloration spectrale des bruits utilisés, nous avons reproduit sur la figure 8.2 les spectrogrammes correspondants du bruit de voiture et du bruit de brouhaha. En utilisant rigoureusement la même paramétrisation EMSR et l'estimation du bruit aveugle dans les trois méthodes, nous obtenons les résultats qualitatifs suivants. Évaluation subjective 117 On peut également observer que la méthode classique se comporte mieux que les autres face au bruit blanc.

Avec l'estimation du bruit aveugle décrite au chapitre 6, les résultats sont plus nuancés, comme le montre le tableau 8.4.

Tab. 8.1: Paramètres d’implémentation des méthodes de rehaussement
Tab. 8.1: Paramètres d’implémentation des méthodes de rehaussement

Conclusion de la deuxième partie

Conclusion

122 Conclusion de la deuxième partie Les performances de l'EMSR appliqué à une échelle ERB sont très intéressantes car, comme les autres méthodes d'atténuation spectrale à court terme, l'EMSR partage le principe d'appliquer un gain variable pour chaque sous-bande. Cependant, l'analyse de l'échelle ERB est particulièrement bénéfique pour le gain et la compression, car l'échelle ERB dérive directement de la modélisation des filtres auditifs.

Perspectives

Troisième partie

Annulation de retour acoustique

Introduction de la troisième partie

Retour acoustique dans les prothèses auditives

  • Description du système acoustique
  • Description du système électrique
  • Étude de stabilité
    • Étude de stabilité à temps continu
    • Étude de stabilité à temps discret
  • Analyse des conditions de stabilité dans une prothèse auditiveprothèse auditive
    • Facteurs pénalisant la stabilité dans une prothèse auditive
    • Variabilité des conditions
    • Distorsions

A(p) est la fonction de transfert du microphone, B(p) celle de l'écouteur et G(z) la fonction de transfert discrète de la puce de traitement qui effectue la compensation de la perte auditive. Ici, nous faisons l'hypothèse que la réponse de chaque module de la prothèse peut être modélisée par une fonction de transfert linéaire invariante dans le temps (LIT). G(p) représentant l'équivalent dans le domaine continu de G(z), la fonction de transfert discrète de la prothèse.

Un modèle d'aide auditive à rétroaction discrète équivalent est illustré à la figure 9.5.

Fig. 9.2: Schéma de la prothèse auditive avec bouclage.
Fig. 9.2: Schéma de la prothèse auditive avec bouclage.

Techniques de compensation du retour acoustique

  • Méthodes classiques
    • Contrainte sur le chemin d’écho
    • Contraintes sur le gain
  • Solutions récentes
    • Description des méthodes
    • Prévention de l’accrochage
    • Compensation de l’écho
    • Annulation de l’écho
  • Annulation d’écho par filtrage adaptatif
    • Utilisation du gradient stochastique dans une prothèse auditiveauditive
    • Continuité de l’adaptation
    • Émission d’une séquence de bruit

En effet, la mise en oeuvre d'un annuleur d'écho par filtrage adaptatif permet en théorie d'obtenir une solution optimale du point de vue de la réhabilitation. Fig.10.2 : Schéma d'une prothèse auditive avec bouclage et annulation d'écho G(z) représente la compensation de la perte auditive ; le filtre adaptatif H(z)c estime la fonction de transfert de trajet d'écho H(z). G(z).∆H(z)|<1 (10.5) Cette nouvelle expression de la condition de stabilité suffisante montre l'intérêt d'utiliser une technique d'annulation d'écho dans le cadre des prothèses auditives.

Dans le cas présent, au contraire, le signal d'écho provient du signal source via la prothèse comme le montre la figure (10.4).

Fig. 10.1: Gabarit d’un filtre réjecteur réglable. La fréquence centrale de la bande rejetée, f r , est ajustée sur la fréquence d’accrochage lors de la mise en place de l’appareil.
Fig. 10.1: Gabarit d’un filtre réjecteur réglable. La fréquence centrale de la bande rejetée, f r , est ajustée sur la fréquence d’accrochage lors de la mise en place de l’appareil.

Domaine d’implémentation du LMS

Le délai

Cette approche permet d'avoir un certain contrôle sur les qualités du signal excitateur par rapport au processus adaptatif. Il serait alors possible d'utiliser la connaissance du phénomène de masquage pour transmettre ce type de séquence de bruit en dessous du seuil de masquage du signal utilisable. Techniques de compensation de larsen acoustique D'autre part, on peut noter que la présence d'un retard entre l'acquisition et la reproduction du signal audio est inhérente aux techniques de traitement par blocs utilisées en filtrage adaptatif.

Par conséquent, il convient de choisir la taille des blocs en fonction du délai de calcul et du délai maximum.

Synthèse

Annulation d’écho par filtrage adaptatif

  • LMS temporel par blocs
    • Principes
    • Calcul de l’erreur par convolution
    • Mise à jour du filtre adaptatif
  • LMS Rapide dans le domaine fréquentiel
    • Principes
    • Convolution rapide dans le domaine de la transformée de FourierFourier
    • Mise à jour du filtre adaptatif
  • FLMS dans le domaine de la transformée de Hartley discrète
    • La transformée de Hartley discrète
    • Convolution rapide dans le domaine de la transformée de HartleyHartley
    • Mise à jour du filtre adaptatif

LMS rapide dans le domaine fréquentiel 157 Soit ues le produit de la convolution circulaire entre ja et ehs. La réalisation de la convolution circulaire est moins directement exprimable dans le domaine de la transformation THD que son équivalent dans le domaine fréquentiel. FLMS dans le domaine de la transformée de Hartley discrète 161 L'équation (11.16) est alors reformulée comme suit.

En effet, la corrélation croisée est calculée dans le domaine THD par la formule Yfs⋆Ees, où.

Filtre à Délais Multiples Généralisé

  • Principes
  • Synthèse WOLA
  • Partitionnement des données
  • Implémentation du LMS

Prado et Moulines ont expliqué son application dans le domaine du THD dans [61]. 12.6) Chaque sous-bloc hks est alors mélangé dans le domaine THD avec N +L−1 échantillons de dey[n]. 12.7) On veut calculer le produit de convolution circulaire entre hs et le vecteur po de taille N +L′ −1 et défini par.

Dans le domaine THD, l'erreur est définie comme dans le FLMS selon l'équation (11.35).

Fig. 12.1: Décomposition d’un filtre en sous-blocs pour l’implémentation du GMDF. Le filtre original de taille L ′ = K · L est décomposé en K sous blocs de taille L au moyen d’une structure à délais multiples
Fig. 12.1: Décomposition d’un filtre en sous-blocs pour l’implémentation du GMDF. Le filtre original de taille L ′ = K · L est décomposé en K sous blocs de taille L au moyen d’une structure à délais multiples

Modification du pas d’adaptation

  • Pas d’adaptation du LMS
    • Rôle du pas d’adaptation
    • Normalisation du gradient
  • Modification de la définition du pas d’adaptation
    • Seuil minimal de la puissance spectrale par sous-bande
    • Prise en compte de la puissance spectrale de l’erreur

A cet effet, chaque coefficient de Ts est défini comme l'inverse de la puissance spectrale de Yfs. Dans le domaine du THD, compte tenu de la relation entre TFD et THD, le terme est équivalent au terme. Modification de la définition de l'étape d'adaptation 173 Dans le cadre des prothèses auditives, la complexité algorithmique des doubles détecteurs de parole est très importante par rapport aux faibles capacités de calcul des DSP.

Comme précédemment pour Pys, nous définissons la force du signal d'erreur dans le domaine du THD par .

Fig. 13.1: Définition de la puissance moyenne par sous-bandes. P y s est représenté en trait pointillé
Fig. 13.1: Définition de la puissance moyenne par sous-bandes. P y s est représenté en trait pointillé

Résultats - Simulations

  • Motivations
  • Simulations Matlab
    • Description de l’environnement

Imagem

Fig. 1.1: Schéma de l’appareil auditif humain comprenant l’oreille externe [E], l’oreille moyenne [M] et l’oreille interne [I]
Fig. 1.4: Section axiale de la cochlée (image INSERM reproduit de [62])
Fig. 1.8: Représentation schématique de l’enveloppe des ondes propagées selon le modèle de von Békésy
Fig. 1.10: Réponse de la membrane basilaire d’un cobaye à un son pur de 10 kHz, le mécanisme actif amplifie de 50 dB la vibration de la membrane basilaire par rapport à l’enveloppe passive de Békésy et affine la sélectivité fréquentielle.
+7

Referências

Documentos relacionados

Si, dans une oeuvre d'art, nous visons d'abord un objet, nous la désapproprions de son propre, comme nous dé-visageons - lui ôtant son visage - l'autre que notre regard s'objecte et