Traitement numérique du signal acoustique pour une aide aux malentendants

Dans un deuxième temps, nous avons étudié le problème de rétroaction acoustique entre les transducteurs de la prothèse. La dernière partie de ce travail consiste à développer une implémentation en temps réel de l'algorithme d'annulation du Larsen précédemment proposé à l'aide d'un prototype d'aide auditive.

Liste des tableaux

Liste des abréviations

ITE intra-auriculaire ; intra-conque, prothèse placée dans la conque (voir page 60) LIT Linéaire Invariant dans le temps. LMS Eastern Mean Square ; Moyenne des moindres carrés, algorithme de gradient stochastique Filtre multi-décalage MDF ; Filtre à retard multiple.

Introduction générale

Par conséquent, la mise en œuvre d'un algorithme pour améliorer la parole est assez pratique. Pour limiter ce souci, il n'y a guère d'autre solution à l'heure actuelle que de limiter l'amplification apportée au signal, ce qui revient à limiter les capacités auditives rééducatrices de la prothèse.

Première partie

Audition et réhabilitation auditive

Introduction de la première partie

Anatomie et physiologie de l’appareil auditif

Principe général
Mesure physique de l’intensité
L’oreille externe

Anatomie
Physiologie

L’oreille moyenne

Anatomie
Physiologie

L’oreille interne

Anatomie
Physiologie de la cochlée

Le nerf auditif

Courbe d’accord
Codage de la fréquence
Codage de l’intensité

Conclusions sur la physiologie de l’appareil auditif

La tonotopie passive mobilise la membrane basilaire de la base (tons aigus) à l'apex (tons graves). La mesure de la réponse de la membrane basilaire est effectuée au point FC8kHz.

Fig. 1.1: Schéma de l’appareil auditif humain comprenant l’oreille externe [E], l’oreille moyenne [M] et l’oreille interne [I]

Psychoacoustique et perception auditive

Les seuils auditifs
Intensité subjective

Échelle des phones
Échelle des sones ou échelle d’intensité subjective

Les filtres auditifs

Principe
Largeur des filtres auditifs
Forme des filtres auditifs
Pattern d’excitation

Si le seuil d'audition varie en fonction de la fréquence, il en est de même pour la sensation d'intensité. La figure 2.4 représente la valeur de sonie en fonction du niveau de sonie en phons.

Fig. 2.1: Courbes d’isosonie pour l’écoute binaurale sur écouteurs. Reproduit de [9]

Pathologies de l’audition

Les différents types de surdité

Les surdités de transmission
Les surdités de perception

Effets généraux des surdités
Rehaussement des seuils auditifs
Le phénomène de recrutement
L’élargissement des filtres auditifs

La surdité de transmission résulte d'une déficience de l'oreille moyenne ou externe au niveau du conduit auditif, du tympan ou de la chaîne des osselets (par exemple, après une otite). Parce que la transmission fonctionne anormalement, il y a une perte d'énergie qui est transférée au milieu liquide de la cochlée. Les stimuli auditifs pathologiques dont la fréquence correspond à la zone atteinte de la cochlée ne peuvent donc être perçus que dans une zone voisine.

Dans la suite de cette section, nous présenterons brièvement les effets des pathologies cochléaires.

Fig. 3.1: Courbes d’audiogramme en fonction de l’âge. Ces courbes représentent des moyennes d’audiogrammes cliniques (en perte de dB) réalisées chez des sujets âgés de 20 ans à 90 ans

Réhabilitation auditive par port de prothèses

Principe Général
Techniques de réhabilitation

Amplification et compression
Réduction du bruit
Traitements

Les différents types d’appareils auditifs

Les contours d’oreille
Les intra-auriculaires
Le choix du type de prothèse

Technologie des prothèses auditives

Transducteurs électro-acoustiques
Autres voies de transduction
Processeurs et puces de traitement

Idéalement, si l'on se réfère aux courbes de sonie de la figure 3.2, le gain de la prothèse est fonction de l'intensité sonore du signal entrant et devrait permettre d'obtenir la courbe de sonie normale. L'autre facteur décisif pour la compression est le choix des temps de réponse (temps de montée et de descente du compresseur). Le premier problème auquel le traitement du signal peut apporter une solution est le problème de rétroaction acoustique entre les transducteurs de la prothèse.

Rééducation auditive par port de prothèse au niveau de la bande passante (limitée par la puissance de calcul du processeur) et au niveau de la boucle entre transducteurs (limitée par le couplage acoustique).

Fig. 4.1: Schéma général d’une prothèse auditive

Conclusion de la première partie

Deuxième partie . Réduction du bruit

Introduction de la deuxième partie

Rehaussement de la parole

Techniques de rehaussement de la parole

Contexte
Choix du type de méthode

Modification spectrale à court-terme

Principes
Filtrage de Wiener Paramétrique
Le phénomène du bruit musical

Règle de suppression d’Ephraïm et Malah

Introduction
Description de la méthode
Réduction du bruit musical

Parmi d'autres solutions potentielles, les méthodes de modification spectrale à court terme forment une famille d'algorithmes d'amélioration de la parole de référence. Désactivé |Oui[k]| on calcule une estimation de la densité spectrale de puissance du signal observé aux indices fréquentiels discrets k, notés Pys[k]. Dans cette section, nous avons présenté le principe général qui structure les techniques d'amélioration de la parole par atténuation spectrale à court terme comme celui des méthodes qui effectuent une estimation de l'amplitude spectrale à court terme du signal source.

L'origine du bruit musical est la variance des estimateurs locaux de la densité spectrale des signaux (cf. [14, 13]).

Fig. 5.1: Schéma général d’implémentation d’une méthode de débruitage par atténuation spectrale

Estimation du niveau de bruit

Méthodes d’estimation du niveau de bruit

Principes
Estimation discontinue
Estimation continue

Solution adoptée

Modèle élémentaire de DAV
Mise à jour de l’estimateur
Validation du choix de la méthode

Ainsi, lorsque le signal de parole est détecté, il n'y a pas de mise à jour de l'estimation de la densité spectrale de puissance. On peut voir que l'estimation de la densité spectrale de puissance de bruit à cet instant est relativement proche de sa valeur réelle (c'est-à-dire 10). Différents tests d'évaluation ont été effectués sur les différentes techniques d'estimation du niveau de bruit.

Dans ces évaluations, les méthodes d'évaluation du niveau de bruit n'ont pas été directement évaluées, c'est-à-dire

Fig. 6.1: Estimation du niveau de bruit, aspect temporel. P y s [k] est indiquée en trait plein, tandis que P b s [k] est indiquée en trait pointillé

Application de la règle de

Motivations à l’utilisation de l’échelle des ERB

Filtres auditifs et perception des signaux bruités
Choix de l’échelle fréquentielle
Application de l’EMSR selon une analyse en échelle ERB
Rehaussement de la parole sur une échelle fréquentielle non-linéairenon-linéaire

On peut également noter l'utilisation de l'échelle de Bark et d'une autre échelle de fréquence issue de la psychoacoustique, l'échelle mel, dans le traitement de la parole [63, 12]. Ainsi, selon la théorie, l'EMSR est censé être d'autant plus efficace que la taille du TFCT est grande. En fait, nous avons déjà mentionné la compatibilité architecturale entre les méthodes d'amélioration de la parole par atténuation spectrale à court terme et les autres modules de traitement du signal dans une prothèse auditive.

Dans [34], les auteurs comparent différentes méthodes d'amélioration de la parole réalisées sur un banc de filtres d'ondelettes de 70 canaux et sur un banc de filtres de 256 canaux non uniformes avec une implémentation classique utilisant un TFCT sur 256 canaux.

Fig. 7.1: Correspondance entre l’échelle ERB et les valeurs en Hertz

Synthèse de bancs de filtres sur-échantillonnés en échelle ERB

A partir de ces différents paramètres il est alors possible de calculer explicitement les expressions des réponses impulsionnelles de chaque filtre du banc. La figure 7.2 montre les réponses en fréquence d'un tel banc de filtres construit avec K = 32 canaux et une demi-longueur L = 1000. La contrainte imposée à la synthèse des filtres est la reconstruction parfaite du signal d'entrée par simple addition de signaux de sous-bande.

Fig. 7.2: Réponses en fréquence d’un banc de filtres ERB 32 canaux pour L=1000 filtres d’analyse, le signal d’entrée y[n] est ainsi décomposé en K signaux de sous-bande

Implémentation de l’EMSR pour une analyse banc de filtres

Application de l'EMSR à une analyse dans un banc de filtres ERB où l'on rappelle que k est l'indice de sous-bande, N est la taille de bloc et R est le pré-pas entre deux blocs consécutifs. Une fois que nous avons, pour chaque trame s et pour chaque sous-bande de fréquence d'indice k, l'estimateur de la puissance spectrale Pys[k], la suite des calculs des différents paramètres nécessaires à la définition de l'amplification spectrale de l L'EMSR (a priori et a posteriori RSB), GEMs[k], et l'estimation de la puissance de bruit Pbs[k] fonctionnent de manière strictement identique au cas classique présenté ci-dessus. Enfin, comme l'indique la condition de reconstruction de signal de l'équation (7.3), le signal amélioré est construit en ajoutant des signaux amplifiés en sous-bande.

La définition de la taille de bloc considérée doit être modifiée et l'étape d'interpolation et le banc de filtres de synthèse doivent être ajoutés avant la reconstruction finale par sommation des signaux de sous-bande de l'équation (7.8).

Fig. 7.3: Application du gain spectral sur des blocs recouvrants

Résultats et discussion

Protocole d’évaluation

Motivations
Choix d’implémentations
Corpus de test

Amélioration du Rapport Signal à Bruit

Avec estimation du bruit
Sans estimation du bruit

Évaluation subjective

Analyse subjective
Tests subjectifs
Résultats

Pour donner une indication plus précise de la coloration spectrale des bruits utilisés, nous avons reproduit sur la figure 8.2 les spectrogrammes correspondants du bruit de voiture et du bruit de brouhaha. En utilisant rigoureusement la même paramétrisation EMSR et l'estimation du bruit aveugle dans les trois méthodes, nous obtenons les résultats qualitatifs suivants. Évaluation subjective 117 On peut également observer que la méthode classique se comporte mieux que les autres face au bruit blanc.

Avec l'estimation du bruit aveugle décrite au chapitre 6, les résultats sont plus nuancés, comme le montre le tableau 8.4.

Tab. 8.1: Paramètres d’implémentation des méthodes de rehaussement

Conclusion de la deuxième partie

Conclusion

122 Conclusion de la deuxième partie Les performances de l'EMSR appliqué à une échelle ERB sont très intéressantes car, comme les autres méthodes d'atténuation spectrale à court terme, l'EMSR partage le principe d'appliquer un gain variable pour chaque sous-bande. Cependant, l'analyse de l'échelle ERB est particulièrement bénéfique pour le gain et la compression, car l'échelle ERB dérive directement de la modélisation des filtres auditifs.

Perspectives

Troisième partie

Annulation de retour acoustique

Introduction de la troisième partie

Retour acoustique dans les prothèses auditives

Description du système acoustique
Description du système électrique
Étude de stabilité

Étude de stabilité à temps continu
Étude de stabilité à temps discret

Analyse des conditions de stabilité dans une prothèse auditiveprothèse auditive

Facteurs pénalisant la stabilité dans une prothèse auditive
Variabilité des conditions
Distorsions

A(p) est la fonction de transfert du microphone, B(p) celle de l'écouteur et G(z) la fonction de transfert discrète de la puce de traitement qui effectue la compensation de la perte auditive. Ici, nous faisons l'hypothèse que la réponse de chaque module de la prothèse peut être modélisée par une fonction de transfert linéaire invariante dans le temps (LIT). G(p) représentant l'équivalent dans le domaine continu de G(z), la fonction de transfert discrète de la prothèse.

Un modèle d'aide auditive à rétroaction discrète équivalent est illustré à la figure 9.5.

Fig. 9.2: Schéma de la prothèse auditive avec bouclage.

Techniques de compensation du retour acoustique

Méthodes classiques

Contrainte sur le chemin d’écho
Contraintes sur le gain

Solutions récentes

Description des méthodes
Prévention de l’accrochage
Compensation de l’écho
Annulation de l’écho

Annulation d’écho par filtrage adaptatif

Utilisation du gradient stochastique dans une prothèse auditiveauditive
Continuité de l’adaptation
Émission d’une séquence de bruit

En effet, la mise en oeuvre d'un annuleur d'écho par filtrage adaptatif permet en théorie d'obtenir une solution optimale du point de vue de la réhabilitation. Fig.10.2 : Schéma d'une prothèse auditive avec bouclage et annulation d'écho G(z) représente la compensation de la perte auditive ; le filtre adaptatif H(z)c estime la fonction de transfert de trajet d'écho H(z). G(z).∆H(z)|<1 (10.5) Cette nouvelle expression de la condition de stabilité suffisante montre l'intérêt d'utiliser une technique d'annulation d'écho dans le cadre des prothèses auditives.

Dans le cas présent, au contraire, le signal d'écho provient du signal source via la prothèse comme le montre la figure (10.4).

Fig. 10.1: Gabarit d’un filtre réjecteur réglable. La fréquence centrale de la bande rejetée, f r , est ajustée sur la fréquence d’accrochage lors de la mise en place de l’appareil.

Domaine d’implémentation du LMS

Le délai

Cette approche permet d'avoir un certain contrôle sur les qualités du signal excitateur par rapport au processus adaptatif. Il serait alors possible d'utiliser la connaissance du phénomène de masquage pour transmettre ce type de séquence de bruit en dessous du seuil de masquage du signal utilisable. Techniques de compensation de larsen acoustique D'autre part, on peut noter que la présence d'un retard entre l'acquisition et la reproduction du signal audio est inhérente aux techniques de traitement par blocs utilisées en filtrage adaptatif.

Par conséquent, il convient de choisir la taille des blocs en fonction du délai de calcul et du délai maximum.

Synthèse

Annulation d’écho par filtrage adaptatif

LMS temporel par blocs

Principes
Calcul de l’erreur par convolution
Mise à jour du filtre adaptatif

LMS Rapide dans le domaine fréquentiel

Principes
Convolution rapide dans le domaine de la transformée de FourierFourier

FLMS dans le domaine de la transformée de Hartley discrète

La transformée de Hartley discrète
Convolution rapide dans le domaine de la transformée de HartleyHartley

LMS rapide dans le domaine fréquentiel 157 Soit ues le produit de la convolution circulaire entre ja et ehs. La réalisation de la convolution circulaire est moins directement exprimable dans le domaine de la transformation THD que son équivalent dans le domaine fréquentiel. FLMS dans le domaine de la transformée de Hartley discrète 161 L'équation (11.16) est alors reformulée comme suit.

En effet, la corrélation croisée est calculée dans le domaine THD par la formule Yfs⋆Ees, où.

Filtre à Délais Multiples Généralisé

Principes
Synthèse WOLA
Partitionnement des données
Implémentation du LMS

Prado et Moulines ont expliqué son application dans le domaine du THD dans [61]. 12.6) Chaque sous-bloc hks est alors mélangé dans le domaine THD avec N +L−1 échantillons de dey[n]. 12.7) On veut calculer le produit de convolution circulaire entre hs et le vecteur po de taille N +L′ −1 et défini par.

Dans le domaine THD, l'erreur est définie comme dans le FLMS selon l'équation (11.35).

Fig. 12.1: Décomposition d’un filtre en sous-blocs pour l’implémentation du GMDF. Le filtre original de taille L ′ = K · L est décomposé en K sous blocs de taille L au moyen d’une structure à délais multiples

Modification du pas d’adaptation

Pas d’adaptation du LMS

Rôle du pas d’adaptation
Normalisation du gradient

Modification de la définition du pas d’adaptation

Seuil minimal de la puissance spectrale par sous-bande
Prise en compte de la puissance spectrale de l’erreur

A cet effet, chaque coefficient de Ts est défini comme l'inverse de la puissance spectrale de Yfs. Dans le domaine du THD, compte tenu de la relation entre TFD et THD, le terme est équivalent au terme. Modification de la définition de l'étape d'adaptation 173 Dans le cadre des prothèses auditives, la complexité algorithmique des doubles détecteurs de parole est très importante par rapport aux faibles capacités de calcul des DSP.

Comme précédemment pour Pys, nous définissons la force du signal d'erreur dans le domaine du THD par .

Fig. 13.1: Définition de la puissance moyenne par sous-bandes. P y s est représenté en trait pointillé

Résultats - Simulations

Motivations
Simulations Matlab

Description de l’environnement