Dans un deuxième temps, nous avons étudié le problème de rétroaction acoustique entre les transducteurs de la prothèse. La dernière partie de ce travail consiste à développer une implémentation en temps réel de l'algorithme d'annulation du Larsen précédemment proposé à l'aide d'un prototype d'aide auditive.
Liste des tableaux
Liste des abréviations
ITE intra-auriculaire ; intra-conque, prothèse placée dans la conque (voir page 60) LIT Linéaire Invariant dans le temps. LMS Eastern Mean Square ; Moyenne des moindres carrés, algorithme de gradient stochastique Filtre multi-décalage MDF ; Filtre à retard multiple.
Introduction générale
Par conséquent, la mise en œuvre d'un algorithme pour améliorer la parole est assez pratique. Pour limiter ce souci, il n'y a guère d'autre solution à l'heure actuelle que de limiter l'amplification apportée au signal, ce qui revient à limiter les capacités auditives rééducatrices de la prothèse.
Première partie
Audition et réhabilitation auditive
Introduction de la première partie
Anatomie et physiologie de l’appareil auditif
- Principe général
- Mesure physique de l’intensité
- L’oreille externe
- Anatomie
- Physiologie
- L’oreille moyenne
- Anatomie
- Physiologie
- L’oreille interne
- Anatomie
- Physiologie de la cochlée
- Le nerf auditif
- Courbe d’accord
- Codage de la fréquence
- Codage de l’intensité
- Conclusions sur la physiologie de l’appareil auditif
La tonotopie passive mobilise la membrane basilaire de la base (tons aigus) à l'apex (tons graves). La mesure de la réponse de la membrane basilaire est effectuée au point FC8kHz.
Psychoacoustique et perception auditive
- Les seuils auditifs
- Intensité subjective
- Échelle des phones
- Échelle des sones ou échelle d’intensité subjective
- Les filtres auditifs
- Principe
- Largeur des filtres auditifs
- Forme des filtres auditifs
- Pattern d’excitation
Si le seuil d'audition varie en fonction de la fréquence, il en est de même pour la sensation d'intensité. La figure 2.4 représente la valeur de sonie en fonction du niveau de sonie en phons.
Pathologies de l’audition
- Les différents types de surdité
- Les surdités de transmission
- Les surdités de perception
- Effets généraux des surdités
- Rehaussement des seuils auditifs
- Le phénomène de recrutement
- L’élargissement des filtres auditifs
La surdité de transmission résulte d'une déficience de l'oreille moyenne ou externe au niveau du conduit auditif, du tympan ou de la chaîne des osselets (par exemple, après une otite). Parce que la transmission fonctionne anormalement, il y a une perte d'énergie qui est transférée au milieu liquide de la cochlée. Les stimuli auditifs pathologiques dont la fréquence correspond à la zone atteinte de la cochlée ne peuvent donc être perçus que dans une zone voisine.
Dans la suite de cette section, nous présenterons brièvement les effets des pathologies cochléaires.
Réhabilitation auditive par port de prothèses
- Principe Général
- Techniques de réhabilitation
- Amplification et compression
- Réduction du bruit
- Traitements
- Les différents types d’appareils auditifs
- Les contours d’oreille
- Les intra-auriculaires
- Le choix du type de prothèse
- Technologie des prothèses auditives
- Transducteurs électro-acoustiques
- Autres voies de transduction
- Processeurs et puces de traitement
Idéalement, si l'on se réfère aux courbes de sonie de la figure 3.2, le gain de la prothèse est fonction de l'intensité sonore du signal entrant et devrait permettre d'obtenir la courbe de sonie normale. L'autre facteur décisif pour la compression est le choix des temps de réponse (temps de montée et de descente du compresseur). Le premier problème auquel le traitement du signal peut apporter une solution est le problème de rétroaction acoustique entre les transducteurs de la prothèse.
Rééducation auditive par port de prothèse au niveau de la bande passante (limitée par la puissance de calcul du processeur) et au niveau de la boucle entre transducteurs (limitée par le couplage acoustique).
Conclusion de la première partie
Deuxième partie . Réduction du bruit
Introduction de la deuxième partie
Rehaussement de la parole
- Techniques de rehaussement de la parole
- Contexte
- Choix du type de méthode
- Modification spectrale à court-terme
- Principes
- Filtrage de Wiener Paramétrique
- Le phénomène du bruit musical
- Règle de suppression d’Ephraïm et Malah
- Introduction
- Description de la méthode
- Réduction du bruit musical
Parmi d'autres solutions potentielles, les méthodes de modification spectrale à court terme forment une famille d'algorithmes d'amélioration de la parole de référence. Désactivé |Oui[k]| on calcule une estimation de la densité spectrale de puissance du signal observé aux indices fréquentiels discrets k, notés Pys[k]. Dans cette section, nous avons présenté le principe général qui structure les techniques d'amélioration de la parole par atténuation spectrale à court terme comme celui des méthodes qui effectuent une estimation de l'amplitude spectrale à court terme du signal source.
L'origine du bruit musical est la variance des estimateurs locaux de la densité spectrale des signaux (cf. [14, 13]).
Estimation du niveau de bruit
- Méthodes d’estimation du niveau de bruit
- Principes
- Estimation discontinue
- Estimation continue
- Solution adoptée
- Modèle élémentaire de DAV
- Mise à jour de l’estimateur
- Validation du choix de la méthode
Ainsi, lorsque le signal de parole est détecté, il n'y a pas de mise à jour de l'estimation de la densité spectrale de puissance. On peut voir que l'estimation de la densité spectrale de puissance de bruit à cet instant est relativement proche de sa valeur réelle (c'est-à-dire 10). Différents tests d'évaluation ont été effectués sur les différentes techniques d'estimation du niveau de bruit.
Dans ces évaluations, les méthodes d'évaluation du niveau de bruit n'ont pas été directement évaluées, c'est-à-dire
Application de la règle de
Motivations à l’utilisation de l’échelle des ERB
- Filtres auditifs et perception des signaux bruités
- Choix de l’échelle fréquentielle
- Application de l’EMSR selon une analyse en échelle ERB
- Rehaussement de la parole sur une échelle fréquentielle non-linéairenon-linéaire
On peut également noter l'utilisation de l'échelle de Bark et d'une autre échelle de fréquence issue de la psychoacoustique, l'échelle mel, dans le traitement de la parole [63, 12]. Ainsi, selon la théorie, l'EMSR est censé être d'autant plus efficace que la taille du TFCT est grande. En fait, nous avons déjà mentionné la compatibilité architecturale entre les méthodes d'amélioration de la parole par atténuation spectrale à court terme et les autres modules de traitement du signal dans une prothèse auditive.
Dans [34], les auteurs comparent différentes méthodes d'amélioration de la parole réalisées sur un banc de filtres d'ondelettes de 70 canaux et sur un banc de filtres de 256 canaux non uniformes avec une implémentation classique utilisant un TFCT sur 256 canaux.
Synthèse de bancs de filtres sur-échantillonnés en échelle ERB
A partir de ces différents paramètres il est alors possible de calculer explicitement les expressions des réponses impulsionnelles de chaque filtre du banc. La figure 7.2 montre les réponses en fréquence d'un tel banc de filtres construit avec K = 32 canaux et une demi-longueur L = 1000. La contrainte imposée à la synthèse des filtres est la reconstruction parfaite du signal d'entrée par simple addition de signaux de sous-bande.
Implémentation de l’EMSR pour une analyse banc de filtres
Application de l'EMSR à une analyse dans un banc de filtres ERB où l'on rappelle que k est l'indice de sous-bande, N est la taille de bloc et R est le pré-pas entre deux blocs consécutifs. Une fois que nous avons, pour chaque trame s et pour chaque sous-bande de fréquence d'indice k, l'estimateur de la puissance spectrale Pys[k], la suite des calculs des différents paramètres nécessaires à la définition de l'amplification spectrale de l L'EMSR (a priori et a posteriori RSB), GEMs[k], et l'estimation de la puissance de bruit Pbs[k] fonctionnent de manière strictement identique au cas classique présenté ci-dessus. Enfin, comme l'indique la condition de reconstruction de signal de l'équation (7.3), le signal amélioré est construit en ajoutant des signaux amplifiés en sous-bande.
La définition de la taille de bloc considérée doit être modifiée et l'étape d'interpolation et le banc de filtres de synthèse doivent être ajoutés avant la reconstruction finale par sommation des signaux de sous-bande de l'équation (7.8).
Résultats et discussion
- Protocole d’évaluation
- Motivations
- Choix d’implémentations
- Corpus de test
- Amélioration du Rapport Signal à Bruit
- Avec estimation du bruit
- Sans estimation du bruit
- Évaluation subjective
- Analyse subjective
- Tests subjectifs
- Résultats
Pour donner une indication plus précise de la coloration spectrale des bruits utilisés, nous avons reproduit sur la figure 8.2 les spectrogrammes correspondants du bruit de voiture et du bruit de brouhaha. En utilisant rigoureusement la même paramétrisation EMSR et l'estimation du bruit aveugle dans les trois méthodes, nous obtenons les résultats qualitatifs suivants. Évaluation subjective 117 On peut également observer que la méthode classique se comporte mieux que les autres face au bruit blanc.
Avec l'estimation du bruit aveugle décrite au chapitre 6, les résultats sont plus nuancés, comme le montre le tableau 8.4.
Conclusion de la deuxième partie
Conclusion
122 Conclusion de la deuxième partie Les performances de l'EMSR appliqué à une échelle ERB sont très intéressantes car, comme les autres méthodes d'atténuation spectrale à court terme, l'EMSR partage le principe d'appliquer un gain variable pour chaque sous-bande. Cependant, l'analyse de l'échelle ERB est particulièrement bénéfique pour le gain et la compression, car l'échelle ERB dérive directement de la modélisation des filtres auditifs.
Perspectives
Troisième partie
Annulation de retour acoustique
Introduction de la troisième partie
Retour acoustique dans les prothèses auditives
- Description du système acoustique
- Description du système électrique
- Étude de stabilité
- Étude de stabilité à temps continu
- Étude de stabilité à temps discret
- Analyse des conditions de stabilité dans une prothèse auditiveprothèse auditive
- Facteurs pénalisant la stabilité dans une prothèse auditive
- Variabilité des conditions
- Distorsions
A(p) est la fonction de transfert du microphone, B(p) celle de l'écouteur et G(z) la fonction de transfert discrète de la puce de traitement qui effectue la compensation de la perte auditive. Ici, nous faisons l'hypothèse que la réponse de chaque module de la prothèse peut être modélisée par une fonction de transfert linéaire invariante dans le temps (LIT). G(p) représentant l'équivalent dans le domaine continu de G(z), la fonction de transfert discrète de la prothèse.
Un modèle d'aide auditive à rétroaction discrète équivalent est illustré à la figure 9.5.
Techniques de compensation du retour acoustique
- Méthodes classiques
- Contrainte sur le chemin d’écho
- Contraintes sur le gain
- Solutions récentes
- Description des méthodes
- Prévention de l’accrochage
- Compensation de l’écho
- Annulation de l’écho
- Annulation d’écho par filtrage adaptatif
- Utilisation du gradient stochastique dans une prothèse auditiveauditive
- Continuité de l’adaptation
- Émission d’une séquence de bruit
En effet, la mise en oeuvre d'un annuleur d'écho par filtrage adaptatif permet en théorie d'obtenir une solution optimale du point de vue de la réhabilitation. Fig.10.2 : Schéma d'une prothèse auditive avec bouclage et annulation d'écho G(z) représente la compensation de la perte auditive ; le filtre adaptatif H(z)c estime la fonction de transfert de trajet d'écho H(z). G(z).∆H(z)|<1 (10.5) Cette nouvelle expression de la condition de stabilité suffisante montre l'intérêt d'utiliser une technique d'annulation d'écho dans le cadre des prothèses auditives.
Dans le cas présent, au contraire, le signal d'écho provient du signal source via la prothèse comme le montre la figure (10.4).
Domaine d’implémentation du LMS
Le délai
Cette approche permet d'avoir un certain contrôle sur les qualités du signal excitateur par rapport au processus adaptatif. Il serait alors possible d'utiliser la connaissance du phénomène de masquage pour transmettre ce type de séquence de bruit en dessous du seuil de masquage du signal utilisable. Techniques de compensation de larsen acoustique D'autre part, on peut noter que la présence d'un retard entre l'acquisition et la reproduction du signal audio est inhérente aux techniques de traitement par blocs utilisées en filtrage adaptatif.
Par conséquent, il convient de choisir la taille des blocs en fonction du délai de calcul et du délai maximum.
Synthèse
Annulation d’écho par filtrage adaptatif
- LMS temporel par blocs
- Principes
- Calcul de l’erreur par convolution
- Mise à jour du filtre adaptatif
- LMS Rapide dans le domaine fréquentiel
- Principes
- Convolution rapide dans le domaine de la transformée de FourierFourier
- Mise à jour du filtre adaptatif
- FLMS dans le domaine de la transformée de Hartley discrète
- La transformée de Hartley discrète
- Convolution rapide dans le domaine de la transformée de HartleyHartley
- Mise à jour du filtre adaptatif
LMS rapide dans le domaine fréquentiel 157 Soit ues le produit de la convolution circulaire entre ja et ehs. La réalisation de la convolution circulaire est moins directement exprimable dans le domaine de la transformation THD que son équivalent dans le domaine fréquentiel. FLMS dans le domaine de la transformée de Hartley discrète 161 L'équation (11.16) est alors reformulée comme suit.
En effet, la corrélation croisée est calculée dans le domaine THD par la formule Yfs⋆Ees, où.
Filtre à Délais Multiples Généralisé
- Principes
- Synthèse WOLA
- Partitionnement des données
- Implémentation du LMS
Prado et Moulines ont expliqué son application dans le domaine du THD dans [61]. 12.6) Chaque sous-bloc hks est alors mélangé dans le domaine THD avec N +L−1 échantillons de dey[n]. 12.7) On veut calculer le produit de convolution circulaire entre hs et le vecteur po de taille N +L′ −1 et défini par.
Dans le domaine THD, l'erreur est définie comme dans le FLMS selon l'équation (11.35).
Modification du pas d’adaptation
- Pas d’adaptation du LMS
- Rôle du pas d’adaptation
- Normalisation du gradient
- Modification de la définition du pas d’adaptation
- Seuil minimal de la puissance spectrale par sous-bande
- Prise en compte de la puissance spectrale de l’erreur
A cet effet, chaque coefficient de Ts est défini comme l'inverse de la puissance spectrale de Yfs. Dans le domaine du THD, compte tenu de la relation entre TFD et THD, le terme est équivalent au terme. Modification de la définition de l'étape d'adaptation 173 Dans le cadre des prothèses auditives, la complexité algorithmique des doubles détecteurs de parole est très importante par rapport aux faibles capacités de calcul des DSP.
Comme précédemment pour Pys, nous définissons la force du signal d'erreur dans le domaine du THD par .
Résultats - Simulations
- Motivations
- Simulations Matlab
- Description de l’environnement