• Nenhum resultado encontrado

Introduction de la deuxième partie

6. Estimation du niveau de bruit

6.2. Solution adoptée

premier ordre comparable à celui de l’équation (6.1) en employant des valeurs différentes du paramètre de lissageα suivant que la trame correspond à une attaque ou non.

α=

αa si Pys[k]>Pbs[k]

αd si Pys[k]<Pbs[k]

Pour réaliser l’estimation souhaitée, il convient d’employer une constante de temps longue pour les périodes d’attaque et plus courte pour les périodes de descente. Dans l’exemple de la figure 6.1, le temps d’attaque correspondant à αa est de 4s tandis que le temps de descente, correspondant àαd est de 1ms1. Cette figure illustre la mise en oeuvre de l’estimateur de niveau de bruit explicité ci-dessus sur un segment de signal de parole.

Pour un indice fréquentiel k arbitraire, l’évolution de Pys[k] est indiquée en trait plein, tandis que celle de Pbs[k] est indiquée en trait pointillé. L’estimation du niveau de bruit est mise en oeuvre après une phase d’initialisation sur 40 trames. Les valeurs hautes de Pys[k] correspondent à la présence de parole au milieu d’un bruit de fond (bruit blanc de densité spectrale de puissance d’amplitude 10). On constate que la valeur de Pbs[k] tend progressivement vers le niveau du bruit de fond. En particulier, c’est la faible valeur du temps de descente (1ms) qui permet cette adaptation. Le temps d’attaque est réglé de telle sorte que l’estimateur puisse s’adapter à une éventuelle hausse du niveau de bruit sans pour autant être trop sensible à une hausse sporadique.

La figure 6.2 reprend le même exemple dans le domaine fréquentiel pour un indice de trame arbitraire s suffisamment grand pour que l’estimateur ait pu converger vers des valeurs convenables. On constate qu’à cet instant, l’estimation de la densité spectrale de puissance du bruit est relativement proche de sa valeur réelle (i.e. 10).

6.2. Solution adoptée

6.2.1. Modèle élémentaire de DAV

Comme cela a été précisé précédemment, l’implantation d’un DAV performant au sein d’une prothèse auditive n’est pour le moment pas encore techniquement envisageable.

Toutefois, si l’on étudie sous un autre angle les méthodes d’estimation continue du niveau de bruit que nous venons de présenter, on peut considérer que celles-ci ont finalement recours à un modèle de DAV rudimentaire. En effet, cette approche empirique du trai- tement du signal audio qui consiste à observer l’enveloppe du signal en sous-bande et à dissocier les moments d’attaque et de descente du signal revient à faire une hypothèse a priori sur la présence du signal et donc à utiliser un DAV élémentaire.

1. Le temps d’attaque (temps de réponse à -3dB),τatt, permet de définir la valeur du paramètre αa

tel queαa= 0,5Teatt Te est la période d’échantillonnage.

94 6. Estimation du niveau de bruit

0 50 100 150 200 250 300 350 400 450 500

100 101 102 103 104

Trame

Puissance

Fig. 6.1: Estimation du niveau de bruit, aspect temporel. Pys[k] est indiquée en trait plein, tandis que Pbs[k] est indiquée en trait pointillé. Le bruit est un bruit blanc dont la densité spectrale de puissance a pour valeur 10. La phase d’initialisation sur les 40 premières trames est un simple lissage du signal.

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

10−2 10−1 100 101 102 103 104

Fréquence réduite

Puissance

Signal

Bruit

Fig.6.2: Estimation du niveau de bruit, aspect fréquentiel. Les valeurs du périodogramme du signal source (sans bruit) sont indiquées en trait plein, tandis que les valeurs dePbs[k], sont indiquées en trait pointillé. Le bruit est un bruit blanc dont la densité spectrale de puissance a pour valeur 10.

6.2. Solution adoptée 95 Cette hypothèse est fortement liée à l’hypothèse de stationnarité du bruit de fond.

Dans le cadre de notre application, il est, de toute manière, difficile d’envisager d’autres hypothèses plus rigoureuses sur les statistiques du signal source ou sur celles du bruit.

Malgré tout, ce type d’estimation du niveau de bruit parvient néanmoins de manière assez correcte à estimer le niveau moyen du bruit de fond dans chaque sous-bande et permet donc de réduire au moins la partie stationnaire du bruit dans le signal rehaussé.

Dans la littérature et, en particulier, dans [50], un autre modèle rudimentaire de DAV est exploité dont la démarche est assez semblable à la détermination des attaques sur l’enveloppe. Son principe se base sur l’observation de la valeur moyenne de Rposts [k] sur lesM indices fréquentiels k pour le bloc courant que l’on note R¯posts :

posts = 1 M ·

MX1 k=0

Rposts [k] (6.2)

Rappelons que Rposts est une estimation du RSB pour la trame courante. Si R¯posts a une valeur nulle ou quasiment nulle, la trame peut être considérée comme une trame de bruit.

Il est donc possible en considérant un certain seuil, R¯seuil, proche de 0, de prendre une décision sur la présence éventuelle du signal de parole :

— si R¯posts >R¯seuil, le signal de parole est présent,

— si R¯posts <R¯seuil, seul le bruit est présent.

Dans [50], Malah et al. proposent de choisirR¯seuilentre0,3et1. Cette valeur légèrement supérieure à 0permet de tenir compte d’une éventuelle hausse du niveau de bruit.

6.2.2. Mise à jour de l’estimateur

Dans ce même article [50], les auteurs développent une manière très efficace de mettre à jour l’estimation du spectre du bruit. La mise à jour se fait grâce à une équation de récurrence régie par un facteur de lissage. Ce facteur de lissage s’exprime de manière simple à partir du RSB dans le bloc courant.

αb = 1−0,2· |R¯spost| (6.3a) en ajoutant la contrainte : 0,8< αb <0,98 (6.3b) Les variations des valeurs de αb en fonction de celles de |R¯posts | sont indiquées sur la figure 6.3.

6.2.3. Validation du choix de la méthode

Différents tests d’évaluation ont été menés sur les différentes techniques d’estimation du niveau de bruit. Ils ne seront pas présentés ici mais ils nous ont permis de déterminer que la méthode proposée dans [50] offre la possibilité d’aboutir à des résultats satisfaisants

96 6. Estimation du niveau de bruit

|R¯spost| Valeurdeαb

0 0.2 0.4 0.6 0.8 1

0.8 0.85 0.9 0.95 1

|R¯spost|

Tempsdeponseenms

0 0.2 0.4 0.6 0.8 1

0 0.5 1 1.5 2 2.5

Fig. 6.3: Calcul du facteur de lissage αb pour la mise à jour de l’estimation du niveau de bruit en fonction deR¯posts . En haut, la figure indique les valeurs deαbselon la formule (6.3).

En bas, les temps de réponse à −3dB correspondants sont indiqués (en ms).

de rehaussement tout en conservant un rapport efficacité / coût de calcul très intéres- sant. Lors de ces évaluations, les méthodes d’estimation du niveau de bruit n’ont pas été évaluées, de manière directe, i.e. sur leur précision d’évaluation de la densité spectrale de puissance du bruit mais de manière indirecte lors d’une utilisation conjointe avec la méthode de rehaussement d’Ephraïm et Malah.

Ce choix d’estimation est volontairement applicatif et vise à considérer l’efficacité de ces estimateurs uniquement dans le cadre du rehaussement de la parole.

97