• Nenhum resultado encontrado

Caractérisation des distributions non gaussiennes : Méthode des

No documento Nicolas Trouvé (páginas 92-96)

1.3 Modèle Non Gaussien

1.3.4 Caractérisation des distributions non gaussiennes : Méthode des

Principe

Quand on étudie une image, ou un échantillon d’images, on est souvent amené à s’interroger sur la nature de la distribution rencontrée. Nous venons de voir qu’il existe un grand nombre de lois pouvant, plus ou moins rigoureusement, décrire les comportements statistiques. A l’usage, l’habitude nous permet d’anticiper avec une précision correcte le type de distribution qu’il est souhaitable d’utiliser. Il est toutefois nécessaire, surtout quand on décide d’employer des distributions très complexes, de justifier la nature du signal mesuré.

Une méthode simple consiste à étudier les paramètres de loi "comme si" la distribution mesurée suivait la distribution envisagée. Ainsi on peut, si on s’attend à rencontrer un fouillis K-distribué, estimer le paramètre ν de la distribution et, en fonction de la valeur de celui ci, déterminer si les données sont gaussiennes (ν très grand) ou impulsionnelles (ν petit). Il convient ensuite d’utiliser des tests de comparaison (divergence, distance) entre la distribution mesurée, et une distribution tirée à partir des paramètres estimés. Cette méthode n’est toutefois pas idéale et objectivement pas toujours démonstrative.

Un outil introduit par Jean-Marie Nicolas dans [27] permet de caractériser des distribu- tions non gaussiennes en étudiant les Logs-moments et Logs-cumulants de la distribution.

L’avantage de cette méthode est qu’elle fournit en plus une représentation graphique.

Celle-ci permet de visualiser dans quelles zones se répartissent les distributions rencon- trées dans une image, dans un plan contenant les distributions classiques. Les moments et cumulants d’ordres supérieurs sont caractéristiques des distributions non gaussiennes, il est donc naturel de s’y intéresser afin de les caractériser. L’originalité des travaux concer- nant les logs moments vient de la propriété des logarithmes à transformer les produits en sommes. Ce qui nous permet, dans le cadre d’un modèle multiplicatif de séparer la contribution de la loi de texture, du noyau gaussien.

Pour toutes les applications où l’on rencontre des produits de distributions, les mo- ments et cumulants dits de deuxième espèce s’avèrent particulièrement élégants : ils al- lient performance et simplicité. Ce sont des outils qui sont donc régulièrement employés en imagerie SAR afin de caractériser la nature des images rencontrées. Après les travaux de Jean Marie Nicolas, nous notons donc les travaux d’Afinsen qui étend la technique aux log-det-cumulants en supposant un modèle produit entre la texture et la matrice de cohérence/covariance polarimétrique [28].

Cette représentation graphique basée sur les log-cumulants et log-det-cumulants est souvent appelée plan κ2,κ3. Elle consiste en effet à représenter les moments de groupe d’échantillons d’une image SAR en fonction de leurs log-cumulants d’ordre 2 et 3.

Ainsi par définition,

˜

m1 =E(log(x)) m˜2 =E(log(x)2) m˜3 =E(log(x)3)

˜

κ1 = m˜1

˜

κ2 = m˜2m˜12

˜

κ3 = m˜3 −3 ˜m1m˜2+ 2 ˜m13.

(1.16) Dans cette représentation il est ainsi possible de représenter un grand nombre de lois traditionnellement utilisées pour représenter des lois non gaussiennes. Ainsi la figure 1.3 représente dans le plan κ2,κ3 les différentes courbes qui correspondent aux positions théoriques des log- cumulants de ces lois ainsi que des moments estimés à l’aide de données simulées à partir de ces mêmes lois.

Problème et limitations

Théoriquement cette méthode et l’utilisation de cette représentation sont effectivement des outils pertinents parce qu’ils permettent de visualiser sur un même plan l’ensemble de ces distributions. Des problèmes surviennent cependant lorsque des conclusions trop optimistes sont déduites de l’utilisation de ce plan. Ou bien lorsque le calcul pratique de ces moments sur des données réelles n’est pas effectué de manière adéquate, et que les interprétations qui en sont faites sont erronées.

1. Estimation des moments. Le premier problème qui survient d’après moi, vient de l’estimation des paramètres κ2 etκ3.

Comme pour l’estimation d’une matrice de covariance, ou d’un paramètre d’une loi de distribution, cette estimation nécessite un certain nombre d’échantillons ou d’ob-

1.3. Modèle Non Gaussien

−40 −3 −2 −1 0 1 2 3 4

0.5 1 1.5 2 2.5 3 3.5 4

κ3

κ 2

Gamma inverse Gamma

Pearson I

Pearson I

Gauss Pearson VI

Figure 1.3 – Exemple de représentation dans le plan κ2,κ3.

servations qui correspondent idéalement au même comportement physique. Clas- siquement on utilise un moyennage spatial avec une fenêtre glissante sur l’image.

Nous allons voir que cette méthode est à proscrire.

L’image est naturellement structurée, et ce de manière encore plus importante dans les images urbaines (qui d’ailleurs sont le plus souvent celles qui motivent l’utilisation de modèles non gaussiens). Cette structure dans l’image fait que, même si toutes les distributions rencontrées sont "gaussiennes" par morceaux ou régions, une fenêtre glissante rencontrera inévitablement un nombre conséquent (voir majoritaire) de zones de transitions. Ces zones de transitions présenteront alors des distributions bi-modales qui donneront alors l’illusion de l’existence de distributions fortement non gaussiennes.

La justification du choix d’une distribution ou de modèle ne peut pas être faite à l’aide d’une estimation par fenêtre glissante.Seule la sélection de zones "homogènes"

automatiquement, ou manuellement, avant d’étudier leurs log moments, permet de justifier convenablement le choix de tel ou tel modèle de distribution. Il est pré- férable à mon avis de ne sélectionner qu’un nombre restreint de zones que l’on va juger caractéristiques de l’image. Nous représentons les effets d’une estimation par fenêtre contre une estimation par région sur la figure 1.5. Sur cette figure, la couleur est reliée à la densité des paramètresκ2 etκ3 estimée à l’aide d’une fenêtre glissante sur l’ensemble de l’image présentée sur la figure 1.4. Les points noirs correspondent à l’estimation pour chacune des régions délimitées sur la figure 1.4. L’estimation des paramètres par fenêtre glissante donne l’illusion d’une distribution bien plus impul- sionnelle que celle rencontrée réellement. Le centre de la distribution est surévalué par rapport aux distributions réelles rencontrées par région.

2. Aucun véritable point de repère. L’autre problème de cette représentation est l’ab-

Figure 1.4 – Exemple de sélection de zones homogènes, sans frontières, dans une image SAR polarimétrique de la ville de Toulouse

κ3

κ 2

−40 −3 −2 −1 0 1 2 3 4

0.5 1 1.5 2 2.5 3 3.5 4

Figure 1.5 – Illustration des estimés de paramètresκ2,κ3 sur une image haute résolution de la ville de Toulouse.

1.3. Modèle Non Gaussien sence de point de repère permettant de véritablement choisir entre différents mo- dèles. Les courbes théoriques permettent de délimiter les zones correspondant à certaines distributions (Gamma, Beta, Fisher...). Mais encore une fois, même si les moments ont été parfaitement estimés, la position à un endroit précis du plan ne permet pas à elle seule de préjuger de la nécessité d’utiliser un modèle de distribu- tion particulier. En effet l’intégralité du plan et des courbes de référence forment une figure invariante par changement d’échelle. Ainsi un point situé dans la zone des distributions de Fisher, ne garantit pas que l’utilisation d’outils déduits des distri- butions de Fisher apporte quoi que ce soit. Ce point peut être extrêmement proche d’une distribution gaussienne ! Cela ne dépendra véritablement que de l’échelle des axes de κ2 et κ3. Cette représentation ne permet pas de trancher sur le choix de la distribution tant qu’il n’existe pas de seuil qui nous permette rigoureusement de choisir une distribution.

No documento Nicolas Trouvé (páginas 92-96)