Evaluation et r´esultats ´ - Recherche d’images de sc` enes naturelles 143

Partie II Contributions en reconnaissance de formes 75

Chapitre 8 Recherche d’images de sc` enes naturelles 143

8.4 Evaluation et r´esultats ´

Il est parfaitement possible d’intégrer plusieurs exemples positifs et négatifs. Pour ce faire, il suffit d’entrer plusieurs évidences, chaque évidence correspondant à l’observation des caracté- ristiques visuelles sur une image exemple.

La classe cachée des images pertinentes est alors inférée.

On infère alors la classe de chaque image de la base de recherche, comme s’il s’agissait d’une image requête seule (non accompagnée d’images exemples positifs ou négatifs).

Finalement, les images considérées comme lesk plus proches de la requête sont les images de la base dont la classe inférée est la même que la classe inférée pour les images pertinentes (RI), avec lesk plus grandes probabilités d’appartenance à cette classe.

QI_j,∀j ∈ {1, . . . ,n}, une image requête. Alors lesk,∀k ∈ {1, . . . ,30}précisions de recherche de l’imageQIj sont définies par :

P_j_k = # images pertinentes parmi les k premi`eres images de la liste k

etP =

Pn j=1

P30 k=1Pjk

n ×100.

8.4.3 R´esultats

Consid´erons le tableau 8.1. La notation «VF»signifie que les caract´eristiques visuelles ont

été utilisées. La notation «KW»indique que l’information textuelle a été utilisée. Quant à la notation «PRF»(respectivement «RF»), elle indique l’utilisation du processus de retour de pertinence avec exemples positifs seulement (respectivement avec des exemples positifs et négatifs).

Les résultats confirment que la combinaison de caractéristiques visuelles et sémantiques avec retour de pertinence améliore la précision de la recherche. En effet, on observe que la combinaison de caractéristiques visuelles et d’éventuels mots-clés améliore la précision de recherche de 26.4%

en moyenne comparée à la recherche d’images par le contenu. De plus, on peut noter que le processus de retour de pertinence, avec exemples positifs seulement, améliore la précision de recherche de 10.1% en moyenne. L’ajout d’exemples négatifs dans le processus de retour de pertinence améliore encore la précision de 8%.

Pour résumer, on a atteint une amélioration de 44.5% en moyenne en procédant à une recherche visuo-textuelle associée à un processus de retour de pertinence avec exemples positifs et négatifs, comparée à une recherche d’image par le contenu.

VF VF + KW VF + KW + PRF VF + KW + RF

1 itération 10 itérations 1 itération 10 itérations

44.3 70.7 79.3 82.4 86.7 91

Table 8.1 – Pr´ecisions moyennes de recherche (P en %)

Considérons maintenant la figure 8.3, représentant les précisions moyennes en fonction du rangk dans la liste résultat, dans les mêmes conditions que dans le tableau 8.1. Le processus de retour de pertinence a été testé avec 10 itérations (courbes bleue et rose).

La courbe rouge (VF = caract´eristiques visuelles uniquement), toujours en dessous des 3 autres, montre la robustesse de la recherche visuo-textuelle. De plus, on remarque que les courbes rouge et jaune, obtenues sans processus de retour de pertinence, d´ecroissent continuellement.

Au contraire, les 2 autres courbes croissent à partir de 25 images environ, grâce au retour de pertinence. Ceci peut s’expliquer par le fait qu’une grande valeur de k laisse plus de variabilité quant à la «reformulation»de la requête : une grande valeur de k laissera plus de chances à de nouvelles images (dont des images pertinentes) de rentrer dans le top k, à chaque itération de retour de pertinence. Ceci montre que la valeur maximale de k, fixée à 30 dans un soucis d’ergonomie, pourrait encore être augmentée, pour permettre encore plus de variabilité au top k et améliorer encore les résultats. Augmenter le nombre d’itérations permet aussi d’améliorer les résultats de recherche. Nous pouvons le constater sur le tableau 8.1. Enfin, pour fixer la valeur maximale de k, il faut trouver un compromis entre précision de recherche et ergonomie

de l’application. En effet, une petite valeur dek offre une meilleur ergonomie mais nécessite plus d’itérations pour atteindre une bonne précision.

De plus, la courbe rose, toujours au dessus de la bleue, montre l’intérêt d’utiliser les exemples négatifs, en plus des positifs, dans le processus de retour de pertinence.

20 30 40 50 60 70 80 90 100

0 5 10 15 20 25 30

VF VF + KW VF + KW + PRF VF + KW + RF

Figure 8.3 – Pr´ecisionP en fonction du rang k

D’autre part, le tableau 8.2 montre une image requête (1ère colonne) et les 5 premières images retrouvées pour cette requête. La première ligne montre les images retrouvées sans retour de pertinence. La deuxième ligne montre les images retrouvées suite à une itération du processus de retour de pertinence, avec un exemple positif et un exemple négatif.

Sur la première ligne, sans retour de pertinence, on constate que la dernière image n’est pas pertinente. Cette erreur a eu lieu car cette image, représentant des aliments sur une table, est annotée non seulement par le terme«nourriture»mais aussi par le mot-clé«fleur». Cette image a été utilisée en exemple négatif pour le processus de retour de pertinence. Et c’est la première image qui est utilisée en exemple positif.

Enfin, sur la deuxième ligne, après une itération de retour de pertinence, toutes les images retrouvées sont pertinentes. Le système a finalement appris que si une image est annotée à la fois par«nourriture»et«fleur»elle n’est pas pertinente pour une image requête annotée par le seul mot«fleur».

requˆete«fleur» Images retrouv´ees

Table8.2 – Exemple d’une image requˆete et des images retrouv´ees par recherche visuo-textuelle

Enfin, le tableau 8.3 les 5 premières images retrouvées pour une requête sur le mot-clé

«forêt». La première ligne montre les images retrouvées sans retour de pertinence. La deuxième ligne montre les images retrouvées suite à une itération du processus de retour de pertinence, avec un exemple positif et un exemple négatif.

Sur la première ligne, sans retour de pertinence, la quatrième image est désignée comme non pertinente. Cette erreur provient du fait que cette image est annotée à la fois par les termes

«forêt»et«voiture». Il en est d’ailleurs de même pour la deuxième image. La première image est désignée comme exemple positif.

Suite à une itération de retour de pertinence, on peut observer les nouveaux résultats sur la deuxième ligne. Le système a finalement appris que si une image est annotée à la fois par

«forêt»et «voiture»elle n’est pas pertinente pour une image requête annotée par le seul mot

«forêt». Cependant, dans ce résultat, on pourrait considérer la deuxième image, la troisième, voire la dernière comme non pertinentes. En effet, sur la deuxième image on peut observer des cyclistes sur une route de forêt. La pertinence ou non de cette image pour la requête«forêt»va dépendre de l’utilisateur. Il est est de même pour la troisième image sur laquelle on peut observer un pont, et pour la dernière image sur laquelle on peut observer des gens. Enfin, même si la pertinence de ces images n’est pas claire, elles ont toutes été renvoyées par le système car elles sont annotées par au moins un mot-clé«forêt».

Requˆete Images retrouv´ees

«forˆet»

Table 8.3 – Exemple d’images retrouv´ees pour une recherche visuo-textuelle sur le mot-cl´e

«forˆet»

No documento Modèles graphiques probabilistes pour la reconnaissance de formes (páginas 162-166)