• Nenhum resultado encontrado

Partie II Contributions en reconnaissance de formes 75

Chapitre 8 Recherche d’images de sc` enes naturelles 143

8.4 Evaluation et r´esultats ´

Il est parfaitement possible d’int´egrer plusieurs exemples positifs et n´egatifs. Pour ce faire, il suffit d’entrer plusieurs ´evidences, chaque ´evidence correspondant `a l’observation des caract´e- ristiques visuelles sur une image exemple.

La classe cach´ee des images pertinentes est alors inf´er´ee.

On inf`ere alors la classe de chaque image de la base de recherche, comme s’il s’agissait d’une image requˆete seule (non accompagn´ee d’images exemples positifs ou n´egatifs).

Finalement, les images consid´er´ees comme lesk plus proches de la requˆete sont les images de la base dont la classe inf´er´ee est la mˆeme que la classe inf´er´ee pour les images pertinentes (RI), avec lesk plus grandes probabilit´es d’appartenance `a cette classe.

QIj,∀j ∈ {1, . . . ,n}, une image requˆete. Alors lesk,∀k ∈ {1, . . . ,30}pr´ecisions de recherche de l’imageQIj sont d´efinies par :

Pjk = # images pertinentes parmi les k premi`eres images de la liste k

etP =

Pn j=1

P30 k=1Pjk

30

n ×100.

8.4.3 R´esultats

Consid´erons le tableau 8.1. La notation «VF»signifie que les caract´eristiques visuelles ont

´et´e utilis´ees. La notation «KW»indique que l’information textuelle a ´et´e utilis´ee. Quant `a la notation «PRF»(respectivement «RF»), elle indique l’utilisation du processus de retour de pertinence avec exemples positifs seulement (respectivement avec des exemples positifs et n´egatifs).

Les r´esultats confirment que la combinaison de caract´eristiques visuelles et s´emantiques avec retour de pertinence am´eliore la pr´ecision de la recherche. En effet, on observe que la combinaison de caract´eristiques visuelles et d’´eventuels mots-cl´es am´eliore la pr´ecision de recherche de 26.4%

en moyenne compar´ee `a la recherche d’images par le contenu. De plus, on peut noter que le processus de retour de pertinence, avec exemples positifs seulement, am´eliore la pr´ecision de recherche de 10.1% en moyenne. L’ajout d’exemples n´egatifs dans le processus de retour de pertinence am´eliore encore la pr´ecision de 8%.

Pour r´esumer, on a atteint une am´elioration de 44.5% en moyenne en proc´edant `a une recherche visuo-textuelle associ´ee `a un processus de retour de pertinence avec exemples positifs et n´egatifs, compar´ee `a une recherche d’image par le contenu.

VF VF + KW VF + KW + PRF VF + KW + RF

1 it´eration 10 it´erations 1 it´eration 10 it´erations

44.3 70.7 79.3 82.4 86.7 91

Table 8.1 – Pr´ecisions moyennes de recherche (P en %)

Consid´erons maintenant la figure 8.3, repr´esentant les pr´ecisions moyennes en fonction du rangk dans la liste r´esultat, dans les mˆemes conditions que dans le tableau 8.1. Le processus de retour de pertinence a ´et´e test´e avec 10 it´erations (courbes bleue et rose).

La courbe rouge (VF = caract´eristiques visuelles uniquement), toujours en dessous des 3 autres, montre la robustesse de la recherche visuo-textuelle. De plus, on remarque que les courbes rouge et jaune, obtenues sans processus de retour de pertinence, d´ecroissent continuellement.

Au contraire, les 2 autres courbes croissent `a partir de 25 images environ, grˆace au retour de pertinence. Ceci peut s’expliquer par le fait qu’une grande valeur de k laisse plus de variabilit´e quant `a la «reformulation»de la requˆete : une grande valeur de k laissera plus de chances `a de nouvelles images (dont des images pertinentes) de rentrer dans le top k, `a chaque it´eration de retour de pertinence. Ceci montre que la valeur maximale de k, fix´ee `a 30 dans un soucis d’ergonomie, pourrait encore ˆetre augment´ee, pour permettre encore plus de variabilit´e au top k et am´eliorer encore les r´esultats. Augmenter le nombre d’it´erations permet aussi d’am´eliorer les r´esultats de recherche. Nous pouvons le constater sur le tableau 8.1. Enfin, pour fixer la valeur maximale de k, il faut trouver un compromis entre pr´ecision de recherche et ergonomie

de l’application. En effet, une petite valeur dek offre une meilleur ergonomie mais n´ecessite plus d’it´erations pour atteindre une bonne pr´ecision.

De plus, la courbe rose, toujours au dessus de la bleue, montre l’int´erˆet d’utiliser les exemples n´egatifs, en plus des positifs, dans le processus de retour de pertinence.

20 30 40 50 60 70 80 90 100

0 5 10 15 20 25 30

P

k

VF VF + KW VF + KW + PRF VF + KW + RF

Figure 8.3 – Pr´ecisionP en fonction du rang k

D’autre part, le tableau 8.2 montre une image requˆete (1`ere colonne) et les 5 premi`eres images retrouv´ees pour cette requˆete. La premi`ere ligne montre les images retrouv´ees sans retour de pertinence. La deuxi`eme ligne montre les images retrouv´ees suite `a une it´eration du processus de retour de pertinence, avec un exemple positif et un exemple n´egatif.

Sur la premi`ere ligne, sans retour de pertinence, on constate que la derni`ere image n’est pas pertinente. Cette erreur a eu lieu car cette image, repr´esentant des aliments sur une table, est annot´ee non seulement par le terme«nourriture»mais aussi par le mot-cl´e«fleur». Cette image a ´et´e utilis´ee en exemple n´egatif pour le processus de retour de pertinence. Et c’est la premi`ere image qui est utilis´ee en exemple positif.

Enfin, sur la deuxi`eme ligne, apr`es une it´eration de retour de pertinence, toutes les images retrouv´ees sont pertinentes. Le syst`eme a finalement appris que si une image est annot´ee `a la fois par«nourriture»et«fleur»elle n’est pas pertinente pour une image requˆete annot´ee par le seul mot«fleur».

requˆete«fleur» Images retrouv´ees

Table8.2 – Exemple d’une image requˆete et des images retrouv´ees par recherche visuo-textuelle

Enfin, le tableau 8.3 les 5 premi`eres images retrouv´ees pour une requˆete sur le mot-cl´e

«forˆet». La premi`ere ligne montre les images retrouv´ees sans retour de pertinence. La deuxi`eme ligne montre les images retrouv´ees suite `a une it´eration du processus de retour de pertinence, avec un exemple positif et un exemple n´egatif.

Sur la premi`ere ligne, sans retour de pertinence, la quatri`eme image est d´esign´ee comme non pertinente. Cette erreur provient du fait que cette image est annot´ee `a la fois par les termes

«forˆet»et«voiture». Il en est d’ailleurs de mˆeme pour la deuxi`eme image. La premi`ere image est d´esign´ee comme exemple positif.

Suite `a une it´eration de retour de pertinence, on peut observer les nouveaux r´esultats sur la deuxi`eme ligne. Le syst`eme a finalement appris que si une image est annot´ee `a la fois par

«forˆet»et «voiture»elle n’est pas pertinente pour une image requˆete annot´ee par le seul mot

«forˆet». Cependant, dans ce r´esultat, on pourrait consid´erer la deuxi`eme image, la troisi`eme, voire la derni`ere comme non pertinentes. En effet, sur la deuxi`eme image on peut observer des cyclistes sur une route de forˆet. La pertinence ou non de cette image pour la requˆete«forˆet»va d´ependre de l’utilisateur. Il est est de mˆeme pour la troisi`eme image sur laquelle on peut observer un pont, et pour la derni`ere image sur laquelle on peut observer des gens. Enfin, mˆeme si la pertinence de ces images n’est pas claire, elles ont toutes ´et´e renvoy´ees par le syst`eme car elles sont annot´ees par au moins un mot-cl´e«forˆet».

Requˆete Images retrouv´ees

«forˆet»

«forˆet»

Table 8.3 – Exemple d’images retrouv´ees pour une recherche visuo-textuelle sur le mot-cl´e

«forˆet»