Banco de imagens utilizados na metodologia BoF

Material e Metodologia 4.1 Banco de Imagens

4.1.2 Banco de imagens utilizados na metodologia BoF

O banco de imagens Caltech 20043 _{foi utilizado para dois experimentos com o descritor}

M-LMP. Primeiramente foram utilizadas quatro classes de imagens da base Caltech 2004 que incluem 1074 aviões, 1155 carros, 450 faces e 826 motos. A Figura 23 mostra um exemplo de uma imagem de cada categoria.

Para o segundo experimento com a base Caltech 2004 o número de classes foi aumen- tado para 6 incluindo-se as classes “guitarra” e “casa”. A Figura 24 mostra um exemplo de cada classe.

O banco de imagens Pascal VOC 2006 4 _{foi utilizado para a realização de um expe-}

http://www.robots.ox.ac.uk/ vgg/research/affine/

2_{http://lear.inrialpes.fr/people/mikolajczyk/}

3_{http://www.robots.ox.ac.uk/ vgg/data3.html}

66 Capítulo 4. Material e Metodologia

(a) graf1 (b) graf4 (c) bark1 (d) bark4

(e) leuven1 (f) leuven4 (g) trees1 (h) trees4

(i) ubc1 (j) ubc4 (k) boat1 (l) boat4

(m) bike1 (n) bike4 (o) wall1 (p) wall4

Figura 21: Imagens utilizadas para o ajuste do parâmetro β: graf (mudança de ponto de vista), bark (escala e rotação), trees (imagem borrada), leuven (mudança de iluminação),

ubc (compressão JPEG), boat (escala e rotação), bike (imagem borrada), wall (mudança

de ponto de vista)

rimento com o descritor M-LMP utilizando a metodologia BoF. Foi utilizada a base de dados Pascal VOC 2006 com as seguintes classes: ônibus, vaca, cavalo e ovelha. A Figura 25 mostra um exemplo de cada classe.

Foram realizados dois experimentos com as imagens da base Caltech 101 (FEI; FERGUS;

PERONA, 2004) utilizando o descritor M-LMP. Primeiramente foram escolhidas 4 classes

da base Caltech 101: bonsai, faces_easy, leopards e watch, com imagens com variação de rotação, iluminação, escala, compressão e aliasing. Exemplos das imagens de cada classe são mostradas na Figura 26.

Foi também analisado o desempenho do descritor M-LMP utilizando a metodologia proposta nesta tese para a classificação de objetos de 5 classes da base Caltech 101: bonsai,

faces_easy, leopards, watch e airplanes. Algumas das imagens são mostradas na Figura

27.

Três banco de imagens de faces foram utilizados para experimentos com a metodologia proposta utilizando o descritor M-LMP. A base de faces Feret (PHILLIPS; RAUSS, 1997)

com 45 classes e 40 imagens por classe, onde as imagens escolhidas para cada classe incluem: expressão facial regular (fa), expressão facial alternativa (fb), posição esquerda

(a) resid1 (b) resid4 (c) east park1 (d) east park4

(e) east south1 (f) east south4 (g) ensigmag1 (h) ensigmag4

(i) laptop1 (j) laptop4 (k) zmars1 (l) zmars4

(m) zmonet1 (n) zmonet4 (o) new york1 (p) new york4

(q) axterix1 (r) axterix4 (s) belledone1 (t) belledone4

(u) bip1 (v) bip4 (w) crolle1 (x) crolle4

(y) lap1 (z) lap4 (aa) vangogh1 (ab) vangogh4

(ac) inria1 (ad) inria10

Figura 22: Imagens do conjunto de teste: resid, east park, east south, ensigmag, laptop e

Inria (escala e rotação), zmars, zmonet, new york (rotação), axterix, belledone, bip, crolle, lap e vangogh (escala)

68 Capítulo 4. Material e Metodologia

(a) Avião (b) Carro (c) Face (d) Moto

Figura 23: Exemplo de uma imagem de cada categoria da Base de Dados Caltech 2004

(a) Avião (b) Carro (c) Face (d) Moto

(e) Guitarra (f) Casa

Figura 24: Exemplo de imagens de cada uma das seis classes da base de dados Caltech 2004, usadas no segundo experimento.

(a) Ônibus (b) Vaca (c) Cavalo (d) Ovelha

Figura 25: Exemplo de imagens de cada classe da base de dados Pascal VOC 2006.

(a) bonsai (b) faces_easy (c) leopards (d) watch

(a) Bonsai (b) Faces (c) Leopards (d) Watch (e) Airplanes

Figura 27: Exemplo de uma imagem de cada categoria da Base de Dados Caltech 101

e direita (hl e hr), perfil esquerdo e direito (ql e qr), imagens randômicas (ra, rb, rc, rd e re) e algumas de faces com mudanças de escala. A Figura 28 mostra alguns exemplos por classe.

Figura 28: Exemplo de uma imagem de cada categoria da Base de faces Feret

Para a base de faces ORL 5 _{foram utilizadas 40 classes com 10 imagens por classe.}

As imagens possuem diversas características tais como mudança de iluminação, expressão facil e detalhes faciais (com óculos e sem óculos), e tiradas com um fundo escuro, com tolerância para algumas mudanças de pose. A Figura 29 apresenta três exemplos de 6 classes da base de faces ORL.

E por fim, a base de faces Yale Face 6 _{foi utilizada nos experimentos e contém 15}

classes com 11 imagens por classe. As configurações das faces em cada classe são: com

5_{http://www.cl.cam.ac.uk/}

70 Capítulo 4. Material e Metodologia

Figura 29: Exemplo de 3 imagens de 6 categorias da Base de faces ORL

iluminação centralizada, com óculos, sem óculos, feliz, com iluminação a esquerda, normal, com iluminação a direita, triste, sonolento, surpreso e piscando os olhos. A Figura 30 mostra três exemplos de 6 classes da base de imagens Yale Face.

Figura 30: Exemplo de 3 imagens de 6 categorias da Base de faces Yale Face

Para a avaliação do desempenho dos descritores M-LMP e CS-LMP foram utilizadas duas bases de imagens: Caltech 101 7 _{e ImageNet} 8_{, onde foram escolhidas aleatoria-}

mente 27 classes contendo 80 imagens por classe. A Figura 31 mostra 3 exemplos de cada classe para a base de imagens Caltech 101. As classes utilizadas foram: airplane, background_google, bonsai, butterfly, brain, buddha, car_side, chandelier, ewer, faces, face_easy, grand_piano, hawksbill, helicopter, ibis, kangaroo, ketch, laptop, leopards,

7_{http://www.vision.caltech.edu/Image Datasets/Caltech101/}

utilizadas foram: airplane, blender, bonsai, butterfly, car_elevator_car, car_wheel, train,

chandelier, coffee, ewer, face, fish, grand_piano, hawksbill, helicopter, horse, ketch, laptop, leopard, menorah, pen, revolver, school_bus, scorpion, sunflower, watch e wine.

(a) airplanes (b) background_google (c) bonsai

(d) brain (e) buddha (f) butterfly

(g) car_side (h) chandelier (i) ewer

(j) faces (k) faces_easy (l) grand_piano

(m) hawksbill (n) helicopter (o) ibis

(p) kangaroo (q) ketch (r) laptop

(s) Leopards (t) menorah (u) motorbikes

(v) revolver (w) scorpion (x) starfish

(y) sunflower (z) trilobite (aa) watch

72 Capítulo 4. Material e Metodologia

(a) airplanes (b) blender (c) bonsai

(d) butterfly (e) car_elevator_car (f) car_wheel

(g) train (h) chandelier (i) coffee

(j) ewer (k) faces (l) fish

(m) grand_piano (n) hawksbill (o) helicopter

(p) horse (q) ketch (r) laptop

(s) leopard (t) menorah (u) pen

(v) revolver (w) school_bus (x) scorpion

(y) sunflower (z) watch (aa) wine

Figura 32: Exemplos de imagens de cada classe da Base de Imagens ImageNet

O último banco de imagens utilizado nos experimentos foi o banco Indoor Scene Re-

cognition dataset 9_{. Foram utilizadas 8 classes, com 200 imagens por classes escolhidas}

aleatoriamente. O descritor MCS-LMP foi avaliado aplicando a metodologia proposta para classificação de imagens. A Figura 33 mostra alguns exemplos das imagens de cada classe onde imagens intra-classes são altamente diferentes umas das outras.

(a) Bakery

(b) Bedroom

(c) Casino

(d) Corridor

(e) Grocery Store

(f) Kitchen

(g) Restaurant

(h) Toystore

Figura 33: Exemplos de imagens de cada classe da base de imagens Indoor Scene Recog-

74 Capítulo 4. Material e Metodologia

4.2 Metodologia

No documento Novos descritores de textura para localização e identificação de objetos em imagens... (páginas 67-76)