• Nenhum resultado encontrado

5.6 M´etodos cl´assicos e novos m´etodos implementados

5.6.1 HSV-162 e HSV-162 + GRAS

Primeiramente, ser´a mostrada uma compara¸c˜ao do desempenho da estrat´egia de histogra- ma de cores contra essa mesma estrat´egia combinada com caracter´ısticas extra´ıdas pelo algoritmo GRAS. A abordagem cl´assica que utiliza histogramas de cores ´e descrita por [Smith e Chang, 1996b]. Ela consta primeiramente em transformar a imagem para o es- pa¸co HSV (Hue, Saturation, Value) com 18 tons para o H, 3 para o S, 3 para o V e 4 para tons de cinza, gerando 18 x 3 x 3 + 4 = 166 poss´ıveis valores para cada pixel em 18 + 3 + 3 + 4 = 28 entradas para o histograma. Por esse motivo, essa abordagem ´e conhecida como histograma-166. No presente trabalho, foi implementada uma varia¸c˜ao dessa estrat´egia, que utiliza H = 18, S = 3 e V = 3. Os tons de cinza foram ignorados uma vez que aqui as imagens monocrom´aticas n˜ao s˜ao consideradas. Assim, foi implementado um histograma com 18 x 3 x 3 = 162 poss´ıveis valores de pixels.

Por outro lado, o algoritmo GRAS foi usado para encontrar as caracter´ısticas de regi˜oes do grafo gerado a partir das imagens. Essas caracter´ısticas s˜ao exatamente as 6 descritas na Se¸c˜ao 4.1.3: NR, NF, NS, NC, EMG e TP.

Um vetor de caracter´ıstica para uma imagem ´e ent˜ao composto com as 18 + 3 + 3 = 24 entradas do histograma-162 mais as 6 caracter´ısticas do GRAS, gerando um vetor de 24 + 6 = 30 entradas. .

CAP´ITULO 5. EXPERIMENTOS 77

Revoca¸c˜ao HSV-162 HSV-162 + GRAS Ganho (%) 0.10 0.9912 0.9912 0 0.20 0.8370 0.8384 0.1654 0.30 0.7621 0.7636 0.1983 0.40 0.7291 0.7298 0.1068 0.50 0.6788 0.6805 0.2421 0.60 0.5523 0.5550 0.4852 0.70 0.3328 0.3341 0.3612 0.80 0.1991 0.1997 0.3042 0.90 0.0606 0.0607 0.0462 1.00 0.0277 0.0277 0.1053 M´edia 0.5171 0.5181 0.1909

Tabela 5.2: Desempenho do histograma-162 e do histograma-162 combinado com o GRAS para 72 consultas da classe 1. Embora as revoca¸c˜oes tenham sido tomadas nos pontos 1/72 ... 72/72 (72 pontos), a tabela exibe uma interpola¸c˜ao linear para os dez pontos de revoca¸c˜ao mostrados.

combinado com GRAS foram executadas em ambas as bases de dados, Columbia e natural. Primeiramente, uma ´unica tabela PR para o histograma-162 foi gerada a partir da m´edia de 72 consultas (uma consulta para cada imagem da classe 1). Assim, cada uma das 72 imagens da classe 1 ´e tomada como consulta 1 vez e confrontada com as 7200 imagens da base. O mesmo tipo de tabela, PR, foi gerada para o histograma-162 + GRAS. As duas tabelas foram combinadas em uma s´o, Tabela 5.2, onde tamb´em s˜ao mostrados os ganhos por revoca¸c˜ao e ganho final m´edio. A primeira observa¸c˜ao que pode ser tirada da Tabela 5.2 ´e o pequeno ganho em todos os pontos de revoca¸c˜ao. Embora seja pouco, o ganho final m´edio, 0.19%, n˜ao representa uma m´edia de perdas e ganhos, uma vez que o histograma-162 + GRAS superou o histograma-162 em todos os pontos de revoca¸c˜ao, o que pode indicar, dentre uma base de dados de 7200 imagens, um ganho significativo para o usu´ario. Sem d´uvida, esse pequeno ganho ´e devido ao aumento da quantidade de informa¸c˜ao fornecida pelo GRAS. ´E, portanto, uma indica¸c˜ao pr´atica de que a combina¸c˜ao de informa¸c˜oes de forma com informa¸c˜oes de cores pode levar a melhores resultados.

Outro ponto que ´e poss´ıvel observar ´e que a quantidade de informa¸c˜ao de cores usada ´e muito superior a pequena quantidade informa¸c˜ao de forma. Isso explica o pequeno ganho,

Figura 5.3: Desempenho do histograma-162 combinado com o GRAS para a classe 1 da base de dados Columbia. Cada uma das 72 vistas da classe foi tomada como consulta confrontada com as 7200 imagens da base. O gr´afico ´e a m´edia dessas 72 consultas. no entanto, aumentar a quantidade de informa¸c˜ao de forma e diminuir a de cor ´e uma estrat´egia que precisa ser investigada futuramente.

A queda “ constante” da evolu¸c˜ao das precis˜oes, exibida no gr´afico da Fig. 5.3, em rela¸c˜ao `as revoca¸c˜oes ´e outro fator importante a ser considerado. Isso pode ser um reflexo do fato de ser uma base controlada, onde as vistas variam em taxas quase constantes de parˆametros (ˆangulo de vis˜ao, luminosidade, etc.). Entre as revoca¸c˜oes 0.2 e 0.7, o gr´afico exibe uma subita melhora no desempenho, sugerindo que as consultas nesta faixa eram imagens com melhor conjunto de relevantes, isso ´e comprovado observando como as vistas foram fotografadas; como h´a um giro de 360o, ´e natural que uma faixa de imagens

semelhantes se repitam, gerando um desempenho peri´odico. No entanto, o desempenho sempre cai, devido ao aumento da revoca¸c˜ao. O mesmo foi feito para a base natural; foram feitos experimentos para cada uma das 14 classes da base. Como na base da Columbia, cada membro de cada classe foi tomado como consulta e calculada a m´edia global por classe. A Tabela 5.3 mostra o resultado m´edio de 175 consultas da classe carro da base natural. Ao contr´ario da classe 1 da base Columbia, claramente a combina¸c˜ao das caracter´ısticas

CAP´ITULO 5. EXPERIMENTOS 79

Revoca¸c˜ao HSV-162 HSV-162 + GRAS Ganho (%) 0.10 0.3421 0.6192 44.7513 0.20 0.3037 0.5307 42.7737 0.30 0.2740 0.4093 33.0687 0.40 0.2476 0.3202 22.6733 0.50 0.2286 0.2662 14.1274 0.60 0.2114 0.2392 11.6221 0.70 0.1982 0.2240 11.4758 0.80 0.1876 0.2046 8.3089 0.90 0.1779 0.1882 5.4729 1.00 0.1578 0.1604 1.6209 M´edia 0.2329 0.3162 26.3465

Tabela 5.3: Desempenho do histograma-162 e do histograma-162 combinado com o GRAS para 175 consultas da classe carro da base natural. Como na tabela anterior, embora as revoca¸c˜oes tenham sido tomadas nos pontos 1/175 ... 175/175 (175 pontos), a tabela exibe uma interpola¸c˜ao linear para os dez pontos de revoca¸c˜ao mostrados.

extra´ıdas pelo GRAS com o histograma-162 superam o desempenho no caso de ser usado somente o histograma-162. Em alguns pontos de revoca¸c˜ao o ganho chega a ser de quase 50%. O ganho m´edio, em torno de 27%, ´e devido `as caracter´ısticas da base natural. Ela possui muitas informa¸c˜oes globais que geralmente n˜ao s˜ao capturadas somente com o uso de histogramas.

O gr´afico da Fig. 5.4 compara o desempenho do histograma-162, quando ele ´e usado sozinho e quando ´e combinado com o GRAS.

O mesmo foi feito para as demais classes. Na Tabela 5.4 s˜ao mostradas as precis˜oes e revoca¸c˜oes para a classe texturas, podendo serem vistos ganhos de at´e 70%, com um ganho m´edio de 55%. Sendo essa classe, portanto, a mais adequada para o uso do GRAS. A Figura 5.5 mostra o comportamento global para todos os pontos. Com cerca de 70% de revoca¸c˜ao, o desempenho cai muito, praticamente se igualando ao desempenho do histograma-162. Esse fato pode indicar o seguinte. Para grandes revoca¸c˜oes, muitas imagens da base de dados se assemelham muito `as imagens de pˆor-do-sol, dificultando os resultados. Este fato relembra o problema da classifica¸c˜ao manual da base; muitas imagens que possuem um pˆor-do-sol e um carro poderiam ser classificadas tanto em uma classe quanto em outra.

Figura 5.4: Desempenho do histograma-162 combinado com o GRAS para a classe carro da base natural.

Como exemplo, ver Fig. 1.2 na Se¸c˜ao 1.1.1.

A Tabela 5.5 apresenta os mesmos experimentos para a classe pˆor-do-sol da base natural. Outra vez, a combina¸c˜ao de informa¸c˜oes espaciais globais, fornecidas pelo GRAS, com histograma-162 supera em praticamente todos os pontos de revoca¸c˜ao o histograma de cores. Apenas para uma revoca¸c˜ao de 100% h´a uma perda em torno de 3% da t´ecnica combinada em rela¸c˜ao `a tecnica cl´assica. Essa perda pode vir mais uma vez do fato de a base ter sido classificada manualmente, gerando poss´ıveis imagens que podem ter sido classificadas como Por-do-Sol, no entanto, seus atributos espaciais classificam-na como pertencente a uma outra classe. Novamente, a Fig. 5.6 d´a uma id´eia geral do desempenho dos dois m´etodos.

Documentos relacionados