• Nenhum resultado encontrado

AO DE TEXTURAS BASEADA EM QUANTIZAC

N/A
N/A
Protected

Academic year: 2019

Share "AO DE TEXTURAS BASEADA EM QUANTIZAC"

Copied!
55
0
0

Texto

(1)

CLASSIFICAC

¸ ˜

AO DE TEXTURAS

BASEADA EM QUANTIZAC

¸ ˜

AO DE

VETORES

Marrone Silv´erio Melo Dantas

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO UNIDADE ACADˆEMICA DE GARANHUNS

(2)
(3)

Marrone Silv´erio Melo Dantas

CLASSIFICAC

¸ ˜

AO DE TEXTURAS BASEADA EM

QUANTIZAC

¸ ˜

AO DE VETORES

Monografia apresentada ao curso Bacharelado em Ciˆencias da Computa¸c˜ao da Universidade Federal Rural de Pernambuco, como requisito para a obten¸c˜ao do grau de Bacharel em Ciˆencias da Computa¸c˜ao.

Orientador: TIAGO BUARQUE ASSUNC¸ ˜AO DE CARVALHO

(4)

Ficha catalogr´afica: elaborada pela biblioteca do CI.

(5)

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO CAMPUS GARANHUNS

Trabalho de Conclus˜ao de Curso de Ciˆencias da Computa¸c˜ao de autoria de Mar-rone Silv´erio Melo Dantas intituladoCLASSIFICAC¸ ˜AO DE TEXTURAS BASE-ADA EM QUANTIZAC¸ ˜AO DE VETORES aprovada pela banca examinadora constitu´ıda pelos seguintes professores:

Prof. Dr. TIAGO BUARQUE ASSUNC¸ ˜AO DE CARVALHO UFRPE - Unidade Acadˆemica de Garanhuns

Prof. Dr. MARIA APARECIDA AMORIM SIBALDO DE CARVALHO UFRPE - Unidade Acadˆemica de Garanhuns

Prof. Dr. RIAN GABRIEL SANTOS PINHEIRO UFRPE - Unidade Acadˆemica de Garanhuns

Coordenador(a) do Curso de Ciˆencias da Computa¸c˜ao RODRIGO GUSMAO DE CARVALHO ROCHA

Garanhuns, 26 de Fevereiro de 2017

Bacharelado em Ciˆencias da Computa¸c˜ao, Universidade Federal Rural de Pernambuco Av. Bom Pastor, s/n - Boa Vista, Garanhuns - PE, 55292-270

(6)
(7)
(8)
(9)

DEDICAT ´

ORIA

Quero dedicar esta vit´oria a minha m˜ae Roseane Dantas, uma pessoa que sempre pensou no filhos antes de tudo, que sempre mostrou que se pode ganhar algo na vida foi a partir do estudo, que sempre mostrou o que ´e amor, que sempre ensinou o caminho certo, que sempre amei, que sempre esteve ao meu lado quando precisei, que sempre vou amar, meu obrigado.

A pessoa que sempre tornou o que fiz real, que sempre deu apoio de todas as maneiras, n˜ao somente a mim, mas todos que pode, todos que precisavam, mas hoje s´o posso abra¸ca-la e ela n˜ao pode me abra¸car de volta, mas compartilha comigo mas este passo, minha v´o Dona Rosa, um mulher guerreira e antes de tudo como minha m˜ae diz: ’um anjo na terra”, se sou algo algo hoje, isso tudo eu devo a ela tamb´em, meu obrigado. Ao meu pai senhor Jo˜ao Dantas, que foi apressado e partiu desse mundo, mas ainda vou encontr´a-lo para dar uma bronca nele, que sempre teve orgulho de mim, que quando fal´avamos sempre acreditou no meu potencial, que eu sempre amei, apesar de tudo, que como minha v´o sempre ajudou quem pˆode, um homem bom, um camarada! Dedico ao homem que vocˆe foi, o homem que eu enxergava, o homem que Deus pode ver, o pai que eu desejava, o amigo que escutava, o futuro que n˜ao teremos, o passado que fica, o meu pai, meu obrigado.

A meus irm˜ao que penso todos os dias, que amo e me preocupo Maria e Andr´e, que sempre me dediquei para poder fazer o papel do melhor irm˜ao, isso tudo tamb´em ´e de vocˆes, que tudo que tenho e terei, tudo que sei e saberei ´e nosso, nossa dores e alegria, tudo nosso, dedico essa conquista. Em especial que dedicar isto a minha v´o Eunice, que mesmo de forma simples sempre esteve comigo, que amo e sei que sempre fez o que pˆode, eu dedico este momento. A vocˆes meu obrigado.

Ao meu amigo que parece ser de adolescˆencia Hugo Felipe, que conhe¸co a mais tempo do que ´e datado, que sempre esteve l´a pra me ajudar e escutar, que me ajudou a passar pelo momento mais dif´ıcil da minha vida, ao meu sincero e verdadeiro amigo, meu obrigado.

(10)

AGRADECIMENTOS

Ao Professor Dro

Tiago Buarque pela orienta¸c˜ao neste projeto e pesquisa, al´em de aconselhamento pessoais e profissionais.

Ao professores Dro

Rian Gabriel e Dra

Maria Aparecida por ajudarem na avalia¸c˜ao compondo a banca.

`

A Maria de F´atima nossa governanta da casa de estudante, que ajudou muito nesses anos de luta, ao meu amigo Jos´e Kellison que me ajudou em in´umeras coisas, inclusive na tradu¸c˜ao do resumo desta monografia.

Em especial a uma companheira de luta at´e hoje Ana Raquel, uma das restantes da turma original, uma grande amiga.

Ao meus amigos que viraram noites fazendo projetos e estudando, ajudando isto a se tornar poss´ıvel: Marcus Vin´ıcius, Vin´ıcius Ferreira, Jeferson Pessoa e Jo˜ao Antˆonio.

`

(11)

RESUMO

Este trabalho teve como objetivo desenvolver um m´etodo capaz de ajudar na clas-sifica¸c˜ao de texturas. A clasclas-sifica¸c˜ao de textura ´e considerada uma tarefa dif´ıcil de ser realizada pelo computador, por as texturas serem muito suscet´ıveis `as vari´aveis de ambi-ente (como a ilumina¸c˜ao) e vari´aveis de manipula¸c˜ao (como redimensionamento e ruido). O m´etodo proposto foi baseado em uma extens˜ao do LBP (Local Binary Pattern) que aplica a ele uma quantiza¸c˜ao de vetores sendo denominado LVQP (Local Vector Quan-tization Pattern). S˜ao propostos dois novos m´etodos o DQP (Difference Quantization Pattern ) e o m´etodo MLVQP (Multiple LVQP). O MLVQP aplicou paralelamente o LVQP com sua modifica¸c˜ao DQP e concatenou seus histogramas para o processamento do classificador. O m´etodo obteve uma acur´acia superior ou pr´oxima em rela¸c˜ao ao m´etodo LBP e LVQP. Para o teste foi utilizada valida¸c˜ao cruzada, 100 repeti¸c˜oes de hol-dout e com o classificador k-NN (k-nearest neighbors), com k = 1, a m´edia e o desvio padr˜ao dos acertos foram calculadas. Foram utilizada 3 bases para o experimento UIUC, KTH-TIPS e KTH-TIPS2, nas quais foram aplicadas os m´etodos LBP, LVQP e o proposto MLVQP. Na base UIUC, os m´etodos chegaram a acur´acia m´axima com os seguinte valo-res: LBP (80,01%), LVQP (93,38%) e o MLVQP (95,35%); na base KTH-TIPS2 temos: LBP (95,68%), LVQP (98,08%) e o MLVQP (98,27%); e por fim, na base KTH-TIPS conseguimos: LBP (95,5%), LVQP (93,98%) com o MLVQP (94,89%). O m´etodo pro-posto se destaca quando o n´umero de padr˜oes para o treino dok-NN ´e pequeno. Na base UIUC a diferen¸ca m´axima de acur´acia entre o LVQP o MLVQP chega a 8,87%, na base KTH-TIPS2 chega a 6,16% e por fim a base KTH-TIPS com a diferen¸ca de 2,90%.

(12)

ABSTRACT

We propose a new texture classification technique. Texture classification is a hard task to be performed by computers due illumination changes, resize and noise. The proposed method is an extension of LBP (Local Binary Pattern) and LVQP (Local Vector Quantization Pattern). Two new methods are proposed: DQP (Difference Quatization Pattern) and MLVQP (Multiple LVQP). MLVQP computes LVQP and DQP in parallel and concatenate both final outputs before classification. MLVQP have accuracy higher or similar than that achieved by LBP and LVQP. In the test procedure, we calculate mean and standard deviation of the accuracy for 100 holdout repetitions. We used the 1-NN (nearest neighbor classifier) and 3 datasets: UIUC, KTH-TIPS e KTH-TIPS2. For UIUC, the maximum mean accuracy are: LBP (80.01%), LVQP (93.38%), and MLVQP (95.35%). For KTH-TIPS2: LBP (95.68%), LVQP (98.08%), and MLVQP (98.27%). And for KTH-TIPS: LBP (95.5%), LVQP (93.98%), and MLVQP (94.89%). We highlight the advantage of the proposed method when few examples are used for training. In this case, MLVQP have higher accuracy than LVQP: 8.87% (UIUC), 6.16% (KTH-TIPS2), and 2.90% (KTH-TIPS).

(13)

LISTA DE FIGURAS

1 (a) Textura original. (b) Textura rotacionada em 180 graus. . . 19

2 (a) Textura original. (b) Textura reduzida. (c) Textura ampliada. . . 19

3 (a) Textura com ruido; (b) Textura original. . . 20

4 Imagem em escala de cinza . . . 22

5 Espectros do Padr˜ao RGB. (a) Intensidade de Vermelho. (b) Intensidade de Verde. (c) Intensidade de Azul. . . 22

6 Exemplo de regress˜ao para uma vari´avel x. . . 23

7 Exemplo de problema de classifica¸c˜ao. . . 23

8 Textura geradas pela codifica¸c˜ao LBP. (a) Textura original. (b) Textura com codifica¸c˜ao LBP. (c) Textura com codifica¸c˜ao LBP com clareamento. . 24

9 Caption for LOF . . . 25

10 Codifica¸c˜ao LBP. (a) Padr˜ao original. (b) Binariza¸c˜ao da vizinhan¸ca. (c) N´umero bin´ario gerado. (d) N´um´ero bin´ario convertido para um valor base 10. (e) Substitui¸c˜ao do c´odigo LBP. . . 26

11 Exemplo de aplica¸c˜ao de interpola¸cao bilinear. X e Y s˜ao as posi¸c˜oes estipuladas, x1, x2, y1 e y2 s˜ao as posi¸c˜oes dos pixels mais pr´oximos inteiras em rela¸c˜ao a X e Y, e P ´e o novo valor do pixel ap´os a interpola¸c˜ao bilinear. 27 12 Padr˜oes LBP gerados. (a) e (b) s˜ao padr˜oes distintos mas quando s˜ao processados pelo LBP tem como resultado a mesma codifica¸c˜ao. . . 28

13 Exemplo da invariante de rota¸c˜ao. Em uma rota¸c˜ao onde temos R=1 e P=8, os que exigem mais de duas transi¸c˜oes espaciais assume o n´umero de P+1, ou seja, 9. . . 29

14 Padr˜oes LTP. Na figura temos o padr˜ao positivo e negativo. . . 30

15 Caption for LOF . . . 30

16 Compara¸c˜ao em LBP e LTP . . . 31

17 Busca no Codebook e associa¸c˜ao do novo c´odigo LVQP . . . 33

18 Invariante de rota¸c˜ao em um codebook (R=1, P=8) . . . 34

19 Diagrama geral da codifica¸c˜ao LVQP . . . 34

20 Compara¸c˜ao de defini¸c˜ao de c´odigos, LVQP x LBP . . . 35

(14)

22 Busca de pixel no LVQP com conjuntos de diferen¸cas . . . 37

23 Gera¸c˜ao de histograma ap´os LVQP . . . 38

24 Diagrama da defini¸c˜ao do m´etodo proposto aqui definido com MLVQP . . 38

25 Exemplo das 25 classes da base UIUC . . . 39

26 Exemplos das 11 classes da base KTH-TIPS2-b . . . 41

27 Exemplos das 10 classes da base KTH-TIPS . . . 43

28 Compara¸c˜ao do LVQPxMLVQP na base UIUC . . . 46

29 Compara¸c˜ao do LVQPxMLVQP base KTH-TIPS2 . . . 47

(15)

LISTA DE TABELAS

1 Resultado com R=1 e P=8 . . . 40

2 Resultado com R=2 e P=16 . . . 40

3 Resultados com R=3 e P=24 . . . 41

4 Resultados com R=1 e P=8 . . . 42

5 Resultados com R=2 e P=16 . . . 42

6 Resultados com R=3 e P=24 . . . 43

7 Resultados com R=1 e P=8 . . . 44

8 Resultados com R=2 e P=16 . . . 44

(16)

LISTA DE ABREVIATURAS

DQP - Differnce Quantization Pattern LBP – Local Binary Pettern

LTP - Local Ternary Pattern

LVQP - Local Vector Quantization Pattern

(17)

Conte´

udo

1 INTRODUC¸ ˜AO 18

1.1 Defini¸c˜ao do Problema . . . 18

1.2 Objetivo Geral . . . 20

1.3 Objetivos espec´ıficos . . . 20

1.4 Estrutura da monografia . . . 20

2 CONCEITOS GERAIS E REVIS ˜AO DA LITERATURA 21 2.1 Textura como Imagem . . . 22

2.2 Classificador . . . 23

2.3 LBP - Local Binary Pattern . . . 24

2.4 LTP . . . 29

2.5 LVQP . . . 31

3 M´ETODO PROPOSTO - MLVQP 36 3.1 Difference Quantization Pattern - DQP . . . 36

3.2 MLVQP . . . 37

4 APRESENTAC¸ ˜AO E AN ´ALISE DOS RESULTADOS 39 4.1 Base UIUC . . . 39

4.2 Base KTH-TIPS2 . . . 41

4.3 Base KTH-TIPS . . . 43

4.4 TESTE DE HIP ´OTESE . . . 45

5 CONCLUS ˜OES 50

REFERˆENCIAS 50

(18)

1

INTRODUC

¸ ˜

AO

A vis˜ao computacional tem como objetivo emular a vis˜ao humana, tentando trazer `a computa¸c˜ao uma interpreta¸c˜ao da imagem, sendo essa interpreta¸c˜ao completa ou parcial [35]. Para tal, a vis˜ao computacional, faz uso do reconhecimento de padr˜oes. Podemos definir o reconhecimento de padr˜oes como um ramo da aprendizagem de m´aquina que foca em reconhecer os poss´ıveis padr˜oes e regularidades a partir dos dados obtidos [2].

Um m´etodo natural humano para reconhecimento de objetos ´e a percep¸c˜ao de seus arranjos repetitivos padronizados sobre um ´area ou sobre toda ela, a esses arran-jos de padr˜oes ´e o que denominamos texturas [49]. A classifica¸c˜ao dessas texturas pode ser ´util nas mais diversas ´areas, como: inspe¸c˜ao industrial, biom´edica, na classifica¸c˜ao e an´alise de imagens de sensoriamento remoto e busca e identifica¸c˜ao por imagens com determinadas caracter´ısticas num banco de dados [21]. Obter a capacidade de classificar texturas de forma autom´atica ´e uma ferramenta de significativa importˆancia, que pode trazer in´umeros benef´ıcios para diversas ´areas, desde detectar algum tipo de cˆancer [1] at´e detec¸c˜ao de qualidade de frutas [16], ou seja, uma ´area que al´em de poder trazer benef´ıcios para industria tamb´em pode trazer benef´ıcios a sa´ude. Facilitar estes tipos de trabalhos pode culminar em uma diminui¸c˜ao de custos para empresas, melhora em diagn´ostico e consequentemente em uma poss´ıvel maior chance de curas, menos desperd´ıcios em em-presas de frutas, emem-presas de constru¸c˜ao de mat´erias automotivos entre muitas outras aplica¸c˜oes. Este trabalho trata exatamente disto, tenta abordar a classifica¸c˜ao de textu-ras com uma t´ecnica de aprendizagem de m´aquina que possa facilitar a automatiza¸c˜ao dessa classifica¸c˜ao, tentando fazer de forma r´apida e eficiente.

1.1 Defini¸c˜ao do Problema

A classifica¸c˜ao de textura nos dias atuais ainda ´e uma tarefa dif´ıcil de ser realizada pelo computador, pois textura ´e algo muito suscet´ıvel a trˆes fatores consider´aveis:

1. rota¸c˜ao;

2. mudan¸ca de escala;

3. ru´ıdo.

As limita¸c˜oes se tornam mais vis´ıveis com imagens reais, temos como exemplo abaixo a Figura 1 uma textura retirada e rotacionada da base KTH [14].

(19)

Figura 1: (a) Textura original. (b) Textura rotacionada em 180 graus.

Na Figura 1 temos um exemplo da mesma imagem, uma sem rota¸c˜ao e uma com rota¸c˜ao de 180 graus, que pode levar a um erro de classifica¸c˜ao em algumas maquinas somente pelo deslocamento de valores.

Outra limita¸c˜ao, comum em v´arios m´etodos, ´e a mudan¸ca de escala. Ao diminuir ou aumentar as dimens˜oes da textura pode-se gerar caracter´ısticas modificadas que talvez sejam interpretadas de forma diferente. Na Figura 2 temos um exemplo.

Figura 2: (a) Textura original. (b) Textura reduzida. (c) Textura ampliada.

O ´ultimo destes fatores que pode interferir na classifica¸c˜ao de texturas ´e o ruido. Uma modifica¸c˜ao inusitada `a imagem que pode gerar um fluxo de dados diferenciado, um exemplo desse ´e o ruido de sal e pimenta [4]. Na Figura 3, temos a imagem (a) com a aplica¸c˜ao de um ruido de sal e pimenta, j´a na Figura 3 (b) temos a imagem original.

(20)

Figura 3: (a) Textura com ruido; (b) Textura original.

Foram propostos diversos m´etodos para tentar extrair caracter´ısticas das texturas para classifica¸c˜ao com m´ınimo de interferˆencia desses fatores. Existem atualmente diversos m´etodos na literatura que tentam resolver estes problemas, alguns desses m´etodos ser˜ao abordados neste trabalho.

1.2 Objetivo Geral

Propor um m´etodo de pr´e-processamento de texturas, utilizando quantiza¸c˜oes de vetores, em conjunto com o conceito de pixel central, para extra¸c˜ao de caracter´ısticas.

1.3 Objetivos espec´ıficos

• Estudo, compreens˜ao e implementa¸c˜ao de m´etodos de extra¸c˜ao de caracter´ısticas para classifica¸c˜ao de textura: LVQP (Local Vector Quantization Pattern) e LBP (Local Binaty Pattern);

• desenvolver um m´etodo baseado em LVQP;

• avaliar, com valida¸c˜ao cruzada e teste de hip´otese, em v´arias bases de dados de textura, utilizando o classificador k-NN (k-Nearest Neighbour);.

1.4 Estrutura da monografia

O Cap´ıtulo 2 conta com os conceitos gerais e a revis˜ao de literatura, um vis˜ao do estado da arte relacionado ao problema abordado, e conceitos relacionado ao problema e solu¸c˜ao. O Cap´ıtulo 2 trata do m´etodo proposto, a defini¸c˜ao da forma que o problema foi abordado. O Cap´ıtulo 4 tem o experimento, os resultados e a an´alise dos resultados. Por fim temos o Cap´ıtulo 5 de conclus˜ao, fala sobre os vantagens do m´etodo proposto e trabalhos futuros.

(21)

2

CONCEITOS GERAIS E REVIS ˜

AO DA LITERATURA

A classifica¸c˜ao de textura apesar de n˜ao ser um problema novo ainda ´e um tema atual. Como citado anteriormente, a real dificuldade aumenta quando temos ru´ıdo, redi-mensionamento e rota¸c˜ao. Desde de muito tempo v´arias abordagens foram empregadas, algumas destas s˜ao descritas a seguir.

V´arios dos m´etodos utilizados para classifica¸c˜ao de textura utilizam tamb´em ex-tra¸c˜ao de caracter´ısticas, modificando a representa¸c˜ao da imagem. Entre estas m´etodos destacam-se m´etodos como o de iso-en´ergia [12], um tipo de medida de energia para ima-gens, e outro m´etodo baseado em espectros de Fourier [13]. Existem abordagens que se baseiam em modelagem estat´ıstica [23], ferramentas estat´ısticas como distribui¸c˜oes liga-das diretamente a imagem [53], distribui¸c˜oes ligaliga-das a vizinhan¸ca [55], abordagens com contabiliza¸c˜ao de histogramas tamb´em se mostraram com uma boa performance para classifica¸c˜ao [18, 54].

Algumas das abordagens mais antigas j´a tratavam de rota¸c˜ao com possibilidade de mudan¸ca de escala, como o campos aleat´orios gaussianos de Markov, [7] e modelo oculto de Markov [6]. Atualmente existe uma grande gama de abordagens para classifica¸c˜ao de texturas, um exemplo disso ´e uma combina¸c˜ao da an´alise de contraste e rota¸c˜ao local [5], que possui uma variante com modelagem estat´ıstica [27].

A classifica¸c˜ao de texturas conta com v´arias abordagens para os mais diversificados tipos de problemas. Em medicina, para classifica¸c˜ao de tumores [15, 24], de anticorpos de doen¸cas reum´aticas [48], les˜oes em rins e audi¸c˜ao [47] [46]. Na ind´ustria de min´erios para classifica¸c˜ao de carv˜ao [33]. Classifica¸c˜ao de moedas [30]. Verifica¸c˜ao das condi¸c˜oes de trilhos [32]. Classifica¸c˜oes de retinas [41]. Por fim na ind´ustria agr´ıcola para classifica¸c˜ao de frutas [16].

Uma das abordagens mais conhecidas para extra¸c˜ao de caracter´ısticas de texturas ´e o LBP (Local Binary Pattern), com mais de 20 anos, foi proposto no ano de 1994 pro Ojala et al. [39]. O LBP [40] se destacou por sua f´acil compreens˜ao e implementa¸c˜ao, al´em de uma tolerˆancia a varia¸c˜ao de ilumina¸c˜ao e rota¸c˜ao em compara¸c˜ao ao m´etodos daquela ´epoca. Ainda continua sendo uma op¸c˜ao eficiente em muito cen´arios.

Semelhante a Ojalaet al.[39] tivemos in´umeros trabalhos baseados em sua defini¸c˜ao de LBP, com melhoramentos em ´areas especificas. Como o trabalho de Tan e Triggs [50], denominado Local Ternary Pattern (LTP) ou Padr˜ao Local Tern´ario, que ´e um extens˜ao do tradicional LBP que possui como caracter´ıstica de codifica¸c˜ao de 2-dimens˜oes para um amplitude de 3-dimens˜oes. Mais tarde, foi proposto o chamado Complete Local Binary Pattern (CLPB) ou Padr˜ao Bin´ario Local Completo, que trata cada caracter´ıstica do LBP com individualidades: magnitude, sinal e o valor do pixel central [19].

(22)

Posteriormente foi proposto um m´etodo denominadoDominant LBP (DLBP), que funciona descartando alguns padr˜oes com menores ocorrˆencias para a cria¸c˜ao do histo-grama, assim com tratamento do ru´ıdo no pr´e- processamento [28]. O trabalho de Qiet al. possui um descritor baseado em LBP com an´alise de caracter´ısticas correlacionadas [45]. Utilizando quantiza¸c˜ao de padr˜oes temos Hussain e Triggs [20], que trabalha com cluste-riza¸c˜ao para redu¸c˜ao de dimens˜ao, e por fim temos uma varia¸c˜ao do LBP porposto pot Lee at. al. para tratamento de imagens coloridas [26].

Na Se¸c˜ao 2.1 ´e discutido a representa¸c˜ao de texturas como imagens. Na Se¸c˜ao 2.2 temos uma defini¸c˜ao de classificadores e do classificador k-NN . Na Se¸c˜ao 2.3 temos a defini¸c˜ao do m´etodo LBP (Local Binary Pattern), suas aplica¸c˜oes e exemplos. Na Se¸c˜ao 2.4 temos a defini¸c˜ao do m´etodo LTP (Local Ternary Pattern) uma extens˜ao do m´etodo LBP. Na Se¸c˜ao 2.5 temos a defini¸c˜ao do m´etodo LVQP, seu algor´ıtimo e como funciona.

2.1 Textura como Imagem

Textura podem ser tratadas com imagens. Tais imagens podem ser definidas como uma matriz, na qual cada posi¸c˜ao dessa matriz possui um valor que ´e a intensidade do pixel daquela posi¸c˜ao [56]. Na Figura 4 temos um exemplo de uma imagem. Cada posi¸c˜ao da matriz ´e o que denominamos pixel, ela possui valores inteiro que geralmente variam de 0 a 255, sendo que o valor 0 ser´a o mais escuro e 255 o mais claro. Com a utiliza¸c˜ao de valores nesta escala, somente ´e poss´ıvel reproduzir imagens em tons de cinza.

23 42 46 13 22 50 96 14 59 

Figura 4: Imagem em escala de cinza

Para a reprodu¸c˜ao de imagens coloridas, existem v´arios padr˜oes, um das mais conhecidos ´e o RGB (Red,Green,Blue), em que a imagem ´e formada pela combina¸c˜ao de trˆes matrizes. Cada uma indica um intensidade de determinada cor: vermelho, verde e azul [56]. Podemos observar um exemplo dos espectros de uma imagem RGB na Figura 5.

23 42 46 13 22 50 96 14 59 

(a)

21 12 61 31 21 53 67 44 55 

(b)

23 31 12 42 11 10 96 79 31 

(c)

Figura 5: Espectros do Padr˜ao RGB. (a) Intensidade de Vermelho. (b) Inten-sidade de Verde. (c) IntenInten-sidade de Azul.

(23)

2.2 Classificador

Em aprendizagem de m´aquina existem dois tipos principais de tarefas supervi-sionadas: regress˜ao e classifica¸c˜ao. Os problemas que estimam valores num´ericos s˜ao chamados de regress˜ao, quando o valor estimado pertence a um conjunto de op¸c˜oes ´e cha-mado de classifica¸c˜ao [17]. Podemos ver um exemplo de regress˜ao na Figura 6, o problema ´e determinar o valor de um im´ovel em um momento x.

Figura 6: Exemplo de regress˜ao para uma vari´avel x.

Se quisermos determinar se um indiv´ıduo pertence a determinado grupo, deter-minar uma nomenclatura para ele, temos um problema do tipo de classifica¸c˜ao [17]. Os grupos do problema s˜ao chamados classes e seus elementos s˜ao chamados padr˜oes. A Fi-gura 7 exemplifica o caso. Podemos perceber nesta fiFi-gura que existem trˆes classes, sendo o problema determinar em qual classe o novo padr˜ao se encaixa. Existem v´arios algor´ıtimos de classifica¸c˜ao, a aplica¸c˜ao desses algoritmos em uma m´aquina ´e o que chamamos classi-ficador. Existem diversos classificadores, como por exemplo: k-Nearest Neighbour, Naive Bayes, ´Arvore de Decis˜ao entre outros [51].

Figura 7: Exemplo de problema de classifica¸c˜ao.

(24)

k-Nearest Neighbor (k-NN)

O k-Nearest Neighbor (k Vizinhos Mais Pr´oximos) ou simplesmente k-NN [8] ´e um classificador simples por´em bastante eficiente em diversos problemas. O k-NN calcula as distˆancias entre o padr˜ao que pretende se classificar e todos os outros elementos da base. E seleciona k mais pr´oximos. E determina a classe do padr˜ao baseado nos k mais pr´oximos. Caso k seja igual a 1 (1-NN), significa que a classe que ele encontrar o padr˜ao com a menor distˆancia em rela¸c˜ao ao padr˜ao a ser classificado ser´a a escolhida.

Na Figura 7 temos um exemplo de um problema para classifica¸c˜ao com o 1-NN. Nesta figura, temos 3 classes. Na Figura 7 ´e classificado pertence a classe A, por possuir menor distˆancia em rela¸c˜ao aos integrantes dessa classe. Para medirmos essa distˆancia podemos usar v´arias medidas, as mais comuns s˜ao a euclidiana. Esta distˆancia ser´a discutida mais adiante, ver Equa¸c˜ao 13 na p´agina 32.

2.3 LBP - Local Binary Pattern

LBP ´e um pr´e-processamento desenvolvido para o classifica¸c˜ao de texturas. O LBP tem como sa´ıda um conjunto de caracter´ısticas, os quais v˜ao servir de entrada para algoritmos de classifica¸c˜ao. Na Figura 8 temos um exemplo de uma imagem com a aplica¸c˜ao do LBP.

Figura 8: Textura geradas pela codifica¸c˜ao LBP. (a) Textura original. (b) Textura com codifica¸c˜ao LBP. (c) Textura com codifica¸c˜ao LBP com clarea-mento.

Para entender o LBP s˜ao necess´arios dois conceitos: raio e vizinhan¸ca. Vizinhan¸ca s˜ao todos os pixels que circundam o pixel central. Os pixels vizinhos utilizados para o LBP s˜ao aqueles que est˜ao `a uma mesma distˆancia R (raio) do pixel central. Sendo o total de vizinhos um n´umero P. Na Figura 9, temos em (a) um bloco de raio 1 e 4 vizinhos (P = 4, R = 1), em (b) um bloco de raio 1 e 8 vizinhos (P = 8, R = 1), em (c) um

(25)

bloco de raio 1 e 8 vizinhos (P = 16, R = 1,5),em (d) um bloco de raio 2 e 16 vizinhos (P = 16, R = 2) e em (e) um bloco de raio 3 e 24 vizinhos (P = 24, R = 3).

Figura 9: Blocos para codifica¸c˜ao LBP. Imagem adaptada de Ojalaet. al. [40].

As posi¸c˜oes dos pixels vizinhos s˜ao determinadas a partir da equa¸c˜ao da circun-ferˆencia, a qual pode resultar em valores n˜ao inteiros. Visto que uma imagem pode ser tratada com uma matriz, valores n˜ao inteiros s˜ao considerados posi¸c˜oes inv´alidas. Neste caso ´e necess´ario calcular novos valores de intensidade para as posi¸c˜oes inv´alidas. O m´etodo utilizado para este prop´osito neste trabalho ´e o de interpola¸c˜ao bilinear, que ser´a descrito em detalhes a seguir. Na Figura 10 temos uma exemplo da codifica¸c˜ao LBP.

Dado um pixel central, o LBP ´e respons´avel pela gera¸c˜ao de um valor dede inten-sidade que substituir´a o valor atual. A defini¸c˜ao de nesse novo valor segue a Equa¸c˜ao (1).

LBPP,R(c) = P−1

X

p=0

s(gp −gc)2p (1)

Na Equa¸c˜ao (1), P ´e total de vizinhos, R ´e o raio, gc ´e o valor de intensidade do

pixel central e gp representa o valor de intensidade dop−pixelvizinho. O resultado desse

somat´orio ser´a o novo c´odigo LBP. A fun¸c˜ao do pixel central sdefine uma binariza¸c˜ao no LBP, ´E apresentada na Equa¸c˜ao (2).

s(x) = (

1, x≥0

0, x <0 (2)

Na Equa¸c˜ao (2), o valor de x ser´a um pixel vizinho subtra´ıdo do pixel central, retornando 0 se x for menor que 0 ou 1 caso contrario.

A codifica¸c˜ao LBP ´e definida de forma completa na Figura 10.

(26)

Figura 10: Codifica¸c˜ao LBP. (a) Padr˜ao original. (b) Binariza¸c˜ao da vizi-nhan¸ca. (c) N´umero bin´ario gerado. (d) N´um´ero bin´ario convertido para um valor base 10. (e) Substitui¸c˜ao do c´odigo LBP.

Na Figura 10 primeiro em (a) selecionamos o pixel central. Seus vizinhos s˜ao submetidos a Equa¸c˜ao (2) que os binariza (b). O n´umero bin´ario ´e gerado em (c) e convertido para base decimal em (d) e por fim substitui o valor antigo da intensidade em (e).

Ao final da codifica¸c˜ao LBP, as imagens precisam ser classificadas por alguma algoritmo de classifica¸c˜ao, a proposta do m´etodo ´e utilizar o histograma dessa imagens como entrada.

Na Equa¸c˜ao (3) temos a defini¸c˜ao de como o histograma ´e computado.

Mi = P−1

X

j=0

mj (3)

Na Equa¸c˜ao (3),Mi ´e n´umero total de observa¸c˜oes na posi¸c˜ao i, P ´e o n´umero total

de clusters emj ´e a posi¸c˜ao no histograma a ser somada.

Interpola¸c˜ao Bilinear

Para determinarmos as posi¸c˜oes dos vizinhos no LBP, aplicamos a equa¸c˜ao da circunferˆencia, que pode ser vista na Equa¸c˜ao (4).

gp = (Rseno(2πp/P), Rcos(2πp/P)) (4)

Na Equa¸c˜ao (4), temos que R ´e o raio, P ´e o total de vizinhos e p ´e o ´ındice do vizinho, tal que p∈ {0,1,2, ...., P −1}.

Como dito antes, o problema surge quando as posi¸c˜oes resultantes da equa¸c˜ao n˜ao s˜ao inteiras, sendo necess´ario utilizar interpola¸c˜ao bilinear. A Figura 11 demonstra uma posi¸c˜ao (x, y) n˜ao inteira entre os pixels nas posi¸c˜oes (x1, y1) e (x2, y2).

(27)

Figura 11: Exemplo de aplica¸c˜ao de interpola¸cao bilinear. X e Y s˜ao as posi¸c˜oes estipuladas, x1, x2, y1 e y2 s˜ao as posi¸c˜oes dos pixels mais pr´oximos inteiras em rela¸c˜ao a X e Y, e P ´e o novo valor do pixel ap´os a interpola¸c˜ao bilinear.

O valor final da interpola¸c˜ao bilinear ser´a a nova intensidade do pixel na posi¸c˜ao de entrada. No conjunto de Equa¸c˜oes (5) podemos observar a interpola¸c˜ao.

f(x, y)∼= y2−y

y2−y1

f(x, y1) + y−y1

y2−y1

f(x, y2) (5a)

f(x, y1)∼= x2−x

x2 −x1

Q11+

x−x1

x2−x1

Q21 (5b)

f(x, y2)∼= x2−x

x2 −x1

Q12+

x−x1

x2−x1

Q22 (5c)

No conjunto de Equa¸c˜oes (5),Q11, Q12, Q21eQ22 s˜ao intensidades de pixels pr´oximos

`a posi¸c˜ao de entrada (X, Y) e (x1, y1) e (x2, y2) s˜ao as posi¸c˜oes inteiras mais pr´oximas. LBP - Invariante de Rota¸c˜ao

O LBP possui sensibilidade quanto a rota¸c˜ao. Existem padr˜oes que pertencem a mesma classe e produzem c´odigos LBP distintos ou de classes distintas que produzem o mesmo c´odigo LBP, simplesmente por estarem rotacionados. Na Figura 12 temos um exemplo de dois padr˜oes que s˜ao distintos por´em produzem o mesmo c´odigo LBP.

Essa limita¸c˜ao foi abordada por Ojala et al.(2002) [40] com uma invariante de rota¸c˜ao. Essa invariante de rota¸c˜ao aplica um conceito chamado de transi¸c˜ao espacial. A transi¸c˜ao espacial ´e um valor de medida de esfor¸co para os c´odigos. Podemos ver a f´ormula na Equa¸c˜ao (6).

U(LBPP,R(c)) =|s(gP−1 −gc)−s(g0−gc)|

+

P−1

X

p=1

|s(gp−gc)−s(gp−1 −gc)|

(6)

(28)

Figura 12: Padr˜oes LBP gerados. (a) e (b) s˜ao padr˜oes distintos mas quando s˜ao processados pelo LBP tem como resultado a mesma codifica¸c˜ao.

Na Equa¸c˜ao (6) temos P o total de vizinhos, R o raio da imagem, gp o p pixel a

ser computado e gc o pixel central, a fun¸c˜ao S(x) ter´a como retorno o total de transa¸c˜oes

de um determinado c´odigo. Podemos ver a Equa¸c˜ao (2) para codifica¸c˜ao s do LBP. Na codifica¸c˜ao quando ´e aplicada a invariante ela ´e denominada LBPriuα, que

permite uma total de α transi¸c˜oes espaciais. Para este trabalho o valor de α selecionado foi 2. Na Equa¸c˜ao (7) podemos observar este caso:

LBPriuα

P,R (i, j) =

( PP

p=1s(gp−gc) se U(LBPP,R(i, j))≤α

P + 1 caso contrario´ (7)

Na Equa¸c˜ao (7) temos P o total de vizinhos, R o raio da imagem, gp o p-pixel a ser

computado e gc o pixel central. Se o total de transi¸c˜oes espaciais for menor ou igual a

α, a sa´ıda ser´a o somat´orio dos resultados da fun¸c˜ao s(x), caso contr´ario ser´a o valor de todos os vizinhos mais 1.

Na Figura 13 temos um exemplo da aplica¸c˜ao da invariante de rota¸c˜ao, nos blocos com resultado 5 n˜ao foi necess´ario aplicar pois tivemos menos de duas transi¸c˜oes espaciais, nos com resultado 9 as transi¸c˜oes foram superiores a 2, ent˜ao foi aplicado.

(29)

Figura 13: Exemplo da invariante de rota¸c˜ao. Em uma rota¸c˜ao onde temos R=1 e P=8, os que exigem mais de duas transi¸c˜oes espaciais assume o n´umero de P+1, ou seja, 9.

2.4 LTP

O LTP (Local Temary Pattern) ou Padr˜ao Local Tern´ario [50] ´e uma modifica¸c˜ao do LBP, onde o threshold se torna um novo valor t. A fun¸c˜ao s no LTP deixa de ser uma fun¸c˜ao de sa´ıda binaria e passa a ser ternaria. Na Equa¸c˜ao (8) temos a defini¸c˜ao do m´etodo LTP.

LT PP,R = P−1

X

p=0

s(gp−gc) (8)

Na Equa¸c˜ao (8), gc ´e o valor de intensidade do pixel central, egp representa o valor

de intensidade do p−pixel vizinho em um raio R com P vizinhos. A fun¸c˜ao tern´aria s

define a codifica¸c˜ao LTP, na Equa¸c˜ao (9).

s(x) =   

 

1, x≥t

0, |x|< t

−1 x≤ −t

(9)

Na Equa¸c˜ao (9), t ´e o threshold, x ´e um pixel vizinho subtra´ıdo do pixel central, retornando 1 se x for maior ou igual a t, 0 se t for menor que o m´odulo de x e -1 se for menor ou igual a menos t.

Padr˜oes LTP

O LTP possui possui uma sa´ıda tern´ario formado por 1, 0 e -1. Diferente do LBP

(30)

o LTP gera dois padr˜oes: um positivo e um negativo. Na Equa¸c˜ao (10) temos a fun¸c˜ao para o padr˜ao positivo e na Equa¸c˜ao (11) a fun¸c˜ao para o padr˜ao negativo.

Spositivo(x) =

(

1, x≥0

0, x <0 (10)

Snegativo(x) =

(

1, x≤0

0, x >0 (11)

Na Figura 14 temos uma demonstra¸c˜ao da gera¸c˜ao do c´odigo LTP, com o padr˜ao positivo e negativo.

Figura 14: Padr˜oes LTP. Na figura temos o padr˜ao positivo e negativo.

Os padr˜oes LTP s˜ao independentes e podem ser classificados de forma distintas. A Figura 15 ´e um exemplo de imagens geradas por os dois padr˜oes do LTP.

Figura 15: Padr˜oes LTP. (a) Padr˜ao positivo. (b) Padr˜ao Negativo. Fonte: [52]

(31)

LBP x LTP

O LTP possui um maior poder discriminante em rela¸c˜ao LBP, por aumentar a quantidade de caracter´ısticas e padr˜oes. Como o LBP efetua uma transforma¸c˜ao de escalar, o aumento de padr˜oes do LTP pode facilitar o processo de classifica¸c˜ao. J´a que o LBP tem como sa´ıda um c´odigo e o LTP pode possuir at´e 2 c´odigos. Na Figura 16 temos uma compara¸c˜ao das imagens geradas pelos padr˜oes LTP, enquanto o LBP gera somente uma codifica¸c˜ao, o LTP gera duas, uma positiva e uma negativa.

Figura 16: Compara¸c˜ao em LBP e LTP

2.5 LVQP

O LVQP (Local Vector Quantization Pattern) Padr˜ao Local com Quantiza¸c˜ao de Vetor [42], ´e um m´etodo baseado no LBP com quantiza¸c˜ao de vetor. A seguir temos uma explica¸c˜ao do funcionamento do LVQP.

Vetor de Diferen¸ca

O vetor de diferen¸ca ´e o conjunto de valores de todas as diferen¸cas de intensidade dos pixels vizinhos em rela¸c˜ao ao pixel central. Na Equa¸c˜ao (12) temos a equa¸c˜ao do vetor de diferen¸ca.

Vd= (g0−gc, g1−gc, ..., gP1−gc) (12)

Na Equa¸c˜ao (12), Vd´e o vetor de diferen¸ca, gc ´e o valor do pixel central, P ´e total

de vizinhos.

(32)

O vetor de diferen¸ca de cada pixel central agora ´e considerado um c´odigo para o LVQP. Esse c´odigo n˜ao passa pela binariza¸c˜ao e transforma¸c˜ao em escalar do LBP. O c´odigo tem a vantagem de manter a magnitude dos valores, que possuem um bom poder descritivo, perdida na transforma¸c˜ao escalar do LBP.

Quantiza¸c˜ao de Vetores

A quantiza¸c˜ao de vetores ´e um tipo de clusteriza¸c˜ao. Clusteriza¸c˜ao ´e um algor´ıtimo de aprendizagem de m´aquina n˜ao supervisionado que divide uma base de dados em grupos (clusters) de forma autom´atica a partir de alguma medida de distˆancia [37]. Cadacluster possui um representante, ´e o que chamamos de centroide. O centroide ´e um vetor de valores que serve de guia para a distribui¸c˜ao dos dados segundo a medida de similaridade escolhida.

A quantiza¸c˜ao de vetores utilizada ´e uma modifica¸c˜ao do conhecido k-M´edias com a adi¸c˜ao do conceito de distor¸c˜ao. Existem v´arios algor´ıtimos para a quantiza¸c˜ao de vetores, o utilizado neste trabalho ´e o de Linde-Buzo-Gray (LBG) [31]. Temos a seguir em detalhes do LBG:

1. Selecione um conjunto de dados.

2. Crie Nclusters de centroides selecionados aleatoriamente da base.

3. Distribua o restante dos dados segundo o centroide com menor distˆancia.

4. Atualize os centroides.

5. Calcule a distor¸c˜ao geral, se for maior que um valor ǫ ou o n´umero de itera¸c˜oes for menor que o total de itera¸c˜oes m´axima determinado volte ao passo 3, se n˜ao, finalize.

6. Retorne os centroides de cadacluster como uma lista (codebook).

A distˆancia utilizada para o algor´ıtimo foi a euclidiana. Na Equa¸c˜ao (13) temos sua defini¸c˜ao.

Deuclidiana(x,y) = L−1

X

j=0

(xj −yj)

2

(13)

Para a atualiza¸c˜ao dos centroides ´e calculada a m´edia dos valores em cadacluter. A distor¸c˜ao de um cluster em um itera¸c˜aoi´e a m´edia das distˆancia de todos seus elementos em rela¸c˜ao ao centroide. A distor¸c˜ao geral considera as itera¸c˜oes anteriores segundo a Equa¸c˜ao (14).

(33)

Dgeral = (Di−1−Di)/Di i= (1,2, ..., M ax) (14)

Em quei´e o ´ındice da itera¸c˜ao e Max ´e o valor m´aximo de itera¸c˜oes determinados no inicio do algoritmo. Ap´os a clusteriza¸c˜ao temos como resultado o codebook que ´e um matriz que cont´em todos os N centroides de dimens˜ao P.

LVQP - Algor´ıtimo

Para extrair caracter´ısticas o LVQP, primeiro seleciona-se uma base de imagens para para treino. Ent˜ao s˜ao extra´ıdas os seus vetores de diferen¸ca. Os vetores de diferen¸ca ser˜ao a nova base de dados para a clusteriza¸c˜ao por quantiza¸c˜ao de vetor.

Como o LVQP ´e um pr´e-processamento a segunda parte ser´a a convers˜ao da base de imagens para a codifica¸c˜ao. A partir do pixel central com seu vetor de diferen¸ca ´e realizada uma busca no codebook pelo valor mais pr´oximo, utilizando distˆancia euclidiana. Com o valor mais pr´oximo selecionado o ´ındice desse c´odigo no codebook se tornar´a o novo valor do pixel central. Esse processo ´e aplicado para todos os pixels nas imagens da base. A Figura 17 exemplifica esse processo.

Figura 17: Busca no Codebook e associa¸c˜ao do novo c´odigo LVQP

A busca ainda passa por um tratamento para rota¸c˜ao. O invariante de rota¸c˜ao consistes em rotacionar o c´odigo P vezes, tal que P ´e dimens˜ao do c´odigo, gerando um conjunto de c´odigos de tamanho P. Na Figura 18 temos um c´odigo com 8 dimens˜oes (P = 8), que foi rotacionado 8 vezes, tendo como sa´ıda um conjunto de 8 c´odigos. Cada integrante do conjunto de c´odigos rotacionados ´e comparado com cada posi¸c˜ao do code-book, sendo aquele do conjunto que possuir a menor distˆancia o selecionado para aquele ´ındice. A Equa¸c˜ao (15) define o invariante de rota¸c˜ao para o LVQP.

DER(x, y) = min[Deuclidiana(x, yi)], i∈(0,1, ..., S−1). (15)

Na Equa¸c˜ao (15), temos que x´e um c´odigo do codebook, y´e o conjunto de c´odigos rotacionados e P ´e a dimens˜ao dos c´odigos. Na Figura 18 temos um exemplo temos um

(34)

um c´odigo LVQP rotacionado.

1(x1, x2, x3, x4, x5, x6, x7, x8)

2(x2, x3, x4, x5, x6, x7, x8, x1)

3(x3, x4, x5, x6, x7, x8, x1, x2)

4(x4, x5, x6, x7, x8, x1, x2, x3)

5(x5, x6, x7, x8, x9, x2, x3, x4)

6(x6, x7, x8, x1, x1, x3, x4, x5)

7(x7, x8, x1, x2, x2, x4, x5, x6)

8(x8, x1, x2, x3, x3, x5, x6, x7)

Figura 18: Invariante de rota¸c˜ao em um codebook (R=1, P=8)

Na Figura 19 temos um diagrama do funcionamento geral do algor´ıtimo LVQP.

Figura 19: Diagrama geral da codifica¸c˜ao LVQP

O vetor de diferen¸ca consegue armazenar no geral mais informa¸c˜oes com rela¸c˜ao ao pixel central, como magnitude e ilumina¸c˜ao. Na Figura 20 temos um exemplo de como a codifica¸c˜ao LVQP pode ser mais eficiente que o LBP.

(35)

Figura 20: Compara¸c˜ao de defini¸c˜ao de c´odigos, LVQP x LBP

Na Figura 20 o c´odigo LVQP ´e diferente para padr˜oes distintos enquanto o do LBP teve como resultado c´odigos iguais. De forma similar ao LBP, as caracter´ısticas computadas pelo LVQP s˜ao utilizadas para gerar um histograma para serem para uma m´aquina de classifica¸c˜ao. Para o histograma podemos considerar a Equa¸c˜ao (3).

Considera¸c˜oes Finais

O m´etodo LBP apesar de ser antigo, ´e um robusto e de simples implementa¸c˜ao. V´arios m´etodos utilizam como base o LBP, como citado aqui o LVQP. O LVQP ´e uma modifica¸c˜ao do LBP, que adiciona quantiza¸c˜ao de vetores. A adi¸c˜ao de quantiza¸c˜ao de vetores com LBP aumenta acur´acia na classifica¸c˜ao de texturas. Por´em o LVQP possui algumas limitas, que podem ser trabalhadas para aumentar esta acur´acia. No Capitulo seguinte falamos do m´etodo proposto que modifica o LVQP para uma acur´acia maior e dos m´etodos necess´arios para o seu desenvolvimento.

(36)

3

ETODO PROPOSTO - MLVQP

Este trabalho prop˜oe uma modifica¸c˜ao do m´etodo LVQP. A primeira parte deste processo ´e a modifica¸c˜ao da entrada da quantiza¸c˜ao de vetor no LVQP, que deixa de ser o vetor de diferen¸ca e agora ´e cada valor de diferen¸ca, chamado agora de DQP (Difference Quantization Pattern). A segunda parte do processo ´e a aplica¸c˜ao do DQP e LVQP em uma mesma base de treino. Ent˜ao, de cada padr˜ao de textura s˜ao obtidos dois histogra-mas, um gerado pelo DQP e um pelo LVQP. Ent˜ao estes histogramas s˜ao concatenados e enviados para um classificador.

3.1 Difference Quantization Pattern - DQP

Enquanto no LVQP s˜ao agrupasos os vetores de diferen¸ca, no DQP cada diferen¸ca ´e um dos elementos que vai ser agrupado. No DQP um vetor de diferen¸ca, que ´e um c´odigo de dimens˜ao P, se torna uma conjunto de P c´odigos com dimens˜ao 1. Ap´os `a aplica¸c˜ao dessa transforma¸c˜ao, em cada imagem temos como resultado um conjunto de diferen¸cas. Ent˜ao um ´unico conjunto com todas as diferen¸cas ´e formado a partir da uni˜ao de todos os conjuntos de diferen¸ca. E esse conjunto ´e quantizado atrav´es da clusteriza¸c˜ao. A Figura 21 demonstra como ocorre esse procedimento da clusteriza¸c˜ao das diferen¸cas no DQP. Conjuntos de Diferenças {5,-1,-32,41,12,32} Quantização com K clusters Cluster 1 Cluster 2 Cluster 3 Cluster K ... Conjunto de Diferenças {2,-4,9,1,32,-31} Conjunto de Diferenças {12,-22,49,-15,0,2} ... ...

Imagens de treino União dos Conjuntos de Diferenças

{5,-1, -32, 41,12,32, 12,-22,-49, -15,0,2,2,-4,

9,1,32,-31}

Figura 21: Diagrama simplificado do LVQP com pixel central (DQP)

Quando ´e realizada a busca no codebook, a partir de um valor gerado pelas dife-ren¸cas, como ele agora possui c´odigos de dimens˜ao 1 n˜ao ´e necess´ario tratamento para rota¸c˜ao. Para o convers˜ao da base s˜ao considerados os valores de diferen¸ca em rela¸c˜ao a um pixel central. Com o conjunto de diferen¸cas selecionado ent˜ao ´e efetuada a busca no

(37)

codebook. Para cada centroide ´e selecionado o valor do conjunto de diferen¸cas que possuir a menor distˆancia. Dentre todas as distˆancias calculadas a menor entre elas ser´a um novo c´odigo. O ´ındice do centroide com a menor distˆancia ser´a o novo valor desse c´odigo que ir´a substituir o valor do pixel central. Essa modifica¸c˜ao do LVQP chamamos de DQP (Diferrence Quantization Pattern) ou Padr˜ao de Quantiza¸c˜ao de Diferen¸ca. A Figura 22 exemplifica a busca de c´odigo no DQP. Na Figura 22 o novo c´odigo que ir´a substituir o valor do pixel 13 ser´a o ´ındice do codebook mais pr´oximo, ap´os a busca, neste caso 2.

Figura 22: Busca de pixel no LVQP com conjuntos de diferen¸cas

O DQP ´e uma modifica¸c˜ao do LVQP. A ele ´e adicionado o conceito de conjunto de diferen¸cas. Diferente do LVQP que trata de x vetores com dimens˜ao P, o DQP tem um conjunto comP valores de diferen¸ca. O DQP ´e mais simples se comparado ao LVQP, pois para o seu processamento n˜ao ´e necess´aria a aplica¸c˜ao de uma invariante de rota¸c˜ao. De forma similar ao LBP, as caracter´ısticas computadas pelo LVQP s˜ao utilizadas para gerar um histograma para serem para uma m´aquina de classifica¸c˜ao. Para gerar este histograma podemos considerar a Equa¸c˜ao (3).

3.2 MLVQP

O LVQP apresenta resultados impressionante como descritor, com acur´acia acima de 80% [42] em bases consideradas dif´ıceis. Como o LVQP foi proposto para classifica¸c˜ao a partir de histogramas, o n´umeros de caracter´ısticas est´a relacionado diretamente com o total declusters selecionados. O total declusters´e igual ao total de n´ıveis do histograma, se forem 8 clusters teremos um histograma com 8 n´ıveis.

Se o total de clusters selecionados for pequeno, pode resultar em uma grande redu¸c˜ao de caracter´ısticas, podendo culminar na perda de informa¸c˜ao importantes. Na Figura 23 a seguir temos a demonstra¸c˜ao disto. Na Figura 23, temos um conjunto de

(38)

treino que de in´ıcio possui 1024 caracter´ısticas em cada padr˜ao, que ap´os a codifica¸c˜ao passa a possuir somente 8 caracter´ısticas para a classifica¸c˜ao.

Figura 23: Gera¸c˜ao de histograma ap´os LVQP

´

E proposta a extra¸c˜ao de caracter´ısticas, para cada imagem, como a concatena¸c˜ao do histograma gerado pelo LVQP com o histograma gerdo pelo DQP. Visando aumentar o n´umero de caracter´ısticas. Com a concatena¸c˜ao do DQP e LVQP temos uma amplia¸c˜ao da quantidade de caracter´ısticas. Como temos uma computa¸c˜ao independentes dos dados, os valores podem ser computados simultaneamente de acordo com o esquema apresentado na Figura 24.

Figura 24: Diagrama da defini¸c˜ao do m´etodo proposto aqui definido com MLVQP

Na Figura 24 o m´etodos temos o LVQP e DQP executados de forma independente somente com valor de k (n´umero de clusters para a quantiza¸c˜ao de vetor) sendo com-partilhado. Como ambos m´etodos possuem o mesmo n´umero de clusters o n´umero de caracter´ısticas cresce, de k para 2k ap´os a concatena¸c˜ao.

O m´etodo ´e chamado MLVQP (Multiple Vector Local Quantization Pattern) ou Padr˜ao Local com Quantiza¸c˜ao de Vetor M´ultipla, por no processamento a quantiza¸c˜ao ser executada mais de uma vez.

(39)

4

APRESENTAC

¸ ˜

AO E AN ´

ALISE DOS RESULTADOS

Esta se¸c˜ao possui a demonstra¸c˜ao dos resultados e uma an´alise sobre eles e por fim a aplica¸c˜ao de testes de hip´oteses sobre os melhores resultados obtidos.

Nos testes executados existem algumas vari´aveis est´aticas que se mantem para todos: o n´umero m´aximo de itera¸c˜oes foi de 10000 e o valor de ǫ de distor¸c˜ao igual a 0,000001.

Para a execu¸c˜ao dos testes e algor´ıtimos todos os m´etodos foram implementados. Para a execu¸c˜ao do experimento foram selecionadas trˆes bases, a base UIUC [25] e KTH-TIPS [14] e KTH-KTH-TIPS2 [34], para efeito de compara¸c˜ao foram aplicados nas bases as codifica¸c˜oes LBP [40], LVQP [42] e o m´etodo proposto MLVQP. Tanto para o LVQP e MLVQP os valores declusters foram fixados emk =32, 64 e 128. Cada teste foi executado 100, vezes ent˜ao sua m´edia e desvio padr˜ao foram calculados. Para a classifica¸c˜ao foi utilizado o 1-Nearest Neighbors, com distˆancia euclidiana.

4.1 Base UIUC

A base UIUC ´e formada por 24 classes, cada classe possui 40 padr˜oes, sendo suas dimens˜oes originais de 640 de largura por 480 de altura. A base foi redimensionada para 20% em cada uma das suas dimens˜oes, para um melhor desempenho computacional. Para a valida¸c˜ao foi utilizado a valida¸c˜ao cruzada holdout com valores de treino N de cada classe, tal que N = 5, 10, 15, 20, ou seja de cada textura s˜ao enviado N imagens de cada classe para o treino e o restante para o teste. A Figura 25 tem um exemplo de cada textura presente na base UIUC.

Figura 25: Exemplo das 25 classes da base UIUC

Na Tabela 1 temos os resultados obtidos, juntamente com seu desvio padr˜ao, os

(40)

m´etodos utilizados com seu respectivo total de clusters, e a quantidade de N. Na Tabela 1 temos o raio igual a 1 (R=1) e o total de vizinhos igual a 8 (P=8). Em todos os casos o m´etodo proposto obteve um melhor resultado, chegando no seu melhor, com k = 64 clusters e N = 20 imagens de treino, com valor de 92,71% enquanto o LVQP chegou a 88,22% e por fim o LBP chegou a 72,99%, para os mesmos valores de N e k. Por´em com poucos valores para treino onde o N = 5 e K = 74 o MLVQP obt´em uma diferen¸ca consider´avel, de 73,59% contra os 64,99% do LVQP.

Tabela 1: Resultado com R=1 e P=8

Alg

N

20 15 10 5

LBP 72,99(1,58) 64,71(1,78) 55,21(1,58) 41,75(2,00)

LVQP(32) 87,96(1,30) 82,89(1,26) 75,93(1,42) 63,64(1,96)

LVQP(64) 88,22(1,36) 83,62(1,18) 76,70(1,49) 63,98(2,03)

LVQP(128) 88,71(1,36) 84,40(1,30) 77,58(1,52) 64,99(1,91)

MLVQP(32) 92,50(1,14) 89,18(1,10) 83,56(1,47) 73,55(2,00)

MLVQP(64) 92,71(1,07) 89,44(1,09) 84,01(1,23) 73,59(1,59)

MLVQP(128) 92,66(0,97) 89,60(1,01) 84,45(1,32) 73,56(1,84)

Na Tabela 2 temos os resultados obtidos quando temos o raio igual a 2 (R=2) e o total de vizinhos igual a 16 (P=16) juntamente com o desvio padr˜ao dos experimentos. Em todos os casos o m´etodo proposto obteve um melhor resultado, chegando no seu melhor com k = 128 e N = 20 com valor de 95,01% enquanto o LVQP chegou a 93,14% e por fim o LBP chegou a 78,48%, para os mesmo valores de k e N. Quando o set de treinamento ´e pequeno a diferen¸ca ´e mais significativa, com N = 5 e k = 128, chegando a 3,95% de diferen¸ca em rela¸c˜ao ao LVQP.

Tabela 2: Resultado com R=2 e P=16

Alg

N

20 15 10 5

LBP 78,48(1,60) 71,65(1,48) 62,77(1,58) 49,35(1,87)

LVQP(32) 90,99(1,17) 87,15(1,20) 81,03(1,43) 70,53(1,94)

LVQP(64) 92,86(1,06) 89,23(1,19) 84,22(1,21) 74,10(1,91)

LVQP(128) 93,14(1,20) 89,91(1,02) 84,87(1,32) 75,60(1,90)

MLVQP(32) 94,00(0,91) 90,91(0,99) 86,14(1,30) 77,27(1,73)

MLVQP(64) 94,67(0,89) 92,29(1,02) 88,19(1,19) 78,71(1,62)

MLVQP(128) 95,01(0,89) 92,78(0,96) 88,58(1,33) 79,55(1,62)

Na Tabela 3 temos os resultados obtidos quando temos o raio igual a 3 (R=2) e o total de vizinhos igual a 24 (P=24). Semelhante aos testes anteriores o MLVQP obteve os melhores resultados, com uma diferen¸ca significativa,quando a base de treinamento baixa,

(41)

com N = 5 e k= 128, o MLVQP chegou a 80,21% enquanto o LVQP chegou a 76,82% e por fim o LBP chegou a 50,55%.

Tabela 3: Resultados com R=3 e P=24

Alg

N

20 15 10 5

LBP 80,01(1,41) 73,16(1,62) 64,46(1,74) 50,55(1,93)

LVQP(32) 91,19(1,10) 87,48(1,27) 81,81(1,30) 72,15(1,76)

LVQP(64) 92,47(0,98) 89,16(1,21) 84,28(1,32) 74,66(1,78)

LVQP(128) 93,38(1,13) 90,37(1,10) 86,10(1,25) 76,82(1,87)

MLVQP(32) 93,76(0,98) 91,02(0,96) 86,67(1,31) 77,66(1,82)

MLVQP(64) 92,57(1,09) 89,14(1,04) 84,15(1,47) 74,35(1,59)

MLVQP(128) 95,35(0,81) 92,77(0,98) 88,83(1,27) 80,21(1,75)

4.2 Base KTH-TIPS2

A base KTH-TIPS2 [34] ´e um extens˜ao da base CURet [10] com varia¸c˜ao de posi¸c˜ao, tamanho e luz, tamb´em com a inclus˜ao de subsets de texturas existentes com outros mat´erias. A base possui dois conjuntos de teste, o KTH-TIPS2a e KTH-TIPS2b, para o experimento foi selecionado o KTH-TIPS2b que possui 11 texturas 200 pixeis de largura e 200 pixeis de altura, cada textura possui 4 subconjuntos, os subconjuntos tem tamanho variado de 77 a 108 padr˜oes. De cada textura foi escolhida o subconjunto com o maior n´umero de padr˜oes (108) e efetuada um redimensionamento para 50% de cada dimens˜ao e transforma¸c˜ao para escala de cinza, para diminui¸c˜ao do custo computacional. Para o holdout os valores usados de amostras foram de 56, 28, 14 e 7 imagens por classe. Na Figura 26 temos um exemplo das texturas presente na base.

Figura 26: Exemplos das 11 classes da base KTH-TIPS2-b

(42)

Na Tabela 4 temos os resultados obtidos quando temos o raio igual a 1 (R=1) e o total de vizinhos igual a 8 (P=8). O LBP chega ao m´aximo valor de 89,99%, comN = 56 e k = 128, enquanto o LVQP chega a 98,06% e o MLVQP com 98,27%, com mesmos valores de N ek. O destaque fica quando a amostragem ´e pequena, com N = 7 ek = 64, o LBP chega a somente 59,56%, o LVQP chega a 75,50% e o MLVQP tem o valor de 81,55%, uma diferen¸ca de 6,05%.

Tabela 4: Resultados com R=1 e P=8

Alg

N

56 28 14 7

LBP 89,99(1,25) 80,87(1,30) 70,26(1,77) 59,56(2,73)

LVQP(32) 95,94(0,89) 90,08(1,15) 81,64(1,69) 72,16(2,41)

LVQP(64) 97,73(0,72) 93,06(0,94) 85,07(1,71) 75,50(2,18)

LVQP(128) 98,06(0,54) 93,55(1,07) 86,13(1,25) 76,24(2,27)

MLVQP(32) 97,46(0,62) 93,62(0,95) 88,28(1,43) 80,63(1,96)

MLVQP(64) 97,85(0,54) 94,16(0,88) 88,66(1,41) 81,55(2,04)

MLVQP(128) 98,27(0,58) 94,52(0,87) 88,79(1,50) 81,42(1,97)

Na Tabela 5 temos os valores com o raio igual a 2 (R=2) e com vizinho igual a 16 (P=16). O MLVQP se mostrou superior em todos os casos, chegando ao seu m´aximo, com N = 56 e k = 128, com 97,82%, o LVQP com 97,18% e o LBP com 90,24%, com mesmos valores deN ek. Com a maior diferen¸ca emN = 7 ek = 32, onde o LBP chegou a somente 57,42%, o LVQP com 71,62% tendo o MLVQP com 81,64%.

Tabela 5: Resultados com R=2 e P=16

Alg

N

56 28 14 7

LBP 90,24(1,08) 79,96(1,20) 68,16(1,82) 57,42(2,33)

LVQP(32) 95,49(0,76) 89,71(1,07) 81,36(1,75) 71,62(2,49)

LVQP(64) 96,49(0,78) 90,67(1,09) 82,55(1,78) 72,93(2,36)

LVQP(128) 97,18(0,67) 91,71(1,11) 83,84(1,43) 74,82(2,22)

MLVQP(32) 97,48(0,57) 93,79(0,91) 88,57(1,55) 81,64(2,44)

MLVQP(64) 97,68(0,57) 93,96(0,91) 88,60(1,43) 80,75(1,96)

MLVQP(128) 97,82(0,62) 94,10(0,85) 88,51(1,50) 80,98(2,33)

Na Tabela 6 temos os valores com o raio igual a 3 (R=3) e com vizinho igual a 24 (P=24). O melhor resultado alcan¸cado pelo MLVQP foi de 98,02%, com k = 128 e N = 56, o LVQP de 97,74% e por fim o LBP com 91,54% os mesmos valore de k e N. A maior diferen¸ca fica com um quantidade de imagens de treino pequeno, com N = 7 e k = 64, com o LBP chegando a 58,57%, o LVQP a 73.99% finalizando o MLVQP 80,66%.

(43)

Tabela 6: Resultados com R=3 e P=24

Alg

N

56 28 14 7

LBP 91,54(1,05) 81,12(1,26) 69,97(1,84) 58,57(2,61)

LVQP(32) 95,68(0,84) 89,71(0,93) 81,50(1,61) 71,71(2,34)

LVQP(64) 96,96(0,76) 91,31(1,04) 83,49(1,50) 73,99(2,10)

LVQP(128) 97,74(0,60) 93,06(0,79) 85,50(1,36) 75,51(2,43)

MLVQP(32) 97,29(0,57) 93,51(0,92) 87,67(1,58) 80,45(2,09)

MLVQP(64) 97,51(0,56) 93,57(0,89) 87,89(1,51) 80,66(2,10)

MLVQP(128) 98,02(0,62) 94,33(0,81) 88,19(1,50) 80,57(2,51)

4.3 Base KTH-TIPS

A base KTH-TIPS [14] ´e formada por 10 classes, cada classe possui um total de 81 padr˜oes, sendo sua dimens˜oes originais de 200 de largura por 200 de altura. A base foi redimensionada para 50% do seu tamanho, em cada dimens˜ao, para diminuir o processamento. Para a valida¸c˜ao foi utilizado a valida¸c˜ao cruzada holdout, com N = 5, 10, 20, 40, ou seja de cada textura s˜ao enviado N imagens para o treino e o restante para o teste. A Figura 27 tem um exemplo de cada textura presente na base.

Figura 27: Exemplos das 10 classes da base KTH-TIPS

Diferente das outras base o LBP descreve muito bem esta base, mas o prop´osito ´e demonstrar que mesmo desta forma o MLVQP apresenta um melhoramento na per-formance do LVQP. Na Tabela 7 temos os valores com o raio igual a 1 (R=1) e com vizinho n´umero de vizinhos igual a 8 (P=8). O melhor resultado alcan¸cado pelo LBP foi de 93,44%, e o LVQP com 93,83% e com o MLVQP de 94,86%, ambos com k = 128 e N = 10. A maior diferen¸ca acontece quando a quantidade de imagens de treino ´e pequena, com o LBP chegando a 61,71%,o LVQP a 57,96% e o MLVQP com a 60,86%, ambos com

(44)

k = 128 e N = 5.

Tabela 7: Resultados com R=1 e P=8

Alg

N

40 20 10 5

LBP 93,44(1,15) 84,57(1,59) 73,49(2,32) 61,71(2,56)

LVQP(32) 91,75(1,42) 81,78(2,02) 68,21(2,04) 55,48(2,74)

LVQP(64) 93,09(1,27) 83,71(1,64) 69,71(2,37) 56,51(2,73)

LVQP(128) 93,83(1,36) 84,92(1,62) 71,49(2,56) 57,96(2,88)

MLVQP(32) 93,72(1,29) 84,35(1,74) 71,72(1,87) 59,52(2,83)

MLVQP(64) 94,43(1,25) 85,03(1,81) 72,48(2,08) 60,67(2,47)

MLVQP(128) 94,86(1,24) 86,15(1,63) 72,94(2,32) 60,86(3,00)

Na Tabela 8 temos os valores com o raio igual a 2 (R=2) e com n´umero vizinho igual a 16 (P=16). O m´aximo valor obtido pelo LBP foi de 95,5%, LVQP com 93,98% e MLVQP com 94,86%, ambos com k = 128 e N = 40. Com os conjunto de treinamento com poucas imagens ´e onde ocorre a maior diferen¸ca, o valor do LBP chegou a 61,66%, o LVQP a 59,97% e o MLVQP a 61,88%, ambos com k = 128 eN = 5.

Tabela 8: Resultados com R=2 e P=16

Alg

N

40 20 10 5

LBP 95,50(0,91) 87,00(1,92) 74,40(2,47) 61,66(2,38)

LVQP(32) 90,86(1,59) 81,08(1,79) 68,11(2,16) 55,90(2,34)

LVQP(64) 92,50(1,17) 83,63(1,79) 70,99(2,10) 58,37(2,84)

LVQP(128) 93,98(1,15) 85,76(1,64) 72,81(2,25) 59,97(2,71)

MLVQP(32) 92,80(1,29) 82,88(1,85) 71,11(2,22) 59,16(2,91)

MLVQP(64) 94,38(1,14) 85,23(1,89) 72,37(2,14) 60,49(2,37)

MLVQP(128) 94,86(1,07) 86,81(1,35) 74,28(2,33) 61,88(2,81)

Na Tabela 9 temos os valores com o raio igual a 3 (R=3) e com n´umero vizinho igual a 24 (P=24). O m´aximo valor obtido pelo LBP foi de 93,79%, LVQP com 93,72% e MLVQP com 94,89%, ambos com k = 128 e N = 40. Com os conjunto de treinamento com poucas imagens ´e onde ocorre a maior diferen¸ca, o valor do LBP chegou a 57,89%, o LVQP 61,24% e o MLVQP a 63,12%, ambos com k = 128 e N = 5.

(45)

Tabela 9: Resultados com R=3 e P=24

Alg

N

40 20 10 5

LBP 93,79(1,17) 85,67(1,61) 71,25(2,28) 57,98(2,94)

LVQP(32) 91,64(1,51) 82,33(1,79) 69,61(2,45) 57,29(2,59)

LVQP(64) 93,14(1,09) 84,47(1,79) 72,42(2,22) 59,85(2,44)

LVQP(128) 93,72(1,20) 85,56(1,75) 73,37(2,14) 61,24(2,65)

MLVQP(32) 93,01(1,09) 83,77(1,70) 71,79(2,07) 59,82(2,73)

MLVQP(64) 94,60(1,14) 86,12(1,53) 73,68(1,99) 61,95(3,00)

MLVQP(128) 94,89(1,16) 87,01(1,70) 75,72(1,92) 63,12(2,95)

4.4 TESTE DE HIP ´OTESE

O MLVQP ´e uma extens˜ao do LVQP, ele possui maior taxa de acerto quando analisado principalmente em testes com menos itens no conjunto de treino, suas maiores diferen¸cas de taxa de acertos ocorreram nesse tipo de cen´ario. Os resultados que conse-guiram a maior diferen¸ca de acur´acia, foram submetidos ao teste de hip´otese de Z com uma intervalo de confian¸ca de 95,00%.

O testeZ [36] ele serve para comparar m´edias populacionais com variˆancias conhe-cidas. No nosso caso as m´edias populacionais ser˜ao as m´edias das acur´acias dos testes. Para os testes foram consideradas duas hip´oteses: a nula na qual os m´etodos LVQP tem m´edia de acur´acia menor ou igual ao MLVQP e a hip´otese alternativa o m´etodo MLVQP possui uma acur´acia m´edia superior. Os testes foram aplicados de forma n˜ao pareada e considerando os eventos independentes, sendo realizado um teste para cada caso.

Podemos observar na Figura 28 o gr´afico comparando a acur´acia da base UIUC quando atingiu seu m´aximo valor, com 128 clusters, com raio 3 (R=3) e com 24 vizinhos (P=24) ao n´umero de exemplos no conjunto de treinamento.

(46)

5 10 15 20

70

80

90

100

LVQP x MLVQP − 128 Cluster − R =3, P=24

Número de Fold’s

Acur

ácia

MLVQP LVQP

Figura 28: Compara¸c˜ao do LVQPxMLVQP na base UIUC

Considerando a compara¸c˜ao das acur´acias no gr´afico da Figura 28, com o holdout igual a 5 temos a maior diferen¸ca, realizando o teste de hip´otese para esse holdout temos as seguintes equa¸c˜oes:

H0 :µ1 ≤µ2 (16)

H1 :µ1 > µ2 (17)

Em que H0 ´e a hip´otese nula, na equa¸c˜ao (17) temos H1 com a hip´otese a ser

validada, µ1 ser´a a m´edia do m´etodo MLVQP e µ2 a m´edia do m´etodo LVQP. Como j´a

foi citado ser´a aplicado o teste Z que ´e definido da seguinte forma:

z = qx¯1−x¯2

σ2 1

n1 +

σ2 2

n2

(18)

Com z na equa¸c˜ao (18) sendo o score, ¯x1 ser´a a m´edia do m´etodo MLVQP e ¯x2

a m´edia do m´etodo LVQP, σ1 o desvio padr˜ao da m´edia do LVQP e σ2 o desvio padr˜ao

da m´edia do MLVQP e por fim n1 e n2, sendo o n´umero de testes do LVQP e MLVQP

respectivamente.

Para este caso temos que ¯x1 ´e igual a 80.21%, ¯x1 com 76.82%, com desvio padr˜ao

de 1.75% e 1.87% respectivamente. Como foi dito anteriormente o valor den´e equivalente

(47)

ao total de testes, ou seja, n1 e n2 s˜ao iguais a 100. Aplicando oscore z temos que:

z = q80.21−76.82

1.752

100 + 1.872

100

= 13.23 (19)

O valor de z foi grande, ou seja, na Tabela z tende ao infinito. Dado que φ(z) a fun¸c˜ao de retorno do valor de score da Tabela z, podemos considerar o valor de φ(z > 3)∼= 1. Com o intervalo de confian¸ca deα = 0.05. Comop= 1−φ(z) eφ(z) se aproxima de 1, temos que o p se aproxima de 0. Como que resulta em p < α, ou seja, rejeitando a hip´otese nula, concluindo-se que o m´etodo proposto possui uma acur´acia m´edia maior.

Para a base KHT-TIPS2b, o resultado se apresenta de forma semelhante, seu melhor resultado ocorreu quando possu´ıa 128 clusters, raio 3 (R=3) e com 24 vizinhos (P=24) . A seguir temos o gr´afico na Figura 28 demonstrando uma compara¸c˜ao das acur´acias entre os dois m´etodos em rela¸c˜ao aos holdouts de teste.

10 20 30 40 50

70

80

90

100

LVQP x MLVQP − 128 Cluster − R =3, P=24

Número de Fold’s

Acur

ácia

MLVQP LVQP

Figura 29: Compara¸c˜ao do LVQPxMLVQP base KTH-TIPS2

Considerando a compara¸c˜ao das acur´acias no gr´afico da Figura 29, com N = 5 temos a maior diferen¸ca de acur´acia, realizando o teste de forma similar ao anterior sendo a hip´otese nula da equa¸c˜ao 16, com a hip´otese a ser testada da equa¸c˜ao 17.

Considerando a equa¸c˜ao (18), referente ao valor de Z, neste caso temos que ¯x1 ´e

igual a 63.12%, ¯x1 com 61.24%, com desvio padr˜ao de 2.65% e 2.95% respectivamente.

Como foi dito anteriormente o valor de n´e equivalente ao total de testes, ou seja, n1 en2

s˜ao iguais a 100. Aplicando temos que:

(48)

z = q63.12−61.24

2.652

100 + 2.952

100

= 5.04. (20)

O valor de z foi grande, ou seja, na Tabela z tende ao infinito. Dado que φ(z) a fun¸c˜ao de retorno do valor de score da Tabela z, podemos considerar o valor de φ(z > 3)∼= 1. Com o intervalo de confian¸ca deα = 0.05. Comop= 1−φ(z) eφ(z) se aproxima de 1, temos que o p se aproxima de 0. Como que resulta em p < α, ou seja, rejeitando a hip´otese nula, concluindo-se que o m´etodo proposto possui uma acur´acia m´edia maior.

Na base KTH-TIP, foi onde ocorreu a menor diferen¸ca entre resultados, mas ainda sim obteve uma melhora na acur´acia, mas com o LBP se mantendo na maioria dos casos com a acur´acia superior ao LVQP e MLVQP. A base UIUC atingiu seu m´aximo valor, com 128 clusters, com raio 3 (R=3) e com 24 vizinhos (P=24). A seguir temos o gr´afico na Figura 29 demonstrando uma compara¸c˜ao das acur´acias entre os dois m´etodos em rela¸c˜ao aos holdouts de teste:

5 10 15 20 25 30 35 40

60

70

80

90

LVQP x MLVQP − 128 Cluster − R =3, P=24

Número de Fold’s

Acur

ácia

MLVQP LVQP

Figura 30: Compara¸c˜ao do LVQPxMLVQP base KTH-TIPS2

Considerando a compara¸c˜ao das acur´acias no gr´afico da Figura 30 com o holdout igual a 5 temos a maior diferen¸ca de acur´acia, realizando o teste de forma similar ao anterior aplicando a hip´otese nula da equa¸c˜ao 16, com a hip´otese a ser testada da equa¸c˜ao 17:

Aplicando a equa¸c˜ao (18), referente ao valor de Z, neste caso temos que ¯x1 ´e igual

a 80.57%, ¯x1 com 75.51%, com desvio padr˜ao de 2.51% e 2.43% respectivamente. Como

foi dito anteriormente o valor de n ´e equivalente ao total de testes, ou seja, n1 e n2 s˜ao

(49)

iguais a 100. Aplicando temos que:

z = q80.57−75.51

2.512

100 + 2.432

100

= 14.48 (21)

O valor de z foi grande, ou seja, na Tabela z tende ao infinito. Dado que φ(z) a fun¸c˜ao de retorno do valor de score da Tabela z, podemos considerar o valor de φ(z > 3)∼= 1. Com o intervalo de confian¸ca deα = 0.05. Comop= 1−φ(z) eφ(z) se aproxima de 1, temos que o p se aproxima de 0. Como que resulta em p < α, ou seja, rejeitando a hip´otese nula, concluindo-se que o m´etodo proposto possui uma acur´acia m´edia maior.

Os gr´aficos refor¸cam a hip´otese acima, quanto menor a quantidade de imagens para treino fica maior a diferen¸ca de acur´acia. Ainda que o MLVQP se mantenha superior na maioria dos casos, sua maior vantagem ´e com conjuntos de imagens pequenos para treino. Um dos poss´ıveis motivos do MLVQP possuir uma maior acur´acia em rela¸c˜ao ao LVQP com conjunto de de imagens pequeno para treino, pode ser por conseguir gerar um vetor de caracter´ısticas maior. Como o vetor de caracter´ısticas do LVQP possui k o vetor de caracter´ısticas do MLVQP tem 2k. Com rela¸c˜ao ao tempo computacional n˜ao foi executadas nenhuma m´etrica. Por´em ´e not´avel que o m´etodo n˜ao consome muito mais tempo do que executar duas vezes o LVQP. O DQP n˜ao tem um tempo de execu¸c˜ao maior que o LVQP, pois n˜ao necessita de rota¸c˜oes para executar a busca. E o MLQVP executa o LVQP e DQP.

(50)

5

CONCLUS ˜

OES

Como foi visto neste trabalho o reconhecimento de texturas continua sendo um problema atual. Com aplica¸c˜oes em diversas ´areas como: industria de min´erio, medicina, mercado agr´ıcola, entre outras. Existem diversas abordagens relacionadas a classifica¸c˜ao de texturas: de redes neurais a modelagem estat´ıstica. Dos mais diversos m´etodos exis-tentes um que se destacou foi o LBP. O LBP possui um impressionante poder de des-cri¸c˜ao por´em possui diversas limita¸c˜oes, como sensibilidade ao ru´ıdo, rota¸c˜ao e mudan¸ca de escala. Para isso foram criadas diversas modifica¸c˜oes, uma delas que apresentou um aumento consider´avel na acur´acia foi a LVQP que aplica uma quantiza¸c˜ao de vetor.

Apesar do LVQP apresentar maior acur´acia em rela¸c˜ao ao LBP ele ainda possui algumas limita¸c˜oes. Em boa parte relacionada a sua redu¸c˜ao dr´astica de dimens˜oes. Tendo este problema em vista aqui foram propostas duas abordagens: a DQP e MLVQP. O DQP ´e uma modifica¸c˜ao do LVQP, a qual realiza quantiza¸c˜ao na diferen¸cas entre o pixel central e seus vizinhos. O MLVQP executa simultaneamente o LVQP com DQP e concatena os histogramas gerados por cada m´etodo.

O MLVQP apresenta acur´acia maior ou semelhante em compara¸c˜ao a m´etodos ao LBP e LVQP, chegando a valores m´aximos para cada base: UIUC com 95,35%, KTH-TIPS2 com 98,27% e KTH-TIPS com 94,89%. Com o resultado final deste trabalho temos o MLVQP sendo uma solu¸c˜ao aceit´avel para a classifica¸c˜ao de texturas. Demonstrando uma acur´acia superior na maioria dos testes efetuados, com diferen¸cas de acur´acia em alguns casos superior a 9%. As diferen¸cas de acur´acias s˜ao significativas de acordo com o teste de hip´otese.

Para trabalhos futuros com o MLVQP sugerimos paraleliza¸c˜ao do m´etodo. Tamb´em utilizar outros elementos para quantiza¸c˜ao al´em das diferen¸cas em rela¸c˜ao ao pixel central, com fazemos com o DQP.

(51)

REFERˆ

ENCIAS

[1] P. Babaghorbani, S. Parvaneh, A. Ghassemi, and K. Manshai. Sonography images for breast cancer texture classification in diagnosis of malignant or benign tumors. In 2010 4th International Conference on Bioinformatics and Biomedical Engineering, pages 1–4, June 2010.

[2] Christopher M. Bishop. Pattern Recognition and Machine Learning (Information Science and Statistics). Springer-Verlag New York, Inc., Secaucus, NJ, USA, 2006. [3] Phil Brodatz. Textures : a photographic album for artists and designers. Dover

Publications, New York, 1966.

[4] Raymond H. Chan, Chung Wa Ho, and Mila Nikolova. Salt-and-pepper noise re-moval by median-type noise detectors and detail-preserving regularization. IEEE Transactions on Image Processing, 14(10):1479–1485, 2005.

[5] J. Chen, S. Shan, C. He, G. Zhao, M. Pietikainen, X. Chen, and W. Gao. Wld: A robust local image descriptor. IEEE Transactions on Pattern Analysis and Machine Intelligence, 32(9):1705–1720, Sept 2010.

[6] Jia-Lin Chen and A. Kundu. Rotation and gray scale transform invariant texture identification using wavelet decomposition and hidden markov model. IEEE Tran-sactions on Pattern Analysis and Machine Intelligence, 16(2):208–214, Feb 1994. [7] F. S. Cohen, Z. Fan, and M. A. Patel. Classification of rotated and scaled textured

images using gaussian markov random field models. IEEE Transactions on Pattern Analysis and Machine Intelligence, 13(2):192–202, Feb 1991.

[8] Thomas Cover and Peter Hart. Nearest neighbor pattern classification. IEEE tran-sactions on information theory, 13(1):21–27, 1967.

[9] K. J. Dana, S. K. Nayar, B. van Ginneken, and J. J. Koenderink. Reflectance and texture of real-world surfaces. In Computer Vision and Pattern Recognition, 1997. Proceedings., 1997 IEEE Computer Society Conference on, pages 151–157, Jun 1997. [10] Kristin J Dana, Bram Van Ginneken, Shree K Nayar, and Jan J Koenderink. Reflec-tance and texture of real-world surfaces. ACM Transactions On Graphics (TOG), 18(1):1–34, 1999.

[11] Larry S. Davis. Polarograms: A new tool for image texture analysis. Pattern Recog-nition, 13(3):219–223, 1981.

(52)

[12] Jacques Duvernoy. Optical–digital processing of directional terrain textures invariant under translation, rotation, and change of scale. Applied Optics, 23(6):828–837, Mar 1984.

[13] G. Eichmann and T. Kasparis. Topologically invariant texture descriptors. Computer Vision, Graphic and Image Processing, 41(3):267–281, March 1988.

[14] Mario Fritz, Eric Hayman, Barbara Caputo, and Jan olof Eklundh. The kth-tips database, 2004. Dispon´ıvel em: www.nada.kth.se/cvap/databases/kth-tips/.

[15] Y. Gan, X. Yao, E. Chang, S. B. Amir, H. Hibshoosh, S. Feldman, and C. P. Hendon. Comparative study of texture features in oct images at different scales for human breast tissue classification. In 2016 38th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), pages 3926–3929, Aug 2016.

[16] F. Garcia, J. Cervantes, A. Lopez, and M. Alvarado. Fruit classification by ex-tracting color chromaticity, shape and texture features: Towards an application for supermarkets. IEEE Latin America Transactions, 14(7):3434–3443, July 2016. [17] Raul Garreta and Guillermo Moncecchi. Learning scikit-learn: machine learning in

python. Packt Publishing Ltd, 2013.

[18] R. K. Goyal, W. L. Goh, D. P. Mital, and K. L. Chan. Scale and rotation invariant texture analysis based on structural property. InIndustrial Electronics, Control, and Instrumentation, 1995., Proceedings of the 1995 IEEE IECON 21st International Conference on, volume 2, pages 1290–1294 vol.2, Nov 1995.

[19] Z. Guo, L. Zhang, and D. Zhang. A completed modeling of local binary pattern ope-rator for texture classification. IEEE Transactions on Image Processing, 19(6):1657– 1663, June 2010.

[20] Sibt ul Hussain and Bill Triggs. Visual Recognition Using Local Quantized Patterns, pages 716–729. Springer Berlin Heidelberg, Berlin, Heidelberg, 2012.

[21] Rodrigo Hajime Ito, Hae Yong Kim, Walter Jaimes Salcedo, and Universidade De S˜ao Paulo. Classifica¸c˜ao de Texturas Invariante a Rota¸c˜ao Usando Matriz de Co-ocorrˆencia. 8th International Information and Telecommunication Technologies Symposium, 2009.

[22] Ahmad Izanloo, Ali Khaksari Rafsanjani, and Saeed Pourmehdi Ebrahimi. Effect of commercial land use and accessibility factor on traffic flow in bojnourd. Journal of Urban Planning and Development, page 05016016, 2016.

Imagem

Figura 1: (a) Textura original. (b) Textura rotacionada em 180 graus.
Figura 3: (a) Textura com ruido; (b) Textura original.
Figura 7: Exemplo de problema de classifica¸c˜ ao.
Figura 8: Textura geradas pela codifica¸c˜ ao LBP. (a) Textura original. (b) Textura com codifica¸c˜ ao LBP
+7

Referências

Documentos relacionados

A correlação significativa entre a presença de zona afótica na caverna e de riqueza total e de troglóbios (Tabela 1) pode se dever meramente ao fato de cavernas

evento, contudo, as meninas tendem a aumentar a quantidade de gordura corporal de forma mais acentuada que os meninos. Estes, por outro lado, aumentam de

Ninguém quer essa vida assim não Zambi.. Eu não quero as crianças

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

No prazo de 10 dias contada da deliberação, para os condóminos presentes, ou contada da sua comunicação, para os condómino ausentes, pode ser exigida ao administrador a convocação

Ainda segundo Gil (2002), como a revisão bibliográfica esclarece os pressupostos teóricos que dão fundamentação à pesquisa e às contribuições oferecidas por

Para disciplinar o processo de desenvolvimento, a Engenharia de Usabilidade, também conceituada e descrita neste capítulo, descreve os métodos estruturados, a

Neste sentido, esse estudo mostra que as famílias das camadas mé- dias cariocas são ao mesmo tempo “relacionais” e “individualistas”, pois na mesma medida em que as trocas