Open-GP - Particionamento dos Conjunto de Dados

A.4 Resultados do classificador OSOPF 2 no dataset CALTECH-256

4.2 Particionamento dos Conjunto de Dados

4.2.1 Open-GP

Para os m´etodos Open-GP foi simulado um cen´ario aberto durante a fase de treino. Para isto faz-se o seguinte particionamento das amostras do conjunto de treino:

1. Das x classes conhecidas do treino, toma-se a metade delas como classes conhecidas (y classes) e a outra metade como desconhecidas (z classes).

2. O conjunto de f itting ´e formado pelo 40% das amostras das y classes conhecidas e ´

3. O conjunto validation1(v1) é utilizado para validar a floresta gerada nas gera¸cões da programa¸cão genética e é composto por 30% das amostras das y classes conhecidas e o 50% das amostras das z classes desconhecidas.

4. O conjunto validation2 (v2) ´e usado para tratar o problema de overfitting. Este conjunto cont´em 20% das amostras das y classes conhecidas e 35% das amostras das z classes desconhecidas.

5. O conjunto validation3 (v3) é utilizado para procurar o melhor threshold no classificador OSOPF2-OGP (Se¸cão 3.1.2). Este conjunto contém 10% das amostras das y classes conhecidas e 15% das amostras das z classes desconhecidas.

O particionamento das amostras do treino para criar um cen´ario aberto ´e apresentando na Figura 4.4.

Figura 4.4: Particionamento Open-GP das amostras do treino. v1, v2, v3 s˜ao os conjuntos validation1, validation2 e validation3, respectivamente.

4.2.2 Closed-GP

Nos métodos Closed-GP é feito um treinamento considerando um cenário de classifica¸cão fechado. Portanto, todas amostras do conjunto de treino foram particionadas conforme ilustrado na Figura 4.5 e descrito a seguir.

• 40% das amostras das x classes conhecidas formam o f itting que ´e usado na gera¸c˜ao da floresta do classificador OPF.

• O primeiro conjunto de valida¸cão (v1 na figura) contém 30% das amostras das x classes e é utilizado para validar a floresta gerada.

• Para tratar o problema do overfitting, utiliza-se um segundo conjunto de valida¸c˜ao (v2 na figura). Este conjunto cont´em 30% das amostras das x classes.

Figura 4.5: Particionamento Closed-GP das amostras do treino. v1, v2 s˜ao os conjuntos validation1 e validation2, respectivamente.

4.3 Descritores

Neste trabalho, não se buscaram os melhores descritores para cada dataset. Foram utilizados descritores de cor e textura, considerando que são tipos de descritores que contribuem com caracter´ısticas diferentes dos objetos. Os descritores usados para extra¸cão de caracter´ıstica foram Border/Interior Pixel Classification (BIC), Color Autocorrelogram (ACC), Color Coherence Vector (CCV), Quantized Compound Change Histogram(QCCH) e Local Activity Spectrum(LAS), sendo os três primeiros de cor e os dois últimos de textura.

• Border/Interior Pixel Classification (BIC) [68]: A id´eia principal do descritor BIC ´

e classificar cada pixel da imagem como pixel de borda ou interior. É um método muito simples, eficiente, não custoso em tempo computacional e gera uma representa¸cão compacta (features) da imagem. Depois da quantiza¸cão dos pixels das imagens, os pixels são classificados como pixels de interior se seus vizinhos têm a mesma cor; caso contrário é classificado como pixel de borda. Para obter a representa¸cão, uma vez classificados os pixels, cria-se um histograma considerando apenas os pixels de borda e um outro considerando apenas os pixels de interior. O tamanho do vetor de features gerado pelo descritor é 128 (64 bins para o histograma de pixels de borda e 64 para o histograma referente aos pixels de interior).

• Color Autocorrelogram (ACC) [33]: Este descritor é utilizado para comparar imagens a partir da análise da correla¸cão espacial das cores a diferentes distâncias. É um descritor eficaz, eficiente, rápido e gera um vetor de caracter´ısticas relativamente pequeno. É baseado na probabilidade de encontrar um pixel de cor x a partir de um pixel de cor y a uma certa distância d em uma imagem. Possui tolerância a mudan¸cas em pontos de visão, diferentes tipos de ilumina¸cão e altera¸cões na forma. Os histogramas tradicionais de cor não contemplam nenhum tipo de informa¸cão espacial. O descritor ACC por sua vez considera a correla¸cão espacial local de cor e também a distribui¸cão global da correla¸cão espacial da imagem. O vetor gerado por este descritor possui 256 bins.

• Color Coherence Vector (CCV) [49]: O descritor CCV considera informa¸cão espacial da imagem e classifica cada pixel como coerente ou incorente. Os histogramas de cor não analisam informa¸cão espacial e por isto, existem imagens com aparências totalmente diferentes que podem ter histogramas de cor similares. No descritor

CCV, cada pixel é classificado considerando-se se pertence ou não a uma região cont´ınua de cores similares e de um tamanho considerável (componente conectado). Estas regiões são muito úteis para determinar a similaridade entre imagens. Um componente conectado é o conjunto máximo de pixels adjacentes, em que dois pixels são adjacentes se um pixel está entre os vizinhos mais próximos do outro. Para calcular o CCV, primeiro substituem-se os valores de cada pixel pela média do valor de seus vizinhos (geralmente os 8 vizinhos). Em seguida, geram-se componentes conexos (cada pixel pertence só a um componente conexo). Em seguida, classificam- se os pixels como coerente ou incoerente baseado no componente ao que pertence. Se o tamanho do componente é maior do que 1% do tamanho da imagem, o pixel é classificado como coerente, caso contrário como incoerente. Finalmente, cria-se um histograma para os pixels que formam parte de um dos componentes coerentes e outro para os que são parte dos componentes incorentes. O vetor de caracter´ısticas gerado combina os dois histogramas obtidos. O tamanho do vetor gerado é 128 (64 bins de pixels coerentes e 64 de pixels incoerentes).

• Quantized Compound Change Histogram (QCCH) [32]: QCCH é um descritor que se baseia nos vizinhos de cada pixel para procurar informa¸cão sobre a textura da imagem. Este descritor é independente da transla¸cão e da rota¸cão e é baseado no uso de uma janela quadrada na procura de mudan¸cas da cor cinza em toda a imagem. Cada janela é definida como Jr(x, y) em que r e (x, y) correspondem ao raio e centro da janela, respectivamente. Para cada pixel na imagem é calculada a taxa de mudan¸ca do n´ıvel de cinza em rela¸cão aos seus vizinhos em 4 sentidos diferentes (horizontal, vertical, diagonal e anti-diagonal) e é quantificado em 40 bins para obter a mudan¸ca composta quantificada no pixel. Em seguida, para obter o vetor de caracter´ısticas, calcula-se a mudan¸ca composta quantificada em toda a imagem. O tamanho do vetor gerado pelo descritor é 40.

• Local Activity Spectrum (LAS) [70]: LAS é um descritor de textura que aumenta a capacidade de discrimina¸cão a partir da utiliza¸cão de um histograma de gradiente (gradiente é invariante à transla¸cão) e uma medida de distância chamada SMD (Soma da distância m´ınima). O gradiente pode ser visto como um operador para medir a varia¸cão espacial local (atividade), ou seja a taxa de mudan¸ca em cada pixel. O sentido e a magnitude do gradiente são efetivos para diferenciar diferentes texturas. O LAS utiliza os operadores: soma, valor absoluto e contagem e por isto é mais eficiente em tempo computacional em compara¸cão com outros descritores que usam gradiente. Este descritor apresenta uma variante na indexa¸cão do gradiente para melhorar desempenho, considerando mudan¸cas nos sentidos horizontal, vertical, diagonal e anti-diagonal, com cada um destes sentidos formam-se componentes separados. Para gerar o vetor de caracter´ısticas, cria-se um histograma gerado pela distribui¸cão das 4 atividades (horizontal, vertical, diagonal e antidiagonal) medidas no pixel. Cada componente é quantificado com 4 bins criando um histograma final com 256 bins.

4.4 Configura¸c˜ao GP

Este trabalho utilizou JGAP [18], uma biblioteca java de programa¸cão genética. JGAP representa os indiv´ıduos da programa¸cão genética como árvores em que cada nó interno é um operador matemático e as folhas são valores.

Na programa¸cão genética existem diversos componentes que podem ter influência nos resultados como os operadores matemáticos utilizados e parâmetros da GP. No caso dos operadores e a taxa de reprodu¸cão, utilizaram-se as configura¸cões propostas em [73]. Os operadores são: +, /, × e sqrt que reportaram bons resultados e cuja taxa de reprodu¸cão foi 0, 05. Com rela¸cão aos parâmetros GP, além da taxa de reprodu¸cão, existem alguns atributos a levar em considera¸cão: taxa de muta¸cão, taxa de crossover, número de indiv´ıduos na popula¸cão inicial, número de gera¸cões e profundidade da árvore. Utilizaram-se as metodologias propostas em [4, 24, 62] para avaliar o impacto dos parâmetros GP nos experimentos de reconhecimento de objetos considerados.

Para avaliar o impacto das taxas de muta¸c˜ao e crossover, a seguinte estrat´egia foi adotada:

• Utilizou-se uma popula¸c˜ao inicial de 100 indiv´ıduos e 10 gera¸c˜oes.

• Os valores para testar as taxas de muta¸c˜ao e crossover foram (0, 05; 0, 1; 0, 2) e (0, 2; 0, 5; 0, 8), respectivamente.

• Executaram-se os experimentos correspondentes combinando os valores das taxas de muta¸c˜ao e crossover (9 experimentos no total).

• Selecionaram-se os valores das taxas que obtiveram melhores resultados.

Por outro lado, para avaliar os parâmetros número de indiv´ıduos na popula¸cão inicial (X), número de gera¸cões (Y ) e profundidade da árvore (Z) utilizou-se um modelo full- factorial de dois n´ıveis [10] que serve para conhecer a importância de cada parâmetro nos resultados. Este modelo foi testado e utilizado em [4, 24, 62]. Neste tipo de modelo, cada parâmetro é avaliado com dois valores, um valor baixo (−) e um valor alto (+). Os valores para cada parâmetro são apresentados na Tabela 4.3. Na Tabela 4.4, mostra- se como a avalia¸cão dos parâmetros resulta em um total de 2n _{experimentos em que n} é o número de parâmetros. No nosso caso, n = 3 dando um total de 8 combina¸cões poss´ıveis. Cada experimento é repetido 3 vezes com seeds aleatórias diferentes para gerar popula¸cões iniciais distintas. Com isto há um total de 24 execu¸cões. Para a avalia¸cão dos parâmetros usamos o dataset ALOI (considerando 9 classes como conhecidas) e o classificador OSOPF2-OGP.

Os efeitos de cada um dos parâmetros em nossos experimentos são apresentados na Tabela 4.5. Como pode ser observado, o impacto dos parâmetros não foi alto. Para calcular o efeito de um determinado parâmetro p a seguinte metodologia foi adotada:

1. b = m´edia de todos os experimentos em que p teve seu valor baixo. 2. a = m´edia de todos os experimentos em que p teve seu valor alto. 3. ef eito = a − b.

Tabela 4.3: Valores (Alto e Baixo) dos parˆametros GP avaliados.

Parˆametros Valores

Alto (↑ /+) Baixo (↓ /−)

Popula¸c˜ao inicial 300 50

N´umero de gera¸c˜oes 30 5

Profundidade da ´arvore 12 4

Tabela 4.4: Modelo fatorial em dois n´ıveis. Execu¸cões Parâmetros (Intera¸cão)

X Y Z XY XZ Y Z XY Z x↓ y↓ z↓ − − − + + + − x↑ y↓ z↓ + − − − − + + x↓ y↑ z↓ − + − − + − + x↑ y↑ z↓ + + − + − − − x↓ y↓ z↑ − − + + − − + x↑ y↓ z↑ + − + − + − − x↓ y↑ z↑ − + + − − + − x↑ y↑ z↑ + + + + + + +

4.4.1 Testes Estat´ısticos

Utilizou-se o teste ANOVA junto ao post-test Tukey’s HSD com 95% de n´ıvel de confian¸ca (ver Se¸cão 4.7 para mais detalhes acerca dos testes) para procurar diferen¸cas estat´ısticas significativas entre as médias dos experimentos realizados na avalia¸cão dos parâmetros GP. Os resultados do Tukey’s HSD são mostrados na Figura 4.6. Como pode ser observado, não existe diferen¸ca estat´ıstica significativa entre os experimentos. Desta forma, selecionou- se aquela combina¸cão de parâmetros que relativamente obteve uma melhor média nos experimentos.

Tabela 4.5: Efeito dos parâmetros. Parâmetros (Intera¸cão) Efeito (%)

X 0,583 Y 0,415 Z -1,236 XY 0,083 XZ 0,222 Y Z 0,0908 XY Z -0,0722

Finalmente, os operadores matemáticos e valores dos parâmetros utilizados neste trabalho são apresentados na Tabela 4.6. A Figura 4.7 apresenta a curva de evolu¸cão do classificador GP. Foram plotadas as acurácias obtidas nos conjuntos validation1, validation2 e teste pelos 15 melhores indiv´ıduos de cada gera¸cão nas Figuras 4.7a, 4.7b e 4.7c, res-

Figura 4.6: Tukey’s HSD para sele¸cão de parâmetros com 95% de n´ıvel de confian¸ca. Nesta figura é apresentada a diferen¸ca entre as médias de cada par de combina¸cões de parâmetros. Existe diferen¸ca estat´ıstica significativa se a diferen¸ca das médias de cada par não contêm o valor 0. Neste caso, todos os pares contém o valor 0, portanto não existe diferen¸ca estat´ıstica significativa entre nenhum par.

pectivamente. Observa-se que as curvas na Figura 4.7 têm um comportamento similar. A evolu¸cão dos indiv´ıduos nas últimas gera¸cões não tem maior impacto na acurácia; com isto, verifica-se a estabiliza¸cão do classificador com 30 gera¸cões.

Tabela 4.6: Configura¸c˜ao GP.

Parˆametro Valor

Fun¸cões +, /, × e sqrt Muta¸cão 0,1 Reprodu¸cão 0,05 Crossover 0,8 Popula¸cão inicial 300 Gera¸cões 30 Profundidade da árvore 4-6

4.5 Grid Search

O reconhecimento de objetos na área de Aprendizado de Máquina tem como objetivo mi- nimizar a taxa de erro na fase de teste. Alguns métodos precisam procurar o melhor valor

(a)

(b)

(c)

Figura 4.7: Evolu¸cão da acurácia normalizada do GP considerando os melhores 15 indiv´ıduos de cada gera¸cão nos conjuntos: a) validation1, b) validation2 e c) teste.

para determinados parâmetros que influenciam diretamente o resultado. Entretanto, esta é uma tarefa dif´ıcil e custosa dependendo se o trabalho é feito manual ou computacional- mente, ou se o espa¸co de busca do parâmetro é muito grande.

Grid Search [8] é uma técnica para otimiza¸cão de parâmetros. A otimiza¸cão de parâmetros é o problema de procurar o melhor valor de um parâmetro para ser utilizado dentro de um determinado problema. De forma geral, para realizar um grid search faz-se o seguinte:

• Definir o conjunto p de parˆametros que precisa ser otimizado; • Estabelecer um conjunto v de valores para avaliar cada parˆametro;

• Avaliar o desempenho do m´etodo para cada um dos valores em v dos parˆametros em p;

• Obter o melhor valor para cada parˆametro em p.

Na otimiza¸cão de parâmetros, em geral, se enfrenta o problema da maldi¸cão da di- mensionalidade, dado que o número de poss´ıveis combina¸cões aumenta exponencialmente segundo o número de parâmetros que queremos otimizar. Neste trabalho, não foi observado este problema porque utilizou-se o grid search para definir um só parâmetro e o espa¸co de busca foi delimitado.

Os passos correspondentes ao grid Search utilizado neste trabalho são apresentados no Algoritmo 11. Os atributos classif ier, validation, f orest, igp, levels, nthresholds são o classificador, conjunto de valida¸cão, a floresta gerada, indiv´ıduo-GP, os n´ıveis para a busca do threshold e o número de limiares que vão ser avaliados em cada n´ıvel do grid search, respectivamente.

Algoritmo 11 Grid Search

Require: classif ier, validation, f orest, igp, levels, nthresholds 1: inicio ← 0, 5

2: f im ← 1

3: for n=1 to levels do

4: T ← gerar nthresholds separados uniformemente no intervalo definidos por inicio e f im

5: ti ← threshold ∈ T com a melhor acur´acia normalizada utilizando classif ier(f orest, igp, validation)

6: dif ← |T0− T1| 7: start ← ti− dif 8: f im ← ti+ dif 9: end for

4.6 Medidas de Avalia¸c˜ao

A maior parte de trabalhos de classifica¸cão de objetos estão focados em problemas fecha- dos, por isso existem muitas medidas propostas para este tipo de cenário para as quais não são consideradas as classes não conhecidas. Marina e Lapalme [66] apresentam um análises de 24 medidas de desempenho para tarefas de classifica¸cão binária (acurácia, precision, recall, especificidade, Fscore e AUC ), multi-classe (acurácia média, taxa de erro, macro- precision, micro-precision, macro-FScore, micro-FScore, macro-Recall e micro-Recall ), multi-rotulados (Exact Match Ratio, Labelling Fscore, Retrieval Fscore, Hamming Loss), e tarefas hierárquicas(Precision↓, Precision↑, Recall↓, Recall↑, Fscore↓ e Fscore↑).

Nos problemas de cenário aberto também já foram propostas algumas medidas de avalia¸cão. Uma variante na medida da acurácia para cenários abertos é apresentada por Costa et al. [15, 16], mas a acurácia proposta por Costa et al. considera um problema de cenário aberto baseado em um classificador não inerentemente multiclasse. Neste trabalho, utilizaram-se as medidas de avalia¸cão propostas no trabalho [41, 42] para problemas abertos (Acurácia normalizada e F-measure), que considera o uso de um classificador inerentemente multiclasse.

No documento Técnicas de combinação de evidências para problemas de reconhecimento em cenário aberto (páginas 40-49)