M´odulo 4 Generaliza¸c˜ao da base de conhecimento

5.2 Proposta de constru¸c˜ao do classificador

5.2.4 M´odulo 4 Generaliza¸c˜ao da base de conhecimento

Este m´odulo visa estabelecer a completeza do classificador. Considerando-se que o classificador est´a sendo moldado para reconhecer uma classe espec´ıfica de cores, por exemplo,

5.2 Proposta de constru¸c˜ao do classificador 76

verde-esmeralda (uma situa¸cão t´ıpica poderia ser um robô vasculhando uma galeria in- salubre à procura de esmeraldas). Após o treinamento do classificador, a agrega¸cão e defini¸cão desta classe de cores formará uma “nuvem” de contornos difusos no espa¸co de atributos. Assim, qualquer ponto no interior desta nuvem poderá ser considerado perten- cente à classe, esperando-se que, quanto mais interior, maior a pertinência.

Com o classificador de cores constru´ıdo de acordo com os módulos 1 a 3, é poss´ıvel realizar testes de deteçcão em novos conjuntos de treinamento. Mas, ainda resta um problema: ao se executar a deteçcão (testes), a base de conhecimento restringe-se apenas aos dados de treinamento. Resta incluir no classificador um processo de generaliza¸cão, ou um módulo para inferir a pertinência de uma “nova” cor.

De acordo com a teoria de aprendizado PAC (VALIANT, 1984) (ver anexo 2), um número muito grande de imagens de treinamento é necessário para preencher todo o interior desta nuvem, definindo bem o seu formato. Porém, algumas considera¸cões sobre o dom´ınio de aplica¸cão podem fornecer uma heur´ıstica que otimizam o treinamento. No caso de imagens naturais, a varia¸cão de uma cor caracter´ıstica de um objeto na cena é suave, logo, espera-se que estes cores xk estejam todas em uma vizinhan¸ca compacta, formando um grupo – a assun¸cão feita para se empregar algoritmos de agrupamento no módulo 1.

Após um número razoável de imagens utilizadas para moldar tal nuvem, seus contornos ainda poderão ser difusos, mas seu interior talvez seja descont´ınuo, contendo “buracos” que deveriam estar preenchidos.

Como a abordagem utilizada para a representa¸cão de classes é aquela baseada em instâncias, a solu¸cão escolhida para este preenchimento foi o algoritmo “fuzzy k-nearest neighbor” (FkNN). A regra nebulosa dos k vizinhos mais próximos (“fuzzy kNN rule”) considera os valores de pertinência como fun¸cão de distância dos k vizinhos mais próximos, e também a pertinência uij em rela¸cão às classes i destes vizinhos xj. Aqui, uma ligeira mudan¸ca de nota¸cão, em rela¸cão à utilizada, para seguir a literatura: classes i, pontos j, vizinhos k. A pertinência final do elemento a ser classificado no espa¸co de atributos é uma média entre as pertinências dos k vizinhos, ponderada pelas distâncias (de acordo com alguma métrica) que minimizam a fun¸cão objetivo dada na eq. 3.17. Esta pertinência é

calculada de uma maneira parecida com o algoritmo FCM-GK, sendo expressa por ui(x) = k X j=1 uijkx − xjk −2 m−1 k X j=1 kx − xjk −2 m−1 (5.3)

onde x é o vetor de atributos a ser classificado com a pertinência ui em rela¸cão às classes ωi dos xj vizinhos mais próximos, com grau de nebulosidade m. Em vez do elemento desconhecido x ser atribu´ıdo à classe da maioria dos k vizinhos, ele passa a compartilhar das classes envolvidas, com a respectiva pertinência ui a cada uma delas.

Para a constru¸c˜ao do classificador aqui proposto, em particular, a regra kNN nebulosa foi escolhida pelas seguintes raz˜oes:

• “buracos” no interior da nuvem de pontos que representa uma classe terão uma pertinência atribu´ıda conforme a pertinência dos vizinhos;

• próximo à borda, que é difusa, a pertinência será uma composi¸cão das pertinências de pontos vizinhos, que mistura cores pertencentes à classe (pertinência alta) e cores de outras classes (pertinência baixa). Esta borda é de transi¸cão suave.

Vantagens e desvantagens da regra nebulosa kNN. As vantagens da regra nebulosa kNN s˜ao as seguintes:

• permite um cálculo mais preciso da pertinência do dado a ser generalizado, pois agora se trata de uma média ponderada das pertinências da vizinhan¸ca. Se a varia¸cão da pertinência pela vizinhan¸ca for suave, o novo dado será interpolado;

• pode dispensar a tarefa de generaliza¸cão do sistema (módulo 4), se esta regra for aplicada para classificar instâncias de teste, usando a base de conhecimento obtida no módulo 3. Porém, o procedimento de teste fica bem mais custoso em termos computacionais;

• não importa quão esparsa está a nuvem de dados para um determinado grupo no espa¸co de atributos, pois a regra busca os k vizinhos mais próximos, e sua distância de busca pode ser controlada, para não expandir a nuvem de modo indesejado;

• classifica apenas os dados da instˆancia de teste, n˜ao necessitando explorar o espa¸co completo.

5.2 Proposta de constru¸c˜ao do classificador 78

Este procedimento apresenta tamb´em algumas desvantagens:

• necessita, como parâmetro adicional, um alcance, isto é, uma distância máxima para considerar o tamanho da vizinhan¸ca. Isto porque os classificadores do tipo vizinho mais próximo genericamente atribuem a classe mais freqüente dos vizinhos mais próximos, não importando a posi¸cão da instância x a ser classificada;

• apresenta custo computacional alto, pois o número total de vizinhos cresce com o número de camadas vizinhas elevado ao cubo, no caso do espa¸co de atributos ser discreto. Cada camada neste tipo de vizinhan¸ca é uma “casca” cúbica, de arestas dadas por um número ´ımpar de pontos. Há um problema a ser resolvido experimentalmente: escolher o melhor valor para k. Por exemplo, uma vizinhan¸ca tridimensional cúbica de uma camada apresenta 26 vizinhos; duas camadas, 142 vizinhos; três camadas, 460 vizinhos; e assim segue. Por exemplo, a expressão geral para vizinhan¸ca é

Nvizinhos= Mcamadas X i=1 2i£4 + (2i + 1)2¤ (5.4) .

• se for aplicado como tarefa de generaliza¸cão do sistema, após a etapa de treinamento, necessita testar todos os pontos do espa¸co de atributos, pois não se sabe a princ´ıpio os limites do grupo provenientes do treinamento. Se um dado testado estiver fora da nuvem correspondente ao grupo, receberá pertinência nula (eq. 5.3), e se estiver no interior da nuvem, terá pertinência dada pela varia¸cão de densidade da nuvem. Se estiver na fronteira, sendo ela nebulosa, esta equa¸cão pondera a pertinência da vizinhan¸ca;

• se for aplicado apenas para classificar os dados de teste, dispensa a etapa de generaliza¸cão após o treinamento, mas terá que ser aplicado para todos os dados de teste, para a classifica¸cão.

Uma boa estratégia de aplica¸cão para a generaliza¸cão é usar o classificador kNN nebuloso para testar todo o espa¸co de atributos apenas uma vez e comparando cada cor x com sua vizinhan¸ca nebulosa na base de conhecimentos. Com isto, evita-se classificar toda vez os pixels das imagens de teste.

Um cuidado extra deve ser observado ao se empregar o algoritmo kNN nebuloso (ou mesmo o clássico): são selecionados os k primeiros vizinhos a qualquer distância do ponto

testado. Como o objetivo aqui ´e preencher os interst´ıcios da classe no espa¸co de cores, os k primeiros vizinhos devem ser restritos a uma distˆancia limite do ponto de teste.

Portanto, o melhor conjunto de procedimentos para a constru¸c˜ao e utiliza¸c˜ao da base de conhecimentos consiste em:

• efetuar o treinamento do sistema, (m´odulos 1, 2 e 3);

• executar a generaliza¸c˜ao via regra nebulosa kNN, testando todo o espa¸co de atributos contendo o grupo da classe que se quer obter (m´odulo 4);

• para cada conjunto de teste, classificar os dados usando a base de conhecimentos já generalizada. Neste caso, esta base fica inalterada, e a deteçcão é agilizada.

O quadro 2 ilustra o procedimento de utiliza¸c˜ao do algoritmo kNN nebuloso para generaliza¸c˜ao do modelo constru´ıdo por aprendizado.

Quadro 2 Aplica¸c˜ao do algoritmo kNN nebuloso.

1. informar coordenadas [RGB]inicial e [RGB]f inal do espa¸co de cores, onde ser´a exe-

cutado o processo de preenchimento dos vizinhos faltantes (com pertinˆencia nula) em uma classe espec´ıfica;

2. informar no _{k de vizinhos considerados para pondera¸c˜ao da pertinˆencia;}

3. informar a “distância de alcance” δ para que um ponto seja considerado vizinho; // evita a dilata¸cão da nuvem além desta distância

4. informar o fator de nebulosidade m; 5. para x = [RGB]inicial at´e [RGB]f inal

• para j = 1 at´e k

– se kx − xjk < δ // vizinho dentro do alcance considerado

ent˜ao calcular o numerador e o denominador da eq. 5.3; • armazenar a pertinˆencia u(x);

No documento Aprendizado nebuloso híbrido e incremental para classificar pixels por cores (páginas 96-100)