• Nenhum resultado encontrado

2.2 Reconhecimento de padrões

2.2.3 Classificação das características

As técnicas de normalização e de extração de características são um passo na direção da classificação, pois reorganizam o espaço de características de forma a viabilizar a classificação, onde é possível que sejam evidenciados aglomerados naturais de pontos, mas estes aglomerados não são identificados, ou seja, suas fronteiras e classes não são conhecidas.

A classificação de padrões tem como objetivo dividir o espaço de características em re- giões, nas quais podem ser encontrados os vetores pertencentes a uma das classes. Desta forma as fronteiras das classes são definidas. Para isto, são empregados métodos e critérios. O método

2.2 Reconhecimento de padrões 69

de classificação pondera as características de um objeto para que um critério julgue o resultado desta ponderação, assim, com este julgamento é estabelecida a classe do objeto (COSTA; CESAR

JÚNIOR, 2001). O método e critério também podem ser interpretados como um modelo que

descreve os dados e suas classes. Exemplo de métodos são: medidas de similaridade e dissi- milaridade, estatísticos e limiares. Exemplos de critérios são: próximo ou distantes, acima de determinado valor ou maior probabilidade.

O conhecimento adquirido a respeito do fenômeno que originou os dados a serem clas- sificados pode evidenciar os métodos e os critérios. Caso isto não seja possível, podem ser empregados algoritmos que aproximem os métodos e os critérios. Tendo isto em mente, é pos- sível dividir as técnicas de classificação de padrões da seguinte forma (COSTA; CESAR JÚNIOR,

2001): critério imposto, classificação por exemplos e critério aberto. Estes três tipos serão des- critos a seguir.

Critério Imposto

Neste caso, existe conhecimento suficiente a respeito do fenômeno que originou os dados. As classes são conhecidas e, também, as qualidades, que tornam um objeto membro de uma classe, são conhecidas. Logo, o critério e o método são conhecidos. Devido a isto, somente a extração de características deve ser feita. Um exemplo de critério imposto é a classificação da temperatura em algum equipamento. Neste caso existe somente uma característica e o método de classificação é comparar o valor com outro pré-estabelecido. Os critérios de atribuição são: caso a temperatura esteja maior que o valor pré-estabelecido, esta é atribuída a uma classe; caso contrário, é atribuída a outra classe (COSTA; CESAR JÚNIOR, 2001).

Classificação por exemplos

objeto pertencer ou não a uma classe, entretanto as classes são conhecidas e existem protótipos ou exemplos destas. Isto faz deste caso mais complexo que o critério imposto.

Os algoritmos de classificação de padrões que utilizam exemplos trabalham de duas for- mas distintas Inicialmente, eles analisam o conjunto de exemplos, ou conjunto de treinamento. Depois desta fase, o algoritmo faz o reconhecimento dos padrões apresentados a ele como mostrado na Figura 14. A primeira fase, conhecida também como treinamento, é responsá- vel por encontrar o método e/ou critério, ou encontrar os parâmetros associados a um modelo pré-estabelecido.

Figura 14: Esquema da classificação por exemplos.

Alguns dos classificadores de padrões utilizam métodos específicos outros genéricos, ou seja, abstraem o método. O mesmo ocorre com o critério, onde alguns classificadores adotam critérios específicos e outros conseguem abstrair estes critérios. Exemplo disto são os classifi- cadores bayesianos e RNA treinadas com algoritmo backpropagation ou derivados deste.

O classificador bayesiano adota o método estatístico e o critério maior probabilidade, sendo que o método estatístico é usado para estimar o modelo dos dados (função distribuição de pro- babilidade (PDF) e probabilidades a priori) a partir dos dados de treinamento. O modelo es- tatístico dos dados é utilizado para calcular a probabilidade a posteriori, que neste caso é a probabilidade de um objeto pertencer a uma classe.

2.2 Reconhecimento de padrões 71

tir dos dados durante a fase de treinamento. Os pesos sinápticos dos neurônios são ajustados de tal forma que as entradas da rede (vetor de características de um objeto) sejam ponderadas e julgadas conforme os dados são propagados em direção a saída da RNA. Isto ocorre pois a RNA implementa a aproximação de uma função não-linear que divide o espaço de características nas classes desejadas (COSTA; CESAR JÚNIOR, 2001).

Critério aberto

Os classificadores baseados em critério aberto são caracterizados pela ausência de um con- junto de treinamento dividido em classes pré-estabelecidas. Também, pouco é conhecido sobre os dados que devem ser classificados, o que faz deste caso o mais complexo dos apresentados. Devido a estes fatos, estes classificadores são chamadaos de não-supervisionados. A Figura 15 mostra o esquema geral destes algoritmos.

Figura 15: Esquema do funcionamento de um algoritmo baseado em critério aberto.

Estes algoritmos buscam pelos padrões evidentes nos objetos. Isto é feito segundo um mé- todo e um critério. A busca é feita de forma a agrupar objetos semelhantes, o que é equivalente a maximizar a diferença entre os agrupamentos. Isto pode ser obtido através de um dos dois métodos principais: o particional e o hierárquico.

A abordagem particional busca dividir o espaço de características em um número definido de agrupamentos, segundo um critério pré-estabelecido. Um dos critérios que pode ser adotado é a dispersão dos objetos em um agrupamento. Se a dispersão de um agrupamento for muito grande, este agrupamento deverá ser dividido de forma a minimizar a dispersão. Outra abor- dagem busca minimizar a soma das distâncias, ou seja, a dissimilaridade dos elementos de um mesmo agrupamento com relação a um determinado membro deste mesmo agrupamento. Este último é o caso do algoritmo k-médias.

Os algoritmos de agrupamento hierárquico constroem os grupos progressivamente, agre- gando os objetos similares segundo algum critério de similaridade ou dissimilaridade. Estes algoritmos não determinam a quantidade ótima de agrupamentos, eles fornecem os possíveis agrupamentos para um número de grupos que varia do número um até o número de objetos no conjunto de dados. O resultado produzido por estes algoritmos é representado por um gráfico, onde são evidenciadas as relações hierárquicas entre os agrupamentos e os objetos. Este gráfico é chamado de dendograma.

A quantidade de agrupamentos é um problema presente também nos algoritmos particio- nais, onde esta quantidade deve ser indicada ou deve ser adotada alguma técnica que a estime. Além deste problema, os algoritmos não supervisionados devem lidar com outras dificuldades, como por exemplo:

• classes com formas complexas,

• agrupamentos evidentes em diferentes escalas, • regiões com poucas amostras,

• classes sobrepostas,

• classes próximas uma das outras.

O critério do algoritmo de classificação não-supervisionado influencia diretamente a forma dos grupos encontrados. Dependendo da natureza dos dados, o critério pode não corresponder com a realidade, então outros critérios devem ser considerados quando não existe informação sobre a forma dos agrupamentos (COSTA; CESAR JÚNIOR, 2001).