• Nenhum resultado encontrado

5 VERIFICAÇÃO DE ASSINATURAS MANUSCRITAS OFF LINE COM BASE EM MODELOS ESTATÍSTICOS

5.2. Etapas de Trabalho

5.2.4. Testes das assinaturas

• BANCO DE TESTE: utilizando as assinaturas selecionadas para o treinamento do sistema, escolheram-se algumas para teste;

• RETINAS: o número de retinas utilizadas nas assinaturas a serem testadas é o mesmo do de retinas empregadas para a assinatura de treinamento do sistema; • PADRONIZAÇÃO DO NÚMERO DE PIXELS: é feito de maneira igual a fase

de treinamento, para cada uma das quatro direções e retinas;

• MÓDULO DE Z: da mesma forma que da fase de treinamento, para cada direção; • TESTE: é feito através de intervalos ou regiões de confiança, dependendo da

análise a ser feita;

• CONCLUSÃO: considerando os limiares para cada direção, definidos pela fase de treinamento, cada assinatura é analisada pela direção do módulo, se pertence ao intervalo e às regiões de aceite do intervalo pré- definido para análise univariada e multivariada, respectivamente;

• DECISÃO: como são quatro as informações que se tem para a tomada de decisão, utiliza-se o critério “de maioria”, para emitir o resultado final, no caso de uma análise univariada. Na análise multivariada, como os dados são analisados em conjunto, o próprio procedimento de avaliação já fornece a decisão final, a assinatura pertence ou não à região de confiança.

Na análise univariada, a decisão é tomada como:

• falsa - quando pelo menos três das informações se encontram fora dos limites calculados do intervalo de confiança;

• verdadeira — quando pelo menos três informações estão dentro dos limites calculados do intervalo de confiança;

• sem identificação - quando duas informações estão dentro do intervalo de confiança e duas estão fora dos limites do mesmo.

Para as assinaturas do teste piloto, foram considerados vários tamanhos de “grid”. Define-se “grid” como sendo o número total de retinas em que a imagem foi dividida. Lembrando que o número de retinas depende da escolha do número de linha e de colunas.

Sabourin (1997) afirma que a variabilidade de assinaturas de um mesmo autor se encontra no global, ou seja, a inclinação da assinatura permanece, mas são alteradas as distâncias entre as letras e palavras.

5.2.5. Fase de Verificação e de Análise dos Resultados Obtidos

Nesta fase os seguintes procedimentos são adotados:

• BANCO DE VERIFICAÇÃO: utilizando as assinaturas contidas no Banco de Dados, selecionam-se as dez assinaturas, do mesmo escritor que não fizeram parte do treinamento para a verificação do processo;

• PRÉ PROCESSAMENTO: é realizado da mesma maneira como foi feito para o grupo de assinaturas de treinamento, ou seja:

♦ IMAGEM DA ASSINATURA: as imagens das assinaturas foram definidas para serem obtidas em 256 tons de cinza, na dimensão de 999 x 399 pixels. Independente do tamanho das assinaturas, a dimensão global, manteve-se constante;

♦ BINARIZAÇÃO: para o procedimento proposto há necessidade de imagens monocromáticas, logo as imagens obtidas pelo scanner são transformadas em imagens em preto e branco. Para esta transformação foi utilizado o software Paint Brush deixando todas as assinaturas em imagens monocromáticas;

• RETINAS: são utilizadas no mesmo número das do treinamento, de preferência aquela que foi considerada como “ótima” para aquele escritor;

• PADRONIZAÇÃO DO NÚMERO DE PIXELS: é feito de maneira igual a fase de treinamento, para cada direção e retina;

• MÓDULO DE Z: realizado da mesma forma que da fase de treinamento, para cada direção;

• VERIFICAÇÃO: é feita através de intervalos ou regiões de confiança pre­ estabelecidos a partir das médias;

• CONCLUSÃO: considerando os limiares para cada direção, definidos pela fase de treinamento, cada assinatura é analisada pela direção do módulo, se pertence aos intervalos ou às regiões de confiança pré- definidos;

• DECISÃO: como são quatro as informações que se tem para a tomada de decisão, utiliza-se o critério “de maioria”, para emitir o resultado final , para análise univariada; e a avaliação de pertencer ou não à região de confiança no caso de análise multivariada.

A figura 5.7 mostra as etapas de trabalho necessárias para a verificação de assinaturas manuscritas off-line, para análise univariada e multivariada.

A primeira análise feita, foi considerando o comportamento das informações de cada direção individualmente. Com os dados obtidos na fase de treinamento, foram encontrados os limites do intervalo de confiança para cada direção com um grau de confiabilidade de 95% .

Nessas simulações iniciais, pode-se observar que cada escritor tem características únicas, e a identificação de uma nova assinatura é melhor realizada com específicos tamanho de “grid”. Cada escritor deve ter seu próprio tamanho de “grid”. Os testes iniciais deste trabalho foram feitos com cinco “grids”, com uma variação de 24 retinas a 375 retinas, e em alguns casos, 875, por escritor.

Com os intervalos de confiança definidos com grau de confiabilidade de 95% , cada nova assinatura foi analisada individualmente por direção, e desta forma chega-se ao momento de aceitar ou rejeitar a assinatura em avaliação.

Esta tomada de decisão baseou-se em um método simples de votação. O maior número de informações contidas dentro dos intervalos definidos - no mínimo três - resulta em uma conclusão da assinatura como verdadeira. Caso contrário, é rejeitada e deve passar por uma avaliação manual de um especialista. Mesmo a assinatura tendo duas informações dentro dos intervalos, que em RP seria classificada como indefinida, neste trabalho, decidiu por rejeitá-la e encaminhar para uma avaliação visual.

Todos os procedimentos iniciais da análise univariada foram utilizados nesse enfoque, acrescentando os testes para verificação da existência de correlação entre os dados das direções - horizontal, vertical, diagonal e diagonal invertida - matriz de correlação.

A diferença básica entre as duas análises são as avaliações em conjunto dos dados das variáveis aleatórias contra a análise individual dos mesmos. Intervalos de confiança para a análise univariada - avaliação feita no plano, com quatro intervalos de confiança - e regiões de confiança nas multivariadas — avaliação realizada em uma dimensão "p”, neste caso específico 4 (as direções consideradas), de difícil imaginação.

Como é definida uma região de confiança por escritor, não necessitamos de uma “norma de decisão”, pois a assinatura a ser avaliada pertence ou não à região considerada para o determinado escritor.

SAVAM

Documentos relacionados