• Nenhum resultado encontrado

Introdução ao Reconhecimento de Palavras Manuscritas

N/A
N/A
Protected

Academic year: 2021

Share "Introdução ao Reconhecimento de Palavras Manuscritas"

Copied!
8
0
0

Texto

(1)

Introduc¸˜ao ao Reconhecimento de Palavras Manuscritas

Luciana R. Veloso e Francisco Madeiro

Resumo— O avanc¸o do conhecimento, a expans˜ao da mem´oria e a comunicac¸ ˜ao est˜ao entre os benef´ıcios proporcionados pela escrita, que constitui-se em um dos objetos da ´area de processa- mento de documentos. Dentre os desenvolvimentos relacionados a esta ´area, podem ser citados: sistemas de reconhecimento de caracteres manuscritos, de assinaturas, de numerais manuscritos, de palavras manuscritas e sistemas de filtragem frente-verso. Este artigo apresenta uma introduc¸˜ao ao reconhecimento de palavras manuscritas. S˜ao abordadas etapas importantes do sistemas de reconhecimento: pr´e-processamento, segmentac¸ ˜ao e classificac¸ ˜ao.

O artigo aborda, ainda, t´ecnicas utilizadas para o prop´osito do reconhecimento, com destaque para os modelos de Markov escondidos, as redes neurais artificiais e os m´etodos h´ıbridos.

Palavras-Chave— Processamento de documentos, reconheci- mento de manuscritos, reconhecimento de palavras manuscritas, processamento digital de imagens, reconhecimento de padr˜oes.

I. I

NTRODUC

¸ ˜

AO

Avanc¸os da civilizac¸˜ao devem-se `a escrita, que foi desenvol- vida com o prop ´osito de expandir a mem´oria humana e facilitar a comunicac¸˜ao. Dentre as tecnologias que contribu´ıram para a expans˜ao da escrita, podem ser citadas: a imprensa, a m´aquina de datilografar, o computador e as tecnologias da informac¸˜ao e da comunicac¸˜ao, como os processadores de texto e os servic¸os de e-mail. Ressalte-se, entretanto, que, apesar da polularizac¸˜ao de alguns recursos tecnol´ogicos (computadores, palmtops, tablets), h´a situac¸˜oes em que caneta e papel s˜ao mais convenientes que um teclado [1] – ´e o caso, por exemplo, de estudantes em uma sala de aula, os quais continuam armazenando as informac¸˜oes (texto, equac¸˜oes e gr´aficos) por meio da caneta e do papel.

Os sistemas de reconhecimento de manuscritos s˜ao particu- larmente ´uteis nas situac¸˜oes em que o papel e o instrumento escrevente s˜ao utilizados, permitindo aos computadores trans- formarem uma linguagem representada em sua forma espacial ou marcas gr´aficas em uma representac¸˜ao simb ´olica.

H´a duas abordagens para o problema de reconhecimento de manuscritos: hol´ıstica ou anal´ıtica. A primeira trata as palavras como entidades ´unicas, indivis´ıveis, e procura reconhecˆe-las como um todo [2] e constitui-se na opc¸˜ao preferida quando a aplicac¸˜ao possui um vocabul´ario pequeno. A segunda utiliza unidades de sub-palavras, tais como caracteres ou pseudo- caracteres, para o prop ´osito de reconhecimento, sendo apropri- ada em aplicac¸˜oes pr´aticas que requerem grandes vocabul´arios.

De todo modo, qualquer que seja a abordagem utilizada, os sistemas de reconhecimento s˜ao complexos e necessitam de

Luciana Ribeiro Veloso, Universidade Federal de Campina Grande (UFCG), Campina Grande, PB, Brasil. Francisco Madeiro, Escola Polit´ecnica de Pernambuco (POLI), Universidade de Pernambuco (UPE), Recife, PE, Brasil.

E-mails: veloso@dee.ufcg.edu.br e madeiro@poli.br

v´arias t´ecnicas. Em geral, sistemas off-line de reconhecimento de manuscritos possuem os seguintes m´odulos b´asicos: pr´e- processamento, segmentac¸˜ao de palavras, extrac¸˜ao de carac- ter´ısticas e classificac¸˜ao, conforme se observa na Figura 1.

Fig. 1. Diagrama de blocos de um sistema geral de reconhecimento de palavras manuscritas.

Detalham-se, a seguir, os m´odulos b´asicos de um sistema off-line de reconhecimento de palavras manuscritas. A aborda- gem concentra-se, principalmente, nos sistemas que utilizam a abordagem anal´ıtica.

II. P

RE

´ -

PROCESSAMENTO

T´ecnicas de pr´e-processamento levam `a reduc¸˜ao da va- riabilidade entre as classes de objetos ou entre escritores diferentes. Nesta etapa, a imagem ´e geralmente limpa de ru´ıdo e dos erros causados pelo processo de digitalizac¸˜ao.

A normalizac¸˜ao, que constitui-se em uma fase importante do pr´e-processamento, tem como objetivo reduzir as variac¸˜oes observadas em diferentes amostras da mesma palavra, escrita pela mesma pessoa em instantes distintos ou por diferentes escritores, tais como:

Angulo de inclinac¸˜ao vertical dos caracteres (slope ou ˆ slant). ´ E muito comum encontrar em documentos ma- nuscritos palavras ou numerais com diferentes ˆangulos de inclinac¸˜ao. O ˆangulo de inclinac¸˜ao vertical dos caracteres

´e definido como o ˆangulo entre o eixo correspondente `a direc¸˜ao m´edia dos caracteres, calculada como a m´edia dos ˆangulos de inclinac¸˜ao de cada letra que comp ˜oe a palavra, e o eixo vertical [3]. Nesse cen´ario, as t´ecnicas mais simples assumem que a inclinac¸˜ao ´e uniforme para todas as letras que comp ˜oem a palavra, realizando uma correc¸˜ao global. H´a, no entanto, t´ecnicas que trabalham isolando segmentos de palavra e efetuam a correc¸˜ao individual de cada segmento [4], [5], [6], [7], [3], [8], [9], [10].

Inclinac¸˜ao da linha de base da escrita (Skew). O ˆangulo

da linha de base da escrita ´e o ˆangulo entre a linha

de base definida pelo contorno inferior da palavra e a

(2)

linha horizontal de referˆencia. De modo geral, os m´etodos de correc¸˜ao de linha de base podem ser globais ou locais [10], [11].

Largura do trac¸ado do caractere. A largura do trac¸ado varia devido a fatores como o instrumento de escrita uti- lizado, a press˜ao aplicada, o tipo de papel e a inclinac¸˜ao do instrumento de escrita. Pode ser eliminada por meio de esqueletizac¸˜ao ou extrac¸˜ao de contornos [12], [13], [14], [15], [16], [17], por exemplo.

Um conceito importante ´e o de linhas de base (baselines), que s˜ao linhas imagin´arias que dividem a palavra em trˆes regi˜oes: ascendente, descendente e central [18], [19], [11], [10], [20], conforme mostrado na Figura 2. No reconheci- mento de palavras manuscritas, elas, bem como as regi˜oes ascendente, central e descendente, s˜ao usadas, geralmente, nas etapas de segmentac¸˜ao e extrac¸˜ao de caracter´ısticas. Por exemplo, na extrac¸˜ao de caracter´ısticas de palavras, elas s˜ao utilizadas para detectar os trac¸os ascendentes e descendentes.

Fig. 2. Linhas de base.

(a) (b)

Fig. 3. Correc¸˜ao da inclinac¸ ˜ao das letras da palavra. (a) imagem original, (b) imagem normalizada.

(a) (b)

Fig. 4. Normalizac¸˜ao da inclinac¸ ˜ao da linha de base das palavras. (a) imagem original, (b) imagem normalizada.

As Figuras 3 e 4 ilustram o resultado das operac¸˜oes de normalizac¸˜ao do ˆangulo de inclinac¸˜ao vertical dos caracteres e de normalizac¸˜ao da inclinac¸˜ao da linha de base das palavras

III. S

EGMENTAC

¸ ˜

AO DE PALAVRAS EM CARACTERES

Uma poss´ıvel t´ecnica de reconhecimento de palavras con- siste em realizar uma segmentac¸˜ao das mesmas em caracteres, seguida pelo reconhecimento dos caracteres como s´ımbolos v´alidos do alfabeto e, finalmente, pelo casamento entre as sequˆencias de caracteres identificados e palavras de um di- cion´ario (Figura 5). A variedade de estilos e a grande ambi- guidade encontrada na escrita cursiva tornam complexo o re-

conhecimento autom´atico de manuscritos. ´ E muito desafiador segmentar as palavras em letras.

Fig. 5. Forma intuitiva de reconhecimento de palavras manuscritas: (a) palavra manuscrita; (b) separac¸˜ao dos segmentos; (c) reconhecimento do primeiro segmento; (d) an´alise do segundo segmento; e) sobresegmentac¸ ˜ao do segundo segmento.

A dificuldade supracitada pode ser entendida observando a Figura 6: as partes destacadas nas imagens (a), (b), (c) e (d) correspondem respectivamente a (m, rv, ui e n). Na Figura 6(a), o trac¸ado do caractere que est´a circulado n˜ao necessita ser segmentado, pois pertence a um ´unico caractere. O mesmo n˜ao acontece na imagem (c), que cont´em dois caracteres circulados.

Fig. 6. Exemplos de palavras manuscritas.

Segmentar uma palavra em caracteres ´e uma operac¸˜ao que decomp ˜oe a imagem de uma palavra formada por uma sequˆencia de caracteres em sub-imagens de caracteres ou pseudo-caracteres [21]. Segmentar corretamente uma palavra manuscrita, sem a informac¸˜ao a priori sobre a quantidade e o r´otulo dos caracteres, levando em conta os problemas provocados pela ambiguidade dos caracteres na escrita cursiva,

´e uma tarefa extremamente dif´ıcil. Para solucionar tais proble- mas, uma das estrat´egias utilizadas na literatura ´e realizar a segmentac¸˜ao baseada no reconhecimento. Nessa estrat´egia, o algoritmo de segmentac¸˜ao divide a imagem em segmentos, ou pedac¸os da palavra original, gerando uma lista de hip ´oteses de segmentac¸˜ao (sobre-segmentac¸˜ao). Cada segmento idealmente consiste de um caractere ou parte de um caractere. O processo de classificac¸˜ao determina a melhor maneira de concatenar os segmentos de forma a representar palavras contidas em um l´exico. Os resultados apresentados na literatura mostram que este tipo de abordagem produz bons resultados. Entretanto, devido ao grande n ´umero de hip ´otese geradas e `a necessidade do classificador discriminar os diferentes padr˜oes gerados (caracteres, pseudo-caracteres e caracteres conectados), essa estrat´egia est´a associada a um alto custo computacional. Nessa abordagem, a segmentac¸˜ao pode ser expl´ıcita ou impl´ıcita.

Nos m´etodos expl´ıcitos, a segmentac¸˜ao ´e realizada antes

do classificador, produzindo sub-imagens de caracteres ou

pseudo-caracteres. Em contraste, nos m´etodos impl´ıcitos, a

segmentac¸˜ao ´e incorporada ao processo de classificac¸˜ao e ´e

realizada simultaneamente com a classificac¸˜ao.

(3)

A Figura 3 ilustra o resultado do processo de segmentac¸˜ao expl´ıcita baseada no reconhecimento.

Fig. 7. Resultado do processo de segmentac¸˜ao expl´ıcita baseada no reconhecimento.

Uma segunda estrat´egia de segmentac¸˜ao ´e a livre do reco- nhecimento, que fornece ao classificador uma ´unica hip ´otese de sequˆencia de caracteres. Entretanto, devido aos proble- mas supracitados, essa estrat´egia ´e utilizada, geralmente, na segmentac¸˜ao de palavras manuscritas redigidas em que h´a uma clara delimitac¸˜ao do comec¸o e t´ermino do trac¸ado do caractere.

Diversos algoritmos foram propostos para a segmentac¸˜ao expl´ıcita baseado no reconhecimento. Eles normalmente le- vam em considerac¸˜ao informac¸˜oes provenientes do primeiro e segundo plano da imagem. Dentre as diversas informac¸˜oes utilizadas, destacam-se: a localizac¸˜ao dos m´ınimos locais do contorno ou do esqueleto da palavra, a localizac¸˜ao dos trac¸os relativamente horizontais (trac¸os de ligac¸˜ao entre caracteres), an´alise do perfil de contorno e caracter´ısticas de concavidade do trac¸ado da imagem.

A an´alise dos trac¸os de ligac¸˜ao entre os caracteres permite a localizac¸˜ao dos pontos de segmentac¸˜ao de palavras em carac- teres quando o escritor utiliza pequenos trac¸os relativamente horizontais para separar um caractere do outro. Entretanto, tal informac¸˜ao n˜ao ´e suficiente para a determinac¸˜ao da fronteira entre caracteres fortemente conectados. Nesse caso, a litera- tura recomenda a utilizac¸˜ao das informac¸˜oes provenientes da an´alise dos m´ınimos locais e das concavidades do trac¸ado dos caracteres para a realizac¸˜ao da segmentac¸˜ao. Visando obter um melhor desempenho na segmentac¸˜ao, independente do tipo de manuscrito, muitos sistemas realizam a segmentac¸˜ao baseada numa combinac¸˜ao dessas informac¸˜oes. O principal problema nessa estrat´egia ´e o elevado n ´umero de poss´ıveis pontos de segmentac¸˜ao gerados, com a possibilidade de obter mais de um ponto de segmentac¸˜ao para a mesma fronteira entre caracteres sucessivos, o que acarretaria uma sobrecarga no sistema, haja vista que o classificador deve avaliar cada sub-imagem gerada e suas poss´ıveis combinac¸˜oes caso o sistema permita. Para evitar tal carga de processamento e uma poss´ıvel degradac¸˜ao no sistema, utiliza-se um conjunto de regras heur´ısticas que trabalham na reduc¸˜ao dos poss´ıveis pontos de segmentac¸˜ao. A Figura 8 ilustra o resultado da uni˜ao dos pontos de segmentac¸˜ao gerados por algoritmos de segmentac¸˜ao, e o resultado final ap ´os o processo de avaliac¸˜ao desses pontos por um conjunto de regras heur´ısticas no sistema de reconhecimento de manuscritos desenvolvido por Veloso [22].

IV. E

XTRAC

¸ ˜

AO DE

C

ARACTER

´

ISTICAS

O desempenho de qualquer algoritmo de classificac¸˜ao e/ou reconhecimento depende da representac¸˜ao dos padr˜oes a serem classificados, ou seja, das caracter´ısticas ou primitivas que s˜ao extra´ıdas dos padr˜oes da imagem [23], [20]. Essas carac- ter´ısticas devem preservar as informac¸˜oes que s˜ao pertinentes

(a) (b)

Fig. 8. (a) uni˜ao dos pontos de segmentac¸˜ao produzidos pela combinac¸˜ao dos resultados dos algoritmos de segmentac¸˜ao e (b) resultado final do processo de segmentac¸˜ao ap´os a etapa de p´os-segmentac¸˜ao.

e ´uteis para a classificac¸˜ao e, ao mesmo tempo, eliminar as informac¸˜oes irrelevantes e desnecess´arias [24], [23], [20]. Na definic¸˜ao do conjunto de caracter´ısticas ´e importante conside- rar alguns aspectos b´asicos [25]:

As caracter´ısticas devem ser preferencialmente in- sens´ıveis `a rotac¸˜ao, translac¸˜ao e variac¸˜oes de tamanho da escrita;

A extrac¸˜ao das caracter´ısticas deve ser de baixo custo computacional;

As caracter´ısticas devem ser independentes umas das outras.

Al´em disso, as caracter´ısticas devem destacar as diferenc¸as entre os objetos de classes distintas (interclasse) enquanto mi- nimizam as poss´ıveis variac¸˜oes da mesma classe (intraclasse).

Existem v´arios tipos de caracter´ısticas que s˜ao utiliza- das para descrever os padr˜oes em sistemas de reconheci- mento de manuscritos. Em geral, essas caracter´ısticas contˆem informac¸˜oes sobre a estrutura dos caracteres ou pseudo- caracteres ou fornecem informac¸˜oes estat´ısticas sobre o padr˜ao em an´alise. As caracter´ısticas estat´ısticas s˜ao provenientes da an´alise das distribuic¸˜oes estat´ısticas da representac¸˜ao da imagem (bin´aria, n´ıvel de cinza, contornos ou esqueleto), tais como zoneamento, momentos, histogramas de projec¸˜ao e de transic¸˜ao do contorno, retangularidade e circularidade. Carac- ter´ısticas estruturais s˜ao informac¸˜oes provenientes da an´alise das propriedades topol´ogicas e geom´etricas dos padr˜oes, como concavidades, trac¸os T e X, ˆangulo de inclinac¸˜oes dos trac¸os dos caracteres, direc¸˜oes do trac¸ado do caracteres, intersec¸˜oes dos segmentos e loops.

O tipo de caracter´ısticas estruturais mais utilizado em siste-

mas de reconhecimento de manuscritos ´e o das caracter´ısticas

perceptivas [22], [20], [26], inspiradas no processo de leitura

humano, que as utiliza para identificar palavras manuscri-

tas. Caracter´ısticas perceptivas contˆem informac¸˜oes sobre a

localizac¸˜ao e tamanho de lac¸os (loops), trac¸os ascendentes e

trac¸os descendentes, os quais s˜ao facilmente percebidos pelo

olho humano. Entretanto, tais caracter´ısticas n˜ao fornecem

nenhuma informac¸˜ao quando as imagens analisadas contˆem

caracteres que n˜ao possuam trac¸os ascendentes, descendentes

ou loops, como os caracteres ”m”e ”n”, s´o para citar dois

caracteres como exemplos. Segundo Grandidier [27], mais de

50% das sub-imagens em seu conjunto de treino s˜ao caracte-

rizados pela ausˆencia desse tipo de caracter´ısticas, correspon-

dendo a caracteres que s˜ao escritos sem a utilizac¸˜ao de trac¸os

ascendentes, descendentes e loops. Outras caracter´ısticas es-

truturais bastante estudadas na literatura especializada s˜ao

as globais e as direcionais. Caracter´ısticas globais contˆem

(4)

informac¸˜oes globais sobre o trac¸ado da imagem, tais como sua localizac¸˜ao e forma (retangular ou circular). As caracter´ısticas direcionais analisam regi˜oes do fundo da imagem e foram inspiradas num procedimento de rotulac¸˜ao proposto por Parker [12]. Neste m´etodo, para cada pixel do fundo da imagem, ´e verificado em cada uma das quatro direc¸˜oes principais (norte, sul, leste, oeste) se existe um pixel pertencente ao contorno na direc¸˜ao analisada, conforme ´e ilustrado na Figura 9.

Muitos pesquisadores tˆem explorado a combinac¸˜ao de di- versos conjuntos de caracter´ısticas com objetivo de realc¸ar as propriedades que diferem um caractere do outro [28], [29], [30], [31]. Entretanto, o aumento do n ´umero de caracter´ısticas torna o sistema mais complexo, custa um maior tempo de treinamento e pode reduzir sua capacidade de generalizac¸˜ao.

Recentemente, pesquisadores tˆem aplicado t´ecnicas de selec¸˜ao de caracter´ısticas para reduzir a complexidade dos classi- ficadores e melhorar seu desempenho [28], [29], [32] Al- guns trabalhos na literatura tˆem investigado a utilizac¸˜ao de mecanismos de zoneamento ou m´etodos de decomposic¸˜ao regional acoplados `as t´ecnicas de extrac¸˜ao de caracter´ısticas, com o objetivo de tornar a representac¸˜ao dos caracteres mais eficiente e, assim, melhorar o desempenho dos sistemas de reconhecimento, aumentando a taxa de reconhecimento [20], [33].

Fig. 9. Exemplo do processo de rotulac¸˜ao utilizado pelo extrator de caracter´ısticas direcionais.

V. R

ECONHECIMENTO

O objetivo de um sistema de reconhecimento ´e a classificac¸˜ao. A tarefa do classificador ´e identificar a classe `a qual a imagem analisada pertence, com base nas caracter´ısticas extra´ıdas da mesma. V´arias estrat´egias de classificac¸˜ao po- dem ser utilizadas no reconhecimento off-line de manus- critos, como, por exemplo, casamento de padr˜oes, t´ecnicas estat´ısticas, t´ecnicas estruturais e redes neurais. Esquemas h´ıbridos, de m´ultiplos classificadores, tamb´em tˆem sido pes- quisados [34], [1], [24], [35], [36], [37], [38], [37], [39], [26], [28]. Resultados interessantes tˆem sido obtidos com o uso de conjuntos de classificadores (ensemble classifiers) [40], [41], [42], [31], [39], os quais podem ser obtidos por meio da variac¸˜ao do conjunto de treino, das caracter´ısticas ou parˆametros e arquiteturas do classificador base.

Em diversos sistemas de reconhecimento, podem ser identi- ficadas duas etapas: a de treinamento e a classificac¸˜ao propri- amente dita. A primeira consiste, por exemplo, em obter um conjunto representativo de padr˜oes para as palavras que cons- tituem um conjunto de treinamento do sistema. A segunda, por exemplo, consiste em realizar o reconhecimento com base em

crit´erios de similaridade entre os padr˜oes obtidos da palavra a ser classificada (reconhecida) e os padr˜oes de referˆencia previamente gerados na etapa de treinamento. Neste caso, estamos falando de reconhecimento com base em casamento de padr˜oes. Se a t´ecnica de reconhecimento for uma rede neural artificial, a etapa de treinamento consiste em usar um conjunto de treino para ajustar os pesos da rede neural (NN, neural network) que ser´a utilizada para o prop ´osito de classificac¸˜ao.

As estrat´egias de aprendizagem podem ser classificadas em dependente ou independente do escritor. T´ecnicas de aprendizagem consideradas como independentes do escritor constroem seus modelos por treinamento a partir de um conjunto de amostras de palavras manuscritas de diversos escritores, enquanto as t´ecnicas de aprendizagem dependentes do escritor utilizam apenas amostras de palavras redigidas pelo mesmo escritor para a construc¸˜ao de seus modelos [43].

A seguir s˜ao abordados alguns m´etodos de reconhecimento de palavras manuscritas.

A. Redes Neurais Artificiais

As redes neurais artificiais s˜ao compostas de muitos elemen- tos simples (neurˆonios), interconectados por meio de ligac¸˜oes (pesos), em geral de acordo com uma arquitetura. A ideia de aprendizagem em uma rede neural ´e implementada por meio da modificac¸˜ao dos pesos. Quanto `a forma de aprendizagem, os algoritmos utilizados durante a fase de treinamento de redes neurais [44] podem ser classificados em duas categorias:

algoritmos supervisionados e algoritmos n˜ao-supervisionados.

As redes que utilizam algoritmo de treinamento supervisio- nado recebem informac¸˜ao externa sobre a que classe pertence cada padr˜ao de entrada utilizado na fase de treinamento. De posse dessa informac¸˜ao, os pesos das unidades de processa- mento s˜ao modificados de forma a se obter o desempenho desejado, ou seja, uma classificac¸˜ao satisfat´oria. Um dos algoritmos de treinamento supervisionado mais utilizados ´e o algoritmo backpropagation ou algoritmo de propagac¸˜ao retroativa de erros, que descreve a metodologia de modificac¸˜ao dos pesos na rede neural denominada perceptron multicama- das [44], [45].

Uma caracter´ıstica marcante da aprendizagem supervisio- nada ´e a presenc¸a de um supervisor externo. O supervisor

´e simplesmente o elemento que det´em o conhecimento do problema a ser solucionado pela rede, ou seja, ele conhece o mapeamento entrada-sa´ıda. O supervisor fornece `a rede um conjunto de exemplos entrada-sa´ıda. Em outras palavras, a resposta desejada (resposta correta) ´e fornecida `a rede pelo supervisor. Essa resposta desejada representa a ac¸˜ao ´otima a ser executada pela rede. Nesse contexto, os parˆametros da rede s˜ao ajustados de forma a minimizar o sinal erro, definido como a diferenc¸a entre a resposta real, apresentada pela rede, e a resposta desejada, fornecida pelo supervisor.

Na aprendizagem n˜ao-supervisionada ou auto-

organizativa [44], [45], n˜ao existe um supervisor externo

para orientar o processo de aprendizagem. Nos algoritmos

de treinamento n˜ao-supervisionado, portanto, nenhuma

informac¸˜ao externa referente `as classes a que pertencem os

(5)

dados de treinamento ´e dispon´ıvel `a rede. As modificac¸˜oes efetuadas nos pesos s˜ao realizadas com base apenas na observac¸˜ao de erros internos. O principal objetivo do algoritmo de treinamento n˜ao-supervisionado ´e capturar as regularidades estat´ısticas dos dados de entrada, ou seja, desenvolver a habilidade de promover representac¸˜oes internas eficientes das caracter´ısticas dos padr˜oes de entrada. Um exemplo de rede que utiliza aprendizagem n˜ao-supervisionada s˜ao os mapas auto-organiz´aveis de Kohonen (SOM, Self- organizing Maps) [46].

O perceptron multicamadas (MLP, multi-layer perceptron) foi usado em [47], com um l´exico de 746 palavras, levando a uma taxa de reconhecimento de 83,92%. Estrat´egias fuzzy para o treinamento de redes neurais, com vetores de caracter´ısticas de 120 componentes, foram consideradas em [48].

Cˆot´e et al. [10] desenvolveram um sistema de reconheci- mento de palavras manuscritas que possui arquitetura inspirada no sistema de leitura humano e em concepc¸˜oes perceptuais. No reconhecimento, uma rede neural com trˆes camadas identifica a imagem da palavra utilizando as caracter´ısticas extra´ıdas por interm´edio de sucessivos ciclos perceptuais. Uma t´ecnica de casamento fuzzy identifica a correspondˆencia entre as zonas na imagem de entrada e letras nas palavras do l´exico. A sa´ıda do m´odulo de reconhecimento ´e uma lista de palavras candidatas dispostas em ordem decrescente de ativac¸˜ao.

B. Modelos de Markov Escondidos

Um modelo de Markov escondido ´e um processo estoc´astico gerado por dois mecanismos inter-relacionados. Um canal de Markov b´asico tem um n ´umero finito de estados e um conjunto de func¸˜oes aleat´orias, cada func¸˜ao aleat´oria associada a cada um dos estados. Para cada instante de tempo discreto,

´e assumido que o processo est´a em algum estado e uma sequˆencia de observac¸˜ao ´e gerada por uma func¸˜ao aleat´oria correspondendo ao estado corrente. O canal de Markov b´asico escolhe o estado de acordo com uma matriz de probabilidade de transic¸˜ao. O observador vˆe somente a sa´ıda (observac¸˜oes) da func¸˜ao densidade de probabilidade (fdp) associada a cada estado e n˜ao pode observar os estados do canal de Markov b´asico; da´ı o termo modelo de Markov escondido [49].

Os HMMs tˆem sido amplamente utilizados em sistemas de reconhecimento de palavras manuscritas [50], [23], [51], [52], [19], [53], [54], [55], [56], [25], [57], [58], [36], [59], [60], [61], [62], [63], [64].

Gillies [52] foi um dos primeiros a utilizar HMM em um sistema de reconhecimento de palavras manuscritas com segmentac¸˜ao impl´ıcita. O m´etodo usa operac¸˜oes morfol´ogicas, quantizac¸˜ao vetorial e HMM de densidade discreta esquerda- direita, em que ´e constru´ıdo um modelo para cada letra. Os modelos de letras individuais s˜ao combinados em modelos para cada palavra no l´exico. Os conjuntos de treinamento e de teste consistem em 2.662 e 296 imagens de palavras cursivas, respectivamente, e foram extra´ıdos de blocos de enderec¸os manuscritos do correio americano. As taxas de reconhecimento obtidas para as 10 primeiras palavras foi de 72,6% a 90,5%

para o l´exico de 100 palavras e para o l´exico de 1.000 palavras foi de 51,0% a 80,1%.

Yacoubi et al. [19] propuseram uma t´ecnica de reconheci- mento de palavras manuscritas para um vocabul´ario amplo, usando HMM. O modelo foi testado em uma base de imagens de nomes de cidades francesas. A taxa de reconhecimento obtida para um l´exico de 1.000 palavras foi de 88,9%.

O sistema de reconhecimento de palavras manuscritas pro- posto por Chen et al. [55] utiliza HMM de durac¸˜ao vari´avel com densidade cont´ınua (Continuous Density Variable Dura- tion Hidden Markov Model - CDVDHMM). Um algoritmo de segmentac¸˜ao separa todos os caracteres conectados e ga- rante que cada caractere ser´a segmentado em no m´aximo cinco partes. O CDVDHMM define as 26 letras do alfabeto como 26 estados diferentes. Na fase de treinamento, grupos consecutivos de segmentos s˜ao identificados como estados, e uma mistura de Gaussianas ´e utilizada para modelar as probabilidades de s´ımbolos para cada estado.

No sistema de reconhecimento de palavras manuscritas de Kundu et al. [25], a palavra ´e previamente segmentada em caracteres. Quatorze caracter´ısticas s˜ao extra´ıdas, relativas `a forma (n ´umeros de junc¸˜oes X e T, n ´umero de loops, dentre outras) e `a distribuic¸˜ao dos pixels. Os vetores de caracter´ısticas s˜ao transformados em s´ımbolos, usando quantizac¸˜ao vetorial, e as 26 letras do alfabeto s˜ao identificadas com estados do HMM. Na etapa de reconhecimento, cada letra da palavra ´e classificada por comparac¸˜ao com os s´ımbolos do dicion´ario do quantizador vetorial, de acordo com o crit´erio da m´ınima distˆancia. O reconhecimento ´e feito utilizando o algoritmo de Viterbi.

Bunke et al. [57] apresentaram um sistema com HMM capaz de se adapatar ao estilo de escrita de diferentes escri- tores. Nas fases de treinamento e de teste foram utilizadas palavras manuscritas de cinco indiv´ıduos distintos. O vetor de caracter´ısticas foi codificado por um quantizador vetorial, um HMM foi treinado pelo algoritmo de Baum-Welch e o reconhecimento feito utilizando o algoritmo de Viterbi.

Kessentini et al. [64] apresentam um sistema de reconheci- mento de manuscritos utilizando uma abordagem multi-stream com HMM. Dois conjuntos de caracter´ısticas s˜ao extra´ıdos do contorno inferior e superior da palavra atrav´es de uma janela deslizante. Cada modelo do 2-stream ´e treinado independente- mente utilizando o algoritmo de Baum Welch. O ´ultimo passo

´e o reconhecimento, que utiliza um algoritmo modificado de Viterbi, o qual decodifica dois modelos stream em paralelo de acordo com o formalismo multi-stream.

C. Abordagens H´ıbridas

Uma abordagem multi-vista foi apresentada por Oliveira Jr.

[26] para o reconhecimento de palavras manuscritas. Nela, h´a

trˆes m´odulos. O primeiro realiza uma pseudo-segmentac¸˜ao de

radical que divide as palavras em duas regi˜oes e seu vetor

de caracter´ısticas ´e composto por caracter´ısticas perceptivas

e geom´etricas. As palavras analisadas s˜ao reconhecidas por

redes neurais multicamadas (MLP). O segundo ´e composto por

uma pseudo-segmentac¸˜ao fixa, trˆes extratores de caracter´ısticas

(perceptivas, direcionais e topol´ogicas) e classificadores neu-

rais. O ´ultimo m´odulo realiza uma pseudo-segmentac¸˜ao

vari´avel, para extrair as mesmas caracter´ısticas anteriormente

(6)

descritas do sistema, embora usando uma representac¸˜ao por alfabetos de s´ımbolos. O classificador utilizado ´e um HMM com uma topologia esquerda-direita.

Em outros trabalhos, Rigoll et al. [36], [59] realizaram comparac¸˜oes de sistemas de reconhecimento de palavras ma- nuscritas baseados em HMMs, utilizando t´ecnicas de mo- delamento discreto e h´ıbrido. Nas abordagens h´ıbridas, s˜ao realizadas associac¸˜oes de HMMs e redes neurais. As redes neurais s˜ao utilizadas como um quantizador vetorial para um HMM discreto, ou para calcular a func¸˜ao densidade de probabilidade para um HMM cont´ınuo.

Kim et al. [61] utilizaram para o reconhecimento de pa- lavras manuscritas uma estrat´egia h´ıbrida de classificadores baseada em HMM e redes neurais. O reconhecimento com segmentac¸˜ao expl´ıcita ´e realizado pelo HMM, enquanto o reconhecimento hol´ıstico ´e realizado por redes neurais. Esses dois classificadores s˜ao combinados utilizando uma estrat´egia de multiplicac¸˜ao.

D. Uma Avaliac¸˜ao de Desempenho

O desempenho de alguns sistemas citados neste artigo ´e apresentado nas Tabelas I e II, em que TR ´e a taxa de reconhecimento e NV ´e o n ´umero de palavras no vocabul´ario.

Os sistemas foram avaliados usando diferentes bases de da- dos e, consequentemente, muitas vezes possuem vocabul´arios distintos. Comparar o desempenho dos sistemas por meio de suas taxas de reconhecimento ´e imprudente. A dificuldade do sistema n˜ao reside apenas no tamanho do vocabul´ario mas tamb´em na similaridade entre as palavras do vocabul´ario, a aplicac¸˜ao `a qual se destina e se o sistema ´e ou n˜ao dependente do escritor. De uma maneira geral, quanto maior o vocabul´ario em quest˜ao, menores s˜ao as taxas de reconhecimento.

VI. C

OMENTARIOS FINAIS

´

O reconhecimento de palavras manuscritas ´e um problema relevante da ´area de processamento de documentos e, como consequˆencia, tem recebido atenc¸˜ao da comunidade cient´ıfica da ´area. H´a duas abordagens para o reconhecimento de pala- vras manuscritas: hol´ıstica ou anal´ıtica. Geralmente, quando a aplicac¸˜ao requer um pequeno l´exico, utiliza-se a abordagem hol´ıstica; caso contr´ario, ´e prefer´ıvel utilizar a abordagem anal´ıtica.

Um sistema gen´erico de reconhecimento de palavras manus- critas ´e composto por etapas: pr´e-processamento, segmentac¸˜ao, extrac¸˜ao de caracter´ısticas e classificac¸˜ao (reconhecimento).

As etapas de pr´e-processamento e segmentac¸˜ao podem ou n˜ao ser utilizadas, dependendo da complexidade do problema a ser tratado.

Devido `a existˆencia de letras amb´ıguas e ileg´ıveis, ´e dif´ıcil segmentar a palavra em caracteres completos. A soluc¸˜ao ´e realizar o reconhecimento utilizando a abordagem hol´ıstica ou utilizar a etapa de segmentac¸˜ao para quebrar a palavra em segmentos, que podem ser caracteres completos ou pedac¸os de caracteres.

V´arias t´ecnicas de extrac¸˜ao de caracter´ısticas e de classificac¸˜ao tˆem sido propostas na literatura. Dentre as t´ecnicas utilizadas no reconhecimento de palavras manuscritas,

TABLE I

DESEMPENHO DE ALGUNS SISTEMAS DE RECONHECIMENTO DE MANUSCRITOS.

Sistema ClassificadorNV TR (%) Base de

dados Gader et

al. [47]

NN 746 83,92 nomes de

cidades (CEDAR) (Inglˆes) Gader e

Mohamed [50]

HMM 100 89,3 nomes de

cidades (CEDAR) (Inglˆes) Gillies

[52]

HMM 1000 80,1 nomes de

cidades ameri- canas (Inglˆes) Yacoubi

et al. [19]

HMM 1000 88,9 nomes de

cidades francesas (Francˆes) Chen et

al. [55]

CDVDHMM 1000 59,6 nomes de

cidades, nomes de pessoas, nomes de estados ameri- canos (Inglˆes) Gilloux et

al.[56]

HMM 27 79,0 valores

por extenso em cheques banc´ario (Francˆes) Bunke et

al. [57]

HMM 150 98,4 palavras

manus- critas (Inglˆes) Cˆot´e et al.

[10]

HMM e

Fuzzy

32 73,6 valores

por extenso em cheques banc´ario (Inglˆes)

os modelos de Markov escondidos (HMMs) tˆem ocupado um lugar de destaque. H´a outras alternativas para o reconheci- mento, como ´e o caso de m´etodos baseados em quantizac¸˜ao vetorial e em redes neurais artificiais.

A

GRADECIMENTOS

Os autores expressam os agradecimentos ao Conselho Na- cional de Desenvolvimento Cient´ıfico e Tecnol´ogico (CNPq) pelo apoio financeiro.

R

EFERENCIAS

ˆ

[1] Plamondon, R. and Srihari, S. N., “On-Line and Off-Line Handwriting Recognition: A Comprehensive Survery,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.22, No.1, pp. 63–84, January 2000.

(7)

TABLE II

DESEMPENHO DE ALGUNS SISTEMAS DE RECONHECIMENTO DE MANUSCRITOS(CONTINUAC¸ ˜AO).

Sistema ClassificadorNV TR (%) Base de

dados Rigoll et

al.[58]

HMM 1000 98,30 palavras

manus- critas (Inglˆes) Guillevic

e Suen [60]

HMM- KNN

30 86,7 valores

por extenso em cheques banc´ario (Inglˆes) Kim et

al.[61]

HMM- MLP

32 92,2 valores

por extenso em cheques banc´ario (Inglˆes) Arica et

al. [62]

HMM 1000 90,8 palavras

manus- critas (Inglˆes) Koch et

al. [65]

MLP 1000 67,8 palavras

manus- critas (Francˆes) Koerich et

al. [63]

HMM 1000 91,0 nomes de

cidades (Francˆes) Kessentini

et al. [64]

HMM 1000 42,6 palavras

manus- critas (Inglˆes) Shetty et

al. [66]

campos randˆomicos condicio- nais

300 80,0 palavras

manus- critas (Inglˆes)

[2] Koerich, A. L., Sabourin, R. and Suen, C. Y., “Large Vocabulary Off-line Handwriting Recognition: A survey,” Pattern Analysis and Applications, vol. 6, pp. 97–121, 2003.

[3] Buse, R., Liu, Z.-Q. and Caelli, T. , “A Structural and Relational Approach to Handwritten Word Recognition,” IEEE Transactions on Systems, Man and Cybernetics - Part B: Cybernetics, Vol. 27, No. 5, pp.

847–861, October 1997.

[4] El-Yacoubi, A., Gilloux, M., Sabourin, R. and Suen, C. Y., “Uncons- trained Handwritten Word Recognition using Hidden Markov Models,”

IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993.

[5] Bozinovic, R. M., and Shihari, S. N., “Off-Line Cursive Script Word Recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.11, No.1, pp. 68–83, January 1989.

[6] Kim, G. and Govindaraju, V., “A Lexicon Driven Approach to Handwrit- ten Word Recognition for Real-Time Applications ,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 4, pp. 366–

379, April 1997.

[7] Kim, G. and Govindaraju, V. , “Handwritten Phrase Recognition as Applied to Street Name Images,” Pattern Recognition, Vol. 31, No. 1, pp. 41–51, 1998.

[8] Ding, Y., Kimura, F., Miyake, Y. and Shridhar, M., “Accuracy Improve- ment of Slant Estimation for Handwritten Words,” Proceedings of the International Conference on Pattern Recognition - ICPR’00, pp. 527–

530, 2000.

[9] Slav´ık, P. and Govindaraju, V., “Equivalence of Different Methods for Slant and Skew Corrections in Word Recognition Applications,” IEEE

Transactions on Pattern Analysis and Machine Intelligence, Vol.23, No.3, pp. 323–326, March 2001.

[10] Cˆot´e, M., Lecolinet, E., Cheriet, M. and Suen, C. Y. , “Automatic Reading of Cursive Scripts Using a Reading Model and Perceptual Con- cepts,” International Journal on Document Analysis and Recognition, Vol. 1, pp. 3–17, 1998.

[11] Senior, A. W. and Robinson, A. J. , “An Off-Line Cursive Handwri- ting Recognition System,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, pp. 309–321, March 1998.

[12] Parker, J. R., Algorithms For Image Processing and Computer Vision.

Wiley Computer Publishing, 1997.

[13] Facon, J., Morfologia Matem´atica: Teoria e Exemplos., Universit´aria, Ed. PUC-PR, 1996.

[14] Frucci, M. and Marcelli, A. , “Contour Pixel Classification for Charac- ter Skeletonization,” Proceedings of the First Brazilian Symposium of Document Image Analysis, pp. 141–152, November 1997.

[15] Borgefors, G., Ramella, G. and Baja, G. S. , “Using Binary Pyramids to Create Multi-resolution Shape Descriptors,” Proceedings of the First Brazilian Symposium of Document Image Analysis, pp. 129–140, No- vember 1997.

[16] Gonzalez, R. C. and Woods, R. E. , Digital Image Processing, Addison- Wesley, Ed., 1992.

[17] Lam, L. and Suen, C. Y. , “An Evaluation of Parallel Thinning Algorithms for Character Recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 9, pp. 914–919, 1995.

[18] El Yacoubi, A., “Mod´elisation Markovienne de L’ ´Ecriture Manuscrite Application `a la Reconnaissance des Adresses Postales,” Thesis, Uni- versite De Rennes 1, 1996.

[19] El-Yacoubi, A., Gilloux, M., Sabourin, R. and Suen, C. Y., “An HMM-Based Approach for Off-Line Unconstrained Handwritten Word Modeling and Recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, pp. 752–760, August 1999.

[20] Freitas, C., El-Yacoubi, A., Bortolozzi, F. and Sabourin, A., “Bra- zilian Bank Check Handwritten Legal Amount Recognition,” Anais do Simp´osio Brasileiro de Computac¸ ˜ao Gr´afica e Processamento de imagens- SIBGRAPI’2000, 2000.

[21] Casey, R.G. and Lecolinet E. , “A Survey of Methods and Strategies in Character Segmentation,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 18, No. 7, pp. 690–706, 1996.

[22] Veloso, L. R., “Sistema de Reconhecimento de Palvras Manuscritas Dependente do Usu´ario,” Tese de Doutorado, Universidade Federal de Campina Grande, UFCG, Brasil, marc¸o 2009.

[23] Mohamed, M. A. and Gader, P., “Generalized Hidden Markov Models - Part I: Theoretical Frameworks,” IEEE Transactions on Fuzzy Systems, vol. 8, no. 1, pp. 67–81, 2000.

[24] Kim, J. H., Kim, K. K., Nadal, C. and Suen, C., “A methodology of Combining HMM and MLP Classifiers for Cursive Word Recognition,”

Proceedings of the International Conference on Pattern Recognition - ICPR’00, pp. 319–322, 2000.

[25] Kundu, M. and Bahl, P., “Recognition of handwritten script: A hidden markov model based approach,” Relat´orio T´ecnico, 1988.

[26] Oliveira Jr., J. J., “Reconhecimento de Palavras Manuscritas Usando An´alise Multi-Vistas,” Tese de Doutorado, Universidade Federal de Campina Grande, 2006.

[27] Grandidier, F., Sabourin, R., El-Yacoubi, A., Gilloux, M. and Suen, C., “Influence of Word Length on Handwriting Recognition,” 1999.

[Online]. Available: citeseer.ist.psu.edu/grandidier99influence.html [28] Nunes, C. M., Britto, Ad. S., Jr.; Kaestner, C. A. A.; Sabourin, R., “An

Optimized Hill Climbing Algorithm for Feature Subset Selection: Eva- luation on Handwritten Character Recognition,” in Ninth International Workshop on Frontiers in Handwriting Recognition, 2004.

[29] Oliveira, L. S., Sabourin, R., Bortolozzi, F. and Suen, C. Y. , “A Metho- dology for Feature Selection Using Multi-Objective Genetic Algorithms for Handwritten Digit String Recognition,” International Journal of Pattern Recognition and Artificial Intelligence, vol. 17, pp. 903–930, 2003.

[30] Morita, M., Oliveira, L.S. and Sabourin, R., “Gerac¸˜ao Autom´atica de Conjuntos de Classificadores Atrav´es da Selec¸˜ao de Caracter´ısticas n˜ao Supervisionada,” IEEE Latin America Transactions, vol. 3, no. 5, pp.

50–56, 2005.

[31] Oliveira, L. S., Morita, M. and Sabourin, R., “Feature Selection for Ensembles Applied to Handwriting Recognition,” International Journal on Document Analysis and Recognition, vol. 8, no. 4, pp. 262–279, 2006.

[32] Kim, J. H., Kim, K. K. and Suen, C. Y., “An HMM-MLP Hybrid Model for Cursive Script Recognition,” Pattern Analysis and Applications, vol. 3, pp. 314–324, 2000.

(8)

[33] Li, Z.C., Suen, C.Y., Guo, J., “A Regional Decomposition Method for Recognizing Handprinted Characters,” IEEE Transactions on Systems, Man, and Cybernetics, pp. 998–1010, 1995.

[34] Xu, L., Krzyzak, A. and Suen, C.,Y., “Methods of Combining Multiple Classifiers and Their Applications to Handwriting Recognition,” IEEE Transactions on Systems, Man, and Cybernetics, Vol.22, No.3, pp. 418–

435, May/June 1992.

[35] Suen, C., Kim, J., Kim, K., Xu, Q. and Lam, L., “Handwriting Recogni- tion - The Last Frontiers,” Proceedings of the International Conference on Pattern Recognition - ICPR’00, pp. 1–10, September 2000.

[36] Brakensiek, A., Kosmala, A., Willet, D., Wang, W. and Rigoll G.,

“Performance Evaluation of a New Modeling Technique for Handwriting Recognition Using Identical On-Line and Off- Line Data,” Proceedings of the V International Conference on Document Analysis and Recogni- tion - ICDAR’99, Bangalore, India, 1999.

[37] Dehghan, M., Faez, K., Ahmadi, M. and Shridhar, M., “Off-Line Unconstrained Farsi Handwritten Word Recognition Using Fuzzy Vector Quantization and Hidden Markov Word Models,” Proceedings of the International Conference on Pattern Recognition - ICPR’00, pp. 351–

354, September 2000.

[38] Knerr, S. and Augustian, E., “A Neural Network-Hidden Markov Model Hybrid for Cursive Word Recognition,” Proceedings of the International Conference on Pattern Recognition - ICPR’98, Vol. 2, pp. 1518–1520, 1998.

[39] Ko A., Sabourin R., Britto Jr. A. and Oliveira L. S., “Pairwise Fusion Matrix for Combining Classifiers,” Pattern Recognition, vol. 40, no. 8, pp. 2198–2210, 2007.

[40] Oliveira, L. S. Sabourin, R., Bortolozzi, F. and Suen, C. Y., “Feature Selection for Ensembles: A Hierarchical Multi-Objective Genetic Al- gorithm Approach,” in In Proc. of 7 th International Conference on Document Analysis and Recognition, Edinburgh-Scotland, 2003. IEEE Computer Society, 2003, pp. 676–680.

[41] Morita, M., Oliveira, L. S. and Sabourin, R., “Unsupervised Feature Selection for Ensemble of Classifiers,” in In 9th International Workshop on Frontiers in Handwriting Recognition, 2004, pp. 81–86.

[42] Liu, C.-L. and Marukawa, K., “Normalization Ensemble for Handwritten Character Recognition,” International Workshop on Frontiers in Hand- writing Recognition,, vol. 0, pp. 69–74, 2004.

[43] Srihari, S. N., Xu, A. and Kalera, M., “Learning Strategies and Clas- sification Methods for Off-Line Signature Verification,” International Workshop on Frontiers in Handwriting Recognition, vol. 0, pp. 161–

166, 2004.

[44] Haykin, S., Neural Networks - A Comprehensive Foundation. Upper Saddle River, New Jersey 07458: Prentice-Hall, Inc., 1999.

[45] Beale, R. and Jackson, T., Neural Computing: An Introduction. Bristol and Philadelphia: Institute of Physics Publishing, 1990.

[46] Kohonen, T., Self-Organization and Associative Memory (3rd ed). Ber- lin: Springer-Verlag, 1989.

[47] Gader, P., Whalen, M., Ganzberger, M. and Hepp, D. , “Handprinted Word Recongition on a NIST Data Set,” Machine Vision and Applica- tion, Vol.8, pp. 31–40, 1995.

[48] Gader, P., Mohamed, M. and Chiang, J.-H. , “Comparison of Crisp and Fuzzy Character Neural Networks in Handwritten Word Recognition,”

IEEE Transactions on Fuzzy Systems, Vol. 3, No. 3, pp. 357–363, August 1995.

[49] Rabiner, L. R. and Schafer, R. W., Digital Processing of Speech Signals.

Upper Saddle River, New Jersey: Prentice-Hall, 1978.

[50] Mohamed, M. A. and Gader, P, “Handwritten Word Recognition Using Segmentation-Free Hidden Markov Modeling and Segmentation-Based Dynamic Programming Techniques,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 18, No. 5, pp. 548–554, May 1996.

[51] Mohamed, M. A. and Gader, P., “Generalized Hidden Markov Models - Part II: Application to Handwritten Word Recognition,” IEEE Transac- tions on Fuzzy Systems, vol. 8, no. 1, pp. 82–94, 2000.

[52] Gillies, A.M., “Cursive Word Recognition Using Hidden Markov Mo- dels,” Proceedings of the Advanced Technology Conference - United States Postal Service, Vol. 1, 1992.

[53] Chen, M.-Y., Kundu, A., Zhou, J. and Srihari, S. N., “Off-Line Hand- written Word Recognition Using Hidden Markov Models,” Proceedings of the Advanced Technology Conference - United States Postal Service, Vol. 1, 1992.

[54] Chen, M.-Y., Kundu, A. and Zhou, J., “Off-Line Handwritten Word Recognition Using Hidden Markov Model Type Stochastic Network ,”

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.16, No. 5, pp. 481–496, May 1994.

[55] Chen, M.-Y., Kundu, A. and Srihari, N. , “Variable Duration Hidden Markov Model and Morphological Segmentation for Handwritten Word Recognition,” IEEE Transactions on Image Processing, Vol. 4, No. 12, pp. 1675 – 1687, December 1995.

[56] Gilloux, M., Leroux, M. and Bertille, J.-M. , “Strategies for Hanwritten Words Recognition Using Hidden Markov Models,” Proceedings of the International Conference on Document Analysis and Recognition - ICDAR’93, pp. 299–304, 1993.

[57] Bunke, H., Roth, M. and Schukatt-Talamazzini, E.G., “Off-line Cursive Handwriting Recognition using Hidden Markov Models,” Relat´orio T´ecnico, IAM-94-008, Institut f¨ur Informatik und angewandle Mathe- matic, Universit¨at Bern, 1994.

[58] Wang, W., Brakensiek, A., Kosmala and Rigoll G. , “HMM Based High Accuracy Off-Line Cursive Handwriting Recognition by a Baseline Detection Error Tolerant Feature Extraction Approach,” Proceedings of the IWFHR, Amsterdam, The Netherlands, 2000.

[59] Brakensiek, A., Rottland, A., Kosmala, A., and Rigoll G. , “Off-Line Handwriting Recognition Using Various Hybrid Modeling Techniques and Character N-Grams,” Proceedings of the IWFRH, Amsterdam, The Netherlands, 2000.

[60] Guillevic, D. and Suen, C. Y., “HMM Word Recognition Engine,”

Proceedings of the IV International Conference on Document Analysis and Recognition - ICDAR’97, Ulm , Germany, pp. 544–547, 1997.

[61] Kim, G., and Kim, S. , “Feature Selection Using Genetic Algorithms for Handwritten Character Recognition,” Proceedings of the International Workshop on Frontiers in Handwriting Recognition, Amsterdam, The Netherlands, 2000.

[62] Arica, N. and Yarman-Vural, F. T., “Optical Character Recognition for Cursive Handwriting,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 6, pp. 801–813, 2002.

[63] Koerich, A. and Sabourin, R. and Suen, C. Y., “Fast Two-Level HMM Decoding Algorithm for Large Vocabulary Handwriting Recognition,”

in Proc. Ninth Workshop Frontiers in Handwriting Recognition, 2004, pp. 232–237.

[64] Kessentini, Y., Paquet, T. and Benhamadou, A., “A Multi-stream Appro- ach to Off-Line Handwritten Word Recognition,” in ICDAR ’07: Pro- ceedings of the Ninth International Conference on Document Analysis and Recognition (ICDAR 2007) Vol 1. Washington, DC, USA: IEEE Computer Society, 2007, pp. 317–321.

[65] Koch, G., Paquet, T. and Heutte, L., “Combination of Contextual Information for Handwritten Word Recognition,” in Proceedings of the Ninth International Workshop on Frontiers in Handwriting Recognition.

Washington, DC, USA: IEEE Computer Society, 2004, pp. 468–473.

[66] Shetty, S., Srinivasan, H. and Srihari, S., “Handwritten Word Re- cognition Using Conditional Random Fields,” in Proceedings of the Ninth International Conference on Document Analysis and Recognition (ICDAR 2007) Vol 2. Washington, DC, USA: IEEE Computer Society, 2007, pp. 1098–1102.

Referências

Documentos relacionados

Criar, estereotipar as coisas assim: “lateral chega ali à linha e pára o barco”, tem ali uma parede; mas também ter um lateral que sobe por subir, mas depois não percebe que,

Os termos “Transgredir” e “Problematizar” são aqui postos no sentido de criar novas situações de ensino e de aprendizagem na e para formação de estudantes e

Os resultados das interações entre as variáveis analisadas consumo de potência, eficiência de trabalho útil, consumo específico, capacidade de produção e tamanho das

Antes de tudo isso, havia sido feita, logo no início deste trabalho, uma (re)construção crítica da história do Brasil, no intuito de encontrar inscritos nela

Figures 2 and 3, as follows, present the implantation plan, as well as respective ubdivision into urban development units, and Table 5 features the land occupation

Destas, quatro tipos foram de conhecimento prévio (ativa significado das palavras, ativa conhecimentos prévios relativos aos conteúdos das frases, contrasta informação do texto

Because spring P concentrations have been shown to be significant predictors of blue-green algal densities and water clarity during the summer months in the lake (Stow, Carpenter

En este primer estudio, los datos obtenidos coinciden con los aportados por otras investigaciones respecto de la relación entre género y ansiedad ante los exámenes (por