Introduc¸˜ao ao Reconhecimento de Palavras Manuscritas
Luciana R. Veloso e Francisco Madeiro
Resumo— O avanc¸o do conhecimento, a expans˜ao da mem´oria e a comunicac¸ ˜ao est˜ao entre os benef´ıcios proporcionados pela escrita, que constitui-se em um dos objetos da ´area de processa- mento de documentos. Dentre os desenvolvimentos relacionados a esta ´area, podem ser citados: sistemas de reconhecimento de caracteres manuscritos, de assinaturas, de numerais manuscritos, de palavras manuscritas e sistemas de filtragem frente-verso. Este artigo apresenta uma introduc¸˜ao ao reconhecimento de palavras manuscritas. S˜ao abordadas etapas importantes do sistemas de reconhecimento: pr´e-processamento, segmentac¸ ˜ao e classificac¸ ˜ao.
O artigo aborda, ainda, t´ecnicas utilizadas para o prop´osito do reconhecimento, com destaque para os modelos de Markov escondidos, as redes neurais artificiais e os m´etodos h´ıbridos.
Palavras-Chave— Processamento de documentos, reconheci- mento de manuscritos, reconhecimento de palavras manuscritas, processamento digital de imagens, reconhecimento de padr˜oes.
I. I
NTRODUC¸ ˜
AOAvanc¸os da civilizac¸˜ao devem-se `a escrita, que foi desenvol- vida com o prop ´osito de expandir a mem´oria humana e facilitar a comunicac¸˜ao. Dentre as tecnologias que contribu´ıram para a expans˜ao da escrita, podem ser citadas: a imprensa, a m´aquina de datilografar, o computador e as tecnologias da informac¸˜ao e da comunicac¸˜ao, como os processadores de texto e os servic¸os de e-mail. Ressalte-se, entretanto, que, apesar da polularizac¸˜ao de alguns recursos tecnol´ogicos (computadores, palmtops, tablets), h´a situac¸˜oes em que caneta e papel s˜ao mais convenientes que um teclado [1] – ´e o caso, por exemplo, de estudantes em uma sala de aula, os quais continuam armazenando as informac¸˜oes (texto, equac¸˜oes e gr´aficos) por meio da caneta e do papel.
Os sistemas de reconhecimento de manuscritos s˜ao particu- larmente ´uteis nas situac¸˜oes em que o papel e o instrumento escrevente s˜ao utilizados, permitindo aos computadores trans- formarem uma linguagem representada em sua forma espacial ou marcas gr´aficas em uma representac¸˜ao simb ´olica.
H´a duas abordagens para o problema de reconhecimento de manuscritos: hol´ıstica ou anal´ıtica. A primeira trata as palavras como entidades ´unicas, indivis´ıveis, e procura reconhecˆe-las como um todo [2] e constitui-se na opc¸˜ao preferida quando a aplicac¸˜ao possui um vocabul´ario pequeno. A segunda utiliza unidades de sub-palavras, tais como caracteres ou pseudo- caracteres, para o prop ´osito de reconhecimento, sendo apropri- ada em aplicac¸˜oes pr´aticas que requerem grandes vocabul´arios.
De todo modo, qualquer que seja a abordagem utilizada, os sistemas de reconhecimento s˜ao complexos e necessitam de
Luciana Ribeiro Veloso, Universidade Federal de Campina Grande (UFCG), Campina Grande, PB, Brasil. Francisco Madeiro, Escola Polit´ecnica de Pernambuco (POLI), Universidade de Pernambuco (UPE), Recife, PE, Brasil.
E-mails: veloso@dee.ufcg.edu.br e madeiro@poli.br
v´arias t´ecnicas. Em geral, sistemas off-line de reconhecimento de manuscritos possuem os seguintes m´odulos b´asicos: pr´e- processamento, segmentac¸˜ao de palavras, extrac¸˜ao de carac- ter´ısticas e classificac¸˜ao, conforme se observa na Figura 1.
Fig. 1. Diagrama de blocos de um sistema geral de reconhecimento de palavras manuscritas.
Detalham-se, a seguir, os m´odulos b´asicos de um sistema off-line de reconhecimento de palavras manuscritas. A aborda- gem concentra-se, principalmente, nos sistemas que utilizam a abordagem anal´ıtica.
II. P
RE´ -
PROCESSAMENTOT´ecnicas de pr´e-processamento levam `a reduc¸˜ao da va- riabilidade entre as classes de objetos ou entre escritores diferentes. Nesta etapa, a imagem ´e geralmente limpa de ru´ıdo e dos erros causados pelo processo de digitalizac¸˜ao.
A normalizac¸˜ao, que constitui-se em uma fase importante do pr´e-processamento, tem como objetivo reduzir as variac¸˜oes observadas em diferentes amostras da mesma palavra, escrita pela mesma pessoa em instantes distintos ou por diferentes escritores, tais como:
•
Angulo de inclinac¸˜ao vertical dos caracteres (slope ou ˆ slant). ´ E muito comum encontrar em documentos ma- nuscritos palavras ou numerais com diferentes ˆangulos de inclinac¸˜ao. O ˆangulo de inclinac¸˜ao vertical dos caracteres
´e definido como o ˆangulo entre o eixo correspondente `a direc¸˜ao m´edia dos caracteres, calculada como a m´edia dos ˆangulos de inclinac¸˜ao de cada letra que comp ˜oe a palavra, e o eixo vertical [3]. Nesse cen´ario, as t´ecnicas mais simples assumem que a inclinac¸˜ao ´e uniforme para todas as letras que comp ˜oem a palavra, realizando uma correc¸˜ao global. H´a, no entanto, t´ecnicas que trabalham isolando segmentos de palavra e efetuam a correc¸˜ao individual de cada segmento [4], [5], [6], [7], [3], [8], [9], [10].
•
Inclinac¸˜ao da linha de base da escrita (Skew). O ˆangulo
da linha de base da escrita ´e o ˆangulo entre a linha
de base definida pelo contorno inferior da palavra e a
linha horizontal de referˆencia. De modo geral, os m´etodos de correc¸˜ao de linha de base podem ser globais ou locais [10], [11].
•
Largura do trac¸ado do caractere. A largura do trac¸ado varia devido a fatores como o instrumento de escrita uti- lizado, a press˜ao aplicada, o tipo de papel e a inclinac¸˜ao do instrumento de escrita. Pode ser eliminada por meio de esqueletizac¸˜ao ou extrac¸˜ao de contornos [12], [13], [14], [15], [16], [17], por exemplo.
Um conceito importante ´e o de linhas de base (baselines), que s˜ao linhas imagin´arias que dividem a palavra em trˆes regi˜oes: ascendente, descendente e central [18], [19], [11], [10], [20], conforme mostrado na Figura 2. No reconheci- mento de palavras manuscritas, elas, bem como as regi˜oes ascendente, central e descendente, s˜ao usadas, geralmente, nas etapas de segmentac¸˜ao e extrac¸˜ao de caracter´ısticas. Por exemplo, na extrac¸˜ao de caracter´ısticas de palavras, elas s˜ao utilizadas para detectar os trac¸os ascendentes e descendentes.
Fig. 2. Linhas de base.
(a) (b)
Fig. 3. Correc¸˜ao da inclinac¸ ˜ao das letras da palavra. (a) imagem original, (b) imagem normalizada.
(a) (b)
Fig. 4. Normalizac¸˜ao da inclinac¸ ˜ao da linha de base das palavras. (a) imagem original, (b) imagem normalizada.
As Figuras 3 e 4 ilustram o resultado das operac¸˜oes de normalizac¸˜ao do ˆangulo de inclinac¸˜ao vertical dos caracteres e de normalizac¸˜ao da inclinac¸˜ao da linha de base das palavras
III. S
EGMENTAC¸ ˜
AO DE PALAVRAS EM CARACTERESUma poss´ıvel t´ecnica de reconhecimento de palavras con- siste em realizar uma segmentac¸˜ao das mesmas em caracteres, seguida pelo reconhecimento dos caracteres como s´ımbolos v´alidos do alfabeto e, finalmente, pelo casamento entre as sequˆencias de caracteres identificados e palavras de um di- cion´ario (Figura 5). A variedade de estilos e a grande ambi- guidade encontrada na escrita cursiva tornam complexo o re-
conhecimento autom´atico de manuscritos. ´ E muito desafiador segmentar as palavras em letras.
Fig. 5. Forma intuitiva de reconhecimento de palavras manuscritas: (a) palavra manuscrita; (b) separac¸˜ao dos segmentos; (c) reconhecimento do primeiro segmento; (d) an´alise do segundo segmento; e) sobresegmentac¸ ˜ao do segundo segmento.
A dificuldade supracitada pode ser entendida observando a Figura 6: as partes destacadas nas imagens (a), (b), (c) e (d) correspondem respectivamente a (m, rv, ui e n). Na Figura 6(a), o trac¸ado do caractere que est´a circulado n˜ao necessita ser segmentado, pois pertence a um ´unico caractere. O mesmo n˜ao acontece na imagem (c), que cont´em dois caracteres circulados.
Fig. 6. Exemplos de palavras manuscritas.
Segmentar uma palavra em caracteres ´e uma operac¸˜ao que decomp ˜oe a imagem de uma palavra formada por uma sequˆencia de caracteres em sub-imagens de caracteres ou pseudo-caracteres [21]. Segmentar corretamente uma palavra manuscrita, sem a informac¸˜ao a priori sobre a quantidade e o r´otulo dos caracteres, levando em conta os problemas provocados pela ambiguidade dos caracteres na escrita cursiva,
´e uma tarefa extremamente dif´ıcil. Para solucionar tais proble- mas, uma das estrat´egias utilizadas na literatura ´e realizar a segmentac¸˜ao baseada no reconhecimento. Nessa estrat´egia, o algoritmo de segmentac¸˜ao divide a imagem em segmentos, ou pedac¸os da palavra original, gerando uma lista de hip ´oteses de segmentac¸˜ao (sobre-segmentac¸˜ao). Cada segmento idealmente consiste de um caractere ou parte de um caractere. O processo de classificac¸˜ao determina a melhor maneira de concatenar os segmentos de forma a representar palavras contidas em um l´exico. Os resultados apresentados na literatura mostram que este tipo de abordagem produz bons resultados. Entretanto, devido ao grande n ´umero de hip ´otese geradas e `a necessidade do classificador discriminar os diferentes padr˜oes gerados (caracteres, pseudo-caracteres e caracteres conectados), essa estrat´egia est´a associada a um alto custo computacional. Nessa abordagem, a segmentac¸˜ao pode ser expl´ıcita ou impl´ıcita.
Nos m´etodos expl´ıcitos, a segmentac¸˜ao ´e realizada antes
do classificador, produzindo sub-imagens de caracteres ou
pseudo-caracteres. Em contraste, nos m´etodos impl´ıcitos, a
segmentac¸˜ao ´e incorporada ao processo de classificac¸˜ao e ´e
realizada simultaneamente com a classificac¸˜ao.
A Figura 3 ilustra o resultado do processo de segmentac¸˜ao expl´ıcita baseada no reconhecimento.
Fig. 7. Resultado do processo de segmentac¸˜ao expl´ıcita baseada no reconhecimento.
Uma segunda estrat´egia de segmentac¸˜ao ´e a livre do reco- nhecimento, que fornece ao classificador uma ´unica hip ´otese de sequˆencia de caracteres. Entretanto, devido aos proble- mas supracitados, essa estrat´egia ´e utilizada, geralmente, na segmentac¸˜ao de palavras manuscritas redigidas em que h´a uma clara delimitac¸˜ao do comec¸o e t´ermino do trac¸ado do caractere.
Diversos algoritmos foram propostos para a segmentac¸˜ao expl´ıcita baseado no reconhecimento. Eles normalmente le- vam em considerac¸˜ao informac¸˜oes provenientes do primeiro e segundo plano da imagem. Dentre as diversas informac¸˜oes utilizadas, destacam-se: a localizac¸˜ao dos m´ınimos locais do contorno ou do esqueleto da palavra, a localizac¸˜ao dos trac¸os relativamente horizontais (trac¸os de ligac¸˜ao entre caracteres), an´alise do perfil de contorno e caracter´ısticas de concavidade do trac¸ado da imagem.
A an´alise dos trac¸os de ligac¸˜ao entre os caracteres permite a localizac¸˜ao dos pontos de segmentac¸˜ao de palavras em carac- teres quando o escritor utiliza pequenos trac¸os relativamente horizontais para separar um caractere do outro. Entretanto, tal informac¸˜ao n˜ao ´e suficiente para a determinac¸˜ao da fronteira entre caracteres fortemente conectados. Nesse caso, a litera- tura recomenda a utilizac¸˜ao das informac¸˜oes provenientes da an´alise dos m´ınimos locais e das concavidades do trac¸ado dos caracteres para a realizac¸˜ao da segmentac¸˜ao. Visando obter um melhor desempenho na segmentac¸˜ao, independente do tipo de manuscrito, muitos sistemas realizam a segmentac¸˜ao baseada numa combinac¸˜ao dessas informac¸˜oes. O principal problema nessa estrat´egia ´e o elevado n ´umero de poss´ıveis pontos de segmentac¸˜ao gerados, com a possibilidade de obter mais de um ponto de segmentac¸˜ao para a mesma fronteira entre caracteres sucessivos, o que acarretaria uma sobrecarga no sistema, haja vista que o classificador deve avaliar cada sub-imagem gerada e suas poss´ıveis combinac¸˜oes caso o sistema permita. Para evitar tal carga de processamento e uma poss´ıvel degradac¸˜ao no sistema, utiliza-se um conjunto de regras heur´ısticas que trabalham na reduc¸˜ao dos poss´ıveis pontos de segmentac¸˜ao. A Figura 8 ilustra o resultado da uni˜ao dos pontos de segmentac¸˜ao gerados por algoritmos de segmentac¸˜ao, e o resultado final ap ´os o processo de avaliac¸˜ao desses pontos por um conjunto de regras heur´ısticas no sistema de reconhecimento de manuscritos desenvolvido por Veloso [22].
IV. E
XTRAC¸ ˜
AO DEC
ARACTER´
ISTICASO desempenho de qualquer algoritmo de classificac¸˜ao e/ou reconhecimento depende da representac¸˜ao dos padr˜oes a serem classificados, ou seja, das caracter´ısticas ou primitivas que s˜ao extra´ıdas dos padr˜oes da imagem [23], [20]. Essas carac- ter´ısticas devem preservar as informac¸˜oes que s˜ao pertinentes
(a) (b)
Fig. 8. (a) uni˜ao dos pontos de segmentac¸˜ao produzidos pela combinac¸˜ao dos resultados dos algoritmos de segmentac¸˜ao e (b) resultado final do processo de segmentac¸˜ao ap´os a etapa de p´os-segmentac¸˜ao.
e ´uteis para a classificac¸˜ao e, ao mesmo tempo, eliminar as informac¸˜oes irrelevantes e desnecess´arias [24], [23], [20]. Na definic¸˜ao do conjunto de caracter´ısticas ´e importante conside- rar alguns aspectos b´asicos [25]:
•
As caracter´ısticas devem ser preferencialmente in- sens´ıveis `a rotac¸˜ao, translac¸˜ao e variac¸˜oes de tamanho da escrita;
•
A extrac¸˜ao das caracter´ısticas deve ser de baixo custo computacional;
•
As caracter´ısticas devem ser independentes umas das outras.
Al´em disso, as caracter´ısticas devem destacar as diferenc¸as entre os objetos de classes distintas (interclasse) enquanto mi- nimizam as poss´ıveis variac¸˜oes da mesma classe (intraclasse).
Existem v´arios tipos de caracter´ısticas que s˜ao utiliza- das para descrever os padr˜oes em sistemas de reconheci- mento de manuscritos. Em geral, essas caracter´ısticas contˆem informac¸˜oes sobre a estrutura dos caracteres ou pseudo- caracteres ou fornecem informac¸˜oes estat´ısticas sobre o padr˜ao em an´alise. As caracter´ısticas estat´ısticas s˜ao provenientes da an´alise das distribuic¸˜oes estat´ısticas da representac¸˜ao da imagem (bin´aria, n´ıvel de cinza, contornos ou esqueleto), tais como zoneamento, momentos, histogramas de projec¸˜ao e de transic¸˜ao do contorno, retangularidade e circularidade. Carac- ter´ısticas estruturais s˜ao informac¸˜oes provenientes da an´alise das propriedades topol´ogicas e geom´etricas dos padr˜oes, como concavidades, trac¸os T e X, ˆangulo de inclinac¸˜oes dos trac¸os dos caracteres, direc¸˜oes do trac¸ado do caracteres, intersec¸˜oes dos segmentos e loops.
O tipo de caracter´ısticas estruturais mais utilizado em siste-
mas de reconhecimento de manuscritos ´e o das caracter´ısticas
perceptivas [22], [20], [26], inspiradas no processo de leitura
humano, que as utiliza para identificar palavras manuscri-
tas. Caracter´ısticas perceptivas contˆem informac¸˜oes sobre a
localizac¸˜ao e tamanho de lac¸os (loops), trac¸os ascendentes e
trac¸os descendentes, os quais s˜ao facilmente percebidos pelo
olho humano. Entretanto, tais caracter´ısticas n˜ao fornecem
nenhuma informac¸˜ao quando as imagens analisadas contˆem
caracteres que n˜ao possuam trac¸os ascendentes, descendentes
ou loops, como os caracteres ”m”e ”n”, s´o para citar dois
caracteres como exemplos. Segundo Grandidier [27], mais de
50% das sub-imagens em seu conjunto de treino s˜ao caracte-
rizados pela ausˆencia desse tipo de caracter´ısticas, correspon-
dendo a caracteres que s˜ao escritos sem a utilizac¸˜ao de trac¸os
ascendentes, descendentes e loops. Outras caracter´ısticas es-
truturais bastante estudadas na literatura especializada s˜ao
as globais e as direcionais. Caracter´ısticas globais contˆem
informac¸˜oes globais sobre o trac¸ado da imagem, tais como sua localizac¸˜ao e forma (retangular ou circular). As caracter´ısticas direcionais analisam regi˜oes do fundo da imagem e foram inspiradas num procedimento de rotulac¸˜ao proposto por Parker [12]. Neste m´etodo, para cada pixel do fundo da imagem, ´e verificado em cada uma das quatro direc¸˜oes principais (norte, sul, leste, oeste) se existe um pixel pertencente ao contorno na direc¸˜ao analisada, conforme ´e ilustrado na Figura 9.
Muitos pesquisadores tˆem explorado a combinac¸˜ao de di- versos conjuntos de caracter´ısticas com objetivo de realc¸ar as propriedades que diferem um caractere do outro [28], [29], [30], [31]. Entretanto, o aumento do n ´umero de caracter´ısticas torna o sistema mais complexo, custa um maior tempo de treinamento e pode reduzir sua capacidade de generalizac¸˜ao.
Recentemente, pesquisadores tˆem aplicado t´ecnicas de selec¸˜ao de caracter´ısticas para reduzir a complexidade dos classi- ficadores e melhorar seu desempenho [28], [29], [32] Al- guns trabalhos na literatura tˆem investigado a utilizac¸˜ao de mecanismos de zoneamento ou m´etodos de decomposic¸˜ao regional acoplados `as t´ecnicas de extrac¸˜ao de caracter´ısticas, com o objetivo de tornar a representac¸˜ao dos caracteres mais eficiente e, assim, melhorar o desempenho dos sistemas de reconhecimento, aumentando a taxa de reconhecimento [20], [33].
Fig. 9. Exemplo do processo de rotulac¸˜ao utilizado pelo extrator de caracter´ısticas direcionais.
V. R
ECONHECIMENTOO objetivo de um sistema de reconhecimento ´e a classificac¸˜ao. A tarefa do classificador ´e identificar a classe `a qual a imagem analisada pertence, com base nas caracter´ısticas extra´ıdas da mesma. V´arias estrat´egias de classificac¸˜ao po- dem ser utilizadas no reconhecimento off-line de manus- critos, como, por exemplo, casamento de padr˜oes, t´ecnicas estat´ısticas, t´ecnicas estruturais e redes neurais. Esquemas h´ıbridos, de m´ultiplos classificadores, tamb´em tˆem sido pes- quisados [34], [1], [24], [35], [36], [37], [38], [37], [39], [26], [28]. Resultados interessantes tˆem sido obtidos com o uso de conjuntos de classificadores (ensemble classifiers) [40], [41], [42], [31], [39], os quais podem ser obtidos por meio da variac¸˜ao do conjunto de treino, das caracter´ısticas ou parˆametros e arquiteturas do classificador base.
Em diversos sistemas de reconhecimento, podem ser identi- ficadas duas etapas: a de treinamento e a classificac¸˜ao propri- amente dita. A primeira consiste, por exemplo, em obter um conjunto representativo de padr˜oes para as palavras que cons- tituem um conjunto de treinamento do sistema. A segunda, por exemplo, consiste em realizar o reconhecimento com base em
crit´erios de similaridade entre os padr˜oes obtidos da palavra a ser classificada (reconhecida) e os padr˜oes de referˆencia previamente gerados na etapa de treinamento. Neste caso, estamos falando de reconhecimento com base em casamento de padr˜oes. Se a t´ecnica de reconhecimento for uma rede neural artificial, a etapa de treinamento consiste em usar um conjunto de treino para ajustar os pesos da rede neural (NN, neural network) que ser´a utilizada para o prop ´osito de classificac¸˜ao.
As estrat´egias de aprendizagem podem ser classificadas em dependente ou independente do escritor. T´ecnicas de aprendizagem consideradas como independentes do escritor constroem seus modelos por treinamento a partir de um conjunto de amostras de palavras manuscritas de diversos escritores, enquanto as t´ecnicas de aprendizagem dependentes do escritor utilizam apenas amostras de palavras redigidas pelo mesmo escritor para a construc¸˜ao de seus modelos [43].
A seguir s˜ao abordados alguns m´etodos de reconhecimento de palavras manuscritas.
A. Redes Neurais Artificiais
As redes neurais artificiais s˜ao compostas de muitos elemen- tos simples (neurˆonios), interconectados por meio de ligac¸˜oes (pesos), em geral de acordo com uma arquitetura. A ideia de aprendizagem em uma rede neural ´e implementada por meio da modificac¸˜ao dos pesos. Quanto `a forma de aprendizagem, os algoritmos utilizados durante a fase de treinamento de redes neurais [44] podem ser classificados em duas categorias:
algoritmos supervisionados e algoritmos n˜ao-supervisionados.
As redes que utilizam algoritmo de treinamento supervisio- nado recebem informac¸˜ao externa sobre a que classe pertence cada padr˜ao de entrada utilizado na fase de treinamento. De posse dessa informac¸˜ao, os pesos das unidades de processa- mento s˜ao modificados de forma a se obter o desempenho desejado, ou seja, uma classificac¸˜ao satisfat´oria. Um dos algoritmos de treinamento supervisionado mais utilizados ´e o algoritmo backpropagation ou algoritmo de propagac¸˜ao retroativa de erros, que descreve a metodologia de modificac¸˜ao dos pesos na rede neural denominada perceptron multicama- das [44], [45].
Uma caracter´ıstica marcante da aprendizagem supervisio- nada ´e a presenc¸a de um supervisor externo. O supervisor
´e simplesmente o elemento que det´em o conhecimento do problema a ser solucionado pela rede, ou seja, ele conhece o mapeamento entrada-sa´ıda. O supervisor fornece `a rede um conjunto de exemplos entrada-sa´ıda. Em outras palavras, a resposta desejada (resposta correta) ´e fornecida `a rede pelo supervisor. Essa resposta desejada representa a ac¸˜ao ´otima a ser executada pela rede. Nesse contexto, os parˆametros da rede s˜ao ajustados de forma a minimizar o sinal erro, definido como a diferenc¸a entre a resposta real, apresentada pela rede, e a resposta desejada, fornecida pelo supervisor.
Na aprendizagem n˜ao-supervisionada ou auto-
organizativa [44], [45], n˜ao existe um supervisor externo
para orientar o processo de aprendizagem. Nos algoritmos
de treinamento n˜ao-supervisionado, portanto, nenhuma
informac¸˜ao externa referente `as classes a que pertencem os
dados de treinamento ´e dispon´ıvel `a rede. As modificac¸˜oes efetuadas nos pesos s˜ao realizadas com base apenas na observac¸˜ao de erros internos. O principal objetivo do algoritmo de treinamento n˜ao-supervisionado ´e capturar as regularidades estat´ısticas dos dados de entrada, ou seja, desenvolver a habilidade de promover representac¸˜oes internas eficientes das caracter´ısticas dos padr˜oes de entrada. Um exemplo de rede que utiliza aprendizagem n˜ao-supervisionada s˜ao os mapas auto-organiz´aveis de Kohonen (SOM, Self- organizing Maps) [46].
O perceptron multicamadas (MLP, multi-layer perceptron) foi usado em [47], com um l´exico de 746 palavras, levando a uma taxa de reconhecimento de 83,92%. Estrat´egias fuzzy para o treinamento de redes neurais, com vetores de caracter´ısticas de 120 componentes, foram consideradas em [48].
Cˆot´e et al. [10] desenvolveram um sistema de reconheci- mento de palavras manuscritas que possui arquitetura inspirada no sistema de leitura humano e em concepc¸˜oes perceptuais. No reconhecimento, uma rede neural com trˆes camadas identifica a imagem da palavra utilizando as caracter´ısticas extra´ıdas por interm´edio de sucessivos ciclos perceptuais. Uma t´ecnica de casamento fuzzy identifica a correspondˆencia entre as zonas na imagem de entrada e letras nas palavras do l´exico. A sa´ıda do m´odulo de reconhecimento ´e uma lista de palavras candidatas dispostas em ordem decrescente de ativac¸˜ao.
B. Modelos de Markov Escondidos
Um modelo de Markov escondido ´e um processo estoc´astico gerado por dois mecanismos inter-relacionados. Um canal de Markov b´asico tem um n ´umero finito de estados e um conjunto de func¸˜oes aleat´orias, cada func¸˜ao aleat´oria associada a cada um dos estados. Para cada instante de tempo discreto,
´e assumido que o processo est´a em algum estado e uma sequˆencia de observac¸˜ao ´e gerada por uma func¸˜ao aleat´oria correspondendo ao estado corrente. O canal de Markov b´asico escolhe o estado de acordo com uma matriz de probabilidade de transic¸˜ao. O observador vˆe somente a sa´ıda (observac¸˜oes) da func¸˜ao densidade de probabilidade (fdp) associada a cada estado e n˜ao pode observar os estados do canal de Markov b´asico; da´ı o termo modelo de Markov escondido [49].
Os HMMs tˆem sido amplamente utilizados em sistemas de reconhecimento de palavras manuscritas [50], [23], [51], [52], [19], [53], [54], [55], [56], [25], [57], [58], [36], [59], [60], [61], [62], [63], [64].
Gillies [52] foi um dos primeiros a utilizar HMM em um sistema de reconhecimento de palavras manuscritas com segmentac¸˜ao impl´ıcita. O m´etodo usa operac¸˜oes morfol´ogicas, quantizac¸˜ao vetorial e HMM de densidade discreta esquerda- direita, em que ´e constru´ıdo um modelo para cada letra. Os modelos de letras individuais s˜ao combinados em modelos para cada palavra no l´exico. Os conjuntos de treinamento e de teste consistem em 2.662 e 296 imagens de palavras cursivas, respectivamente, e foram extra´ıdos de blocos de enderec¸os manuscritos do correio americano. As taxas de reconhecimento obtidas para as 10 primeiras palavras foi de 72,6% a 90,5%
para o l´exico de 100 palavras e para o l´exico de 1.000 palavras foi de 51,0% a 80,1%.
Yacoubi et al. [19] propuseram uma t´ecnica de reconheci- mento de palavras manuscritas para um vocabul´ario amplo, usando HMM. O modelo foi testado em uma base de imagens de nomes de cidades francesas. A taxa de reconhecimento obtida para um l´exico de 1.000 palavras foi de 88,9%.
O sistema de reconhecimento de palavras manuscritas pro- posto por Chen et al. [55] utiliza HMM de durac¸˜ao vari´avel com densidade cont´ınua (Continuous Density Variable Dura- tion Hidden Markov Model - CDVDHMM). Um algoritmo de segmentac¸˜ao separa todos os caracteres conectados e ga- rante que cada caractere ser´a segmentado em no m´aximo cinco partes. O CDVDHMM define as 26 letras do alfabeto como 26 estados diferentes. Na fase de treinamento, grupos consecutivos de segmentos s˜ao identificados como estados, e uma mistura de Gaussianas ´e utilizada para modelar as probabilidades de s´ımbolos para cada estado.
No sistema de reconhecimento de palavras manuscritas de Kundu et al. [25], a palavra ´e previamente segmentada em caracteres. Quatorze caracter´ısticas s˜ao extra´ıdas, relativas `a forma (n ´umeros de junc¸˜oes X e T, n ´umero de loops, dentre outras) e `a distribuic¸˜ao dos pixels. Os vetores de caracter´ısticas s˜ao transformados em s´ımbolos, usando quantizac¸˜ao vetorial, e as 26 letras do alfabeto s˜ao identificadas com estados do HMM. Na etapa de reconhecimento, cada letra da palavra ´e classificada por comparac¸˜ao com os s´ımbolos do dicion´ario do quantizador vetorial, de acordo com o crit´erio da m´ınima distˆancia. O reconhecimento ´e feito utilizando o algoritmo de Viterbi.
Bunke et al. [57] apresentaram um sistema com HMM capaz de se adapatar ao estilo de escrita de diferentes escri- tores. Nas fases de treinamento e de teste foram utilizadas palavras manuscritas de cinco indiv´ıduos distintos. O vetor de caracter´ısticas foi codificado por um quantizador vetorial, um HMM foi treinado pelo algoritmo de Baum-Welch e o reconhecimento feito utilizando o algoritmo de Viterbi.
Kessentini et al. [64] apresentam um sistema de reconheci- mento de manuscritos utilizando uma abordagem multi-stream com HMM. Dois conjuntos de caracter´ısticas s˜ao extra´ıdos do contorno inferior e superior da palavra atrav´es de uma janela deslizante. Cada modelo do 2-stream ´e treinado independente- mente utilizando o algoritmo de Baum Welch. O ´ultimo passo
´e o reconhecimento, que utiliza um algoritmo modificado de Viterbi, o qual decodifica dois modelos stream em paralelo de acordo com o formalismo multi-stream.
C. Abordagens H´ıbridas
Uma abordagem multi-vista foi apresentada por Oliveira Jr.
[26] para o reconhecimento de palavras manuscritas. Nela, h´a
trˆes m´odulos. O primeiro realiza uma pseudo-segmentac¸˜ao de
radical que divide as palavras em duas regi˜oes e seu vetor
de caracter´ısticas ´e composto por caracter´ısticas perceptivas
e geom´etricas. As palavras analisadas s˜ao reconhecidas por
redes neurais multicamadas (MLP). O segundo ´e composto por
uma pseudo-segmentac¸˜ao fixa, trˆes extratores de caracter´ısticas
(perceptivas, direcionais e topol´ogicas) e classificadores neu-
rais. O ´ultimo m´odulo realiza uma pseudo-segmentac¸˜ao
vari´avel, para extrair as mesmas caracter´ısticas anteriormente
descritas do sistema, embora usando uma representac¸˜ao por alfabetos de s´ımbolos. O classificador utilizado ´e um HMM com uma topologia esquerda-direita.
Em outros trabalhos, Rigoll et al. [36], [59] realizaram comparac¸˜oes de sistemas de reconhecimento de palavras ma- nuscritas baseados em HMMs, utilizando t´ecnicas de mo- delamento discreto e h´ıbrido. Nas abordagens h´ıbridas, s˜ao realizadas associac¸˜oes de HMMs e redes neurais. As redes neurais s˜ao utilizadas como um quantizador vetorial para um HMM discreto, ou para calcular a func¸˜ao densidade de probabilidade para um HMM cont´ınuo.
Kim et al. [61] utilizaram para o reconhecimento de pa- lavras manuscritas uma estrat´egia h´ıbrida de classificadores baseada em HMM e redes neurais. O reconhecimento com segmentac¸˜ao expl´ıcita ´e realizado pelo HMM, enquanto o reconhecimento hol´ıstico ´e realizado por redes neurais. Esses dois classificadores s˜ao combinados utilizando uma estrat´egia de multiplicac¸˜ao.
D. Uma Avaliac¸˜ao de Desempenho
O desempenho de alguns sistemas citados neste artigo ´e apresentado nas Tabelas I e II, em que TR ´e a taxa de reconhecimento e NV ´e o n ´umero de palavras no vocabul´ario.
Os sistemas foram avaliados usando diferentes bases de da- dos e, consequentemente, muitas vezes possuem vocabul´arios distintos. Comparar o desempenho dos sistemas por meio de suas taxas de reconhecimento ´e imprudente. A dificuldade do sistema n˜ao reside apenas no tamanho do vocabul´ario mas tamb´em na similaridade entre as palavras do vocabul´ario, a aplicac¸˜ao `a qual se destina e se o sistema ´e ou n˜ao dependente do escritor. De uma maneira geral, quanto maior o vocabul´ario em quest˜ao, menores s˜ao as taxas de reconhecimento.
VI. C
OMENTARIOS FINAIS´
O reconhecimento de palavras manuscritas ´e um problema relevante da ´area de processamento de documentos e, como consequˆencia, tem recebido atenc¸˜ao da comunidade cient´ıfica da ´area. H´a duas abordagens para o reconhecimento de pala- vras manuscritas: hol´ıstica ou anal´ıtica. Geralmente, quando a aplicac¸˜ao requer um pequeno l´exico, utiliza-se a abordagem hol´ıstica; caso contr´ario, ´e prefer´ıvel utilizar a abordagem anal´ıtica.
Um sistema gen´erico de reconhecimento de palavras manus- critas ´e composto por etapas: pr´e-processamento, segmentac¸˜ao, extrac¸˜ao de caracter´ısticas e classificac¸˜ao (reconhecimento).
As etapas de pr´e-processamento e segmentac¸˜ao podem ou n˜ao ser utilizadas, dependendo da complexidade do problema a ser tratado.
Devido `a existˆencia de letras amb´ıguas e ileg´ıveis, ´e dif´ıcil segmentar a palavra em caracteres completos. A soluc¸˜ao ´e realizar o reconhecimento utilizando a abordagem hol´ıstica ou utilizar a etapa de segmentac¸˜ao para quebrar a palavra em segmentos, que podem ser caracteres completos ou pedac¸os de caracteres.
V´arias t´ecnicas de extrac¸˜ao de caracter´ısticas e de classificac¸˜ao tˆem sido propostas na literatura. Dentre as t´ecnicas utilizadas no reconhecimento de palavras manuscritas,
TABLE I
DESEMPENHO DE ALGUNS SISTEMAS DE RECONHECIMENTO DE MANUSCRITOS.
Sistema ClassificadorNV TR (%) Base de
dados Gader et
al. [47]
NN 746 83,92 nomes de
cidades (CEDAR) (Inglˆes) Gader e
Mohamed [50]
HMM 100 89,3 nomes de
cidades (CEDAR) (Inglˆes) Gillies
[52]
HMM 1000 80,1 nomes de
cidades ameri- canas (Inglˆes) Yacoubi
et al. [19]
HMM 1000 88,9 nomes de
cidades francesas (Francˆes) Chen et
al. [55]
CDVDHMM 1000 59,6 nomes de
cidades, nomes de pessoas, nomes de estados ameri- canos (Inglˆes) Gilloux et
al.[56]
HMM 27 79,0 valores
por extenso em cheques banc´ario (Francˆes) Bunke et
al. [57]
HMM 150 98,4 palavras
manus- critas (Inglˆes) Cˆot´e et al.
[10]
HMM e
Fuzzy
32 73,6 valores
por extenso em cheques banc´ario (Inglˆes)
os modelos de Markov escondidos (HMMs) tˆem ocupado um lugar de destaque. H´a outras alternativas para o reconheci- mento, como ´e o caso de m´etodos baseados em quantizac¸˜ao vetorial e em redes neurais artificiais.
A
GRADECIMENTOSOs autores expressam os agradecimentos ao Conselho Na- cional de Desenvolvimento Cient´ıfico e Tecnol´ogico (CNPq) pelo apoio financeiro.
R
EFERENCIASˆ
[1] Plamondon, R. and Srihari, S. N., “On-Line and Off-Line Handwriting Recognition: A Comprehensive Survery,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.22, No.1, pp. 63–84, January 2000.
TABLE II
DESEMPENHO DE ALGUNS SISTEMAS DE RECONHECIMENTO DE MANUSCRITOS(CONTINUAC¸ ˜AO).
Sistema ClassificadorNV TR (%) Base de
dados Rigoll et
al.[58]
HMM 1000 98,30 palavras
manus- critas (Inglˆes) Guillevic
e Suen [60]
HMM- KNN
30 86,7 valores
por extenso em cheques banc´ario (Inglˆes) Kim et
al.[61]
HMM- MLP
32 92,2 valores
por extenso em cheques banc´ario (Inglˆes) Arica et
al. [62]
HMM 1000 90,8 palavras
manus- critas (Inglˆes) Koch et
al. [65]
MLP 1000 67,8 palavras
manus- critas (Francˆes) Koerich et
al. [63]
HMM 1000 91,0 nomes de
cidades (Francˆes) Kessentini
et al. [64]
HMM 1000 42,6 palavras
manus- critas (Inglˆes) Shetty et
al. [66]
campos randˆomicos condicio- nais
300 80,0 palavras
manus- critas (Inglˆes)
[2] Koerich, A. L., Sabourin, R. and Suen, C. Y., “Large Vocabulary Off-line Handwriting Recognition: A survey,” Pattern Analysis and Applications, vol. 6, pp. 97–121, 2003.
[3] Buse, R., Liu, Z.-Q. and Caelli, T. , “A Structural and Relational Approach to Handwritten Word Recognition,” IEEE Transactions on Systems, Man and Cybernetics - Part B: Cybernetics, Vol. 27, No. 5, pp.
847–861, October 1997.
[4] El-Yacoubi, A., Gilloux, M., Sabourin, R. and Suen, C. Y., “Uncons- trained Handwritten Word Recognition using Hidden Markov Models,”
IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993.
[5] Bozinovic, R. M., and Shihari, S. N., “Off-Line Cursive Script Word Recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.11, No.1, pp. 68–83, January 1989.
[6] Kim, G. and Govindaraju, V., “A Lexicon Driven Approach to Handwrit- ten Word Recognition for Real-Time Applications ,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 4, pp. 366–
379, April 1997.
[7] Kim, G. and Govindaraju, V. , “Handwritten Phrase Recognition as Applied to Street Name Images,” Pattern Recognition, Vol. 31, No. 1, pp. 41–51, 1998.
[8] Ding, Y., Kimura, F., Miyake, Y. and Shridhar, M., “Accuracy Improve- ment of Slant Estimation for Handwritten Words,” Proceedings of the International Conference on Pattern Recognition - ICPR’00, pp. 527–
530, 2000.
[9] Slav´ık, P. and Govindaraju, V., “Equivalence of Different Methods for Slant and Skew Corrections in Word Recognition Applications,” IEEE
Transactions on Pattern Analysis and Machine Intelligence, Vol.23, No.3, pp. 323–326, March 2001.
[10] Cˆot´e, M., Lecolinet, E., Cheriet, M. and Suen, C. Y. , “Automatic Reading of Cursive Scripts Using a Reading Model and Perceptual Con- cepts,” International Journal on Document Analysis and Recognition, Vol. 1, pp. 3–17, 1998.
[11] Senior, A. W. and Robinson, A. J. , “An Off-Line Cursive Handwri- ting Recognition System,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, pp. 309–321, March 1998.
[12] Parker, J. R., Algorithms For Image Processing and Computer Vision.
Wiley Computer Publishing, 1997.
[13] Facon, J., Morfologia Matem´atica: Teoria e Exemplos., Universit´aria, Ed. PUC-PR, 1996.
[14] Frucci, M. and Marcelli, A. , “Contour Pixel Classification for Charac- ter Skeletonization,” Proceedings of the First Brazilian Symposium of Document Image Analysis, pp. 141–152, November 1997.
[15] Borgefors, G., Ramella, G. and Baja, G. S. , “Using Binary Pyramids to Create Multi-resolution Shape Descriptors,” Proceedings of the First Brazilian Symposium of Document Image Analysis, pp. 129–140, No- vember 1997.
[16] Gonzalez, R. C. and Woods, R. E. , Digital Image Processing, Addison- Wesley, Ed., 1992.
[17] Lam, L. and Suen, C. Y. , “An Evaluation of Parallel Thinning Algorithms for Character Recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 9, pp. 914–919, 1995.
[18] El Yacoubi, A., “Mod´elisation Markovienne de L’ ´Ecriture Manuscrite Application `a la Reconnaissance des Adresses Postales,” Thesis, Uni- versite De Rennes 1, 1996.
[19] El-Yacoubi, A., Gilloux, M., Sabourin, R. and Suen, C. Y., “An HMM-Based Approach for Off-Line Unconstrained Handwritten Word Modeling and Recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, pp. 752–760, August 1999.
[20] Freitas, C., El-Yacoubi, A., Bortolozzi, F. and Sabourin, A., “Bra- zilian Bank Check Handwritten Legal Amount Recognition,” Anais do Simp´osio Brasileiro de Computac¸ ˜ao Gr´afica e Processamento de imagens- SIBGRAPI’2000, 2000.
[21] Casey, R.G. and Lecolinet E. , “A Survey of Methods and Strategies in Character Segmentation,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 18, No. 7, pp. 690–706, 1996.
[22] Veloso, L. R., “Sistema de Reconhecimento de Palvras Manuscritas Dependente do Usu´ario,” Tese de Doutorado, Universidade Federal de Campina Grande, UFCG, Brasil, marc¸o 2009.
[23] Mohamed, M. A. and Gader, P., “Generalized Hidden Markov Models - Part I: Theoretical Frameworks,” IEEE Transactions on Fuzzy Systems, vol. 8, no. 1, pp. 67–81, 2000.
[24] Kim, J. H., Kim, K. K., Nadal, C. and Suen, C., “A methodology of Combining HMM and MLP Classifiers for Cursive Word Recognition,”
Proceedings of the International Conference on Pattern Recognition - ICPR’00, pp. 319–322, 2000.
[25] Kundu, M. and Bahl, P., “Recognition of handwritten script: A hidden markov model based approach,” Relat´orio T´ecnico, 1988.
[26] Oliveira Jr., J. J., “Reconhecimento de Palavras Manuscritas Usando An´alise Multi-Vistas,” Tese de Doutorado, Universidade Federal de Campina Grande, 2006.
[27] Grandidier, F., Sabourin, R., El-Yacoubi, A., Gilloux, M. and Suen, C., “Influence of Word Length on Handwriting Recognition,” 1999.
[Online]. Available: citeseer.ist.psu.edu/grandidier99influence.html [28] Nunes, C. M., Britto, Ad. S., Jr.; Kaestner, C. A. A.; Sabourin, R., “An
Optimized Hill Climbing Algorithm for Feature Subset Selection: Eva- luation on Handwritten Character Recognition,” in Ninth International Workshop on Frontiers in Handwriting Recognition, 2004.
[29] Oliveira, L. S., Sabourin, R., Bortolozzi, F. and Suen, C. Y. , “A Metho- dology for Feature Selection Using Multi-Objective Genetic Algorithms for Handwritten Digit String Recognition,” International Journal of Pattern Recognition and Artificial Intelligence, vol. 17, pp. 903–930, 2003.
[30] Morita, M., Oliveira, L.S. and Sabourin, R., “Gerac¸˜ao Autom´atica de Conjuntos de Classificadores Atrav´es da Selec¸˜ao de Caracter´ısticas n˜ao Supervisionada,” IEEE Latin America Transactions, vol. 3, no. 5, pp.
50–56, 2005.
[31] Oliveira, L. S., Morita, M. and Sabourin, R., “Feature Selection for Ensembles Applied to Handwriting Recognition,” International Journal on Document Analysis and Recognition, vol. 8, no. 4, pp. 262–279, 2006.
[32] Kim, J. H., Kim, K. K. and Suen, C. Y., “An HMM-MLP Hybrid Model for Cursive Script Recognition,” Pattern Analysis and Applications, vol. 3, pp. 314–324, 2000.
[33] Li, Z.C., Suen, C.Y., Guo, J., “A Regional Decomposition Method for Recognizing Handprinted Characters,” IEEE Transactions on Systems, Man, and Cybernetics, pp. 998–1010, 1995.
[34] Xu, L., Krzyzak, A. and Suen, C.,Y., “Methods of Combining Multiple Classifiers and Their Applications to Handwriting Recognition,” IEEE Transactions on Systems, Man, and Cybernetics, Vol.22, No.3, pp. 418–
435, May/June 1992.
[35] Suen, C., Kim, J., Kim, K., Xu, Q. and Lam, L., “Handwriting Recogni- tion - The Last Frontiers,” Proceedings of the International Conference on Pattern Recognition - ICPR’00, pp. 1–10, September 2000.
[36] Brakensiek, A., Kosmala, A., Willet, D., Wang, W. and Rigoll G.,
“Performance Evaluation of a New Modeling Technique for Handwriting Recognition Using Identical On-Line and Off- Line Data,” Proceedings of the V International Conference on Document Analysis and Recogni- tion - ICDAR’99, Bangalore, India, 1999.
[37] Dehghan, M., Faez, K., Ahmadi, M. and Shridhar, M., “Off-Line Unconstrained Farsi Handwritten Word Recognition Using Fuzzy Vector Quantization and Hidden Markov Word Models,” Proceedings of the International Conference on Pattern Recognition - ICPR’00, pp. 351–
354, September 2000.
[38] Knerr, S. and Augustian, E., “A Neural Network-Hidden Markov Model Hybrid for Cursive Word Recognition,” Proceedings of the International Conference on Pattern Recognition - ICPR’98, Vol. 2, pp. 1518–1520, 1998.
[39] Ko A., Sabourin R., Britto Jr. A. and Oliveira L. S., “Pairwise Fusion Matrix for Combining Classifiers,” Pattern Recognition, vol. 40, no. 8, pp. 2198–2210, 2007.
[40] Oliveira, L. S. Sabourin, R., Bortolozzi, F. and Suen, C. Y., “Feature Selection for Ensembles: A Hierarchical Multi-Objective Genetic Al- gorithm Approach,” in In Proc. of 7 th International Conference on Document Analysis and Recognition, Edinburgh-Scotland, 2003. IEEE Computer Society, 2003, pp. 676–680.
[41] Morita, M., Oliveira, L. S. and Sabourin, R., “Unsupervised Feature Selection for Ensemble of Classifiers,” in In 9th International Workshop on Frontiers in Handwriting Recognition, 2004, pp. 81–86.
[42] Liu, C.-L. and Marukawa, K., “Normalization Ensemble for Handwritten Character Recognition,” International Workshop on Frontiers in Hand- writing Recognition,, vol. 0, pp. 69–74, 2004.
[43] Srihari, S. N., Xu, A. and Kalera, M., “Learning Strategies and Clas- sification Methods for Off-Line Signature Verification,” International Workshop on Frontiers in Handwriting Recognition, vol. 0, pp. 161–
166, 2004.
[44] Haykin, S., Neural Networks - A Comprehensive Foundation. Upper Saddle River, New Jersey 07458: Prentice-Hall, Inc., 1999.
[45] Beale, R. and Jackson, T., Neural Computing: An Introduction. Bristol and Philadelphia: Institute of Physics Publishing, 1990.
[46] Kohonen, T., Self-Organization and Associative Memory (3rd ed). Ber- lin: Springer-Verlag, 1989.
[47] Gader, P., Whalen, M., Ganzberger, M. and Hepp, D. , “Handprinted Word Recongition on a NIST Data Set,” Machine Vision and Applica- tion, Vol.8, pp. 31–40, 1995.
[48] Gader, P., Mohamed, M. and Chiang, J.-H. , “Comparison of Crisp and Fuzzy Character Neural Networks in Handwritten Word Recognition,”
IEEE Transactions on Fuzzy Systems, Vol. 3, No. 3, pp. 357–363, August 1995.
[49] Rabiner, L. R. and Schafer, R. W., Digital Processing of Speech Signals.
Upper Saddle River, New Jersey: Prentice-Hall, 1978.
[50] Mohamed, M. A. and Gader, P, “Handwritten Word Recognition Using Segmentation-Free Hidden Markov Modeling and Segmentation-Based Dynamic Programming Techniques,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 18, No. 5, pp. 548–554, May 1996.
[51] Mohamed, M. A. and Gader, P., “Generalized Hidden Markov Models - Part II: Application to Handwritten Word Recognition,” IEEE Transac- tions on Fuzzy Systems, vol. 8, no. 1, pp. 82–94, 2000.
[52] Gillies, A.M., “Cursive Word Recognition Using Hidden Markov Mo- dels,” Proceedings of the Advanced Technology Conference - United States Postal Service, Vol. 1, 1992.
[53] Chen, M.-Y., Kundu, A., Zhou, J. and Srihari, S. N., “Off-Line Hand- written Word Recognition Using Hidden Markov Models,” Proceedings of the Advanced Technology Conference - United States Postal Service, Vol. 1, 1992.
[54] Chen, M.-Y., Kundu, A. and Zhou, J., “Off-Line Handwritten Word Recognition Using Hidden Markov Model Type Stochastic Network ,”
IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.16, No. 5, pp. 481–496, May 1994.
[55] Chen, M.-Y., Kundu, A. and Srihari, N. , “Variable Duration Hidden Markov Model and Morphological Segmentation for Handwritten Word Recognition,” IEEE Transactions on Image Processing, Vol. 4, No. 12, pp. 1675 – 1687, December 1995.
[56] Gilloux, M., Leroux, M. and Bertille, J.-M. , “Strategies for Hanwritten Words Recognition Using Hidden Markov Models,” Proceedings of the International Conference on Document Analysis and Recognition - ICDAR’93, pp. 299–304, 1993.
[57] Bunke, H., Roth, M. and Schukatt-Talamazzini, E.G., “Off-line Cursive Handwriting Recognition using Hidden Markov Models,” Relat´orio T´ecnico, IAM-94-008, Institut f¨ur Informatik und angewandle Mathe- matic, Universit¨at Bern, 1994.
[58] Wang, W., Brakensiek, A., Kosmala and Rigoll G. , “HMM Based High Accuracy Off-Line Cursive Handwriting Recognition by a Baseline Detection Error Tolerant Feature Extraction Approach,” Proceedings of the IWFHR, Amsterdam, The Netherlands, 2000.
[59] Brakensiek, A., Rottland, A., Kosmala, A., and Rigoll G. , “Off-Line Handwriting Recognition Using Various Hybrid Modeling Techniques and Character N-Grams,” Proceedings of the IWFRH, Amsterdam, The Netherlands, 2000.
[60] Guillevic, D. and Suen, C. Y., “HMM Word Recognition Engine,”
Proceedings of the IV International Conference on Document Analysis and Recognition - ICDAR’97, Ulm , Germany, pp. 544–547, 1997.
[61] Kim, G., and Kim, S. , “Feature Selection Using Genetic Algorithms for Handwritten Character Recognition,” Proceedings of the International Workshop on Frontiers in Handwriting Recognition, Amsterdam, The Netherlands, 2000.
[62] Arica, N. and Yarman-Vural, F. T., “Optical Character Recognition for Cursive Handwriting,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 6, pp. 801–813, 2002.
[63] Koerich, A. and Sabourin, R. and Suen, C. Y., “Fast Two-Level HMM Decoding Algorithm for Large Vocabulary Handwriting Recognition,”
in Proc. Ninth Workshop Frontiers in Handwriting Recognition, 2004, pp. 232–237.
[64] Kessentini, Y., Paquet, T. and Benhamadou, A., “A Multi-stream Appro- ach to Off-Line Handwritten Word Recognition,” in ICDAR ’07: Pro- ceedings of the Ninth International Conference on Document Analysis and Recognition (ICDAR 2007) Vol 1. Washington, DC, USA: IEEE Computer Society, 2007, pp. 317–321.
[65] Koch, G., Paquet, T. and Heutte, L., “Combination of Contextual Information for Handwritten Word Recognition,” in Proceedings of the Ninth International Workshop on Frontiers in Handwriting Recognition.
Washington, DC, USA: IEEE Computer Society, 2004, pp. 468–473.
[66] Shetty, S., Srinivasan, H. and Srihari, S., “Handwritten Word Re- cognition Using Conditional Random Fields,” in Proceedings of the Ninth International Conference on Document Analysis and Recognition (ICDAR 2007) Vol 2. Washington, DC, USA: IEEE Computer Society, 2007, pp. 1098–1102.