2.5 Reconhecimento de Imagem
2.5.2 Reconhecimento de Objectos Gr´aficos (Vectorizac¸˜ao)
O reconhecimento de gr´aficos est´a centrado na an´alise de documentos gr´aficos inten-
sivos, tais como desenhos t´ecnicos, mapas e esquemas. Os m´etodos de reconhecimento
de objectos gr´aficos existentes podem ser classificados em m´etodos de reconhecimento di-
recto e m´etodos baseado na vectorizac¸˜ao. A primeira classe reconhece os objectos gr´aficos
directamente na imagem raster, enquanto a ´ultima classe converte primeiro a imagem raster
numa representac¸˜ao vectorial de baixo n´ıvel, e ent˜ao aplica alguns algoritmos de reconheci-
mento baseado em vectores para produzir o resultado final. Ambas as classes argumentam
sobre as dificuldades da outra classe [124, 29, 115]; contudo, tamb´em sofrem das suas
Realmente, ambas as classes tˆem feito um progresso significativo nos ´ultimos anos;
contudo o caminho mais promissor ´e talvez explorar um novo paradigma que integre as
vantagens de ambos e evite as suas fraquezas [110].
M´etodos baseados na vectorizac¸˜ao
A vectorizac¸˜ao, i.e. a convers˜ao de raster para vectores, ´e certamente uma parte central
do problema de reconhecimento de gr´aficos, uma vez que o seu prop´osito ´e converter uma
imagem digitalizada para uma forma de vectores que posteriormente possam ser analisada.
A maioria dos m´etodos de vectorizac¸˜ao divide o processo de convers˜ao em dois passos:
vectorizac¸˜ao pura e p´os-processamento. Durante o passo de vectorizac¸˜ao, extraem-se tantos
segmentos de linha sem junc¸˜oes quanto poss´ıvel, partindo da imagem raster, de seguida
no passo de p´os-processamento estendem-se e combinam-se os segmentos de linha em
entidades gr´aficas exactas, tais como linhas rectas, arcos e curvas.
A principal raz˜ao para esta divis˜ao em dois passos ´e que estes m´etodos de vectorizac¸˜ao
n˜ao conseguem extrair entidades gr´aficas num s´o passo, se existirem junc¸˜oes complicadas.
Exemplos t´ıpicos da vectorizac¸˜ao em dois passos s˜ao os m´etodos baseados na skeletoniza-
tion, tais como algoritmos baseados no thinning, algoritmos baseados no contorno, algorit-
mos baseados na estrutura de grafos e m´etodos baseados no seguimento de sparse pixeis
(linhas finas e pouco densas).
Os m´etodos baseados no thinning [118, 22, 142, 87] normalmente aplicam um processo
de eros˜ao iterativa aos limites de modo a remover os pixeis exteriores, at´e que exista apenas
o esqueleto com largura de um pixel. Ent˜ao ligam-se os pixeis sobre o esqueleto `a cadeia
pixeis em vectores usando um procedimento de line fitting. Este m´etodo ´e conhecido como
tendo como principais desvantagens a ineficiˆencia de tempo e a existˆencia de distorc¸˜oes
nas junc¸˜oes.
O m´etodo baseado no contorno [44, 16, 9] extrai primeiro os contornos da imagem e
ent˜ao encontra o eixo m´edio entre os contornos. Este m´etodo por vezes tem o inconveniente
de obter buracos que partem os vectores, devido `a falta de pares de contornos nas junc¸˜oes.
O m´etodo baseado na estrutura dos grafos [91, 84] constr´oi um grafo de adjacˆencia
em linha depois de efectuar a codificac¸˜ao do comprimento dos segmentos na imagem. O
procedimento de aproximac¸˜ao poligonal ´e aplicado aos pontos m´edios dos segmentos. Este
m´etodo ´e suscept´ıvel ao ru´ıdo e pode causar distorc¸˜oes nas junc¸˜oes.
O m´etodo de seguimento de sparse pixeis [27, 29] pretende melhorar a eficiˆencia e
precis˜ao pela verificac¸˜ao dos pixeis espalhados. O resultado ´e um esqueleto difuso e s˜ao
necess´arias operac¸˜oes de aproximac¸˜oes polinomiais para encontrar a melhor aproximac¸˜ao
da linha. Este m´etodo pode apenas evitar parcialmente a quebra de linhas.
Como os vectores que resultam do primeiro passo n˜ao satisfazem as exigˆencias, o se-
gundo passo de p´os-processamento, i.e. o refinamento dos vectores, deve considerar os
problemas t´ıpicos, incluindo a reconstruc¸˜ao de intersecc¸˜oes, a localizac¸˜ao dos extremos,
a fragmentac¸˜ao de conex˜oes e segmentac¸˜ao texto/gr´aficos, para converter o resultado dos
vectores de baixo n´ıvel num gr´afico final aceit´avel.
M´etodos de Reconhecimento Directo
Os m´etodos de reconhecimento directo apenas funcionam sobre o n´ıvel pixel. O se-
exemplos destes m´etodos.
Kovalevsky [67] propˆos um algoritmo de seguimento de pixeis para linhas rectas e ar-
cos. Para uma linha recta, o seguimento comec¸a com dois pixeis vizinhos num padr˜ao e
constr´oi-se uma pequena linha prot´otipo com os primeiros pixeis. Ent˜ao cont´ınua o se-
guimento desta linha at´e n˜ao encontrar mais pixeis com conex˜ao-4 na pequena linha. Em
cada passo do seguimento, ´e calculado o vector produto dos pixeis candidatos e os limites
da pequena linha para verificar as condic¸˜oes internas de linha. Para detectar um arco, s˜ao
encontrados pelo menos os dois primeiros segmentos de linha recta, os quais d˜ao a primeira
aproximac¸˜ao `a curvatura do arco.
A transformada de Hough ´e tamb´em usada para detectar directamente na imagem raster
linhas rectas, c´ırculos e elipses. Uma vez que a transformac¸˜ao de todos os pixeis tem
custos demasiado altos em tempo e mem´oria, estes m´etodos seleccionam alguns pixeis
como pontos caracter´ısticos, contudo n˜ao se utilizam os pontos do esqueleto, para realizar
a transformada, mas por exemplo edge points [119] ou pontos conexos [69].
Chiang et al. [18] propuseram um m´etodo baseado em regi˜oes para reconhecer directa-
mente linhas rectas a partir de imagens raster. Este m´etodo usa um c´ırculo m´aximo inscrito
(CMI) com padr˜oes, para detectar as caracter´ısticas de uma linha recta.
O m´etodo de vectorizac¸˜ao de linha global [111, 115, 114], pode reconhecer directa-
mente linhas rectas (s´olidas e a tracejado), arcos e c´ırculos completos a partir de imagens
raster. A ideia principal deste m´etodo ´e primeiro detectar as caracter´ısticas da forma pre-
tendida, usando esta caracter´ıstica para guiar o seguimento de pixel de modo a obter o
objecto gr´afico completo. No final, os pixeis pretos que correspondem unicamente ao ob-