• Nenhum resultado encontrado

Reconhecimento de Objectos Gr´aficos (Vectorizac¸˜ao)

2.5 Reconhecimento de Imagem

2.5.2 Reconhecimento de Objectos Gr´aficos (Vectorizac¸˜ao)

O reconhecimento de gr´aficos est´a centrado na an´alise de documentos gr´aficos inten-

sivos, tais como desenhos t´ecnicos, mapas e esquemas. Os m´etodos de reconhecimento

de objectos gr´aficos existentes podem ser classificados em m´etodos de reconhecimento di-

recto e m´etodos baseado na vectorizac¸˜ao. A primeira classe reconhece os objectos gr´aficos

directamente na imagem raster, enquanto a ´ultima classe converte primeiro a imagem raster

numa representac¸˜ao vectorial de baixo n´ıvel, e ent˜ao aplica alguns algoritmos de reconheci-

mento baseado em vectores para produzir o resultado final. Ambas as classes argumentam

sobre as dificuldades da outra classe [124, 29, 115]; contudo, tamb´em sofrem das suas

Realmente, ambas as classes tˆem feito um progresso significativo nos ´ultimos anos;

contudo o caminho mais promissor ´e talvez explorar um novo paradigma que integre as

vantagens de ambos e evite as suas fraquezas [110].

M´etodos baseados na vectorizac¸˜ao

A vectorizac¸˜ao, i.e. a convers˜ao de raster para vectores, ´e certamente uma parte central

do problema de reconhecimento de gr´aficos, uma vez que o seu prop´osito ´e converter uma

imagem digitalizada para uma forma de vectores que posteriormente possam ser analisada.

A maioria dos m´etodos de vectorizac¸˜ao divide o processo de convers˜ao em dois passos:

vectorizac¸˜ao pura e p´os-processamento. Durante o passo de vectorizac¸˜ao, extraem-se tantos

segmentos de linha sem junc¸˜oes quanto poss´ıvel, partindo da imagem raster, de seguida

no passo de p´os-processamento estendem-se e combinam-se os segmentos de linha em

entidades gr´aficas exactas, tais como linhas rectas, arcos e curvas.

A principal raz˜ao para esta divis˜ao em dois passos ´e que estes m´etodos de vectorizac¸˜ao

n˜ao conseguem extrair entidades gr´aficas num s´o passo, se existirem junc¸˜oes complicadas.

Exemplos t´ıpicos da vectorizac¸˜ao em dois passos s˜ao os m´etodos baseados na skeletoniza-

tion, tais como algoritmos baseados no thinning, algoritmos baseados no contorno, algorit-

mos baseados na estrutura de grafos e m´etodos baseados no seguimento de sparse pixeis

(linhas finas e pouco densas).

Os m´etodos baseados no thinning [118, 22, 142, 87] normalmente aplicam um processo

de eros˜ao iterativa aos limites de modo a remover os pixeis exteriores, at´e que exista apenas

o esqueleto com largura de um pixel. Ent˜ao ligam-se os pixeis sobre o esqueleto `a cadeia

pixeis em vectores usando um procedimento de line fitting. Este m´etodo ´e conhecido como

tendo como principais desvantagens a ineficiˆencia de tempo e a existˆencia de distorc¸˜oes

nas junc¸˜oes.

O m´etodo baseado no contorno [44, 16, 9] extrai primeiro os contornos da imagem e

ent˜ao encontra o eixo m´edio entre os contornos. Este m´etodo por vezes tem o inconveniente

de obter buracos que partem os vectores, devido `a falta de pares de contornos nas junc¸˜oes.

O m´etodo baseado na estrutura dos grafos [91, 84] constr´oi um grafo de adjacˆencia

em linha depois de efectuar a codificac¸˜ao do comprimento dos segmentos na imagem. O

procedimento de aproximac¸˜ao poligonal ´e aplicado aos pontos m´edios dos segmentos. Este

m´etodo ´e suscept´ıvel ao ru´ıdo e pode causar distorc¸˜oes nas junc¸˜oes.

O m´etodo de seguimento de sparse pixeis [27, 29] pretende melhorar a eficiˆencia e

precis˜ao pela verificac¸˜ao dos pixeis espalhados. O resultado ´e um esqueleto difuso e s˜ao

necess´arias operac¸˜oes de aproximac¸˜oes polinomiais para encontrar a melhor aproximac¸˜ao

da linha. Este m´etodo pode apenas evitar parcialmente a quebra de linhas.

Como os vectores que resultam do primeiro passo n˜ao satisfazem as exigˆencias, o se-

gundo passo de p´os-processamento, i.e. o refinamento dos vectores, deve considerar os

problemas t´ıpicos, incluindo a reconstruc¸˜ao de intersecc¸˜oes, a localizac¸˜ao dos extremos,

a fragmentac¸˜ao de conex˜oes e segmentac¸˜ao texto/gr´aficos, para converter o resultado dos

vectores de baixo n´ıvel num gr´afico final aceit´avel.

M´etodos de Reconhecimento Directo

Os m´etodos de reconhecimento directo apenas funcionam sobre o n´ıvel pixel. O se-

exemplos destes m´etodos.

Kovalevsky [67] propˆos um algoritmo de seguimento de pixeis para linhas rectas e ar-

cos. Para uma linha recta, o seguimento comec¸a com dois pixeis vizinhos num padr˜ao e

constr´oi-se uma pequena linha prot´otipo com os primeiros pixeis. Ent˜ao cont´ınua o se-

guimento desta linha at´e n˜ao encontrar mais pixeis com conex˜ao-4 na pequena linha. Em

cada passo do seguimento, ´e calculado o vector produto dos pixeis candidatos e os limites

da pequena linha para verificar as condic¸˜oes internas de linha. Para detectar um arco, s˜ao

encontrados pelo menos os dois primeiros segmentos de linha recta, os quais d˜ao a primeira

aproximac¸˜ao `a curvatura do arco.

A transformada de Hough ´e tamb´em usada para detectar directamente na imagem raster

linhas rectas, c´ırculos e elipses. Uma vez que a transformac¸˜ao de todos os pixeis tem

custos demasiado altos em tempo e mem´oria, estes m´etodos seleccionam alguns pixeis

como pontos caracter´ısticos, contudo n˜ao se utilizam os pontos do esqueleto, para realizar

a transformada, mas por exemplo edge points [119] ou pontos conexos [69].

Chiang et al. [18] propuseram um m´etodo baseado em regi˜oes para reconhecer directa-

mente linhas rectas a partir de imagens raster. Este m´etodo usa um c´ırculo m´aximo inscrito

(CMI) com padr˜oes, para detectar as caracter´ısticas de uma linha recta.

O m´etodo de vectorizac¸˜ao de linha global [111, 115, 114], pode reconhecer directa-

mente linhas rectas (s´olidas e a tracejado), arcos e c´ırculos completos a partir de imagens

raster. A ideia principal deste m´etodo ´e primeiro detectar as caracter´ısticas da forma pre-

tendida, usando esta caracter´ıstica para guiar o seguimento de pixel de modo a obter o

objecto gr´afico completo. No final, os pixeis pretos que correspondem unicamente ao ob-