Reconhecimento de Objectos Gráficos (Vectorização)

2.5 Reconhecimento de Imagem

2.5.2 Reconhecimento de Objectos Gráficos (Vectorização)

O reconhecimento de gráficos está centrado na análise de documentos gráficos inten-

sivos, tais como desenhos t´ecnicos, mapas e esquemas. Os m´etodos de reconhecimento

de objectos gr´aficos existentes podem ser classificados em m´etodos de reconhecimento di-

recto e métodos baseado na vectorização. A primeira classe reconhece os objectos gráficos

directamente na imagem raster, enquanto a ´ultima classe converte primeiro a imagem raster

numa representação vectorial de baixo n´ıvel, e então aplica alguns algoritmos de reconheci-

mento baseado em vectores para produzir o resultado final. Ambas as classes argumentam

sobre as dificuldades da outra classe [124, 29, 115]; contudo, tamb´em sofrem das suas

Realmente, ambas as classes tˆem feito um progresso significativo nos ´ultimos anos;

contudo o caminho mais promissor ´e talvez explorar um novo paradigma que integre as

vantagens de ambos e evite as suas fraquezas [110].

Métodos baseados na vectorização

A vectorização, i.e. a conversão de raster para vectores, é certamente uma parte central

do problema de reconhecimento de gráficos, uma vez que o seu propósito é converter uma

imagem digitalizada para uma forma de vectores que posteriormente possam ser analisada.

A maioria dos métodos de vectorização divide o processo de conversão em dois passos:

vectorização pura e pós-processamento. Durante o passo de vectorização, extraem-se tantos

segmentos de linha sem junc¸˜oes quanto poss´ıvel, partindo da imagem raster, de seguida

no passo de p´os-processamento estendem-se e combinam-se os segmentos de linha em

entidades gr´aficas exactas, tais como linhas rectas, arcos e curvas.

A principal razão para esta divisão em dois passos é que estes métodos de vectorização

não conseguem extrair entidades gráficas num só passo, se existirem junções complicadas.

Exemplos t´ıpicos da vectorização em dois passos são os métodos baseados na skeletoniza-

tion, tais como algoritmos baseados no thinning, algoritmos baseados no contorno, algorit-

mos baseados na estrutura de grafos e m´etodos baseados no seguimento de sparse pixeis

(linhas finas e pouco densas).

Os m´etodos baseados no thinning [118, 22, 142, 87] normalmente aplicam um processo

de eros˜ao iterativa aos limites de modo a remover os pixeis exteriores, at´e que exista apenas

o esqueleto com largura de um pixel. Ent˜ao ligam-se os pixeis sobre o esqueleto `a cadeia

pixeis em vectores usando um procedimento de line fitting. Este m´etodo ´e conhecido como

tendo como principais desvantagens a ineficiência de tempo e a existência de distorções

nas junc¸˜oes.

O m´etodo baseado no contorno [44, 16, 9] extrai primeiro os contornos da imagem e

então encontra o eixo médio entre os contornos. Este método por vezes tem o inconveniente

de obter buracos que partem os vectores, devido à falta de pares de contornos nas junções.

O método baseado na estrutura dos grafos [91, 84] constrói um grafo de adjacência

em linha depois de efectuar a codificac¸˜ao do comprimento dos segmentos na imagem. O

procedimento de aproximação poligonal é aplicado aos pontos médios dos segmentos. Este

método é suscept´ıvel ao ru´ıdo e pode causar distorções nas junções.

O m´etodo de seguimento de sparse pixeis [27, 29] pretende melhorar a eficiˆencia e

precisão pela verificação dos pixeis espalhados. O resultado é um esqueleto difuso e são

necessárias operações de aproximações polinomiais para encontrar a melhor aproximação

da linha. Este m´etodo pode apenas evitar parcialmente a quebra de linhas.

Como os vectores que resultam do primeiro passo n˜ao satisfazem as exigˆencias, o se-

gundo passo de p´os-processamento, i.e. o refinamento dos vectores, deve considerar os

problemas t´ıpicos, incluindo a reconstrução de intersecções, a localização dos extremos,

a fragmentação de conexões e segmentação texto/gráficos, para converter o resultado dos

vectores de baixo n´ıvel num gr´afico final aceit´avel.

M´etodos de Reconhecimento Directo

Os m´etodos de reconhecimento directo apenas funcionam sobre o n´ıvel pixel. O se-

exemplos destes m´etodos.

Kovalevsky [67] propˆos um algoritmo de seguimento de pixeis para linhas rectas e ar-

cos. Para uma linha recta, o seguimento comec¸a com dois pixeis vizinhos num padr˜ao e

constrói-se uma pequena linha protótipo com os primeiros pixeis. Então cont´ınua o se-

guimento desta linha até não encontrar mais pixeis com conexão-4 na pequena linha. Em

cada passo do seguimento, ´e calculado o vector produto dos pixeis candidatos e os limites

da pequena linha para verificar as condições internas de linha. Para detectar um arco, são

encontrados pelo menos os dois primeiros segmentos de linha recta, os quais d˜ao a primeira

aproximação à curvatura do arco.

A transformada de Hough ´e tamb´em usada para detectar directamente na imagem raster

linhas rectas, c´ırculos e elipses. Uma vez que a transformac¸˜ao de todos os pixeis tem

custos demasiado altos em tempo e mem´oria, estes m´etodos seleccionam alguns pixeis

como pontos caracter´ısticos, contudo n˜ao se utilizam os pontos do esqueleto, para realizar

a transformada, mas por exemplo edge points [119] ou pontos conexos [69].

Chiang et al. [18] propuseram um m´etodo baseado em regi˜oes para reconhecer directa-

mente linhas rectas a partir de imagens raster. Este m´etodo usa um c´ırculo m´aximo inscrito

(CMI) com padr˜oes, para detectar as caracter´ısticas de uma linha recta.

O método de vectorização de linha global [111, 115, 114], pode reconhecer directa-

mente linhas rectas (s´olidas e a tracejado), arcos e c´ırculos completos a partir de imagens

raster. A ideia principal deste m´etodo ´e primeiro detectar as caracter´ısticas da forma pre-

tendida, usando esta caracter´ıstica para guiar o seguimento de pixel de modo a obter o

objecto gr´afico completo. No final, os pixeis pretos que correspondem unicamente ao ob-

No documento Extracção automática de dados georreferenciados a partir dos planos cadastrais portugueses (páginas 55-59)