• Nenhum resultado encontrado

3Estruturadamonografia 2Objetivo 1Escopodotrabalho PropostademonografiaAplicaçãodeanálisemorfológicaparasegmentaçãodepáginasemimagensdedocumentos

N/A
N/A
Protected

Academic year: 2022

Share "3Estruturadamonografia 2Objetivo 1Escopodotrabalho PropostademonografiaAplicaçãodeanálisemorfológicaparasegmentaçãodepáginasemimagensdedocumentos"

Copied!
3
0
0

Texto

(1)

Proposta de monografia

Aplicação de análise morfológica para segmentação de páginas em imagens de documentos

Aluno: Ricardo de Cillo Supervisora: Nina S. T. Hirata

2012-05-27

Resumo

Uma das aplicações da teoria de visão computacional é a análise de imagens de docu- mentos. O objetivo desta aplicação é extrair informações sobre o conteúdo e estrutura de um documento digitalizado. Uma das etapas envolvidas é a segmentação de página que consiste na identificação de áreas da imagem correspondentes à elementos estruturais, tais como títulos, legendas e blocos de texto. Nesta monografia iremos explorar métodos mor- fológicos aplicados à segmentação de páginas. A qualidade da solução obtida será medida e comparada, segundo os mesmo critérios aplicados à resultados considerados estado da arte por pesquisadores da .

1 Escopo do trabalho

A analise de imagens de documentos, ou apenas análise de documentos, é um campo de pesquisa ativo apesar de ter sido bastante explorado nas últimas décadas. Isto se deve a sua importância prática e a complexidade dos problemas abordados. Delimitamos o escopo deste trabalho à análise de layout, como indicado no diagrama 1 adaptado de [6].

Para se extrair o texto de um documento cujo layout possui elementos estruturais complexos como colunas, por exemplo, precisamos primeiramente identificar estas regiões antes de aplicar um OCR.

2 Objetivo

Construir um software que receba como entrada a imagem de um documento digitalizado e produza como saída uma descrição geométrica [2] de suas regiões de texto.

3 Estrutura da monografia

A estrutura esperada da monografia será de acordo com o esquema abaixo:

1. Descrição do problema e objetivos: definição formal e exemplos.

2. Revisão bibliográfica: resumo dos artigos estudados e trabalho importantes no assunto.

3. Metodologia: fundamentação teórica para construção da solução.

4. Implementação: documentação dos pontos principais da implementação.

1

(2)

Análise de Documentos

Textual Gráfica

Optical Caracter

Recognition Análise de Layout Processamento de

linhas Processamento de símbolos e regiões

Texto Linhas e blocos de texto,

parágrafos Linhas,

cantos e curvas Regiões preenchidas

Figura 1: Contextualização do tema do trabalho entre as áreas da análise de documentos.

5. Resultados experimentais: o que deu certo ou errado e porque.

4 Atividades realizadas

Até o momento eu li artigos [2] [4] [3] [7] [8] [1] [5], estudei conceitos de visão na disciplina MAC0417 com o professor Junior Barreira, obtive um dataset para testes.

5 Cronograma

Vide figura 2.

Referências

[1] 10th International Conference on Document Analysis and Recognition, ICDAR 2009, Barce- lona, Spain, 26-29 July 2009. IEEE Computer Society, 2009.

[2] A. Antonacopoulos and D. Bridson. Performance analysis framework for layout analysis methods. Document Analysis and Recognition, International Conference on, 2:1258–1262, 2007.

[3] A. Antonacopoulos, D. Bridson, C. Papadopoulos, and S. Pletschacher. A realistic dataset for performance evaluation of document layout analysis, 2009.

2

(3)

maio junho julho agosto setembro outubro novembro

pesquisa e estudo

implementação

monografia

poster

Figura 2: Cronograma.

[4] A. Antonacopoulos and R. T. Ritchings. Representation and classification of complex-shaped printed regions using white tiles. In Proceedings of the 3rd ICDAR, pages 1132–1135. IEEE- CS Press, 1995.

[5] Apostolos Antonacopoulos, Stefan Pletschacher, David Bridson, and Christos Papadopoulos.

Icdar 2009 page segmentation competition. In ICDAR [1], pages 1370–1374.

[6] Rangachar Kasturi, Lawrence O’Gorman, and Venu Govindaraju. Document image analysis:

A primer. Sadhana, 27(1):3–22, 2002.

[7] Michael A. Moll and Henry S. Baird. Document content inventory and retrieval. InIn Proc., IAPR 9th Int’l Conf. on Document Analysis and Recognition (ICDAR2007, 2007.

[8] Raymond W. Smith. Hybrid page layout analysis via tab-stop detection. In Proceedings of the 2009 10th International Conference on Document Analysis and Recognition, ICDAR ’09, pages 241–245, Washington, DC, USA, 2009. IEEE Computer Society.

3

Referências

Documentos relacionados

- Se o estagiário, ou alguém com contacto direto, tiver sintomas sugestivos de infeção respiratória (febre, tosse, expetoração e/ou falta de ar) NÃO DEVE frequentar

O pressuposto teórico à desconstrução da paisagem, no caso da cidade de Altinópolis, define que os exemplares para essa análise, quer sejam eles materiais e/ou imateriais,

O segundo Beneficiário será designado pelo Segurado na Proposta de Adesão, podendo ser substituído a qualquer tempo, mediante solicitação formal assinada pelo próprio Segurado, para

As pontas de contato retas e retificadas em paralelo ajustam o micrômetro mais rápida e precisamente do que as pontas de contato esféricas encontradas em micrômetros disponíveis

Contribuições/Originalidade: A identificação dos atributos que conferem qualidade ao projeto habitacional e das diretrizes de projeto que visam alcançá-los, são de fundamental

* Movement based refers to any Creative work, from any artistic area, using the movement as basis of work, research or critical approach. Movement understood as the movement of

Em condições em que a temperatura do termômetro globo é menor que a temperatura do termômetro de bulbo seco, o ITEG-500 permite através dessa configuração, realizar uma

Almanya'da olduğu gibi, burada da bu terimin hiçbir ayrım gütmeden, modern eğilimleri simgeleyen tüm sanatçılar için geçerli olduğu anlaşılıyor.. SSCB'de ilk halk