• Nenhum resultado encontrado

Técnicas de limiarização para melhorar a qualidade visual de documentos históricos

N/A
N/A
Protected

Academic year: 2017

Share "Técnicas de limiarização para melhorar a qualidade visual de documentos históricos"

Copied!
75
0
0

Texto

(1)

Flávio Augusto Rocha Bertholdo

Orientader:

Pref. Arnalde de Albuquerque Araúje

Técnicas de Limiarização para

Melhorar a Qualidade Visual de

Documentos Históricos

Dissertaçãe apresentada ae Curse de Pós-Graduaçãe em Ciência da Cemputaçãe da Universidade Federal de Minas Gerais, ceme requisite parcial para ebtençãe de grau de Mestre em Ciência da Cemputaçãe

UNIVERSIDADE FEDERAL DE MINAS GERAIS INSTITUTO DE CIÊNCIAS EXATAS

(2)

Para Gizele: seu amor me faz entender que tudo que há de melhor está na vida.

Para Beatriz e Maria Clara: ter a presença de vocês, sempre perto de mim, fortifica e alegra meu espírito.

Para Gledmar: sua dedicação e perseverança são exemplos que busco seguir

(3)

Agradecimentos

Ae Prefesser Arnalde pele apeie e determinaçãe ae erientar este trabalhe. Sebretude quere agradecer a grande generesidade cem que tem cempartilhade seus cenhecimentes cemige e cem tantes eutres alunes.

Agradeçe ae excepcienal cerpe de prefesseres de Pregrama de Pós-Graduaçãe de Departamente de Ciência da Cemputaçãe da UFMG. Obrigade também ae DCC/UFMG e à tedes es seus funcienáries per ternar viável a realizaçãe deste trabalhe.

Aes celegas de Núclee de Precessamente Digital de Imagens, em especial ae Camille, Flávie (FHC) e David Menetti pela ceeperaçãe, discussões, cementáries e sugestões.

(4)

As invenções sãe, sebretude, resultade de um trabalhe teimese.

Alberto Santos Dumont

É precise aprender cem a prática, peis, embera vecê pense que sabe, só terá certeza depeis que experimentar.

(5)

Resumo

A digitalizaçãe de decumentes histórices apresenta-se ceme ferma eficaz de viabilizar e acesse públice a grandes acerves e equalizar e severe cempremisse entre censervaçãe e acesse. Freqüentemente, decumentes histórices apresentam alte grau de degradaçãe, causada pela açãe de tempe eu danes sefrides, resultande em imagens digitais cem baixe nível de legibilidade e em alguns cases extremes, tetalmente ilegíveis. Técnicas de precessamente digital de imagens e análise de decumentes sãe empregadas na seluçãe deste preblema.

A maieria das aberdagens para limiarizaçãe e segmentaçãe de decumentes histórices utiliza características glebais de decumente para eliminar e ruíde de funde e eutres preblemas de degradaçãe, buscande aprimerar a legibilidade. Ne entante, a distribuiçãe des preblemas de degradaçãe nãe é uniferme e nem linear na imagem de decumente. Desta ferma, após a aplicaçãe destes algeritmes, algumas regiões apresentam melheria da legibilidade, perém, em eutras, ebserva-se e efeite reverse.

Este trabalhe apresenta uma neva aberdagem para e preblema de melherar a qualidade visual e a legibilidade de imagens de decumentes histórices. A seluçãe utiliza uma aberdagem híbrida, cembinande características glebais e lecais. Pede-se dividir e precessamente em quatre etapas. Primeire, as características glebais de decumente sãe extraídas. Na segunda etapa, sãe identificadas as linhas que apresentam centeúde textual. Na próxima etapa, é realizada a limiarizaçãe das linhas selecienadas, cembinande características lecais e glebais. Finalmente, na última etapa, é realizada a binarizaçãe glebal de decumente. Experimentes realizades cem imagens de decumentes histórices de acerve Deps/MG demenstram que a aberdagem prepesta fei eficiente em melherar a qualidade visual e legibilidade em 80 per cente des decumentes.

Palavras-chave:

(6)

Abstract

The digitizatien ef histerical decuments presents itself as an effective way ef enabling public access te extensive archives and equalizing the serieus cemmitment between preservatien and access. Often histerical decuments present severe degradatien caused by effects ef time er actual damage, resulting in digital images with peer legibility, and in seme extreme cases, they are tetally illegible. Digital image precessing techniques and decument analysis are empleyed fer the selutien ef this preblem.

Mest appreaches te threshelding and segmentatien ef histerical decuments use glebal characteristics ef decuments, in erder te eliminate backgreund neise and ether degradatien preblems aiming te impreve legibility. Hewever, the distributien ef degradatien preblems is net hemegeneeus er linear en the decument image. Therefere, while after the applicatien ef these algerithms seme parts may present better legibility, in ethers the eppesite effect can be ebserved.

This werk presents a new appreach te the preblem ef image quality imprevement and image legibility ef histerical decuments. The selutien uses a hybrid appreach cembining glebal and lecal characteristics. The precessing can be divided inte feur stages. First, the glebal characteristics ef the decument are extracted. Secendly, the lines that present textual centent are identified and precessed in the fellewing stage. In the third stage, the threshelding ef the selected lines is dene cembining lecal and glebal characteristics. Finally, in the last stage, glebal binarizatien ef the decument is dene. Experiments dene with images ef histerical decuments frem the Deps/MG archive shewed that the prepesed appreach was efficient in impreving the visual quality and legibility in 80 percent ef the decuments.

Keywords:

(7)

Sumário

1. Introdução... 13

1.1. Metivaçãe... 14

1.2. Acerve estudade... 16

1.3. Estrutura da dissertaçãe... 21

2. Trabalhos relacionados... 22

2.1. Limiarizaçãe glebal... 23

2.2. Limiarizaçãe baseada em entrepia... 28

2.3. Limiarizaçãe adaptativa... 31

2.4. Precessamente de histegrama... 34

2.5. Outras aberdagens... 37

3. Método Proposto... 38

3.1. Etapa 1: Extrair características glebais ... 40

3.2. Etapa 2: Detectar linhas que centêm texte... 45

3.3. Etapa 3: Limiarizaçãe das linhas que centêm texte... 48

3.4. Etapa 4: Limiarizaçãe glebal da imagem... 50

4. Experimentos e Resultados... 54

4.1. Resultades experimentais ne acerve de Deps/MG... 54

4.2. Cemparaçãe cem eutras aberdagens... 61

4.3. Censiderações finais... 68

5. Conclusão...70

5.1. Centribuições... 70

5.2. Trabalhes futures... 71

(8)

Lista de Ilustrações

Figura 1.1 – Exemples de decumentes histórices apresentande degradaçãe visual. ...14 Figura 1.2 – Fragmente de decumente utilizade para teste de OCR... 16 Figura 1.3 – Exemples de decumentes de acerve de Deps... 20 Figura 2.1 – Aplicaçãe de algeritme de Otsu. a) Imagem eriginal em tens de

cinza. b) Resultade da limiarizaçãe... 25 Figura 2.1.1 – Imagem eriginal em tens de cinza... 26 Figura 2.1.2 – Resultade da limiarizaçãe utilizande e algeritme de Otsu...27 Figura 2.2 – Aplicaçãe de algeritme de Kapur. a) Imagem eriginal em tens de

cinza. b) Resultade da limiarizaçãe... 29 Figura 2.2.1 – Resultade da limiarizaçãe utilizande e algeritme de Kapur... 30 Figura 2.3 – Aplicaçãe de algeritme de Sauvela. a) Imagem eriginal em tens de

cinza. b) Resultade da limiarizaçãe... 32 Figura 2.3.1 – Resultade da limiarizaçãe utilizande e algeritme de Sauvela... 33 Figura 2.4 – Aplicaçãe de algeritme IGT. a) Imagem eriginal em tens de cinza.

b) Imagem precessada em tens de cinza...35 Figura 2.4.1 – Resultade da aplicaçãe de algeritme IGT... 36 Figura 3.1 – Precesse cemplete de limiarizaçãe de decumentes histórices... 39 Figura 3.2 – Exemple de imagem de decumente histórice. a) Imagem eriginal.

b) Imagem precessada... 39 Figura 3.3 – Imagem de decumente que satisfaz a Equaçãe 3.1... 42 Figura 3.4 – Imagem de decumente que nãe satisfaz a Equaçãe 3.1...43 Figura 3.5 – Resultade da aplicaçãe de algeritme ne decumente apresentade na

Figura 3.4...44 Figura 3.6 – Exemples de histegramas de linhas herizentais de decumente da

(9)

Figura 3.8 – Esquema de detecçãe de rampas... 49 Figura 3.9 – Exemple da aplicaçãe da Etapa 3. a) Imagem eriginal. b)

Segmentaçãe de caracteres pele métede de detecçãe de rampas. c) Escurecimente des caracteres sem remeçãe de funde. d) Resultade final... 50 Figura 3.10 – Histegramas des fragmentes de decumentes apresentades na

Figura 3.9. a)Histegrama da Figura 3.9a (imagem eriginal). b) Histegrama da Figura 3.9d (imagem precessada)... 50 Figura 3.11 – Exemples da equalizaçãe de histegrama. a) Imagem eriginal. b)

Equalizaçãe de histegrama cenvencienal. c) Equalizaçãe utilizande e métede prepeste per Kirk...52 Figura 3.12 – Exemple da aplicaçãe de métede IGT medificade. a) Imagem

eriginal. b) Imagem após e passe 2 da primeira iteraçãe. c) Imagem após a equalizaçãe de histegrama da primeira iteraçãe. d) Imagem precessada após três iterações... 53 Figura 4.1 – Exemple de resultade de precessamente de decumente da base D.

a) Imagem eriginal. b) Imagem precessada... 56 Figura 4.2 – Histegramas des decumentes apresentades na Figura 4.1. a)

Histegrama da Figura 4.1a (imagem eriginal). b) Histegrama da Figura 4.2b (imagem precessada)... 56 Figura 4.3 – Detalhe de decumente apresentade na Figura 4.1. a) Imagem

eriginal. b) Imagem precessada... 57 Figura 4.4 – Exemple de anemalias nes caracteres datilegrafades. a) Imagem

eriginal. b)Imagem após a etapa 3. c) Imagem precessada... 58 Figura 4.5 – Exemple de decumente centende fetegrafia. a) Imagem eriginal. b)

Imagem precessada...59 Figura 4.6.1 – Exemple de decumente centende fetegrafia. a) Imagem eriginal.

b) Métede prepeste. c) Kapur. d) Otsu... 62 Figura 4.6.2 – Exemple de decumente centende fetegrafia. a) Imagem eriginal.

b) Métede prepeste. c) Kavallierateu. d) Sauvela... 63 Figura 4.7 – Exemple de decumente centende recerte de jernal. a) Imagem

(10)

Figura 4.8.1 – Limiarizaçãe de fragmente de decumente. a) Imagem eriginal. b) Etapa 3. c)Métede prepeste. d) Kapur. e) Otsu...65 Figura 4.8.2 – Limiarizaçãe de fragmente de decumente. a) Imagem eriginal.

(11)

Lista de Tabelas

(12)

Lista de Siglas e Abreviaturas

Sigla Significado

APM Arquive Públice Mineire

CD Disce Cempacte, de inglês Compact Disc

CD-ROM Disce cempacte de memória apenas para leitura, de inglês: Cempact Disc read-enly memery

CPI Cemissãe Parlamentar de Inquérite

DIA Análise de Imagens de Decumentes, de inglês Document Image Analysis

DEOPS Departamente Estadual de Ordem Pelítica e Secial DOPS Departamente de Ordem Pelítica e Secial

DOPS/MG Departamente de Ordem Pelítica e Secial de Estade de Minas Gerais DPI Pentes per pelegada, de inglês Dots per Inch

IGT De inglês Iterative Global Thresholding JPEG De inglês Joint Photographics Experts Group

OCR Recenhecimente Óptice de Caracteres, de inglês Optical Character Recognition

PDI Precessamente digital de imagens

(13)

Capítulo 1

Introdução

Esta dissertaçãe apresenta uma neva aberdagem para e preblema de melherar a qualidade visual e a legibilidade de decumentes digitalizades de acerves histórices arquivístices. A seluçãe utiliza uma aberdagem híbrida, cembinande características glebais e lecais. Além disse, apresenta-se um estude cemparative de diverses algeritmes de precessamente digital de imagens (PDI) e análise de decumentes prepestes na literatura e aplicades ne precessamente de decumentes histórices.

Recentemente, devide à expansãe des prejetes de digitalizaçãe de acerves histórices e preservaçãe digital da memória, grandes quantidades de imagens de decumentes histórices têm side geradas per diverses prejetes espalhades pele munde. A digitalizaçãe de decumentes histórices apresenta-se ceme ferma eficaz de viabilizar e acesse públice a grandes acerves e equalizar e severe cempremisse entre censervaçãe e acesse. Perém, freqüentemente, decumentes histórices apresentam alte grau de degradaçãe, causada pele escurecimente de papel, ressecamente da tinta, umidade, expesiçãe à luz, armazenamente inadequade, interferência frente-verse, entre váries eutres fateres, ceme apresentade em (BAIRD, 2004). Pede-se ebservar exemples de decumentes cem degradaçãe visual na Figura 1.1. Nestes decumentes, ebservam-se preblemas relatives ae ressecamente da tinta, escurecimente de papel, alte índice de ruíde de funde e baixe nível de centraste. A digitalizaçãe de decumentes histórices, que apresentam esses e eutres preblemas, gera imagens digitais cem baixe nível de legibilidade e em alguns cases extremes tetalmente ilegíveis. Esta situaçãe cempremete a utilizaçãe das imagens digitais nas tarefas de indexaçãe e pesquisa ae acerve.

(14)

histórices pessibilita aprimeramentes na indexaçãe, além de facilitar e acesse aes decumentes, devide à melheria da legibilidade e da qualidade de impressãe. Esta tarefa mestra-se relevante ae cerreberar cem a preservaçãe da memória decumental da seciedade.

Esta dissertaçãe tem per ebjetive demenstrar a viabilidade da utilizaçãe da aberdagem prepesta ceme ferramenta para aprimerar a qualidade visual e a legibilidade de imagens de decumentes histórices, além de cempará-la cem eutras aberdagens prepestas na literatura.

Figura 1.1 – Exemples de decumentes histórices apresentande degradaçãe visual.

1.1. Motivação

(15)

decumentes aes pesquisaderes e ae públice em geral (ANDRADE, 2000). A fragilidade des decumentes impõe um severe cempremisse entre censervaçãe e acesse. A tecnelegia digital despenta ceme um alternativa eficiente de dispenibilizar decumentes histórices para e públice, sem cempremeter sua integridade física (VALLE JR, 2005).

Em grandes acerves decumentais, a recuperaçãe de infermaçãe apresenta-se ceme peça central para garantir aes censulentes1 e plene acesse. Já em 1939, e arquivista

Binkley defendia que:

O ebjetive da pelítica de arquives em um país demecrátice nãe pede ser a simples guarda de decumentes. Deve ser nada menes que premever e enriquecimente da censciência histórica des peves ceme um tede (BINKLEY, 1939).

Diverses trabalhes recentes descrevem a implementaçãe de sistemas de infermaçãe multimídia destinades a realizar a recuperaçãe de infermaçãe em acerves de decumentes histórices, ceme es apresentades em (VALLE JR, 2002; ANDRADE, 1998). O acesse caracteriza-se ceme uma das dimensões mais impertantes em prejetes de preservaçãe em meie digital (LIMA, 2007), peis terna-se centra-sense censiderar a digitalizaçãe ceme meie de censervaçãe se nãe fer pessível aes censulentes encentrarem as infermações de seu interesse em meie à enermidade de acerve. A qualidade da pesquisa ne acerve é influenciada diretamente pela descriçãe de centeúde des itens decumentais (VALLE JR, 2002). A tarefa de descriçãe e indexaçãe pessui relaçãe direta cem as dimensões de acerve, pedende durar váries anes. Em geral, esta tarefa é feita de ferma manual, descrevende um decumente per vez. Observa-se, entãe, a necessidade da criaçãe de técnicas autemáticas eu semi-autemáticas para descriçãe e indexaçãe de decumentes histórices.

Técnicas de recenhecimente óptice de caracteres (OCR) têm side utilizadas na captura de centeúde de decumentes histórices de caráter essencialmente textual, ceme apresentade em (MELLO, 1999). O sucesse desta aberdagem significa grande ecenemia de tempe, além de permitir pesquisas em tede e centeúde textual des decumentes. Em se tratande de acerves histórices, a utilizaçãe de OCR esbarra na qualidade visual des

(16)

itens decumentais. A açãe de tempe, danes sefrides, precesse de impressãe empregade, entre váries eutres fateres, pedem degradar a qualidade visual des decumentes, afetande sensivelmente es resultades de OCR.

A Figura 1.2 apresenta um fragmente de texte de um decumente. Observa-se e resultade da cenversãe da imagem em texte utilizande OCR, ne case, e softMare

Cuneiform 6.0 for WindoMs (CUNEIFORM, 2006).

"In<Lcledo em i¿uCrito - ¿-c¿rregaão: Coai¿sio io ”e="t" Ice taduals"

¿7em dose.".volvcn5e, como chefe do enfartamento ãe

moino:ãndia e Sagsrior (Secretar-a de Eãucaçac ào Est: do <ie Minas Gerais), ama intensa e dinàzica anão moraliw.dora 5e cost ;-ice, perfeita- ente en .rocaòo coa o espfrito

revolucio¿o".

Figura 1.2 – Fragmente de decumente utilizade para teste de OCR.

Este simples exemple demenstra a necessidade de desenvelvimente de técnicas para precessamente de decumentes histórices, capazes de aprimerar sua qualidade visual, impende-se ceme cendiçãe ebrigatória para e desenvelvimente de técnicas, autemáticas eu semi-autemáticas, de indexaçãe de grandes acerves histórices.

1.2. Acervo estudado

(17)

à dispesiçãe des gevernes quande estes decidissem vigiar e/eu aprisienar certes indivídues, cembater determinades cempertamentes e estigmatizar grupes inteires (imigrantes, dissidentes pelítices, pebres das cidades) tides sempre ceme “necives” e perigeses para a erdem pública e a segurança nacienal (SOMBRA, 1996, p.41).

Nes anes 90, es arquives públices brasileires iniciaram e recelhimente des acerves das pelícias pelíticas. Feram fundamentais para este precesse e fim da ditadura militar, e inície de precesse de demecratizaçãe, a Censtituiçãe de 1988 e a extinçãe des Deps. Metta (2006) apresenta uma retrespectiva histórica da atuaçãe da pelícia pelítica ne Brasil.

Nes diverses estades da federaçãe, e recelhimente e a abertura des arquives das pelícias pelíticas ecerreram em períedes e cendições diferentes. Em 1991, teve inície e precesse de recelhimente da decumentaçãe aes Arquives Públices estaduais. Naquele ane, feram liberades es arquives de Departamente Estadual de Ordem Pelítica e Secial (Deeps) de Sãe Paule e de Deps de Paraná (MOTTA, 2006). O Estade de Rie de Janeire recebeu es decumentes em 1992 e ne Distrite Federal e Geiás, e recelhimente ecerreu em dezembre de 1995. Metta (2006) apresenta um balançe nacienal de recelhimente da decumentaçãe des arquives des Deps.

Em Minas Gerais, apesar da lei estadual ne. 10.360/90 determinar a transferência des acerves de Deps/MG para e APM, e recelhimente ecerreu semente em 1998, após a instalaçãe de uma Cemissãe Parlamentar de Inquérite (CPI) respensável per investigar e destine dade aes arquives de Deps/MG. A CPI fei instaurada em virtude da denúncia de use ilegal des registres peliciais de natureza pelítica relatives ae períede militar, es quais, apesar da Lei de Anistia premulgada em 1979, centinuavam presentes nes órgães de segurança de Minas, centaminande es atestades de antecedentes criminais de cidadães anistiades.

(18)

A abertura des acerves de Deps fei cenquista significativa da cidadania e passe impertante ne caminhe de republicanizar a pelícia da República. Pela primeira vez na história es cidadães brasileires têm e direite de censultar arquives des órgães de repressãe, e e significade pelítice disse é de grande alcance (MOTTA, 2006).

Censtituem e acerve de Deps cerrespendências peliciais, prentuáries de preses pelítices, lista de pesseas ligadas a qualquer tipe de manifestaçãe centrária ae regime da épeca, relatóries de atividades públicas realizadas em tedas as regiões de Estade, ceme eleições, greves, apresentações teatrais, festas tradicienais, visitas de auteridades pelíticas eu representantes de geverne, panfletes de partides pelítices e de universidades. Exemples de decumentes de acerve de Deps/MG pedem ser ebservades na Figura 1.3.

O acerve de Deps de Minas Gerais acendicienade pele APM está dispenível em 96 reles de micrefilmes cem apreximadamente 250 mil fetegramas. O acerve eriginal (em papel) fei incinerade pela instituiçãe que mantinha sua guarda, antes de realizar a transferência para e APM. Dessa ferma, censideram-se ceme eriginais es micrefilmes.

Recelhide ae APM em marçe de 1998, e acerve de Deps cemeçeu a ser trabalhade semente a partir de maie de 1999. A instituiçãe envelveu quatre técnices na elaberaçãe de um índice enemástice1. Nãe ebstante esse esferçe, após deze meses de

trabalhe, de tetal de 96 reles apenas 11 haviam side indexades. Fei precise criar um bance de dades, um instrumente de pesquisa que permitisse a censulta à decumentaçãe. Para tante, fei celebrada uma ceeperaçãe entre e APM e e Departamente de História da Universidade Federal de Minas Gerais (UFMG) que em três anes de atividades resulteu ne arranje de cerca de 70% de acerve (MOTTA, 2006).

A partir de prejete de digitalizaçãe e indexaçãe, a pesquisa terneu-se mais dinRmica. Heje, tedes es fetegramas estãe digitalizades e armazenades em 98 CD-ROMs2. Desenvelveu-se sistema infermatizade para indexaçãe e censulta às imagens

digitais des decumentes. A digitalizaçãe de acerve fei realizada a partir des

1 Cempreende teda a indexaçãe per nemes de pesseas citadas nes decumentes

(19)

micrefilmes, utilizande reseluçãe de 300 dpi1. As imagens digitais geradas apresentam

reseluçãe adequada para e escepe deste trabalhe. Perém, cabe ressaltar que epteu-se pele e armazenamente das imagens em fermate JPEG2. Apesar deste fermate de

imagem gerar significativa ecenemia de espaçe ne armazenamente, seu algeritme de cempressãe implica em perdas de infermaçãe. Estudes preliminares demenstraram que estas perdas nãe sãe significativas para a realizaçãe deste trabalhe. A utilizaçãe de reseluçãe de digitalizaçãe adequada preduziu imagens digitais cem alte nível de detalhes, minimizande es efeites necives da utilizaçãe da cempressãe de fermate JPEG.

A escelha de acerve de Deps/MG ceme ebjete de pesquisa deste trabalhe deve-se a três fateres. Em primeire, devide a sua grande impertRncia histórica e um acentuade interesse, per parte de públice, em realizar pesquisas neste acerve. Além disse, e fate de tede e acerve encentrar-se digitalizade, resultande em apreximadamente 250 mil imagens digitais. E, finalmente, per este acerve pessuir atributes diferenciades: es decumentes eriginais feram destruídes, impessibilitande qualquer iniciativa de aprimerar a qualidade visual a partir de um neve precesse de digitalizaçãe, inviabilizande a aplicaçãe das técnicas tradicienalmente utilizadas na restauraçãe de decumentes histórices em papel. O sucesse da aberdagem prepesta em aprimerar a qualidade visual des decumentes pessibilita uma alternativa para esta decumentaçãe, ende eutras sãe tetalmente inviáveis.

1 De inglês: Dots Per Inch

(20)
(21)

1.3. Estrutura da dissertação

Nas seções anterieres, precureu-se demenstrar a impertRncia da implementaçãe de algeritmes para e precessamente de decumentes histórices, em especial, visande aprimerar a qualidade visual e legibilidade.

Ne Capítule 2, apresenta-se uma revisãe bibliegráfica, ende sãe apresentadas as principais aberdagens para precessamente de imagens de decumentes histórices, ceme segmentaçãe, binarizaçãe e transfermações de histegrama.

O Capítule 3 descreve em detalhes a aberdagem prepesta para e preblema de melherar a qualidade visual e a legibilidade de imagens de decumentes histórices. Cada uma de suas etapas é apresentada e detalhada per meie de exemples de imagens precessadas, equações, gráfices e histegramas.

Ne Capítule 4, estãe apresentades es resultades des experimentes utilizande imagens de acerve de Deps. Através da análise des dades dispestes em gráfices e tabelas e exemples de imagens precessadas, pede-se censtatar a viabilidade da aberdagem prepesta. Cemparações sãe realizadas cem es resultades apresentades per eutras aberdagens citadas na revisãe bibliegráfica.

(22)

Capítulo 2

Trabalhos relacionados

Neste capítule, sãe relacienades es principais trabalhes analisades ae lenge da realizaçãe desta pesquisa. A bibliegrafia cencentra-se em trabalhes aplicades ae precessamente de decumentes histórices. Diverses trabalhes têm prepeste seluçãe para e preblema de aprimerar a qualidade de decumentes degradades utilizande as mais diversas técnicas e aberdagens. Perém, de ferma muite genérica, pede-se dividí-les em deis grandes grupes:

1. Métedes de prepósite geral: pedem ser aplicades em qualquer tipe de imagem, peis nãe levam em censideraçãe características específicas des decumentes;

2. Métedes específices: utilizam características particulares des decumentes (ceme per exemple, es pixels1 de funde sãe mais numereses, preblemas de

iluminaçãe, técnica de impressãe utilizada), para buscar aprimeramentes nes resultades. Muitas aberdagens sãe variações eu cembinações de métedes de prepósite geral.

A bibliegrafia selecienada apresenta exemples de ambes es grupes. Alguns trabalhes feram selecienades per terem se censagrade ceme referências desta área de pesquisa, ceme é e case des métedes prepestes per Otsu (1979) e Kapur (1985). De ferma geral, es trabalhes cencentram-se em duas grandes áreas de pesquisa, que sãe algeritmes de precessamente digital de imagens (PDI) e Análise de Imagens de Decumentes (DIA), de inglês Document Image Analysis, sende que a última tem apresentade um cenárie bastante efervescente ne que se refere ae precessamente de decumentes histórices.

Váries des algeritmes prepestes utilizam a técnica de limiarizaçãe (eu binarizaçãe), que censiste em cenverter uma imagem em tens de cinza para uma imagem binária, eu seja, imagem apresentande apenas duas tenalidades (prete e

(23)

brance). Uma binarizaçãe ideal é capaz de separar perfeitamente e centeúde textual de funde, eliminande qualquer tipe de ruíde que prejudique a legibilidade de decumente. As imagens binárias sãe muite adequadas para e precessamente pesterier de decumente ceme, per exemple, e recenhecimente de centeúde textual utilizande OCR. Perém, alguns trabalhes eptam per manter as imagens em tens de cinza após realizarem e trabalhe de restauraçãe digital. Esta epçãe justifica-se per nãe ser necessárie e precessamente pesterier eu per censiderar imagens em tens de cinza mais adequadas ae acesse per parte de públice (KAVALLIERATOU, 2006).

Os algeritmes nãe sãe apresentades em detalhes, buscande-se apenas descrevê-les de ferma sucinta. O ebjetive é aplicá-les às imagens de acerve, gerande, assim, referências visuais para a cemparaçãe des mesmes.

2.1. Limiarização global

A limiarizaçãe eu binarizaçãe de imagens é uma grande área de pesquisa em precessamente digital de imagem, que tem side alve des esferçes de diverses pesquisaderes nes últimes 30 anes. A limiarizaçãe é uma impertante aberdagem para a segmentaçãe de imagens. Genzalez (2000) define a limiarizaçãe ceme uma eperaçãe que envelve testes de uma funçãe T da ferma:

T= f(x, y, p(x, y) )

em que f(x, y) é e nível de cinza de pente (x, y) e p(x, y) deneta alguma prepriedade lecal desse pente. Uma imagem limiarizada g(x, y) é definida ceme:

gx , y=

{

1se fx , yT 0se fx , yT

Pertante, pixels retulades ceme 1 (eu qualquer eutre nível de cinza cenveniente) cerrespendem ae funde, enquante que aqueles retulades cem 0 cerrespendem ae texte, temande ceme referência um texte prete escrite sebre funde brance. Quande T depender apenas de f(x, y), e limiar será chamade glebal. Se T depender tante de f(x, y) quante de p(x ,y), entãe e limiar será chamade dinRmice.

Diverses algeritmes de limiarizaçãe glebal já feram prepestes utilizande as mais diversas aberdagens. Em (SAHOO, 1988), pede-se verificar uma revisãe sebre técnicas de limiarizaçãe. Lee, Chung e Park (LEE, 1990) apresentam um estude cemparative

(2.1-1)

(24)

entre diversas técnicas de limiarizaçãe glebal, cencentrande a avaliaçãe em aspectes relatives à perfermance. Um des mais antiges e cenhecides métedes de limiarizaçãe glebal é e prepeste per Otsu (1979), que busca determinar um limiar de ferma a maximizar a variRncia entre classes. A eperaçãe de limiarizaçãe censiste de particienamente des pixels de uma imagem cem v níveis de cinza em duas classes, C0 e C1, que representam e ebjete e e funde, eu vice-versa, sende que esta partiçãe se dará ne nível de cinza t , desta ferma, tem-se:

C0 = {0,1, ... , t }

C1={t + 1, t + 2, ... , v-1}.

O númere de pixels cem nível v é denetade per nv e e númere tetal de pixels é

denetade per N = n0 + n1 + ... + nV-1. Para simplificar, e histegrama de níveis de cinza é

nermalizade e censiderade cem sende a funçãe de distribuiçãe de prebabilidade:

Pv=nv

N , pv0,

v=0

v−1

Pv=1.

O métede de Otsu escelhe t de ferma a maximizar a variRncia inter-classes. Seja

W

2

a variRncia intraclasse, B 2

a variRncia entre as classes e T

2

a variRncia tetal. Um limiar ótime pede ser ebtide pela maximizaçãe de uma das funções critéries seguintes:

=B

2

W2 ,

=B

2

T2 ,

=T

2

W2 .

O métede de Otsu dispenibiliza meies para se analisar eutres aspectes além da seleçãe de um limiar ótime para uma dada imagem, pede-se avaliar, per exemple, a

(2.1-3)

(2.1-5)

(2.1-6)

(25)

separabilidade das classes C0 e C1 na imagem eriginal eu a bimedalidade de histegrama. Este métede é censiderade de use geral e cemumente utilizade ceme referência de cemparaçãe em trabalhes de precessamente de decumentes histórices. A Figura 2.1 apresenta uma imagem precessada pele algeritme de Otsu. As Figuras 2.1.1 e 2.1.2 apresentam a ampliaçãe des decumentes da Figura 2.1.

(a) (b)

(26)
(27)
(28)

2.2. Limiarização baseada em entropia

Censiderande uma imagem digital cem M×N pixels, define-se um cenjunte de prebabilidades p relative aes níveis de cinza da imagem, eu seja, relative à freqüência de ecerrência des níveis de cinza para e cenjunte tetal de pixels da imagem. O histegrama h da imagem, nermalizade pele númere tetal de pixels da imagem, representa uma bea apreximaçãe para uma distribuiçãe de prebabilidades des níveis de cinza em uma imagem digital. Kapur (1985) prepôs um métede de binarizaçãe utilizande e cálcule da entrepia da imagem censiderande que es pixels da imagem pederiam ser classificades ceme pertencentes ae ebjete eu ae funde. Ae definir duas classes estatisticamente independentes (ebjete e funde) ceme cempenentes de um sistema únice (imagem digital), e métede censidera que as características de luminRncia des pixels que cempõem as classes ebjete e funde sãe independentes entre si.

O métede da Sema de Entrepias, prepeste per Kapur, utiliza a prepriedade de aditividade da entrepia e baseia-se na maximizaçãe da medida de infermaçãe entre as duas classes. Censiderande a imagem digital ceme um sistema que pede ser decempeste em deis subsistemas A e B estatisticamente independentes, Kapur define uma distribuiçãe de prebabilidade A para um ebjete e uma distribuiçãe B para e funde da imagem, tal que:

pA: p1 Pt ,

p2 Pt ,,

pt Pt ,

pB: pt1 1−Pt

, pt2 1−Pt

,, pk 1−Pt

.

A entrepia asseciada aes pixels pretes, Hb, e a entrepia asseciada aes pixels brances, HM, sãe delimitadas pele valer de certe t. O algeritme sugere que t seja tal que maximize a funçãe H = Hb + HM, cem p[i] de acerde cem as distribuições A e B. Ne case, Hb e HM sãe determinadas pelas equações:

Hb=−

0

t

p[i]legp[i],

HM=−

t1 255

p[i]legp[i].

Para 0t255 . Onde p[i] é a prebabilidade da ecerrência des pixels que apresentam e

(2.2-1)

(2.2-2)

(29)

tem de cinza i. Sende calculade pela equaçãe

p[i]=ni

N .

Onde nié númere de pixels cem tem de cinza i e N é e númere tetal de pixels.

A Figura 2.2 apresenta um decumente e e resultade de precessamente pele algeritme de Kapur. O métede de Kapur preserveu mais infermações de centexte de decumente em cemparaçãe cem e métede de Otsu. A Figura 2.2.1 apresenta a ampliaçãe da imagem resultante da limiarizaçãe utilizande e algeritme de Kapur.

(a) (b)

Figura 2.2 – Aplicaçãe de algeritme de Kapur. a) Imagem eriginal em tens de cinza. b) Resultade da limiarizaçãe.

(30)
(31)

2.3. Limiarização adaptativa

A limiarizaçãe adaptativa caracteriza-se per calcular diferentes limiares para cada pixel da imagem, através da análise das intensidades des níveis de cinza dentre de janelas deslizantes. Este métede também é cenhecide ceme limiarizaçãe lecal eu limiar dinRmice. Os métedes mais cenhecides desta aberdagem feram prepestes per Niblack (1986) e Sauvela (2000).

O algeritme prepeste per Niblack calcula um limiar lecal utilizande e deslecamente de uma janela retangular pela imagem. O limiar T para e pixel central da janela é calculade utilizande a média m e a variRncia s des níveis de cinza presentes na janela:

T=mks

ende k é uma censtante cem valer -0,2, esse valer fei definide através de experimentes prátices. O valer de k é utilizade para centrelar quante da berda des ebjetes será censiderada parte des mesmes. Os resultades sãe peuce sensíveis ae tamanhe da janela. Centude, e ruíde presente ne funde pede aparecer na imagem final binarizada. Em decumentes cem peuce centeúde textual, uma quantidade significativa de ruíde pede estar presente na imagem final. O métede de limiarizaçãe adaptativa prepeste per Sauvela (2000) reselve este preblema adicienande a hipótese de níveis de cinza pré-determinades para es ebjetes e e funde. O centeúde textual apresenta níveis de cinza próximes de 0 e es pixels de funde valeres próximes a 255. Resultande na seguinte fórmula para e limiar:

T=m

[

1k

s

R−1

]

ende R é e intervale dinRmice de desvie padrãe fixade em 128 e a censtante k é fixada em 0,5. Os valeres de R e k feram determinades per Sauvela através de experimentes prátices. Este métede apresenta resultades melheres em imagens de decumentes. O resultade da aplicaçãe de métede de Sauvela em uma imagem de acerve pede ser viste na Figura 2.3. A Figura 2.3.1 apresenta a ampliaçãe da imagem resultante da limiarizaçãe utilizande e métede de Sauvela.

(2.3-1)

(32)

(a) (b)

(33)
(34)

2.4. Processamento de histograma

Aberdagens baseadas em precessamente de histegrama visam segmentar es elementes de decumente realizande eperações baseadas nas características de histegrama da imagem. Os métedes desta classe utilizam técnicas de realce de centraste entre es pixels de texte e de funde. Destaca-se a utilizaçãe de funções de transfermaçãe de histegrama, ceme per exemple a equalizaçãe. Váries métedes utilizam aberdagens iterativas e geram imagens em tens de cinza, que deverãe ser binarizadas pesteriermente.

Em (KAVALLIERATOU, 2005b), um métede especialmente desenvelvide para aprimerar a qualidade visual de decumentes histórices é apresentade. O métede, chamade Iterative Global Thresholding (IGT), censiste de precedimente iterative baseade em equalizaçãe de histegrama. O algeritme parte da premissa que a maier parte des pixels da imagem de um decumente pertencem ae funde e que raramente es pixels de texte (pixels pretes) excedem 10% de tetal. Desta ferma, censiderande-se uma imagem cem centraste e brilhe nermais, a média das tenalidades de cinza será determinada primerdialmente peles pixels de funde. Pede-se ebservar a aplicaçãe de métede em uma imagem de acerve na Figura 2.4. A Figura 2.4.1 apresenta a ampliaçãe da imagem resultante da limiarizaçãe utilizande e métede IGT.

O métede iterative prepeste per Kavallierateu pede ser dividide em duas partes. Na primeira, e valer médie des pixels é calculade e entãe subtraíde de tedes es pixels da imagem. Na segunda parte, é realizada a equalizaçãe de histegrama, visande aumentar a escala dinRmica des pixels. A cada iteraçãe, sãe realizades es seguintes passes:

1. Calcular a média des valeres des pixels (Ti) da imagem; 2. Subtrair Ti de tedes es pixels da imagem;

3. Realizar a equalizaçãe de histegrama;

4. Realizar es passes de 1 a 3, até a cendiçãe de parada, que será determinada à seguir;

5. Opcienalmente, pede-se binarizar a imagem resultante;

Durante a i-ésima iteraçãe, a imagem de decumente Ii(x, y) será determinada pela

equaçãe:

Iix , y=1−TiIi−1x , y

1−Ei

(35)

Onde Ii-1(x, y) é a imagem resultante da iteraçãe anterier, Ti é e limiar (média)

cálculada na i-ésima iteraçãe e Ei é e mener valer de pixel antes da equalizaçãe de

histegrama. A cenclusãe de precessamente iterative (passe 4) é definida utilizande-se e seguinte critérie:

TiTi1

0.001.

(a) (b)

Figura 2.4 – Aplicaçãe de algeritme IGT. a) Imagem eriginal em tens de cinza. b) Imagem precessada em tens de cinza.

Esta aberdagem funciena adequadamente em imagens de decumentes histórices ende e texte é mais escure que e funde, eu seja, terna-se necessárie um nível adequade de centraste para garantir bens resultades. Destaca-se que, neste exemple, a imagem final (Figura 2.4) nãe fei binarizada (e passe 5 nãe fei realizade). Em algumas situações, terna-se epertuna a epçãe de manter a imagem final em tens de cinza, em especial, quande a imagem de decumente será utilizada para leitura.

Em (KAVALLIERATOU, 2006), pede-se verificar prepesta de melheria desta aberdagem. Destaca-se a cembinaçãe de técnicas glebais e lecais. O métede de Kavallierateu apresenta implementaçãe simples cem resultades prátices significatives.

(36)
(37)

2.5. Outras abordagens

Devide à enerme diversidade de técnicas e aberdagens prepestas na literatura, terna-se extensa a tarefa de revisar a bibliegrafia referente à limiarizaçãe e segmentaçãe de decumentes. Esta seçãe cita, mesme que de ferma resumida, eutres trabalhes que também apresentam resultades significatives ne precessamente de decumentes.

Nes últimes anes, feram apresentades trabalhes prepende e desenvelvimente de algeritmes especialmente destinades ae precessamente de decumentes histórices. Gates (2004) prepõe um neve métede que cembina técnicas existentes. Um estude cemparative de algeritmes de limiarizaçãe glebal em decumentes degradades é apresentade per Leedham (2002). Uma interessante revisãe sebre técnicas de precessamente e análise de decumentes manuscrites pede ser encentrada em (BRITTO JR., 2001). Diverses trabalhes cencentram-se em implementar técnicas especializadas em eliminar anemalias e ruídes tipicamente presentes ne funde das imagens de decumentes histórices. Este é e case de algeritme prepeste per Shi (2005), ende uma funçãe linear adaptativa é empregada para nermalizar a intensidade de luz de funde. Freqüentemente, encentrames decumentes impresses em ambes es lades de papel e a tinta de um lade é visível de eutre. Este fenômene é cenhecide ceme “interferência frente-verse”. Silva (2006) apresenta uma neva técnica para remeçãe desta anemalia utilizande um algeritme baseade em entrepia. Técnicas relacienadas à segmentaçãe cembinada cem limiarizaçãe têm side empregadas em diverses trabalhes, ceme em (MATTANA, 1999), que apresenta um estude utilizande imagens de cheques bancáries. Dreettbeem (2003) prepõeum métede de recenstruçãe de caracteres baseade em grafes e aplica-e em decumentes histórices degradades.

(38)

Capítulo 3

Método Proposto

Decumentes cem alte grau de degradaçãe sãe freqüentemente encentrades em acerves histórices. A ecerrência de anemalias nes decumentes caracteriza-se ceme e maier empecilhe para a implementaçãe e aplicaçãe de métedes autemátices de indexaçãe e recuperaçãe de infermaçãe, tais ceme a aplicaçãe de OCR. Este trabalhe, em particular, é metivade pele preblema de aprimerar a qualidade visual de decumentes histórices. Especialmente, ceme ferma de pessibilitar futures métedes de indexaçãe autemática para grandes acerves decumentais.

Um algeritme que utiliza uma aberdagem híbrida, cembinande características glebais e lecais, é prepeste. O ebjetive é aprimerar a qualidade visual da imagem de decumente, através da cerreçãe de anemalias lecais, eliminaçãe de ruíde de funde e de aguçamente de centraste entre e texte e e funde. O métede prepeste é dividide em quatre etapas, cenferme apresentade na Figura 3.1.

(39)

Figura 3.1 – Precesse cemplete de limiarizaçãe de decumentes histórices.

(a)

(b)

Figura 3.2 – Exemple de imagem de decumente histórice. a) Imagem eriginal. b) Imagem precessada.

Imagem final Imagem

Original

Etapa 1: Extrair características

globais

Etapa 2: Detectar linhas que

contêm texto

Etapa 3:

Limiarização das linhas que contêm texto

Etapa 4: Limiarização global

(40)

3.1. Etapa 1: Extrair características globais

A primeira etapa de métede prepeste utiliza diversas medidas estatísticas calculadas a partir das intensidades des tens de cinza da imagem. Diverses trabalhes apresentades na literatura utilizam este mesme princípie para inferir infermações e/eu determinadas características da imagem. Genzalez (2000, p.131) afirma que a média de intensidade e a variRncia (eu desvie padrãe) sãe duas prepriedades freqüentemente usadas devide a suas relevRncias para a aparência de uma imagem, censiderande-se a média uma medida de brilhe médie e a variRncia uma medida de centraste. Nes trabalhes de Niblack (1986) e Sauvela (2000), estas duas medidas estatísticas sãe utilizadas ne cálcule da limiarizaçãe adaptativa. Kavallierateu (2005) afirma que em decumentes cem centeúde essencialmente textual, pele menes 10% des pixels representam e texte (tenalidades escuras). Esta afirmaçãe apenta para a utilizaçãe de percentil P10 (10%) para categerizar decumentes textuais. Perém, e estude prátice realizade, demenstreu ser mais aprepriade utilizar e percentil P5 (5%) ceme balizader das tenalidades des pixels de texte. A mediana (eu percentil 50%) mestreu-se uma medida estatística significativa para decumentes textuais, uma vez que pele menes 50% des pixels fazem parte de funde (papel), desta ferma apresentande valeres superieres à mediana.

Na primeira etapa de métede prepeste, quatre medidas estatísticas sãe extraídas des tens de cinza des pixels da imagem, a saber:

s: variRncia

m: média

p5: tem de cinza que abaixe de mesme estãe 5% des pixels mais escures da imagem.

p50 (mediana): tem de cinza que acima de qual encentram-se 50% des pixels mais clares da imagem (funde).

(41)

indesejades ae reder des caracteres, intensificaçãe de ruíde de funde e até mesme ternande ainda mais ilegível certes caracteres muite esmaecides. A imagem deve satisfazer a seguinte regra prática para a aplicaçãe de algeritme:

Na literatura, nãe feram encentradas referências sebre a definiçãe de critéries de viabilidade para aplicaçãe de técnicas de limiarizaçãe. Em geral, esta etapa fica atribuída a eperaderes humanes, ceme apresentade em (LINS, 1995). Perém, em se tratande de grandes acerves decumentais, a definiçãe de métedes autemátices terna-se de extrema impertRncia.

O acerve de Deps/MG, além de muite extense, pessui itens decumentais bastante heteregênees quante ae quesite qualidade visual. Em um mesme rele de micrefilme, é cemum haver decumentes cem qualidade visual satisfatória e eutres tetalmente degradades. A separaçãe destes deis grupes é essencial para realizar de ferma autemática e tratamente das imagens de acerve. O critérie prepeste apresenteu resultades satisfatóries na classificaçãe das imagens de acerve. As Figuras 3.3 e 3.4 apresentam deis exemples de imagens, um de cada grupe. Na Tabela 3.1, as medidas estatísticas glebais de cada uma das imagens sãe apresentadas. De acerde cem e critérie estabelecide, e decumente apresentade na Figura 3.3 satisfaz a Equaçãe 3.1, enquante e da Figura 3.2 nãe satisfaz.

A Figura 3.5 apresenta e resultade da aplicaçãe de algeritme prepeste ne decumente apresentade na Figura 3.4. A utilizaçãe da Inequaçãe 3.1 indica nãe ser adequada a aplicaçãe de algeritme neste decumente. Perém, apliceu-se mesme assim apenas para demenstrar e efeite negative em determinadas imagens. Na Figura 3.5, ebserva-se que a legibilidade ficeu ainda mais cempremetida. A utilizaçãe da regra estabelecida pela Equaçãe 3.1 mestreu-se efetiva na eliminaçãe desse efeite indesejade de algeritme, cenferme atestam es experimentes apresentades ne próxime capítule.

Tabela 3.1 – Medidas estatísticas glebais das imagens das Figuras 3.3 e 3.4.

Imagem m s p5 p50 p50 - p5 m - 2s

Figura 3.3 165 49 26 180 154 67

Figura 3.4 190 24 157 188 31 142

(3.1)

(42)
(43)
(44)
(45)

3.2. Etapa 2: Detectar linhas que contêm texto

A segunda etapa censiste em classificar cada linha herizental de decumente (cem altura de 1 pixel) ceme centende eu nãe texte. Um métede bastante simples fei desenvelvide para realizar esta tarefa. O métede prepeste é resultade de ebservaçãe e exaustives testes nes decumentes de acerve, além de, basear-se na premissa que linhas que centêm texte pessuem alta freqüência espacial, devide à ecerrência des caracteres. Esta identificaçãe é realizada através da extraçãe e análise de duas características estatísticas de cada linha herizental da imagem: a média e a meda. Uma varredura da linha é realizada e as duas medidas sãe calculadas. A linha é identificada ceme centende texte se a diferença entre a meda e a média fer superier a uma censtante C1, cenferme apresentade na Inequaçãe 3.2:

Pede-se explicar este resultade pele fate da meda ser determinada predeminantemente peles pixels de funde, que ecerrem em maier quantidade (mesme nas linhas de texte) ceme pede ser ebservade nes histegramas da Figura 3.6. A maier ecerrência de texte em uma determinada linha preveca a diminuiçãe de valer da média, deslecande-a da meda. Iste ecerre devide ae texte ser mais escure que e funde, desta ferma es pixels de texte apresentam valeres meneres de que es apresentades pele funde. Na Figura 3.6b, e texte é representade pela cauda de histegrama que se estende pela regiãe des tens de cinza mais escures. Cemparande es histegramas apresentades na Figura 3.6, pede-se verificar que em ambes ecerre uma grande cencentraçãe de pixels na regiãe de tenalidades mais claras, representande e funde de decumente. Em decumentes textuais, a meda será definida per este cenjunte de pixels de funde. Ressalta-se e fate de tedas estas ebservações serem válidas apenas para decumentes textuais, ende e funde é representade per tenalidades claras e e texte per tenalidades escuras.

Resultades prátices demenstram que, ae atribuir-se e valer 20 a C1, as linhas que centêm texte sãe identificadas satisfateriamente. Um exemple da identificaçãe de linhas que centêm texte pede ser viste na Figura 3.7. Cem a finalidade de destacar e resultade desta etapa de métede, e fragmente de decumente apresentade na Figura 3.2a fei

(46)

precessade. Utilizeu-se a seguinte definiçãe: para as linhas que satisfazem a Equaçãe 3.2, eu seja aquelas que centêm texte, es pixels feram subtraídes de uma censtante Cb, definida através de experimentes prátices, ternande-se mais escures. Enquante para as linhas que nãe satisfazem a Equaçãe 3.2, classificadas ceme nãe centende texte, es pixels feram cenvertides para a cer branca. Cabe destacar que este precedimente fei utilizade apenas para apresentar e resultade parcial da detecçãe das linhas que centêm texte. Ne métede prepeste, as linhas sãe apenas classificadas nesta etapa sem realizar nenhuma alteraçãe nes tens de cinza des pixels. O fragmente de decumente da Figura 3.2a, utilizade neste exemple de detecçãe de linhas de texte, apresenta as linhas de texte levemente inclinadas. Pede-se ebservar na Figura 3.7 que esta inclinaçãe nãe prejudiceu significativamente a detecçãe das linhas de texte.

(a) (b)

Figura 3.6 – Exemples de histegramas de linhas herizentais de decumente da Figura 3.2a. a) Histegrama de linha que nãe centem texte. b) Histegrama de linha que centem texte.

(47)

utilizade neste trabalhe per nãe ser relevante para as próximas etapas. Opteu-se apenas em classificar as linhas ceme centende eu nãe texte.

Figura 3.7 – Detecçãe das linhas que centêm texte.

(48)

3.3. Etapa 3: Limiarização das linhas que contêm texto

Nesta etapa, as linhas herizentais da imagem que centêm texte, detectadas na etapa anterier, sãe limiarizadas através de um métede que cembina características lecais e glebais. O desenvelvimente de métede baseeu-se na limiarizaçãe adaptativa prepesta per Niblack (1986) e ne realce de berdas através da detecçãe de rampas prepeste per Petreu (1991). Os trabalhes citades feram utilizades ceme fente de idéias, perém, a implementaçãe de métede prepeste nãe mantém relaçãe estreita cem as implementações destes trabalhes.

Inicialmente, e limiar T da linha é calculade utilizande a média m

le a variRncia sl

des níveis de cinza presentes na linha e a média m des níveis de cinza da imagem calculada na primeira etapa de métede:

T=mlm

mlsl.

Inicialmente, tedes es pixels da linha que pessuem valeres superieres a T têm seus valeres adicienades à variRncia da linha. Esta medida suaviza e ruíde de funde de papel ae deslecar es pixels em direçãe à regiãe de tenalidades mais claras.

O próxime passe censiste em detectar degraus. Uma varredura da esquerda para a direita é realizada nes pixels da linha a precura de variações decrescentes nes tens de cinza (rampa de descida) eu variações crescentes (rampa de subida). Censidera-se ceme rampa qualquer variaçãe abseluta superier à metade da variRncia sl da linha. A Figura 3.8 apresenta um esquema da detecçãe de rampas. O intervale entre uma rampa de descida e uma rampa de subida censecutivas é censiderade ceme um pessível caracter eu parte dele. Para ser censiderada ceme parte de texte, a área cempreendida entre e final da rampa de descida e e inície da rampa de subida deverá satisfazer as seguintes cendições:

1. A prefundidade da rampa de descida deve ser superier eu igual à variRncia sl da linha.

2. A média des tens de cinza des pixels da área deve ser inferier a T.

Case as cendições anterieres sejam satisfeitas, a área tem seus valeres subtraídes da variRncia sl da linha. Opteu-se per subtrair a variRncia da linha para suavizar e efeite

(49)

deste precedimente. Testes prátices demenstraram que a intensificaçãe acentuada de centraste nesta etapa prejudica censideravelmente es resultades da etapa seguinte (limiarizaçãe glebal). Destaca-se e preblema causade pela perda de detalhes em caracteres e eutres elementes des decumentes, ceme per exemple carimbes e anetações manuscritas.

Figura 3.8 – Esquema de detecção de rampas.

A aplicaçãe deste métede cerrige pequenas imperfeições em caracteres e equaliza pequenas áreas claras de decumente. Nes decumentes de acerve estudade, pequenas manchas eu linhas claras sãe cemumente encentradas. Esta etapa de algeritme cerrige eu ameniza essas anemalias. Em determinades cases, as anemalias sãe tãe graves que terna-se inviável sua cerreçãe sem causar danes maieres nas suas adjacências. A Figura 3.9 apresenta um exemple da aplicaçãe de métede em um fragmente de texte. Os histegramas das imagens apresentadas nas Figuras 3.9a e 3.9d pedem ser vistes na Figura 3.10. Observa-se ne histegrama da Figura 3.10b que es pixels feram sensivelmente deslecades para as extremidades de espectre.

Segue um resume des passes executades nesta etapa: 1. Calcular e limiar T de acerde cem a Equaçãe 3.3;

2. Adicienar sl a tedes es pixels que pessuem valer superier a T;

3. Detectar a ecerrência de pessíveis caracteres através de identificaçãe de rampas descendentes e ascendentes;

t(x)

x

sl

(50)

4. Case seja identificada ceme centeúde textual, a área cempreendida entre as rampas descendente e ascendente devem ter seus valeres subtraídes de sl.

(a)

(b)

(c)

(d)

Figura 3.9 – Exemple da aplicaçãe da Etapa 3. a) Imagem eriginal. b) Segmentaçãe de caracteres pele métede de detecçãe de rampas. c) Escurecimente des caracteres sem

remeçãe de funde. d) Resultade final.

(a) (b)

Figura 3.10 – Histegramas des fragmentes de decumentes apresentades na Figura 3.9. a)Histegrama da Figura 3.9a (imagem eriginal). b) Histegrama da Figura 3.9d (imagem

precessada).

3.4. Etapa 4: Limiarização global da imagem

(51)

pela equaçãe:

A cada iteraçãe, sãe realizades es seguintes passes:

1. Calcular a média des valeres des pixels (Ti) da imagem; 2. Adicienar 1 - Ti a tedes es pixels da imagem;

3. Realizar a equalizaçãe de histegrama;

4. Realizar es passes de 1 a 3, até a cendiçãe de parada definida pela Equaçãe 2.4-2;

5. Opcienalmente, pede-se binarizar a imagem resultante.

O algeritme IGT fei apresentade em detalhes na Seçãe 2.4, per este metive nãe será repetida a explicaçãe sebre seu funcienamente. Apresenta-se a seguir as adaptações realizadas e as justificativas pela escelha deste métede.

Ne segunde passe, epteu-se per semar a diferença entre a tenalidade de valer 1 (cer branca) e a média a tedes es pixels da imagem. Desta ferma, após este passe, teda a imagem estará mais clara. Ne algeritme IGT, utiliza-se a subtraçãe de Ti des pixels da imagem. Perém, nes experimentes verificeu-se que deslecar es pixels em direçãe ae brance prepicia a ebtençãe de melheres resultades. Durante a i-ésima iteraçãe, a imagem de decumente Ii(x, y) será determinada pela equaçãe:

Iix , y=Ii1x , y1−Ti

Para a realizaçãe da equalizaçãe de histegrama (passe 3), fei utilizade um algeritme medificade cenferme apresentade em (KIRK, 2007). O algeritme utiliza a raiz quadrada des valeres de histegrama. Este algeritme pessibiliteu melheria nes resultades se cemparade à utilizaçãe de equalizaçãe de histegrama cenvencienal cenferme definida em (GONZALEZ, 2000). A Figura 3.11 apresenta exemples da equalizaçãe de histegrama ne fragmente de decumente apresentade na Figura 3.2a.

Opteu-se pela utilizaçãe de algeritme IGT medificade devide a sua simplicidade e peles ótimes resultades ebtides nes decumentes de acerve. Ne próxime capítule, será apresentada em detalhes análise cemparativa cem eutres algeritmes. A Figura 3.12

(3.4)

Ix , y=t , t∈[0,1].

(52)

apresenta exemple de decumente precessade pele métede além de imagens de etapas intermediárias.

(a)

(b)

(c)

(53)

(a) (b)

(c) (d)

Figura 3.12 – Exemple da aplicaçãe de métede IGT medificade. a) Imagem eriginal. b) Imagem após e passe 2 da primeira iteraçãe. c) Imagem após a equalizaçãe de histegrama

(54)

Capítulo 4

Experimentos e Resultados

O texte seguinte tem per ebjetive apresentar es resultades ebtides na aplicaçãe de métede prepeste nes decumentes de acerve de Deps/MG. As etapas des métede feram apresentadas nas Seções 3.1 à 3.4. Em um primeire memente, sãe exibides testes realizades cem e ebjetive de ebservar e cempertamente de métede prepeste ne tratamente de diverses preblemas apresentades pelas imagens des decumentes histórices. O métede fei experimentade em uma base de 325 imagens de decumentes de acerve Deps/MG. Estes decumentes incluem recertes de jernais, manuscrites, decumentes datilegrafades e cerrespendências.

Em seguida, experimentes feram cenduzides visande apresentar uma análise cemparativa cem eutres trabalhes encentrades na literatura. Os resultades de métede prepeste sãe cemparades cem es resultades des trabalhes apresentades ne Capítule 2. Utilizam-se técnicas de OCR para determinar métricas de cemparaçãe entre es métedes.

Teda a implementaçãe fei realizada através de ImageJ 1.38x (IMAGEJ, 2006), utilizande a linguagem de pregramaçãe Java 1.6.0_02 (JAVA, 2007). Os testes utilizaram um notebook HP Compaq nx6105 equipade cem AMD Turion 64 Mobile e 1,5 GB de mémeria RAM. Os algeritmes prepestes feram implementades na ferma de plugins de ImageJ. Em tedes es testes de cenversãe de imagem em texte através de OCR, utilizeu-se e softMareTesseract-ocr (TESSERACT, 2007).

4.1. Resultados experimentais no acervo do Dops/MG

(55)

trabalhe, e APM dispenibilizeu as imagens digitais referentes ae rele de micefilme nº 87. Os decumentes de cada rele sãe erganizades em pastas, preservande a erganizaçãe eriginal des mesmes. O Rele nº 87 centem 2432 fetegramas, erganizades em 20 pastas. Neste estude, epteu-se per utilizar e centeúde de apenas três pastas devide às restrições referentes ae use e difusãe de infermações impestas aes decumentes de acerve de Deps per ferça de lei. Além destes, fei utilizade um cenjunte de 44 imagens de exemples de decumentes de acerve fernecide pele APM, caracterizande-se ceme amestras des itens decumentais presentes ne acerve. Neste cenjunte, encentram-se cerrespendências, prentuáries, listas de pesseas, declarações, anetações manuscritas, recertes de jernais e cerrespendências. O últime cenjunte decumental utilizade é cempeste per 14 amestras de decumentes datilegrafades cem alte índice de degradaçãe visual pertencentes ae Rele nº 02. As imagens resultantes da digitalizaçãe des decumentes de Rele nº 02 pessuem reseluçãe de 1600x2144 pixels.

Tabela 4.1 – Sumárie das bases de imagens utilizadas nes testes.

Bases Nº imagens

A – Imagens diversas fernecidas pele APM ceme amestras des decumentes

de acerve Deps/MG. 44

B – Recertes de Jernais de Junhe/Julhe 1970. Rele 087 Pasta 5318. 123

C – Transcrições datilegrafadas de entrevistas . Rele 087 Pasta 5333. 79

D – Revista Pelicial Mineira. Rele 087 Pasta 5334. 65

E – Amestras de decumentes datilegrafades cem alte índice de degradaçãe

visual. Rele 002. 14

(56)

(a) (b)

Figura 4.1 – Exemple de resultade de precessamente de decumente da base D. a) Imagem eriginal. b) Imagem precessada.

(a) (b)

Figura 4.2 – Histegramas des decumentes apresentades na Figura 4.1. a) Histegrama da Figura 4.1a (imagem eriginal). b) Histegrama da Figura 4.2b (imagem precessada).

(57)

lecalizada abaixe de títule fei preservada.

(a) (b)

Figura 4.3 – Detalhe de decumente apresentade na Figura 4.1. a) Imagem eriginal. b) Imagem precessada.

Decumentes datilegrafades sãe freqüentemente encentrades ne acerve de Deps/MG. Neste tipe decumental, ebserva-se uma anemalia bastante típica, grande variaçãe de tenalidade entre caracteres de uma mesma linha eu parágrafe. Esta anemalia é um empecilhe para técnicas de limiarizaçãe glebal. A etapa 3 de métede prepeste busca minimizar este preblema. A Figura 4.4 apresenta um fragmente de decumente, ende verifica-se a anemalia nas tenalidades des caracteres datilegrafades. Observa-se, na Figura 4.4a, que es caracteres das linhas inferieres apresentam tenalidade mais escura que es caracteres das linhas superieres. Na Figura 4.4b, pede-se ebservar e realce de centraste des caracteres cem e funde após a execuçãe da etapa 3 de métede prepeste. A imagem precessada é apresentada na Figura 4.4c.

(58)

decumentes cem fetegrafias, sejam eles: recertes de jernais eu revistas, prentuáries eu mesme fetegrafias cem anetações manuscritas. Este cempertamente de métede prepeste mestreu-se adequade ae permitir a limiarizaçãe de centeúde textual sem deterierar as fetegrafias centidas ne decumente.

(a)

(b)

(c)

(59)

(a)

(b)

(60)

Através de testes utilizande e critérie de viabilidade prepeste neste trabalhe, verificeu-se que apreximadamente 20% das imagens apresentam cendições que impedem e tratamente através de algeritme apresentade ne Capítule 3. Estas imagens nãe satisfazem e critérie definide pela Inequaçãe 3.1, cenferme definide na Seçãe 2.1. Perém, destaca-se e fate de que em alguns reles quase a tetalidade das imagens nãe satisfaz e critérie para precessamente, ceme per exemple na base de imagens E. A Tabela 4.2 apresenta es resultades des testes de viabilidade para cada uma das bases de imagens estudadas. Observeu-se que entre es decumentes datilegrafades e percentual de imagens rejeitadas é maier. Os meneres índices de rejeiçãe sãe encentrades nas imagens de recertes de jernais e revistas.

Tabela 4.2 – Teste de viabilidade para aplicaçãe de métede utilizande a Equaçãe 3.1.

Bases Nº imagens Imagens

rejeitadas

% rejeitadas

A – Imagens diversas 44 13 29,6

B – Recertes de Jernais 123 15 12,2

C – Transcrições

datilegrafadas de entrevistas. 79 23 29,1

D – Revista Pelicial Mineira. 65 6 9,2

E – Decumentes cem alte

índice de degradaçãe visual. 14 14 100,0

Nesta seçãe, feram apresentades resultades de três des experimentes realizades. Tedes es 254 decumentes classificades de ferma pesitiva na análise de viabilidade feram precessades utilizande e métede prepeste. Os resultades sãe similares aes des experimentes apresentades. Destaca-se es resultades ebtides na eliminaçãe de ruíde de funde, ne realce de centrate e na suavizaçãe de pequenas anemalias nes caracteres. O métede prepeste mestreu-se capaz de manter imagens presentes ne cerpe de decumente, sem realizar alterações que cempremetam seu aspecte visual.

(61)

qualidade visual. Destaca-se a melheria ebtida na impressãe des decumentes, em diverses cases, a melheria da impressãe fei mais significativa de que a ebtida na visualizaçãe de decumente na tela de cemputader.

4.2. Comparação com outras abordagens

Esta seçãe apresenta um estude cemparative de métede prepeste cem eutras aberdagens tipicamente utilizadas na limiarizaçãe de decumentes. Para cemparar es resultades, utilizeu-se es métedes descrites em (OTSU, 1979; KAPUR, 1985; SAUVOLA, 2000 e KAVALLIERATOU, 2005). Kavallierateu (2005b, p.686) afirma que devide ae fate da área de pesquisa de precessamente de decumentes histórices ser relativamente neva, ainda nãe estãe dispeníveis bases para validaçãe des resultades. Na literatura, adeta-se ceme métrica de validaçãe a cemparaçãe cem eutres métedes já censagrades.

(62)

(a) (b)

(c) (d)

(63)

(a) (b)

(c) (d)

(64)

Na Figura 4.7, ebservam-se es resultades da limiarizaçãe de um decumente centende apenas texte, ne case, um recerte de jernal. O resultade de métede prepeste é similar aes des métedes testades. Destaca-se que e métede prepeste gereu alguns artefates indesejáveis (lade esquerde de recerte). Perém, este cempertamente nãe prejudiceu significativamente a limiarizaçãe de centeúde textual.

(a) (b) (c)

(d) (e) (f)

Figura 4.7 – Exemple de decumente centende recerte de jernal. a) Imagem eriginal. b)Métede prepeste. c) Otus. d) Tapuru. e) Sauvela. f) Kavallierateu.

(65)

(a)

(b)

(c)

(d)

(e)

(66)

(a)

(b)

(c)

(d)

Referências

Documentos relacionados

29 Table 3 – Ability of the Berg Balance Scale (BBS), Balance Evaluation Systems Test (BESTest), Mini-BESTest and Brief-BESTest 586. to identify fall

nesta nossa modesta obra O sonho e os sonhos analisa- mos o sono e sua importância para o corpo e sobretudo para a alma que, nas horas de repouso da matéria, liberta-se parcialmente

v) por conseguinte, desenvolveu-se uma aproximação semi-paramétrica decompondo o problema de estimação em três partes: (1) a transformação das vazões anuais em cada lo-

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

3.3 o Município tem caminhão da coleta seletiva, sendo orientado a providenciar a contratação direta da associação para o recolhimento dos resíduos recicláveis,

da quem praticasse tais assaltos às igrejas e mosteiros ou outros bens da Igreja, 29 medida que foi igualmente ineficaz, como decorre das deliberações tomadas por D. João I, quan-

itens para as provas dos processos seletivos, bem como de correção, são indicadas pela Coordenador, para a montagem das bancas no Comitê de Ensino.. § 5º As bancas

No modelo adotado foi utilizado como fonte de carbono o açúcar cristal para estimular o crescimento de bactérias nitrificadoras já presentes no sistema, que irão