Reconhecimento automático de crateras na superfície de Marte baseado em técnicas de boosting

(1)

Outubro de 2007

Reconhecimento automático de crateras na superfície de

Marte baseado em técnicas de boosting

R

ICARDO

F

ERNANDO

L

OPES

F

ONTES

M

ARTINS

Dissertação para obtenção do Grau de Mestre em

E

NGENHARIA

E

LECTROTÉCNICA E DE

C

OMPUTADORES

Júri

Presidente:

Prof. Francisco Miguel Prazeres Silva Garcia

Orientadores:

Prof. Jorge dos Santos Salvador Marques

Prof. Pedro Miguel Berardo Duarte Pina

Vogais:

Profª. Maria Margarida Campos da Silveira

(2)

Agradecimentos

Quero em primeiro lugar dedicar esta dissertaç ão de mestrado à minha fam´ılia, em especial à minha m ãe que sempre acreditou em mim e nas minhas capacidades. Apoiou e apostou, desde sempre, na minha educaç ão e formaç ão a todos os n´ıveis. Ao meu irm ão por todos os conselhos e aos meus av ós que garantiram os meus estudos ao longo de todos estes anos. Sem voc ês n ão estaria onde estou hoje, a todos o meu eterno e profundo agradecimento.

Agradeço tamb ém aos meus orientadores. Ao Prof. Jorge Salvador Marques, ao Prof. Pedro Pina e à Profª. Margarida Silveira, obrigado pela vossa paci ência e pelas vossas sugest ões, coment ários e cr´ıticas. Especial agradecimento ao Prof. Pedro Pina pela disponibilizaç ão do conjunto de imagens utilizadas nesta dissertaç ão, anteriormente utilizadas sob o projecto PDCTE/CTA/49724/03 suportado pela FCT (Fundaç ão para a Ci ência e Tecnologia).

Por fim quero agradecer a todos os meus amigos de dentro e fora do Instituto Superior T écnico que me apoiaram neste percurso. Em especial à Dora Gaspar pelos incentivos, compreens ão e paci ência, e por se ter voluntariado para ler esta dissertaç ão.

(3)

Resumo

A identificaç ão de crateras de impacto numa superf´ıcie planet ária assume uma import ância crucial no estudo dos planetas, pois permite a estimaç ão da idade de zonas da superf´ıcie atrav és de mediç ões de tamanho e frequ ência de impactos. Diversos m étodos para identificaç ão autom ática de crateras t êm sido desenvolvidos, no entanto nenhum é suficientemente robusto de forma a poder ser aplicado em todas as superf´ıcies planet árias.

Esta dissertaç ão prop õe uma nova abordagem para detecç ão autom ática de crateras na superf´ıcie de Marte utilizando algoritmos de aprendizagem baseados em boosting e caracter´ısticas de Haar. Os m étodos desenvolvidos s ão inspirados no trabalho de P. Viola e M. Jones [22] em 2001 no contexto de detecç ão de faces. A nova abordagem é por si s ó um contributo para a área em quest ão. Outros contributos s ão: a proposta de um mecanismo de treino de classificadores com exemplos de crateras em escalas diferentes, m étodos de geraç ão de falsos exemplos para o conjunto de treino e avaliaç ão autom ática de desempenho dos classificadores. S ão utilizadas 101 imagens da superf´ıcie de Marte para treino e teste. Os m étodos propostos s ão avaliados por validaç ão cruzada de quatro ensaios. Os melhores resultados para crateras de di âmetro igual ou superior a 7 pixels variam entre 79% a 88% de taxa de detecç ões correctas e entre 5% a 23% de taxa de falsas detecç ões dependendo do threshold. Os desempenhos est ão pr óximos dos melhores publicados at é hoje e podem ser melhorados.

(4)

Abstract

The identification of impact craters on a planetary surface has crucial importance for planetary studies because it allows the estimation of the surface age through measures of size and frequency of impacts. Several methods for automatic crater identification have been developed, however none is sufficiently robust to be applied on all planetary surfaces.

This dissertation proposes a new approach to automatic crater detection on the surface of Mars using learning algorithms based on boosting and Haar-like features. The method developed is inspired on the work of P. Viola and M. Jones [22] in 2001 for face detection. This new approach is by itself a contribution to this area. Other contributes are: the proposal of a classifier training mechanism with craters of different scales, methods to produce false examples for the training set and automatic evaluation of the performance of each classifier. For training and testing, 101 images of Mars are used. The proposed method is evaluated through a four fold cross validation. The best global results for craters equal or above 7 pixels of diameter vary between 79% to 88% of true detection rate and 5% to 23% of false detection rate depending on the chosen threshold. The performances are close to the best ever published so far and can be improved.

(5)

Conte ´

udo

Agradecimentos 1 Resumo 2 Abstract 3 Lista de Tabelas 6 Lista de Figuras 7

Lista de Acr ´onimos 10

1 Introduc¸ ˜ao 11

1.1 Estado da Arte . . . 13

1.2 Objectivos e Contribuic¸ ˜oes . . . 14

1.3 Estrutura da Dissertac¸ ˜ao . . . 15

2 Reconhecimento Autom ático de Crateras 16 2.1 Formulaç ão do Problema . . . 16

2.2 Metodologia . . . 17

2.3 Pr ´e-Processamento . . . 18

2.4 Caracter´ısticas da Imagem . . . 19

2.4.1 M ´ascaras Rectangulares . . . 19

2.4.2 Extracç ão de caracter´ısticas atrav és da imagem integral . . . 20

2.5 Classificador boosting . . . 21

2.5.1 Aprendizagem . . . 23

2.6 Classificador boosting em cascata . . . 24

2.7 Classificac¸ ˜ao Multi-Escala . . . 26

2.8 P ´os-Processamento . . . 27

3 Base de Dados e Conjuntos de Treino e Teste 30 3.1 Imagens e Condiç ões de Aquisiç ão . . . 30

3.2 Identificac¸ ˜ao Manual de Crateras . . . 31

3.3 Validac¸ ˜ao Cruzada . . . 32

3.4 Definic¸ ˜ao de Conjunto de Treino e de Escalas . . . 33

3.5 Conjunto de Treino Autom ´atico . . . 34

(6)

4 Resultados Experimentais 37

4.1 Taxa de Detecç ão e Taxa de Falsas Detecç ões . . . 37

4.2 Avaliaç ão Autom ática das Detecç ões . . . 38

4.3 Resultados com classificador boosting . . . 40

4.4 Resultados com classificador boosting em cascata . . . 42

4.5 Influ ência do n úmero de iteraç ões e do deslocamento de bloco . . . 43

4.6 Teste simples em imagens de sondas diferentes . . . 45

4.7 Discuss ˜ao dos Resultados . . . 47

5 Conclus ˜oes e Trabalho Futuro 49 Bibliografia 51 Anexos 53 Anexo I - Listagem das Imagens MOC . . . 54

Anexo II - Representac¸ ˜ao do Ground Truth nas Imagens . . . 58

Anexo III - Resultados parciais para boosting simples . . . 68

Anexo IV - Resultados parciais para boosting em cascata . . . 71

(7)

Lista de Tabelas

2.1 Algoritmo para treino boosting, adaptado de Viola e Jones [22] . . . 22

2.2 Algoritmo para treino de boosting em cascata, adaptado de Viola e Jones [22] . . . 25

2.3 Procedimento para o agrupamento de detecç ões ap ós classificaç ão de uma imagem com o classificador final. . . 29

3.1 Tabela com a divis ˜ao do n ´umero de imagens utilizadas em cada ensaio por zona. . . . 33

4.1 Algoritmo desenvolvido para a avaliaç ão autom ática dos resultados. . . 38

4.2 Tabela com as taxas de detecç ão (TDR) e falsas detecç ão (FDR) globais para os clas-sificadores de boosting obtidos com os v ários conjuntos de treino e em funç ão de µ. . . 41

4.3 Tabela com as taxas de detecç ão (TDR) e falsas detecç ão (FDR) globais para os clas-sificadores de boosting em cascata obtidos com os v ários conjuntos de treino e em funç ão de µ. . . 43

5.1 Tabela de informaç ão sobre as imagens referentes à Zona A. . . 54

5.2 Tabela de informaç ão sobre as imagens referentes à Zona B. . . 54

5.3 Tabela de informaç ão sobre as imagens referentes à Zona C. . . 55

(8)

Lista de Figuras

1.1 Modelo cronol ógico baseado em crateras de impacto desenvolvido por Hartmann e Neu-kum [2]. O eixo das ordenadas refere-se à frequ ência de impactos por km2_{e o eixo das}

abcissas `a correspondente idade em mil milh ˜oes de anos. . . 12 2.1 Imagens ilustrativas das dificuldades das imagens. Em (a): imagem R0901855 da zona

B mostra a variedade de tamanhos de crateras. Em (b): imagem R0601245 da zona C é vis´ıvel um enorme vale e algumas montanhas. No exemplo em (c): imagem R1301124 da zona D, apresentam-se crateras com aspecto visual muito diferente das duas ima-gens anteriores devido provavelmente a eros ão e ólica na zona. . . 17 2.2 Esquem ático proposto para a detecç ão de cratera num bloco da imagem. . . 18 2.3 Detecç ão de crateras em imagens de Marte. . . 18 2.4 Exemplo de rotaç ão de duas imagens segundo o azimute do Sol. (a) e (c) Imagens

origi-nais E0100976 e R1004288 respectivamente; (b) e (d) Imagens E0100976 e R1004288 rodadas segundo o azimute do Sol respectivamente. . . 19 2.5 Em cima, de (a) a (e), os v ´arios tipos de m ´ascaras. Em baixo (f): um exemplo de uma

m áscara do Tipo 1 e a representaç ão dos respectivos pontos de refer ência necess ários à definiç ão dos rect ângulos. . . 20 2.6 Resultado da classificaç ão da imagem MOC-R1004288 (Zona B) com um classificador

boosting sem an álise multi-escala, bloco de dimens ão 20 × 20. . . 23 2.7 Representaç ão de um classificador em cascata com 3 camadas . . . 24 2.8 Resultado da classificaç ão de imagem MOC-R1004288 (Zona B) como um classificador

boosting em cascata sem an álise multi-escala. . . 25 2.9 Representaç ão do c álculo e normalizaç ão de caracter´ısticas. . . 26 2.10 Resultado da classificaç ão de imagem MOC-R1004288 (Zona B) com um classificador

boosting com an álise multi-escala. . . 27 2.11 Supress ão de n ão m áximos. Em (a) e (b) as detecç ões est ão representadas em (x, y) e

escala (S). Em (a) as detecç ões ap ós a classificaç ão de uma imagem. Em (b) o resul-tado ap ós a supress ão de n ão m áximos. Nos gr áficos (c) e (d) as detecç ões est ão repre-sentadas em localizaç ão x/y, escala S e funç ão discriminante H. Em (c) as detecç ões ap ós a classificaç ão de uma imagem. Em (b) o resultado ap ós a supress ão de n ão m áximos. . . 28 2.12 Resultado da classificaç ão da imagem MOC-R1004288 (Zona B) com um classificador

boosting a v árias escalas com p ós-processamento. . . 28 3.1 Superf´ıcie de Marte e as quatro zonas utilizadas (A,B,C e D). . . 31 3.2 Informaç ão dispon´ıvel para a imagem M2100403. No rect ângulo azul est á o valor do

(9)

3.3 Diagrama dos ensaios para validac¸ ˜ao cruzada dos resultados. . . 32

3.4 Definic¸ ˜ao da escala adequada a um exemplo de cratera de impacto . . . 33

3.5 Os primeiros 100 exemplos de crateras presentes no conjunto de treino CTA referente ao 1º Ensaio. . . 34

3.6 Exemplos falsos sobre os an ´eis de uma cratera. A verde o exemplo positivo de uma cratera. A vermelho os exemplos falsos enviados para o conjunto de treino . . . 35

3.7 Esquem ático do m étodo utilizado para geraç ão de conjuntos de treino iterativos . . . . 36

4.1 Legendagem para a avaliac¸ ˜ao dos resultados obtidos numa imagem. . . 39

4.2 Classificaç ão de duas imagens: R1004288 da zona B e R1002799 da zona D, com o classificador boosting obtido no 1º Ensaio com CTA (esquerda) e avaliaç ão autom ática dos resultados (direita). Em (a) e (c) o resultado ap ós a classificaç ão e (c) e (d) a avaliaç ão autom ática dos resultados. . . 39

4.3 As 10 primeiras caracter´ısticas escolhidas com o classificador boosting treinado com CTA(4º Ensaio). . . 40

4.4 As 10 primeiras caracter´ısticas escolhidas com o classificador boosting treinado com CTI3(4º Ensaio). . . 40

4.5 Curva de ROC para os classificadores de boosting com 50 iterac¸ ˜oes. . . 41

4.6 As dez primeiras caracter´ısticas escolhidas na segunda camada do classificador em cascata para o conjunto CTI3 do quarto ensaio. . . 42

4.7 Curva de ROC para os classificadores de boosting em cascata. . . 43

4.8 Comparaç ão de desempenhos do mesmo classificador (obtido do treino boosting sim-ples com CTI3 - 4º Ensaio, µ = 0.6) utilizando diferente n úmero de iteraç ões T . Resul-tados obtidos na imagem R0904061 da Zona A. . . 44

4.9 Comparaç ão entre o n úmero de iteraç ões utilizado e o tempo de classificaç ão. Resulta-dos resultantes da aplicaç ão a todo o conjunto de teste. . . 44

4.10 Comparaç ão de desempenhos do mesmo classificador (obtido do treino boosting sim-ples com CTI3 - 4º Ensaio) utilizando passos de deslocamento de bloco δ diferentes. Resultados resultantes da aplicaç ão a todo o conjunto de teste. . . 45

4.11 Comparaç ão entre o tamanho do deslocamento do passo δ e o tempo de classificaç ão. Resultados obtidos na imagem R0904061 da Zona A. . . 46

4.12 Detecc¸ ˜ao de crateras numa imagem proveniente da sonda HRSC com o classificador boosting simples obtido do treino com CTI3, com µ = 0.6. . . 46

4.13 Detecc¸ ˜ao de crateras numa imagem proveniente da sonda Viking 2 com o classificador boosting simples obtido do treino com CTI3. . . 47

5.1 GT para as imagens da Zona A. . . 58

5.2 GT para as imagens da Zona B, parte 1. . . 59

5.3 GT para as imagens da Zona B, parte 2. . . 60

5.4 GT para as imagens da Zona C. . . 61

5.5 GT para as imagens da Zona D, parte 1. . . 62

(10)

5.11 Curvas de ROC para o 1º ensaio, classificadores de boosting com 50 iterac¸ ˜oes. . . 68

5.15 Curvas de ROC para o 1º ensaio, classificadores de boosting em cascata. . . 71

5.19 Resultado parcial para a Zona A, figuras por ordem: E0500815 e E1600100. . . 74

5.20 Resultado parcial para a Zona B 1ª parte, figuras por ordem: E1102299, E1201076 e E1201895. . . 75

5.21 Resultado parcial para a Zona B 2ª parte, figuras por ordem: M0201122. . . 76

5.22 Resultado parcial para a Zona C, figuras por ordem: E0100976. . . 76

5.23 Resultado parcial para a Zona D, 1ª parte, figuras por ordem: E0101393, E0101876 e E0400996. . . 77

5.24 Resultado parcial para a Zona D, 2ª parte, figuras por ordem: E0402024, E1900648 e E1900650. . . 78

5.25 Resultado parcial para a Zona D, 3ª parte, figuras por ordem: E2100529, FHA00514 e M0001055. . . 79

5.26 Resultado parcial para a Zona D, 4ª parte, figuras por ordem: M0001986, M0003044 e M0003160. . . 80

5.27 Resultado parcial para a Zona D, 5ª parte, figuras por ordem: M0200385, M0201769 e M0203009. . . 81

(11)

Lista de Acr ´

onimos

MGS - Mars Global Surveyor.

MOC - Mars Orbital Camera.

HRSC - High Resolution Stereo C ˆamera.

GENIE - GENetic Imagery Exploitation.

CSTM - Continuously Scalable Template Models.

FFT - Fast Fourier Transform.

MIMS - Mars Image Mining System.

CERENA - Centro de Recursos Naturais e Ambiente.

CTA - Conjunto de Treino Autom ´atico.

CTI - Conjunto de Treino Iterativo.

TD - True Detection.

FD - False Detection.

TDR - True Detection Rate.

FDR - False Detection Rate.

GT - Ground Truth.

(12)

Cap´ıtulo 1

Introduc¸ ˜ao

As crateras de impacto s ão estruturas geol ógicas formadas pelo impacto de meteoritos sobre a superf´ıcie de um planeta e constituem o motivo de v ários estudos efectuados pela comunidade cient´ıfica. S ão uma das caracter´ısticas que mais sobressaem visualmente numa superf´ıcie planet ária, sendo a sua formaç ão um processo geol ógico que ocorre em todo o sistema solar e constitui o principal escultor das superf´ıcies planet árias.

A identificaç ão de crateras de impacto numa superf´ıcie planet ária é de import ância fundamental, pois a contagem do n úmero destas estruturas permite estimar a idade dos terrenos onde se inserem. A compreens ão da evoluç ão geol ógica de planetas baseia-se em medidas de distribuiç ão de tamanho e frequ ência de impactos, calculadas atrav és das imagens recolhidas pelas sondas em órbita dos corpos planet ários [1]. Sabendo a taxa de produç ão de crateras e assumindo a distribuiç ão espacial de crateras de impacto como um processo aleat ório, o conhecimento do n úmero de crateras de uma determinada área permite estimar a idade da superf´ıcie em milhares de anos. Terrenos mais antigos apresentam em geral um maior n úmero de impactos relativamente a terrenos mais recentes.

O desenvolvimento de t écnicas para determinaç ão das idades das superf´ıcies teve in´ıcio na d écada de 50. A recolha de rochas provenientes da Lua permitiu saber a idade absoluta das rochas e desen-volver um modelo de estimaç ão de idades, baseado no tamanho e frequ ência de impactos observados numa determinada área. Assim, a Lua é uma base de calibraç ão de modelos para determinaç ão da idade de outros planetas. Nos últimos anos t êm aparecido diferentes modelos aplicados ao planeta Marte usados para estimar a idade da superf´ıcie de diversas zonas desse planeta. O modelo cro-nol ógico constru´ıdo para a Lua foi adaptado para Marte por Hartmann e Neukum em 2001 [2] e é apresentado na Figura 1.1.

As crateras de impacto na superf´ıcie de Marte apresentam estados de conservaç ão variados (cra-teras mais recentes t êm contornos mais bem definidos, cra(cra-teras menos recentes podem apresentar contornos mais difusos). As imagens de maior resoluç ão espacial obtidas pela Mars Orbital Camera (MOC) a bordo da sonda Mars Global Surveyor (MGS) que orbita Marte desde 1997, revelam acti-vidade vulc ânica, l´ıquida e e ólica ap ós a formaç ão das crateras. Estes processos naturais alteram a estrutura geol ógica das crateras ao longo do tempo, criando uma grande variedade de formatos de crateras em toda a superf´ıcie. Por outro lado, as dimens ões das crateras variam desde a ordem do metro at é aos milhares de quil ómetros e os terrenos onde ocorrem t êm origem e aspectos muito diversos.

O reconhecimento e catalogaç ão das crateras de impacto é tamb ém essencial para a cronoes-tratigrafia (o estudo da idade das rochas e todo o seu processo de formaç ão) de uma determinada

(13)

Figura 1.1: Modelo cronol ógico baseado em crateras de impacto desenvolvido por Hartmann e Neu-kum [2]. O eixo das ordenadas refere-se à frequ ência de impactos por km2 _{e o eixo das abcissas à}

correspondente idade em mil milh ˜oes de anos.

regi ão, que permite melhorar a interpretaç ão geol ógica hist órica de um determinado local ou zona da superf´ıcie. Assim, o estudo das crateras de um planeta serve v ários fins, como o da compreens ão do pr óprio processo de craterismo, o do conhecimento da natureza dos terrenos que foram alvo dos impactos, e sobretudo o da an álise e compreens ão dos processos que est ão na origem da sua por vezes acentuada degradaç ão (preenchimento parcial ou total das depress ões internas e a eros ão dos bordos elevados) e que contribu´ıram para a definiç ão do aspecto actual da superf´ıcie do planeta. Iden-tificar impactos de crateras poder á tamb ém ser importante para a elaboraç ão de uma ferramenta de navegaç ão espacial, a ser utilizada para definir um local seguro de aterragem em miss ões espaciais futuras.

O processo de identificaç ão de crateras tem sido executado por operadores humanos, mas esta operaç ão é extremamente exigente em termos de tempo (seriam necess ários v ários anos para cons-truir uma base de dados com toda a informaç ão de impactos de crateras em Marte atrav és deste processo). Esta situaç ão é exacerbada pelo aumento da resoluç ão espacial dos instrumentos a bordo das sondas recentes, que permitem a detecç ão de crateras com v árias dimens ões.

Por estas raz ões é cada vez mais importante providenciar à comunidade cient´ıfica ferramentas autom áticas de detecç ão de crateras. A automaç ão total do processo de detecç ão de crateras ser á uma contribuiç ão importante para o estudo do sistema solar, assim como ser á uma preciosa ferra-menta para os operadores humanos que possuem um largo volume de imagens para analisar e po-dendo focar a sua concentraç ão na aplicaç ão dos modelos geol ógicos aos dados. Diversas linhas de investigaç ão t êm sido seguidas nas últimas d écadas para se conseguir um processo autom ático que permita a identificaç ão e contagem de crateras de impacto (algumas ser ão abordadas na secç ão 1.1). Contudo, a identificaç ão autom ática de crateras atrav és de m étodos de processamento de imagem provou ser um problema dif´ıcil pois at é hoje nenhum dos m étodos obteve resultados suficientemente satisfat órios para serem aplicados a toda a superf´ıcie de Marte.

(14)

1.1 Estado da Arte

Diversos trabalhos sobre detecç ão autom ática de crateras em imagens de superf´ıcies planet árias, nomeadamente da Lua e de Marte, t êm sido efectuados nos últimos anos. As abordagens para detecç ão de crateras podem ser divididas em duas classes: supervisionadas e n ão-supervisionadas. Ambas as abordagens utilizam conjuntos de treino e teste. Nos m étodos n ão-supervisionados os da-dos n ão est ão classificada-dos ao contr ário da-dos m étoda-dos supervisionada-dos que necessitam de classificaç ão dos dados por parte do utilizador.

Os m étodos supervisionados [3], [4], [5] e [6] utilizam conceitos de aprendizagem de forma a cons-truir um classificador para a detecç ão de crateras. Em [3] é testado um software de aprendizagem autom ática chamado GENIE (GENetic Imagery Exploitation). O software avalia o desempenho de v ários algoritmos e combina os melhores de forma a classificar correctamente todo o conjunto de treino. É utilizada apenas uma imagem de Marte para treino e o resultado apresentado refere-se à classificaç ão dessa mesma imagem com o classificador final (98% de detecç ão e 10% de falsas detecç ões) n ão sendo contabilizadas as crateras de pequenas dimens ões neste resultado. O facto de se usar a mesma imagem para treino e teste conduz a estimativas demasiado optimistas do de-sempenho desta abordagem. Nos trabalhos [4] e [6] utiliza-se a t écnica de modelos de template continuamente escal áveis (CSTM-Continuously Scalable Template Models), baseia-se um exemplo real de uma cratera amostrado a v árias frequ ências com o objectivo de criar uma fam´ılia de filtros a ser utilizada para classificaç ão. No desempenho ambas as abordagens s ão avaliadas num conjunto de teste inferior a cinco imagens, [4] é testado numa imagem da superf´ıcie Lunar e obteve 80% de detecç ões correctas e 12% de falsas, [6] é testado em tr ês exemplos sint éticos e uma imagem MOC obtendo um elevado n úmero de falsas detecç ões. Em [5] v ários algoritmos s ão testados e compa-rados (entre os quais redes neuronais, modelos de templates continuamente escal áveis e m áquinas de vectores de suporte). As m áquinas de vectores de suporte mapeiam os vectores de treino num espaço dimensional elevado procurando construir um hiperplano que separe as classes. O melhor desempenho foi obtido com m áquinas de vectores de suporte com apenas 60% de detecç ões correc-tas num n úmero n ão especificado de imagens da sonda Viking Orbiter. Em [7] é apresentada uma abordagem de redes neuronais para identificaç ão de crateras mas apenas testada em tr ês blocos de imagem contendo exemplos de crateras e dois exemplos sint éticos. Todas as abordagens supervisio-nadas referidas apresentam resultados promissores mas os classificadores resultantes do treino s ão aplicados a um conjunto de teste limitado e alguns apresentam apenas bons resultados em crateras de grandes dimens ões.

A maioria das abordagens baseia-se em m étodos n ão-supervisionados e utilizam t écnicas para identificar os an éis das crateras numa imagem atrav és da extracç ão de caracter´ısticas circulares ou el´ıpticas. As abordagens propostas em [8], [9] e [10] baseiam-se na transformada de Hough para detecç ão de formas circulares. M étodos para detecç ão autom ática de crateras atrav és de dados de topografia digital, [11] e [12], procuram por zonas c ôncavas e utilizam tamb ém a transformada de Hough. Em [13] a detecç ão de crateras é feita atrav és de an álise de textura e em [14] atrav és da correlaç ão com uma template ap ós a detecç ão de contornos. Outras abordagens, [15], [16], [17], [18], [19] e [20], optam por combinar diversos dos m étodos mencionados (transformada de Hough, an álise de textura e correlaç ão com template) e outras t écnicas de processamento para detectar crateras. No artigo [20] o m étodo combina detecç ão de contornos, medidas de textura e an álise de direcç ão de gradientes e é testado em imagens provenientes de diferentes sondas.

Dos v ários estudos efectuados nenhum obteve taxas de detecç ão acima de 90% e de falsas detecç ões abaixo de 10% sobre um conjunto de imagens de teste de dimens ão consider ável (pelo

(15)

menos 10 imagens). No entanto, entre os melhores resultados destaca-se o obtido por L. Bandeira et al.[18]. Neste trabalho o reconhecimento de crateras é composto por tr ês fases: selecç ão de candi-datos (atrav és de detecç ão de contornos), criaç ão de um volume de probabilidade criado atrav és da correlaç ão com templates a v árias escalas utilizando uma FFT (Fast Fourier Transform) e detecç ão de crateras atrav és da an álise de m áximos locais. Este m étodo n ão supervisionado atinge um resul-tado global de 86% de detecç ões correctas e 12% de falsas detecç ões. O trabalho desenvolvido com dados de topografia digital [11] obteve um bom desempenho (taxa de detecç ão de 88% em imagens provenientes da MOC), mas as imagens de teste foram escolhidas de forma a n ão inclu´ırem crate-ras muito degradadas e localizadas sobre os an éis de outcrate-ras cratecrate-ras pois o m étodo possui um fraco desempenho nestas situaç ões.

1.2 Objectivos e Contribuic¸ ˜

oes

Esta dissertaç ão tem como objectivo principal desenvolver um m étodo para a detecç ão autom ática de crateras, n ão s ó em imagens da superf´ıcie de Marte como de qualquer outra superf´ıcie planet ária, em diferentes escalas, utilizando uma abordagem diferente de todas as outras mencionadas anteri-ormente. Para que este trabalho tenha um bom impacto na comunidade cient´ıfica, deseja-se nesta fase demonstrar que é um m étodo v álido para detecç ão de crateras e por isso dever á obter taxas de desempenho pr óximas das melhores apresentadas na literatura at é hoje.

Para se poder lidar com as fontes de variaç ão apresentadas na introduç ão, pretende-se nesta dissertaç ão utilizar m étodos de aprendizagem autom ática capazes de aprender as caracter´ısticas ou features da imagem de fundo e das crateras. Pretende-se ainda usar uma representaç ão multi-escala das imagens para tornar o algoritmo independente da escala. As abordagens dos trabalhos apre-sentados na secç ão anterior possuem uma quantidade fixa de caracter´ısticas a serem utilizadas na detecç ão de crateras. Nesta dissertaç ão o processo de aprendizagem selecciona as melhores carac-ter´ısticas de entre milhares de caraccarac-ter´ısticas escolhidas pelo utilizador para construir um classificador final. Prop õe-se que esta selecç ão seja feita usando t écnicas de boosting semelhantes às propostas por P. Viola e M. Jones [22] no contexto da detecç ão de faces em imagens e que demonstraram um desempenho e rapidez not áveis mesmo quando h á variaç ões de escala. Este m étodo foi inicialmente aplicado para reconhecimento de caras, sendo hoje considerado um standard em problemas de reco-nhecimento de padr ões.

Em contraste com os trabalhos de aprendizagem apresentados, ser á utilizado um conjunto vasto de imagens de diversas regi ões e com crateras de aspecto e dimens ão variados. As imagens utili-zadas neste trabalho s ão as do trabalho desenvolvido por L. Bandeira et al.[18], o que permite uma comparaç ão de resultados apesar de existirem algumas diferenças no processo de avaliaç ão. Nesta dissertaç ão, as imagens ser ão separadas em conjuntos de treino e teste enquanto que em [18] n ão existe um conjunto de treino tendo sido testado em todo o conjunto de imagens. Para demonstrar a validade dos resultados com esta abordagem, é feita uma validaç ão cruzada realizando v ários en-saios para que todas as imagens sejam utilizadas na fase de teste. O c ódigo foi desenvolvido em MATLABT M e executado num laptop convencional. Este trabalho prop õe uma nova abordagem no contexto de automaç ão de detecç ão de crateras, que se pretende competitiva em relaç ão aos m étodos at é hoje propostos pela comunidade cient´ıfica.

(16)

1.3 Estrutura da Dissertac¸ ˜ao

O trabalho encontra-se dividido em mais quatro cap´ıtulos para al ém do cap´ıtulo de introduç ão. No pr óximo cap´ıtulo é feita a formulaç ão do problema e s ão descritos os algoritmos utilizados para treino e detecç ão de crateras em diversas escalas. No cap´ıtulo 3 explica-se a origem e caracterizaç ão das imagens utilizadas. É descrito o processo de recolha de informaç ão, identificaç ão manual de crateras e c álculo do seu di âmetro para a criaç ão da base de dados para cada imagem (ground truth). A forma como é gerado o conjunto de treino influencia directamente os resultados obtidos pelo classificador final resultante do treino, os tipos de conjuntos de treino constru´ıdos s ão tamb ém descritos neste cap´ıtulo. No cap´ıtulo 4 apresentam-se os resultados globais ap ós a validaç ão cruzada, alguns testes efectuados e uma cr´ıtica aos resultados obtidos. Finalmente, no cap´ıtulo 6 s ão apresentadas as conclus ões do trabalho, sugest ões para poss´ıveis melhoramentos e trabalho futuro.

(17)

Cap´ıtulo 2

Reconhecimento Autom ´atico de

Crateras

Este cap´ıtulo começa por formular o problema, descrevendo em pormenor as principais dificulda-des. Seguidamente apresenta-se a proposta de resoluç ão do problema, a sua origem, motivaç ão e justificaç ão. Nas secç ões seguintes explicam-se em detalhe os algoritmos desenvolvidos e o proces-samento envolvido.

2.1 Formulac¸ ˜ao do Problema

Dado um conjunto de imagens de diversas zonas da superf´ıcie de Marte, pretende-se detectar e registar a localizaç ão das crateras de impacto atrav és de um m étodo autom ático. Apesar de alguns resultados animadores nos últimos anos, o problema de detecç ão autom ática de crateras continua a ser um problema dif´ıcil, n ão existindo ainda uma soluç ão suficientemente satisfat ória.

Uma das dificuldades associadas a este problema é a diversidade do aspecto visual das crateras de impacto que depende do tipo de terreno em que ocorrem, direcç ão de iluminaç ão e do estado atmosf érico no instante de aquisiç ão. Algumas zonas em estruturas geol ógicas tais como vales, mon-tanhas e vulc ões possuem caracter´ısticas morfol ógicas semelhantes às das crateras que podem ser confundidas com crateras. No entanto, a maior dificuldade deve-se aos diferentes tipos de eros ão a que as crateras foram expostas ao longo dos anos (tempestades de poeira, erupç ões de lava e acti-vidade l´ıquida). Por estas raz ões, as crateras possuem uma grande variedade de aspectos. Crateras em diferentes zonas da superf´ıcie foram expostas a diferentes tipos de eros ão, alterando de forma diferente em cada zona, as suas estruturas geol ógicas e, consequentemente, as suas caracter´ısticas visuais. É tamb ém frequente a sobreposiç ão de crateras, por exemplo, crateras de impacto de menor dimens ão situadas dentro ou sobre o anel de uma cratera de dimens ão maior. Por último, o tama-nho das crateras de impacto na superf´ıcie de Marte pode variar entre alguns metros e milhares de quil ómetros. A Figura 2.1 mostra algumas das dificuldades mencionadas.

Estas dificuldades s ão respons áveis pela n ão exist ência at é hoje de uma soluç ão final satisfat ória para o problema. Para atingir uma soluç ão final satisfat ória, o m étodo proposto dever á ser robusto às dificuldades anteriores para que possa ser aplicado em toda a superf´ıcie de Marte e tamb ém a outras superf´ıcies planet árias.

(18)

(a) (b) (c)

Figura 2.1: Imagens ilustrativas das dificuldades das imagens. Em (a): imagem R0901855 da zona B mostra a variedade de tamanhos de crateras. Em (b): imagem R0601245 da zona C é vis´ıvel um enorme vale e algumas montanhas. No exemplo em (c): imagem R1301124 da zona D, apresentam-se crateras com aspecto visual muito diferente das duas imagens anteriores devido provavelmente a eros ão e ólica na zona.

2.2 Metodologia

O reconhecimento autom ático de crateras enquadra-se nas áreas de reconhecimento de padr ões e processamento de imagem. Para se poder lidar com as fontes de variaç ão apresentadas na secç ão anterior pretende-se aplicar neste trabalho m étodos de aprendizagem autom ática capazes de apren-der as caracter´ısticas da imagem de fundo e das crateras, a partir de exemplos. Modelos de reco-nhecimento de padr ões podem ser baseados em templates ou caracter´ısticas (features). A estrat égia seguida neste trabalho consiste em extrair de imagens, blocos de dimens ões predefinidas e classific á-los numa de duas classes: com ou sem cratera no seu interior. A decis ão é baseada num conjunto de caracter´ısticas visuais que descrevem o conte údo do bloco. O classificador é treinado a partir de exemplos fornecidos pelo utilizador correspondendo a blocos com e sem crateras (exemplos positi-vos e negatipositi-vos, respectivamente) para que o classificador aprenda as propriedades estat´ısticas das caracter´ısticas seleccionadas em ambas as classes.

Para o reconhecimento de padr ões numa imagem, a operaç ão de extracç ão de caracter´ısticas consiste em extrair valores de determinados atributos de uma imagem que permitam diferenciar os objectos e gerar uma decis ão em funç ão dos valores extra´ıdos. Ao contr ário de outras abordagens em que as caracter´ısticas s ão definidas pelo utilizador (por exemplo: intensidade m édia, vari ância, percentagem de pontos de contorno, formas circulares), neste trabalho parte-se de um n úmero muito elevado (milhares) de caracter´ısticas e usa-se um m étodo de selecç ão autom ática que selecciona um pequeno n úmero (dezenas) de caracter´ısticas a serem utilizadas para o reconhecimento de crateras.

Este trabalho inspira-se no m étodo proposto por P. Viola e M. Jones [22] no contexto de detecç ão de faces em imagens, que demonstrou um desempenho not ável mesmo na presença de variaç ões de escala. Prop õe-se a utilizaç ão de t écnicas de boosting para a selecç ão de caracter´ısticas semelhan-tes. O boosting é um conceito utilizado para aprendizagem autom ática supervisionada e consiste em combinar classificadores ”fracos” (com um fraco desempenho) treinados com um algoritmo de apren-dizagem simples de forma a obter um classificador ”forte” que apresente um melhor desempenho do que qualquer um dos classificadores ”fracos”. O boosting e os m étodos de aprendizagem ser ão ex-plicados em detalhe na secç ão 2.5. O m étodo apresentado é aplic ável a todo o tipo de objectos e utiliza uma t écnica r ápida de extracç ão de caracter´ısticas da imagem atrav és da filtragem linear com m áscaras rectangulares utilizando uma imagem integral. Para diminuir o tempo de classificaç ão total

(19)

é constru´ıdo um classificador em cascata constitu´ıdo por v ários classificadores boosting em camadas subsequentes, secç ão 2.6. A Figura 2.2 mostra o diagrama da abordagem para a detecç ão de crate-ras num bloco de imagem. Dado um bloco da imagem Bn×n_{, extrai-se um vector de caracter´ısticas, f ,}

Figura 2.2: Esquem ático proposto para a detecç ão de cratera num bloco da imagem.

usadas na classificaç ão. O classificador utilizar á essas caracter´ısticas para calcular a decis ão final. O classificador atribui uma etiqueta 1 se existir uma cratera e uma etiqueta 0 caso contr ário. A detecç ão de crateras nas imagens da superf´ıcie de Marte é realizada aplicando este m étodo de classificaç ão a cada bloco de dimens ão n × n, ver Figura 2.3. Para diminuir o efeito da direcç ão de iluminaç ão numa

Figura 2.3: Detecc¸ ˜ao de crateras em imagens de Marte.

imagem rodam-se previamente as imagens de forma a alinhar a direcç ão de iluminaç ão (secç ão 2.3) e ap ós a classificaç ão da imagem na sua totalidade ser á necess ário realizar um processo de supress ão de n ão m áximos (secç ão 2.8).

2.3 Pr ´e-Processamento

A direcç ão da luz incidente na superf´ıcie de Marte varia ao longo do tempo, em funç ão da posiç ão relativa do Sol no instante de aquisiç ão, alterando o aspecto visual das crateras. A colocaç ão de exemplos no conjunto de treino com diferentes direcç ões de luz incidente torna o classificador menos selectivo, por esta raz ão pretende-se alinhar todas as imagens segundo a posiç ão relativa do Sol. Este procedimento é realizado facilmente conhecendo o azimute solar que é fornecido juntamente com as imagens utilizadas nesta dissertaç ão (ver cap´ıtulo 3). O azimute do Sol é o ângulo, em graus (no sentido dos ponteiros do rel ógio), entre uma linha desenhada do centro para a direita da imagem e outra do centro em direcç ão à localizaç ão do sol, no instante de aquisiç ão. Esta informaç ão permite saber a direcç ão e sentido da luz do sol numa imagem. Pretende-se que a direcç ão da luz solar seja igual em todas as imagens. Para esse efeito, as imagens s ão rodadas no valor desse azimute mas segundo o sentido contr ário ao dos ponteiros de rel ógio. Para evitar um fundo a preto ap ós a rotaç ão, a imagem original é inicialmente expandida com o valor dos seus pixels na fronteira para que

(20)

(a) (b)

(c) (d)

Figura 2.4: Exemplo de rotac¸ ˜ao de duas imagens segundo o azimute do Sol. (a) e (c) Imagens originais E0100976 e R1004288 respectivamente; (b) e (d) Imagens E0100976 e R1004288 rodadas segundo o azimute do Sol respectivamente.

futuramente n ão apareçam falsas detecç ões devido a transiç ões bruscas de iluminaç ão. Aplicando este procedimento, todas as imagens ficar ão alinhadas com a mesma direcç ão (horizontal) e sentido (da esquerda para a direita) da fonte de luz, ver dois exemplos na Figura 2.4. Devido à rotaç ão, a dimens ão das imagens aumenta e, consequentemente, aumenta o tempo de computaç ão para a detecç ão de crateras pois existe um maior n úmero de blocos na imagem a classificar.

2.4 Caracter´ısticas da Imagem

2.4.1 M ´ascaras Rectangulares

A extracç ão de caracter´ısticas da imagem é feita atrav és de m áscaras semelhantes às propostas por P.Viola e M.Jones [22]. Estas caracter´ısticas foram inicialmente propostas por Papageorgiou et al. [21] e s ão tamb ém denominadas por caracter´ısticas de Haar (Haar-like features), pois o seu valor é calculado de forma semelhante aos coeficientes de uma Transformada de Haar. Nesta dissertaç ão s ão utilizados cinco tipos de m áscaras diferentes, ver Figura 2.5, sendo poss´ıvel variar a posiç ão e dimens ão de cada m áscara no interior da imagem.

Estas m áscaras s ão caracterizadas pelos seus coeficientes, o coeficiente na zona branca é 1, na zona a preto é -1 e nas restantes zonas é zero. As m áscaras podem alterar a sua forma em altura,

(21)

(a) Tipo 1 (b) Tipo 2 (c) Tipo 3 (d) Tipo 4 (e) Tipo 5

(f) Refer ˆencias

Figura 2.5: Em cima, de (a) a (e), os v ários tipos de m áscaras. Em baixo (f): um exemplo de uma m áscara do Tipo 1 e a representaç ão dos respectivos pontos de refer ência necess ários à definiç ão dos rect ângulos.

comprimento, e localizaç ão dentro da janela. Nesta dissertaç ão é criado um conjunto de m áscaras de dimens ão N: m = {m1, · · · , mj, · · · , mN}. Cada uma dessas m áscaras é definida pelos seus pontos

de refer ência (v értices dos rect ângulos) e o seu tipo. A forma como s ão geradas as v árias m áscaras rectangulares (m) ser á explicada na secç ão 2.7. A localizaç ão e tamanho de cada m áscara est ão definidos pelos seus pontos de refer ência. O valor da caracter´ıstica fj localizada num ponto (x, y)

da imagem é o resultado da filtragem linear da imagem I com a m áscara mj nessa localizaç ão. A

filtragem linear de uma imagem I com uma m áscara M , de tamanho a × b, na localizaç ão (x, y) é dada por: f (x, y) = a X u=1 b X v=1 M (u, v)I(x + u − 1, y + v − 1) (2.1) A resposta da filtragem linear num ponto é calculada pela soma do produto dos coeficientes da m áscara com os correspondentes pixels da imagem coberta pela m áscara. No caso destas m áscaras, o resultado da filtragem linear é simplesmente o somat ório do valor de todos os pixels dentro da zona branca subtra´ıdo pelo somat ório do valor de todos os pixels dentro da zona preta. Aplicando a teoria ao exemplo da Figura 2.5(f), o c álculo da respectiva caracter´ıstica é dado por:

fj(I) =

X

rectI(CDEF ) −

X

rectI(ABCD) (2.2)

Sendo que P rectI(ABCD) e P rectI(CDEF ) representam o somat ´orio de todos os pixels da

imagem I dentro do rect ângulo definido por ABCD e CDEF , respectivamente. Executar o somat ório de todos os pixels dentro de um rect ângulo requer um tempo de computaç ão proporcional ao tamanho dos rect ângulos. O resultado da filtragem linear com este tipo de m áscaras pode ser executado de forma eficiente utilizando o conceito de imagem integral introduzido em [22].

2.4.2 Extracç ão de caracter´ısticas atrav és da imagem integral

A imagem integral é uma imagem auxiliar constru´ıda a partir da imagem original. O valor da imagem integral J no ponto (x, y) é a soma das intensidades de todos os pixels da imagem I acima e à esquerda de (x, y). Assim:

J (x, y) = X

x0_≤x,y0_≤y

(22)

A imagem integral permite calcular o somat ório de todos os pixels dentro de um rect ângulo uti-lizando apenas 3 operaç ões1 _{com quatro pontos de refer ência. Aplicando a definiç ão de imagem}

integral (2.3) à equaç ão (2.2), o c álculo do valor das caracter´ısticas passa a ser executado com um tempo de computaç ão constante e com um n úmero fixo de operaç ões independentemente do tamanho da imagem ou dos rect ângulos, ver equaç ão (2.4). As caracter´ısticas de tipo 1 e 2 (dois rect ângulos) necessitam de seis pontos de refer ência e sete operaç ões. As de tipo 3 e 4 (tr ês rect ângulos) neces-sitam de oito pontos de refer ência e nove operaç ões e as caracter´ısticas de tipo 5 (oito rect ângulos) necessitam de nove pontos de refer ência e dez operaç ões.

fj(I) = [J (F ) − J (D) − J (E) + J (C)] − [J (D) − J (B) − J (C) + J (A)] (2.4)

2.5 Classificador boosting

Neste trabalho utiliza-se um algoritmo de classificaç ão baseado em boosting. O algoritmo imple-mentado é semelhante ao apresentado por P. Viola e M. Jones [22] sendo uma variante do Ada-Boost. O algoritmo AdaBoost foi publicado por Freund e Schapire em 1995 [25] e o seu nome prov ém do termo boosting adaptativo (Adaptive Boosting). O algoritmo procura adaptar uma funç ão de classificaç ão a um conjunto de treino composto por elementos pesados. Funcionando de forma iterativa, o algoritmo escolhe em cada iteraç ão uma funç ão de classificaç ão ”fraca” (weak classifica-tion funcclassifica-tion) com o menor erro de classificaç ão. O termo ”adaptativo” surge da actualizaç ão dos pesos de forma a aumentar o peso dos elementos mal classificados para a iteraç ão seguinte, desta forma os classificadores seguintes ir ão focar-se nos elementos de treino mal classificados pelos clas-sificadores escolhidos nas rondas anteriores. P. Viola e M. Jones utilizam o AdaBoost para selecç ão de caracter´ısticas ao restringirem as funç ões de classificaç ão ao uso de uma única caracter´ıstica denominando-as por classificadores fracos. Assim, os classificadores de boosting tomam a decis ão com base num comit é de classificadores simples designados por classificadores fracos. Denominam-se fracos pois o Denominam-seu deDenominam-sempenho é pobre, Denominam-sendo pouco prov ável que apenas um consiga classifi-car correctamente todo o conjunto de treino. O classificador fraco hj é definido por uma paridade

p ∈ {−1, 1}, uma caracter´ıstica fje um threshold θj, sendo I a imagem, ou o bloco de imagem, a ser

classificado:

hj(I) =

(

1 se p · fj(I) ≥ p · θj

0 caso contrário (2.5) Recapitulando, inicialmente s ão atribu´ıdos pesos para cada elemento de treino. O algoritmo de bo-osting constr ói o classificador final de forma iterativa, seleccionando em cada iteraç ão o classificador fraco com menor erro de classificaç ão. Em cada iteraç ão cada classificador fraco escolhe o melhor threshold de forma a obter o menor erro poss´ıvel, este processo é descrito na secç ão seguinte. No fim de cada iteraç ão atribui-se um peso a cada padr ão de treino. Os padr ões mal classificados v êem o seu peso aumentado e os padr ões bem classificados v êem o seu peso reduzido. Na iteraç ão se-guinte é escolhido um classificador fraco que se concentre na classificaç ão correcta dos elementos com maior peso (mal classificados pelo classificador nas iteraç ões anteriores). A cada classificador fraco seleccionado j é atribu´ıdo um determinado peso αj (ver descriç ão do algoritmo na tabela 2.1).

Assim, no final de T iteraç ões obt ém-se um classificador com um m áximo de T classificadores fracos2

1_{Neste contexto o termo operaç ões refere-se a adiç ões e subtracç ões.}

2_{O mesmo classificador fraco poder ´a ser seleccionado mais do que uma vez pelo algoritmo e com diferentes thresholds}

(23)

cada um associado a uma ´unica caracter´ıstica. As caracter´ısticas seleccionadas s ˜ao as que melhor separam as duas classes do conjunto de treino (crateras e terreno de fundo).

Tabela 2.1: Algoritmo para treino boosting, adaptado de Viola e Jones [22]

Consideremos um conjunto de treino constitu´ıdo por M imagens de treino e respectiva classe bin ´aria {(I1, y1), ..., (IM, yM)}em que yi = 0se Iin ˜ao contiver uma cratera e yi= 1

caso contr ´ario.

• Procede-se à extracç ão de todas as caracter´ısticas em todos os elementos de treino. • Seja p o n úmero de elementos de treino positivos e n o n úmero de elementos de treino negativos. Inicia-se os pesos w de todos os elementos do conjunto da seguinte forma:

w1,i=

1

2·p se elemento i for positivo 1

2·n se elemento i for negativo

(2.6) • Para t = 1, · · · , T :

– Normaliza-se os pesos atribu´ıdos aos exemplos de treino wt:

wt,i=

wt,i

PM

j=1wt,j

(2.7)

– Para cada caracter´ıstica j treina-se o classificador hjcorrespondente e

escolhe-se o classificador ht com menor erro εt, ver secc¸ ˜ao seguinte. O erro de

classificaç ão é dado por:

εj = M

X

i

wt,i· |hj(Ii) − yi| (2.8)

– Actualiza-se os pesos dos exemplos para a iterac¸ ˜ao seguinte wt+1, sendo ei= 0

se o exemplo Ii for classificado correctamente por ht, ei = 1caso contr ´ario, e

βt=_1−εεt

t:

wt+1,i= wt,i· βt1−ei (2.9)

– Atribui-se um peso αt= log(_β1

t)ao classificador ht.

A funç ão discriminante final H(I) (2.10), é obtida atrav és da combinaç ão linear das classificaç ões geradas pelos classificadores fracos escolhidos a cada iteraç ão, ponderada com os pesos α. O clas-sificador final C(I) utiliza o resultado da funç ão discriminante H, seguido de um threshold definido por uma percentagem µ do somat ório dos pesos α, para gerar a decis ão final (2.11).

H(I) = T X t=1 αt· ht(I) (2.10) C(I) = ( 1 se H(I) ≥ µ ·PT t=1αt(0 ≤ µ ≤ 1)

0 caso contrário (2.11) Normalmente o valor escolhido para µ é 0.5. Diminuindo µ, reduzem-se os erros de falhas de detecç ão mas aumenta-se o n úmero de detecç ões falsas. Quando se aumenta µ, diminui-se o n úmero de falsas detecç ões mas aumenta-se o n úmero de falhas de detecç ão. No final é necess ário executar uma an álise aos v ários resultados em funç ão de µ de forma a decidir sobre o compromisso entre taxa de detecç ões correctas e taxa de falsas detecç ões. A Figura 2.6, mostra o resultado de classificaç ão

(24)

de uma imagem com um classificador de boosting sem an ´alise multi-escala. Neste exemplo verifica-se

Figura 2.6: Resultado da classificaç ão da imagem MOC-R1004288 (Zona B) com um classificador boosting sem an álise multi-escala, bloco de dimens ão 20 × 20.

a detecç ão de todas as crateras com escala semelhante entre si. No entanto v árias detecç ões ocorrem em torno de uma cratera. Esta dificuldade é corrigida com um p ós-processamento dos resultados (secç ão 2.8).

2.5.1 Aprendizagem

Como foi referido anteriormente, a aprendizagem é feita atrav és dos classificadores fracos que est ão associados às diferentes caracter´ısticas. Em cada iteraç ão, os pesos dos elementos de treino mudam e por isso é necess ário calcular, em todas as iteraç ões, o threshold óptimo para cada clas-sificador fraco. Para cada clasclas-sificador fraco calcula-se o valor da caracter´ıstica correspondente em todos os M exemplos do conjunto de treino. Os elementos s ão ent ão ordenados por ordem crescente do valor da caracter´ıstica. Para cada elemento ordenado é calculado o erro de classificaç ão utilizando como limiar o valor da caracter´ıstica nesse exemplo. O erro é ponderado segundo os pesos actuais dos exemplos de treino e é avaliado segundo as duas paridades poss´ıveis. Relembrando (2.5), com paridade p = 1 o classificador fraco retorna 1 (cratera) quando o valor da caracter´ıstica é superior ao threshold, portanto s ão erros todos os valores abaixo desse threshold correspondentes a exemplos de crateras e tamb ém todos os exemplos acima desse threshold correspondentes a exemplos falsos. Concluindo, para p = 1 erro de classificaç ão com threshold igual ao valor da caracter´ıstica no exemplo kvem concretizado na equaç ão (2.12). Para a paridade p = −1 é precisamente o inverso, equaç ão (2.13). Ep=1(k) = k X i=1 wiyi+ n X i=k+1 wi(1 − yi) (2.12) Ep=−1(k) = k X i=1 wi(1 − yi) + n X i=k+1 wiyi (2.13)

Sendo que wi representa o peso de elemento i. O erro ´e calculado para todos os valores da

(25)

associado a essa caracter´ıstica s ão os que minimizam o erro de classificaç ão (2.14). Este procedi-mento é executado para todos os classificadores fracos e, a cada iteraç ão, é escolhido o que menor erro apresenta com o threshold e paridade óptimos.

min k ∈ {1, ..., n} p ∈ {−1, 1}

Ep(k) (2.14)

2.6 Classificador boosting em cascata

Com o classificador em cascata, pretende-se diminuir o tempo de processamento necess ário para classificar uma imagem e avaliar as diferenças de desempenho em relaç ão ao classificador de boosting simples, comparando os resultados de detecç ões correctas e falsos alarmes.

O classificador em cascata é constitu´ıdo por uma sequ ência de camadas (layers), sendo que cada camada cont ém um classificador de boosting diferente. Um bloco da imagem ser á classificado como cratera se for avaliado correctamente em todas as camadas do classificador. Se em qualquer camada o bloco for classificado como n ão cratera é de imediato exclu´ıdo, n ão sendo avaliado nas camadas seguintes. A maioria dos blocos de imagem que n ão cont êm crateras s ão rejeitados nas primeiras ca-madas, avaliando um pequeno n úmero de caracter´ısticas, n ão perdendo tempo nos blocos ”f áceis”de classificar. As últimas camadas est ão treinadas para diferenciar os exemplos falsos mais ”dif´ıceis”, das crateras. Um diagrama representativo de um classificador em cascata com 3 camadas é apresentado na Figura 2.7.

Figura 2.7: Representac¸ ˜ao de um classificador em cascata com 3 camadas

Na Tabela 2.2 é descrito o algoritmo de treino para aprendizagem com um classificador em cascata. Este algoritmo permite ao utilizador definir uma taxa m´ınima de detecç ão e uma taxa m áxima de falsas detecç ões toleradas em cada camada, e tamb ém a taxa final de falsas detecç ões. Permite tamb ém especificar o n úmero m´ınimo de caracter´ısticas a utilizar no classificador de boosting em cada camada. Ao contr ário do algoritmo de boosting, cuja condiç ão de paragem é o n úmero de iteraç ões especificado, o crit ério de paragem no treino de um classificador de boosting em cascata é satisfazer a taxa final de falsas detecç ões especificada pelo utilizador ou o n úmero de camadas indicado.

A Figura 2.8 mostra o resultado da classificaç ão de uma imagem (sem multi-escala) de um classi-ficador boosting em cascata. Tamb ém neste exemplo s ão vis´ıveis as m últiplas detecç ões em torno de uma cratera.

(26)

Tabela 2.2: Algoritmo para treino de boosting em cascata, adaptado de Viola e Jones [22] Divide-se o conjunto de treino em conjunto de treino positivo P e conjunto de treino nega-tivo N .

• Escolhe-se um valor para Fmax(taxa m ´axima aceit ´avel de falsos positivos) e para

Dmin(taxa m´ınima aceit ável de detecç ão) em cada camada. Escolheu-se Fmax= 0.3

e Dmin= 0.99.

• Escolhe-se a taxa final de falsas detecc¸ ˜oes Ff inaldesejada. Escolheu-se Ff inal =

0.0001.

• Iniciam-se as vari ´aveis F (0) = 1.0, D(0) = 1.0 e i = 0.

• Define-se o n ´umero m´ınimo de caracter´ısticas a avaliar em cada camada:

Lmin(1) = 15, Lmin(2) = 20, Lmin(3) = 25, · · · → Lmin = [15, 20, 25, ...] (2.15)

• Enquanto F (i) ≥ Ff inal:

– i = i + 1;

– n(i) = Lmin(i); F (i) = F (i − 1);

– Enquanto F (i) ≥ Fmax· F (i − 1) :

* Utiliza-se os conjuntos P e N para treinar um classificador com n(i) carac-ter´ısticas utilizando o algoritmo de boosting.

* Avalia-se o actual classificador em cascata para determinar D(i) e F (i). * Desce-se o threshold da camada i at ´e o classificador em cascata actual ter

uma taxa de detecc¸ ˜ao de pelo menos Dmin× D(i − 1).

* n(i) = n(i) + 1

– Vaza-se o conjunto N .

– Se F (i) ≥ Ff inal: avalia-se o actual classificador em cascata no conjunto de

negativos e colocar em N os mal classificados.

Figura 2.8: Resultado da classificaç ão de imagem MOC-R1004288 (Zona B) como um classificador boosting em cascata sem an álise multi-escala.

(27)

2.7 Classificac¸ ˜ao Multi-Escala

Os classificadores anteriores s ão adequados para detectar crateras com dimens ões id ênticas. Para lidar com grandes variaç ões de escala usa-se um classificador independente de escala. O re-conhecimento de padr ões em v árias escalas pode ser obtido atrav és de diversos classificadores (um para cada escala) ou utilizando uma pir âmide de escalas a serem classificadas pelo mesmo clas-sificador. Nesta dissertaç ão um único classificador é obtido, treinado com padr ões multi-escala. O classificador obtido é utilizado para classificaç ão de todos os blocos de imagem em diversas esca-las3_{. Em todos os blocos de imagem s ão extra´ıdas as mesmas caracter´ısticas sem ser necess ário}

re-amostrar todas as imagens para a mesma resoluç ão, desta forma n ão se perde informaç ão sobre a imagem original. A extracç ão do valor de todas as caracter´ısticas num bloco de imagem é efectuada atrav és do escalamento das m áscaras para a escala S do elemento de treino, seguindo-se o c álculo do seu valor e normalizaç ão atrav és da divis ão por S2_.

O conjunto de m ´ascaras m ´e gerado num bloco quadrado de 1 × 1 (escala S = 1pixel2_{) variando a}

altura, largura, e coordenadas de posiç ão de 0.1 em 0.1, construindo todas as combinaç ões poss´ıveis, s ão geradas 3216 m áscaras rectangulares4, ou seja, m = {m1, · · · , m3216}.

Desta forma o conjunto de treino é constitu´ıdo por imagens de crateras e de exemplos falsos a escalas diferentes. Para cada elemento de treino, cada m áscara é escalada5 para a escala corres-pondente do elemento, seguindo-se o c álculo da caracter´ıstica f nessa escala divido por S2_{para que}

o valor fique normalizado, caracter´ıstica normalizada f0. O classificador ´e portanto treinado com os

valores das caracter´ısticas normalizados em funç ão da escala. O classificador final obtido do treino pode ser utilizado para detectar crateras a diferentes escalas numa imagem desde que a classificaç ão seja feita sobre o valor das caracter´ısticas normalizado. A Figura 2.9 ilustra um esquem ático para o c álculo e normalizaç ão do valor das caracter´ısticas.

Figura 2.9: Representaç ão do c álculo e normalizaç ão de caracter´ısticas.

Para executar o varrimento de uma imagem da superf´ıcie de Marte começa-se por deslocar um bloco quadrado de escala S = 10 (10 × 10 pixel) ao longo de toda a imagem com um desloca-mento δ = 1 pixel. Ap ós classificar todos os blocos à escala S da imagem executa-se de novo o mesmo procedimento com diferentes escalas relacionadas por um factor multiplicativo de 1.25 entre si (S0 = 1.25 · S) at é atingir a escala S = 400. A dimens ão dos blocos de v árias escalas é sempre arredondada à dezena para evitar problemas de arredondamento no escalamento das m áscaras. O resultado final da classificaç ão de uma imagem inteira é um conjunto de detecç ões d. Uma detecç ão

3_{A escala S ´e a dimens ˜ao do bloco quadrado.}

4_{O total de m áscaras é obtido a partir de todas as combinaç ões poss´ıveis de altura, largura e coordenadas de posiç ão.}

N úmero de m áscaras para cada tipo de m áscara: Tipo 1-880, Tipo 2-880, Tipo 3-528, Tipo 4-528 e Tipo 5-400. Totalizando 3216 m áscaras.

(28)

é definida pelas coordenadas de localizaç ão (x, y), pela escala S e pelo valor obtido na funç ão dis-criminante H do classificador, ou seja, um conjunto de N detecç ões pode ser representado por d = {(x1, y1, S1, H1), ..., (xN, yN, SN, HN)}. A Figura 2.10 mostra o resultado da classificaç ão de

uma imagem com um classificador boosting usando multi-escala. De novo s ão vis´ıveis as m últiplas detecç ões em torno de uma cratera.

Figura 2.10: Resultado da classificaç ão de imagem MOC-R1004288 (Zona B) com um classificador boosting com an álise multi-escala.

2.8 P ´

os-Processamento

Devido à pouca sensibilidade do classificador final face a pequenas variaç ões de escala e posiç ão, m últiplas detecç ões ocorrem em torno de uma cratera e a diferentes escalas. As m últiplas detecç ões em torno de uma cratera devem ser agrupadas numa s ó. O agrupamento é feito atrav és do valor da funç ão discriminante obtida de cada detecç ão, pois deseja-se manter apenas a detecç ão com maior valor na funç ão discriminante nesse local, ou seja, realizar uma supress ão de n ão m áximos locais. Os gr áficos da Figura 2.11 representam sob a forma de gr áficos tridimensionais um exemplo da supress ão de n ão m áximos aplicada às detecç ões obtidas ap ós classificaç ão de uma imagem. A descriç ão gen érica do algoritmo para supress ão de n ão m áximos desenvolvido encontra-se na tabela 2.3. O algoritmo é um processo exaustivo de procura por m áximos locais, para isso procura numa vizinhança, em localizaç ão (x, y) e tamb ém em escala (S), por detecç ões com maior valor na funç ão discriminante H. Os valores utilizados para os intervalos de escala e localizaç ão foram obtidos por tentativa-erro.

Ap ós o agrupamento de pontos é tamb ém necess ário rodar as detecç ões e a imagem para a sua orientaç ão inicial, por isso a imagem e as coordenadas das detecç ões s ão rodadas do azimute correspondente à imagem. A Figura 2.12 mostra o resultado do p ós-processamento (supress ão de n ão m áximos e rotaç ão da imagem para a sua orientaç ão inicial) aplicado ao resultado apresentado na Figura 2.10.

(29)

(a) (b)

(c) (d)

Figura 2.11: Supress ão de n ão m áximos. Em (a) e (b) as detecç ões est ão representadas em (x, y) e escala (S). Em (a) as detecç ões ap ós a classificaç ão de uma imagem. Em (b) o resultado ap ós a supress ão de n ão m áximos. Nos gr áficos (c) e (d) as detecç ões est ão representadas em localizaç ão x/y, escala S e funç ão discriminante H. Em (c) as detecç ões ap ós a classificaç ão de uma imagem. Em (b) o resultado ap ós a supress ão de n ão m áximos.

Figura 2.12: Resultado da classificaç ão da imagem MOC-R1004288 (Zona B) com um classificador boosting a v árias escalas com p ós-processamento.

(30)

Tabela 2.3: Procedimento para o agrupamento de detecç ões ap ós classificaç ão de uma imagem com o classificador final.

Dadas as detecç ões ap ós o varrimento a uma imagem, relembrando a secç ão 2.7. Denote-se d o conjunto das detecç ões encontradas numa imagem I, Denote-sendo dj= (xj, yj, Sj, Hj):

• Inicia-se j = 1 e i = 1. Avaliar a distancia ρ de dj à detecç ão seguinte dj+icalculando

a dist ˆancia euclidiana: ρ =

q

(xj− xj+i)2+ (yj− yj+i)2 (2.16)

– Se as duas seguintes condic¸ ˜oes:

ρ ≤Sj

2

0.7 × Sj ≤ Sj+i≤ 2.5 × Sj

forem verificadas, considera-se uma detecç ão vizinha. Neste caso escolhe-se a detecç ão com maior resultado na funç ão discriminante H, ou seja:

* Se Hj< Hj+ielimina-se a detecç ão j do conjunto das detecç ões.

* Caso contr ário elimina-se a detecç ão dj+ido conjunto.

• Incrementa-se i (i = i + 1).

• Repete-se este procedimento para as detecç ões restantes (j = j + 1 e reinicializar i = 1), at é n ão existirem mais detecç ões para agrupar.

(31)

Cap´ıtulo 3

Base de Dados e Conjuntos de Treino

e Teste

Existem actualmente milhares de imagens da superf´ıcie de Marte capturadas pelas sondas que orbitam o planeta, nomeadamente a Mariner 9, Viking 1 e Viking 2, Mars Global Surveyor, Mars Odissey, Mars Express e a Mars Reconnaissance Orbiter. A 15 de Dezembro de 2005 existia um total de 329240 imagens, a Mars Global Surveyor que iniciou a sua ´orbita em torno de Marte a 12 de Setembro de 1997 capturou a imagem 100000 em 20 Novembro de 2001. As imagens utilizadas para este estudo (101 no total) s ˜ao uma pequena amostra da superf´ıcie deste planeta.

A definiç ão dos conjuntos de treino é um passo fundamental no desenho do classificador. A forma como s ão gerados necessita de ser bem definida e explicada. O maior problema da geraç ão de con-juntos de treino n ão reside nos exemplos de crateras (exemplos verdadeiros) mas sim nos exemplos falsos (n ão crateras). Os exemplos positivos s ão facilmente criados a partir da informaç ão dispon´ıvel do Ground Truth. Definir quais os exemplos falsos que devem ser inclu´ıdos no conjunto de treino e de que forma s ão criados, é um aspecto fundamental. Nas seguintes secç ões s ão introduzidos e definidos dois tipos de conjuntos de treino: o conjunto de treino autom ático e iterativo.

3.1 Imagens e Condic¸ ˜

oes de Aquisic¸ ˜ao

O m étodo é testado apenas sobre as imagens obtidas pela MOC, no futuro pretende-se aplicar o m étodo em imagens de diferentes sondas como em [20]. As imagens prov êm de quatro zonas diferentes da superf´ıcie de Marte intituladas: Zona A, Zona B, Zona C e Zona D (visualizar Figura 3.1). Os conjuntos de imagens utilizadas s ão os mesmos de L. Bandeira et al. [18] e foram escolhidas com a ajuda do MIMS (Mars Image Mining System) [23], uma base de dados relacional de endereços internet para a maioria das imagens obtidas das diversas miss ões efectuadas que permitiu obter facilmente todas as imagens MOC dispon´ıveis para as quatro regi ões indicadas. Nesse trabalho [18] algumas imagens ruidosas foram exclu´ıdas do conjunto. O n úmero de imagens em cada zona é diferente (11, 18, 9 e 63 para as zonas A, B, C e D, respectivamente) totalizando 101 imagens.

As imagens s ão apresentadas numa escala de cinzento com 256 n´ıveis e a resoluç ão espacial de cada uma varia entre os 200 e 300 m/pixel. O tamanho de todas as imagens (excepto duas) é de 480×480 pixelse cobrem uma área total de cerca de 1500000 km2_{. Os cientistas dividem a hist ória de}

(32)

Figura 3.1: Superf´ıcie de Marte e as quatro zonas utilizadas (A,B,C e D).

Marte em tr ês per´ıodos geol ógicos: Noachian(a mais de 3.5 mil milh ões de anos), Hesperian(entre 3.5 e 1.8 milh ões de anos) e Amazonian(desde à 1.8 mil milh ões de anos at é hoje). As zonas escolhidas A, B, C e D, correspondem a superf´ıcies do mesmo per´ıodo geol ógico (Hesperian), no entanto mesmo dentro da mesma zona, as superf´ıcies revelam uma grande diversidade de estruturas geol ógicas.

Todas as imagens MOC dispon´ıveis na internet est ão acompanhadas de informaç ões sobre as condiç ões de aquisiç ão tais como longitude, latitude, escala, azimute do Sol, resoluç ão e outros as-pectos, ver Figura 3.2. Foi criado um ficheiro de informaç ão com o nome as imagens utilizadas e o respectivo azimute solar, factor essencial para o pr é-processamento aplicado às imagens para que todas fiquem alinhadas com a mesma direcç ão da fonte de luz. Informaç ão detalhada sobre todas as imagens utilizadas pode ser consultada no Anexo I desta dissertaç ão.

Figura 3.2: Informaç ão dispon´ıvel para a imagem M2100403. No rect ângulo azul est á o valor do azimute solar.

3.2 Identificac¸ ˜ao Manual de Crateras

Para poder gerar o conjunto de treino é necess ário criar exemplos de crateras, ou seja, blocos de imagens contendo crateras, esses exemplos s ão provenientes das imagens definidas para treino.

(33)

Para cada uma das 101 imagens foi criada e guardada informaç ão que nesta dissertaç ão se designa por Ground Truth (GT). A informaç ão de GT inclui a localizaç ão (coordenadas x e y) e di âmetro d (em pixels) de todas as crateras identific áveis visualmente em cada uma das imagens. Esta informaç ão foi produzida de forma manual, no contexto desta dissertaç ão, atrav és de um script desenvolvido onde é pedido ao utilizador que efectue a marcaç ão do centro das crateras e de dois pontos sobre o anel da cratera em margens opostas, de forma a calcular o seu di âmetro pela dist ância entre esses dois pontos. O GT é importante para o treino do classificador e para a sua avaliaç ão no conjunto de teste. O procedimento para a avaliaç ão autom ática do desempenho do classificador no conjunto de teste é explicado em detalhe no cap´ıtulo 4. No GT constru´ıdo para cada imagem est ão marcadas todas as crateras vis´ıveis, mesmo crateras que saem do dom´ınio da imagem e crateras muito pequenas (2 pixels de di âmetro). As crateras muito pequenas foram marcadas numa segunda fase, com um script semelhante ao da primeira fase de recolha de informaç ão utilizando um zoom sobre as zonas onde se encontram as crateras pequenas. No Anexo II desta dissertaç ão é apresentado o GT sobreposto nas correspondentes imagens utilizadas.

3.3 Validac¸ ˜ao Cruzada

Uma vez que o m étodo proposto se baseia em aprendizagem é necess ário definir as imagens a serem utilizadas para o conjunto de treino, que ser á utilizado pelo algoritmo de aprendizagem e as imagens de um conjunto de teste onde ser á avaliado o desempenho dos classificadores finais. Dado que o conjunto de imagens é pequeno, decidiu-se que 75% das imagens ser ão utilizadas para treino e os restantes 25% para teste. Para que seja poss´ıvel utilizar todas as imagens como teste pretende-se

Figura 3.3: Diagrama dos ensaios para validac¸ ˜ao cruzada dos resultados.

realizar uma validaç ão cruzada de resultados realizando quatro ensaios. Como existem quatro zonas distintas, cada uma ser á dividida em 75% para treino e 25% para teste em cada, pelo que no total aproximadamente 75 imagens ser ão utilizadas no treino e 25 para teste em cada ensaio. O conjunto de imagens é dividido em quatro subconjuntos, cada um com 25% (um quarto) das imagens de cada zona. Em cada ensaio, um dos quatro subconjuntos é utilizado como conjunto de teste e os restantes subconjuntos formam o conjunto de treino. Desta forma cada imagem é utilizada no teste uma vez e tr ês vezes no treino, ver ilustraç ão na Figura 3.3. A divis ão 75% para treino e 25% para teste n ão é exacta em cada uma das zonas sendo a diferença compensada no último ensaio, Tabela 3.1.