• Nenhum resultado encontrado

Reconhecimento automático de crateras na superfície de Marte baseado em técnicas de boosting

N/A
N/A
Protected

Academic year: 2021

Share "Reconhecimento automático de crateras na superfície de Marte baseado em técnicas de boosting"

Copied!
82
0
0

Texto

(1)

Outubro de 2007

Reconhecimento automático de crateras na superfície de

Marte baseado em técnicas de boosting

R

ICARDO

F

ERNANDO

L

OPES

F

ONTES

M

ARTINS

Dissertação para obtenção do Grau de Mestre em

E

NGENHARIA

E

LECTROTÉCNICA E DE

C

OMPUTADORES

Júri

Presidente:

Prof. Francisco Miguel Prazeres Silva Garcia

Orientadores:

Prof. Jorge dos Santos Salvador Marques

Prof. Pedro Miguel Berardo Duarte Pina

Vogais:

Profª. Maria Margarida Campos da Silveira

(2)

Agradecimentos

Quero em primeiro lugar dedicar esta dissertac¸ ˜ao de mestrado `a minha fam´ılia, em especial `a minha m ˜ae que sempre acreditou em mim e nas minhas capacidades. Apoiou e apostou, desde sempre, na minha educac¸ ˜ao e formac¸ ˜ao a todos os n´ıveis. Ao meu irm ˜ao por todos os conselhos e aos meus av ´os que garantiram os meus estudos ao longo de todos estes anos. Sem voc ˆes n ˜ao estaria onde estou hoje, a todos o meu eterno e profundo agradecimento.

Agradec¸o tamb ´em aos meus orientadores. Ao Prof. Jorge Salvador Marques, ao Prof. Pedro Pina e `a Profª. Margarida Silveira, obrigado pela vossa paci ˆencia e pelas vossas sugest ˜oes, coment ´arios e cr´ıticas. Especial agradecimento ao Prof. Pedro Pina pela disponibilizac¸ ˜ao do conjunto de imagens utilizadas nesta dissertac¸ ˜ao, anteriormente utilizadas sob o projecto PDCTE/CTA/49724/03 suportado pela FCT (Fundac¸ ˜ao para a Ci ˆencia e Tecnologia).

Por fim quero agradecer a todos os meus amigos de dentro e fora do Instituto Superior T ´ecnico que me apoiaram neste percurso. Em especial `a Dora Gaspar pelos incentivos, compreens ˜ao e paci ˆencia, e por se ter voluntariado para ler esta dissertac¸ ˜ao.

(3)

Resumo

A identificac¸ ˜ao de crateras de impacto numa superf´ıcie planet ´aria assume uma import ˆancia crucial no estudo dos planetas, pois permite a estimac¸ ˜ao da idade de zonas da superf´ıcie atrav ´es de medic¸ ˜oes de tamanho e frequ ˆencia de impactos. Diversos m ´etodos para identificac¸ ˜ao autom ´atica de crateras t ˆem sido desenvolvidos, no entanto nenhum ´e suficientemente robusto de forma a poder ser aplicado em todas as superf´ıcies planet ´arias.

Esta dissertac¸ ˜ao prop ˜oe uma nova abordagem para detecc¸ ˜ao autom ´atica de crateras na superf´ıcie de Marte utilizando algoritmos de aprendizagem baseados em boosting e caracter´ısticas de Haar. Os m ´etodos desenvolvidos s ˜ao inspirados no trabalho de P. Viola e M. Jones [22] em 2001 no contexto de detecc¸ ˜ao de faces. A nova abordagem ´e por si s ´o um contributo para a ´area em quest ˜ao. Outros contributos s ˜ao: a proposta de um mecanismo de treino de classificadores com exemplos de crateras em escalas diferentes, m ´etodos de gerac¸ ˜ao de falsos exemplos para o conjunto de treino e avaliac¸ ˜ao autom ´atica de desempenho dos classificadores. S ˜ao utilizadas 101 imagens da superf´ıcie de Marte para treino e teste. Os m ´etodos propostos s ˜ao avaliados por validac¸ ˜ao cruzada de quatro ensaios. Os melhores resultados para crateras de di ˆametro igual ou superior a 7 pixels variam entre 79% a 88% de taxa de detecc¸ ˜oes correctas e entre 5% a 23% de taxa de falsas detecc¸ ˜oes dependendo do threshold. Os desempenhos est ˜ao pr ´oximos dos melhores publicados at ´e hoje e podem ser melhorados.

(4)

Abstract

The identification of impact craters on a planetary surface has crucial importance for planetary studies because it allows the estimation of the surface age through measures of size and frequency of impacts. Several methods for automatic crater identification have been developed, however none is sufficiently robust to be applied on all planetary surfaces.

This dissertation proposes a new approach to automatic crater detection on the surface of Mars using learning algorithms based on boosting and Haar-like features. The method developed is inspired on the work of P. Viola and M. Jones [22] in 2001 for face detection. This new approach is by itself a contribution to this area. Other contributes are: the proposal of a classifier training mechanism with craters of different scales, methods to produce false examples for the training set and automatic evaluation of the performance of each classifier. For training and testing, 101 images of Mars are used. The proposed method is evaluated through a four fold cross validation. The best global results for craters equal or above 7 pixels of diameter vary between 79% to 88% of true detection rate and 5% to 23% of false detection rate depending on the chosen threshold. The performances are close to the best ever published so far and can be improved.

(5)

Conte ´

udo

Agradecimentos 1 Resumo 2 Abstract 3 Lista de Tabelas 6 Lista de Figuras 7

Lista de Acr ´onimos 10

1 Introduc¸ ˜ao 11

1.1 Estado da Arte . . . 13

1.2 Objectivos e Contribuic¸ ˜oes . . . 14

1.3 Estrutura da Dissertac¸ ˜ao . . . 15

2 Reconhecimento Autom ´atico de Crateras 16 2.1 Formulac¸ ˜ao do Problema . . . 16

2.2 Metodologia . . . 17

2.3 Pr ´e-Processamento . . . 18

2.4 Caracter´ısticas da Imagem . . . 19

2.4.1 M ´ascaras Rectangulares . . . 19

2.4.2 Extracc¸ ˜ao de caracter´ısticas atrav ´es da imagem integral . . . 20

2.5 Classificador boosting . . . 21

2.5.1 Aprendizagem . . . 23

2.6 Classificador boosting em cascata . . . 24

2.7 Classificac¸ ˜ao Multi-Escala . . . 26

2.8 P ´os-Processamento . . . 27

3 Base de Dados e Conjuntos de Treino e Teste 30 3.1 Imagens e Condic¸ ˜oes de Aquisic¸ ˜ao . . . 30

3.2 Identificac¸ ˜ao Manual de Crateras . . . 31

3.3 Validac¸ ˜ao Cruzada . . . 32

3.4 Definic¸ ˜ao de Conjunto de Treino e de Escalas . . . 33

3.5 Conjunto de Treino Autom ´atico . . . 34

(6)

4 Resultados Experimentais 37

4.1 Taxa de Detecc¸ ˜ao e Taxa de Falsas Detecc¸ ˜oes . . . 37

4.2 Avaliac¸ ˜ao Autom ´atica das Detecc¸ ˜oes . . . 38

4.3 Resultados com classificador boosting . . . 40

4.4 Resultados com classificador boosting em cascata . . . 42

4.5 Influ ˆencia do n ´umero de iterac¸ ˜oes e do deslocamento de bloco . . . 43

4.6 Teste simples em imagens de sondas diferentes . . . 45

4.7 Discuss ˜ao dos Resultados . . . 47

5 Conclus ˜oes e Trabalho Futuro 49 Bibliografia 51 Anexos 53 Anexo I - Listagem das Imagens MOC . . . 54

Anexo II - Representac¸ ˜ao do Ground Truth nas Imagens . . . 58

Anexo III - Resultados parciais para boosting simples . . . 68

Anexo IV - Resultados parciais para boosting em cascata . . . 71

(7)

Lista de Tabelas

2.1 Algoritmo para treino boosting, adaptado de Viola e Jones [22] . . . 22

2.2 Algoritmo para treino de boosting em cascata, adaptado de Viola e Jones [22] . . . 25

2.3 Procedimento para o agrupamento de detecc¸ ˜oes ap ´os classificac¸ ˜ao de uma imagem com o classificador final. . . 29

3.1 Tabela com a divis ˜ao do n ´umero de imagens utilizadas em cada ensaio por zona. . . . 33

4.1 Algoritmo desenvolvido para a avaliac¸ ˜ao autom ´atica dos resultados. . . 38

4.2 Tabela com as taxas de detecc¸ ˜ao (TDR) e falsas detecc¸ ˜ao (FDR) globais para os clas-sificadores de boosting obtidos com os v ´arios conjuntos de treino e em func¸ ˜ao de µ. . . 41

4.3 Tabela com as taxas de detecc¸ ˜ao (TDR) e falsas detecc¸ ˜ao (FDR) globais para os clas-sificadores de boosting em cascata obtidos com os v ´arios conjuntos de treino e em func¸ ˜ao de µ. . . 43

5.1 Tabela de informac¸ ˜ao sobre as imagens referentes `a Zona A. . . 54

5.2 Tabela de informac¸ ˜ao sobre as imagens referentes `a Zona B. . . 54

5.3 Tabela de informac¸ ˜ao sobre as imagens referentes `a Zona C. . . 55

(8)

Lista de Figuras

1.1 Modelo cronol ´ogico baseado em crateras de impacto desenvolvido por Hartmann e Neu-kum [2]. O eixo das ordenadas refere-se `a frequ ˆencia de impactos por km2e o eixo das

abcissas `a correspondente idade em mil milh ˜oes de anos. . . 12 2.1 Imagens ilustrativas das dificuldades das imagens. Em (a): imagem R0901855 da zona

B mostra a variedade de tamanhos de crateras. Em (b): imagem R0601245 da zona C ´e vis´ıvel um enorme vale e algumas montanhas. No exemplo em (c): imagem R1301124 da zona D, apresentam-se crateras com aspecto visual muito diferente das duas ima-gens anteriores devido provavelmente a eros ˜ao e ´olica na zona. . . 17 2.2 Esquem ´atico proposto para a detecc¸ ˜ao de cratera num bloco da imagem. . . 18 2.3 Detecc¸ ˜ao de crateras em imagens de Marte. . . 18 2.4 Exemplo de rotac¸ ˜ao de duas imagens segundo o azimute do Sol. (a) e (c) Imagens

origi-nais E0100976 e R1004288 respectivamente; (b) e (d) Imagens E0100976 e R1004288 rodadas segundo o azimute do Sol respectivamente. . . 19 2.5 Em cima, de (a) a (e), os v ´arios tipos de m ´ascaras. Em baixo (f): um exemplo de uma

m ´ascara do Tipo 1 e a representac¸ ˜ao dos respectivos pontos de refer ˆencia necess ´arios `a definic¸ ˜ao dos rect ˆangulos. . . 20 2.6 Resultado da classificac¸ ˜ao da imagem MOC-R1004288 (Zona B) com um classificador

boosting sem an ´alise multi-escala, bloco de dimens ˜ao 20 × 20. . . 23 2.7 Representac¸ ˜ao de um classificador em cascata com 3 camadas . . . 24 2.8 Resultado da classificac¸ ˜ao de imagem MOC-R1004288 (Zona B) como um classificador

boosting em cascata sem an ´alise multi-escala. . . 25 2.9 Representac¸ ˜ao do c ´alculo e normalizac¸ ˜ao de caracter´ısticas. . . 26 2.10 Resultado da classificac¸ ˜ao de imagem MOC-R1004288 (Zona B) com um classificador

boosting com an ´alise multi-escala. . . 27 2.11 Supress ˜ao de n ˜ao m ´aximos. Em (a) e (b) as detecc¸ ˜oes est ˜ao representadas em (x, y) e

escala (S). Em (a) as detecc¸ ˜oes ap ´os a classificac¸ ˜ao de uma imagem. Em (b) o resul-tado ap ´os a supress ˜ao de n ˜ao m ´aximos. Nos gr ´aficos (c) e (d) as detecc¸ ˜oes est ˜ao repre-sentadas em localizac¸ ˜ao x/y, escala S e func¸ ˜ao discriminante H. Em (c) as detecc¸ ˜oes ap ´os a classificac¸ ˜ao de uma imagem. Em (b) o resultado ap ´os a supress ˜ao de n ˜ao m ´aximos. . . 28 2.12 Resultado da classificac¸ ˜ao da imagem MOC-R1004288 (Zona B) com um classificador

boosting a v ´arias escalas com p ´os-processamento. . . 28 3.1 Superf´ıcie de Marte e as quatro zonas utilizadas (A,B,C e D). . . 31 3.2 Informac¸ ˜ao dispon´ıvel para a imagem M2100403. No rect ˆangulo azul est ´a o valor do

(9)

3.3 Diagrama dos ensaios para validac¸ ˜ao cruzada dos resultados. . . 32

3.4 Definic¸ ˜ao da escala adequada a um exemplo de cratera de impacto . . . 33

3.5 Os primeiros 100 exemplos de crateras presentes no conjunto de treino CTA referente ao 1º Ensaio. . . 34

3.6 Exemplos falsos sobre os an ´eis de uma cratera. A verde o exemplo positivo de uma cratera. A vermelho os exemplos falsos enviados para o conjunto de treino . . . 35

3.7 Esquem ´atico do m ´etodo utilizado para gerac¸ ˜ao de conjuntos de treino iterativos . . . . 36

4.1 Legendagem para a avaliac¸ ˜ao dos resultados obtidos numa imagem. . . 39

4.2 Classificac¸ ˜ao de duas imagens: R1004288 da zona B e R1002799 da zona D, com o classificador boosting obtido no 1º Ensaio com CTA (esquerda) e avaliac¸ ˜ao autom ´atica dos resultados (direita). Em (a) e (c) o resultado ap ´os a classificac¸ ˜ao e (c) e (d) a avaliac¸ ˜ao autom ´atica dos resultados. . . 39

4.3 As 10 primeiras caracter´ısticas escolhidas com o classificador boosting treinado com CTA(4º Ensaio). . . 40

4.4 As 10 primeiras caracter´ısticas escolhidas com o classificador boosting treinado com CTI3(4º Ensaio). . . 40

4.5 Curva de ROC para os classificadores de boosting com 50 iterac¸ ˜oes. . . 41

4.6 As dez primeiras caracter´ısticas escolhidas na segunda camada do classificador em cascata para o conjunto CTI3 do quarto ensaio. . . 42

4.7 Curva de ROC para os classificadores de boosting em cascata. . . 43

4.8 Comparac¸ ˜ao de desempenhos do mesmo classificador (obtido do treino boosting sim-ples com CTI3 - 4º Ensaio, µ = 0.6) utilizando diferente n ´umero de iterac¸ ˜oes T . Resul-tados obtidos na imagem R0904061 da Zona A. . . 44

4.9 Comparac¸ ˜ao entre o n ´umero de iterac¸ ˜oes utilizado e o tempo de classificac¸ ˜ao. Resulta-dos resultantes da aplicac¸ ˜ao a todo o conjunto de teste. . . 44

4.10 Comparac¸ ˜ao de desempenhos do mesmo classificador (obtido do treino boosting sim-ples com CTI3 - 4º Ensaio) utilizando passos de deslocamento de bloco δ diferentes. Resultados resultantes da aplicac¸ ˜ao a todo o conjunto de teste. . . 45

4.11 Comparac¸ ˜ao entre o tamanho do deslocamento do passo δ e o tempo de classificac¸ ˜ao. Resultados obtidos na imagem R0904061 da Zona A. . . 46

4.12 Detecc¸ ˜ao de crateras numa imagem proveniente da sonda HRSC com o classificador boosting simples obtido do treino com CTI3, com µ = 0.6. . . 46

4.13 Detecc¸ ˜ao de crateras numa imagem proveniente da sonda Viking 2 com o classificador boosting simples obtido do treino com CTI3. . . 47

5.1 GT para as imagens da Zona A. . . 58

5.2 GT para as imagens da Zona B, parte 1. . . 59

5.3 GT para as imagens da Zona B, parte 2. . . 60

5.4 GT para as imagens da Zona C. . . 61

5.5 GT para as imagens da Zona D, parte 1. . . 62

5.6 GT para as imagens da Zona D, parte 2. . . 63

5.7 GT para as imagens da Zona D, parte 3. . . 64

5.8 GT para as imagens da Zona D, parte 4. . . 65

5.9 GT para as imagens da Zona D, parte 5. . . 66

(10)

5.11 Curvas de ROC para o 1º ensaio, classificadores de boosting com 50 iterac¸ ˜oes. . . 68

5.12 Curvas de ROC para o 2º ensaio, classificadores de boosting com 50 iterac¸ ˜oes. . . 69

5.13 Curvas de ROC para o 3º ensaio, classificadores de boosting com 50 iterac¸ ˜oes. . . 69

5.14 Curvas de ROC para o 4º ensaio, classificadores de boosting com 50 iterac¸ ˜oes. . . 70

5.15 Curvas de ROC para o 1º ensaio, classificadores de boosting em cascata. . . 71

5.16 Curvas de ROC para o 2º ensaio, classificadores de boosting em cascata. . . 72

5.17 Curvas de ROC para o 3º ensaio, classificadores de boosting em cascata. . . 72

5.18 Curvas de ROC para o 4º ensaio, classificadores de boosting em cascata. . . 73

5.19 Resultado parcial para a Zona A, figuras por ordem: E0500815 e E1600100. . . 74

5.20 Resultado parcial para a Zona B 1ª parte, figuras por ordem: E1102299, E1201076 e E1201895. . . 75

5.21 Resultado parcial para a Zona B 2ª parte, figuras por ordem: M0201122. . . 76

5.22 Resultado parcial para a Zona C, figuras por ordem: E0100976. . . 76

5.23 Resultado parcial para a Zona D, 1ª parte, figuras por ordem: E0101393, E0101876 e E0400996. . . 77

5.24 Resultado parcial para a Zona D, 2ª parte, figuras por ordem: E0402024, E1900648 e E1900650. . . 78

5.25 Resultado parcial para a Zona D, 3ª parte, figuras por ordem: E2100529, FHA00514 e M0001055. . . 79

5.26 Resultado parcial para a Zona D, 4ª parte, figuras por ordem: M0001986, M0003044 e M0003160. . . 80

5.27 Resultado parcial para a Zona D, 5ª parte, figuras por ordem: M0200385, M0201769 e M0203009. . . 81

(11)

Lista de Acr ´

onimos

MGS - Mars Global Surveyor.

MOC - Mars Orbital Camera.

HRSC - High Resolution Stereo C ˆamera.

GENIE - GENetic Imagery Exploitation.

CSTM - Continuously Scalable Template Models.

FFT - Fast Fourier Transform.

MIMS - Mars Image Mining System.

CERENA - Centro de Recursos Naturais e Ambiente.

CTA - Conjunto de Treino Autom ´atico.

CTI - Conjunto de Treino Iterativo.

TD - True Detection.

FD - False Detection.

TDR - True Detection Rate.

FDR - False Detection Rate.

GT - Ground Truth.

(12)

Cap´ıtulo 1

Introduc¸ ˜ao

As crateras de impacto s ˜ao estruturas geol ´ogicas formadas pelo impacto de meteoritos sobre a superf´ıcie de um planeta e constituem o motivo de v ´arios estudos efectuados pela comunidade cient´ıfica. S ˜ao uma das caracter´ısticas que mais sobressaem visualmente numa superf´ıcie planet ´aria, sendo a sua formac¸ ˜ao um processo geol ´ogico que ocorre em todo o sistema solar e constitui o principal escultor das superf´ıcies planet ´arias.

A identificac¸ ˜ao de crateras de impacto numa superf´ıcie planet ´aria ´e de import ˆancia fundamental, pois a contagem do n ´umero destas estruturas permite estimar a idade dos terrenos onde se inserem. A compreens ˜ao da evoluc¸ ˜ao geol ´ogica de planetas baseia-se em medidas de distribuic¸ ˜ao de tamanho e frequ ˆencia de impactos, calculadas atrav ´es das imagens recolhidas pelas sondas em ´orbita dos corpos planet ´arios [1]. Sabendo a taxa de produc¸ ˜ao de crateras e assumindo a distribuic¸ ˜ao espacial de crateras de impacto como um processo aleat ´orio, o conhecimento do n ´umero de crateras de uma determinada ´area permite estimar a idade da superf´ıcie em milhares de anos. Terrenos mais antigos apresentam em geral um maior n ´umero de impactos relativamente a terrenos mais recentes.

O desenvolvimento de t ´ecnicas para determinac¸ ˜ao das idades das superf´ıcies teve in´ıcio na d ´ecada de 50. A recolha de rochas provenientes da Lua permitiu saber a idade absoluta das rochas e desen-volver um modelo de estimac¸ ˜ao de idades, baseado no tamanho e frequ ˆencia de impactos observados numa determinada ´area. Assim, a Lua ´e uma base de calibrac¸ ˜ao de modelos para determinac¸ ˜ao da idade de outros planetas. Nos ´ultimos anos t ˆem aparecido diferentes modelos aplicados ao planeta Marte usados para estimar a idade da superf´ıcie de diversas zonas desse planeta. O modelo cro-nol ´ogico constru´ıdo para a Lua foi adaptado para Marte por Hartmann e Neukum em 2001 [2] e ´e apresentado na Figura 1.1.

As crateras de impacto na superf´ıcie de Marte apresentam estados de conservac¸ ˜ao variados (cra-teras mais recentes t ˆem contornos mais bem definidos, cra(cra-teras menos recentes podem apresentar contornos mais difusos). As imagens de maior resoluc¸ ˜ao espacial obtidas pela Mars Orbital Camera (MOC) a bordo da sonda Mars Global Surveyor (MGS) que orbita Marte desde 1997, revelam acti-vidade vulc ˆanica, l´ıquida e e ´olica ap ´os a formac¸ ˜ao das crateras. Estes processos naturais alteram a estrutura geol ´ogica das crateras ao longo do tempo, criando uma grande variedade de formatos de crateras em toda a superf´ıcie. Por outro lado, as dimens ˜oes das crateras variam desde a ordem do metro at ´e aos milhares de quil ´ometros e os terrenos onde ocorrem t ˆem origem e aspectos muito diversos.

O reconhecimento e catalogac¸ ˜ao das crateras de impacto ´e tamb ´em essencial para a cronoes-tratigrafia (o estudo da idade das rochas e todo o seu processo de formac¸ ˜ao) de uma determinada

(13)

Figura 1.1: Modelo cronol ´ogico baseado em crateras de impacto desenvolvido por Hartmann e Neu-kum [2]. O eixo das ordenadas refere-se `a frequ ˆencia de impactos por km2 e o eixo das abcissas `a

correspondente idade em mil milh ˜oes de anos.

regi ˜ao, que permite melhorar a interpretac¸ ˜ao geol ´ogica hist ´orica de um determinado local ou zona da superf´ıcie. Assim, o estudo das crateras de um planeta serve v ´arios fins, como o da compreens ˜ao do pr ´oprio processo de craterismo, o do conhecimento da natureza dos terrenos que foram alvo dos impactos, e sobretudo o da an ´alise e compreens ˜ao dos processos que est ˜ao na origem da sua por vezes acentuada degradac¸ ˜ao (preenchimento parcial ou total das depress ˜oes internas e a eros ˜ao dos bordos elevados) e que contribu´ıram para a definic¸ ˜ao do aspecto actual da superf´ıcie do planeta. Iden-tificar impactos de crateras poder ´a tamb ´em ser importante para a elaborac¸ ˜ao de uma ferramenta de navegac¸ ˜ao espacial, a ser utilizada para definir um local seguro de aterragem em miss ˜oes espaciais futuras.

O processo de identificac¸ ˜ao de crateras tem sido executado por operadores humanos, mas esta operac¸ ˜ao ´e extremamente exigente em termos de tempo (seriam necess ´arios v ´arios anos para cons-truir uma base de dados com toda a informac¸ ˜ao de impactos de crateras em Marte atrav ´es deste processo). Esta situac¸ ˜ao ´e exacerbada pelo aumento da resoluc¸ ˜ao espacial dos instrumentos a bordo das sondas recentes, que permitem a detecc¸ ˜ao de crateras com v ´arias dimens ˜oes.

Por estas raz ˜oes ´e cada vez mais importante providenciar `a comunidade cient´ıfica ferramentas autom ´aticas de detecc¸ ˜ao de crateras. A automac¸ ˜ao total do processo de detecc¸ ˜ao de crateras ser ´a uma contribuic¸ ˜ao importante para o estudo do sistema solar, assim como ser ´a uma preciosa ferra-menta para os operadores humanos que possuem um largo volume de imagens para analisar e po-dendo focar a sua concentrac¸ ˜ao na aplicac¸ ˜ao dos modelos geol ´ogicos aos dados. Diversas linhas de investigac¸ ˜ao t ˆem sido seguidas nas ´ultimas d ´ecadas para se conseguir um processo autom ´atico que permita a identificac¸ ˜ao e contagem de crateras de impacto (algumas ser ˜ao abordadas na secc¸ ˜ao 1.1). Contudo, a identificac¸ ˜ao autom ´atica de crateras atrav ´es de m ´etodos de processamento de imagem provou ser um problema dif´ıcil pois at ´e hoje nenhum dos m ´etodos obteve resultados suficientemente satisfat ´orios para serem aplicados a toda a superf´ıcie de Marte.

(14)

1.1

Estado da Arte

Diversos trabalhos sobre detecc¸ ˜ao autom ´atica de crateras em imagens de superf´ıcies planet ´arias, nomeadamente da Lua e de Marte, t ˆem sido efectuados nos ´ultimos anos. As abordagens para detecc¸ ˜ao de crateras podem ser divididas em duas classes: supervisionadas e n ˜ao-supervisionadas. Ambas as abordagens utilizam conjuntos de treino e teste. Nos m ´etodos n ˜ao-supervisionados os da-dos n ˜ao est ˜ao classificada-dos ao contr ´ario da-dos m ´etoda-dos supervisionada-dos que necessitam de classificac¸ ˜ao dos dados por parte do utilizador.

Os m ´etodos supervisionados [3], [4], [5] e [6] utilizam conceitos de aprendizagem de forma a cons-truir um classificador para a detecc¸ ˜ao de crateras. Em [3] ´e testado um software de aprendizagem autom ´atica chamado GENIE (GENetic Imagery Exploitation). O software avalia o desempenho de v ´arios algoritmos e combina os melhores de forma a classificar correctamente todo o conjunto de treino. ´E utilizada apenas uma imagem de Marte para treino e o resultado apresentado refere-se `a classificac¸ ˜ao dessa mesma imagem com o classificador final (98% de detecc¸ ˜ao e 10% de falsas detecc¸ ˜oes) n ˜ao sendo contabilizadas as crateras de pequenas dimens ˜oes neste resultado. O facto de se usar a mesma imagem para treino e teste conduz a estimativas demasiado optimistas do de-sempenho desta abordagem. Nos trabalhos [4] e [6] utiliza-se a t ´ecnica de modelos de template continuamente escal ´aveis (CSTM-Continuously Scalable Template Models), baseia-se um exemplo real de uma cratera amostrado a v ´arias frequ ˆencias com o objectivo de criar uma fam´ılia de filtros a ser utilizada para classificac¸ ˜ao. No desempenho ambas as abordagens s ˜ao avaliadas num conjunto de teste inferior a cinco imagens, [4] ´e testado numa imagem da superf´ıcie Lunar e obteve 80% de detecc¸ ˜oes correctas e 12% de falsas, [6] ´e testado em tr ˆes exemplos sint ´eticos e uma imagem MOC obtendo um elevado n ´umero de falsas detecc¸ ˜oes. Em [5] v ´arios algoritmos s ˜ao testados e compa-rados (entre os quais redes neuronais, modelos de templates continuamente escal ´aveis e m ´aquinas de vectores de suporte). As m ´aquinas de vectores de suporte mapeiam os vectores de treino num espac¸o dimensional elevado procurando construir um hiperplano que separe as classes. O melhor desempenho foi obtido com m ´aquinas de vectores de suporte com apenas 60% de detecc¸ ˜oes correc-tas num n ´umero n ˜ao especificado de imagens da sonda Viking Orbiter. Em [7] ´e apresentada uma abordagem de redes neuronais para identificac¸ ˜ao de crateras mas apenas testada em tr ˆes blocos de imagem contendo exemplos de crateras e dois exemplos sint ´eticos. Todas as abordagens supervisio-nadas referidas apresentam resultados promissores mas os classificadores resultantes do treino s ˜ao aplicados a um conjunto de teste limitado e alguns apresentam apenas bons resultados em crateras de grandes dimens ˜oes.

A maioria das abordagens baseia-se em m ´etodos n ˜ao-supervisionados e utilizam t ´ecnicas para identificar os an ´eis das crateras numa imagem atrav ´es da extracc¸ ˜ao de caracter´ısticas circulares ou el´ıpticas. As abordagens propostas em [8], [9] e [10] baseiam-se na transformada de Hough para detecc¸ ˜ao de formas circulares. M ´etodos para detecc¸ ˜ao autom ´atica de crateras atrav ´es de dados de topografia digital, [11] e [12], procuram por zonas c ˆoncavas e utilizam tamb ´em a transformada de Hough. Em [13] a detecc¸ ˜ao de crateras ´e feita atrav ´es de an ´alise de textura e em [14] atrav ´es da correlac¸ ˜ao com uma template ap ´os a detecc¸ ˜ao de contornos. Outras abordagens, [15], [16], [17], [18], [19] e [20], optam por combinar diversos dos m ´etodos mencionados (transformada de Hough, an ´alise de textura e correlac¸ ˜ao com template) e outras t ´ecnicas de processamento para detectar crateras. No artigo [20] o m ´etodo combina detecc¸ ˜ao de contornos, medidas de textura e an ´alise de direcc¸ ˜ao de gradientes e ´e testado em imagens provenientes de diferentes sondas.

Dos v ´arios estudos efectuados nenhum obteve taxas de detecc¸ ˜ao acima de 90% e de falsas detecc¸ ˜oes abaixo de 10% sobre um conjunto de imagens de teste de dimens ˜ao consider ´avel (pelo

(15)

menos 10 imagens). No entanto, entre os melhores resultados destaca-se o obtido por L. Bandeira et al.[18]. Neste trabalho o reconhecimento de crateras ´e composto por tr ˆes fases: selecc¸ ˜ao de candi-datos (atrav ´es de detecc¸ ˜ao de contornos), criac¸ ˜ao de um volume de probabilidade criado atrav ´es da correlac¸ ˜ao com templates a v ´arias escalas utilizando uma FFT (Fast Fourier Transform) e detecc¸ ˜ao de crateras atrav ´es da an ´alise de m ´aximos locais. Este m ´etodo n ˜ao supervisionado atinge um resul-tado global de 86% de detecc¸ ˜oes correctas e 12% de falsas detecc¸ ˜oes. O trabalho desenvolvido com dados de topografia digital [11] obteve um bom desempenho (taxa de detecc¸ ˜ao de 88% em imagens provenientes da MOC), mas as imagens de teste foram escolhidas de forma a n ˜ao inclu´ırem crate-ras muito degradadas e localizadas sobre os an ´eis de outcrate-ras cratecrate-ras pois o m ´etodo possui um fraco desempenho nestas situac¸ ˜oes.

1.2

Objectivos e Contribuic¸ ˜

oes

Esta dissertac¸ ˜ao tem como objectivo principal desenvolver um m ´etodo para a detecc¸ ˜ao autom ´atica de crateras, n ˜ao s ´o em imagens da superf´ıcie de Marte como de qualquer outra superf´ıcie planet ´aria, em diferentes escalas, utilizando uma abordagem diferente de todas as outras mencionadas anteri-ormente. Para que este trabalho tenha um bom impacto na comunidade cient´ıfica, deseja-se nesta fase demonstrar que ´e um m ´etodo v ´alido para detecc¸ ˜ao de crateras e por isso dever ´a obter taxas de desempenho pr ´oximas das melhores apresentadas na literatura at ´e hoje.

Para se poder lidar com as fontes de variac¸ ˜ao apresentadas na introduc¸ ˜ao, pretende-se nesta dissertac¸ ˜ao utilizar m ´etodos de aprendizagem autom ´atica capazes de aprender as caracter´ısticas ou features da imagem de fundo e das crateras. Pretende-se ainda usar uma representac¸ ˜ao multi-escala das imagens para tornar o algoritmo independente da escala. As abordagens dos trabalhos apre-sentados na secc¸ ˜ao anterior possuem uma quantidade fixa de caracter´ısticas a serem utilizadas na detecc¸ ˜ao de crateras. Nesta dissertac¸ ˜ao o processo de aprendizagem selecciona as melhores carac-ter´ısticas de entre milhares de caraccarac-ter´ısticas escolhidas pelo utilizador para construir um classificador final. Prop ˜oe-se que esta selecc¸ ˜ao seja feita usando t ´ecnicas de boosting semelhantes `as propostas por P. Viola e M. Jones [22] no contexto da detecc¸ ˜ao de faces em imagens e que demonstraram um desempenho e rapidez not ´aveis mesmo quando h ´a variac¸ ˜oes de escala. Este m ´etodo foi inicialmente aplicado para reconhecimento de caras, sendo hoje considerado um standard em problemas de reco-nhecimento de padr ˜oes.

Em contraste com os trabalhos de aprendizagem apresentados, ser ´a utilizado um conjunto vasto de imagens de diversas regi ˜oes e com crateras de aspecto e dimens ˜ao variados. As imagens utili-zadas neste trabalho s ˜ao as do trabalho desenvolvido por L. Bandeira et al.[18], o que permite uma comparac¸ ˜ao de resultados apesar de existirem algumas diferenc¸as no processo de avaliac¸ ˜ao. Nesta dissertac¸ ˜ao, as imagens ser ˜ao separadas em conjuntos de treino e teste enquanto que em [18] n ˜ao existe um conjunto de treino tendo sido testado em todo o conjunto de imagens. Para demonstrar a validade dos resultados com esta abordagem, ´e feita uma validac¸ ˜ao cruzada realizando v ´arios en-saios para que todas as imagens sejam utilizadas na fase de teste. O c ´odigo foi desenvolvido em MATLABT M e executado num laptop convencional. Este trabalho prop ˜oe uma nova abordagem no contexto de automac¸ ˜ao de detecc¸ ˜ao de crateras, que se pretende competitiva em relac¸ ˜ao aos m ´etodos at ´e hoje propostos pela comunidade cient´ıfica.

(16)

1.3

Estrutura da Dissertac¸ ˜ao

O trabalho encontra-se dividido em mais quatro cap´ıtulos para al ´em do cap´ıtulo de introduc¸ ˜ao. No pr ´oximo cap´ıtulo ´e feita a formulac¸ ˜ao do problema e s ˜ao descritos os algoritmos utilizados para treino e detecc¸ ˜ao de crateras em diversas escalas. No cap´ıtulo 3 explica-se a origem e caracterizac¸ ˜ao das imagens utilizadas. ´E descrito o processo de recolha de informac¸ ˜ao, identificac¸ ˜ao manual de crateras e c ´alculo do seu di ˆametro para a criac¸ ˜ao da base de dados para cada imagem (ground truth). A forma como ´e gerado o conjunto de treino influencia directamente os resultados obtidos pelo classificador final resultante do treino, os tipos de conjuntos de treino constru´ıdos s ˜ao tamb ´em descritos neste cap´ıtulo. No cap´ıtulo 4 apresentam-se os resultados globais ap ´os a validac¸ ˜ao cruzada, alguns testes efectuados e uma cr´ıtica aos resultados obtidos. Finalmente, no cap´ıtulo 6 s ˜ao apresentadas as conclus ˜oes do trabalho, sugest ˜oes para poss´ıveis melhoramentos e trabalho futuro.

(17)

Cap´ıtulo 2

Reconhecimento Autom ´atico de

Crateras

Este cap´ıtulo comec¸a por formular o problema, descrevendo em pormenor as principais dificulda-des. Seguidamente apresenta-se a proposta de resoluc¸ ˜ao do problema, a sua origem, motivac¸ ˜ao e justificac¸ ˜ao. Nas secc¸ ˜oes seguintes explicam-se em detalhe os algoritmos desenvolvidos e o proces-samento envolvido.

2.1

Formulac¸ ˜ao do Problema

Dado um conjunto de imagens de diversas zonas da superf´ıcie de Marte, pretende-se detectar e registar a localizac¸ ˜ao das crateras de impacto atrav ´es de um m ´etodo autom ´atico. Apesar de alguns resultados animadores nos ´ultimos anos, o problema de detecc¸ ˜ao autom ´atica de crateras continua a ser um problema dif´ıcil, n ˜ao existindo ainda uma soluc¸ ˜ao suficientemente satisfat ´oria.

Uma das dificuldades associadas a este problema ´e a diversidade do aspecto visual das crateras de impacto que depende do tipo de terreno em que ocorrem, direcc¸ ˜ao de iluminac¸ ˜ao e do estado atmosf ´erico no instante de aquisic¸ ˜ao. Algumas zonas em estruturas geol ´ogicas tais como vales, mon-tanhas e vulc ˜oes possuem caracter´ısticas morfol ´ogicas semelhantes `as das crateras que podem ser confundidas com crateras. No entanto, a maior dificuldade deve-se aos diferentes tipos de eros ˜ao a que as crateras foram expostas ao longo dos anos (tempestades de poeira, erupc¸ ˜oes de lava e acti-vidade l´ıquida). Por estas raz ˜oes, as crateras possuem uma grande variedade de aspectos. Crateras em diferentes zonas da superf´ıcie foram expostas a diferentes tipos de eros ˜ao, alterando de forma diferente em cada zona, as suas estruturas geol ´ogicas e, consequentemente, as suas caracter´ısticas visuais. ´E tamb ´em frequente a sobreposic¸ ˜ao de crateras, por exemplo, crateras de impacto de menor dimens ˜ao situadas dentro ou sobre o anel de uma cratera de dimens ˜ao maior. Por ´ultimo, o tama-nho das crateras de impacto na superf´ıcie de Marte pode variar entre alguns metros e milhares de quil ´ometros. A Figura 2.1 mostra algumas das dificuldades mencionadas.

Estas dificuldades s ˜ao respons ´aveis pela n ˜ao exist ˆencia at ´e hoje de uma soluc¸ ˜ao final satisfat ´oria para o problema. Para atingir uma soluc¸ ˜ao final satisfat ´oria, o m ´etodo proposto dever ´a ser robusto `as dificuldades anteriores para que possa ser aplicado em toda a superf´ıcie de Marte e tamb ´em a outras superf´ıcies planet ´arias.

(18)

(a) (b) (c)

Figura 2.1: Imagens ilustrativas das dificuldades das imagens. Em (a): imagem R0901855 da zona B mostra a variedade de tamanhos de crateras. Em (b): imagem R0601245 da zona C ´e vis´ıvel um enorme vale e algumas montanhas. No exemplo em (c): imagem R1301124 da zona D, apresentam-se crateras com aspecto visual muito diferente das duas imagens anteriores devido provavelmente a eros ˜ao e ´olica na zona.

2.2

Metodologia

O reconhecimento autom ´atico de crateras enquadra-se nas ´areas de reconhecimento de padr ˜oes e processamento de imagem. Para se poder lidar com as fontes de variac¸ ˜ao apresentadas na secc¸ ˜ao anterior pretende-se aplicar neste trabalho m ´etodos de aprendizagem autom ´atica capazes de apren-der as caracter´ısticas da imagem de fundo e das crateras, a partir de exemplos. Modelos de reco-nhecimento de padr ˜oes podem ser baseados em templates ou caracter´ısticas (features). A estrat ´egia seguida neste trabalho consiste em extrair de imagens, blocos de dimens ˜oes predefinidas e classific ´a-los numa de duas classes: com ou sem cratera no seu interior. A decis ˜ao ´e baseada num conjunto de caracter´ısticas visuais que descrevem o conte ´udo do bloco. O classificador ´e treinado a partir de exemplos fornecidos pelo utilizador correspondendo a blocos com e sem crateras (exemplos positi-vos e negatipositi-vos, respectivamente) para que o classificador aprenda as propriedades estat´ısticas das caracter´ısticas seleccionadas em ambas as classes.

Para o reconhecimento de padr ˜oes numa imagem, a operac¸ ˜ao de extracc¸ ˜ao de caracter´ısticas consiste em extrair valores de determinados atributos de uma imagem que permitam diferenciar os objectos e gerar uma decis ˜ao em func¸ ˜ao dos valores extra´ıdos. Ao contr ´ario de outras abordagens em que as caracter´ısticas s ˜ao definidas pelo utilizador (por exemplo: intensidade m ´edia, vari ˆancia, percentagem de pontos de contorno, formas circulares), neste trabalho parte-se de um n ´umero muito elevado (milhares) de caracter´ısticas e usa-se um m ´etodo de selecc¸ ˜ao autom ´atica que selecciona um pequeno n ´umero (dezenas) de caracter´ısticas a serem utilizadas para o reconhecimento de crateras.

Este trabalho inspira-se no m ´etodo proposto por P. Viola e M. Jones [22] no contexto de detecc¸ ˜ao de faces em imagens, que demonstrou um desempenho not ´avel mesmo na presenc¸a de variac¸ ˜oes de escala. Prop ˜oe-se a utilizac¸ ˜ao de t ´ecnicas de boosting para a selecc¸ ˜ao de caracter´ısticas semelhan-tes. O boosting ´e um conceito utilizado para aprendizagem autom ´atica supervisionada e consiste em combinar classificadores ”fracos” (com um fraco desempenho) treinados com um algoritmo de apren-dizagem simples de forma a obter um classificador ”forte” que apresente um melhor desempenho do que qualquer um dos classificadores ”fracos”. O boosting e os m ´etodos de aprendizagem ser ˜ao ex-plicados em detalhe na secc¸ ˜ao 2.5. O m ´etodo apresentado ´e aplic ´avel a todo o tipo de objectos e utiliza uma t ´ecnica r ´apida de extracc¸ ˜ao de caracter´ısticas da imagem atrav ´es da filtragem linear com m ´ascaras rectangulares utilizando uma imagem integral. Para diminuir o tempo de classificac¸ ˜ao total

(19)

´e constru´ıdo um classificador em cascata constitu´ıdo por v ´arios classificadores boosting em camadas subsequentes, secc¸ ˜ao 2.6. A Figura 2.2 mostra o diagrama da abordagem para a detecc¸ ˜ao de crate-ras num bloco de imagem. Dado um bloco da imagem Bn×n, extrai-se um vector de caracter´ısticas, f ,

Figura 2.2: Esquem ´atico proposto para a detecc¸ ˜ao de cratera num bloco da imagem.

usadas na classificac¸ ˜ao. O classificador utilizar ´a essas caracter´ısticas para calcular a decis ˜ao final. O classificador atribui uma etiqueta 1 se existir uma cratera e uma etiqueta 0 caso contr ´ario. A detecc¸ ˜ao de crateras nas imagens da superf´ıcie de Marte ´e realizada aplicando este m ´etodo de classificac¸ ˜ao a cada bloco de dimens ˜ao n × n, ver Figura 2.3. Para diminuir o efeito da direcc¸ ˜ao de iluminac¸ ˜ao numa

Figura 2.3: Detecc¸ ˜ao de crateras em imagens de Marte.

imagem rodam-se previamente as imagens de forma a alinhar a direcc¸ ˜ao de iluminac¸ ˜ao (secc¸ ˜ao 2.3) e ap ´os a classificac¸ ˜ao da imagem na sua totalidade ser ´a necess ´ario realizar um processo de supress ˜ao de n ˜ao m ´aximos (secc¸ ˜ao 2.8).

2.3

Pr ´e-Processamento

A direcc¸ ˜ao da luz incidente na superf´ıcie de Marte varia ao longo do tempo, em func¸ ˜ao da posic¸ ˜ao relativa do Sol no instante de aquisic¸ ˜ao, alterando o aspecto visual das crateras. A colocac¸ ˜ao de exemplos no conjunto de treino com diferentes direcc¸ ˜oes de luz incidente torna o classificador menos selectivo, por esta raz ˜ao pretende-se alinhar todas as imagens segundo a posic¸ ˜ao relativa do Sol. Este procedimento ´e realizado facilmente conhecendo o azimute solar que ´e fornecido juntamente com as imagens utilizadas nesta dissertac¸ ˜ao (ver cap´ıtulo 3). O azimute do Sol ´e o ˆangulo, em graus (no sentido dos ponteiros do rel ´ogio), entre uma linha desenhada do centro para a direita da imagem e outra do centro em direcc¸ ˜ao `a localizac¸ ˜ao do sol, no instante de aquisic¸ ˜ao. Esta informac¸ ˜ao permite saber a direcc¸ ˜ao e sentido da luz do sol numa imagem. Pretende-se que a direcc¸ ˜ao da luz solar seja igual em todas as imagens. Para esse efeito, as imagens s ˜ao rodadas no valor desse azimute mas segundo o sentido contr ´ario ao dos ponteiros de rel ´ogio. Para evitar um fundo a preto ap ´os a rotac¸ ˜ao, a imagem original ´e inicialmente expandida com o valor dos seus pixels na fronteira para que

(20)

(a) (b)

(c) (d)

Figura 2.4: Exemplo de rotac¸ ˜ao de duas imagens segundo o azimute do Sol. (a) e (c) Imagens originais E0100976 e R1004288 respectivamente; (b) e (d) Imagens E0100976 e R1004288 rodadas segundo o azimute do Sol respectivamente.

futuramente n ˜ao aparec¸am falsas detecc¸ ˜oes devido a transic¸ ˜oes bruscas de iluminac¸ ˜ao. Aplicando este procedimento, todas as imagens ficar ˜ao alinhadas com a mesma direcc¸ ˜ao (horizontal) e sentido (da esquerda para a direita) da fonte de luz, ver dois exemplos na Figura 2.4. Devido `a rotac¸ ˜ao, a dimens ˜ao das imagens aumenta e, consequentemente, aumenta o tempo de computac¸ ˜ao para a detecc¸ ˜ao de crateras pois existe um maior n ´umero de blocos na imagem a classificar.

2.4

Caracter´ısticas da Imagem

2.4.1

M ´ascaras Rectangulares

A extracc¸ ˜ao de caracter´ısticas da imagem ´e feita atrav ´es de m ´ascaras semelhantes `as propostas por P.Viola e M.Jones [22]. Estas caracter´ısticas foram inicialmente propostas por Papageorgiou et al. [21] e s ˜ao tamb ´em denominadas por caracter´ısticas de Haar (Haar-like features), pois o seu valor ´e calculado de forma semelhante aos coeficientes de uma Transformada de Haar. Nesta dissertac¸ ˜ao s ˜ao utilizados cinco tipos de m ´ascaras diferentes, ver Figura 2.5, sendo poss´ıvel variar a posic¸ ˜ao e dimens ˜ao de cada m ´ascara no interior da imagem.

Estas m ´ascaras s ˜ao caracterizadas pelos seus coeficientes, o coeficiente na zona branca ´e 1, na zona a preto ´e -1 e nas restantes zonas ´e zero. As m ´ascaras podem alterar a sua forma em altura,

(21)

(a) Tipo 1 (b) Tipo 2 (c) Tipo 3 (d) Tipo 4 (e) Tipo 5

(f) Refer ˆencias

Figura 2.5: Em cima, de (a) a (e), os v ´arios tipos de m ´ascaras. Em baixo (f): um exemplo de uma m ´ascara do Tipo 1 e a representac¸ ˜ao dos respectivos pontos de refer ˆencia necess ´arios `a definic¸ ˜ao dos rect ˆangulos.

comprimento, e localizac¸ ˜ao dentro da janela. Nesta dissertac¸ ˜ao ´e criado um conjunto de m ´ascaras de dimens ˜ao N: m = {m1, · · · , mj, · · · , mN}. Cada uma dessas m ´ascaras ´e definida pelos seus pontos

de refer ˆencia (v ´ertices dos rect ˆangulos) e o seu tipo. A forma como s ˜ao geradas as v ´arias m ´ascaras rectangulares (m) ser ´a explicada na secc¸ ˜ao 2.7. A localizac¸ ˜ao e tamanho de cada m ´ascara est ˜ao definidos pelos seus pontos de refer ˆencia. O valor da caracter´ıstica fj localizada num ponto (x, y)

da imagem ´e o resultado da filtragem linear da imagem I com a m ´ascara mj nessa localizac¸ ˜ao. A

filtragem linear de uma imagem I com uma m ´ascara M , de tamanho a × b, na localizac¸ ˜ao (x, y) ´e dada por: f (x, y) = a X u=1 b X v=1 M (u, v)I(x + u − 1, y + v − 1) (2.1) A resposta da filtragem linear num ponto ´e calculada pela soma do produto dos coeficientes da m ´ascara com os correspondentes pixels da imagem coberta pela m ´ascara. No caso destas m ´ascaras, o resultado da filtragem linear ´e simplesmente o somat ´orio do valor de todos os pixels dentro da zona branca subtra´ıdo pelo somat ´orio do valor de todos os pixels dentro da zona preta. Aplicando a teoria ao exemplo da Figura 2.5(f), o c ´alculo da respectiva caracter´ıstica ´e dado por:

fj(I) =

X

rectI(CDEF ) −

X

rectI(ABCD) (2.2)

Sendo que P rectI(ABCD) e P rectI(CDEF ) representam o somat ´orio de todos os pixels da

imagem I dentro do rect ˆangulo definido por ABCD e CDEF , respectivamente. Executar o somat ´orio de todos os pixels dentro de um rect ˆangulo requer um tempo de computac¸ ˜ao proporcional ao tamanho dos rect ˆangulos. O resultado da filtragem linear com este tipo de m ´ascaras pode ser executado de forma eficiente utilizando o conceito de imagem integral introduzido em [22].

2.4.2

Extracc¸ ˜ao de caracter´ısticas atrav ´es da imagem integral

A imagem integral ´e uma imagem auxiliar constru´ıda a partir da imagem original. O valor da imagem integral J no ponto (x, y) ´e a soma das intensidades de todos os pixels da imagem I acima e `a esquerda de (x, y). Assim:

J (x, y) = X

x0≤x,y0≤y

(22)

A imagem integral permite calcular o somat ´orio de todos os pixels dentro de um rect ˆangulo uti-lizando apenas 3 operac¸ ˜oes1 com quatro pontos de refer ˆencia. Aplicando a definic¸ ˜ao de imagem

integral (2.3) `a equac¸ ˜ao (2.2), o c ´alculo do valor das caracter´ısticas passa a ser executado com um tempo de computac¸ ˜ao constante e com um n ´umero fixo de operac¸ ˜oes independentemente do tamanho da imagem ou dos rect ˆangulos, ver equac¸ ˜ao (2.4). As caracter´ısticas de tipo 1 e 2 (dois rect ˆangulos) necessitam de seis pontos de refer ˆencia e sete operac¸ ˜oes. As de tipo 3 e 4 (tr ˆes rect ˆangulos) neces-sitam de oito pontos de refer ˆencia e nove operac¸ ˜oes e as caracter´ısticas de tipo 5 (oito rect ˆangulos) necessitam de nove pontos de refer ˆencia e dez operac¸ ˜oes.

fj(I) = [J (F ) − J (D) − J (E) + J (C)] − [J (D) − J (B) − J (C) + J (A)] (2.4)

2.5

Classificador boosting

Neste trabalho utiliza-se um algoritmo de classificac¸ ˜ao baseado em boosting. O algoritmo imple-mentado ´e semelhante ao apresentado por P. Viola e M. Jones [22] sendo uma variante do Ada-Boost. O algoritmo AdaBoost foi publicado por Freund e Schapire em 1995 [25] e o seu nome prov ´em do termo boosting adaptativo (Adaptive Boosting). O algoritmo procura adaptar uma func¸ ˜ao de classificac¸ ˜ao a um conjunto de treino composto por elementos pesados. Funcionando de forma iterativa, o algoritmo escolhe em cada iterac¸ ˜ao uma func¸ ˜ao de classificac¸ ˜ao ”fraca” (weak classifica-tion funcclassifica-tion) com o menor erro de classificac¸ ˜ao. O termo ”adaptativo” surge da actualizac¸ ˜ao dos pesos de forma a aumentar o peso dos elementos mal classificados para a iterac¸ ˜ao seguinte, desta forma os classificadores seguintes ir ˜ao focar-se nos elementos de treino mal classificados pelos clas-sificadores escolhidos nas rondas anteriores. P. Viola e M. Jones utilizam o AdaBoost para selecc¸ ˜ao de caracter´ısticas ao restringirem as func¸ ˜oes de classificac¸ ˜ao ao uso de uma ´unica caracter´ıstica denominando-as por classificadores fracos. Assim, os classificadores de boosting tomam a decis ˜ao com base num comit ´e de classificadores simples designados por classificadores fracos. Denominam-se fracos pois o Denominam-seu deDenominam-sempenho ´e pobre, Denominam-sendo pouco prov ´avel que apenas um consiga classifi-car correctamente todo o conjunto de treino. O classificador fraco hj ´e definido por uma paridade

p ∈ {−1, 1}, uma caracter´ıstica fje um threshold θj, sendo I a imagem, ou o bloco de imagem, a ser

classificado:

hj(I) =

(

1 se p · fj(I) ≥ p · θj

0 caso contr´ario (2.5) Recapitulando, inicialmente s ˜ao atribu´ıdos pesos para cada elemento de treino. O algoritmo de bo-osting constr ´oi o classificador final de forma iterativa, seleccionando em cada iterac¸ ˜ao o classificador fraco com menor erro de classificac¸ ˜ao. Em cada iterac¸ ˜ao cada classificador fraco escolhe o melhor threshold de forma a obter o menor erro poss´ıvel, este processo ´e descrito na secc¸ ˜ao seguinte. No fim de cada iterac¸ ˜ao atribui-se um peso a cada padr ˜ao de treino. Os padr ˜oes mal classificados v ˆeem o seu peso aumentado e os padr ˜oes bem classificados v ˆeem o seu peso reduzido. Na iterac¸ ˜ao se-guinte ´e escolhido um classificador fraco que se concentre na classificac¸ ˜ao correcta dos elementos com maior peso (mal classificados pelo classificador nas iterac¸ ˜oes anteriores). A cada classificador fraco seleccionado j ´e atribu´ıdo um determinado peso αj (ver descric¸ ˜ao do algoritmo na tabela 2.1).

Assim, no final de T iterac¸ ˜oes obt ´em-se um classificador com um m ´aximo de T classificadores fracos2

1Neste contexto o termo operac¸ ˜oes refere-se a adic¸ ˜oes e subtracc¸ ˜oes.

2O mesmo classificador fraco poder ´a ser seleccionado mais do que uma vez pelo algoritmo e com diferentes thresholds

(23)

cada um associado a uma ´unica caracter´ıstica. As caracter´ısticas seleccionadas s ˜ao as que melhor separam as duas classes do conjunto de treino (crateras e terreno de fundo).

Tabela 2.1: Algoritmo para treino boosting, adaptado de Viola e Jones [22]

Consideremos um conjunto de treino constitu´ıdo por M imagens de treino e respectiva classe bin ´aria {(I1, y1), ..., (IM, yM)}em que yi = 0se Iin ˜ao contiver uma cratera e yi= 1

caso contr ´ario.

• Procede-se `a extracc¸ ˜ao de todas as caracter´ısticas em todos os elementos de treino. • Seja p o n ´umero de elementos de treino positivos e n o n ´umero de elementos de treino negativos. Inicia-se os pesos w de todos os elementos do conjunto da seguinte forma:

w1,i=

 1

2·p se elemento i for positivo 1

2·n se elemento i for negativo

(2.6) • Para t = 1, · · · , T :

– Normaliza-se os pesos atribu´ıdos aos exemplos de treino wt:

wt,i=

wt,i

PM

j=1wt,j

(2.7)

– Para cada caracter´ıstica j treina-se o classificador hjcorrespondente e

escolhe-se o classificador ht com menor erro εt, ver secc¸ ˜ao seguinte. O erro de

classificac¸ ˜ao ´e dado por:

εj = M

X

i

wt,i· |hj(Ii) − yi| (2.8)

– Actualiza-se os pesos dos exemplos para a iterac¸ ˜ao seguinte wt+1, sendo ei= 0

se o exemplo Ii for classificado correctamente por ht, ei = 1caso contr ´ario, e

βt=1−εεt

t:

wt+1,i= wt,i· βt1−ei (2.9)

– Atribui-se um peso αt= log(β1

t)ao classificador ht.

A func¸ ˜ao discriminante final H(I) (2.10), ´e obtida atrav ´es da combinac¸ ˜ao linear das classificac¸ ˜oes geradas pelos classificadores fracos escolhidos a cada iterac¸ ˜ao, ponderada com os pesos α. O clas-sificador final C(I) utiliza o resultado da func¸ ˜ao discriminante H, seguido de um threshold definido por uma percentagem µ do somat ´orio dos pesos α, para gerar a decis ˜ao final (2.11).

H(I) = T X t=1 αt· ht(I) (2.10) C(I) = ( 1 se H(I) ≥ µ ·PT t=1αt(0 ≤ µ ≤ 1)

0 caso contr´ario (2.11) Normalmente o valor escolhido para µ ´e 0.5. Diminuindo µ, reduzem-se os erros de falhas de detecc¸ ˜ao mas aumenta-se o n ´umero de detecc¸ ˜oes falsas. Quando se aumenta µ, diminui-se o n ´umero de falsas detecc¸ ˜oes mas aumenta-se o n ´umero de falhas de detecc¸ ˜ao. No final ´e necess ´ario executar uma an ´alise aos v ´arios resultados em func¸ ˜ao de µ de forma a decidir sobre o compromisso entre taxa de detecc¸ ˜oes correctas e taxa de falsas detecc¸ ˜oes. A Figura 2.6, mostra o resultado de classificac¸ ˜ao

(24)

de uma imagem com um classificador de boosting sem an ´alise multi-escala. Neste exemplo verifica-se

Figura 2.6: Resultado da classificac¸ ˜ao da imagem MOC-R1004288 (Zona B) com um classificador boosting sem an ´alise multi-escala, bloco de dimens ˜ao 20 × 20.

a detecc¸ ˜ao de todas as crateras com escala semelhante entre si. No entanto v ´arias detecc¸ ˜oes ocorrem em torno de uma cratera. Esta dificuldade ´e corrigida com um p ´os-processamento dos resultados (secc¸ ˜ao 2.8).

2.5.1

Aprendizagem

Como foi referido anteriormente, a aprendizagem ´e feita atrav ´es dos classificadores fracos que est ˜ao associados `as diferentes caracter´ısticas. Em cada iterac¸ ˜ao, os pesos dos elementos de treino mudam e por isso ´e necess ´ario calcular, em todas as iterac¸ ˜oes, o threshold ´optimo para cada clas-sificador fraco. Para cada clasclas-sificador fraco calcula-se o valor da caracter´ıstica correspondente em todos os M exemplos do conjunto de treino. Os elementos s ˜ao ent ˜ao ordenados por ordem crescente do valor da caracter´ıstica. Para cada elemento ordenado ´e calculado o erro de classificac¸ ˜ao utilizando como limiar o valor da caracter´ıstica nesse exemplo. O erro ´e ponderado segundo os pesos actuais dos exemplos de treino e ´e avaliado segundo as duas paridades poss´ıveis. Relembrando (2.5), com paridade p = 1 o classificador fraco retorna 1 (cratera) quando o valor da caracter´ıstica ´e superior ao threshold, portanto s ˜ao erros todos os valores abaixo desse threshold correspondentes a exemplos de crateras e tamb ´em todos os exemplos acima desse threshold correspondentes a exemplos falsos. Concluindo, para p = 1 erro de classificac¸ ˜ao com threshold igual ao valor da caracter´ıstica no exemplo kvem concretizado na equac¸ ˜ao (2.12). Para a paridade p = −1 ´e precisamente o inverso, equac¸ ˜ao (2.13). Ep=1(k) = k X i=1 wiyi+ n X i=k+1 wi(1 − yi) (2.12) Ep=−1(k) = k X i=1 wi(1 − yi) + n X i=k+1 wiyi (2.13)

Sendo que wi representa o peso de elemento i. O erro ´e calculado para todos os valores da

(25)

associado a essa caracter´ıstica s ˜ao os que minimizam o erro de classificac¸ ˜ao (2.14). Este procedi-mento ´e executado para todos os classificadores fracos e, a cada iterac¸ ˜ao, ´e escolhido o que menor erro apresenta com o threshold e paridade ´optimos.

min k ∈ {1, ..., n} p ∈ {−1, 1}

Ep(k) (2.14)

2.6

Classificador boosting em cascata

Com o classificador em cascata, pretende-se diminuir o tempo de processamento necess ´ario para classificar uma imagem e avaliar as diferenc¸as de desempenho em relac¸ ˜ao ao classificador de boosting simples, comparando os resultados de detecc¸ ˜oes correctas e falsos alarmes.

O classificador em cascata ´e constitu´ıdo por uma sequ ˆencia de camadas (layers), sendo que cada camada cont ´em um classificador de boosting diferente. Um bloco da imagem ser ´a classificado como cratera se for avaliado correctamente em todas as camadas do classificador. Se em qualquer camada o bloco for classificado como n ˜ao cratera ´e de imediato exclu´ıdo, n ˜ao sendo avaliado nas camadas seguintes. A maioria dos blocos de imagem que n ˜ao cont ˆem crateras s ˜ao rejeitados nas primeiras ca-madas, avaliando um pequeno n ´umero de caracter´ısticas, n ˜ao perdendo tempo nos blocos ”f ´aceis”de classificar. As ´ultimas camadas est ˜ao treinadas para diferenciar os exemplos falsos mais ”dif´ıceis”, das crateras. Um diagrama representativo de um classificador em cascata com 3 camadas ´e apresentado na Figura 2.7.

Figura 2.7: Representac¸ ˜ao de um classificador em cascata com 3 camadas

Na Tabela 2.2 ´e descrito o algoritmo de treino para aprendizagem com um classificador em cascata. Este algoritmo permite ao utilizador definir uma taxa m´ınima de detecc¸ ˜ao e uma taxa m ´axima de falsas detecc¸ ˜oes toleradas em cada camada, e tamb ´em a taxa final de falsas detecc¸ ˜oes. Permite tamb ´em especificar o n ´umero m´ınimo de caracter´ısticas a utilizar no classificador de boosting em cada camada. Ao contr ´ario do algoritmo de boosting, cuja condic¸ ˜ao de paragem ´e o n ´umero de iterac¸ ˜oes especificado, o crit ´erio de paragem no treino de um classificador de boosting em cascata ´e satisfazer a taxa final de falsas detecc¸ ˜oes especificada pelo utilizador ou o n ´umero de camadas indicado.

A Figura 2.8 mostra o resultado da classificac¸ ˜ao de uma imagem (sem multi-escala) de um classi-ficador boosting em cascata. Tamb ´em neste exemplo s ˜ao vis´ıveis as m ´ultiplas detecc¸ ˜oes em torno de uma cratera.

(26)

Tabela 2.2: Algoritmo para treino de boosting em cascata, adaptado de Viola e Jones [22] Divide-se o conjunto de treino em conjunto de treino positivo P e conjunto de treino nega-tivo N .

• Escolhe-se um valor para Fmax(taxa m ´axima aceit ´avel de falsos positivos) e para

Dmin(taxa m´ınima aceit ´avel de detecc¸ ˜ao) em cada camada. Escolheu-se Fmax= 0.3

e Dmin= 0.99.

• Escolhe-se a taxa final de falsas detecc¸ ˜oes Ff inaldesejada. Escolheu-se Ff inal =

0.0001.

• Iniciam-se as vari ´aveis F (0) = 1.0, D(0) = 1.0 e i = 0.

• Define-se o n ´umero m´ınimo de caracter´ısticas a avaliar em cada camada:

Lmin(1) = 15, Lmin(2) = 20, Lmin(3) = 25, · · · → Lmin = [15, 20, 25, ...] (2.15)

• Enquanto F (i) ≥ Ff inal:

– i = i + 1;

– n(i) = Lmin(i); F (i) = F (i − 1);

– Enquanto F (i) ≥ Fmax· F (i − 1) :

* Utiliza-se os conjuntos P e N para treinar um classificador com n(i) carac-ter´ısticas utilizando o algoritmo de boosting.

* Avalia-se o actual classificador em cascata para determinar D(i) e F (i). * Desce-se o threshold da camada i at ´e o classificador em cascata actual ter

uma taxa de detecc¸ ˜ao de pelo menos Dmin× D(i − 1).

* n(i) = n(i) + 1

– Vaza-se o conjunto N .

– Se F (i) ≥ Ff inal: avalia-se o actual classificador em cascata no conjunto de

negativos e colocar em N os mal classificados.

Figura 2.8: Resultado da classificac¸ ˜ao de imagem MOC-R1004288 (Zona B) como um classificador boosting em cascata sem an ´alise multi-escala.

(27)

2.7

Classificac¸ ˜ao Multi-Escala

Os classificadores anteriores s ˜ao adequados para detectar crateras com dimens ˜oes id ˆenticas. Para lidar com grandes variac¸ ˜oes de escala usa-se um classificador independente de escala. O re-conhecimento de padr ˜oes em v ´arias escalas pode ser obtido atrav ´es de diversos classificadores (um para cada escala) ou utilizando uma pir ˆamide de escalas a serem classificadas pelo mesmo clas-sificador. Nesta dissertac¸ ˜ao um ´unico classificador ´e obtido, treinado com padr ˜oes multi-escala. O classificador obtido ´e utilizado para classificac¸ ˜ao de todos os blocos de imagem em diversas esca-las3. Em todos os blocos de imagem s ˜ao extra´ıdas as mesmas caracter´ısticas sem ser necess ´ario

re-amostrar todas as imagens para a mesma resoluc¸ ˜ao, desta forma n ˜ao se perde informac¸ ˜ao sobre a imagem original. A extracc¸ ˜ao do valor de todas as caracter´ısticas num bloco de imagem ´e efectuada atrav ´es do escalamento das m ´ascaras para a escala S do elemento de treino, seguindo-se o c ´alculo do seu valor e normalizac¸ ˜ao atrav ´es da divis ˜ao por S2.

O conjunto de m ´ascaras m ´e gerado num bloco quadrado de 1 × 1 (escala S = 1pixel2) variando a

altura, largura, e coordenadas de posic¸ ˜ao de 0.1 em 0.1, construindo todas as combinac¸ ˜oes poss´ıveis, s ˜ao geradas 3216 m ´ascaras rectangulares4, ou seja, m = {m1, · · · , m3216}.

Desta forma o conjunto de treino ´e constitu´ıdo por imagens de crateras e de exemplos falsos a escalas diferentes. Para cada elemento de treino, cada m ´ascara ´e escalada5 para a escala corres-pondente do elemento, seguindo-se o c ´alculo da caracter´ıstica f nessa escala divido por S2para que

o valor fique normalizado, caracter´ıstica normalizada f0. O classificador ´e portanto treinado com os

valores das caracter´ısticas normalizados em func¸ ˜ao da escala. O classificador final obtido do treino pode ser utilizado para detectar crateras a diferentes escalas numa imagem desde que a classificac¸ ˜ao seja feita sobre o valor das caracter´ısticas normalizado. A Figura 2.9 ilustra um esquem ´atico para o c ´alculo e normalizac¸ ˜ao do valor das caracter´ısticas.

Figura 2.9: Representac¸ ˜ao do c ´alculo e normalizac¸ ˜ao de caracter´ısticas.

Para executar o varrimento de uma imagem da superf´ıcie de Marte comec¸a-se por deslocar um bloco quadrado de escala S = 10 (10 × 10 pixel) ao longo de toda a imagem com um desloca-mento δ = 1 pixel. Ap ´os classificar todos os blocos `a escala S da imagem executa-se de novo o mesmo procedimento com diferentes escalas relacionadas por um factor multiplicativo de 1.25 entre si (S0 = 1.25 · S) at ´e atingir a escala S = 400. A dimens ˜ao dos blocos de v ´arias escalas ´e sempre arredondada `a dezena para evitar problemas de arredondamento no escalamento das m ´ascaras. O resultado final da classificac¸ ˜ao de uma imagem inteira ´e um conjunto de detecc¸ ˜oes d. Uma detecc¸ ˜ao

3A escala S ´e a dimens ˜ao do bloco quadrado.

4O total de m ´ascaras ´e obtido a partir de todas as combinac¸ ˜oes poss´ıveis de altura, largura e coordenadas de posic¸ ˜ao.

N ´umero de m ´ascaras para cada tipo de m ´ascara: Tipo 1-880, Tipo 2-880, Tipo 3-528, Tipo 4-528 e Tipo 5-400. Totalizando 3216 m ´ascaras.

(28)

´e definida pelas coordenadas de localizac¸ ˜ao (x, y), pela escala S e pelo valor obtido na func¸ ˜ao dis-criminante H do classificador, ou seja, um conjunto de N detecc¸ ˜oes pode ser representado por d = {(x1, y1, S1, H1), ..., (xN, yN, SN, HN)}. A Figura 2.10 mostra o resultado da classificac¸ ˜ao de

uma imagem com um classificador boosting usando multi-escala. De novo s ˜ao vis´ıveis as m ´ultiplas detecc¸ ˜oes em torno de uma cratera.

Figura 2.10: Resultado da classificac¸ ˜ao de imagem MOC-R1004288 (Zona B) com um classificador boosting com an ´alise multi-escala.

2.8

P ´

os-Processamento

Devido `a pouca sensibilidade do classificador final face a pequenas variac¸ ˜oes de escala e posic¸ ˜ao, m ´ultiplas detecc¸ ˜oes ocorrem em torno de uma cratera e a diferentes escalas. As m ´ultiplas detecc¸ ˜oes em torno de uma cratera devem ser agrupadas numa s ´o. O agrupamento ´e feito atrav ´es do valor da func¸ ˜ao discriminante obtida de cada detecc¸ ˜ao, pois deseja-se manter apenas a detecc¸ ˜ao com maior valor na func¸ ˜ao discriminante nesse local, ou seja, realizar uma supress ˜ao de n ˜ao m ´aximos locais. Os gr ´aficos da Figura 2.11 representam sob a forma de gr ´aficos tridimensionais um exemplo da supress ˜ao de n ˜ao m ´aximos aplicada `as detecc¸ ˜oes obtidas ap ´os classificac¸ ˜ao de uma imagem. A descric¸ ˜ao gen ´erica do algoritmo para supress ˜ao de n ˜ao m ´aximos desenvolvido encontra-se na tabela 2.3. O algoritmo ´e um processo exaustivo de procura por m ´aximos locais, para isso procura numa vizinhanc¸a, em localizac¸ ˜ao (x, y) e tamb ´em em escala (S), por detecc¸ ˜oes com maior valor na func¸ ˜ao discriminante H. Os valores utilizados para os intervalos de escala e localizac¸ ˜ao foram obtidos por tentativa-erro.

Ap ´os o agrupamento de pontos ´e tamb ´em necess ´ario rodar as detecc¸ ˜oes e a imagem para a sua orientac¸ ˜ao inicial, por isso a imagem e as coordenadas das detecc¸ ˜oes s ˜ao rodadas do azimute correspondente `a imagem. A Figura 2.12 mostra o resultado do p ´os-processamento (supress ˜ao de n ˜ao m ´aximos e rotac¸ ˜ao da imagem para a sua orientac¸ ˜ao inicial) aplicado ao resultado apresentado na Figura 2.10.

(29)

(a) (b)

(c) (d)

Figura 2.11: Supress ˜ao de n ˜ao m ´aximos. Em (a) e (b) as detecc¸ ˜oes est ˜ao representadas em (x, y) e escala (S). Em (a) as detecc¸ ˜oes ap ´os a classificac¸ ˜ao de uma imagem. Em (b) o resultado ap ´os a supress ˜ao de n ˜ao m ´aximos. Nos gr ´aficos (c) e (d) as detecc¸ ˜oes est ˜ao representadas em localizac¸ ˜ao x/y, escala S e func¸ ˜ao discriminante H. Em (c) as detecc¸ ˜oes ap ´os a classificac¸ ˜ao de uma imagem. Em (b) o resultado ap ´os a supress ˜ao de n ˜ao m ´aximos.

Figura 2.12: Resultado da classificac¸ ˜ao da imagem MOC-R1004288 (Zona B) com um classificador boosting a v ´arias escalas com p ´os-processamento.

(30)

Tabela 2.3: Procedimento para o agrupamento de detecc¸ ˜oes ap ´os classificac¸ ˜ao de uma imagem com o classificador final.

Dadas as detecc¸ ˜oes ap ´os o varrimento a uma imagem, relembrando a secc¸ ˜ao 2.7. Denote-se d o conjunto das detecc¸ ˜oes encontradas numa imagem I, Denote-sendo dj= (xj, yj, Sj, Hj):

• Inicia-se j = 1 e i = 1. Avaliar a distancia ρ de dj `a detecc¸ ˜ao seguinte dj+icalculando

a dist ˆancia euclidiana: ρ =

q

(xj− xj+i)2+ (yj− yj+i)2 (2.16)

– Se as duas seguintes condic¸ ˜oes:

ρ ≤Sj

2

0.7 × Sj ≤ Sj+i≤ 2.5 × Sj

forem verificadas, considera-se uma detecc¸ ˜ao vizinha. Neste caso escolhe-se a detecc¸ ˜ao com maior resultado na func¸ ˜ao discriminante H, ou seja:

* Se Hj< Hj+ielimina-se a detecc¸ ˜ao j do conjunto das detecc¸ ˜oes.

* Caso contr ´ario elimina-se a detecc¸ ˜ao dj+ido conjunto.

• Incrementa-se i (i = i + 1).

• Repete-se este procedimento para as detecc¸ ˜oes restantes (j = j + 1 e reinicializar i = 1), at ´e n ˜ao existirem mais detecc¸ ˜oes para agrupar.

(31)

Cap´ıtulo 3

Base de Dados e Conjuntos de Treino

e Teste

Existem actualmente milhares de imagens da superf´ıcie de Marte capturadas pelas sondas que orbitam o planeta, nomeadamente a Mariner 9, Viking 1 e Viking 2, Mars Global Surveyor, Mars Odissey, Mars Express e a Mars Reconnaissance Orbiter. A 15 de Dezembro de 2005 existia um total de 329240 imagens, a Mars Global Surveyor que iniciou a sua ´orbita em torno de Marte a 12 de Setembro de 1997 capturou a imagem 100000 em 20 Novembro de 2001. As imagens utilizadas para este estudo (101 no total) s ˜ao uma pequena amostra da superf´ıcie deste planeta.

A definic¸ ˜ao dos conjuntos de treino ´e um passo fundamental no desenho do classificador. A forma como s ˜ao gerados necessita de ser bem definida e explicada. O maior problema da gerac¸ ˜ao de con-juntos de treino n ˜ao reside nos exemplos de crateras (exemplos verdadeiros) mas sim nos exemplos falsos (n ˜ao crateras). Os exemplos positivos s ˜ao facilmente criados a partir da informac¸ ˜ao dispon´ıvel do Ground Truth. Definir quais os exemplos falsos que devem ser inclu´ıdos no conjunto de treino e de que forma s ˜ao criados, ´e um aspecto fundamental. Nas seguintes secc¸ ˜oes s ˜ao introduzidos e definidos dois tipos de conjuntos de treino: o conjunto de treino autom ´atico e iterativo.

3.1

Imagens e Condic¸ ˜

oes de Aquisic¸ ˜ao

O m ´etodo ´e testado apenas sobre as imagens obtidas pela MOC, no futuro pretende-se aplicar o m ´etodo em imagens de diferentes sondas como em [20]. As imagens prov ˆem de quatro zonas diferentes da superf´ıcie de Marte intituladas: Zona A, Zona B, Zona C e Zona D (visualizar Figura 3.1). Os conjuntos de imagens utilizadas s ˜ao os mesmos de L. Bandeira et al. [18] e foram escolhidas com a ajuda do MIMS (Mars Image Mining System) [23], uma base de dados relacional de enderec¸os internet para a maioria das imagens obtidas das diversas miss ˜oes efectuadas que permitiu obter facilmente todas as imagens MOC dispon´ıveis para as quatro regi ˜oes indicadas. Nesse trabalho [18] algumas imagens ruidosas foram exclu´ıdas do conjunto. O n ´umero de imagens em cada zona ´e diferente (11, 18, 9 e 63 para as zonas A, B, C e D, respectivamente) totalizando 101 imagens.

As imagens s ˜ao apresentadas numa escala de cinzento com 256 n´ıveis e a resoluc¸ ˜ao espacial de cada uma varia entre os 200 e 300 m/pixel. O tamanho de todas as imagens (excepto duas) ´e de 480×480 pixelse cobrem uma ´area total de cerca de 1500000 km2. Os cientistas dividem a hist ´oria de

(32)

Figura 3.1: Superf´ıcie de Marte e as quatro zonas utilizadas (A,B,C e D).

Marte em tr ˆes per´ıodos geol ´ogicos: Noachian(a mais de 3.5 mil milh ˜oes de anos), Hesperian(entre 3.5 e 1.8 milh ˜oes de anos) e Amazonian(desde `a 1.8 mil milh ˜oes de anos at ´e hoje). As zonas escolhidas A, B, C e D, correspondem a superf´ıcies do mesmo per´ıodo geol ´ogico (Hesperian), no entanto mesmo dentro da mesma zona, as superf´ıcies revelam uma grande diversidade de estruturas geol ´ogicas.

Todas as imagens MOC dispon´ıveis na internet est ˜ao acompanhadas de informac¸ ˜oes sobre as condic¸ ˜oes de aquisic¸ ˜ao tais como longitude, latitude, escala, azimute do Sol, resoluc¸ ˜ao e outros as-pectos, ver Figura 3.2. Foi criado um ficheiro de informac¸ ˜ao com o nome as imagens utilizadas e o respectivo azimute solar, factor essencial para o pr ´e-processamento aplicado `as imagens para que todas fiquem alinhadas com a mesma direcc¸ ˜ao da fonte de luz. Informac¸ ˜ao detalhada sobre todas as imagens utilizadas pode ser consultada no Anexo I desta dissertac¸ ˜ao.

Figura 3.2: Informac¸ ˜ao dispon´ıvel para a imagem M2100403. No rect ˆangulo azul est ´a o valor do azimute solar.

3.2

Identificac¸ ˜ao Manual de Crateras

Para poder gerar o conjunto de treino ´e necess ´ario criar exemplos de crateras, ou seja, blocos de imagens contendo crateras, esses exemplos s ˜ao provenientes das imagens definidas para treino.

(33)

Para cada uma das 101 imagens foi criada e guardada informac¸ ˜ao que nesta dissertac¸ ˜ao se designa por Ground Truth (GT). A informac¸ ˜ao de GT inclui a localizac¸ ˜ao (coordenadas x e y) e di ˆametro d (em pixels) de todas as crateras identific ´aveis visualmente em cada uma das imagens. Esta informac¸ ˜ao foi produzida de forma manual, no contexto desta dissertac¸ ˜ao, atrav ´es de um script desenvolvido onde ´e pedido ao utilizador que efectue a marcac¸ ˜ao do centro das crateras e de dois pontos sobre o anel da cratera em margens opostas, de forma a calcular o seu di ˆametro pela dist ˆancia entre esses dois pontos. O GT ´e importante para o treino do classificador e para a sua avaliac¸ ˜ao no conjunto de teste. O procedimento para a avaliac¸ ˜ao autom ´atica do desempenho do classificador no conjunto de teste ´e explicado em detalhe no cap´ıtulo 4. No GT constru´ıdo para cada imagem est ˜ao marcadas todas as crateras vis´ıveis, mesmo crateras que saem do dom´ınio da imagem e crateras muito pequenas (2 pixels de di ˆametro). As crateras muito pequenas foram marcadas numa segunda fase, com um script semelhante ao da primeira fase de recolha de informac¸ ˜ao utilizando um zoom sobre as zonas onde se encontram as crateras pequenas. No Anexo II desta dissertac¸ ˜ao ´e apresentado o GT sobreposto nas correspondentes imagens utilizadas.

3.3

Validac¸ ˜ao Cruzada

Uma vez que o m ´etodo proposto se baseia em aprendizagem ´e necess ´ario definir as imagens a serem utilizadas para o conjunto de treino, que ser ´a utilizado pelo algoritmo de aprendizagem e as imagens de um conjunto de teste onde ser ´a avaliado o desempenho dos classificadores finais. Dado que o conjunto de imagens ´e pequeno, decidiu-se que 75% das imagens ser ˜ao utilizadas para treino e os restantes 25% para teste. Para que seja poss´ıvel utilizar todas as imagens como teste pretende-se

Figura 3.3: Diagrama dos ensaios para validac¸ ˜ao cruzada dos resultados.

realizar uma validac¸ ˜ao cruzada de resultados realizando quatro ensaios. Como existem quatro zonas distintas, cada uma ser ´a dividida em 75% para treino e 25% para teste em cada, pelo que no total aproximadamente 75 imagens ser ˜ao utilizadas no treino e 25 para teste em cada ensaio. O conjunto de imagens ´e dividido em quatro subconjuntos, cada um com 25% (um quarto) das imagens de cada zona. Em cada ensaio, um dos quatro subconjuntos ´e utilizado como conjunto de teste e os restantes subconjuntos formam o conjunto de treino. Desta forma cada imagem ´e utilizada no teste uma vez e tr ˆes vezes no treino, ver ilustrac¸ ˜ao na Figura 3.3. A divis ˜ao 75% para treino e 25% para teste n ˜ao ´e exacta em cada uma das zonas sendo a diferenc¸a compensada no ´ultimo ensaio, Tabela 3.1.

Referências

Documentos relacionados

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

Este dado diz respeito ao número total de contentores do sistema de resíduos urbanos indiferenciados, não sendo considerados os contentores de recolha

Os testes de desequilíbrio de resistência DC dentro de um par e de desequilíbrio de resistência DC entre pares se tornarão uma preocupação ainda maior à medida que mais

In this work, TiO2 nanoparticles were dispersed and stabilized in water using a novel type of dispersant based on tailor-made amphiphilic block copolymers of

Esta pesquisa teve como objetivo avaliar as características de madeira do híbrido Euca/ytpus grandis x Euca/ytpus urophylla e da celulose entre o primeiro ano até o sétimo ano

Este trabalho busca reconhecer as fragilidades e potencialidades do uso de produtos de sensoriamento remoto derivados do Satélite de Recursos Terrestres Sino-Brasileiro