M´ odulo Processo Central - Abordagem Metodol´ ogica

4.1 Abordagem Metodol´ ogica

4.1.1 M´ odulo Processo Central

O Processo Central (Figura 4.4) é o núcleo do processamento dos dados. Através de códigos de programa¸cão, em linguagem Python 2.7, foram criados códigos que permitem o processamento semi-automático dos dados. A rotina desenvolvida para a extra¸cão dos dados respeita critérios espec´ıficos e necessita de três informa¸cões para iniciar o processo: coordenada do centro do rio, número do track que cruza o rio e a distância em que os dados serão extra´ıdos ao longo do track a partir da coordenada central. A coordenada pode ser consultada através de sistemas de informa¸cão geográfica ou até mesmo com o Google Earth, já o número do track deve ser consultado na camada vetorial disponibilizada pelas agências espaciais responsáveis pelos satélites2_.

Na Figura 4.5 é apresentado um exemplo da extra¸cão realizada nesta etapa. Na região de Manga há um cruzamento entre o track 835 e o RSF, no par de coordenadas [S 14,9272;W 43,9620]. Ao inserir estas informa¸cões, a rotina desenvolvida busca e se- leciona todos os pontos dentro da distância estabelecida. Todos os pontos selecionados são enviados ao Processo de Retracking, no qual são calculadas as altitudes. Ao

2_Ender¸_{co para download} _{dos tracks} _{em formato kml para Saral e Envisat:} _https _:

Figura 4.4: Processo Central - Extra¸cão do conjunto de pontos. Essa etapa se inicia com a inser¸cão da coordenada central do curso d’água, a partir dela são extra´ıdos os dados dos satélites. Do conjunto de medidas de altitude, gerados no Processo de Retracking, é extra´ıda a mediana. Este valor é salvo e corresponde a cota altimétrica na esta¸cão virtual.

fim do processo todos os pontos retornam ao Processo Central (Figura 4.5 b). Para cada data de passagem do satélite na EV deve haver apenas uma medida de altitude, que foi calculada com a extra¸cão da mediana do conjunto de altitudes dispon´ıvel para cada coordenada central (Tabela 4.1). Frappart et al. (2005) e Frappart et al. (2006) utilizaram a mesma metodologia para obten¸cão das medidas de altitude em seus trabalhos.

Tabela 4.1: Fragmento do conjunto de dados extra´ıdos para a esta¸cão virtual de Manga. Os dados são mostrados para os ciclos 10 e 11 e correspondem a uma data de passagem do satélite Envisat no ano de 2002.

Satelite Track Cycle Lat Lon Year Datj Ice1 Envisat 835 10 -14,9388 -43,9608 2002 303 426,1366 Envisat 835 10 -14,9355 -43,9616 2002 303 427,0397 Envisat 835 10 -14,9322 -43,9624 2002 303 426,8368 Envisat 835 10 -14,9289 -43,9631 2002 303 426,1609 Envisat 835 10 -14,9256 -43,9639 2002 303 426,1450 Envisat 835 10 -14,9223 -43,9646 2002 303 426,0770 Envisat 835 10 -14,9190 -43,9654 2002 303 425,8668 Envisat 835 10 -14,9157 -43,9662 2002 303 425,5787 Envisat 835 10 -14,9091 -43,9677 2002 303 426,0784 Envisat 835 11 -14,9406 -43,9594 2002 338 426,3127 Envisat 835 11 -14,9373 -43,9601 2002 338 426,4298 Envisat 835 11 -14,9340 -43,9609 2002 338 427,7830 Envisat 835 11 -14,9307 -43,9616 2002 338 427,1130 Envisat 835 11 -14,9274 -43,9624 2002 338 426,4708 Envisat 835 11 -14,9241 -43,9632 2002 338 426,5607 Envisat 835 11 -14,9208 -43,9639 2002 338 426,5545 Envisat 835 11 -14,9175 -43,9647 2002 338 426,1344 Envisat 835 11 -14,9142 -43,9654 2002 338 425,6662

Nesta etapa existem duas possibilidades de sa´ıda dos dados, uma consiste na extra¸c˜ao da mediana do conjunto de dados obtidos com o uso do ICE-1 e a outra em aplicar o algoritmo Randon Sample Consensus (RANSAC) sobre os dados de AS gerados pelo ICE-1. O RANSAC tem por objetivo eliminar erros grosseiros do conjunto de pontos antes da extra¸c˜ao da mediana.

Aplica¸cão do Randon Sample Consensus (RANSAC) aos dados altimétricos A filosofia do RANSAC é oposta a de outra técnicas de suaviza¸cão de erros. Ao invés de utilizar o máximo de dados poss´ıveis com a posterior elimina¸cão de dados grosseiros ou inválidos, ele utiliza uma amostra pequena e agrega ao conjunto os dados mais consistente, quando poss´ıvel (Bolles e Fischler, 1981).

(a) Esta¸c˜ao Virtual de Manga. (b) Conjunto de pontos extra´ıdos dos dados Envisat.

Figura 4.5: (a) Esta¸cão Virtual (EV) de Manga. A linha tracejada em laranja re- presenta o track do satélite, a linha azul é o contorno aproximado das margens do São Francisco, o c´ırculo branco é a esta¸cão virtual. (b) Conjunto de pontos extra´ıdos para os ciclos dispon´ıveis do satélite Envisat na esta¸cão de Manga a distância de um quilômetro a partir da coordenada central do rio.

Técnicas clássicas de estimativa de parâmetros, como m´ınimos quadrados, melho- ram os modelos para todo o conjunto de dados. Estas técnicas não possuem mecanismo para detectar e rejeitar erros grosseiros. Elas são técnicas que calculam a média a partir do pressuposto que o desvio máximo esperado de cada dado do modelo é uma fun¸cão direta do tamanho do conjunto de dados. O RANSAC funciona de forma diferente, ao identificar os erros grosseiros de forma iterativa e eliminar aqueles que não devem fazer parte do conjunto de dados, ao invés de mantê-los e realizar o ajuste do modelo através da média de todos os erros (Fischler e Bolles, 1981).

Dentre as vantagens do RANSAC destacam-se a sua simplicidade e extensibilidade, o que facilita a sua implementa¸cão; a sua forma generalista, o que permite o seu uso de diferentes aplica¸cões; e sua capacidade de trabalhar com popula¸cões de dados que contêm taxas de outliers superiores a 50% (Roth e Levine, 1993; Schnabel et al., 2007). Originalmente o algoritmo RANSAC teve como objetivo analisar imagens com base nos problemas de classifica¸cão e de estimativa de parâmetros. Como na prática estes dois problemas não são independentes, a solu¸cão para um problema é sempre requerida para solucionar o outro (Fischler e Bolles, 1981; Bolles e Fischler, 1981). O conceito do RANSAC foi aqui utilizado não para trabalhar com imagens, mas sim para gerar modelos a partir dos pontos extra´ıdos em cada passagem dos satélites nas EVs. A fun¸cão RANSAC utilizada no Processo Central é uma adapta¸cão de Fischler e Bolles

(a) (b) (c)

Figura 4.6: Os gráficos representam três momentos de itera¸cão dos dados do RAN- SAC. (a) primeira itera¸cão; (b) aproximadamente na metade do número de itera¸cões previstas; (c) ultima itera¸cão realizada com a obten¸cão do modelo final.

(1981) e funciona como um filtro para os erros mais grosseiros.

O algoritmo é iniciado a partir da inser¸cão dos seguintes parâmetros: 1 - número de inliers, porcentagem de pontos em rela¸cão a amostra que serão inseridos no modelo final; 2 - quantidade de itera¸cões e; 3 - limiar (threshold ). Definidos os parâmetros, o conjunto de pontos de cada um dos ciclos dispon´ıveis é lido pelo algoritmo, de onde são sorteados dois pontos aleatórios, a partir dos quais é criado um modelo linear teórico do RANSAC, descrito por uma fun¸cão do tipo f (x) = ax + b. Com base nos parâmetros definidos, o algoritmo insere o restante do conjunto de pontos no modelo. A cada itera¸cão um novo modelo é gerado com o sorteio de dois novos pontos. O processo é encerrado quando o maior número de medidas, dentro do limiar estabelecido, é selecionado e passa a compor o conjunto final de dados (Concensus Set ). A Figura 4.6 mostra, de forma gráfica, o modelo linear e os pontos inseridos no modelo em três momentos diferentes das itera¸cões.

O algoritmo busca manter o maior número de pontos dentro da amostra. Aqueles identificados como pertencentes ao modelo (inliers) são salvos em uma lista, que é utilizada para o calculo da mediana. O fluxograma da Figura 4.7 esquematiza o processo RANSAC. Além disso, o código em Python 2.7 (Apêndice F), também está exposto com a explica¸cão de cada uma das etapas do algoritmo utilizado. Este código é uma adapta¸cão feita de um código disponibilizado na internet 3_.

O RANSAC foi aplicado ao conjunto de pontos extra´ıdos com o uso do ICE-1 para excluir os erros grosseiros. Isso foi feito para cada ciclo (data), em cada esta¸c˜ao virtual e para cada um dos sat´elites.

Neste trabalho os parâmetros foram testados, e a melhor combina¸cão foi dada por:: 1 - número de itera¸cões igual a 100; 2 - limiar de 0,01; 3 - taxa de inliers de 0,6. O

3_{https : //salzis.wordpress.com/2014/06/10/robust − linear − model − estimation − using −}

Figura 4.7: Fluxograma do Randon Sample Consensus (RANSAC). A partir de um conjunto de pontos inseridos é gerado um modelo linear. Com os parâmetros definidos são inseridos os outros pontos, quando o melhor modelo é encontrado o processo se encerra e os pontos são salvos (inliers).

número de itera¸cões se relaciona ao número de combina¸cões feitas para o conjunto de dados. O limiar indica a permissividade do modelo para incorporar os pontos, quanto maior este valor mais distantes do modelo os pontos podem estar. Já o número de inliers se relaciona com a porcentagem m´ınima de pontos do conjunto de dados que devem compor o modelo.

No documento Altimetria por satélite radar na medição do nível d'água de rios de pequeno e médio porte: um estudo de caso no Rio São Francisco (páginas 75-80)