• Nenhum resultado encontrado

4.1 Abordagem Metodol´ ogica

4.1.1 M´ odulo Processo Central

O Processo Central (Figura 4.4) ´e o n´ucleo do processamento dos dados. Atrav´es de c´odigos de programa¸c˜ao, em linguagem Python 2.7, foram criados c´odigos que permitem o processamento semi-autom´atico dos dados. A rotina desenvolvida para a extra¸c˜ao dos dados respeita crit´erios espec´ıficos e necessita de trˆes informa¸c˜oes para iniciar o processo: coordenada do centro do rio, n´umero do track que cruza o rio e a distˆancia em que os dados ser˜ao extra´ıdos ao longo do track a partir da coordenada central. A coordenada pode ser consultada atrav´es de sistemas de informa¸c˜ao geogr´afica ou at´e mesmo com o Google Earth, j´a o n´umero do track deve ser consultado na camada vetorial disponibilizada pelas agˆencias espaciais respons´aveis pelos sat´elites2.

Na Figura 4.5 ´e apresentado um exemplo da extra¸c˜ao realizada nesta etapa. Na regi˜ao de Manga h´a um cruzamento entre o track 835 e o RSF, no par de coordenadas [S 14,9272;W 43,9620]. Ao inserir estas informa¸c˜oes, a rotina desenvolvida busca e se- leciona todos os pontos dentro da distˆancia estabelecida. Todos os pontos selecionados s˜ao enviados ao Processo de Retracking, no qual s˜ao calculadas as altitudes. Ao

2Ender¸co para download dos tracks em formato kml para Saral e Envisat: https :

Figura 4.4: Processo Central - Extra¸c˜ao do conjunto de pontos. Essa etapa se inicia com a inser¸c˜ao da coordenada central do curso d’´agua, a partir dela s˜ao extra´ıdos os dados dos sat´elites. Do conjunto de medidas de altitude, gerados no Processo de Retracking, ´e extra´ıda a mediana. Este valor ´e salvo e corresponde a cota altim´etrica na esta¸c˜ao virtual.

fim do processo todos os pontos retornam ao Processo Central (Figura 4.5 b). Para cada data de passagem do sat´elite na EV deve haver apenas uma medida de altitude, que foi calculada com a extra¸c˜ao da mediana do conjunto de altitudes dispon´ıvel para cada coordenada central (Tabela 4.1). Frappart et al. (2005) e Frappart et al. (2006) utilizaram a mesma metodologia para obten¸c˜ao das medidas de altitude em seus trabalhos.

Tabela 4.1: Fragmento do conjunto de dados extra´ıdos para a esta¸c˜ao virtual de Manga. Os dados s˜ao mostrados para os ciclos 10 e 11 e correspondem a uma data de passagem do sat´elite Envisat no ano de 2002.

Satelite Track Cycle Lat Lon Year Datj Ice1 Envisat 835 10 -14,9388 -43,9608 2002 303 426,1366 Envisat 835 10 -14,9355 -43,9616 2002 303 427,0397 Envisat 835 10 -14,9322 -43,9624 2002 303 426,8368 Envisat 835 10 -14,9289 -43,9631 2002 303 426,1609 Envisat 835 10 -14,9256 -43,9639 2002 303 426,1450 Envisat 835 10 -14,9223 -43,9646 2002 303 426,0770 Envisat 835 10 -14,9190 -43,9654 2002 303 425,8668 Envisat 835 10 -14,9157 -43,9662 2002 303 425,5787 Envisat 835 10 -14,9091 -43,9677 2002 303 426,0784 Envisat 835 11 -14,9406 -43,9594 2002 338 426,3127 Envisat 835 11 -14,9373 -43,9601 2002 338 426,4298 Envisat 835 11 -14,9340 -43,9609 2002 338 427,7830 Envisat 835 11 -14,9307 -43,9616 2002 338 427,1130 Envisat 835 11 -14,9274 -43,9624 2002 338 426,4708 Envisat 835 11 -14,9241 -43,9632 2002 338 426,5607 Envisat 835 11 -14,9208 -43,9639 2002 338 426,5545 Envisat 835 11 -14,9175 -43,9647 2002 338 426,1344 Envisat 835 11 -14,9142 -43,9654 2002 338 425,6662

Nesta etapa existem duas possibilidades de sa´ıda dos dados, uma consiste na ex- tra¸c˜ao da mediana do conjunto de dados obtidos com o uso do ICE-1 e a outra em aplicar o algoritmo Randon Sample Consensus (RANSAC) sobre os dados de AS ge- rados pelo ICE-1. O RANSAC tem por objetivo eliminar erros grosseiros do conjunto de pontos antes da extra¸c˜ao da mediana.

Aplica¸c˜ao do Randon Sample Consensus (RANSAC) aos dados altim´etricos A filosofia do RANSAC ´e oposta a de outra t´ecnicas de suaviza¸c˜ao de erros. Ao inv´es de utilizar o m´aximo de dados poss´ıveis com a posterior elimina¸c˜ao de dados grosseiros ou inv´alidos, ele utiliza uma amostra pequena e agrega ao conjunto os dados mais consistente, quando poss´ıvel (Bolles e Fischler, 1981).

(a) Esta¸c˜ao Virtual de Manga. (b) Conjunto de pontos extra´ıdos dos dados Envisat.

Figura 4.5: (a) Esta¸c˜ao Virtual (EV) de Manga. A linha tracejada em laranja re- presenta o track do sat´elite, a linha azul ´e o contorno aproximado das margens do S˜ao Francisco, o c´ırculo branco ´e a esta¸c˜ao virtual. (b) Conjunto de pontos extra´ıdos para os ciclos dispon´ıveis do sat´elite Envisat na esta¸c˜ao de Manga a distˆancia de um quilˆometro a partir da coordenada central do rio.

T´ecnicas cl´assicas de estimativa de parˆametros, como m´ınimos quadrados, melho- ram os modelos para todo o conjunto de dados. Estas t´ecnicas n˜ao possuem mecanismo para detectar e rejeitar erros grosseiros. Elas s˜ao t´ecnicas que calculam a m´edia a partir do pressuposto que o desvio m´aximo esperado de cada dado do modelo ´e uma fun¸c˜ao direta do tamanho do conjunto de dados. O RANSAC funciona de forma diferente, ao identificar os erros grosseiros de forma iterativa e eliminar aqueles que n˜ao devem fazer parte do conjunto de dados, ao inv´es de mantˆe-los e realizar o ajuste do modelo atrav´es da m´edia de todos os erros (Fischler e Bolles, 1981).

Dentre as vantagens do RANSAC destacam-se a sua simplicidade e extensibilidade, o que facilita a sua implementa¸c˜ao; a sua forma generalista, o que permite o seu uso de diferentes aplica¸c˜oes; e sua capacidade de trabalhar com popula¸c˜oes de dados que contˆem taxas de outliers superiores a 50% (Roth e Levine, 1993; Schnabel et al., 2007). Originalmente o algoritmo RANSAC teve como objetivo analisar imagens com base nos problemas de classifica¸c˜ao e de estimativa de parˆametros. Como na pr´atica estes dois problemas n˜ao s˜ao independentes, a solu¸c˜ao para um problema ´e sempre requerida para solucionar o outro (Fischler e Bolles, 1981; Bolles e Fischler, 1981). O conceito do RANSAC foi aqui utilizado n˜ao para trabalhar com imagens, mas sim para gerar modelos a partir dos pontos extra´ıdos em cada passagem dos sat´elites nas EVs. A fun¸c˜ao RANSAC utilizada no Processo Central ´e uma adapta¸c˜ao de Fischler e Bolles

(a) (b) (c)

Figura 4.6: Os gr´aficos representam trˆes momentos de itera¸c˜ao dos dados do RAN- SAC. (a) primeira itera¸c˜ao; (b) aproximadamente na metade do n´umero de itera¸c˜oes previstas; (c) ultima itera¸c˜ao realizada com a obten¸c˜ao do modelo final.

(1981) e funciona como um filtro para os erros mais grosseiros.

O algoritmo ´e iniciado a partir da inser¸c˜ao dos seguintes parˆametros: 1 - n´umero de inliers, porcentagem de pontos em rela¸c˜ao a amostra que ser˜ao inseridos no modelo final; 2 - quantidade de itera¸c˜oes e; 3 - limiar (threshold ). Definidos os parˆametros, o conjunto de pontos de cada um dos ciclos dispon´ıveis ´e lido pelo algoritmo, de onde s˜ao sorteados dois pontos aleat´orios, a partir dos quais ´e criado um modelo linear te´orico do RANSAC, descrito por uma fun¸c˜ao do tipo f (x) = ax + b. Com base nos parˆametros definidos, o algoritmo insere o restante do conjunto de pontos no modelo. A cada itera¸c˜ao um novo modelo ´e gerado com o sorteio de dois novos pontos. O processo ´e encerrado quando o maior n´umero de medidas, dentro do limiar estabelecido, ´e selecionado e passa a compor o conjunto final de dados (Concensus Set ). A Figura 4.6 mostra, de forma gr´afica, o modelo linear e os pontos inseridos no modelo em trˆes momentos diferentes das itera¸c˜oes.

O algoritmo busca manter o maior n´umero de pontos dentro da amostra. Aqueles identificados como pertencentes ao modelo (inliers) s˜ao salvos em uma lista, que ´e uti- lizada para o calculo da mediana. O fluxograma da Figura 4.7 esquematiza o processo RANSAC. Al´em disso, o c´odigo em Python 2.7 (Apˆendice F), tamb´em est´a exposto com a explica¸c˜ao de cada uma das etapas do algoritmo utilizado. Este c´odigo ´e uma adapta¸c˜ao feita de um c´odigo disponibilizado na internet 3.

O RANSAC foi aplicado ao conjunto de pontos extra´ıdos com o uso do ICE-1 para excluir os erros grosseiros. Isso foi feito para cada ciclo (data), em cada esta¸c˜ao virtual e para cada um dos sat´elites.

Neste trabalho os parˆametros foram testados, e a melhor combina¸c˜ao foi dada por:: 1 - n´umero de itera¸c˜oes igual a 100; 2 - limiar de 0,01; 3 - taxa de inliers de 0,6. O

3https : //salzis.wordpress.com/2014/06/10/robust − linear − model − estimation − using −

Figura 4.7: Fluxograma do Randon Sample Consensus (RANSAC). A partir de um conjunto de pontos inseridos ´e gerado um modelo linear. Com os parˆametros definidos s˜ao inseridos os outros pontos, quando o melhor modelo ´e encontrado o processo se encerra e os pontos s˜ao salvos (inliers).

n´umero de itera¸c˜oes se relaciona ao n´umero de combina¸c˜oes feitas para o conjunto de dados. O limiar indica a permissividade do modelo para incorporar os pontos, quanto maior este valor mais distantes do modelo os pontos podem estar. J´a o n´umero de inliers se relaciona com a porcentagem m´ınima de pontos do conjunto de dados que devem compor o modelo.