• Nenhum resultado encontrado

3. METODOLOGIA

4.2. Obtenção e pré processamento dos dados

Todos os dados utilizados nesta dissertação foram obtidos gratuitamente pela página de internet do The International Research Institute for Climate and Society (IRI), usando dados do projeto World Climate Research Programme's (WCRP's) Coupled Model Intercomparison Project phase 3 (CMIP3) multi-model dataset (MEEHL et al., 2007). Estes modelos foram selecionados para participar do AR4 utilizando o cenário A1B do IPCC. Todos os arquivos continham médias mensais de temperatura do ar à superfície em uma grade horizontal uniforme cobrindo todo o planeta. O período inicial e final, bem como o espaçamento da grade variava de modelo a modelo. A Tabela 4.1 apresenta as principais informações sobre a observação CRU (MITCHELL e JONES, 2005) e os modelos selecionados.

Tabela 4.1 – Principais informações sobre a observação (CRU) e os modelos selecionados para o experimento (os demais).

Nome Instituição Responsável País Rodadas7 Resolução8 CRU1 University of East Anglia Reino Unido 1 0.5°

GFDL2 US Dept. of Commerce / NOAA / Geophysical Fluid Dynamics Laboratory

EUA 4 2.5°

GISS3 NASA / Goddard Institute for Space Studies

EUA 9 5°

IPSL4 Institut Pierre Simon Laplace França 3 3.75°

ECHAM55 Max Planck Institute for Meteorology

Alemanha 8 1.875°

HADCM36 Hadley Centre for Climate Prediction and Research / Met Office

Reino Unido 3 3.75°

1: MITCHELL e JONES, 2005, 2: DELWORTH et al., 2006, 3: SCHMIDT et al., 2005, 4:

HOURDIN et al., 2005, 5: ROECKNER et al., 2003, 6: JOHNS, 2003, 7: somatória de integrações do modelo para ambos os séculos, 8: relativa à resolução espacial em graus de latitude e longitude da grade horizontal quadrada do modelo ou observação.

38

Como foram apresentados na Tabela 4.1, todos os modelos selecionados contêm mais de uma rodada (run) de integração, ou seja, são conjuntos de rodadas do mesmo modelo numérico com alguma pequena diferença entre elas. Nesta metodologia, as rodadas foram tratadas individualmente do começo do pré processamento até antes da fase de obtenção dos percentis, onde uma média aritmética simples consolidou as rodadas dos modelos numa única série temporal de valores.

A próxima tarefa depois de obter os dados da página do IRI foi cortar os dados em médias mensais para nossa região e períodos de interesse e transformar todas as temperaturas para Celsius. Este tratamento foi feito no ambiente de programação R utilizando uma suíte de rotinas já existente chamada Rclim (COELHO et al., 2006, COELHO et al., 2008). A Tabela 4.2 mostra os dois períodos de interesse (relativos aos séculos XX e XXI) e a Figura 4.1 é um mapa físico da região de interesse.

Figura 4.1 – Mapa físico e de relevo da região de interesse do experimento. O contorno em vermelho indica os limites da Bacia do Prata.

39

Tabela 4.2 – Períodos utilizados no experimento.

Período Início Final

Século XX Janeiro de 1901 Dezembro de 2000 Século XXI Janeiro de 2001 Dezembro de 2100

Foram aplicadas duas metodologias de agrupamento sobre a Bacia do Prata visando distinguir regiões com mesmas características, utilizando para isso todos os dados observados disponíveis para o século XX, divididos por estações do ano para filtrar a variabilidade mensal da variável. Os meses utilizados para as médias sazonais estão na Tabela 4.3. As metodologias utilizadas foram o c-means e o fuzzy c-means (usando as funções pam e fanny do pacote clusters do R, respectivamente), com valores de K indo de dois a cinco (onde K diz respeito a quantos grupos serão formados).

O principal critério para decidir qual a melhor maneira de agrupar a bacia em regiões era a facilidade em interpretar a diferença entre elas.

Uma das principais influências para a variação de temperatura do ar em superfície, especialmente nesta região, é a latitude. À medida que um local se afasta da linha do Equador a tendência básica é de queda de temperatura, apesar da possibilidade de mudança nesta tendência quando sobre influência de outros fatores como altitude, relevo e continentalidade.

Tabela 4.3 – Divisão de meses e a respectiva sigla.

Estação do ano Sigla Meses contidos

Verão DJF Dezembro, Janeiro e Fevereiro Inverno JJA Junho, Julho e Agosto

Ano completo ANO Todos os meses

40

Além disso, pode-se verificar no mapa da Figura 4.1 que existe uma parte dos Andes numa porção oeste da Bacia e a serra catarinense a sudeste. Ambas devem ser consideradas à parte, pois apresentam uma altitude muito diferente das outras partes da Bacia.

De todas as tentativas de agrupamento, as que obtiveram melhor resultado foram a c-means e fuzzy c-means com três grupos (Figura 4.2). Pode-se notar que o grupo com cor verde apresenta duas ramificações em direção para norte, uma em cada lado do mapa. Comparando esta figura com o mapa físico e de relevo da Figura 4.1, é possível associar estas ramificações como locais com altitude elevada.

Figura 4.2 – Representação visual das três regiões obtidas pelas duas técnicas escolhidas de agrupamento da Bacia do Prata, usando c-means à esquerda e

fuzzy c-means à direita.

Devido a este fato, foi proposta a criação de mais dois grupos, um para cada região de altitude elevada, chegando assim à divisão final de regiões da Bacia do Prata (Figura 4.3). Destas cinco regiões da Bacia, apenas as três primeiras serão utilizadas para o experimento pois as outras duas, por terem pouca área geográfica, contêm poucos pontos de dados, o que pode acarretar em problemas na estabilidade dos modelos de regressão propostos.

41

Figura 4.3 – Divisão final das regiões da Bacia do Prata para o experimento. As regiões 4 e 5 serão descartadas por falta de dados devido à sua pequena área

em relação às demais.

Com as três regiões definidas, tem-se então um número Jm de pontos de grade de simulações contidos no limite geográfico de cada região C, sendo que este valor varia com a resolução espacial da grade de cada modelo.

Sendo R1, R2 e R3 os conjuntos de pontos contidos nas três regiões da bacia, as Equações 4.1 e 4.2 buscam os valores médios de Xm(j,t) e seus respectivos desvios, em cada ponto de grade j (do total de Jm pontos de grade de cada modelo m), para cada uma das três regiões r, ou seja,

X,(t) =&#'()"*#($,%)

# | j ∈ R , m=1,2,...,5 , r=1,2,3 (4.1)

σ,(t) = -∑ ("&#'() #($,%)."#,/(%))

*#.0 | j ∈ R , m=1,2,...,5 , r=1,2,3 (4.2)

Com isso, é possível simplificar a informação consolidando um único valor médio representativo da região e seu desvio padrão, ao invés de lidar com pontos de grade individualmente.

42

Além da média e desvio padrão, é importante também quantificar os percentis destas informações. Foram obtidos os percentis de 5%, 10%, 20%, 30%, 70%, 80%, 90% e 95% em cada modelo m e região r, para cada tempo, identificados como p5m,r(t), p10m,r(t), p20m,r(t), p30m,r(t), p70m,r(t), p80m,r(t), p90m,r(t) e p95m,r(t), respectivamente.

Pode-se ainda aplicar estas metodologias em informações mais consolidadas no tempo. Foram criados então os três subsets da Tabela 4.3, tornando as médias mensais em médias anuais usando todos os meses do ano, somente os meses de verão e somente os meses de inverno. Todas as estatísticas anteriores foram consolidadas no tempo dentro dos três subsets s, gerando assim a média Xm,r,s(t), o desvio σm,r,s(t) e os percentis p5m,r,s(t), p10m,r,s(t), p20m,r,s(t), p30m,r,s(t), p70m,r,s(t), p80m,r,s(t), p90m,r,s(t) e p95m,r,s(t), sendo que agora t se refere à série temporal anual, e não mais mensal.

O Anexo I apresenta as figuras de séries temporais das médias e percentis dos da observação (século XX) e dos modelos (para ambos os séculos).

Documentos relacionados