• Nenhum resultado encontrado

Baixar livros de Administração Baixar livros de Agronomia Baixar livros de Arquitetura Baixar livros de Artes

N/A
N/A
Protected

Academic year: 2022

Share "Baixar livros de Administração Baixar livros de Agronomia Baixar livros de Arquitetura Baixar livros de Artes"

Copied!
101
0
0

Texto

(1)

i COPPE/UFRJ

COPPE/UFRJ

CALIBRAÇÃO E COMBINAÇÃO DE SIMULAÇÕES CLIMÁTICAS EM CONJUNTOS MULTI-MODELO PARA A BACIA DO PRATA

USANDO REGRESSÃO FUZZY

Luiz Rodrigo Lins Tozzi

Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia Civil, COPPE, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Mestre em Engenharia Civil.

Orientadores: Alexandre Gonçalves Evsukoff Caio Augusto dos Santos Coelho

Rio de Janeiro Janeiro de 2010

(2)

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

(3)

ii

CALIBRAÇÃO E COMBINAÇÃO DE SIMULAÇÕES CLIMÁTICAS EM CONJUNTOS MULTI-MODELO PARA A BACIA DO PRATA

USANDO REGRESSÃO FUZZY

Luiz Rodrigo Lins Tozzi

DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO LUIZ COIMBRA DE PÓS-GRADUAÇÃO E PESQUISA DE ENGENHARIA (COPPE) DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM CIÊNCIAS EM ENGENHARIA CIVIL.

Examinada por:

________________________________________________

Prof. Alexandre Gonçalves Evsukoff, D.Sc.

________________________________________________

Prof. Caio Augusto dos Santos Coelho, D.Sc.

________________________________________________

Profª. Maria Gertrudes Alvarez Justi da Silva, D.Sc.

________________________________________________

Prof. Nelson Francisco Favilla Ebecken, D.Sc.

RIO DE JANEIRO, RJ - BRASIL JANEIRO DE 2010

(4)

iii

Tozzi, Luiz Rodrigo Lins

Calibração e Combinação de Simulações Climáticas em Conjuntos Multi-Modelo para a Bacia do Prata usando Regressão Fuzzy / Luiz Rodrigo Lins Tozzi. – Rio de Janeiro: UFRJ/COPPE, 2010.

IX, 89 p.: il.; 29,7 cm.

Orientador(es): Alexandre Gonçalves Evsukoff Caio Augusto dos Santos Coelho Dissertação (mestrado) – UFRJ/ COPPE/ Programa de Engenharia Civil, 2010.

Referencias Bibliográficas: p. 64-72.

1. Regressão fuzzy intervalar. 2. Mudanças Climáticas. 3. Meteorologia. I. Evsukoff, Alexandre Gonçalves et al. II. Universidade Federal do Rio de Janeiro, COPPE, Programa de Engenharia Civil. III.

Título.

(5)

iv

A Deus, que foi e é a minha força, inspiração e motivação.

(6)

v

AGRADECIMENTOS

Quero agradecer a Deus pela oportunidade que tive de ter condições e incentivo para estudar e me especializar na área que gosto. Ele não me deixou na mão, mais uma vez, como sempre.

Quero agradecer também à minha família, aos meus amigos e à minha futura esposa Mariana pela ajuda e compreensão nos momentos em que eu tentava estar fisicamente perto mas sempre com a cabeça longe. Foram anos complicados, mas que valeram a pena por causa de vocês.

Quero agradecer ao CNPq pelo suporte financeiro durante o mestrado e à COPPE e ao NTT pelo conhecimento e vivência que recebi de seus professores, funcionários e inúmeros amigos que ganhei. Cada um foi especial ao seu modo, sejam pelas inúmeras cobranças, dicas e momentos de paciência e de descontração.

Quero agradecer também aos meus orientadores oficiais (e extra-oficiais), que investiram em mim e em minha idéia de trazer o começo de algo diferente tanto para a área de meteorologia quanto para a área de sistemas computacionais. Em minha opinião, isso é ciência: arriscar no novo, sempre buscando aprender algo diferente com as outras áreas do conhecimento.

Muito obrigado!

(7)

vi

Resumo da Dissertação apresentada à COPPE/UFRJ como parte dos requisitos necessários para a obtenção do grau de Mestre em Ciências (M.Sc.)

CALIBRAÇÃO E COMBINAÇÃO DE SIMULAÇÕES CLIMÁTICAS EM CONJUNTOS MULTI-MODELO PARA A BACIA DO PRATA

USANDO REGRESSÃO FUZZY

Luiz Rodrigo Lins Tozzi

Janeiro/2010

Orientadores: Alexandre Gonçalves Evsukoff Caio Augusto dos Santos Coelho

Programa: Engenharia Civil

Um método de regressão linear fuzzy é utilizado para calibrar e combinar projeções de temperaturas de modelos climáticos em um conjunto multi-modelo. O estudo de caso aplica valores médios anuais assim como médias sazonais de temperatura do ar coletados ao longo do século XX na Bacia do Prata e simulações provenientes de cinco modelos climáticos para projetar a temperatura do século XXI em três regiões distintas da bacia. A entrada de dados no modelo fuzzy intervalar é o valor central, ou seja, o valor médio de cada modelo climático e os limites superiores e inferiores contendo 90% das observações dentro de cada região. A sua resposta representa a incerteza em uma função de pertinência de formato trapezoidal, onde seu núcleo engloba todos os valores centrais de observação e seu suporte engloba 90%

dos valores observados. Os parâmetros do modelo são então calculados de forma a minimizar a incerteza global. O estudo também utiliza um modelo de regressão linear convencional para avaliar e validar os resultados. O método se mostrou muito útil e estável para casos onde não é possível garantir a estabilidade das estatísticas tradicionais.

(8)

vii

Abstract of Dissertation presented to COPPE/UFRJ as a partial fulfillment of the requirements for the degree of Master of Science (M.Sc.)

CALIBRATION AND COMBINATION OF CLIMATE PROJECTIONS FOR THE LA PLATA BASIN IN MULTI-MODEL ENSEMBLES

USING FUZZY REGRESSION

Luiz Rodrigo Lins Tozzi

January/2010

Advisors: Alexandre Gonçalves Evsukoff Caio Augusto dos Santos Coelho

Department: Civil Engineering

A fuzzy interval linear regression method is used to calibrate and combine climate temperature models in a multi-model ensemble of climate model temperature projections. The study is carried out using air temperature data recorded yearly and seasonally during the 20th century in the La Plata Basin. The objective of the study is to provide realistic projections of air temperature in the 21st century, taking into account five climate models to envelope the projections data for three distinct regions.

The input to the fuzzy interval model is the central value (i.e. the ensemble mean) for each climate model projection. The output data is the central temperature value, the lower and upper limits, representing 90% of the dataset within a region. The output to the fuzzy interval regression model represents the uncertainty in a trapezoid shaped membership function, in which the core interval envelop all the observed central data values and the support interval envelopes 90% of the observed data. The fuzzy regression parameters are computed such that the global uncertainty is minimized. A standard linear regression model is also be used for comparison and validation. The method has shown to be useful to handle uncertainty in climate model projections better than the linear regression model, especially in cases where it’s not possible to guarantee the normality assumption.

(9)

viii SUMÁRIO

1. INTRODUÇÃO ... 1

1.1. Motivação ... 1

1.2. Objetivo ... 3

2. FUNDAMENTAÇÃO CIENTÍFICA ... 5

2.1. Objetivo ... 5

2.2. Modelagem numérica de tempo e clima ... 5

2.2.1 Métodos estatísticos de calibração e combinação de previsões e simulações ... 13

2.3. Modelagem numérica por conjunto de modelos ... 14

2.4. Métodos fuzzy para análise de incertezas ... 18

3. METODOLOGIA ... 25

3.1. Objetivo ... 25

3.2. Convenções ... 25

3.3. Regressão Linear ... 25

3.3.1 Calibração ... 27

3.3.2 Combinação ... 27

3.4. Método fuzzy de regressão intervalar ... 29

3.4.1 Intervalos convencionais e intervalos fuzzy ... 29

3.4.2 Regressão Linear Fuzzy ... 32

3.4.3 Calibração e combinação usando regressão linear fuzzy intervalar ... 34

(10)

ix

4. ESTUDO DE CASO: TEMPERATURA MÉDIA ANUAL E DE INVERNO E VERÃO

NA BACIA DO PRATA ... 36

4.1. Objetivo ... 36

4.2. Obtenção e pré processamento dos dados ... 37

4.3. Métricas de Avaliação e Validação ... 42

4.4. Projeções de temperatura para a Bacia do Prata ... 48

4.4.1 Média anual ... 48

4.4.2 Inverno ... 53

4.4.3 Verão ... 57

5. CONCLUSÃO ... 62

6. REFERÊNCIAS BIBLIOGRÁFICAS ... 64

ANEXO I ... 73

(11)

1 1. INTRODUÇÃO

1.1 Motivação

As mudanças climáticas que o planeta vem sofrendo têm afetado a sociedade em diferentes escalas e de diferentes formas. Desde 1972 com a Conferência de Estocolmo, começou-se a discutir e negociar estratégias ambientais entre os vários países filiados às Nações Unidas. Em 1990 foi criado o Painel Intergovernamental de Mudanças Climáticas (IPCC), corpo científico internacional pertencente à ONU, com objetivo de avaliar a informação científica, técnica e sócio-econômica disponível no campo de mudança climática. Desde então vários especialistas do mundo todo têm buscado por formas e métodos para simular o clima nos próximos anos, décadas e séculos de várias maneiras e com diferentes objetivos.

Com o passar dos anos e a melhoria da capacidade de processamento dos computadores, estes estudos começaram então a se especializar e começou a ser possível fazer previsões de tempo e simulações de clima numa escala regional. Com isso começou também uma tendência a criar artigos e projetos científicos nas áreas de tempo e clima com um maior grau de detalhamento espacial.

Uma região até então carente de um projeto mais aprofundado era a região da Bacia do Prata, que abrange o Brasil, Uruguai, Argentina, Paraguai e Bolívia. Desde o começo do século a bacia vem sofrendo sérios impactos ambientais, tais como o aumento da temperatura e da precipitação (ROSENBLUTH et al., 1997, MARENGO, 2008). A hidrologia e a agricultura da região são fatores importantes para a economia local e são também muito sensíveis às mudanças climáticas na temperatura. A evapotranspiração (que determina o balanço entre perda de água do solo por evaporação e a perda de água da planta por transpiração) depende diretamente da

(12)

2

temperatura do ar e é algo essencial para o equilíbrio hidrológico e para muitas das culturas locais. Estas são boas justificativas para se buscar um melhor entendimento da tendência da temperatura na região para as próximas décadas.

Esta possível mudança no clima da região motivou um consórcio de pesquisa internacional chamado CLARIS LPB (A Europe-South America Network for Climate Assessment and Impact Studies in La Plata Basin), envolvendo instituições nacionais como o Instituto Nacional de Pesquisas Espaciais (INPE), universidades como a Universidade de São Paulo (USP) e a Universidade Federal de Paraná (UFPR), dentre outras.

Uma das várias ferramentas disponíveis para avaliar o impacto das mudanças locais do clima é a combinação de projeções climáticas em conjuntos multi-modelo.

Esta técnica consiste em agrupar os vários modelos, com físicas e resoluções diferentes, atribuindo pesos às projeções futuras de clima utilizando as projeções que possam ser validadas. A vantagem desta abordagem é que ela aproveita o melhor de cada modelo para uma simulação ótima. Atualmente as técnicas para esta combinação se baseiam fundamentalmente em estatísticas lineares e métodos bayesianos (TEBALDI e KNUTTI, 2007, GIORGI e MEARNS, 2003) e poucos trabalhos usam ferramentas fuzzy para estas aplicações (LAWRY et al., 2005, BÁRDOSSY et al., 2005, HALL, 2007, HALL et al., 2007), indicando que essa é uma área de pesquisa pouco explorada com a necessidade de novos desenvolvimentos e aplicações.

(13)

3 1.2 Objetivo

A proposta deste trabalho é obter um cenário de tendência de temperatura do ar para três regiões da bacia, aos moldes dos cenários do IPCC (2007) aplicando-se dois métodos para calibração e combinação de simulações climáticas, onde entenda- se “calibração” como o processo de ajuste de um modelo de regressão e

“combinação” como a aplicação deste mesmo modelo de regressão em dados diferentes do conjunto de treinamento.

O primeiro método usa o conceito de regressão fuzzy intervalar (TANAKA et al., 1982, BISSERIER et al., 2008) na busca por cenários futuros “ótimos” de clima para a região. O modelo tem a formulação matemática bem semelhante à regressão linear convencional, mas com uma diferença fundamental: ela opera sobre números fuzzy. Um número fuzzy é uma função de pertinência em torno de um valor mais possível de acontecer. Em outras palavras, é uma espécie de valor associado a uma banda intrínseca de incerteza.

A regressão fuzzy utilizada neste trabalho usa intervalos progressivos de cortes das funções de pertinência para aplicar a regressão. Os parâmetros da regressão serão todos números reais.

O segundo método de modelo de regressão utiliza uma regressão linear múltipla simples (RLMS), para efeito de controle do experimento.

As projeções baseadas no cenário A1B do IPCC serão obtidas a partir da calibração e combinação de dados de simulações climáticas de cinco modelos de clima aprovados pelo IPCC em seu quarto relatório de avaliação (também chamado de AR4). Para isso serão utilizadas médias anuais e sazonais para o inverno e verão de temperatura do ar simuladas para os séculos XX e XXI sobre três regiões da Bacia do Prata e as suas respectivas observações (para o século XX).

(14)

4

Em termos gerais, ambos os modelos de regressão buscarão relações de associação entre as simulações de temperatura dos modelos de clima para o século XX em relação às observações. Essas relações serão usadas para calibrar e combinar as projeções climáticas dos modelos para o século XXI de forma obter uma combinação robusta das simulações disponíveis.

Com isso espera-se regionalizar de forma ótima as simulações climáticas disponíveis no IPCC e, conseqüentemente, ter uma melhor indicação de como se comportará o clima da região no próximo século.

(15)

5 2. FUNDAMENTAÇÃO CIENTÍFICA

2.1 Objetivo

Desde o final do século XX, que foi marcado por movimentos em prol do meio ambiente e da causa do aquecimento global, a comunidade científica tem buscado simular as condições ambientais dentro de possíveis cenários futuros. Várias linhas de pesquisa têm sido criadas desde então para estudar e modelar as mudanças climáticas dos últimos até aos próximos séculos.

Este capítulo visa apresentar a fundamentação científica por trás das ferramentas utilizadas nesta dissertação. Será apresentado também o histórico destes modelos de regressão, com o intuito de mostrar a evolução de cada linha de trabalho e também a própria evolução da abordagem da análise de incertezas em mudanças climáticas.

2.2 Modelagem numérica de tempo e clima

A modelagem numérica de tempo e clima é um processo de evolução temporal de grandezas ambientais, com valores dispostos em grades espaciais tridimensionais, onde esta evolução é regida por leis físicas. Estas grandezas também são por sua vez interdependentes, criando assim um sistema de equações que descrevem estas leis físicas. A Figura 2.1 apresenta um exemplo de corte lateral mostrando uma grade espacial tridimensional e alguns componentes básicos de uma integração numérica.

Já a Figura 2.2 apresenta um esquema dos fatores e sistemas físicos mais comuns utilizados em modelagem numérica de tempo e clima.

(16)

6

Figura 2.1: Esquema mostrando o corte lateral da grade espacial tridimensional e os componentes básicos da integração numérica (METED, 2002).

Figura 2.2: Esquema dos fatores e sistemas físicos mais comuns utilizados em modelagem numérica de tempo e clima (IPCC, 2001)

Algumas das interações entre grandezas ambientais não têm uma equação descrevendo a sua evolução temporal, que é o caso da precipitação e da nebulosidade. Para contornar esta limitação propõe-se o uso de esquemas de

(17)

7

parametrizações físicas, onde se cria um conjunto de relações entre as variáveis ambientais partindo de dados obtidos em experimentos de campo. Muitas destas parametrizações têm validade apenas no local do experimento (ou locais com características semelhantes) enquanto outras têm um caráter mais generalizado.

Apesar da idéia de integrar estas equações no tempo venha de 1904 com V.

Bjerknes, somente em 1910 que Richardson foi o primeiro a modelar numericamente estas equações e executou a primeira integração numérica de tempo. O modelo usado fez uma previsão de seis horas centrada na Alemanha, com uma grade horizontal de 200 km e quatro níveis na vertical e teve um desempenho muito ruim. Por décadas não houve mais tentativas de reproduzir o experimento, até que no final da década de 40 os pesquisadores Charney, Fjortoft e J. Von Neuman utilizaram um dos primeiros computadores para fazer uma previsão de tempo de 24 horas (KALNAY, 2003). Nas próximas décadas houve uma popularização destas ferramentas e operacionalização destas previsões para os mais diversos fins.

Existem basicamente duas formas de integrar grandezas ambientais no tempo:

através de previsão ou simulação numérica. A previsão consiste em inferir um tempo futuro partindo de condições iniciais e de contorno de algumas variáveis, como temperatura da superfície do mar (se aplicável), pressão e umidade, onde uma simples perturbação nessas condições iniciais pode levar a crescentes mudanças na integração. Já na simulação, integra-se o modelo numérico por um período utilizando informações reais ao longo da integração.

As integrações também podem ser divididas em tempo e clima. A primeira diz respeito ao prazo total da integração. Uma previsão de tempo com boa previsibilidade tem um horizonte de previsão que vai de poucos minutos (no chamado "nowcast") até normalmente 15 dias (LORENZ, 1965) enquanto que uma integração de clima abrange a escala de meses a milênios.

(18)

8

Partindo das idéias de LORENZ (1993), que sistemas caóticos são sistemas determinísticos que possuem uma pequena quantidade de aleatoriedade e que são altamente dependentes de modificações interiores nas condições iniciais, conclui-se que a atmosfera é um sistema caótico. Como tal, há uma limitação na sua previsibilidade usando apenas o conceito básico de modelagem numérica integrando uma grade espacial por pequenos passos de tempo (BARCELLOS, 2009).

Diferente da previsão de tempo tradicional, onde um único modelo pode ser executado por todo o seu período de integração partindo de uma dada condição inicial e simplesmente evoluindo no tempo, as integrações climáticas são tradicionalmente feitas em conjuntos de modelos que usam condições iniciais levemente diferentes, onde cada integração do modelo individualmente é chamada de “membro”. Com isso, não se busca um valor exato para uma variável, mas sim a probabilidade em torno de um dado valor, ou seja, quantos membros dão a mesma informação dentre todos os membros. As formas e as intensidades desta perturbação que diferencia cada membro de um modelo já foram muito discutidas e estudadas na literatura.

No caso de conjuntos de clima, outra diferença entre a previsão, simulação e projeção fica por conta da escolha e uso de suas forçantes. Normalmente a temperatura da superfície do mar (TSM) é utilizada como forçante principal da condição de contorno, sendo que existem outras forçantes de interesse, como os perfis de CO2 para aplicações de mudanças climáticas.

A simulação climática (Figura 2.3) utiliza uma TSM climatológica ou observada fixa para todo o período de simulação. Com isso é possível obter a climatologia de cada membro do conjunto e a média dessas climatologias é a chamada climatologia do modelo, normalmente utilizando a TSM climatológica. A climatologia do modelo é essencial para poder conhecer o comportamento do modelo em cada região de interesse.

(19)

Figura 2.3: Esquema da simulação climática, desde cada membro do conjunto até a geração da sua climatologia média.

Já a previsão de clima (Figur

início da integração e TSM prevista para o restante do período a quantidade de semanas ou meses com TSM observada prevista varia bastante. No caso da TSM prevista

curtos (de seis meses a um ano),

mesmo ser incorporada de uma previsão de um modelo acoplado.

fins, a previsão climática previsão sazonal.

A diferença da média dos membros da previsão sazonal e da climatologia do modelo é a chamada previsão de anomalia, ou seja, a informação que indica se o período da previsão está com uma grandeza ambiental abaixo, acima o

climatológica.

9

3: Esquema da simulação climática, desde cada membro do conjunto até a geração da sua climatologia média.

Já a previsão de clima (Figura 2.4) utiliza um período de TSM observada no início da integração e TSM prevista para o restante do período. As metodologias para a quantidade de semanas ou meses com TSM observada e a forma de uso da TSM prevista varia bastante. No caso da TSM prevista, ela pode ser atualizada em períodos curtos (de seis meses a um ano), pode ser mantida persistida por todo o período ou de uma previsão de um modelo acoplado. Dependendo dos fins, a previsão climática também pode ser chamada em centros operacionais de

A diferença da média dos membros da previsão sazonal e da climatologia do modelo é a chamada previsão de anomalia, ou seja, a informação que indica se o período da previsão está com uma grandeza ambiental abaixo, acima o

3: Esquema da simulação climática, desde cada membro do conjunto

4) utiliza um período de TSM observada no . As metodologias para e a forma de uso da TSM ser atualizada em períodos ser mantida persistida por todo o período ou Dependendo dos operacionais de

A diferença da média dos membros da previsão sazonal e da climatologia do modelo é a chamada previsão de anomalia, ou seja, a informação que indica se o período da previsão está com uma grandeza ambiental abaixo, acima ou na média

(20)

Figura 2.4: Esquema da previsão climática, desde cada membro do conjunto até

A projeção climática pode ser considerada como uma simulação climática com a inclusão de elementos futuros em sua integração.

adição de perfis futuros de emissão de CO2. Estes perfis são propostos pelo IPCC de forma a propor cenários de emissão deste gás

Tabela 2.1 apresenta alguns d

Com as emissões de CO2 como contorno é possível integrar no tempo futuro e usar estas projeções climáticas como ferramenta

climáticas. Esta será a metodologia

cenário utilizado neste trabalho foi o A1B, considerado um dos mais prováveis de ocorrer pela similaridade com as condições atuais.

10

4: Esquema da previsão climática, desde cada membro do conjunto até sua previsão média sazonal.

A projeção climática pode ser considerada como uma simulação climática com a inclusão de elementos futuros em sua integração. Normalmente este

adição de perfis futuros de emissão de CO2. Estes perfis são propostos pelo IPCC de enários de emissão deste gás em diferentes possíveis futuros

alguns dos principais cenários propostos no AR4.

Com as emissões de CO2 como contorno é possível integrar no tempo futuro e usar estas projeções climáticas como ferramenta de avaliação de possíveis mudanças

metodologia utilizada nos modelos obtidos neste trabalho.

cenário utilizado neste trabalho foi o A1B, considerado um dos mais prováveis de ocorrer pela similaridade com as condições atuais.

4: Esquema da previsão climática, desde cada membro do conjunto até

A projeção climática pode ser considerada como uma simulação climática com Normalmente este elemento é a adição de perfis futuros de emissão de CO2. Estes perfis são propostos pelo IPCC de em diferentes possíveis futuros. A

AR4.

Com as emissões de CO2 como contorno é possível integrar no tempo futuro e de avaliação de possíveis mudanças utilizada nos modelos obtidos neste trabalho. O cenário utilizado neste trabalho foi o A1B, considerado um dos mais prováveis de

(21)

11

Tabela 2.1 – Principais características dos cenários do IPCC AR4

Cenário Principais características

A1FI Rápido crescimento econômico;

A população mundial chega a 9 bilhões em 2050 e diminui gradativamente depois disso;

Rápida popularização de tecnologias eficientes;

Interações sociais e culturais mundo afora;

Ênfase em combustíveis fósseis;

A1T O mesmo que A1FI, mas com ênfase em fontes de energia não-fósseis;

A1B O mesmo que A1FI, mas com um balanço entre as fontes de energia;

A2 Nações auto-sustentáveis;

População continuamente em crescimento;

Desenvolvimento econômico com foco regional;

Mudanças tecnológicas mais lentas e mais fragmentadas com melhoras na renda per capita;

B1 Rápido crescimento, assim como nos cenários A1, mas com rápidas mudanças no sentido de uma economia com foco em serviços e informação;

A população mundial chega a 9 bilhões em 2050 e diminui gradativamente depois disso;

Introdução de tecnologias limpas;

Ênfase em soluções globais para estabilidade econômica, social e ambiental;

B2 População continuamente em crescimento, mas em taxas mais baixas que no cenário A2;

Ênfase em soluções locais para estabilidade econômica, social e ambiental;

Nível intermediário de desenvolvimento econômico;

Mudanças tecnológicas mais lentas e fragmentadas em relação aos cenários A1 e B1;

Com a crescente evolução da computação e o barateamento do custo das integrações numéricas, tem-se usado resoluções mais refinadas e uma física cada vez mais elaborada nas simulações atmosféricas. Até a década de 80, a resolução espacial dos modelos de circulação geral (GCM) era em torno de 2,5 graus de latitude e longitude (SMAGORINSKY, 1963, HOLLOWAY e MANABE, 1971) e ela vem sendo refinada gradativamente (ORLANSKI, 2008) até que na década atual a resolução é em média de 60 km (SAHA et al., 2006, HUEBENER et al., 2007). Este refinamento foi acompanhado também pelo uso crescente de modelos numéricos regionais de tempo

(22)

12

e clima usando os modelos globais como condição de contorno (WILBY e WIGLEY, 1997, HAYLOCK et al., 2006). Num dos principais centros de previsão do tempo do mundo (o National Centers for Environmental Prediction, dos Estados Unidos), a resolução espacial do modelo passou de uma previsão global de aproximadamente 75km em 1998 (versão T170L42 com previsões de 3,5 dias) para 40km a partir de 2005 (versão T382L64 com previsões de 7,5 dias) (YUAN et al., 2007, NCEP, 2009).

Apesar do aumento de resolução espacial trazer benefícios interessantes como o melhor nível de detalhamento horizontal do terreno (Figura 2.5), se a qualidade da condição inicial (derivada de observações) não estiver com uma densidade e espaçamento adequado é possível que a qualidade da previsão ou simulação não melhore ou até mesmo piore.

Figura 2.5: Comparação do nível de detalhamento horizontal de terreno de duas grades com resoluções espaciais diferentes (METED, 2002).

O Painel Intergovernamental sobre Mudanças Climáticas (IPCC), corpo científico internacional pertencente à Organização das Nações Unidas (ONU), tem regulamentado e organizado desde 1990 os modelos numéricos que fazem simulações climáticas, bem como os cenários destas simulações (IPCC, 2001, 2007).

(23)

13

Apesar das rápidas melhorias computacionais já citadas, grande parte dos modelos do IPCC ainda tem dois graus de latitude e longitude de resolução (IPCC, 2007), muito devido à grande quantidade de membros e integrações necessárias para submeter às informações ao IPCC e também ao extenso horizonte temporal das simulações.

2.2.1 Métodos estatísticos de calibração e combinação de previsões e simulações

Vários métodos para combinar e melhorar as previsões e simulações climáticas são encontrados na literatura científica. KLEIN et al. (1959) propôs um método chamado Modelo de Prognóstico Perfeito (MPP) para corrigir e aprimorar as previsões de tempo utilizando uma estatística sobre as análises anteriores do próprio modelo. No MPP, a previsão corrigida é gerada relacionando a sua variável de interesse às variáveis meteorológicas observadas, sem defasagem de tempo, através de uma RLMS. A previsão é feita substituindo na equação de regressão os valores das variáveis meteorológicas previstas no dia de rodada, no caso, os prognósticos do modelo numérico. Com isso, uma série de análises do modelo é utilizada como se fosse a verdade atmosférica, ou seja, a observação, o que nem sempre é a melhor abordagem.

O MOS (Model Output Statistics), desenvolvido por GLAHN e LOWRY (1972), funciona de forma bem similar ao MPP. A grande diferença é que este modelo de regressão utiliza, para o estabelecimento das equações de regressão, os campos de previsão ao invés das análises, e deste modo elimina a influência de um possível erro sistemático existente na modelagem numérica.

Ambas estatísticas necessitam de séries longas de produtos numéricos para a formação do banco de dados para a correção (para previsão de tempo pelo menos

(24)

14

dois anos de dados para uma estatística estável). Em 1998, MAO et al. propôs uma estatística chamada MOC (Model Output Calibration), onde o banco de dados para a correção de previsões de tempo só precisava de algumas semanas de dados, ao contrário dos vários anos de dados necessários para os algoritmos estatísticos clássicos. Ao contrário dos outros dois métodos, o MOC não estima o valor da variável a ser prevista, mas sim seu erro de previsão.

Para conjuntos de modelos de tempo, alguns estudos mostraram a simples correção do erro sistemático (viés de previsão) das últimas semanas de previsão pode trazer muitos benefícios às previsões com um único modelo (FEDDERSEN et al., 1999, ANDERSON et al., 1999, CHEN et al., 2000) ou mesmo em um conjunto de modelos (PENDERGRASS e ELMORE, 2005).

É comum combinar previsões climáticas usando a simples média aritmética dos membros do conjunto. BEZERRA et al. (2008) propôs um método chamado ECCOCLIM (Esquema Estatístico de Combinação e Correção de Previsões Climáticas) que também usa uma RLMS, mas para atribuir pesos a cada um dos membros do conjunto. Nesta técnica é possível inclusive incluir mais de um tipo de modelo no conjunto.

2.3 Modelagem numérica por conjunto de modelos

Desde o experimento de Richardson, uma questão importante que permanece até hoje é a forte dependência das integrações numéricas de tempo e clima em relação às condições iniciais da atmosfera. Com o passar das décadas, os modelos atmosféricos se tornaram cada vez mais robustos, baratos computacionalmente e com física mais elaborada. Esta variedade crescente de modelos tornou natural a idéia de combinar suas integrações na busca de uma previsão ótima.

(25)

15

O principal objetivo de uma previsão por conjunto (“ensemble”, no inglês) de modelos é prever a probabilidade de eventos futuros com uma maior confiabilidade que uma previsão determinística de apenas um modelo (MULLEN e BAUMHEFNER, 1994). Um tipo muito comum de combinação é o uso de modelagem por conjunto, onde um conjunto de modelos de mesma física é iniciado ao mesmo tempo, apenas com diferentes condições iniciais (SIVILLO et al., 1997; GRIMIT et al., 2006). Uma variação também muito utilizada é usar um conjunto de modelos com física levemente alterada, iniciados ao mesmo tempo com as mesmas condições iniciais. Ambas as metodologias seguem o mesmo princípio de que a ligeira diferença entre as condições iniciais dos modelos pode fornecer uma nova informação ao usuário de forma a verificar probabilidades de ocorrência de futuros cenários. Com isso, quando os membros do conjunto concordam ou discordam numa determinada tendência, é possível expressar essa informação com um caráter probabilístico (Figuras 2.6 e 2.7).

(a) (b)

Figura 2.6: Exemplo de dois possíveis comportamentos de integrações por conjunto, onde (a) apresenta uma boa previsão apesar do grande espalhamento e (b) apresenta uma previsão com maior concordância mas com pior qualidade.

As linhas pretas indicam as perturbações positivas e negativas de um membro, a verde apresenta o membro controle (sem perturbação), a azul apresenta a média dos membros e a vermelha é a verdade atmosférica da grandeza prevista.

A Figura 2.6 apresenta um exemplo de dois possíveis comportamentos de integrações por conjunto, com apenas dois membros (um com perturbação positiva e

(26)

16

outro com negativa) e o modelo sem perturbação (chamado de controle). A Figura 2.6a apresenta os membros afastados mas onde a verdade atmosférica está contida neste intervalo entre os membros, enquanto que a Figura 2.6b mostra uma maior concordância entre os membros, mas se afastando da realidade física da grandeza a ser prevista. Em resumo, a Figura 2.6a pode ser considerada a melhor previsão pois, apesar de ter um grande espalhamento, acompanha bem o processo físico, ao contrário da Figura 2.6b.

Figura 2.7: Exemplo de Spaguetti de temperatura do ar do CPTEC/INPE.

A Figura 2.7 é um exemplo de produto de ensemble chamado de Spaguetti de temperatura do ar, onde as linhas mais próximas indicam convergência entre os membros do ensemble e linhas mais afastadas divergência. Quanto mais convergência, maior concordância entre os membros, sugerindo também uma maior confiança na previsão.

(27)

17

O uso frequente de conjuntos de modelos globais e regionais para simulações de clima (MURPHY et al., 2007, TEBALDI e KNUTTI, 2007, MIN et al., 2007, FRAME et al., 2007, STAINFORTH et al., 2007b) vem contribuindo muito para o desenvolvimento de pesquisas sobre as incertezas das simulações. Várias abordagens foram desenvolvidas lidando com estas informações de uma maneira probabilística (ZAPERT et al., 1998, VISSER et al., 2000, WEBSTER e SOKOLOV, 2000, WIGLEY e RAPER, 2001, LOPEZ et al., 2007), dependendo da informação de funções de densidade de probabilidade (PDF). Um dos primeiros trabalhos a respeito foi desenvolvido por MORGAN e KEITH (1995), que geraram PDFs da sensibilidade climática a partir de uma entrevista com vários especialistas norte-americanos. NEW et al. (2000) e RÄISÄNEN e PALMER (2001) propuseram metodologias probabilísticas usando conjuntos de modelos regionais com 14 e 17 membros, respectivamente.

Ao contrário de RÄISÄNEN e PALMER (2001), que contam a frequência de ocorrências acima de um dado limiar para incluir ou não o modelo no conjunto, GIORGI e MEARNS (2002) propuseram um método para avaliar o peso da contribuição do cada simulação no conjunto baseado nos conceitos de viés da simulação e convergência entre simulações. O método, chamado Reliability Ensemble Averaging (REA), é uma forma linear e objetiva de combinar simulações de clima e foi explorado em outros artigos, como NYCHKA e TEBALDI (2003), MURPHY et al.

(2007) E RÄISÄNEN (2007).

GIORGI e MEARNS (2003) usaram o REA para obter a probabilidade de ocorrência de mudança climática acima de um dado limiar usando nove simulações globais de dois cenários do IPCC. Técnicas Bayesianas vieram complementar a idéia probabilística, como em GREENE et al. (2006), FURRER et al. (2007a, 2007b) e TEBALDI et al. (2004, 2005). Neste último foram associadas às simulações de conjuntos multi-modelo e dados observados para estimar probabilidades de mudanças climáticas usando a métrica do REA como referência de combinação dos membros do

(28)

18

conjunto. Outros métodos também já foram explorados, como técnicas de reamostragem para os conjuntos multi-modelos (DETTINGER, 2006, RÄISÄNEN e RUOKOLAINEN, 2006).

O uso de conjuntos usando um único modelo com condições iniciais perturbadas (perturbed physics ensembles, PPE) também tem sido muito frequente na busca por um maior controle das incertezas das simulações climáticas (WIGLEY e RAPER, 2001, FOREST et al., 2002, KNUTTI et al., 2002, 2003, PIANI et al., 2005, HEGERL et al., 2006).

2.4 Métodos fuzzy para análise de incertezas

A teoria de conjuntos fuzzy teve origem na necessidade de introduzir o conceito de subjetividade aos métodos científicos clássicos. No senso comum fora da linguagem científica clássica, os conceitos normalmente são vagos e a matemática e a lógica clássica não conseguem lidar bem com este tipo de conceito.

O termo fuzzy (“nebuloso”, em português) foi introduzido por ZADEH (1965), quando ele publicou um dos primeiros artigos sobre o assunto, onde introduzia as bases da lógica fuzzy. Nas décadas seguintes o próprio ZADEH (1973, 1976a, 1976b) e depois vários outros pesquisadores, como MAMDANI (1977) e SUGENO (1977), aprimoraram e generalizaram a idéia para vários campos da matemática e da engenharia.

A lógica clássica tem vários axiomas e leis. Um dos axiomas mais importantes é chamado de “Lei da não-contradição” e diz que uma proposição verdadeira não pode ser falsa e vice versa, ou seja, nenhuma proposição pode ser os dois ao mesmo tempo: verdadeira e falsa. Outra lei importante é a “Lei do terceiro excluído”, que diz

(29)

19

que uma proposição só pode ser verdadeira se não for falsa e só pode ser falsa se não for verdadeira, porque o terceiro valor é excluído.

A teoria clássica dos conjuntos, baseada nesta lógica clássica, segue estes mesmos princípios. Um conjunto é uma coleção de elementos onde não importa a ordem dos mesmos. A teoria de conjuntos trata das propriedades destes conjuntos.

CANTOR (1874) introduziu essa teoria numa tentativa de comparar conjuntos infinitos pela combinação um a um de seus elementos. Trabalhos seguintes amadureceram e expandiram a idéia com o significado de pertinência, ou seja, a característica associada a um elemento que faz parte de um conjunto. Uma das principais propriedades da teoria é que cada elemento só pertence a um único conjunto em relação a seu complementar. Essa propriedade leva a um comportamento indesejável próximo à borda de um conjunto. Por exemplo, definindo-se um conjunto de preços altos como sendo preços acima de 200 reais, um produto valendo 199,99 reais não seria considerado caro.

A fim de aproximar mais a matemática do senso comum, a teoria dos conjuntos fuzzy atribui um valor contínuo de pertinência entre zero (não pertence) e um (pertence) para cada elemento em relação a um conjunto (PEDRYCZ e GOMIDE, 1998). Desta forma é possível que um elemento esteja contido em mais de um conjunto ao mesmo tempo, com diferentes graus de pertinência (ZADEH, 1965). No exemplo anterior seria possível atribuir para o produto uma pertinência de 0,9 para o conjunto “preços altos” e 0,1 para “preços baixos”. A própria teoria de conjuntos clássica pode ser obtida a partir de um caso especial de conjunto fuzzy (onde a função de pertinência assume valores binários).

Dois conceitos importantes para a lógica fuzzy são o Suporte e o Núcleo (“Kernel” em inglês). O Suporte de uma função de pertinência fuzzy é o intervalo de elementos com pertinência maior que zero, ou seja, onde há elementos no conjunto.

(30)

20

Já o Núcleo é o intervalo onde a pertinência é máxima (igual a um), ou seja, onde os elementos pertencem totalmente ao conjunto.

A Figura 2.8 apresenta várias representações de conjuntos fuzzy e clássicos (também chamados de conjuntos crisp). A Figura 2.8a apresenta um conjunto clássico, onde valores entre X0 e X1 estão contidos no conjunto e os demais não estão contidos. A mesma figura pode ser interpretada como um conjunto fuzzy cuja função de pertinência é binária, apresentando pertinência igual a um entre X0 e X1 e pertinência nula nos demais elementos. O Suporte nesse caso seria o intervalo entre X0 e X1 e seria igual ao Núcleo.

A Figura 2.8b apresenta um conjunto fuzzy chamado singleton, onde a função de pertinência é tal que sobre um dado valor X0 ela vale um e nos demais vale zero.

A Figura 2.8c apresenta um conjunto fuzzy com função de pertinência triangular. O Suporte deste conjunto vai de X0 a X2 e a função de pertinência tem valor máximo no ponto X1 e cai linearmente até os limites do Suporte, a partir do qual os valores de pertinência são zero. Elementos próximos a X1 são mais compatíveis com as propriedades do conjunto do que elementos mais distantes, por isso X1 nesse caso é chamado de protótipo.

(a) (b) (c)

Figura 2.8: Representações gráficas de configurações de conjuntos.

(31)

21

Geralmente a forma da função de pertinência é triangular, mas ela pode ser expressa de várias formas, mediante a escolha de uma função que a represente, como na função de pertinência gaussiana ou trapezoidal, por exemplo. A função de pertinência trapezoidal convexa apresenta um Suporte sempre maior que o Núcleo, por definição.

Algumas das propriedades derivadas dos conjuntos crisp também são válidas para conjuntos fuzzy, tais como:

• Um conjunto fuzzy num dado intervalo é vazio se e somente se sua

função de pertinência é igual a zero sobre todo o intervalo;

• O complemento de um conjunto fuzzy é dado por 1-µ(x), sendo µ(x) a função de pertinência do conjunto num dado intervalo.

Partindo destas idéias, ZADEH (1976a, 1988) e TERANO et al. (1992) propuseram a definição de um número fuzzy, ou seja, um número tal que as suas operações aritméticas são realizadas como se fossem conjuntos fuzzy. Para isso, entendem-se as Figuras 2.8b e 2.8c também em termos de números fuzzy, onde a Figura 2.8b determinaria que o valor X0 é um valor preciso, enquanto que na Figura 2.8c o valor X1 tem uma faixa de imprecisão que vai de X0 a X2 de acordo com a função de pertinência triangular da figura.

Uma vez que o número fuzzy é basicamente um conjunto fuzzy, várias técnicas aritméticas levaram à elaboração de operações lógicas chamadas de operadores fuzzy generalizados, como se pode ver nos trabalhos de SUGENO (1977), YAGER (1980), DUBOIS e PRADE (1980). A Tabela 2.2 lista alguns dos principais operadores generalizados, sua representação em termos de função lógica e seus tipos mais comuns:

(32)

22

Tabela 2.2: Operadores fuzzy generalizados Operador Função lógica Tipos mais comuns T-norma Conjunção

(operador E)

T(a,b) = min {a,b} (Mínimo) T(a,b) = ab (Produto algébrico)

T(a,b) = max {0, a+b-1} (Soma limitada) T-conorma Disjunção

ou união (operador OU)

Tc(a, b) = max {a, b} (Máximo) Tc(a, b) = a + b (Adição algébrica) Tc(a, b) = min {1,a+b} (Soma limitada) Complemento

fuzzy

Complemento (operador NÃO)

c(a) = (1-a) / (1+λa), λ ∈ (-1;∞) (Complemento involutivo de Sugeno) c(a) = (1-aλ)1/λ, λ ∈ (0;∞)

(Complemento involutivo de Yager)

A t-norma (relativo ao operador E na lógica) é um dos operadores mais comuns e a diferença entre seus tipos está na no grau de restrição do método. Dos listados, o Mínimo é o tipo de t-norma mais tolerante e a Soma limitada é a mais restrita. O inverso ocorre com a t-conorma, onde o Máximo é o mais restritivo e a Soma limitada é mais tolerante.

A criação destas ferramentas básicas da abordagem fuzzy permitiu construir métodos mais sofisticados para aplicações como agrupamentos (BEZDEC, 1981, KRISHNAPURAM e KELLER, 1993, LESKI, 2003), por exemplo.

Em 1977, MAMDANI propôs um processo de inferência fuzzy (também chamado de sistema fuzzy) que consistia de três etapas. Inicialmente as informações iniciais do sistema eram fuzzificadas, ou seja, transformadas em informações fuzzy.

Em seguida, elas sofriam uma inferência aritmética, que dependia basicamente da forma das funções de pertinência de cada conjunto envolvido e das operações generalizadas entre eles. Por último, esses conjuntos fuzzy resultantes era defuzzificados, ou seja, a informação era convertida de fuzzy para uma informação tradicional, normalmente numérica escalar. BUCKELEY e HAYASHI (1993) demonstraram ainda que um sistema fuzzy é um aproximador universal de funções.

(33)

23

Na segunda metade da década de 80, TAKAGI e SUGENO (1985) e SUGENO e KANG (1988) propuseram uma forma diferente de fazer a inferência fuzzy. No sistema fuzzy TSK a saída do sistema não seria mais um conjunto a ser defuzzificado, mas sim um conjunto de equações. Estas equações relacionariam as informações de tal forma a estimar o valor de saída do sistema, tal como uma regressão multivariada.

A regressão fuzzy (TAKAGI e SUGENO, 1985, YING, 1998, DING et al., 1997) parte de uma idéia semelhante à regressão clássica baseada nos conceitos de sistema fuzzy, para dados imprecisos. Existem basicamente duas formas de lidar com esta regressão. A primeira, chamada de regressão possibilística, foi proposta por TANAKA et al. (1982) e tem como objetivo minimizar a variância da saída da regressão. A segunda forma é uma versão fuzzy do método dos mínimos quadrados proposta por DIAMOND (1999) e minimiza o erro quadrático da saída. Em ambos os casos, são possíveis várias combinações de elementos crisp e fuzzy, seja nos parâmetros ou nos dados de entrada ou saída.

Uma regressão intervalar convencional (LONG, 1997) é um método de ajuste semelhante à RLMS, mas onde a variável resposta e ou a variável explicativa são intervalos de dados ao invés de apenas um número. SILVEIRA e BEDREGAL (2001) propuseram adaptar operadores e propriedades fuzzy para a noção intervalar, fazendo com que um valor na função de pertinência tenha associado a ele um intervalo em vez de um número real.

BISSERIER et al. (2008a, 2008b) propôs uma metodologia onde o problema de regressão fuzzy foi simplificado utilizando o conceito de regressão intervalar. O modelo de regressão de Besserier utiliza uma representação baseada no ponto central e no raio do intervalo, conseguindo dar uma maior interpretabilidade para o caso fuzzy da regressão intervalar e ainda garantir que não haja perda de nenhuma informação

(34)

24

sobre as incertezas contidas nos dados. Esta será a metodologia utilizada neste experimento.

KIM et al. (1996) discutiu de forma extensiva as diferenças as regressões fuzzy (inclusive intervalar) e a RLMS. Em seu artigo, Kim aponta que, em relação às suposições básicas, a RLMS assume que os erros de estimativa (resíduos) são devidos à aleatoriedade dos erros de medição (instrumental) ou de fatores relevantes que por algum motivo foram omitidos do modelo final ou mesmo dos dados. Por outro lado, a regressão fuzzy parte do princípio que uma boa parte deste erro vem do conceito de vagueza (fuzziness em inglês), ou seja, os dados ou mesmo o modelo que os descreve contém propriedades ou características vagas, que passam despercebidas pela nossa percepção. Essa vagueza é traduzida pelos números fuzzy, inclusive nos parâmetros. O artigo diz também que a RLMS depende de várias suposições para garantir um bom ajuste, como a normalidade dos dados de entrada.

Algumas metodologias fuzzy têm sido utilizadas na área de geociências e ciências ambientais, como em HALL et al. (2007), que aplicou conjuntos fuzzy para lidar e agregar os cenários do IPCC. Já que a teoria fuzzy lida com informações imprecisas, HA DUONG et al. (2007) e KRIEGLER e HELD (2005) aplicaram esta metodologia na interpretação de experimentos com conjuntos de simulações sem a necessidade de fazer várias hipóteses a priori. Em 2001, XIONG et al. propôs um sistema fuzzy TSK de primeira ordem para combinar previsões de modelos de chuva- vazão.

(35)

25 3. METODOLOGIA

3.1 Objetivo

Neste capítulo serão apresentadas as duas técnicas a serem utilizadas nesta pesquisa: a RLMS e a regressão fuzzy intervalar. As duas técnicas têm idéias e objetivos semelhantes, mas formas e métodos diferentes. Enquanto a primeira é mais simples e intuitiva mas não explicita intrinsecamente a incerteza associada ao processo, a outra envolve um conceito mais elaborado mas que facilita a análise de incertezas, já que o número fuzzy contém essa informação dentro de sua função de pertinência.

3.2 Convenções

Em ambas as metodologias, as k variáveis explicativas são identificadas como Xk e as variáveis resposta como Y, o mesmo se passando com as suas médias (, ). Os vetores correspondentes são representados em letra minúscula carregada (y, xk), e seus elementos em itálico e letra minúscula (yi, xik). Usam-se letras maiúsculas carregadas para as matrizes quando necessárias (X, M, W), sendo os seus elementos representados como os dos vetores. O acento circunflexo é usado para indicar que se trata de valores estimados ( , por exemplo).

3.3 Regressão linear

Como o próprio nome indica, a regressão linear múltipla simples (RLMS) é a forma mais simples e objetiva de regressão neste experimento. Este modelo de

(36)

26

regressão busca estabelecer uma relação linear entre uma variável que se deseja prever Y(t) com outras k variáveis Xk (t), k=1..p, da forma:

Y(t)=akXk(t)

p

k=1

+a0 (3.1)

sendo ak e a0 os coeficientes da regressão. O objetivo é estimar estes coeficientes tal que:

Y(t)=akXk(t)

p

k=1

+a0+ε(t) (3.2)

seja a relação que mais minimiza o erro quadrático médio (Equações 3.3 e 3.4), sendo θ os parâmetros da regressão e o resíduo de regressão dado por ε(t)=Y(t)- Y(t).

∂EQM(θ)

∂θ =0 (3.3)

EQM(θ)=1

N Y(t)-Y(t)2

N

t=1

(3.4)

A Equação 3.2 ainda pode ser escrita de uma forma vetorial da seguinte forma:

onde

Y(t)=aX(t) (3.5)

X(t)=[1,x1(t),x2(t),5xp(t)]T (3.6)

a(t)=[1,a1(t),a2(t),5ap(t)]T (3.7)

(37)

27 3.3.1 Calibração

O processo de calibração é a etapa inicial do método de busca da combinação ótima dos modelos. Parte-se da idéia de que a relação entre os modelos do conjunto de treinamento (ou seja, do período onde há observação para validar as simulações) deve ser quantificada de tal forma a ser usada posteriormente na etapa de combinação.

A calibração é efetuada através de uma RLMS com as projeções Xm(t) de todos os T modelos, tal que:

Y(t)=amXm(t)

T

m=1

+a0+ε(t) (3.8)

onde am e a0 são os coeficientes desta regressão, ou seja, o peso ideal de cada projeção para, combinadas, melhor simular a observação Y(t) e o resíduo ε(t) da regressão.

3.3.2 Combinação

Para a etapa da combinação, o objetivo é combinar os modelos do tempo futuro (ou seja, que não têm observações para validação) usando a mesma relação obtida na etapa de calibração. Os coeficientes am e a0 obtidos na calibração serão repetidos para combinar as projeções futuras X'm(t):

Y'(t)=amX'm(t)

T

m=1

+a0 (3.10)

onde neste caso Y'(t) é a combinação ótima.

(38)

28

Resta nesse caso estimar ε'(t), ou seja, a incerteza (resíduo) associada à combinação ótima da Eq. 3.10. Essa estimativa é obtida através da resolução da equação linear da Eq. 3.11, onde o resíduo ε(t)resultante da regressão do século é modelado em função da variância modelada para o século XX (Eq. 3.11). Nota-se que para obter ε'(t) é necessário obter os parâmetros e e utilizar esses parâmetros sobre a variância V'(t) do século XXI.

ε(t)=γ+τV(t) (3.11)

Uma vez estimados os parâmetros e através da Equação 3.11, aplicam-se estes parâmetros sobre a variância V'(t) entre os modelos do século XXI para se obter ε'(t) (Equação 3.12), ou seja, um resíduo corrigido que leva em conta a dispersão entre os modelos climáticos.

ε'(t)=γ+τV'(t) (3.12)

Utilizando as duas últimas equações a variância dos modelos do século futuro é adaptada para receber os pesos da RLMS do século XX sem se tornar instável.

A obtenção do intervalo contendo 90% dos dados não será dessa vez pelo intervalo de confiança, uma vez que na prática não houve regressão nenhuma para a Eq. 3.10, mas sim apenas o uso dos pesos obtidos na Eq. 3.8 e do resíduo da Eq.

3.12. Para obter este intervalo usar-se-á a hipótese de que o comportamento dos dados tende a uma distribuição normal e desse modo 90% dos dados estão confinados entre X'm(t)±1,65*ε'(t).

(39)

29 3.4 Método fuzzy de regressão intervalar

A análise de regressão de dados fuzzy, também chamada de análise de regressão fuzzy (DIAMOND, 1999) é uma forma de executar o mesmo princípio de regressão porém utilizando números fuzzy. Como um número fuzzy tem uma função de pertinência associada, normalmente a obtenção de seus parâmetros não se dá de forma trivial como na RLMS (que apenas minimiza o erro quadrático médio da estimativa). Neste trabalho será utilizada uma forma de regressão fuzzy chamada intervalar, onde uma metodologia de intervalos será aplicada para a busca dos parâmetros da regressão.

3.4.1 Intervalos convencionais e intervalos fuzzy

Um intervalo convencional a é definido pelo conjunto de elementos situado entre seu limite inferior e superior, ou seja:

a={x|a-≤x≤a+,x∈ R} (3.13)

Um intervalo convencional a pode ser visto como um caso particular de número fuzzy cuja função de pertinência µa assume o valor um sobre o intervalo e zero em qualquer outro lugar (Figura 3.1a). Da mesma forma, um intervalo fuzzy A é representado por sua função de pertinência µA. Com o objetivo de especificar a forma do intervalo fuzzy, é preciso considerar duas dimensões. A primeira (dimensão horizontal) é similar à utilizada na representação do intervalo, que é a linha real ℜ. A segunda (dimensão vertical) está relacionada ao manejo dos graus de pertinência e, consequentemente restrito ao intervalo [0,1] (Figura 3.1b).

(40)

30

(a) (b)

Figura 3.1 – Diferença entre intervalos convencionais (a) e fuzzy (b)

Neste trabalho será utilizado um esquema de transformação de coordenadas para migrar os limites do intervalo para um sistema de raio e ponto central (Fig 3.2).

Dado um intervalo A, é possível definir seu ponto central MA e raio RA como:

Ma = ( a-+ a+ ) / 2 Ra = ( a-- a+ ) / 2

(3.14)

Assim, o intervalo convencional pode ser reescrito como:

a = [ a-, a+] = [ Ma - Ra , Ma + Ra] (3.15)

Dois tipos de informação são necessários para definir um intervalo fuzzy. Dois intervalos definidos sobre a linha real estão associados a dois diferentes níveis, sendo o intervalo do Suporte para nível zero e o intervalo do Núcleo para o nível um (Figura 3.1b). Com isso, define-se o Suporte como o conjunto de todos os valores possíveis dos intervalos fuzzy A, enquanto que o Núcleo é o conjunto de todos os valores com os mais altos graus de pertinência. Quando a função de pertinência µA é linear, o intervalo fuzzy A é trapezoidal e totalmente definido por seus intervalos de Suporte (SA) e Núcleo (KA), como se segue:

(41)

31 SA = [ SA-

, SA+

] KA = [ KA- , KA+ ]

(3.16)

Neste caso, o intervalo trapezoidal fuzzy A é definido por:

A = ( KA , SA ) = ( [ KA- , KA+ ] , [ SA- , SA+ ] ) (3.17)

Um caso particular de intervalo fuzzy trapezoidal é o triangular, cujo Núcleo é reduzido para um valor pontual KA. A Figura 3.2 mostra de forma gráfica a obtenção do ponto central MA e do raio RA para o conjunto fuzzy A. Para comparação, a Figura 3.1b é um intervalo fuzzy trapezoidal enquanto que a Figura 3.2 é triangular. No caso triangular, um intervalo fuzzy é definido por:

A = ( KA , SA ) = ( KA , [ SA-

, SA+

] ) (3.18)

Figura 3.2 – Esquema mostrando a obtenção do ponto central MA e do raio RA. Como intervalos fuzzy trapezoidais e triangulares são completamente definidos apenas por dois intervalos, é possível tratá-los considerando intervalos convencionais.

Além disso, é possível definir a inclusão de dois intervalos fuzzy trapezoidais A e B pela inclusão de dois níveis do Núcleo e do Suporte, ou seja:

(42)

32 A ⊆ B ⇔ KA ⊆ KB

SA ⊆ SB (3.19)

Assim, o problema é reduzido à inclusão de dois intervalos convencionais, que são interpretados em termos de seu ponto central e raio (BOUKEZZOULA et al., 2007) por:

a ⊆ b ⇔ | Mb - Ma | ≤Rb - Ra (3.20)

3.4.2 Regressão Linear Fuzzy

Sendo um conjunto de dados M, da forma x1j , x2j , 5, xNj , Yj, j = 1, 5, M, tem-se o xj o j-ésimo vetor de dados de entrada com N componentes (Eq. 3.21) e Yj o seu vetor de saída correspondente (Eq. 3.22), definido como um intervalo fuzzy triangular.

xj = [ x1j , x2j , 5, xNj ] (3.21)

Yj = ( KYj , [ SYj-

, SYj+

] ) (3.22)

Assume-se que cada componente xi do vetor de entrada é definido em um próprio domínio dado por:

Di = [ ximin , ximáx ] (3.23)

Como em qualquer técnica de regressão, o objetivo da regressão fuzzy é determinar uma relação funcional entre a entrada (x) e saída do modelo de regressão (Y). Esta relação é tida como linear e determinada pela seguinte expressão:

Y(x)=A0 ⊕ A1.x1 ⊕ d ⊕ AN.xN (3.24)

(43)

33

Onde os xi são valores de entrada, os parâmetros Ai são intervalos trapezoidais fuzzy e a saída é um intervalo trapezoidal fuzzy.

Assim, o problema da regressão fuzzy passa a ser estimar os parâmetros fuzzy Ai, i=1, ..., N. BISSERIER et al. (2008a, 2008b) propôs um método de modelo de regressão onde o objetivo é determinar os intervalos de Suporte e Núcleo dos parâmetros, tal que todas as observações estejam incluídas no modelo identificado. O objetivo deste modelo de regressão é minimizar um critério linear sob um conjunto de restrições.

O critério linear a ser minimizado é a representação da incerteza da saída do modelo de regressão (BISSERIER et al., 2008b), como definido abaixo:

RKA0+RSA0+ (RKAi+RSAi).M(Di) .∆i N

i=1

(3.25)

com:

i = sign( M(Di) )=sign( 1

2ximin + ximáx) (3.26)

onde “sign” é uma função que retorna apenas o sinal do seu parâmetro.

As restrições a serem respeitadas pelo modelo devem garantir a inclusão das observações em suas saídas. Por ser um intervalo trapezoidal fuzzy, pode-se restringir a inclusão das observações em apenas dois níveis, ou seja, confinados entre os intervalos de Suporte e de Núcleo. Como as observações são também intervalos fuzzy triangulares, a inclusão do Suporte como restrição é definida pela inclusão de dois intervalos convencionais:

[ SYj- , SYj+ ] ⊆ [ SY

j

- , SY

j

+ ] (3.27)

Referências

Documentos relacionados

Como objetivos específicos, este estudo verifica se essas indústrias possuem um sistema de informações contábil-gerenciais adequado à necessidade dos gestores, a adoção de

do grupo NUIR entre 1991 e 2000. Nos municípios de estrutura industrial fordista, a pobreza sofreu declínio menos acentuado, sugerindo que este tipo mais maduro de indústria tem

Esta pesquisa, vinculada a uma linha de estudos voltada à compreensão dos processos de aquisição da escrita, tem como objetivo geral mapear as representações

3.2.2 – Experimento de biodegradação com culturas monoclonais de cianobactérias Os experimentos de degradação foram conduzidos em Erlenmeyers com capacidade para 50 mL, nos

As relações internacionais, neste mundo de economia globalizada, são marcadas por grande competição entre os Estados, nem sempre tão amigáveis, na medida em que ferem os

Figura 8 – Imagem do software desenvolvido para aplicação no teste de agilidade de Monte (2004a). e) Raquete de tênis, dentro dos padrões exigidos pela Federação

It is important to observe the change in the lipid droplets (ld) aspect, probably denoting a chemical alteration in lipid molecules. 4 shows the peripheral region of an oocyte

A feminilidade (LIMA, 2006), então, deixa uma face de não-sabido, enquanto a maternidade, ao colocar uma distância entre o não-sabido e o saber, não consegue,