• Nenhum resultado encontrado

2.2 Tipos de modelo numérico

2.1.2 Modelo regional

È uma solução para aumentar a resolução do modelo sem aumentar o custo computacional. Consiste em limitar a grade em uma zona geográfica limitada de interesse. Deste modo pode-se prever fenômenos de pequena escala como tempestades.

Figura 2.4 - Grades do Centro, Leste, Oeste Americano, Havaí, Alasca e Porto Rico. FONTE: NCEP/NOAA, Gutiérrez (2003).

2.3 Previsão climática

A previsão climática é uma estimativa do comportamento médio da atmosfera com alguns meses de antecedência. Por exemplo, pode-se prever se o próximo verão será mais quente ou mais frio que o normal, ou ainda, mais ou menos chuvoso. Todavia, tal estimativa não pode dizer exatamente qual será a quantidade de chuvas ou quantos graus a temperatura estará mais ou menos elevada.

Para previsão climática, no CPTEC-INPE são utilizados modelos numéricos, alguns em caráter experimental, pois no Brasil e no mundo, essa é uma área que está em constante evolução com o propósito de torná-la mais confiável (Centro de Previsão do Tempo e Estudos Climáticos, 2003).

O modelo de circulação geral atmosférico (MCGA), descrito na seção 2.1.1, tem sido utilizado para estudar a variabilidade e as mudanças climáticas e predição sazonal no CPTEC, na qual emprega uma técnica para o tratamento do comportamento caótico da atmosfera denominada de ensemble, conhecida também por previsão por conjuntos, que é uma ferramenta necessária para reduzir os efeitos das condições iniciais (Cavalcanti et al, 2002).

A previsão por ensemble é o resultado da média de todos os membros do MCGA (Figura 2.3) e surgiu com a finalidade de aumentar os prazos de previsões de tempo e clima e a previsibilidade dos modelos dinâmicos (não lineares), através da suposição de que os modelos sejam perfeitos e, assim, considerando apenas a incerteza na condição inicial, busca-se, através de alguma técnica específica, estimar os erros associados às observações para criar um conjunto de condições iniciais perturbadas. Este método veio para solucionar o problema da previsibilidade numérica de forma determinística, pois Lorenz (1963, 1965, 1969) observou que a solução de sistemas de equações semelhantes às que governam os movimentos atmosféricos, apresentam dependência sensível em relação às condições iniciais fornecidas no início da integração, ou seja, notou que partindo de condições ligeiramente perturbadas, após algum tempo de integração, as soluções podem ser completamente diferentes. Isto é conhecido como caos determinístico e é o fenômeno que limita o horizonte das previsões pois devido às condições iniciais ligeiramente perturbadas o erro se propaga exponencialmente pelo sistema gerando resultados errados Gutiérrez (2003). Portanto dependendo das aproximações físicas e escalas consideradas no modelo numérico, a não linearidade deste imporá um alcance maior ou menor na predição.

2.4 Tipos de previsão

Assim como os modelos numéricos para previsão, seja de tempo ou clima, os tipos de previsão ou predição, estão relacionados com a resolução temporal e espacial dos dados. Esta dependência espaço-temporal é mostrada na Figura 2.5, pois quando se aumenta o

alcance da previsão decresce a resolução espacial e os fenômenos que podem ser preditos.

Tabela 2.1 – Alcance das previsões. Previsão Alcance de Previsão Now-casting (imediata) minutos, horas

Curto prazo 1 a 3 dias

Médio prazo (ensemble) 4 a 15 dias

Mensal mês

Sazonal trimestre

As previsões, a respeito do comportamento atmosférico em escalas na ordem de metros e km, são realizadas de forma determinística para um alcance temporal na ordem de minutos e segundos (Tabela 2.1). Não é possível realizar previsões nestas escalas para dias, meses e anos, pois o modelo, devido a sua não-linearidade, apresentaria resultados totalmente equivocados devidos às incertezas associadas nas condições iniciais. Já nas previsões para médio prazo, que são aquelas com um alcance de quatro a quinze dias, tem que ser realizada utilizando a técnica do ensemble, também conhecida como previsão por conjuntos, para minimizar os efeitos das condições iniciais a médio prazo. As previsões mensais e sazonais são realizadas com ensemble e de forma probabilística, como mostra a Figura 2.5.

Portanto os tipos de previsão são: Determinística e Probabilística.

D et er m in ís ti ca P ro b ab il ís ti ca

Tipos de Predição

a n u a l m e n sa l d iá ri a h o rá ri a m km 100 km 1000 km

Escala Espacial

E

sc

a

la

T

em

p

o

ra

l

computacionalmentecustoso Restrição Não-linearidade do modelo Precip. = 10.3 mm P(Precip.>10mm)=0.85 Anomalia > s

Precip. diária esperada para manhã é de 10.3mm

A probabilidade de que a precip. diária esperada para dentro de uma semana supere 10mm é de 0.85

É provável que a anomalia da precip. acumulada para o próximo inverno seja atípica

Now- casting Curto prazo Médio Prazo Mensal Sazonal

2.4.1 Previsão determinística

Uma previsão é determinística quando proporciona um estado para uma variável discreta ou contínua, como por exemplo, vento > 90km/h, precipitação é 18.5 mm (Gutiérrez, 2003). São previsões que obedecem as funções do tipo f: C P, onde f é a função de predição, C as variáveis necessárias para realização da previsão e P o estado da variável prevista.

Existem dois tipos elementares de previsão determinística:

Persistência: Consiste em prognosticar para um dado instante de tempo t o que ocorreu no instante t-1.

ô(t)=o(t-1);

Climatologia: Consiste em prognosticar utilizando algum parâmetro derivado da distribuição climatológica obtida empiricamente para um evento dado. Por exemplo, a precipitação predita para um dia de Janeiro será a média dos valores diários da precipitação em Janeiro nos últimos dez anos:

ô(t)=<o(ti)>; i=1..N;

onde < > denota a média para o período desejado, ô(t) o valor predito para o(ti).

2.4.2 Previsão probabilística

Uma predição é probabilística quando descreve em termos quantitativos a incerteza associada com a predição. O prognóstico realizado é uma distribuição de probabilidade sobre os de valores de uma variável. As predições podem ser visualizadas com variáveis continuas ou discretas como mostra a Figura 2.6.

Figura 2.6 – Previsão probabilística. À esquerda a previsão probabilística contínua e a direita mostrada de forma discreta ou categórica.

3 MINERAÇÃO DE DADOS

3.1 Introdução

Claramente o volume de informações cresceu vertiginosamente, com o aumento significativo da capacidade de armazenamento que as tecnologias para estes fins vêm permitindo. Mas nem sempre o acúmulo de informações é benéfico. Em muitos casos mantêm-se estas grandes bases para fazer simples consultas, sem retirar destas, informações que tenham “valor” ou significado. Por isso e para isso, surgiu a descoberta de conhecimento para de banco de dados, “lapidar”, “extrair” ou “minerar” padrões que estejam escondidos entre os dados com o propósito de entender o comportamento dos mesmos.

Neste contexto de exploração de grandes bases de dados, este capítulo trata basicamente das definições sobre mineração de dados, que faz parte do processo de descoberta de conhecimento, que servirá de fundamento teórico para o estudo desenvolvido nesta dissertação, uma vez que se deseja fazer previsão climática, com técnicas empregadas na inteligência artificial, com o menor número de variáveis possíveis.

Como reduzir variáveis envolve o entendimento das relações entre elas e a mineração de dados executa esta tarefa, então se optou pelo emprego desta metodologia, que é descrita com maiores detalhes a seguir.

3.2 Definições básicas

Mineração de dados é um conjunto de técnicas computacionais para a extração de informações desconhecidas e potencialmente úteis em grandes volumes de dados através de um resumo compacto dos mesmos. O termo “mineração de dados” é somente um de vários termos, incluindo extração de conhecimento, arqueologia de dados,

colheita de informações ou descoberta de conhecimento em banco de dados (KDD - Knowledge Discovery in Databases) (Fayyad et al, 1996).

Chen (2001) Define mineração de dados como a extração não-trivial de informações implícitas, previamente desconhecidas, interessantes e potencialmente usuais, dos dados.

As características principais do processo de mineração de dados são:

• O conhecimento descoberto é representado em uma linguagem de alto nível que pode ser entendido por usuários humanos.

• As descobertas retratam o conteúdo do banco de dados.

• O conhecimento descoberto é interessante de acordo com os usuários. • O processo de descoberta é eficiente.

Algumas vezes os termos KDD e mineração de dados são usados com o mesmo sentido. Isto porque, do ponto de vista da aplicação, o acrônimo KDD, está diretamente relacionado à extração de conhecimento residente em base de dados, fazendo uso de sistemas gerenciadores de banco de dados, enquanto a mineração de dados, não especifica o tipo da fonte de dados e muito menos o formato dos mesmos (Chen, 2001).

A pesquisa em KDD tem crescido e atraído esforços, baseada na disseminação da tecnologia de bancos de dados e na premissa de que as grandes coleções de dados hoje existentes podem ser fontes de conhecimento útil, que está implicitamente representado e pode ser extraído. No sentido de viabilizar esta tecnologia, a KDD se vale, entre outras coisas, de técnicas de inteligência artificial e de conceitos estatísticos para lidar com a incerteza relacionada às descobertas.

Documentos relacionados