• Nenhum resultado encontrado

4 Experimentos e resultados

4.4.1 Aperfeiçoamento da Rede

Seguindo a melhora nos resultados da Rede 2 quando os grupos de treino e testes não foram formados por todos os dados de uma mesma região ativa e houve uma separação aleatória destes dados entre os grupos, novos testes foram feitos com a Rede 1 seguindo este mesmo critério. Foram feitos testes com as 196 regiões ativas de testes anteriores (início dos testes para Rede 1 do Experimento 4), com dados de todos os seus dias.

Para a construção destas redes o parâmetro Explode foi forçado como folha. A rede do Teste 24 é um cross-over da base de dados para a rede do Teste 23. Como as redes aprendidas nos dois testes (23 e 24) possuem a mesma estrutura, a rede resultante é mostrada na Figura 54. Na Tabela 55 estão os resultados dessas redes.

Figura 54 – Experimento 4 Rede 1 Testes 23 e 24

Tabela 55– Novos resultados dos testes da Rede 1 do Experimento 4

Dados de treino Dados de teste Teste Limite

Correto Indefinido Errado Correto Indefinido Errado

Teste 23 5% 88% 3% 9% 84% 3% 13%

Teste 24 5% 89% 1% 10% 83% 2% 15%

Analisando-se estes resultados pode-se perceber que o número de indefinidos é muito baixo, entre 2% e 3% (para teste). Isto demonstra que a variação realizada na separação dos

dados entre grupos de treino e teste dividindo os dados de uma mesma região ativa entre eles foi positiva. E como as redes aprendidas resultaram em um mesmo desenho de rede, pode-se observar que a mesma é robusta.

É interessante observar que para a Rede 1 o mesmos parâmetros McIntosh11,

McIntosh 12 e McIntosh 13 influenciam o parâmetro Explode, assim como acontece com o DiaExp na Rede 2. Porém, na Rede 1 existe também o parâmetro Nspotsg, enquanto que na

Rede 2 aparecem também os parâmetros Areag e Haleg. Estes relacionamentos de causalidade foram encontrados pelo software de aprendizado de redes, o BN PowerConstructor.

5 Conclusão

O melhor entendimento sobre o relacionamento entre os parâmetros que caracterizam as regiões ativas é de fundamental importância para um entendimento mais amplo do comportamento destas regiões ativas e uma possível previsão da ocorrência das grandes explosões cuja atividade associada pode atingir a Terra. Para a previsão das grandes explosões solares utilizamos o método de Redes Bayesiana através dos programas BN

PowerConstructor e Hugin Os dados contendo informações de regiões ativas utilizados no

aprendizado das redes foram obtidos do site SolarMonitor (www.solarmonitor.org).

Neste trabalho, a rede para a previsão se a região ativa irá ou não produzir grandes explosões (• M5) conseguiu um alto índice de confiabilidade, para os primeiros testes, atingindo 95% para o grupo de treino e 91% para o de testes (podendo aumentar para 94% se for considerada uma soma das probabilidades corretas com indefinidas). Estes números eram muito bons, porém, os muitos testes realizados levaram à conclusão que estas redes aprendidas inicialmente, apesar de muito confiáveis para a Rede 1, não abrangiam todas as regiões ativas, uma vez que foram criadas com base em dados de regiões ativas que possuíam pelo menos seis dias de informações (D-5 à D0).

Desta forma, e com alterações feitas na base de dados para considerar os gradientes dos parâmetros Nspots, Hale e Area, foram criadas redes que consideravam as informações de todos os dias da região ativa anteriores à explosão. As redes criadas em um primeiro momento, levaram em conta apenas a alteração para valores de gradiente, mas ainda permaneceram apenas com regiões ativas que continham informações de seis dias. Os resultados obtidos nestas redes foram muito satisfatórios, com uma média de 93% para treino e 80% para testes.

Já para as redes criadas posteriormente e que possuíam uma abrangência maior, isto é, todas as regiões ativas que abrigaram explosões (• M5) e igual número de regiões ativas sem explosões, mesmo que tivessem ou não mais do que seis dias de informações, os valores médios de acerto dessas redes para treino e teste foram de 87% e 84%, respectivamente (considerando a média de todos os resultados das Redes 1 do Experimento 4).

Como estes valores são próximos e mesmo com valor médio inferior para treino, o experimento escolhido foi o de número quatro, pois a confiabilidade de 84% para o grupo de treino foi baseada em dados de todos os tipos que existem na base de dados consultada, a qual não contém restrições aos dias de observação.

No Experimento 4 foram realizados diversos testes, mas pode-se observar a presença constante da subestrutura composta pelos parâmetros McIntosh11, McIntosh12 e McIntosh13, onde estas três variáveis sempre se relacionam com o parâmetro Explode, além do parâmetro

Nspotsg que também aparece relacionado com Explode.

Devido à maior abrangência contemplada nas redes dos Testes 23 e 24 (dados de todas as regiões ativas, mesmo que só possuíssem dados de 2 dias, por exemplo) e aos bons resultados, e sendo a rede do Teste 23 ligeiramente mais confiável do que a rede do Teste 24 (criada como cross-over do Teste 23), a rede eleita foi esta. Para a rede do Teste 23 selecionada, os resultados da probabilidade de prever corretamente uma explosão foram 88% para o grupo de treino e de 84% para o grupo de teste. Considerando-se ainda a probabilidade de indefinidos estes valores aumentam para 91% e 87%, respectivamente. Nesta rede, a ocorrência de grandes explosões está associada, além da subestrutura citada acima (McIntosh11, McIntosh12 e McIntosh13), ao parâmetro Nspotsg (gradiente de Nspots).

Isto indica que a configuração magnética das manchas em uma região ativa (McIntosh) aliado a variação do número de manchas (Nspotsg) determinam se uma região ativa produzirá ou não uma grande explosão (• M5). Neste trabalho foi mostrado que é possível prever a ocorrência de explosões • M5 com probabilidade de 84% para qualquer região ativa.

Já para a Rede 2, que visa prever quando a explosão ocorrerá, foram feitos diversos testes, sendo que as porcentagens resultantes variam entre 40% e 77% para teste e 48% e 78% para treino. A partir destes resultados conclui-se que não existem dados suficientes disponíveis para uma boa análise e criação da rede que possa prever o dia da explosão. Dos poucos dados existentes, nem todos puderam ser aproveitados nos estudos, uma vez que algumas regiões ativas surgem no limbo solar, e não é possível dizer se já houve ou não explosão.

Portanto, de todos os resultados obtidos nos testes, podem ser ressaltados dois:

- a criação de um grupo “1” de 4 redes para a definição do dia em que a explosão ocorrerá, sendo que a primeira rede (Teste 9) é responsável por informar se haverá explosão

nos intervalos de dias {0, 1, 2} ou {3, 4, 5, 6} ou {7, 8, 9, 10, 11}. As outras três redes são responsáveis por definir com mais exatidão o dia em que ocorrerá tal evento: dias 0, 1 e 2 (Teste 11) ou dias 3, 4, 5 e 6 (Teste 14) ou 7, 8, 9, 10 e 11 (Teste 15).

- a criação de um grupo “2” de 3 redes para a definição do dia em que a explosão ocorrerá, sendo que a primeira rede (Teste 17) é capaz de informar se haverá explosão (• M5) nos intervalos de dias {3, 4, 5} ou {6, 7, 8, 9, 10, 11}. As outras duas redes refinam esta busca: dias 3, 4 e 5 (Teste 19) ou dias 6, 7, 8, 9, 10 e 11 (Teste 21). Na Tabela 56 estão os resultados para este conjunto de redes e a que testes as redes aprendidas pertencem.

Embora na análise da Tabela 54 os Testes 3, 17 e 18 foram os que ofereceram melhores resultados (acima de 60%), e sendo o Teste 18 um cross-over da rede do Teste 17, apenas este último teste, com melhores resultados, foi selecionado. Já o Teste 3 é bem semelhante aos Testes 17 e 18, sendo diferente apenas no fato de o dia 6 pertencer ao primeiro grupo de dias e não ao segundo como nos Testes 17 e 18. Como o Teste 17 possui resultados melhores do que o Teste 3 também, foi o selecionado como a melhor rede para a previsão do dia em que a primeira grande explosão irá ocorrer.

É interessante observar que a rede do Teste 17 possui a mesma estrutura de diversas outras redes do Experimento 4, como por exemplo as redes dos Testes 4, 7, 8, 13, 14, 15, 16 e 21. Este fato demonstra a robustez da rede aprendida.

Tabela 56– Resultados dos testes da Rede 2 elegíveis

Dados de treino Dados de teste Grupo Teste

Correto Indefinido Errado Correto Indefinido Errado

Teste 9 60% 16% 24% 54% 11% 35% Teste 11 71% 13% 16% 46% 27% 27% Teste 14 60% 14% 26% 54% 10% 36% 1 Teste 15 51% 30% 19% 55% 20% 25% Teste 17 76% 2% 22% 77% 1% 22% Teste 19 68% 12% 20% 56% 8% 36% 2 Teste 21 49% 25% 26% 51% 19% 30%

Analisando-se os resultados descritos nesta tabela, conclui-se que a falta de dados é o principal problema para a criação de uma rede eficaz para a previsão do dia exato da explosão, pois, se esta análise for feita de forma macro, descobrindo-se apenas a que grupo de dias (intervalo) a região ativa em questão pertence, os resultados atingem 54% para teste no primeiro grupo. Já para o segundo grupo de redes, o resultado é de 77%. A diferença principal entre estes dois grupos é que no segundo não existem regiões ativas que abrigam explosões nos dias 0, 1 ou 2.

Desta forma, o grupo melhor para ser eleito como Rede 2 é o primeiro, pois é mais abrangente. Exatamente por este motivo este grupo possui valores cada vez menores de acertos, pois o número de possibilidades de dias é grande, enquanto que o de dados é pequeno. Quanto mais refinada for a pesquisa, menor o número de dados existentes para os testes e conseqüentemente menores os resultados de acerto da rede.

É interessante observar que as variáveis que causam o parâmetro que informa o dia da explosão, DiaExp, são os mesmos nas redes finais: Mcintosh11 (configuração do grupo),

McIntosh12 (penumbra da mancha), McIntosh13 (compactação das manchas no grupo), Areag

(variação do tamanho da área da região ativa) e Haleg (gradiente da configuração magnética), existindo apenas pequenas alterações de relacionamento entre estas variáveis de rede para rede. Conforme mencionado para a Rede 1, quatro variáveis afetam diretamente a ocorrência de grandes explosões: McIntosh11, McIntosh12, McIntosh13 e Nspotsg (número de manchas dentro de uma região ativa), sendo as três primeiras variáveis também responsáveis pela previsão do dia da explosão (DiaExp).

O fato de a configuração magnética não aparecer diretamente como sendo responsável pela definição se haverá ou não explosão (Rede 1), contrariando o resultado anterior de Sammis e colaboradores (2000) de que a configuração magnética (Hale) era um fator importante, pode ser explicado pelo fato deste parâmetro ser muito importante para a definição do dia em que a explosão ocorrerá, sendo que a configuração magnética se altera próximo da explosão acontecer. Já uma rede criada baseada em outros relacionamentos pode prever com antecedência se ocorrerá ou não explosão (embora não definindo quando a mesma irá acontecer).

Neste trabalho foi criada uma seqüência de redes para 1) prever se haverá ou não explosão e 2) quando isto irá ocorrer. Os resultados para a primeira parte foram bem satisfatórios, porém, os resultados para a segunda rede, isto é, a capacidade de prever quando

uma explosão irá ocorrer dada certa configuração das manchas das regiões ativas, a previsão não foi tão boa, atingindo 77% no melhor dos testes. Para a previsão do dia exato da explosão, os parâmetros que influenciaram esse fato são, além da configuração magnética das manchas em uma região ativa (McIntosh), a variação da área (Areag) e o aumento da complexidade magnética da mancha (Haleg). Essa última relação já era conhecida – manchas com Hale • •• são mais propícias a explodirem.

Para aumentar a taxa de confiabilidade destas redes, mais dados são necessários, pois o pequeno número de explosões • M5 na base de dados dificulta / impossibilita a previsão do dia com maior precisão (apenas um dia ao invés de um intervalo com 3 a 6 dias). Caso seja suficiente prever o intervalo de dias em que a explosão ocorrerá, poderá ser feita uma combinação dos resultados das redes dos Testes 17 e 9, onde a primeira possui uma taxa relativamente alta de confiabilidade (77%), porém não consegue prever explosões nos dias 0, 1 e 2, o que a rede do Teste 9 faz com 54% de acerto ou 65% com indefinidos.

No entanto, com todos os resultados disponíveis foi possível concluir que a técnica de aprendizado das Redes Bayesianas é eficiente para a solução deste problema, sendo necessários mais dados para aprimoramento das mesmas a fim de aumentar a probabilidade de previsão da ocorrência de explosões.

Referências

ANDERSEN, S.K.; OLESEN, K.G.; JENSEN, F.V.; JENSEN, F. Hugin. A shell for building

bayesian belief universes for expert systems. In: Proceedings of the 11th International

Congress on Uncertain Artificial Intelligence, p. 1080-1085, 1989. BAYESIA Ltd, Software. Disponível em <http://www.bayesia.com>

CHENG, J.; BELL, D.; LIU, W. Learning bayesian networks from data: An efficient

approach based on information theory. Tech. Rep. – Department of Computer Science –

University of Alberta, 1998.

FRIAÇA, Amâncio C. S.; DAL PINO, Elisabete; SODRÉ JR, Laerte; JATENCO-PEREIRA, Vera. Astronomia: Uma Visão Geral do Universo. 2. ed. São Paulo: Editora da Universidade de São Paulo, 2003. p. 81-95.

KADIE, C. M.; HOVEL, D.; HORVITZ, E. MSBNx: A Component-Centric Toolkit for

Modeling and Inference with Bayesian Networks. Microsoft Research Technical Report MSR-

TR-2001-67, 2001.

KÜNZEL, H. Die Flare-Häufigkeit in Fleckengruppen unterschiedlicher Klasse und

magnetischer Struktur. Astronomische Nachrichten, v. 285, p. 271, 1960.

LANG, Kenneth R. Sun, earth and sky. 1. ed. New York: Springer, 1997. p. 75-90.

MCINTOSH, Patrick S. The classification of sunspot groups. Springer Netherlands: Solar Physics Journal, v. 125, p. 251-267, 1990.

RAFFAELLI, Tatiana; SILVA, Adriana V. R.; MARENGONI, Mauricio. Detecting Giant

Solar Flares Based on Sunspot Parameters Using Bayesian Networks. Lecture Notes in

Artificial Inteligence, Hobart, Australia, v. 4303, p.986-991, 2006

SAMMIS, Ian; TANG, Frances; ZIRIN, Harold. The Dependence of Large Occurrence on the

Magnetic Structure of Sunspots.The Astrophysical Journal, 540:583-587, 2000.

SILVA, Adriana Válio Roque da. Nossa Estrela: o Sol. 1. ed. São Paulo: Editora Livraria da Física, 2006.

SOLARMONITOR at NASA Goddard Space Flight Center's Solar Data Analysis Center (SDAC). Apresenta informações em tempo quase que real e informações arquivadas sobre regiões ativas e atividades solares. Disponível em <http://www.solarmonitor.org>.

SIDC - Solar Influences Data Analysis Center do Royal Observatory of Belgium e do Lake

TAYLOR, Peter O. Observing the Sun.1 ed. USA: Cambridge University Press, 1991. p. 29. WHEATLAND, M. S.. A Bayesian Approach to Solar Flare Prediction. The Astrophysical Journal, 609:1134-1139, 2004.

Documentos relacionados