• Nenhum resultado encontrado

UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO DIRETORIA DE PESQUISA

N/A
N/A
Protected

Academic year: 2021

Share "UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO DIRETORIA DE PESQUISA"

Copied!
5
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DO PARÁ

PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO DIRETORIA DE PESQUISA

PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA – PIBIC : CNPq, CNPq/AF, UFPA, UFPA/AF, PIBIC/INTERIOR, PARD, PIAD, PIBIT, PADRC E FAPESPA

RELATÓRIO TÉCNICO - CIENTÍFICO Período : 11/2015 a 02/2016

( X ) PARCIAL ( ) FINAL

IDENTIFICAÇÃO DO PROJETO

Título do Projeto de Pesquisa (ao qual está vinculado o Plano de Trabalho): Avaliação de algoritmos para classificação de séries temporais representando faltas do tipo curto-circuito em linhas de transmissão

Nome do Orientador: Jefferson Magalhães de Morais Titulação do Orientador: Doutorado

Faculdade: Faculdade de Computação

Instituto/Núcleo: Instituto de Ciências Exatas e Naturais Laboratório: Laboratório de Mineração de Dados

Título do Plano de Trabalho: Avaliação de algoritmos para classificação de séries temporais representando faltas do tipo curto-circuito em linhas de transmissão

Nome do Bolsista: Paulo Roberto Silva Chagas Júnior Tipo de Bolsa : ( ) PIBIC/ CNPq ( ) PIBIC/CNPq – AF

( )PIBIC /CNPq- Cota do pesquisador ( ) PIBIC/UFPA ( ) PIBIC/UFPA – AF ( ) PIBIC/ INTERIOR ( )PIBIC/PARD ( ) PIBIC/PADRC (X) PIBIC/FAPESPA

(2)

( ) PIBIC/ PIAD ( ) PIBIC/PIBIT INTRODUÇÃO

Grande parte dos dados gerados pelos Sistemas Elétrico de Potência (SEP), são séries temporais que podem servir de indicativo do nível de Qualidade de Energia Elétrica (QEE) fornecidas pelas concessionárias de energia. Apesar dos esforços dessas empresas para garantir a qualidade de energia entregue para seu consumidores, ainda é grande quantidade de ocorrências de blackouts.

Neste projeto, investiga-se uma importante classe de eventos de QEE: as faltas do tipo curto-circuito em linhas de transmissão que são responsáveis por cerca de 70% dos distúrbios e blackouts que ocorrem nos SEPs.

Nesse contexto, se tratando de análise de grandes quantidades de dados, entra o conceito de mineração de dados. Segundo Witten (2005), mineração de dados utiliza técnicas para encontrar e descrever padrões estruturais nos dados a fim de ajudar a explicar esses dados e fazer predições a partir dos mesmos. Técnicas de mineração de dados serão utilizadas para encontrar padrões nos eventos em questão (faltas do tipo curto-circuito em linhas de transmissão) de forma que não só se entenda melhor o que ocorre nessas faltas, mas que também seja possível classificar futuras faltas que possam vir a acontecer.

JUSTIFICATIVA

É crescente a quantidade de dados armazenados em um sistema computacional. Uma boa parte desses dados, em particular dados coletados automaticamente por aplicações de monitoração, são dados de séries temporais. Uma série temporal é uma sequência de observações realizadas ao longo do tempo. Neste tipo de dados estamos interessados em analisar e modelar as dependências entre as observações vizinhas, por isso é crucial a ordem dos dados. Séries temporais aparecem em muitas aplicações cientificas e econômicas, como por exemplo, o volume de produtos vendidos, dados de telecomunicações e dados obtidos pela digitalização de sinais em Sistemas Elétricos de Potência (SEPs), caso de estudo deste projeto.

Grande parte dos dados gerados pelos SEPs, quando não processados de maneira correta, podem impedir que sejam evidenciadas características cruciais para um melhor aproveitamento de recursos financeiros, pessoais, administrativos e materiais, bem como o não aprimoramento da prestação de serviços a sociedade por parte das concessionárias de energia elétrica.

No que se refere à Qualidade da Energia Elétrica (QEE) fornecida por essas concessionárias, mesmos com os esforços para garantir que a mesma seja entregue aos consumidores e correndo o risco de serem penalizadas com pesadas multas, as concessionárias de energia elétrica ainda não conseguem evitar ou prevenir a grande quantidade de ocorrências de blackouts, popularmente conhecidos como “apagões”, que dependendo de como ocorrem, provocam danos severos nos equipamentos elétricos dos consumidores finais, os quais podem ser: industriais, comerciais, residenciais e rurais, conforme a ANEEL (2012).

Tendo em vista a satisfação dos consumidores e os encargos financeiros provenientes de interrupções do fornecimento de energia não programadas, fica evidente a importância que os Sistemas Elétricos de Potência têm para uma transmissão de energia elétrica com qualidade, segurança e confiabilidade, uma vez que os mesmos adotam mecanismos de diagnóstico de faltas (distúrbios) que, se detectadas, classificadas e localizadas com rapidez e precisão, permitem o restabelecimento do funcionamento do sistema elétrico no menor tempo

(3)

possível. Entretanto, é preciso salientar que esta qualidade nem sempre é atingida, devido às faltas que ocorrem na operação desses sistemas.

Entende-se por uma falta em um SEP, qualquer falha (parcial ou total) no fornecimento de energia elétrica. Essas faltas podem ser oriundas de fenômenos internos ou externos ao SEP, sendo que os internos podem estar por exemplo, relacionados a sobrecarga de equipamentos. E os fenômenos externos podem por exemplo, ser provenientes de sobretensões devido à descargas atmosféricas. Em um contexto geral, essas falhas podem ocorrer em diferentes equipamentos de um SEP durante o processo de transmissão de energia elétrica. Neste projeto, o enfoque será nas faltas do tipo curto-circuito em linhas de transmissão responsáveis por cerca de 70% dos blackouts e distúrbios que ocorrem nos SEPs.

Como base nesse contexto, o objetivo deste projeto consiste na classificação de séries temporais com faltas do tipo curto-circuito em linhas de transmissão. Essas séries temporais podem ser representadas através de front ends. Os front ends abordados nesse trabalho são:

raw (o sinal é representado pelos valores puros), wavelet (o sinal é representado pelos

coeficientes obtidos da decomposição wavelet), wavelet energy (o sinal é representado por valores, também chamados de energia, obtidos pelos coeficientes wavelet). A proposta desse projeto é otimizar o processo de seleção de parâmetros para classificação e utilizar um front

end que é a concatenação dos front ends citados anteriormente, onde o mesmo foi chamado

de “concat frontend”. OBJETIVOS

O principal objetivo deste projeto era avaliar algoritmos para classificação de séries temporais representando faltas do tipo curto-circuito em linhas de transmissão. A ideia seria comparar as arquiteturas baseadas em frames (FBSC) com as denominadas segmentadas tais como Cadeias Ocultas de Markov (HMM) e Alinhamento Temporal Dinâmico (DTW), e a partir dos resultados obtidos, constatar qual metodologia apresentou melhor desempenho no processo de classificação.

No entanto, ao longo do projeto os objetivos foram sendo redefinidos. O principal objetivo agora é aplicar um método de otimização no processo de seleção parâmetros da concatenação de front ends. Para tal, pode-se sintetizar o projeto nas seguintes etapas:

• Modificar a classe ConcatenatedFrontEnd, de forma que a mesma gere corretamente os arquivos de front end concatenado;

• Implementar uma rotulação intuitiva para o front end concatenado;

• Pesquisar/implementar métodos de otimização para o processo de seleção de parâmetros;

• A partir dos resultados, verificar a performance do classificador e quais parâmetros (front

ends) são mais relevantes.

MATERIAIS E MÉTODOS

A aplicação é composta de duas partes principais: pré-processamento e classificação. O pré-processamento consiste pegar os dados simulados, adequá-los num front end e gerar um arquivo de extensão “.arff” para cada falta simulada. Esse processo é todo implementado utilizando a linguagem de programação Java e algumas APIs, por exemplo o Amazontp para a simulação das faltas e o matlabcontrol para a integração entre Java e MatLab.

Esse arquivo “.arff” serve como entrada na segunda etapa, o processo de classificação. Esse processo utiliza métodos de mineração de dados para que o classificador tenha o melhor desempenho possível. Nesta etapa o arquivo em questão é minerado no WEKA, uma

(4)

ferramenta que possui vários algoritmos de mineração de dados e é muito utilizada em aplicações de aprendizado de máquina. Métodos de otimização serão utilizados nessa etapa a fim da classificação ser eficiente e computacionalmente viável.

RESULTADOS

Como resultados parciais, foi elaborado um projeto baseado no problema encontrado no processo de classificação. O principal problema é a questão da dimensionalidade, pois o front

end concatenado possui um número muito grande de atributos, gerando uma computação

indesejada.

Como avanço teórico, a compreensão do processo como um todo, desde o pré-processamento, simulação de faltas, aplicação dos front ends até o processo de classificação das faltas, foi muito significativa. Além disso, foi feita uma pesquisa sobre técnicas de mineração de dados, métodos de otimização de seleção de parâmetros (tais como algoritmos genéticos e otimização por enxame de partículas), que devem ser implementados futuramente. Para tal, foi necessário o aprendizado de ferramentas voltadas não só à mineração de dados, mas também à área de sinais.

Como avanço prático, foi feita a substituição de uma API ultrapassada (JMatLink) por uma mais recente (matlabcontrol) e, a partir disso foi possível corrigir a classe que geraria o

front end concatenado. Na versão atual, a aplicação faz o pré-processamento de forma

satisfatória, utilizando uma melhor integração com o MatLab. PUBLICAÇÕES

O projeto ainda não gerou publicações, pois conforme foi especificado da seção de resultados, o projeto segue na etapa de desenvolvimento. Depois que a aplicação estiver realizando a classificação utilizando os métodos propostos de forma aceitável, os resultados devem ser validados, gerando subprodutos deste projeto, consistindo de publicações sobre os métodos utilizados, a eficiência e análise dos resultados obtidos com o classificador.

ATIVIDADES A SEREM DESENVOLVIDAS NOS PRÓXIMOS MESES

Conforme foi definido nos objetivos do projeto, uma rotulação adequada deve ser implementada no frond end concatenado. Tal rotulação deve ser simples e intuitiva, sendo possível identificar o sinal, o front end, e possíveis características de determinado front end no processo de seleção de parâmetro.

Após a rotulação ser feita, será possível avançar mais na parte de classificação. Primeiramente é necessário definir quais são os parâmetros mais relevantes, utilizando a rotulação proposta. Com isso, métodos de otimização devem ser estudados e, de acordo com a aplicabilidade dos mesmos, implementá-los no processo de seleção de atributos.

CONCLUSÃO

A fim de aprimorar o processo de classificação das faltas do tipo curto-circuito em linhas de transmissão foi necessário um estudo sobre as particularidades da área e da ferramenta que vinha sendo utilizada. A partir dos trabalhos relacionados, foi proposto um projeto que cobre a utilização do front end concatenado, de forma que se possa comparar o mesmo com os front ends já existentes e, dessa forma, seja possível determinar qual front end é mais eficaz no processo de classificação. Além disso, foi verificado que o custo computacional para esse

(5)

front end concatenado é muito elevado, pois o mesmo possui muitos parâmetros. Para

solucionar esse problema, métodos de otimização de seleção de parâmetros devem ser utilizados, de modo que o classificador tenha maior acurácia com o menor custo computacional possível.

REFERÊNCIAS BIBLIOGRÁFICAS

WITTEN, I.; FRANK, E. Data Mining: Practical Machine Learning Tools and Techniques. Ed 2, 2005.

DIFICULDADES

A principal dificuldade encontrada neste projeto foi compreender as particularidades da área e ter domínio do trabalho que já tinha sido feito. No entanto, conforme foi dito na seção de resultados, os aspectos teóricos e o conhecimento das ferramentas necessárias para desenvolver o projeto foram assimilados, e o projeto segue na etapa de desenvolvimento. PARECER DO ORIENTADOR: O bolsista vem desempenhando a contento suas atividades, apresentando excelente capacidade para discutir ideias e propor soluções. Assim, sou de parecer favorável em relação a este relatório parcial

DATA: 29/02/2016

_________________________________________ ASSINATURA DO ORIENTADOR

____________________________________________ ASSINATURA DO ALUNO

Referências

Documentos relacionados

Ninguém quer essa vida assim não Zambi.. Eu não quero as crianças

serviço com o tempo de fila para um pedido no recurso i. A notação ao lado indica este tempo.  Tempo de resposta: é a soma do tempo de. residência de um pedido em todos

As fontes iniciais da pesquisa nos mostram que a deputada Maria não se intimidou diante de uma casa legislativa composta majoritariamente por homens, ao contrário, buscou

Dessa maneira, os resultados desta tese são uma síntese que propõe o uso de índices não convencionais de conforto térmico, utilizando o Índice de Temperatura de Globo Negro e

Universidade Federal do Amazonas Pró-Reitoria de Pesquisa e Pós-Graduação.. Diretoria de Acompanhamento e Avaliação da Pós-Graduação Pró-Reitoria de Pesquisa

O cinema não emergiu como hoje o conhecemos; apareceu como uma curiosidade científica, produto de um momento da civilização ocidental moderna, que criou

Os resultados encontrados mostraram alta pre- valência de placa bacteriana e sangramento gengi- val, CPOD médio de 13,86 (4,32% de dentes cari- ados) e baixo risco de cárie segundo

No Estado do Pará as seguintes potencialidades são observadas a partir do processo de descentralização da gestão florestal: i desenvolvimento da política florestal estadual; ii