• Nenhum resultado encontrado

Distúrbios Por Curvas Principais Este capítulo propõe a utilização da técnica conhecida por Curvas Principais

4.1 Curvas Principais

As Curvas Principais consistem numa generalização não-linear da análise de componentes principais [91] e foram introduzidas por [81], como curvas suaves, unidimensionais, que passam no meio de um conjunto multidimensional de dados, fornecendo um bom resumo unidimensional destes (vide Fig. 4.1). Além disso, elas são não-paramétricas e sua forma é sugerida pelos dados.

As CP têm despertado bastante interesse da comunidade científica. Diversos trabalhos que aprimoraram sua definição inicial foram publicados após o trabalho original [81]. Tais trabalhos apresentam definições alternativas e propõem aplicações diversas. Em [92] é apresentado um apanhado destes trabalhos. Dentre os algoritmos propostos para a extração das curvas, destaca-se o k-segmentos não-suave [93]. Este algoritmo destaca-se por sua robustez na estimação das CP, menos susceptibilidade a mínimos locais e convergência garantida.

Em geral, na extração das CP de um conjunto de dados, o primeiro compo-nente principal deste conjunto é tomado como ponto de partida para a construção da

Figura 4.1: Curva Principal para um conjunto de dados de duas dimensões. curva. Em seguida, a curva é alterada sucessivamente até que o algoritmo convirja e, finalmente, obtém-se a CP.

Matematicamente, as CP são definidas a partir do conceito de autoconsistên-cia [81]. Para entender este conceito, é necessário definir o índice de projeção de um ponto xi numa curva f. Uma curva unidimensional no espaço d-dimensional é um vetor f(t) de d funções contínuas e uma única variável t, ou seja:

f (t) = [f1(t) f2(t) · · · fd(t)]T (4.1) em que T indica transposto.

Estas funções são denominadas de funções de coordenadas e o parâmetro t está relacionado ao ordenamento ao longo da curva.

Seja x um vetor aleatório em <d, com densidade de probabilidade h, e mo-mento de segunda ordem finito. Seja f uma curva suave no intervalo fechado I ⊆ <1

que não intercepta a si própria, ou seja, t1 6= t2 ⇒ f (t1) 6= f (t2). O índice de projeção tf: <d→ <1 é definido como:

tf(x) = sup{t : kx − f(t)k = inf kx − f(µ)k} (4.2) sendo µ uma variável auxiliar definida em <1.

O índice de projeção tf(x) é o valor de t para o qual a CP f(t) está mais próxima de x. Se houver mais de um valor possível, o maior deles é selecionado.

cinco eventos x1, ..., x5, os quais projetam nos pontos f(tf(x1)), ..., f(tf(x5)) da curva, respectivamente. Observe que t = tf(xi) é o valor do parâmetro t relativo ao ponto da curva mais próximo ao evento xi e, por isso, corresponde ao valor do índice de projeção desse ponto sobre a curva.

Figura 4.2: Projeção dos dados na CP.

De acordo com [81], a CP é autoconsistente, ou seja, os pontos que a compõem constituem a média dos dados que nela se projetam, conforme Equação (4.3).

f(t) = E[x|tf(x) = t], ∀ t (4.3) A Figure 4.3 ilustra um ponto f (ti) autoconsistente de uma CP para dados em duas dimensões.

Figura 4.3: Ponto autoconsistente de uma CP.

As CP podem ser aplicadas em três diferentes abordagens: (i) como técnica de análise de dados; (ii) como técnica de extração de parâmetros e; (iii) como técnica

de detecção e classificação de eventos. Na presente tese, estas três abordagens serão aplicadas aos distúrbios elétricos.

A motivação para a utilização das CP está na sua boa capacidade de extrair modelos compactos dos dados [92] e baixa complexidade computacional na fase de operação. Assim, pode-se representar distúrbios por CP e utilizá-las para detectar e classificar cada tipo de distúrbio.

4.1.1 Algoritmo k-segmentos

Este algoritmo extrai as curvas principais de forma incremental e se destaca, em relação aos demais, por apresentar uma maior robustez na estimação das curvas, menos susceptibilidade a mínimos locais e convergência prática garantida [93]. A extração das CP utilizando este algoritmo é efetuada, basicamente, em três passos, descritos a seguir.

Passo 0: Inserção do primeiro segmento. Na inserção do primeiro segmento, todos os eventos do conjunto de projeto são considerados. Assim, define-se um centro correspondente ao valor médio dos dados e, a partir deste centro, obtém-se o primeiro segmento, na direção do primeiro componente principal e com comprimento de 3/2 do desvio padrão associado a este componente. Passo 1: Inserção do segundo segmento. No segundo segmento, define-se um

novo ponto a ser tomado como centro e, utilizando o algoritmo k-vizinhos mais próximos (k-means) [16], define-se quais eventos pertencerão ao novo agrupamento. Este novo agrupamento é baseado nas regiões de Voronoi, que são compostas por eventos que estão mais próximos de um outro evento (centro da região) do que de um dos segmentos que compõe a curva. Em seguida, o primeiro segmento é recalculado, uma vez que o conjunto de eventos que o define, ou seja, seu agrupamento foi alterado. Os dois segmentos obtidos são unidos por uma linha reta (não-suave). Para os próximos segmentos, os mesmos procedimentos são realizados.

Passo 2: Convergência. Verifica-se se o algoritmo atingiu o número máximo de segmentos definido pelo usuário ou se houve a convergência. A convergência

acontece quando o maior agrupamento possível tem menos de três segmentos. Caso não ocorra nenhuma das duas hipóteses, volta-se ao Passo 1.

Este processo de extração das CP pelo algoritmo k-segmentos não-suave é ilustrado na Figura 4.4, onde k representa o número de segmentos já obtidos e k_max o número máximo de segmentos que se deseja obter.

Figura 4.4: Fluxograma simplificado do algoritmo k-segmentos não-suave.

Ao final da extração, o algoritmo sugere uma determinada quantidade de seg-mentos para a curva principal. Esta sugestão baseia-se na variação do comprimento total da curva após a inserção de um segmento. O comprimento total é obtido através da medição do comprimento de todos os segmentos inseridos mais o com-primento da ligação entre eles. Como o algoritmo seleciona as regiões de Voronoi em ordem decrescente, a cada iteração o segmento inserido é menor que o anterior. Assim, haverá um momento em que o segmento inserido não representa uma grande modificação na curva como um todo. Dessa forma, o método de extração sugere uma quantidade de segmentos que resulte em uma curva que não esteja super treinada.

O algoritmo k-vizinhos mais próximos, empregado na construção da curva principal, possibilita o agrupamento dos dados em regiões de Voronoi, sendo que, a cada passo do algoritmo k-segmentos não-suave, um novo segmento é inserido na maior das regiões obtidas. Aparentemente, este procedimento não parece produzir curvas que, de alguma forma, incorporam o conceito de auto-consistência definido em [81]. No entanto, dois aspectos fazem da curva obtida pelo algoritmo k-segmentos não-suave uma curva principal, que são [94]:

• Os segmentos com direção da primeira componente principal são autoconsis-tentes;

• Se a região é uma região de Voronoi, então os k pontos pertencentes a ela são autoconsistentes.