• Nenhum resultado encontrado

Análise da Sensibilidade dos Limiares

No documento Monitorizando a Evolução de Clusters (páginas 86-90)

5.2 Calibração do MEC

5.2.3 Análise da Sensibilidade dos Limiares

Nas experiências anteriores constatou-se que, uma pequena variação nos valores assumidos pelos limiares τ e ρ, originava resultados diferentes. Esta evidência não deve ser negligenciada e deve ser alvo de uma análise mais profunda, que permita retirar conclusões sobre o impacto destas pequenas variações no resultado nal do algoritmo de detecção de transições. Neste sentido, considerou-se relevante efectuar uma análise da sensibilidade do algoritmo aos valores pré-denidos dos limiares. Esta análise incide sobre os dados articiais, mais especicamente, sobre os clusters gerados com o algoritmo hierárquico aglomerativo, e é dividida de acordo com o intervalo de tempo e de acordo com o limiar. Conduziram-se experiências para todos os valores do limiar de Sobrevivência compreendidos no intervalo [0.5, 1], uma vez que se impôs um valor mínimo; e para os valores do limiar de Cisão compreendidos no intervalo [0, 0.4]. A análise foi realizada separadamente, fazendo variar os valores de um dos limiares e mantendo tudo o resto constante, ou seja, quando se observa o comportamento de τ, assume-se um valor constante de ρ = 0.2, e quando se analisa ρ, considera-se um valor xo de sobrevivência de τ = 0.5.

Limiar de Sobrevivência

Na Figura 5.11, referente ao intervalo de tempo [t, t + 1], é possível observar a relação entre os valores de τ e o número de ocorrências de cada uma das tran- sições exógenas. Em termos lógicos, seria de esperar que, quanto maior o valor do limiar de Sobrevivência, menor o número de sobrevivências detectadas e, conse- quentemente, de fusões. Seria igualmente expectável que, o aumento de τ gerasse maior número de nascimentos e/ou cisões. Porém, a análise da gura contraria esta hipótese inicial, dado que o número de transições é invariante com o limiar (sobrevivencias = fusoes = cisoes = 1 e nascimentos = mortes = 0). Isto é justicado pelos pesos atribuídos às arestas do grafo bipartido (ver Figura 5.8), que assumem valor máximo de sobrevivência (peso = 1). Este caso reecte uma situação de transições permanentes, ie, de transições robustas a variações do τ. Este tipo de transições não gera dúvidas sobre a evolução sofrida pelos clusters, revelando as mudanças mais pertinentes no domínio de conhecimento subjacente. Por sua vez, no intervalo de tempo posterior [t + 1, t + 2], verica-se alguma instabilidade nos resul- tados do algoritmo com a alteração do limiar, o que pode ser observado na Figura 5.12. À medida que τ se aproxima do seu valor máximo, o número de mortes e de cisões aumenta, diminui o número de sobrevivências e de fusões (o pico de sobre- vivência atingido para τ = 0.9 deve-se à extinção de uma fusão e, por conseguinte, à transformação desta fusão numa sobrevivência, visto que uma das ligações é podada) e o número de nascimentos mantém-se constante. Neste caso, estamos perante um comportamento mais previsível que corrobora a hipótese inicial. Este tipo de tran- sições são mais voláteis e sensíveis a pequenas variações de τ - transições relativas -, revelando mudanças pouco consolidadas no contexto em estudo.

Em suma, quanto mais exigente o limiar de Sobrevivência, menor o número de sobrevivências e de fusões e maior o número de mortes e de cisões.

Limiar de Cisão

Em relação ao limiar de Cisão, espera-se que, quanto maior o seu valor, maior o número de mortes, de nascimentos e menor o número de cisões. Preve-se, igual- mente, que o número de fusões e de sobrevivências não seja afectado pela variação de ρ, tendo por base a respectiva denição formal. Analisando a variação do lim- iar para o período [t, t + 1] (Figura 5.13) comprova-se esta hipótese. Contudo, no intervalo seguinte (Figura 5.14), o número de transições exógenas mantém-se in- alterado para diferentes valores de ρ. O motivo subjacente a este acontecimento pode ser facilmente deduzido com base na análise do grafo da Figura 5.8, em que se verica que a poda das ligações com peso ≤ 0.4, não interfere nos resultados nais. Analogamente ao que se constatou na análise de τ, estas tratam-se de tran- sições permanentes, com respeito ao limiar de Cisão e, por isso, o seu impacto nos resultados é nulo.

Figura 5.11: Impacto no número de transições exógenas motivado pela variação do limiar de Sobrevivência τ, para o período [t, t + 1]

Figura 5.12: Impacto no número de transições exógenas motivado pela variação do limiar de Sobrevivência τ, para o período [t + 1, t + 2]

Figura 5.13: Impacto no número de transições exógenas motivado pela variação do limiar de Cisão ρ, para o período [t, t + 1]

Figura 5.14: Impacto no número de transições exógenas motivado pela variação do limiar de Cisão ρ, para o período [t + 1, t + 2]

Assim, conclui-se que quanto mais exigente o limiar de Cisão, maior o número de mortes/nascimentos e menor o número de cisões consideradas. Destacam-se, igualmente, os conceitos de transições permanentes e de transições relativas, que revelam a estabilidade das transições ocorridas nas estruturas de clusters e, por conseguinte, indicam as mudanças mais, ou menos, proeminentes no domínio de conhecimento.

Denição dos limiares

Tendo por base as conclusões da análise de sensibilidade efectuada, assume-se que os valores τ = 0.5, para o limiar de Sobrevivência, e ρ = 0.2, para o limiar de Cisão, são razoáveis e que, apesar de mais relaxados, têm a vantagem de permitir detectar uma maior variedade de transições. Estes serão, assim, os valores adoptados para a condução dos casos de estudo da secção seguinte.

No documento Monitorizando a Evolução de Clusters (páginas 86-90)