Supporting System-Wide Similarity Queries for Networked System Management Suporte a Consultas de Similaridade de Sistema para de gestão de redes

(1)

Supporting System-Wide Similarity Queries for Networked System Management

Suporte a Consultas de Similaridade de Sistema para de gestão de redes

Songyun Duan and Xiaoqiao Meng and Hui Zhang and Guofei Jiang

(2)

Gestão de Redes - Evolução

 Aumento do número de sistemas de larga

escala.

 Aumento da complexidade dos sistemas.

 Aumento do volume de dados a analisar.

 Exemplo:

− _{Os data centers da Google têm centenas de servidores}

que processam milhões de consultas todos os dias. Esses sistemas são complexos e bastante heterogêneos.

(3)

Gestão de Redes - Questões

 Como monitorar este tipo de sistemas?

 Monitorando extensivamente cada um dos seus

componentes Enorme volume de dados→

 Como correlacionar os dados para que seja

possível obter uma visão holística, i.e. global, do estado da rede e da sua performance?

 Como consultar os dados provenientes dos

(4)

Gestão de Redes - Soluções

 Soluções existentes no mercado que suportam

vizualização/navegação de dados ou consultas

SQL-like:  AT&T SWIFT-3D  UC Berkley TelegraphCQ  Yahoo Pig  Facebook Hive  Microsoft DryadLINQ

(5)

Consultas de Similaridade

 Soluções apresentadas somente consultam os

dados coletados.

 E as semelhanças de comportamento dos

objetos durante um determinado tempo?

 Objetivo:

 Conhecer a similaridade ou a dissimilaridade entre

objetos da rede para que os operadores possam analisar melhor o estado global do sistema.

(6)

Consultas de Similaridade - Exemplos

 Ao encontrar um problema de performance no

período de tempo T, será que já foi detectado um problema similar no passado que entretanto já foi diagnosticado e resolvido?

 Quais os protocolos que apresentam um padrão

mais similar a uma determinada hora?

 Entre várias instâncias de máquinas virtuais

quais as que têm uma carga similar e quais as que têm uma carga mais distinta?

(7)

Consultas de Similaridade - Exemplos

 Supondo que existe um histórico temporal

indexado sobre o estado de um sistema.

− S_H – Estados saudáveis − S_U – Estados de falha

 Quando existir um estado de falha S

Q o

(8)

S

2

Q Framework - Etapas

Modelagem do sistema Cálculo da similaridade Indexação Formulação e execução de consultas

(9)

Modelagem do Sistema

 Fluxo de dados contínuo

− _{D – Fluxo de dados}

− Xi é uma série de valores de uma métrica, medida numa

(10)

Modelagem do Sistema

 Relações de dependência pares:

1.Dependências físicas – relacionamento direto entre componentes

2.Dependências estatísticas – calcula correlações

estatísticas com base em séries temporais para um par de componentes de sistema usando uma métrica de correlação

• Exemplo simples: Correlação linear • Proposta: Matriz de correlação

(11)

Relações de Dependência Pares

1ºCálculo

 Gerar a matriz de auto-covariância do

componente X

− ω – tamanho da janela temporal

− m – tamanho da janela de histórico

− X_i,ω – Série temporal começando no instante i até i+ω-1

(12)

Relações de Dependência Pares

2ºCálculo

 Calcular o valor da dependência entre X e Y

baseando-se nas matrizes de auto-covariância.

 Decompor as matrizes usando decomposição em

valores singulares (SVD)

− Toda a matriz A ε IRmxn _{pode ser escrita como:}

A = USVT

onde U_mxm e V_nxn são ortogonais e S_mxn é diagonal.

 O valor de dependência é calculado como a distância

(13)

Relações de Dependência Pares

 1º passo do cálculo define sinopses locais.

 2º passo define sinopses globais.

(14)

Relações de Dependência Pares

Atualização Incremental

 Equal-Importance

(15)

Cálculo da Distância

 Supondo V1 e V2 (vectores de colunas) das

matrizes de covariância

 Decompor em valores singulares (SVD) o produto de

ambos [U,S,V] = SVD(V'1*V2)

 Se o maior valor singular em S for aproximadamente

(16)

Métricas de Similaridade

 Objetivo: Encontrar estados passados que são

similares ao estado atual s.

 Instance-Based retrieval

− Procurar o vizinho mais próximo de s considerando os

estados passados.

 Clustering

− Agrupar os estados passados dos vizinhos e calcular o

centroide que está mais próximo a s utilizando k-médias

(17)

Métricas de Similaridade

 Graph-based Approach

− _{V – componentes alvo do sistema}

− Et – conjunto de relações de dependência entre

(18)

Índices

 Índices baseados em detecção de mudanças

 Quando o estado do sistema não muda as distâncias

para os vizinhos deve ser aproximadamente 0.

 Quando existe uma mudança nos estados a distância

aumenta

 Índice construído com base nas mudanças

verificadas, desta forma a obtenção de estados passados é mais rápida.

(19)

Experimentos - Matlab

 Duas séries temporais:

X1=sin(t)

(20)

(21)

(22)

Experimentos – Detecção de padrões

de Tráfego

(23)

Críticas e Sugestões

 Somente o primeiro passo do framework foi

descrito corretamente.

 Notação confusa

 Problemas de performance em sistemas com

muitas varáveis a comparar

 Muito útil em sistemas que necessitem de uma

(24)