Valores atípicos - Propriedades do componente

Propriedades do componente

9.1.2 Valores atípicos

9.1.2.1 Algoritmo HANA de detecção de anormalidade

Use este algoritmo para encontrar um modelo nos dados que não esteja de acordo com o comportamento esperado.

Observação:

A criação de modelos usando o algoritmo HANA de detecção de anormalidade não é suportada. Propriedades do algoritmo HANA de detecção de anormalidade

Selecione o modo em que você deseja exibir os dados de saída. Modo de saída

Selecione as colunas de origem de entrada. Colunas independentes

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Ignorar: o algoritmo ignora o registro que contenha valores em

falta durante o cálculo. No entanto, os registros são retidos na tabela de resultados.

Valores em falta

Insira o valor para indicar a proporção de anormalidades nos dados de origem.

Porcentagem de valor atípico

Insira um valor para determinar o número de clusters. Número de grupo

Selecione o valor para indicar o tipo de anormalidades nos dados de origem.

Tipo de detecção

Insira o número de iterações permitido para localização de clusters. Iterações máximas

Selecione o método a ser usado para cálculo inicial do centro do cluster.

Método de cálculo do centro

Para normalizar os dados, selecione Verdadeiro. Normalização

Insira o número de grupos para clustering. Número de clusters

Insira o número de threads a ser usado na execução. Número de threads

Insira o valor limite para a saída das iterações. Limite de saída

Insira o método para calcular a distância entre o item e o centro do cluster.

Cálculo da distância

Insira um nome para a nova coluna que contenha os valores previstos.

Nome da coluna prevista

9.1.2.2 Algoritmo HANA de teste de intervalo interquartil

Use este algoritmo para identificar valores atípicos com base na distribuição estatística entre o primeiro e terceiro quartis.

Observação:

• Os dados de entrada para o algoritmo de teste IQR (intervalo interquartil) deve ter pelo menos 4 linhas.

• A criação de modelos usando o algoritmo HANA de teste de intervalo interquartil não é suportada. Propriedades do algoritmo HANA de teste de intervalo interquartil

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspondente é atípico.

• Remover valores atípicos: remove os valores atípicos dos dados de entrada.

Modo de saída

Selecione a coluna de origem de entrada. Coluna independente

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.

• Ignorar: retém os valores em falta. Valores em falta

Insira o desvio permitido para os valores do intervalo interquartil. Coeficiente limitador

Insira um nome para a nova coluna que contenha os valores previstos. Nome da coluna prevista

Use este algoritmo para identificar valores atípicos com base na distribuição estatística entre o primeiro e terceiro quartis.

Observação:

• Os dados de entrada para o algoritmo IQR (intervalo interquartil) deve ter pelo menos 4 linhas. • A criação de modelos usando o algoritmo IQR (intervalo interquartil) não é suportada.

Propriedades do algoritmo de intervalo interquartil

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspondente é atípico.

• Remover valores atípicos: remove os valores atípicos dos dados de entrada.

Modo de saída

Selecione a coluna de origem de entrada. Coluna independente

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.

• Manter: retém os valores em falta.

• Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente.

Valores em falta

Insira o desvio permitido para os valores do intervalo interquartil. Coeficiente limitador

Insira um nome para a nova coluna que contenha os valores previstos. Nome da coluna prevista

9.1.2.4 Valor atípico vizinho mais próximo

Use este algoritmo para identificar valores atípicos com base no número de vizinhos (N) e na distância média dos valores comparados aos seus vizinhos N mais próximos.

Observação:

Propriedades do valor atípico vizinho mais próximo

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspondente é atípico.

• Remover valores atípicos: remove os valores atípicos dos dados de entrada.

Modo de saída

Selecione a coluna de origem de entrada. Coluna independente

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.

• Manter: retém os valores em falta.

• Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente.

Valores em falta

Insira o desvio permitido para os valores do intervalo interquartil. Contagem da vizinhança

Insira o número de valores atípicos a ser removido. Número de valores

atípicos

Insira um nome para a nova coluna que contenha os valores previstos. Nome da coluna prevista

9.1.2.5 Teste de variância HANA

O teste de variância HANA identifica valores atípicos em um conjunto de dados numéricos. Os limites inferior e superior dos dados são calculados com base na média e no desvio padrão dos dados e no multiplicador especificado por você.

Multiplicador é um coeficiente do tipo dobrado que você especifica para testar se todos os valores de um vetor numérico estão no intervalo.

Se um valor ficar fora do intervalo, ele recomenda que seja reprovado no teste de variância. Consequentemente, o valor será marcado como atípico.

Observação:

A criação de modelos usando o algoritmo HANA de detecção de anormalidade não é suportada. Propriedades do teste de variância HANA

Selecione o modo em que você deseja exibir os dados de saída. Modo de saída

Selecione as colunas de origem de entrada. Colunas independentes

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.

• Ignorar: o algoritmo ignora o registro que contenha valores em falta durante o cálculo. No entanto, os registros são retidos na tabela de resultados.

Valores em falta

Insira o valor do Multiplicador para decidir o intervalo do limite Inferior e Superior e identificar os valores atípicos.

Observação:

O valor informado deve ser inteiro e positivo. Multiplicador

Insira o número de threads a ser usado na execução. Número de threads

No documento Ajuda on-line do SAP Predictive Analysis SAP Predictive Analysis (páginas 66-70)