Propriedades do componente
9.1.2 Valores atípicos
9.1.2.1 Algoritmo HANA de detecção de anormalidade
Use este algoritmo para encontrar um modelo nos dados que não esteja de acordo com o comportamento esperado.
Observação:
A criação de modelos usando o algoritmo HANA de detecção de anormalidade não é suportada. Propriedades do algoritmo HANA de detecção de anormalidade
Selecione o modo em que você deseja exibir os dados de saída. Modo de saída
Selecione as colunas de origem de entrada. Colunas independentes
Selecione o método para manipulação dos valores em falta. Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Ignorar: o algoritmo ignora o registro que contenha valores em
falta durante o cálculo. No entanto, os registros são retidos na tabela de resultados.
Valores em falta
Insira o valor para indicar a proporção de anormalidades nos dados de origem.
Porcentagem de valor atípico
Insira um valor para determinar o número de clusters. Número de grupo
Selecione o valor para indicar o tipo de anormalidades nos dados de origem.
Tipo de detecção
Insira o número de iterações permitido para localização de clusters. Iterações máximas
Selecione o método a ser usado para cálculo inicial do centro do cluster.
Método de cálculo do centro
Para normalizar os dados, selecione Verdadeiro. Normalização
Insira o número de grupos para clustering. Número de clusters
Insira o número de threads a ser usado na execução. Número de threads
Insira o valor limite para a saída das iterações. Limite de saída
Insira o método para calcular a distância entre o item e o centro do cluster.
Cálculo da distância
Insira um nome para a nova coluna que contenha os valores previstos.
Nome da coluna prevista
9.1.2.2 Algoritmo HANA de teste de intervalo interquartil
Use este algoritmo para identificar valores atípicos com base na distribuição estatística entre o primeiro e terceiro quartis.
Observação:
• Os dados de entrada para o algoritmo de teste IQR (intervalo interquartil) deve ter pelo menos 4 linhas.
• A criação de modelos usando o algoritmo HANA de teste de intervalo interquartil não é suportada. Propriedades do algoritmo HANA de teste de intervalo interquartil
Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:
• Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspondente é atípico.
• Remover valores atípicos: remove os valores atípicos dos dados de entrada.
Modo de saída
Selecione a coluna de origem de entrada. Coluna independente
Selecione o método para manipulação dos valores em falta. Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.
• Ignorar: retém os valores em falta. Valores em falta
Insira o desvio permitido para os valores do intervalo interquartil. Coeficiente limitador
Insira um nome para a nova coluna que contenha os valores previstos. Nome da coluna prevista
Use este algoritmo para identificar valores atípicos com base na distribuição estatística entre o primeiro e terceiro quartis.
Observação:
• Os dados de entrada para o algoritmo IQR (intervalo interquartil) deve ter pelo menos 4 linhas. • A criação de modelos usando o algoritmo IQR (intervalo interquartil) não é suportada.
Propriedades do algoritmo de intervalo interquartil
Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:
• Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspondente é atípico.
• Remover valores atípicos: remove os valores atípicos dos dados de entrada.
Modo de saída
Selecione a coluna de origem de entrada. Coluna independente
Selecione o método para manipulação dos valores em falta. Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente.
Valores em falta
Insira o desvio permitido para os valores do intervalo interquartil. Coeficiente limitador
Insira um nome para a nova coluna que contenha os valores previstos. Nome da coluna prevista
9.1.2.4 Valor atípico vizinho mais próximo
Use este algoritmo para identificar valores atípicos com base no número de vizinhos (N) e na distância média dos valores comparados aos seus vizinhos N mais próximos.
Observação:
Propriedades do valor atípico vizinho mais próximo
Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:
• Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspondente é atípico.
• Remover valores atípicos: remove os valores atípicos dos dados de entrada.
Modo de saída
Selecione a coluna de origem de entrada. Coluna independente
Selecione o método para manipulação dos valores em falta. Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente.
Valores em falta
Insira o desvio permitido para os valores do intervalo interquartil. Contagem da vizinhança
Insira o número de valores atípicos a ser removido. Número de valores
atípicos
Insira um nome para a nova coluna que contenha os valores previstos. Nome da coluna prevista
9.1.2.5 Teste de variância HANA
O teste de variância HANA identifica valores atípicos em um conjunto de dados numéricos. Os limites inferior e superior dos dados são calculados com base na média e no desvio padrão dos dados e no multiplicador especificado por você.
Multiplicador é um coeficiente do tipo dobrado que você especifica para testar se todos os valores de um vetor numérico estão no intervalo.
Se um valor ficar fora do intervalo, ele recomenda que seja reprovado no teste de variância. Consequentemente, o valor será marcado como atípico.
Observação:
A criação de modelos usando o algoritmo HANA de detecção de anormalidade não é suportada. Propriedades do teste de variância HANA
Selecione o modo em que você deseja exibir os dados de saída. Modo de saída
Selecione as colunas de origem de entrada. Colunas independentes
Selecione o método para manipulação dos valores em falta. Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.
• Ignorar: o algoritmo ignora o registro que contenha valores em falta durante o cálculo. No entanto, os registros são retidos na tabela de resultados.
Valores em falta
Insira o valor do Multiplicador para decidir o intervalo do limite Inferior e Superior e identificar os valores atípicos.
Observação:
O valor informado deve ser inteiro e positivo. Multiplicador
Insira o número de threads a ser usado na execução. Número de threads