• Nenhum resultado encontrado

Ajuda on-line do SAP Predictive Analysis SAP Predictive Analysis

N/A
N/A
Protected

Academic year: 2021

Share "Ajuda on-line do SAP Predictive Analysis SAP Predictive Analysis"

Copied!
122
0
0

Texto

(1)
(2)

produtos podem variar. Estes materiais são fornecidos pela SAP AG e suas empresas afiliadas ("Grupo SAP") apenas para fins informativos, sem representações ou garantias de qualquer tipo, e o Grupo SAP não se responsabiliza por erros ou omissões em relação aos materiais. As únicas garantias para os produtos e serviços do Grupo SAP são aquelas definidas nas declarações expressas de garantia que acompanham os respectivos produtos e serviços, se houver. O conteúdo deste documento não deve ser interpretado como constituição de garantia adicional. SAP e outros produtos e serviços da SAP aqui mencionados, bem como seus respectivos logotipos, são marcas ou marcas registradas da SAP AG na Alemanha e em outros países. Consulte

http://www.sap.com/corporate-en/legal/copyright/index.epx#trademark para informações e avisos adicionais relacionados a marcas.

(3)

Sobre esta ajuda...7 Capítulo 1

Visão geral do SAP Predictive Analysis...9 Capítulo 2

Instalando o SAP Predictive Analysis...11 Capítulo 3

Pré-requisitos de instalação...11 3.1

Para instalar o SAP Predictive Analysis usando o programa de instalação...11 3.2

Como configurar logs de rastreamento...12 3.3

Para desinstalar o SAP Predictive Analysis ...14 3.4

Aspectos importantes a serem considerados no uso do SAP HANA...14 3.5

Para configurar o _SYS_REPO para o usuário do SAP Predictive Analysis...15 3.5.1

Medidas OLAP suportadas ...15 3.5.2

Como obter privilégios de esquema para acessar a fonte de dados HANA Online...16 3.5.3

Privilégios para executar algoritmos PAL com AFL (Application Function Library) ...16 3.5.4

Aspectos importantes a serem considerados no uso de universos do SAP BusinessObjects..17 3.6

Instalação e configuração do ambiente R de fonte aberta...19 Capítulo 4

Como instalar o ambiente R-2.15.1 e os pacotes necessários...19 4.1

Como configurar o ambiente R...19 4.2

Considerações importantes para utilizar o SAP Predictive Analysis com algoritmos de integração R no banco de dados SAP HANA...20 4.3

Introdução ao SAP Predictive Analysis...23 Capítulo 5

Princípios básicos do SAP Predictive Analysis...23 5.1

Como iniciar o SAP Predictive Analysis...24 5.2

Como usar o SAP Predictive Analysis...24 5.3

Visão de designer...25 5.3.1

Visão de resultados...25 5.3.2

Como usar o SAP Predictive Analysis do início ao fim...26 5.4

(4)

Criando análises...29 Capítulo 6

Como criar uma análise...29 6.1

Como adquirir dados de uma fonte de dados...29 6.1.1

Como preparar os dados para análise...31 6.1.2

Como aplicar os algoritmos...31 6.1.3

Como armazenar os resultados da análise...33 6.1.4

Como executar a análise...34 6.2

Como salvar a análise...34 6.3

Como visualizar os resultados...35 6.4

Como analisar os dados...37 Capítulo 7

Gráficos de visualização...37 7.1

Gráfico de matriz de dispersão...37 7.1.1

Gráfico de resumo estatístico...38 7.1.2 Coordenadas paralelas...39 7.1.3 Árvore de decisão...39 7.1.4 Gráfico de regressão...40 7.1.5

Gráfico de série de tempo...41 7.1.6

Gráfico de cluster...42 7.1.7

Gráfico de nuvem de tags Apriori...43 7.1.8

Gráfico Matriz de classificação/ausência de classificação...43 7.1.9

Como trabalhar com modelos...45 Capítulo 8

Como criar um modelo na análise no processo (In-Proc)...45 8.1

Como criar um modelo na análise no banco de dados (In-DB) HANA...46 8.2

Como visualizar as informações do modelo...46 8.3

Como exportar um modelo como PMML...47 8.4

Como exportar um modelo como arquivo .spar...47 8.5

Como exportar um Modelo PAL do SAP HANA como procedimento armazenado...47 8.6

Como remover o procedimento armazenado e exportado do SAP HANA...48 8.6.1

Como importar um modelo...49 8.7

Como excluir um modelo...49 8.8 Propriedades do componente...51 Capítulo 9 Algoritmos...51 9.1 Regressão...51 9.1.1 Valores atípicos...66 9.1.2

(5)

Rede neural...86 9.1.5 Clustering...89 9.1.6 Associação...92 9.1.7 Classificação...97 9.1.8

Componentes de preparação de dados...98 9.2

Fórmula...98 9.2.1

Amostra...102 9.2.2

Definição de tipo de dados...105 9.2.3 Filtro...106 9.2.4 Normalização...110 9.2.5 Categorização HANA...113 9.2.6 Normalização HANA...115 9.2.7 Gravadores de dados...118 9.3 CSV Writer...118 9.3.1 JDBC Writer...119 9.3.2 HANA Writer...120 9.3.3 Modelos salvos...120 9.4 Mais informações...121 Apêndice A

(6)
(7)

Sobre esta ajuda

Esta ajuda contém:

• Visão geral do SAP Predictive Analysis

• Informações sobre os vários algoritmos e componentes disponíveis no SAP Predictive Analysis • Informações sobre como criar análises e modelos

• Informações sobre como analisar os dados usando técnicas de visualização de análise preditiva Esta ajuda não aborda:

• Como adquirir dados de várias fontes de dados

• Como executar operações de manipulação de dados, limpeza de dados e enriquecimento semântico no painel de preparação

• Como compartilhar gráficos e conjuntos de dados Observação:

O SAP Predictive Analysis herda a funcionalidade de aquisição de dados e manipulação de dados do SAP Lumira. Portanto, para informações sobre fluxos de trabalho não abordados nesta ajuda, consulte oGuia do usuário do SAP Lumira disponível em <PA_INST_DIR>\Desktop\documentation. Recomendamos que você leia oGuia do usuário do SAP Lumira junto com a Ajuda on-line do SAP Predictive Analysis para entender o fluxo de trabalho completo para análise de dados usando os algoritmos de análise preditiva.

(8)
(9)

Visão geral do SAP Predictive Analysis

O SAP Predictive Analysis é uma solução de análise estatística e de mineração de dados que permite a criação de modelos preditivos para identificar visões e relações ocultas nos dados, com base nos quais você pode prever eventos futuros.

Com o SAP Predictive Analysis, você realiza várias análises de dados, inclusive previsão de série de tempo, detecção de valores atípicos, análise de tendência, análise de classificação, análise de segmentação e análise de afinidade. Com a aplicação, você analisa os dados usando diferentes técnicas de visualização, como gráficos de matriz de dispersão, coordenadas paralelas, gráficos de cluster e árvores de decisão.

O SAP Predictive Analysis oferece uma ampla gama de algoritmos de análise preditiva, suporta o uso de linguagem de análise estatística de fonte aberta R e oferece recursos de mineração de dados na memória (in-memory) para um processamento eficiente de análise de dados volumosos.

Observação:

O SAP Predictive Analysis herda a funcionalidade de aquisição de dados e manipulação de dados do SAP Lumira. SAP Lumira é uma ferramenta de manipulação e visualização de dados. Usando o SAP Lumira, você pode conectar-se a várias fontes de dados, como arquivos planos, bancos de dados relacionais, bancos de dados na memória e universos do SAP BusinessObjects, além de operar com diferentes volumes de dados, de uma matriz de dados pequena em arquivo CSV até um conjunto bem volumoso de dados no SAP HANA, selecionar e limpar os dados e manipulá-los.

(10)
(11)

Instalando o SAP Predictive Analysis

3.1 Pré-requisitos de instalação

Antes de instalar o SAP Predictive Analysis, verifique estes requisitos:

• O sistema operacional Microsoft Windows 7 deve estar instalado na sua máquina. O SAP Predictive Analysis é compatível com máquinas de 32 e 64 bits.

• Se você já tiver o SAP Lumira instalado na sua máquina, desinstale-o antes de instalar o SAP Predictive Analysis.

• Você precisa de direitos de administrador para instalar o SAP Predictive Analysis no computador. • É necessário espaço suficiente em disco para os seguintes recursos:

Espaço necessário Recurso

2,5 GB Unidade de hospedagem da pasta de dados da aplicação do usuário

200 MB Pasta temporária de usuário (\AppData\Local\Temp)

500 MB Unidade de hospedagem do diretório de instalação

• Estas portas devem estar disponíveis:

Necessária para Porta

Banco de dados Sybase IQ 6401

Instalação do SAP Predictive Analysis Qualquer porta no intervalo de 4520-4539

Para uma lista detalhada dos ambientes suportados e dos requisitos de hardware, consulte Product Availability Matrix em:http://service.sap.com/pam

3.2 Para instalar o SAP Predictive Analysis usando o programa de instalação

1. Execute o arquivo setup.exe.

(12)

3. Especifique a pasta de destino de instalação do SAP Predictive Analysis. • Para aceitar o diretório de instalação padrão, selecione Avançar.

• Para navegar até a pasta em que você deseja instalar o SAP Predictive Analysis, selecione Procurar. Selecione a pasta e, Avançar.

A página do "Contrato de licenciamento" será exibida.

4. Leia o contrato de licenciamento e selecione Aceito o contrato de licenciamento, e selecione Avançar.

5. Para começar a instalação, selecione Avançar.

A instalação será concluída quando a página "Concluir a instalação" for exibida. 6. Para sair da instalação, selecione Concluir.

3.3 Como configurar logs de rastreamento

Use este procedimento para ativar o SAP Predictive Analysis e registrar as informações sobre a execução da aplicação. Estas informações de registro ajudam a identificar as causas das falhas ou dos problemas na aplicação.

Por padrão, as mensagens de erro e de rastreamento ficam gravadas na sua máquina, na pasta %TEMP%\sapvi\logs. Mas se você quiser, pode alterar o local padrão de armazenamento das informações de instalação da seguinte forma:

1. Crie uma pasta em qualquer local para gerar os logs. Observação:

Você precisa de permissão de "gravação" para a pasta. Por exemplo, C:\logs.

2. Crie o arquivo BO_Trace.ini e insira os seguintes detalhes de rastreamento. active=false; severity='E'; importance=xs; size=1000000; keep_num=437; alert=true;

(13)

Descrição Valores possíveis

Parâmetro

Se definido como true (verdadeiro), as mensagens dentro do limiar estabelecido no parâmetro importância serão rastreadas. Se definido como false (falso), as men-sagens não serão rastreadas com base no nível de "importância". O valor padrão é false.

false, true active

Especifica o limiar das mensagens de ras-treamento. Todas as mensagens fora do limiar serão rastreadas. O valor padrão é m (médio).

'<<', '<=', '==', '>=', '>>', xs, s, m, l, xl Observação:

importance = xs ou importance = << são as opções mais complexas enquanto impor-tance = xl ou imporimpor-tance = >> são as menos complexas.

impor-tance

Se definido como true (verdadeiro), as mensagens dentro do limiar estabelecido no parâmetro gravidade serão rastreadas. Se definido como false (falso), as men-sagens não serão rastreadas com base no nível de "gravidade". O valor padrão é true. false, true

alert

Especifica a gravidade limiar acima da qual as mensagens podem ser rastreadas. O valor padrão é 'E'.

' ', 'W', 'E', 'A', success, warning, error, as-sert

severity

Especifica o número de mensagens no ar-quivo de log de rastreamento antes de criar uma nova. O valor padrão é 100000. Os valores possíveis são inteiros >=1000

size

Especifica o número de logs a serem man-tidos.

Os valores possíveis são inteiros >=1000 keep_num

(14)

Descrição Valores possíveis

Parâmetro

Especifica uma anotação a ser usada no arquivo de log de saída. Por exemplo, se administrator = "hello"

esta string for inserida no arquivo de log. Strings ou inteiros

adminis-trator

Especifica o diretório de arquivo de log de saída. Por padrão, arquivos de log são ar-mazenados na pasta Logging.

Por exemplo, C:\logs. log_dir

Especifica se o arquivo de log deve ser fechado após a gravação de um rastrea-mento. O valor padrão é off.

on, off

al-ways_close

3. Salve e feche o arquivo BO_trace.ini.

4. Coloque o arquivo BO_Trace.ini em C:\logs. 5. Defina estas variáveis de ambiente:

• BO_TRACE_LOGDIR = C:/logs • BO_TRACE_CONFIGDIR = C:/logs

• BO_TRACE_CONFIGFILE = C:/logs/BO_Trace.ini 6. Reinicie a aplicação.

Os logs da aplicação serão gerados no local especificado. Por exemplo, C:\logs.

3.4 Para desinstalar o SAP Predictive Analysis

1. Selecione Iniciar > Painel de Controle > Programas. 2. Selecione Desinstalar um programa.

3. Clique com o botão direito do mouse em SAP Predictive Analysis e selecione Desinstalar. O assistente do SAP Predictive Analysis Setup será exibido.

4. Na página Confirmar desinstalação, selecione Avançar. 5. Para completar a desinstalação, selecione Concluir.

(15)

Esta seção contém considerações e requisitos importantes para o uso do SAP Predictive Analysis com o banco de dados SAP HANA.

Requisitos de segurança para publicação no SAP HANA

Para que o usuário possa publicar conteúdo no SAP HANA, ele precisa de privilégios e funções específicos. Esses privilégios e funções também são necessários para recuperação de dados do SAP HANA. Use a aplicação SAP HANA Studio para atribuir privilégios e funções ao usuário. Para informações sobre como administrar o banco de dados SAP HANA e usar o SAP HANA Studio, consulte oSAP HANA Database – Administration Guide. Para informações sobre segurança do usuário, consulte oSAP HANA Security Guide (incluindo o SAP HANA Database Security).

A conta de usuário usada para efetuar logon no sistema SAP HANA do SAP Predictive Analysis deve ser atribuída à função "MODELING" (no SAP HANA).

Observação:

Esta ação só pode ser executada por um usuário com privilégios ROLE_ADMIN no banco de dados SAP HANA.

Quando um usuário do SAP Predictive Analysis efetua logon no sistema SAP HANA, a conta interna _SYS_REPOdeve:

• Ter Privilégios SQL SELECT.

• Ter a opção Grantable to others selecionada no esquema do usuário (SAP Predictive Analysis).

3.5.1 Para configurar o _SYS_REPO para o usuário do SAP Predictive Analysis

Se já houver uma conta definida para o usuário do SAP Predictive Analysis no sistema SAP HANA: 1. Da conexão com o sistema, na janela SAP HANA Studio Navigator, selecione Catalog >

Authorization > Users.

2. Clique duas vezes na conta _SYS_REPO.

3. Na guia SQL Privileges, clique no ícone + , digite o nome do esquema do usuário, e selecione OK. 4. Escolha SELECT e a opção Yes correspondente em Grantable to others.

5. Escolha Deploy ou Save. Observação:

O usuário também pode abrir um editor SQL no SAP HANA Studio e executar esta instrução SQL: GRANT SELECT ON SCHEMA <user_account_name> TO _SYS_REPO WITH GRANT OPTION

3.5.2 Medidas OLAP suportadas

(16)

• SUM • MIN • MAX • COUNT

Se o seu conjunto de dados contiver uma agregação com base em uma medida não listada acima, a agregação será ignorada pelo SAP HANA durante a publicação e não fará parte do artefato final publicado.

3.5.3 Como obter privilégios de esquema para acessar a fonte de dados HANA Online

Privilégios de esquema (_SYS_REPO , _SYS_BI , _SYS_BIC ) são concedidos pelo administrador do SAP HANA. Se já houver uma conta de usuário do SAP Predictive Analysis definida no sistema SAP HANA, o administrador do SAP HANA deverá adotar estes procedimentos para conceder privilégios de esquema ao usuário do SAP Predictive Analysis:

1. Da conexão do sistema na janela SAP HANA Studio Navigator, selecione Security > Users. 2. Clique duas vezes em <HANA Online user account>.

3. Na guia SQL Privileges, clique no ícone + , selecione _SYS_REPO, e OK. 4. Em Privileges for '_SYS_REPO', selecione SELECT.

Observação:

Siga o mesmo procedimento para o esquema _SYS_BI e o _SYS_BIC.

3.5.4 Privilégios para executar algoritmos PAL com AFL (Application Function Library)

Se já houver uma conta de usuário do SAP Predictive Analysis definida no sistema SAP HANA, o administrador do SAP HANA deverá adotar o seguinte procedimento:

1. Da conexão do sistema na janela SAP HANA Studio Navigator, selecione Security > Users. 2. Clique duas vezes em <HANA Online user account>.

3. Na guia SQL Privileges, clique no ícone + , selecione AFL_WRAPPER_GENERATOR(SYSTEM), e OK.

4. Em Privileges for 'AFL_WRAPPER_GENERATOR(SYSTEM)', selecione EXECUTE.

5. Na guia Granted Roles, clique no ícone + , selecione AFL__SYS_AFL_AFLPAL_EXECUTE, e OK.

Observação:

Para mais informações sobre como instalar AFL e criar o procedimento

(17)

3.6 Aspectos importantes a serem considerados no uso de universos do SAP

BusinessObjects.

• Para adquirir dados de universos existentes na plataforma BI 4.0, é necessário que o Web Intelligence Server esteja em execução.

• Também é necessário que a plataforma Business Intelligence seja BI 4.0 SP2 nível de correção 14 ou superior.

Observação:

(18)
(19)

Instalação e configuração do ambiente R de fonte aberta

R é uma linguagem de programação e ambiente de software de fonte aberta para cálculo estatístico.

4.1 Como instalar o ambiente R-2.15.1 e os pacotes necessários

Para usar algoritmos R de fonte aberta na sua análise, você precisa instalar o ambiente R e configurá-lo com a aplicação SAP Predictive Analysis.

O SAP Predictive Analysis oferece uma opção de instalação e configuração do R 2.15.1 e dos pacotes necessários da aplicação. Durante a instalação do ambiente R, você precisa estar conectado à Internet. Para instalar o ambiente R e os pacotes necessários, siga estes procedimentos:

1. Inicie a aplicação SAP Predictive Analysis.

2. No menu Arquivo, selecione Instalar e configurar ambiente R. 3. Selecione Instalar ambiente R

4. Leia o contrato de licenciamento do ambiente R de fonte aberta e as instruções, e selecione Concordo em instalar o ambiente R usando o script.

5. Selecione OK. Observação:

Se você já tiver instalado o R 2.15.x, use este procedimento para instalar os pacotes R necessários.

4.2 Como configurar o ambiente R

Depois de instalado o R, você precisa configurar o ambiente R para ativar os algoritmos R na aplicação. Se você já tiver instalado o R-2.11.1 ou R-2.15.1 e os pacotes necessários, poderá ignorar a etapa de instalação e configurar diretamente o ambiente R.

Observação:

Antes de configurar o R-2.11.1, você precisa definir certas variáveis de ambiente. Por exemplo, se você tiver instalado o R em C:\Program Files\R\R-2.11.1, você precisa definir as variáveis de ambiente da seguinte forma:

(20)

• R_LIBS = C:\Program Files\R\R-2.11.1\library

• Path = caminho existente; C:\Program Files\R\R-2.11.1\library\rJava\jri; C:\Program Files\R\R-2.11.1\bin

Para configurar o ambiente R, siga estes procedimentos: 1. Inicie a aplicação SAP Predictive Analysis.

2. No menu Arquivo, selecione Instalar e configurar ambiente R.

3. Na guia Configuração, selecione Ativar algoritmos R de fonte aberta. 4. Selecione Procurar para selecionar a pasta

5. Selecione OK.

A caixa de diálogo "Controle de conta de usuário" será exibida com uma mensagem de aviso. 6. Selecione Sim na solicitação de confirmação.

4.3 Considerações importantes para utilizar o SAP Predictive Analysis com algoritmos

de integração R no banco de dados SAP HANA

O SAP HANA suporta mineração de dados no banco de dados por meio da integração R e da biblioteca do Predictive Analysis (PAL). Para usar o SAP Predictive Analysis com algoritmos de integração R no banco de dados SAP HANA é importante observar estes aspectos:

• Para usar algoritmos R no banco de dados SAP HANA, você precisa instalar e configurar R no SAP HANA. Para informações sobre como instalar e configurar R no SAP HANA, consulte oGuia de integração R do SAP HANA, disponível emhttp://help.sap.com/hana/hana_dev_r_emb_en.pdf. • Na medida do necessário, conceda inclusive direito de privilégio de usuário Criar script R. • Os seguintes pacotes devem ser instalados antes de executar os algoritmos de integração R no

SAP HANA: • rJava • RODBC • RJDBC • DBI • monmlp • AMORE • XML • PMML (pmml_1.2.32) Observação:

Se você instalar uma versão do PMML anterior a pmml_1.2.32, a visualização do gráfico não será exibida.

• arules • caret • reshape

(21)

• foreach • iterator

(22)
(23)

Introdução ao SAP Predictive Analysis

5.1 Princípios básicos do SAP Predictive Analysis

Componente

Componente é a unidade básica de processamento do SAP Predictive Analysis. Cada componente contém âncoras de entrada e/ou saída (pontos de conexão). As âncoras são usadas para conectar componentes por meio de conectores. Quando você conecta os componentes, os dados são transmitidos dos componentes precedentes para seus componentes sucessores.

O SAP Predictive Analysis contém estes componentes: • Preparação de dados

• Algoritmos

• Gravadores de dados

Você pode acessar os componentes da visão de designer do painel de previsão. Depois de adicionar componentes ao editor de análise, o ícone de status de um componente permite identificar seu estado. Estes são os estados de um componente:

(Não configurado): este estado é exibido quando você arrasta um componente até o editor de análise. Indica a necessidade de configurar o componente antes da execução da análise.

(Configurado): este estado é exibido quando todas as propriedades necessárias do componente estão configuradas.

(Sucesso): este estado é exibido após a execução bem sucedida da análise.

(Falha): este estado é exibido se o componente causar falha na execução da análise. Análise

Análise consiste em uma série de componentes diferentes conectados em sequência específica por meio de conectores que definem a direção do fluxo de dados.

(24)

No banco de dados (In-DB)

No banco de dados (in-DB) é um modo de execução de análise em que os dados são processados dentro do banco de dados usando recursos de mineração de dados. Neste modo, os dados jamais são processados fora do banco de dados, portanto, a velocidade de processamento é bem alta. Este modo pode ser usado para processar conjuntos de dados volumosos. O SAP HANA suporta mineração de dados no banco de dados por meio de integração R e da biblioteca do Predictive Analysis (PAL). No processo (In-Proc)

No processo (in-Proc) é um modo de execução de análise em que os dados são processados, retirando-os do banco de dados e colocando-os em um espaço no processo de análise preditiva. Este tipo de análise também é denominado Out-DB (análise fora do banco de dados).

5.2 Como iniciar o SAP Predictive Analysis

Para iniciar o SAP Predictive Analysis, selecione Iniciar > Todos os Programas > SAP Business Intelligence > SAP Predictive Analysis > SAP Predictive Analysis.

5.3 Como usar o SAP Predictive Analysis

Quando você inicia o SAP Predictive Analysis, a página inicial é exibida. A página inicial contém informações para ajudá-lo a começar a trabalhar com o SAP Predictive Analysis.

Ele tem também uma pasta Amostras, que contém dois documentos de amostra do SAP Predictive Analysis, como Customer Satisfaction Analysis e Revenue Forecasting Analysis. Você também pode visualizar os documentos de amostra do SAP Predictive Analysis no SAP Lumira usando a chave de licença do SAP Predictive Analysis.

Para começar a analisar os dados usando o SAP Predictive Analysis, primeiro você precisa conectar-se à fonte de dados e adquirir os dados para análise. Depois de adquiridos os dados, você pode realizar estas operações:

• Preparar os dados para análise, aplicando funções de manipulação e limpeza de dados • Analisar os dados, aplicando algoritmos de mineração de dados e de análise estatística • Compartilhar conjuntos de dados e gráficos com colaboradores externos

Observação:

Este guia descreve como analisar os dados, aplicando algoritmos de mineração de dados e de análise estatística. Para informações sobre como adquirir os dados, preparar os dados e compartilhar conjuntos de dados, consulte oGuia do usuário do SAP Lumira disponível emhttp://help.sap.com/.

(25)

5.3.1 Visão de designer

A visão de designer permite projetar e executar análises e criar modelos preditivos.

5.3.2 Visão de resultados

A visão de resultados permite entender os dados e os resultados da análise usando várias técnicas de visualização e gráficos intuitivos.

(26)

5.4 Como usar o SAP Predictive Analysis do início ao fim

Esta é uma visão geral do processo de construção de um gráfico baseado em um conjunto de dados. O processo não é linear, portanto você pode retroceder uma etapa para ajustar o gráfico ou os dados.

Descrição Etapas do trabalho com os

seus dados

Se a fonte de dados for:

• RDBMS: insira suas credenciais, conecte-se ao servidor do banco de dados e selecione uma fonte de dados; por exemplo, se você estiver se conectando ao SAP HANA, selecione uma visualização e um cubo para construir um gráfico.

• Arquivo plano: escolha as colunas a serem adquiridas, cortadas ou exibidas e ocultas.

• Universo: insira suas credenciais do universo, conecte-se ao repositório Central Management Server e selecione um universo para construir seu gráfico.

Efetue a conexão à fonte de dados.

Observação:

Para informações sobre co-mo conectar-se a sua fonte de dados, consulte a seção Como se conectar a sua fonte de dados do Guia do usuário do SAP Lumira.

Você pode visualizar os dados adquiridos como colunas ou facetas. Você pode organizar a exibição de dados para facilitar a construção do gráfico desta forma:

• Crie filtros e oculte as colunas desnecessárias

• Crie medidas, hierarquias de tempo e hierarquias geográficas • Limpe e organize os dados em colunas, usando várias ferramentas

de manipulação

• Crie colunas com fórmulas, usando a ampla seleção de funções disponíveis

Visualize e organize as colu-nas e os atributos.

Observação:

Para informações sobre co-mo visualizar colunas e atributos, consulte a seção Como preparar os dados do Guia do usuário do SAP Lu-mira.

(27)

Descrição Etapas do trabalho com os

seus dados

Depois de adquiridos os dados relevantes no painel de preparação, mude para o painel de previsão e crie uma análise para encontrar padrões nos dados e prever resultados futuros.

No painel de previsão, você pode: • Criar uma análise

• Construir modelos preditivos • Visualizar os resultados da análise • Exibir visualizações de modelo • Construir gráficos

Observação:

Para informações sobre como criar gráficos, consulte a seção Como visualizar os dados do Guia do usuário do SAP Lumira. Analise os dados usando

al-goritmos de análise prediti-va.

Observação:

Este guia contém infor-mações de como analisar os dados usando algoritmos de análise preditiva.

Nomeie e salve a análise incluindo seus gráficos. A análise é salva e um documento com o formato de arquivo .SViD na pasta da aplicação, em Documentos, no caminho do seu perfil.

(28)
(29)

Criando análises

6.1 Como criar uma análise

Você pode usar o SAP Predictive Analysis para mineração de dados e análise estatística, executando os dados em uma série de componentes. A série de componentes devem ser conectados entre si por meio de conectores, que definem a direção do fluxo de dados. Esse processo é denominado análise. Usando a análise, você pode ler os dados de uma fonte de dados; analisar os dados, aplicando funções de manipulação de dados, mineração de dados e algoritmos estatísticos; e armazenar os resultados da análise.

Para criar uma análise, siga estes procedimentos: 1. Adquira dados de uma fonte de dados

2. (Opcional) Prepare os dados para análise (por exemplo, filtrando os dados) 3. Aplique os algoritmos

4. (Opcional) Armazene os resultados para uma análise posterior Tópicos relacionados

•Como adquirir dados de uma fonte de dados •Como preparar os dados para análise •Como aplicar os algoritmos

•Como armazenar os resultados da análise

6.1.1 Como adquirir dados de uma fonte de dados

1. Na página inicial, selecione o botão Novo documento no canto superior esquerdo. 2. Efetue a conexão com ou navegue até a sua fonte de dados.

(30)

Descrição Fonte de dados

Você pode adquirir dados de um arquivo de dados com valores separados por vírgula e ex-ecutar a análise no processo (in-proc) usando algoritmos SAP e R.

Arquivo CSV

Você pode criar manualmente seu próprio provedor de dados inserindo sua própria lin-guagem de consulta estruturada (SQL - Struc-tured Query Language) para uma fonte de da-dos de destino e executar a análise no processo (in-proc) usando algoritmos SAP e R.

Free hand SQL

Você pode adquirir dados de tabelas, visualiza-ções e visões de análise do SAP HANA e exe-cutar a análise no processo (in-proc) usando algoritmos SAP e R.

SAP HANA Offline

Você pode adquirir dados de tabelas, visualiza-ções e visões de análise do SAP HANA e exe-cutar a análise no banco de dados (in-db) usan-do algoritmos HANA PAL.

SAP HANA Online

Você pode adquirir dados de uma planilha do Microsoft Excel e executar a análise no proces-so (in-proc) usando algoritmos SAP e R. MS Excel

Você pode adquirir dados de universos do SAP BusinessObjects existentes na plataforma XI 3.x e executar a análise no processo (in-proc) usando algoritmos SAP e R.

Universe 3.x

Você pode adquirir dados de universos do SAP BusinessObjects existentes na plataforma BI 4.x e executar a análise no processo (in-proc) usando algoritmos SAP e R.

Universe 4.x

3. Marque a opção Adquirir ou Selecionar conforme necessário.

As colunas aparecem no painel de dados, os atributos e as medidas, à esquerda no painel Semântica. Você está pronto para começar a construir sua análise. No painel de previsão, o componente configurado de leitor de dados é adicionado ao editor de análise. Você pode executar a análise para ver os resultados do componente de leitor de dados.

Observação:

Para informações sobre como conectar-se a uma fonte de dados específica, consulte oGuia do usuário do SAP Lumira disponível emhttp://help.sap.com/.

(31)

6.1.2 Como preparar os dados para análise

Esta etapa é opcional.

Em muitos casos, os dados brutos da fonte de dados podem não serem adequados para a análise. Para obter resultados precisos, talvez seja necessário preparar e processar os dados antes da análise. Você encontra funções de manipulação de dados no painel de preparação e as funções de preparação de dados no painel de previsão.

A preparação de dados consiste em verificação da precisão dos dados e de campos em falta, filtragem dos dados com base em valores de intervalo, amostragem de dados para investigação de um subconjunto de dados e manipulação de dados. Você pode processar os dados usando os componentes de preparação de dados.

1. No painel de previsão, clique duas vezes no componente de preparação de dados necessário na guia Preparação de dados.

O componente de preparação de dados será adicionado ao editor de análise e uma conexão automática será criada para o componente de leitor de dados.

2. Clique no componente de preparação de dados com o botão direito do mouse e selecione Configurar propriedades.

3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de preparação de dados.

4. Selecione Salvar e fechar.

5. Para ver os resultados do componente de leitor de dados e do componente de preparação de dados, selecione .

Tópicos relacionados

•Componentes de preparação de dados

6.1.3 Como aplicar os algoritmos

Obtidos os dados relevantes para análise, você precisa aplicar os algoritmos apropriados para determinar os padrões nos dados.

É uma tarefa desafiadora determinar o algoritmo apropriado para uma finalidade específica. Você pode usar uma combinação de inúmeros algoritmos para analisar os dados. Por exemplo, primeiro você pode usar algoritmos de série de tempo para amortecer os dados e depois usar algoritmos de regressão para encontrar tendências.

(32)

A seguinte tabela contém informações dos algoritmos que devem ser selecionados para finalidades específicas:

Algoritmos de série de tempo • Amortecimento exponencial triplo

• R de amortecimento exponencial individual • R de amortecimento exponencial duplo • R de amortecimento exponencial triplo Realizando previsões com base no tempo

Algoritmos de regressão • Regressão linear • Regressão exponencial • Regressão geométrica • Regressão logarítmica

• HANA de regressão linear múltipla • R de regressão linear

• R de regressão exponencial • R de regressão geométrica • R de regressão logarítmica • R de regressão linear múltipla Prevendo variáveis contínuas com base em outras

variáveis no conjunto de dados.

Algoritmos de associação • HANA apriori

• R apriori Encontrando padrões frequentes de conjunto de

itens em conjuntos volumosos de dados transa-cionais para gerar regras de associação

Algoritmos de clustering • HANA de valor médio K • Valor médio K

Criando clusters de observações em grupos de conjuntos de itens similares

(33)

Árvores de decisão • HANA C 4.5 • R de árvore CNR Classificando e prevendo uma ou mais variáveis

discretas com base em outras variáveis no conjun-to de dados

Algoritmos de detecção de valor atípico • Intervalo interquartil

• Valor atípico vizinho mais próximo Detectando valores atípicos no conjunto de dados

Algoritmos de rede neural • R de rede neural NNet • R de rede neural MONMLP Prevendo, classificando e reconhecendo padrões

estatísticos

1. No painel de previsão, clique duas vezes no componente de algoritmo necessário na guia Algoritmos.

O componente de algoritmo será adicionado ao editor de análise e conectado ao componente anterior na análise.

2. Clique no componente de algoritmo com o botão direito do mouse e selecione Configurar propriedades.

3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de algoritmo.

4. Selecione Salvar e fechar.

5. Para ver os resultados do componente de leitor de dados, componente de preparação de dados e algoritmo, selecione .

Tópicos relacionados •Algoritmos

6.1.4 Como armazenar os resultados da análise

Esta etapa é opcional.

Você pode armazenar os resultados da análise em arquivos planos ou bancos de dados para uma análise posterior, usando componentes de gravação de dados.

1. No painel de previsão, clique duas vezes no componente de gravação de dados necessário na guia Gravadores de dados.

O componente de gravação de dados será adicionado ao editor de análise e conectado ao componente anterior na análise.

(34)

2. Clique no componente de gravação de dados com o botão direito do mouse e selecione Configurar propriedades.

3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de gravação de dados.

4. Selecione Salvar e fechar.

5. Para ver os resultados do componente de leitor de dados, componente de preparação de dados, algoritmo e componente de gravação de dados, selecione .

Tópicos relacionados •Gravadores de dados

6.2 Como executar a análise

Para executar a análise, selecione na barra de ferramentas do editor de análise ou clique com o botão direito do mouse no último componente da análise, e selecione Executar análise.

Se a sua análise for muito volumosa e complexa, você pode executá-la, componente por componente, e analisar os dados. Para executar parte da análise, selecione na barra de ferramentas do editor de análise ou clique com o botão direito do mouse na análise até a qual deseja executar e selecione Executar até aqui.

6.3 Como salvar a análise

Depois de criada a análise, você pode salvá-la para reutilizar no futuro. No SAP Predictive Analysis, você precisa salvar o documento para salvar a análise correspondente. O documento é salvo em formato de arquivo .SViD. Ele contém a análise criada

Para salvar a análise em um documento, siga estes procedimentos: 1. Selecione Arquivo > Salvar.

2. Insira um nome para o documento. 3. Selecione Salvar.

Se você criar várias análises com o mesmo conjunto de dados, todas serão salvas no mesmo documento. Você pode acessar todas as análise de um documento pela lista de opções Alterar.

(35)

Para adicionar uma nova análise ao documento, selecione na barra de ferramentas de análise. Para renomear a análise, selecione e insira um novo nome. Para excluir uma análise existente do documento, selecione .

6.4 Como visualizar os resultados

Para visualizar os resultados dos componentes em uma análise, após a execução da análise, clique com o botão direito do mouse no componente e selecione Visualizar resultados. A visão Resultados será exibida.

(36)
(37)

Como analisar os dados

Depois da execução correta da análise, o resultado de cada componente da análise é representado usando diferentes gráficos de visualização.

Para analisar os dados, siga estes procedimentos:

1. Depois de executar a análise, mude para a visão de resultados selecionando o botão Resultados na barra de ferramentas.

2. Do painel de seleção de componentes, selecione o componente necessário na análise para ver a visualização.

Por padrão, o resultado do componente é exibido no painel de grade. Você pode mudar para o painel de gráficos para ver o resultado do componente no gráfico de visualização correspondente. Além disso, você pode construir seu próprio gráfico no painel de visualização.

A seguinte tabela mostra resumidamente os componentes e respectivos gráficos de visualização suportados.

Gráficos de visualização Componentes

Gráfico de matriz de dispersão, gráfico de resumo estatístico e coor-denadas paralelas

Leitores de dados e preparação de dados

Gráfico de cluster e resumo do algoritmo Algoritmos de clustering

Árvore de decisão, resumo do algoritmo Árvores de decisão

Gráfico de série de tempo, resumo do algoritmo Algoritmos de série de tempo

Gráfico de regressão, resumo do algoritmo Algoritmos de regressão

7.1 Gráficos de visualização

(38)

Gráficos de matriz de dispersão são matrizes de gráficos (gráficos n*n, em que n é o número de atributos selecionados) usados para comparar os dados em diferentes dimensões. Por padrão, no máximo quatro atributos contínuos são selecionados para análise, começando do primeiro atributo dos dados de origem, para criar um gráfico de matriz 4*4. No entanto, você pode selecionar manualmente os atributos necessários na opção Configurações e atualizar a visualização selecionando Aplicar Observação:

Você pode selecionar no máximo quatro atributos contínuos na opção Configurações.

7.1.2 Gráfico de resumo estatístico

O resumo estatístico contém informações resumidas de atributos contínuos da fonte de dados. Ele contém informações resumidas de contagem, valor mínimo, valor máximo, variação, desvio padrão, soma, média, intervalo e número de registros. Um gráfico em forma de histograma é criado para cada atributo.

(39)

7.1.3 Coordenadas paralelas

Coordenadas paralelas são uma técnica de visualização de dados multidimensionais e padrões multivariáveis dos dados para análise.

Neste gráfico, por padrão, os primeiros cinco atributos estão representados como eixos paralelos espaçados verticalmente. Para escolher um subconjunto de atributos para visualização no gráfico, use a opção Configurações. A etiqueta de cada eixo contém o nome do atributo, e os valores mínimo e máximo dos atributos. Cada observação é representada como uma série de pontos conectados ao longo dos eixos paralelos. Você pode selecionar a cor por opção para filtragem dos dados com base no valor da categoria.

Observação:

Você pode selecionar no máximo sete atributos contínuos na opção Configurações.

7.1.4 Árvore de decisão

Árvore de decisão é uma técnica de visualização que permite classificar as observações em grupos e prever eventos futuros com base no conjunto de regras de decisão.

Esta apresentação será usada para análise da árvore de decisão. Nesta técnica, uma árvore de decisão binária é criada dividindo as observações em subgrupos menores até preencher os critérios de parada. O nó final indica os dados classificados. Você pode ampliar a árvore de decisão usando o botão de aproximação.

Observação:

• A aplicação não cria árvores de decisão se houver mais de 32 valores de categoria para uma coluna dependente.

(40)

• A aparência e o comportamento da árvore de decisão variam dependendo do fornecedor de algoritmos. Por exemplo, a árvore de decisão para o algoritmo R de árvore CNR é diferente da árvore de decisão para o algoritmo HANA C4.5.

Cada nó da árvore de decisão representa a classificação dos dados naquele nível. Você pode visualizar o conteúdo do nó selecionando em cada nó.

7.1.5 Gráfico de regressão

O gráfico de regressão é usado para visualizar a correlação entre as variáveis dependente e independente. No modo tendência, você pode analisar o desempenho do algoritmo, comparando as variáveis dependentes reais com os valores previstos, com as variáveis dependentes representadas como gráfico de barras e os valores previstos representados como gráficos de linhas. No modo preenchimento, o algoritmo preenche os valores que faltam e o resultado é exibido em gráfico de linhas.

(41)

Se o conjunto de dados for volumoso, o gráfico pode não ficar claro. Para visualizar melhor os dados, use o botão de seleção Intervalo localizado na base do gráfico para selecionar um intervalo de dados específico de um conjunto volumoso de dados. Os dados na área selecionada são exibidos no editor de visualização.

Observação:

Na visualização dos gráficos de algoritmo Regressão linear múltipla (MLR), o atributo do eixo x é mencionado como ID de registro.

7.1.6 Gráfico de série de tempo

O gráfico de série de tempo permite visualizar os dados de série de tempo comparados com os valores ajustados ou previstos do algoritmo. Você pode usar o gráfico para visualizar os dados previstos ao longo de um período específico. No modo tendência, uma variável dependente é representada em gráfico de barras e os valores de tendência são representados em gráfico de linhas. No modo previsão, uma variável dependente é representada em gráfico de barras e os valores previstos são representados em gráfico de linhas.

(42)

Se o conjunto de dados for volumoso, o gráfico pode não ficar claro. Para visualizar melhor os dados, use o botão de seleção Intervalo localizado na base do gráfico para selecionar um intervalo de dados específico de um conjunto volumoso de dados. Os dados na área selecionada são exibidos no editor de visualização.

7.1.7 Gráfico de cluster

Gráfico de cluster é uma técnica de visualização que utiliza diferentes gráficos para representar informações do cluster, como tamanho do cluster, densidade e distância do cluster, comparação variável do cluster e comparação do cluster.

Observação:

Se você utilizar o algoritmo HANA de valor médio K para observações de cluster, apenas informações de tamanho e comparação variável do cluster serão representadas graficamente.

Tamanho do cluster

Tamanho do cluster é o número de elementos em cada cluster e é representado por um gráfico de barras horizontais. No entanto, você também pode visualizar o tamanho do cluster em um gráfico de pizza ou um gráfico de barras verticais.

Densidade e distância do cluster

A distância entre clusters e a densidade de cada cluster são representadas por um gráfico de rede. Cada nó da rede representa um cluster e seu tamanho. A cor do nó representa a densidade. Você amplia o gráfico de rede selecionando .

Comparação variável do cluster

A comparação entre a distribuição total de todos os clusters e a distribuição de cada cluster é representada por um histograma. Você pode selecionar o atributo necessário do cluster em uma lista de opções variáveis e alterar o cluster usando o controle deslizante.

(43)

Comparação do cluster

O algoritmo R de valor médio K computa os pontos centrais de cada atributo de entrada em cada cluster. A comparação entre cada ponto central e o cluster é representada pelo gráfico radial. Você pode selecionar a opção Normalizar resultado para visualizar o gráfico com os dados normalizados. No modo normalizado, os dados são representados no intervalo de 0 a 1.

7.1.8 Gráfico de nuvem de tags Apriori

Um gráfico de nuvem de tags Apriori permite a você visualizar e encontrar os itens individuais frequentes, com base na regra de associação. Neste gráfico de visualização, as regras mais importantes são as mais fortes. A importância das regras varia de acordo com a segurança e com o valor de aumento. Quanto mais alto o valor de segurança, mais intensa a cor das regras e, quanto mais alto o valor de aumento, maior a fonte das regras. Você pode alterar o valor do suporte, da confiança e do aumento ajustando o respectivo Controle deslizante do intervalo.

7.1.9 Gráfico Matriz de classificação/ausência de classificação

Um gráfico Matriz de classificação/ausência de classificação contém informações sobre a classificação real e prevista feita por um algoritmo, que permite a você visualizar a precisão. Você poderá visualizar o gráfico se selecionar o método de saída como Classificação e o modo de saída como Tendência para o algoritmo CNR Tree. Ele é uma matriz n*n (onde n representa os valores distintos presentes na coluna dependente selecionada para o algoritmo) que mapeia o número de ocorrências de cada valor previsto em relação ao valor real. As entradas na diagonal da matriz contam a previsão correta. As entradas fora da diagonal da matriz contam as ausências de classificação.

(44)
(45)

Como trabalhar com modelos

Modelo é um componente reutilizável, criado treinando um algoritmo com os dados históricos e salvando a instância.

Geralmente você cria modelos para:

• Compartilhar regras comerciais aplicáveis a dados similares

• Analisar rapidamente os resultados sem os dados históricos, usando a instância treinada do algoritmo

8.1 Como criar um modelo na análise no processo (In-Proc)

Para criar um modelo, você precisa salvar o estado do algoritmo. 1. Adquira os dados da fonte de dados solicitada.

O componente de fonte de dados será adicionado ao editor de análise no painel de previsão. 2. No painel Previsão, clique duas vezes no componente de algoritmo R solicitado.

3. Clique no componente de algoritmo com o botão direito do mouse e selecione Configurar propriedades.

4. Configure as propriedades do algoritmo na caixa de diálogo. a. Insira os valores necessários para as propriedades do algoritmo. b. Em Informações do modelo, selecione Salvar o modelo. c. Insira um nome e uma descrição para o modelo.

d. Se você quiser substituir o modelo existente por um novo, selecione Sobregravar, se existir. e. Selecione Salvar e fechar.

5. Selecione .

O modelo será criado e exibido na guia Modelos salvos. Você pode usar este modelo apenas como qualquer outro componente para a criação de uma análise.

Observação:

Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de coluna independente usados durante a criação do modelo.

(46)

8.2 Como criar um modelo na análise no banco de dados (In-DB) HANA

Para criar um modelo, você precisa salvar o estado do algoritmo. 1. Adquira os dados da fonte de dados solicitada.

O componente de fonte de dados será adicionado ao editor de análise no painel de previsão. 2. No painel Previsão, clique duas vezes no componente de algoritmo HANA R ou HANA solicitado. 3. Clique no componente de algoritmo com o botão direito do mouse e selecione Configurar

propriedades.

4. Configure as propriedades do algoritmo na caixa de diálogo. a. Insira os valores necessários para as propriedades do algoritmo. b. Selecione Salvar e fechar.

5. Selecione .

6. Clique com o botão direito do mouse no componente de algoritmo e selecione Salvar como modelo. Uma janela Salvar modelo é exibida.

a. Na janela Salvar modelo, insira um nome de modelo e uma descrição.

b. Se você quiser substituir o modelo existente por um novo, selecione Sobregravar, se existir. 7. Selecione Salvar.

O modelo será criado e exibido na guia Modelos salvos. Você pode usar este modelo apenas como qualquer outro componente para a criação de uma análise.

Observação:

Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de coluna independente usados durante a criação do modelo.

8.3 Como visualizar as informações do modelo

As informações do modelo abrangem:

• Detalhes da coluna, como quais foram as colunas usadas durante a geração do modelo • Resumo do algoritmo

Esta informação é útil para os analistas de dados entenderem a estrutura do modelo. Para visualizar as informações do modelo, siga estes procedimentos:

1. No painel de previsão, na guia Modelos salvos, clique duas vezes no modelo desejado. A guia Modelos salvos só será exibida se os modelos já estiverem salvos no repositório.

(47)

A visualização correspondente do algoritmo selecionado durante a geração do modelo será exibida.

8.4 Como exportar um modelo como PMML

Você pode exportar as informações do modelo em um arquivo local, no formato padrão da indústria Predictive Modeling Markup Language (PMML), e compartilhá-lo com outras aplicações compatíveis com PMML para analisar dados similares.

Para exportar um modelo em formato PMML, siga estes procedimentos: 1. Crie um modelo.

2. No painel de previsão, na guia Modelos salvos, clique duas vezes no modelo desejado. 3. Clique com o botão direito do mouse no modelo e selecione Exportar como PMML. 4. Insira um nome para o arquivo.

5. Selecione o tipo de arquivo desejado: PMML ou XML. 6. Selecione Salvar.

8.5 Como exportar um modelo como arquivo .spar

Você pode exportar um modelo criado em um documento SVID para um arquivo .spar e usá-lo em outro documento SVID importando o arquivo.

Para exportar um modelo, execute os seguintes procedimentos: 1. Crie um modelo.

2. Clique com o botão direito no modelo e escolha Exportar modelo. 3. Insira um nome para o arquivo .spar.

4. Selecione Salvar.

8.6 Como exportar um Modelo PAL do SAP HANA como procedimento armazenado

Você pode exportar e usar o Modelo PAL salvo do SAP HANA como procedimento armazenado no banco de dados SAP HANA. É necessário ter sua conta definida no SAP HANA.

Para exportar um modelo do SAP HANA como procedimento armazenado, realize as seguintes etapas: 1. Crie um modelo.

(48)

3. Na guia Modelos salvos, clique com o botão direito do mouse no modelo e selecione Exportar modelo.

Uma visão de propriedade Exportar modelo como será exibida.

4. Na visão de propriedade Exportar modelo como, selecione Modelos do SAP HANA, e Avançar. Uma visão de propriedade Selecionar modelos será exibida.

5. Em Selecionar modelos, e Selecionar nome do esquema, selecione o esquema em que o procedimento deve ser exibido.

6. Em Inserir nome do procedimento, especifique o nome do procedimento. Observação:

Se quiser sobregravar o procedimento existente com o mesmo nome no esquema selecionado, selecione sobregravar se o nome existir.

O procedimento exportado e os objetos a ele associados (tabelas/tipos) serão exibidos no esquema selecionado no banco de dados SAP HANA.

8.6.1 Como remover o procedimento armazenado e exportado do SAP HANA

Você pode excluir o procedimento armazenado e exportado do SAP HANA usando o SAP HANA Studio. É necessário ter sua conta definida no SAP HANA.

Para remover o procedimento armazenado e exportado do SAP HANA, realize as seguintes etapas: 1. No SAP HANA Studio, acesse o procedimento que você exportou.

Observação:

O procedimento exportado deve estar na pasta Procedure.

2. Clique com o botão direito do mouse no procedimento e selecione Abrir definição. A guia Definição será exibida.

3. Na guia Definição, selecione a guia Criar instrução.

4. Na guia Criar instrução, copie os comentários SQL (comandos precedidos de dois hífens '--'). 5. Na guia Navegador, clique com o botão direito do mouse no procedimento e selecione Console

SQL.

A guia Console SQL será exibida.

6. Em Console SQL, cole os comentários SQL e clique em Executar, ou pressione a tecla F8. Observação:

Antes de executar os comentários, não esqueça de excluir os dois hífens (- -), que precedem os comentários SQL.

(49)

8.7 Como importar um modelo

Você pode reutilizar um modelo solicitado no documento SVID em outro documento SVID importando o arquivo do arquivo .spar.

Para importar um modelo, execute os seguintes procedimentos: 1. Inicie o SAP Predictive Analysis.

2. No painel de Previsão escolhaImportar modelo. 3. Escolha um arquivo .spar válido e escolha Abrir.

O modelo foi importado e exibido na guia Modelos salvos.

8.8 Como excluir um modelo

Recomendamos que você use esta opção com cautela porque a exclusão de um modelo pode inutilizar a análise que contenha a referência do modelo.

Para excluir um modelo, siga estes procedimentos:

1. No painel de previsão, selecione a guia Modelos salvos.

(50)
(51)

Propriedades do componente

9.1 Algoritmos

Use algoritmos para executar a mineração de dados e análise estatística dos dados. Por exemplo, para determinar tendências e padrões com base nos dados.

O SAP Predictive Analysis contém algoritmos incorporados, como de regressão, série de tempo e valor atípico. No entanto, a aplicação suporta inclusive algoritmos da biblioteca R de fonte aberta, como de árvore de decisão, valor médio k, rede neural, série de tempo e regressão. Você também pode executar uma análise interna do banco de dados usando algoritmos da biblioteca do Predictive Analysis (Predictive Analysis Library - PAL) do SAP HANA.

9.1.1 Regressão

9.1.1.1 Algoritmo HANA de regressão exponencial

Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Determina como uma variável individual influencia outra variável usando a função exponencial.

Observação:

O tipo de dados das colunas usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo.

Propriedades do algoritmo HANA de regressão exponencial

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma

coluna extra na saída que contenha os valores previstos. Modo de saída

(52)

Selecione a coluna de origem de entrada com a qual você deseja executar a regressão.

Colunas independentes

Selecione a coluna de destino em que você deseja executar a regressão. Coluna dependente

Selecione o método para manipulação dos valores em falta. Valores possíveis:

Remover: o algoritmo ignora os registros que contêm os valores em falta na coluna independente ou dependente.

Ignorar: retém valores em falta. Valores em falta

Insira um nome para a coluna recém criada que contenha os valores previstos.

Nome da coluna prevista

Insira o número de threads a ser usado na execução. Número de threads

9.1.1.2 Algoritmo HANA de regressão geométrica

Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Determina como uma variável individual influencia outra variável usando a função geométrica.

Observação:

O tipo de dados das colunas usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo.

Propriedades do algoritmo HANA de regressão geométrica

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma

coluna extra na saída que contenha os valores previstos. Modo de saída

Selecione a coluna de origem de entrada com a qual você deseja executar a regressão.

Colunas independentes

Selecione a coluna de destino em que você deseja executar a regressão. Coluna dependente

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.

• Ignorar: retém os valores em falta. Valores em falta

(53)

Insira um nome para a coluna recém criada que contenha os valores previstos.

Nome da coluna prevista

Insira o número de threads a ser usado na execução. Número de threads

9.1.1.3 HANA de regressão linear múltipla

Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis independentes.

Propriedades do algoritmo HANA de regressão linear múltipla

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma

coluna extra na saída que contenha os valores previstos. Modo de saída

Selecione a coluna de origem de entrada com a qual você deseja executar a regressão.

Colunas independentes

Selecione a coluna de destino em que você deseja executar a regressão. Coluna dependente

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.

• Ignorar: retém os valores em falta. Valores em falta

Insira um nome para a coluna recém criada que contenha os valores previstos.

Nome da coluna prevista

Insira o número de threads a ser usado na execução. Número de threads

9.1.1.4 Algoritmo HANA de regressão logarítmica

Use este algoritmo para encontrar tendências nos dados. Este algoritmo realiza análise de regressão logarítmica bi variável. Ele determina como uma variável individual influencia outra variável usando uma função logarítmica de PAL (Predictive Analysis Library, biblioteca de análise de previsão)

(54)

Observação:

O tipo de dados das colunas usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo.

Propriedades do algoritmo HANA de regressão logarítmica

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma

coluna extra na saída que contenha os valores previstos. Modo de saída

Selecione a coluna de origem de entrada com a qual você deseja executar a regressão.

Coluna independente

Selecione a coluna de destino em que você deseja executar a regressão. Coluna dependente

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.

• Ignorar: retém os valores em falta. Valores em falta

Insira um nome para a coluna recém criada que contenha os valores previstos.

Nome da coluna prevista

Insira o número de threads a ser usado na execução. Número de threads

9.1.1.5 Algoritmo HANA de regressão polinomial

Use este algoritmo para encontrar a relação entre a variável independente e a variável dependente em uma linha curvilínea ajustada.

Observação:

O tipo de dados das colunas usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo.

Propriedades do algoritmo HANA de regressão polinomial

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma Modo de saída

(55)

Selecione a coluna de origem de entrada com a qual você deseja executar a regressão.

Colunas independentes

Insira o maior valor expoente de uma expressão polinomial. Grau do polinomial

Selecione a coluna de destino em que você deseja executar a regressão.

Coluna dependente

Selecione o método para manipulação dos valores em falta. Valores possíveis:

Remover: o algoritmo ignora os registros que contêm os valores em falta na coluna independente ou dependente.

Ignorar: retém valores em falta. Valores em falta

Insira um nome para a coluna recém criada que contenha os valores previstos.

Nome da coluna prevista

Insira o número de threads a ser usado na execução. Número de threads

9.1.1.6 Algoritmo HANA de regressão logística

Use este algoritmo quando as variáveis independentes forem categóricas ou uma mistura de valores contínuo e categórico. Regressão logística é uma abordagem de previsão semelhante à regressão de mínimo quadrado comum (Ordinary Least Square - OLS).

Observação:

O tipo de dados das colunas usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo.

Propriedades do algoritmo HANA de regressão logística

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos.

• Preencher: preenche os valores em falta na coluna de destino. Modo de saída

Selecione a coluna de origem de entrada com a qual você deseja executar a regressão.

Colunas independentes

Selecione a coluna de destino em que você deseja executar a regressão.

Coluna dependente

O método usado é o de iteração de Newton. Método

(56)

Selecione o método para manipulação dos valores em falta. Valores possíveis:

Remover: o algoritmo ignora os registros que contêm os valores em falta na coluna independente ou dependente.

Ignorar: retém valores em falta. Valores em falta

Selecione a opção para visualizar os valores ajustados em uma nova coluna.

Mostrar valores ajustados

Insira um nome para a coluna recém criada que contenha os valores previstos.

Nome da coluna prevista

Especifique um nome para a nova coluna que contenha os valores ajustados.

Valores ajustados

Insira o número máximo de iteração permitido para calcular o coeficiente do algoritmo.

Iteração máxima

Insira o valor limite para a saída da iteração. Limite de saída

Insira o número de threads a ser usado na execução. Número de threads

9.1.1.7 R de regressão exponencial

Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função exponencial da biblioteca de fonte aberta R.

Observação:

O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo.

Propriedades do algoritmo R de regressão exponencial

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma

coluna extra na saída que contenha os valores previstos. Modo de saída

Selecione a coluna de origem de entrada com a qual você deseja executar a regressão.

Coluna independente

Selecione a coluna de destino em que você deseja executar a regressão. Coluna dependente

(57)

Selecione o método para manipulação dos valores em falta. Valores possíveis:

• Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.

• Manter: retém os valores em falta.

• Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente.

Valores em falta

Um valor booleano - se definido como verdadeiro, os coeficientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coeficientes com alias produzirá um erro.

Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única.

Permitir único ajuste

Selecione a lista de contrastes a ser usada para fatores que aparecem como variáveis no modelo.

Contrastes

Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Salvar o modelo

Insira um nome para a coluna recém criada que contenha os valores previstos.

Nome da coluna prevista

9.1.1.8 R de regressão geométrica

Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função geométrica da biblioteca de fonte aberta R.

Observação:

O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo.

Propriedades do algoritmo R de regressão geométrica

Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis:

• Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma

coluna extra na saída que contenha os valores previstos. Modo de saída

Selecione a coluna de origem de entrada com a qual você deseja executar a regressão.

Referências

Documentos relacionados

Este presente artigo é o resultado de um estudo de caso que buscou apresentar o surgimento da atividade turística dentro da favela de Paraisópolis, uma

Como forma de operacionalizar a organização e o trabalho da rede de atenção aos usuários de drogas, a PAIUAD pressupõe o tratamento e reinserção social dos usuários/dependentes

Os resultados mostram que tanto o Grau de Intangibilidade quanto o Retorno sobre Investimentos das empresas do setor de Consumo Cíclico são superiores aos do de

A incidência de FO no estado de Sergipe obtida através dos dados do SINASC, no mesmo período da pesquisa, foi de 0,54 novos casos de fissura para cada 1000 nascidos vivos..

Entretanto, encontramos evidências neste trabalho de que estas variáveis não satisfazem as condições para serem utilizadas como instrumentos (Cap.2, seção 3.1.).

Table 3 Components of the TβD (Jaccard index) observed and comparison between the mean samples and standard deviation for primary ray-finned fishes in Brazil. JAC:

Uma vez formado o quadro, utilizá-lo ao seu potencial máximo significa atribuir tarefas de acordo com habilidades e competências de cada diretor, investir na

Assim como a Natureza, a leitura de folhetos de cordel constituiu uma fonte de inspiração para fazer poesia.. Na comunidade em que vivia Patativa, a leitura dos folhetos de