• Nenhum resultado encontrado

Análise Preditiva com o SQL Server 2008

N/A
N/A
Protected

Academic year: 2021

Share "Análise Preditiva com o SQL Server 2008"

Copied!
21
0
0

Texto

(1)

Análise Preditiva com o SQL Server 2008

Artigo Técnico do SQL Server

Autor: Graeme Malcolm (Conteúdo Mestre)

Revisores Técnicos: Roni Karassik e Donald Farmer Editor do Projeto: Joanne Hodgins

Publicado: Novembro de 2007 Aplica-se Ao: SQL Server 2008

Resumo: O Microsoft® SQL Server® 2008 oferece análise preditiva através de um conjunto completo e intuitivo de ferramentas de data mining. Integração direta com a plataforma Microsoft de Business Intelligence oferece percepção avançada de cada passo do ciclo de vida de dados. Além disso, a plataforma flexível capacita você a estender a previsão a qualquer aplicativo.

(2)

Direitos Autorais

Este é um documento preliminar e pode ser alterado substancialmente antes do lançamento comercial final do software aqui descrito.

As informações contidas neste documento representam a visão atual da Microsoft Corporation sobre os temas discutidos na data da publicação. Como a Microsoft deve responder às mudanças das condições de mercado, este documento não deve ser interpretado como um compromisso da parte da Microsoft, e a Microsoft não pode assegurar a exatidão de qualquer informação apresentada após a data da publicação.

Este white paper destina-se a fins informativos apenas. A MICROSOFT NÃO FORNECE NENHUMA GARANTIA, EXPRESSA OU IMPLÍCITA, QUANTO ÀS INFORMAÇÕES NESTE DOCUMENTO.

O cumprimento de todas as leis pertinentes de direitos autorais é de responsabilidade do usuário. Sem limitar os direitos sob o direito autoral, nenhuma parte deste documento pode ser reproduzida, armazenada em ou inserida em um sistema de recuperação de dados ou transmitido de qualquer forma ou por qualquer meio (eletrônico, mecânico, fotocópia, gravação ou outro) ou para qualquer fim, sem a permissão expressa por escrito da Microsoft Corporation

A Microsoft pode deter as patentes, as solicitações de patentes, as marcas comerciais, os direitos autorais ou outras propriedades intelectuais pertinentes ao objeto deste documento. Salvo expressamente disposto em qualquer contrato de licença escrito da Microsoft, o fornecimento deste documento não confere a você qualquer licença em relação a essas patentes, marcas comerciais, direitos autorais ou outras propriedades intelectuais.

Salvo indicação em contrário, os exemplos de empresas, organizações, produtos, nomes de domínio, endereços de e-mail, logotipos, pessoas, lugares e eventos aqui mencionados são fictícios e nenhuma associação com qualquer empresa, organização, produto, nome de domínio, endereço de email, logotipo, pessoa, lugar ou evento real é intencional ou deve ser deduzida como tal.

Todos os direitos reservados.

Microsoft, SQL Server e Virtual Earth são marcas registradas ou comerciais da Microsoft Corporation nos Estados Unidos e/ou outros países.

Os nomes de empresas e produtos reais aqui mencionados podem ser marcas comerciais de seus respectivos proprietários.

(3)

Conteúdo

Introdução ...1

Análise Preditiva para Todos os Usuários ...1

Distribuição Difundida através do Microsoft Office ... 2

Ambiente de Desenvolvimento Abrangente ... 5

Recursos de Nível Corporativo ... 8

Algoritmos Avançados e Inovadores ... 8

Percepção a Cada Passo do Ciclo de Vida dos Dados ... 10

Integração de Relatórios Nativa ... 10

Mineração Durante Integração de Dados ... 12

Análise Detalhada ... 13

KPIs Preditivos ... 14

Reconhecimento de Data Mining em Todos os Aplicativos ... 15

Programação Preditiva ... 15

Algoritmos de Plug-In e Visualizações Personalizadas ... 15

(4)
(5)

Predictive Analysis with SQL Server 2008 1

Introdução

Um dos ativos mais valiosos de qualquer empresa é o grande volume de dados de negócios em vários aplicativos e sistemas por toda a organização. Esses dados têm o potencial de fornecer percepções incríveis dos negócios e de fornecer uma base confiável para tomada de decisões eficiente e previsão precisa que podem levar uma empresa ao sucesso. Infelizmente, com muita freqüência, os dados são coletados pelos vários sistemas de computação e deixados dormentes em armazenamentos de dados isolados. Algumas organizações podem gerar relatórios históricos a partir desses dados e algumas podem até mesmo medir o desempenho da empresa em comparação com alguns KPIs (key performance indicators - indicadores-chave de desempenho); mas, surpreendentemente, poucas organizações concretizam os benefícios de minerar seus dados históricos para detectar padrões e tendências, e ainda menos incorporam análise preditiva em seus processos de negócios cotidianos para tomar decisões e fazer

previsões e melhorar a agilidade geral da empresa.

Ao longo dos últimos lançamentos, a Microsoft refinou os recursos de relatórios e analíticos do Microsoft SQL Server para criar uma plataforma abrangente de BI

(Business Intelligence) que pode ser integrada nas atividades de negócios do dia-a-dia e usada eficientemente pelos funcionários por toda a organização em vez de por apenas alguns poucos analistas especializados. Muitas organizações que no passado teriam considerado soluções de BI caras demais agora estão tirando proveito dos recursos de criação, processamento e distribuição de relatórios do SQL Server Reporting Services e dos poderosos serviços OLAP (online analytical processing - processamento analítico online) fornecidos pelo SQL Server Analysis Services. A integração estreita entre esses dois produtos de servidor de BI e o onipresente Microsoft Office system leva a análise de negócios às massas e promove a evolução de um novo tipo de profissional da

informação que pode obter uma percepção mais profunda dos negócios e trabalhar com mais eficiência.

Embora essa proliferação de relatórios e analítica multidimensional tenha beneficiado bastante muitas organizações de todos os tamanhos, o passo seguinte na promoção da agilidade de negócios e eficiência operacional é dar o salto de análise retrospectiva de dados históricos para ações proativas baseadas em análise preditiva de dados de negócios e incorporar aos processos de negócios tomada de decisões inteligente e baseada em fatos. A chave para se conseguir isso é usar poderosos algoritmos de data mining para analisar conjuntos de dados, comparar novos dados a fatos e

comportamentos históricos, identificar classificações e relações entre entidades e

atributos de negócios e proporcionar percepções preditivas precisas a todos os sistemas e usuários que tomam decisões de negócios. Como com as tecnologias de OLAP, a data mining já foi considerada um campo altamente especializado que exigia software caro e experiência rara para implementar. Entretanto, incluindo tecnologias abrangentes de data mining no SQL Server Analysis Services e através da integração com o 2007 Microsoft Office System, a Microsoft fornece uma solução eficaz em termos de custo que pode estender o poder da data mining a todo o mundo e fornecer as percepções críticas para o sucesso, ao mesmo tempo em que tira proveito dos recursos de escala corporativa do SQL Server Analysis Services.

(6)

Análise Preditiva para Todos os Usuários

Uma solução de análise preditiva é mais eficiente quando é predominante por toda a organização e ajuda a gerar decisões cotidianas na empresa com seu dimensionamento e desempenho de nível corporativo. Além disso, fornecer uma forma de implementar análise preditiva abrangente possibilita intuitivamente a data mining por

auto-atendimento para os usuários, o que, por sua vez, permite à empresa obter percepção acionável prontamente. A tecnologia de data mining no SQL Server 2008 satisfaz a esses requisitos através da estreita integração com o 2007 Office System, um ambiente de desenvolvimento abrangente, recursos de nível corporativo e um conjunto extensível de algoritmos avançados e inovadores de data mining que são projetados para atender problemas comuns às empresas.

Distribuição Difundida através do Microsoft Office

Tradicionalmente, a análise preditiva era limitada a apenas uma fração dos funcionários que eram peritos treinados em estatística. Os Microsoft SQL Server 2008 Data Mining Add-Ins for Office, mostrados na Figura 1, estendem a percepção e previsão a um público mais amplo permitindo que profissionais da informação controlem a tecnologia de data mining altamente sofisticada dentro de um ambiente familiar de planilhas. O conjunto de ferramentas capacita os usuários a informar decisões diárias em alguns passos simples oferecendo recomendações rápidas e acionáveis. As Table Analysis Tools for Microsoft Office Excel® 2007 ocultam a complexidade da data mining atrás de tarefas intuitivas, proporcionando uma experiência simples que possibilita aos usuários fazer facilmente a transição entre exploração e descoberta. O Data Mining Client for Office Excel 2007 oferece um ciclo de vida de desenvolvimento completo de data mining que capacita usuários avançados com mais informações, validação e controle. Além disso, os Data Mining Templates for Visio permitem aos usuários processar

visualizações gráficas dos modelos de data mining às quais se podem adicionar anotações. De modo geral, a integração entre a data mining do SQL Server 2008 e o 2007 Office System fornece um ecossistema de negócios abrangente, intuitivo e

colaborativo que estende a percepção da análise preditiva para informar as decisões de negócios por toda a organização.

(7)

Análise Preditiva com o SQL Server 2008 3

Figura 1: Add-Ins de Data Mining para o Microsoft Office Excel 2007 Os Add-Ins de Data Mining para o 2007 Office System oferecem os seguintes benefícios:

Abrangentes: fornecem uma grande variedade de ferramentas para satisfazer muitas necessidades

Os Add-Ins de Data Mining para Office 2007 System foram projetados para oferecer um conjunto amplo e confiável de ferramentas de data mining. A disponibilidade dessas ferramentas na estação de trabalho permite que todos os usuários explorem e descubram tendências e relações ocultas entre produtos, clientes, mercados, funcionários e outros fatores, capacitando-os a prever necessidades, entender comportamentos e descobrir oportunidades ocultas que podem melhorar processos de negócios e causar um impacto positivo direto na lucratividade.

Intuitivos: fornecem percepção sobre a qual se pode agir a todos os usuários

O acesso à análise preditiva dentro do ambiente familiar do Microsoft Office ajuda os usuários a incorporar previsão a seus processos cotidianos. As tarefas automatizadas fornecidas nas Table Analysis Tools for Office Excel 2007

proporcionam percepções claras e acionáveis prontamente, em três passos simples:

1. Defina seus dados. Identifique os dados necessários para informar a solução e crie uma tabela em Office Excel 2007 que defina os dados a ser analisados.

(8)

2. Identifique a tarefa. Selecione a tarefa de mineração apropriada para executar nos dados a partir da faixa de opções Data Mining ou Table Analysis.

3. Obtenha resultados. Examine o produto da tarefa fornecido através de visualizações claras e intuitivas diretamente no ambiente do Office Excel 2007.

As tarefas automatizadas fornecidas nos Data Mining Add-Ins for Office Excel 2007 incluem:

o Analisar Inflenciadores-Chave – Detecta as principais características que influenciam certo resultado. Um relatório detalhado que classifica os influenciadores-chave com base na importância é gerado, possibilitando aos usuários comparar os principais fatores para cada conjunto de valores distintos.

o Detectar Categorias – Ajuda os usuários a identificar e segmentar dados com base em propriedades em comum. Um relatório detalhado descrevendo as categorias descobertas é gerado, possibilitando a reclassificação de categorias com nomeação expressiva para análise adicional.

o Preencher Pelo Exemplo – Ajuda os usuários a preencher uma coluna parcialmente populada automaticamente com base em padrões na tabela. Um relatório explicando os padrões detectados é gerado, permitindo aos usuários analisar novamente os dados e refinar padrões à medida que novos conhecimentos são adquiridos.

o Previsão – Permite aos usuários predizer valores futuros com base em tendências do conjunto de dados. Os valores de previsão são adicionados à tabela original e gráficos exibindo a evolução passada e prevista da série são gerados.

o Destacar Exceções – Permite aos usuários detectar casos no conjunto de dados que incluam valores fora da faixa esperada. As linhas contendo as exceções são destacadas e a coluna real propensa a causar a exceção é realçada.

o Análise de Cenários: Hipóteses – Permite aos usuários obter

percepção do impacto de uma mudança potencial aplicada a um valor em outros valores do conjunto de dados.

o Análise de Cenários: Atingir Meta – Permite aos usuários entender melhor os fatores subjacentes que precisam ser alterados para se alcançar um valor desejado em uma coluna-alvo (complementar à ferramenta Hipóteses).

o Calculadora de Previsão – Relacionada à tarefa Analisar

Influenciadores-Chave, a Calculadora de Previsão gera um formulário interativo para se registrar novos casos. A influência de cada atributo é traduzida em um conjunto de pontos. Um resumo de uma combinação de atributos, que se aplicam a um novo caso, prediz comportamentos

futuros prováveis.

o Análise de Cesta de Compras – Permite aos usuários detectar a relação entre itens freqüentemente comprados juntos. Um relatório explicando as relações pode proporcionar uma melhor compreensão da

(9)

Análise Preditiva com o SQL Server 2008 5

significância financeira, oferecendo percepção de ofertas em grupo ou exposição de produto melhorada.

O resultado gráfico fácil de usar dessas ferramentas oferece uma transição direta entre exploração e descoberta e capacita os usuários com previsão e percepção avançadas que se traduzem claramente em recomendações e ações.

Colaborativo: compartilhe percepções em toda a organização

Depois de realizar análise preditiva dentro do Office Excel 2007, os usuários podem usar as poderosas ferramentas de publicação do 2007 Office System para partilhar descobertas e informar decisões de negócios por toda a organização. Por exemplo, os usuários podem compartilhar análises através de visualizações gráficas em diagramas do Office Visio 2007 ou podem partilhar tabelas,

relatórios e diagramas através do Microsoft Office SharePoint® Server 2007.

Ambiente de Desenvolvimento Abrangente

O 2007 Office System é uma ferramenta de estação de trabalho ideal para profissionais da informação, mas desenvolvedores de BI que implantam soluções por toda a

empresa, o SQL Server Business Intelligence Development Studio é o ambiente

preferido porque possui um ambiente baseado em projeto, completo com depuração e integração de controle de fonte que você pode usar para criar soluções de BI fim a fim. E a funcionalidade de distribuição difundida de data mining é útil apenas se os

desenvolvedores puderem construir soluções de data mining que atendam às necessidades da empresa rápida e facilmente. O SQL Server Business Intelligence Development Studio fornece oferece um ambiente de desenvolvimento abrangente que se baseia no sistema de desenvolvimento do Microsoft Visual Studio®. Com o Business Intelligence Development Studio, desenvolvedores podem criar estruturas de data mining, que identificam as tabelas e colunas a ser incluídas na análise e adicionar múltiplos modelos que aplicam algoritmos de mining aos dados naquelas tabelas. O modelo de projeto de Analysis Services no Business Intelligence Development Studio, mostrado na Figura 2, inclui um Designer de Data mining intuitivo para criar e exibir modelos de data mining e oferece validação cruzada, gráficos de comparação de precisão e gráficos de lucros para comparar e contrastar a qualidade de modelos visualmente e através de registros estatísticos de erros e exatidão antes de implantá-los.

(10)

Figura 2: Data Mining Designer no Business Intelligence Development Studio O SQL Server 2008 introduz vários aperfeiçoamentos ao ambiente de desenvolvimento já abrangente do SQL Server 2005, incluindo a capacidade de:

Dividir dados em partições de treinamento e testes mais eficientemente. O particionamento está disponível dentro do processo de criação do modelo de data mining. Desenvolvedores podem identificar uma porção do conjunto de dados de treinamento para ser selecionada aleatoriamente para testes.

Construir modelos com dados filtrados. A filtragem de dados permite a criação de modelos de data mining que usam subconjuntos de dados em uma estrutura de data mining. A filtragem fornece a flexibilidade para projetar

estruturas de data mining e fontes de dados, porque os desenvolvedores podem criar uma única estrutura de data mining, baseada em uma visualização

abrangente de fonte de dados e depois aplicar filtros para usar somente uma parte dos dados para treinamento e testes de uma variedade de modelos, em vez de construir uma estrutura diferente e modelo relacionado para cada subconjunto de dados. Por exemplo, um desenvolvedor pode definir a exibição da fonte de dados na tabela Clientes e relacionadas, construir uma única estrutura de data mining que inclua todos os campos necessários e depois criar um modelo que seja filtrado segundo um determinado atributo de cliente, como Região. O desenvolvedor pode então, facilmente, fazer uma cópia daquele modelo e mudar a condição do filtro para gerar um novo modelo baseado em uma região diferente. Aplicando filtros a modelos de dados você pode:

(11)

Análise Preditiva com o SQL Server 2008 7

o Criar modelos separados para valores distintos. Por exemplo, uma loja de roupas pode usar a demografia dos clientes para construir modelos separados por sexo, embora os dados venham de uma única fonte para todos.

o Fazer experiências com modelos criando e depois testando vários

agrupamentos dos mesmos dados, como de idades de 20 a 30 contra 20 a 40 e contra 20 a 25.

o Especificar filtros complexos em conteúdos de tabela aninhados, como precisar que um caso seja incluído no modelo somente se o cliente tiver comprado pelo menos dois de determinado item.

Construir modelos incompatíveis dentro da mesma estrutura. Modelos usando versões contínuas ou individualizadas da mesma coluna podem coexistir em uma única estrutura, evitando a necessidade de se criar várias versões da mesma coluna de origem.

Testar vários modelos simultaneamente com validação cruzada. Os modelos criados por algoritmos de data mining têm várias aplicações que exigem diferentes medições de exatidão e estabilidade. Dependendo da aplicação, os usuários exigem essas medições. Além disso, essas medições auxiliam em assegurar que várias definições resultem no melhor modelo para um conjunto de dados atuais e uma determinada aplicação. O SQL Server 2008 oferece um robusto recurso de validação cruzada que pode testar

simultaneamente todos os modelos em uma estrutura usando uma técnica de enlace. Isso permite aos usuários testar uma variedade de definições em um subconjunto de dados antes de se comprometer com um passo de

processamento caro. Os resultados da validação cruzada também dizem aos usuários se os resultados do modelo são estáveis ou se podem mudar se ele receber mais ou menos dados. A Figura 3 mostra um relatório de validação cruzada no Designer de Data Mining.

(12)

Figura 3: Validação cruzada

Recursos de Nível Corporativo

A Análise Preditiva do SQL Server faz parte do SQL Server Analysis Services, que fornece vantagens de servidor de classe corporativa: desenvolvimento rápido, alta disponibilidade, desempenho superior e escalabilidade, segurança robusta e

gerenciamento aperfeiçoado através do SQL Server Management Studio. Esse recurso de nível corporativo significa que as tecnologias de data mining que permitem a análise preditiva podem crescer com a empresa e proporcionar uma solução de alto

desempenho e escalonável para organizações de qualquer tamanho..

Algoritmos Avançados e Inovadores

Empresas diferentes têm metas diferentes e precisam tomar decisões diferentes. Por isso, qualquer tecnologia de data mining deve suportar um conjunto abrangente de recursos e algoritmos para atender a uma variedade de necessidades de negócios. O SQL Server 2008 Analysis Services inclui tecnologias de data mining que suportam muitos algoritmos avançados e inovadores, em sua maioria projetados pela Microsoft Research para solucionar problemas comuns às empresas. Além disso, as tecnologias de data mining do SQL Server Analysis Services são extensíveis, permitindo que você adicione plug-ins de algoritmos que atendem necessidades analíticas incomuns que são mais específicas de uma empresa individual. A Tabela 1 mostra algumas das tarefas que a data mining do SQL Server pode ser usada para executar.

(13)

Análise Preditiva com o SQL Server 2008 9

Tarefa Descrição Algoritmos

Análise de Cesta de Compras

Descubra itens vendidos juntos para criar recomendações rápidas e para determinar como a exposição dos produtos pode contribuir diretamente para seus lucros.

Associação

Árvores de Decisão

Análise de Rotatividade

Preveja os clientes que podem estar considerando cancelar seu serviço e identifique os benefícios que os manterão.

Árvores de Decisão Regressão Linear Regressão Logística Análise do

Mercado

Defina segmentos de mercado agrupando automaticamente clientes semelhantes. Use esses segmentos para procurar clientes lucrativos

Clustering Clustering de Seqüência Previsão Preveja vendas e quantidades de inventário

e saiba mais sobre como elas se inter-relacionam para prever afunilamentos e melhorar o desempenho.

Árvores de Decisão Séries de Tempo

Exploração de Dados

Analyze profitability across customers, or compare customers that prefer different brands of the same product to discover new opportunities.Analise a lucratividade entre clientes ou compare clientes que preferem diferentes marcas do mesmo produto para descobrir novas oportunidades.

Rede Neural

Aprendizado Sem

Supervisão

Identifique antecipadamente relações

desconhecidas entre vários elementos de sua empresa para informar suas decisões.

Rede Neural

Análise de Site da Web

Entenda como as pessoas usam seu site da Web e agrupam padrões de uso similares para oferecer uma experiência melhor.

Clustering de Seqüência Análise de

Campanha

Gaste fundos de marketing mais eficientemente visando os clientes com maior probabilidade de responder a uma promoção. Árvores de Decisão Naïve Bayes Clustering Qualidade de Informações

Identifique e lide com anomalias durante a inclusão ou carregamento de dados para melhorar a qualidade das informações.

Regressão Linear Regressão Logística

(14)

Análise de Textos

Analyze feedback to find common themes and trends that concern your customers or employees, informing decisions with

unstructured input.Analise comentários para encontrar temas e tendências comuns que dizem respeito a seus clientes ou

funcionários, informando decisões com dados não-estruturados.

Text mining

Tabela 1: Tarefas de Data Mining

Percepção a Cada Passo do Ciclo de Vida dos

Dados

Seja consumindo, analisando, monitorando, planejando, explorando ou relatando dados de negócios, a análise preditiva pode acrescentar percepção valiosa para expor novas avenidas para crescimento. O SQL Server 2008 faz parte de uma família de tecnologias de business intelligence que trabalham juntas para fornecer uma plataforma

abrangente que permite a organizações incorporar análise preditiva em cada passo do ciclo de vida dos dados.

Integração de Relatórios Nativa

A criação de relatórios é uma atividade fundamental na maioria das empresas, e o SQL Server 2008 Reporting Services fornece uma solução abrangente para criar, processar e implantar relatórios por toda a empresa. O SQL Server Reporting Services pode

processar relatórios diretamente a partir de um modelo de data mining usando uma consulta de DMX (data mining extensions). Isso permite aos usuários visualizar o conteúdo de modelos de data mining para representação de dados otimizada. Além disso, a capacidade de consultar diretamente a estrutura de data mining permite aos usuários incluir facilmente atributos além do escopo dos requisitos do modelo de mineração, apresentando informações completas e substanciais. A Figura 4 mostra o editor de consulta de DMX para o Reporting Services.

(15)

Análise Preditiva com o SQL Server 2008 11

Figura 4: Editor de consulta de DMX para o SQL Server Reporting Services O SQL Server Reporting Services oferece a capacidade de gerar relatórios orientados por parâmetros com base em probabilidade preditiva. Por exemplo, a consulta

mostrada na Figura 4 analisa uma lista de clientes potenciais para a empresa hipotética Adventure Works e usa um modelo de data mining para avaliar a probabilidade de aqueles clientes comprarem um bicicleta. A consulta é filtrada para retornar somente clientes potenciais que tenham probabilidade de compra maior que 50%. A Figura 5 mostra o relatório resultante, que a empresa pode usar como base para uma campanha de marketing visando somente os clientes propensos a fazer uma compra, melhorando significativamente a eficiência da campanha e seu retorno de investimento.

(16)

Figura 5: Relatório de análise preditiva

Mineração Durante Integração de Dados

À medida que a BI (Business Intelligence) se torna mais difundida, as empresas estão cada vez mais implementando soluções de ETL (extract, transform, and load - extração, transformação e carga) para consolidar dados de toda parte da organização em data warehouse para criação de relatórios e análise. Entretanto, os dados de origem para essas operações podem freqüentemente estar incompletos ou, em alguns casos, entidades comerciais, como clientes, podem precisar ser classificadas em categorias baseadas em características comuns de perfil.

O Microsoft SQL Server 2008 Integration Services oferece uma plataforma de ETL poderosa e extensível que desenvolvedores de BI podem usar para implementar operações de ETL que limpam e transformam os dados durante o uso. O SQL Server Integration Services inclui um destino de Data Mining Model Training para treinar modelos de data mining e um uma transformação de Data Mining Query que pode ser usada para executar análise preditiva em dados conforme eles passam através do fluxo de dados. Integrar análise preditiva com o SQL Server Integration Services permite às organizações marcar dados incomuns, classificar entidades comerciais, executar mineração de texto e preencher valores faltantes com base na força e percepção dos algoritmos de data mining. Por exemplo, um processo de ETL pode extrair dados de clientes de um ou mais sistemas de origem para inclusão em um data warehouse. Tradicionalmente, a data mining pode ser usada depois que o data warehouse é

(17)

Análise Preditiva com o SQL Server 2008 13

tarefas de gerenciamento de campanha. Contudo, com o SQL Server Integration Services, o Data Mining Query Transformation pode aplicar um modelo de data mining durante o processo de ETL, resultando em um data warehouse populado com dados classificados no momento do carregamento. Isso reduz o trabalho que deve ser feito no servidor do warehouse e assegura que os dados disponíveis para análise estejam sempre atualizados e classificados de maneira consistente. Além disso, a classificação durante o processo de ETL também pode ser usado para filtrar registros de clientes que não se enquadrem em nenhuma classificação conhecida. Esses registros podem ser o resultado de qualidade de dados insatisfatória ou pode representar uma nova

classificação ainda não capturada no processo de gerenciamento de campanha. Em qualquer caso, o SQL Server Integration Services pode detectar esses registros usando data mining e redirecioná-los para revisão manual ou automática.

A Figura 6 mostra um fluxo de dados do SQL Server Integration Services que inclui uma transformação de Data Mining Query.

Figura 6: Data mining no SQL Server Integration Services

Análise Detalhada

O SQL Server 2008 Analysis Services fornece uma plataforma altamente escalonável para análise multidimensional de OLAP. Muitos clientes já estão colhendo os benefícios de criar um UDM (unified dimensional model) no Analysis Services e usá-lo para esmiuçar medidas de negócios em várias dimensões. A análise preditiva, sendo parte

(18)

do SQL Server 2008 Analysis Services, oferece uma experiência de OLAP mais avançada, com dimensões de data mining que dividem seus dados pelos padrões ocultos dentro delas. Por exemplo, um departamento de vendas e marketing pode criar uma estrutura de data mining baseada em uma dimensão de OLAP Cliente existente e usá-la para classificar clientes em clusters que exibem características semelhantes. Eles podem então usar aquela estrutura de data mining para gerar uma nova dimensão de mineração e usá-la para analisar informações de vendas com base nos clusters de clientes identificados. A Figura 7 mostra uma dimensão de data mining em um cubo de OLAP.

Figura 7: Uma dimensão de data mining em um cubo de OLAP

Além de incorporar os resultados da data mining em dimensões de OLAP, o SQL Server 2008 permite que você incorpore funções preditivas com base em modelos de

mineração em cálculos e KPIs.

KPIs Preditivos

Muitas empresas usam KPIs para avaliar estatísticas de negócios críticas em

comparação com metas. O SQL Server 2008 Analysis Services fornece uma plataforma centralizadas para KPIs na organização e a integração com o Microsoft Office

PerformancePoint™ Server 2007 permite que os responsáveis por decisões montem painéis de negócios a partir dos quais podem monitorar o desempenho da empresa. KPIs são tradicionalmente retrospectivos, mostrando, por exemplo, o total de vendas do mês anterior comparado com a meta. Contudo, com as percepções possibilitadas através da data mining, as organizações podem construir KPIs preditivos que predizem o desempenho futuro em contraste com metas, dando às empresas uma oportunidade

(19)

Análise Preditiva com o SQL Server 2008 15

de detectar e solucionar problemas potenciais proativamente. A Figura 8 mostra um KPI que exibe uma previsão do de número a ser feitos.

Figura 8: Microsoft Office PerformancePoint Server 2007

Além disso, a análise preditiva pode detectar atributos que influenciam KPIs. Junto com o Office PerformancePoint Server 2007, os usuários podem monitorar tendências em indicadores-chave para reconhecer atributos com efeito prolongado, por exemplo, identificar se o desconto no preço de um produto concorrente tem um impacto duradouro sobre as vendas ou se gera apenas uma influência de curto prazo. Tais percepções capacitam as empresas a informar e melhorar sua estratégia de resposta.

Reconhecimento de Data mining em Todos os

Aplicativos

Como você viu nesse white paper até aqui, o SQL Server 2008 fornece uma solução de data mining abrangente e a integração estreita com a plataforma Microsoft Business Intelligence facilita fornecer análise preditiva em toda a empresa. Contudo, pode haver ocasiões em que as organizações precisem incorporar a funcionalidade de data mining em um aplicativo, para introduzir informações em um processo de negócios existente ou para estender tecnologias de data mining para atender a um problema específico. Para esse fim, o SQL Server oferece uma plataforma de programação flexível e

extensível para incorporar diretamente previsão e percepção a aplicativos empresariais.

Programação Preditiva

O recurso de data mining do SQL Server 2008 suporta várias APIs (application

programming interfaces) que os desenvolvedores podem usar para construir soluções personalizadas que aproveitam os recursos de análise preditiva do SQL Server. DMX, XMLA, OLEDB e ADOMD.NET e AMO (Analysis Management Objects) oferecem uma

(20)

plataforma avançada e totalmente documentada, capacitando desenvolvedores a construir aplicações compatíveis com data mining e a fornecer descoberta em tempo real e recomendação através de ferramentas familiares.

Essa extensibilidade cria uma oportunidade para organizações empresariais e ISVs (independent software vendors - fornecedores independentes de software)

incorporarem análise preditiva em aplicativos empresariais, introduzindo percepção e previsões que informam decisões e processos de negócios. Por exemplo, a Analytics Foundation adiciona classificação preditiva ao Microsoft Dynamics® CRM, para permitir a profissionais da informação em organizações de vendas, marketing e serviços

identificar oportunidades alcançáveis que têm maior probabilidade de levar a uma venda, aumentando a eficiência e melhorando a produtividade (para mais informações, consulte http://www.microsoft.com/dynamics/crm/product/analyticsfoundation.mspx).

Algoritmos de Plug-In e Visualizações

Personalizadas

O conjunto de ferramentas de data mining do SQL Server é totalmente extensível através de procedimentos armazenados em Microsoft .NET, algoritmos de plug-in, visualizações personalizadas e PMML. Isso permite aos desenvolvedores estender as tecnologias de data mining prontas do SQL Server 2008 para atender a necessidades de negócios incomuns que são específicas da organização:

 Criando algoritmos de data mining para solucionar problemas analíticos específicos da empresa.

 Usando algoritmos de data mining de outros fornecedores de software.

 Criando visualizações personalizadas de modelos de data mining através de APIs de visualizador de plug-in.

Conclusão

Neste white paper, você viu como o SQL Server 2008 Analysis Services fornece uma plataforma de data mining completa que as organizações podem usar para infundir percepção e previsão em decisões de negócios cotidianas. A distribuição difundida através dos Suplementos de Data mining para o 2007 Office System proporciona recursos de análise preditiva com ferramentas intuitivas e resultados claros que ficam disponíveis nas estações de trabalho por toda a empresa. O ambiente de

desenvolvimento abrangente e a gama extensível de algoritmos de data mining

abrangentes combinados com a escalabilidade e gerenciamento de nível corporativo do SQL Server Analysis Services torna o SQL Server 2008 uma forma ideal para levar os benefícios da análise preditiva à sua empresa.

Os recursos de análise preditiva do SQL Server 2008, sendo parte da plataforma de BI Microsoft, são estreitamente integrados em cada fase do ciclo de vida dos dados, possibilitando incorporar informações em relatórios, integração de dados, análise de OLAP e monitoramento de desempenho de negócios. Essa integração ampla da análise preditiva no ecossistema da organização ajuda a produzir maior agilidade de negócios e cria uma vantagem competitiva tangível.

Embora a funcionalidade de data mining fornecida com o SQL Server 2008 seja abrangente o suficiente para atender às necessidades de uma grande variedade de cenários empresariais, sua extensibilidade assegura que possa ser usada para solucionar praticamente qualquer problema preditivo. A capacidade de estender as

(21)

Análise Preditiva com o SQL Server 2008 17

tecnologias de data mining do SQL Server através de algoritmos e visualizações

personalizados, aliada à capacidade de incorporar funcionalidade preditiva a aplicativos empresariais torna o SQL Server 2008 uma poderosa plataforma para introduzir a análise preditiva em processos de negócios existentes para somar percepção e recomendações a operações do dia a dia.

Para mais informações, visite: http://www.microsoft.com/brasil/sql

Este white paper foi útil? Envie-nos seus comentários. Informe, em uma escala de 1 (insatisfatório) a 5 (excelente), como você classificaria este white paper e por que você usou essa classificação. Por exemplo:

 Você deu uma nota alta porque ele tem bons exemplos, capturas de tela excelentes, uma redação clara ou outra razão?

 Você deu uma nota baixa devido aos exemplos insatisfatórios, às capturas de tela difusas ou à redação confusa?

Esses comentários nos ajudarão a melhorar a qualidade dos white papers que lançamos.

Referências

Documentos relacionados

Além deste fato, foi observado que o teor de carbono orgânico para os solos da região Amazônica, na camada de 0-10 cm (Figura 3a), é maior do que no cerrado, para a faixa de teor

O SSAS (SQL Server 2008 Analysis Services) melhora muito a velocidade de consultas com os novos recursos de computação em bloco, write-back e desempenho de banco de

ETL (Extração, Carga e Transformação dos Dados Front-end (acesso do usuário) Query/Relatórios Análise OLAP Análise estatísticas Previsões Data Mining BSC

(C) A agroindústria do açaí de Codajás não servirá de modelo ainda que os pequenos produtores e trabalhadores da lavoura do açaí recebam pagamento injusto.. (D) A agroindústria

cálculo dessa remuneração corresponderá ao pagamento do valor de mais 01 (um) descanso semanal remunerado. É vedada a transformação dos pagamentos em concessão de folgas, tanto

9.1 - A não comunicação do evento no prazo de 90 dias, por culpa exclusiva das empresas, implicará para a empresa na obrigação do reembolso à gestora ou ao sindicato

Aos empregados afastados do serviço por motivo de doença ou acidente do trabalho, a EMPRESA concederá, por um período de até 180 (cento e oitenta) dias, a complementação de

PARAÍBA – SAAE VALE, entidade de 1º grau, representativa da categoria profissional “AUXILIARES DE ADMINISTRAÇÃO ESCOLAR (EMPREGADOS EM ESTABELECIMENTOS DE ENSINO)”,