• Nenhum resultado encontrado

BIG DATA Armazenamento e Gerenciamento de grandes volumes de dados

N/A
N/A
Protected

Academic year: 2021

Share "BIG DATA Armazenamento e Gerenciamento de grandes volumes de dados"

Copied!
22
0
0

Texto

(1)

BIG DATA

Carlos Marques

Business Development Manager, Data Connectivity and Integration

Latin America & Caribbean Market (CALA)

(2)

O que veremos hoje?

O que é o Big Data?

A revolução dos dados.

Tipos de estrutura dos dados.

Tendências de investimento em bancos de dados para os próximos anos.

De que forma o Big Data pode ajudar sua empresa?

Principais passos para implementar um projeto de Big Data.

(3)

Definição de Big Data

“Big Data são dados cuja escala, distribuição, diversidade e/ou velocidade de criação requer o

uso de novas tecnologias de armazenamento e análise para permitir a captura do valor inserido

(4)

O que acontece na internet em 1 minuto?

(5)

A revolução dos dados

FONTE: Viktor Mayer-Schönberger and Kenneth Cukier: Big Data: A Revolution that will Transform how We Live, Work and Think)

Ano

Dados “físicos”

Dados Digitais

2000

75%

25%

2007

7%

93%

2013

2%

98%

2015

~0,1%

~99,9%

(6)

Uma nova era de crescimento massivo no volume de dados

Crescimento de 10x no volume de dados

produzidos por ano

32B IoT Devices (estarão conectados a

internet)

40% dos dados serão acessados por

Cloud

85% de novos tipos de dados (não

estruturados)

(7)

Estrutura de Dados: O crescimento dos dados não estruturados

Estruturados

Semi-estruturados

“Quase” estruturados

Não estruturados

A

ume

n

to

da

E

s

tr

utur

a

ç

ã

o

80 a 90% dos dados

Dados de um tipo, formato ou estrutura definidos

Ex. Dados transacionais e OLAP

Dados de texto com uma padronização evidente permitindo a separação

Ex. Arquivos XML, EDI, E-mails

Dados de texto com formatos variáveis, os quais podem ser formatados através

de força bruta, ferramental e tempo

Ex. Dados de clickstream, padrões de utilizações das páginas web pelos

usuários.

Dados sem estrutura definida e que são armazenados em diferentes formatos

de arquivo.

Ex. Documentos de texto, PDFs, imagens, áudios, vídeos.

(8)

Pesquisa global sobre uso de base de dados e planos para os

próximos 2 anos

—Big Data

Fonte:

https://www.progress.com/docs/default-source/default-document-library/Progress/Documents/Papers/2015-data-connectivity-outlook.pdf

“Análise de Big Data representa um grande desafio para organizações de TI — mesmo assim, um estudo da Intel feito com 200 gerentes de TI mostra que 84 por cento já analisam dados não estruturados e que 44 por cento daqueles que ainda não o fazem esperam poder fazê-lo

(9)

Projeção de crescimento por tipo de Banco de Dados

+27%

Crescimento

-5%

+35%

Fonte:

(10)

Clientes

Pedidos

Prospects

Funcionários

(11)
(12)

Os 5 Vs do Big Data

Volume

Crescimento

constante das

informações

geradas.

Terabytes

para

Exabytes

Velocidade

Tempo real,

posts em

Redes

sociais,

streaming de

videos.

Variedade

Fontes

diversas,

dados

estruturados

+ não

estruturados.

Veracidade

Ter certeza

de que os

dados são

autênticos e

fazem

sentido.

Valor

Trazer

benefícios

significativos,

gerar retorno.

(13)

De que forma o Big Data pode ajudar sua empresa?

1.

Acesso mais rápido a suas próprias informações.

2.

Correlação de informações externas e internas.

3.

Mapear comportamento dos seus clientes para se antecipar as suas necessidades.

4.

Economia significativa de tempo e dinheiro, através da prevenção de perdas, controle de

contas e aumento da produtividade.

5.

Segurança: prevenção de crimes, detecção de fraudes, infrações de segurança,

ameaças avançadas e ameaças internas.

(14)

Dicas básicas para implementar Big Data

Não comece pelos dados. As análises e os insights determinarão como o seu projeto

deve começar!

Defina os objetivos. O que sua empresa busca responder com o uso de dados?

Defina quais dados são fundamentais para resolver seu problema. Não se trata de

quantidade, a questão é a real utilidade.

Mais do que a tecnologia, o que é essencial em um projeto de Big Data são as pessoas

que fazem as análises, que criam os modelos e os algoritmos, compondo a verdadeira

ciência de dados.

(15)

Passos essenciais para implementar Big Data

Definição dos Passos

Descrição

Tipo de Análise Tempo real, análise posterior ou mistura dos dois. Isto pode determinar decisões sobre produtos, ferramenta, hardware, fontes de dados e a frequência estimada dos dados. Ex. Fraude (tempo real), Tendência (análise posterior)

Metodologia de Processamento Preditiva, analítica, consulta ad hoc e relatórios. A escolha de metodologia de processamento ajuda a identificar as ferramentas e técnicas apropriadas para uso na solução de big data.

Frequência e tamanho dos dados Volume estimado de dados e a frequência com que chegam. Frequência e tamanho de dados dependem das fontes (Sob demanda, Feed Contínuo ou Série Temporal).

Tipos de Dados Tipo dos dados a serem processados — transacionais, históricos, principais e outros. Saber o tipo de dados ajuda a segregar os dados no armazenamento.

Formato de conteúdo Estruturados, não estruturados ou semiestruturados. O formato determina como os dados recebidos precisam ser processados e é essencial para escolher ferramentas e técnicas e definir uma solução de uma perspectiva de negócios. Fonte de dados web e mídia social, gerados por máquina, gerados por humanos, etc

Consumidores de dados Processos de negócios, Usuários corporativos, Aplicativos corporativos, Pessoas individuais em várias funções de negócios, Parte dos fluxos do processo, Outros repositórios de dados ou aplicativos corporativos.

Hardware O tipo de hardware no qual a solução de big data será implementada. Entender as limitações do hardware ajuda na escolha da solução big data.

(16)

Como transformar dados em informações relevantes

para o negócio

Dados

Informações

Insight

Decisão

Do recebimento dos dados

até a tomada de decisão:

(17)
(18)

Exemplos de como solucionar problemas de negócios por vertical

Exemplos de problemas de Negócio

por Vertical Tipo de Big Data Descrição

Serviços públicos:

Prever o consumo de energia Dados gerados por máquina

Uma solução de big data pode analisar dados de geração de energia (fornecimento) e de consumo de energia (demanda) usando medidores inteligentes.

Telecomunicações:

Analítica de perda de clientes

Dados da web e sociais Dados de transação

Provedores de telecomunicações que implementam uma estratégia de analítica preditiva podem gerenciar e prever a perda analisando os padrões de chamada dos assinantes.

Marketing:

Análise de sentimento Dados da web e sociais

O sentimento do cliente deve ser integrado aos dados de perfil do cliente para derivar resultados significativos. O feedback do cliente pode variar de acordo com seus aspectos demográficos.

Atendimento ao cliente:

Monitoramento de chamada Gerado por humanos

Departamentos de TI estão usando soluções de big data para analisar logs de aplicativo e obter insight que possa melhorar o desempenho do sistema.

Varejo:

Sistema de mensagens personalizado com base em reconhecimento facial e mídia social

Dados da web e sociais Biométrica

Varejistas podem usar tecnologia de reconhecimento facial combinada a uma foto da mídia social para fazer ofertas personalizadas a clientes com base no comportamento de compra e na localização.

Varejo e marketing:

Dados de dispositivos móveis e direcionamento com base em localização

Dados gerados por máquina Dados de transação

Varejistas podem atingir seu público-alvo com promoções específicas e cupons com base em dados de localização. As soluções são geralmente projetadas para detectar a localização de um usuário ao entrar em uma loja ou através de um GPS.

Serviços Financeiros / Saúde:

Detecção de fraude

Dados gerados por máquina Dados de transação

Gerados por humano

A capacidade de gerenciamento de fraudes prevê a probabilidade de fraude em uma dada transação ou conta do cliente. Soluções analisam transações em tempo real e geram recomendações para ação imediata, o que é essencial para impedir fraudes de terceiros, fraudes pela própria pessoa e mau uso deliberado de privilégios de conta.

(19)

Como Progress DataDirect pode suportar uma estrutura

com Hadoop

Um único driver que possibilita conectar todas as

plataformas as todas as distribuições do Hadoop.

Atende as demandas de baixa latência, queries

real-time e análises com alta performance, uso eficiente de

CPU e memória.

Está pronto para trabalhar com as principais

ferramentas de BI e analytics, como Tableau, QlikView e

SAP Crystal Reports.

Disponibiliza altos padrões de segurança como

autenticação de usuário, suporte para Hive Kerberos,

SSl e criptografia.

Suporte total a Hive2 com alta escalabilidade.

Minimize riscos e proteja suas aplicações críticas com

nosso Suporte 24x7.

(20)

O que vimos hoje

1.

Vivemos a era do crescimento massivo de dados digitais.

2.

Cloud + Mobile + IoT impulsionarão o Big Data nos próximos anos.

3.

A maior parte dos dados gerados atualmente não são estruturados.

4.

Pesquisas indicam que para os próximos dois anos, os investimentos serão maiores em

soluções para dados não estruturados e Big Data.

5.

Big Data pode ajudar sua empresa no processo de tomada de decisões.

6.

Atenção aos passos de definição antes de implementar seu projeto de Big Data.

7.

Aprenda com os modelos já implementados, benchmarking sempre pode ajudar!

8.

A Progress pode te ajudar em seu projeto de Big Data! Fale com a gente! 

(21)

Para mais informações

Progress|DataDirect Website:

https://www.progress.com/datadirect-connectors

Soluções de conectividade para Big Data:

https://www.progress.com/data-sources/big-data

Webinar sobre como a Progress pode ajudar em sua estratégia para Big Data:

http://forms.progress.com/forms/wbr-DeRiskBigData

Documentações das nossas soluções:

https://www.progress.com/resources/documentation

Registre-se em nosso Community Group de DataDirect:

https://community.progress.com/community_groups/datadirect_connect

Vamos marcar uma reunião para falar sobre o seu projeto de Big Data?

Carlos Marques | +55 11 95559-1769 |

cmarques@progress.com

(22)

Referências

Documentos relacionados

Como o período de ventos mais intensos está relacionado aos eventos de estiagem, é no segundo semestre que a dinâmica morfológica interfere diretamente na dinâmica de uso e

Cartão TAS emitido posteriormente pelo INEM (formando aprovado) Manual de apoio (em suporte digital -

Atualmente algumas instituições financeiras brasileiras como o Banco do Brasil, Itaú e Bradesco já utilizam o Big Data como uma solução, com a finalidade de organizar todos

Na presente formulação cada barra PQ contribui com duas equações (desvios de potência ativa e reativa, entre o valor calculado a partir do estado da rede e o

Maria José Salgadinho é licenciada em Serviço Social pelo ISSS Porto; Coordenadora da Unidade Funcional de Serviço Social do Hospital Magalhães Lemos; Assistente Social desde 1986

consentimento das entidades convenentes, as empresas recolherão a título de contribuição social, até o dia 10 (dez) de cada mês, o valor de R$ 8,46 (oito reais e quarenta

as questões privadas nem as concorrenciais decorrentes da utilização dos dados; (iii) tudo leva a crer que as chamadas data-driven online industries estão sujeitas a

Industrial Internet Serviços Parcela de serviços realizados digitalmente em relação ao total de serviços Parcela do componente digital dos fluxos globais de bens, dados