• Nenhum resultado encontrado

Tcc - Big Data e a Sua Aplicabilidade Em Instituições Financeira

N/A
N/A
Protected

Academic year: 2021

Share "Tcc - Big Data e a Sua Aplicabilidade Em Instituições Financeira"

Copied!
30
0
0

Texto

(1)

B I G D A T A

B I G D A T A E A SUA APLICABILIDADE EM INSTITUIÇÕES FINANCEIRAS E A SUA APLICABILIDADE EM INSTITUIÇÕES FINANCEIRAS

Nome do orientador: Haroldo Luiz dos Santos Nome do orientador: Haroldo Luiz dos Santos Nome do acadêmico: Patrícia de Fátima e

Nome do acadêmico: Patrícia de Fátima e AlmeidaAlmeida

RESUMO RESUMO

Este trabalho apresenta informações sobre o conceito

Este trabalho apresenta informações sobre o conceito big databig data  e a sua  e a sua aplicabilidade em instituições financeiras que buscam evoluir na mesma aplicabilidade em instituições financeiras que buscam evoluir na mesma velocidade das mudanças comportamentais dos clientes para manterem sua velocidade das mudanças comportamentais dos clientes para manterem sua relevância no mercado.

relevância no mercado. PALAVRAS CHAVE

PALAVRAS CHAVE: BIG DATA, : BIG DATA, HADOOP, NOSQL, INTERNET DAS COISAS,HADOOP, NOSQL, INTERNET DAS COISAS,  ANALYTICS.

 ANALYTICS.

A B S T R A C T A B S T R A C T

This paper presents information about the Big Data concept and its applicability This paper presents information about the Big Data concept and its applicability to financial institutions seeking to evolve at the same rate

to financial institutions seeking to evolve at the same rate of behavioral changesof behavioral changes of customers to maintain their relevance in the market.

of customers to maintain their relevance in the market.

K E Y W O R D S :

K E Y W O R D S : BIG DATA, HADOOP, NOSQL, INTERNET OF THINGS,BIG DATA, HADOOP, NOSQL, INTERNET OF THINGS,

 ANALYTICS.  ANALYTICS.

(2)

INTRODUÇÃO INTRODUÇÃO Big data

Big data  é um conceito que utiliza um conjunto de ferramentas capazes de  é um conceito que utiliza um conjunto de ferramentas capazes de capturar, armazenar e analisar em tempo hábil um enorme volume de dados capturar, armazenar e analisar em tempo hábil um enorme volume de dados estruturados e não estruturados, transformando-os em informações úteis que estruturados e não estruturados, transformando-os em informações úteis que podem ajudar as organizações a operar de forma mais eficiente e rentável. podem ajudar as organizações a operar de forma mais eficiente e rentável. Diariamente volumes enormes de dados são gerados no mundo através de Diariamente volumes enormes de dados são gerados no mundo através de transações bancárias, e-mails, logs, sensores, redes sociais, sistemas ERP transações bancárias, e-mails, logs, sensores, redes sociais, sistemas ERP ((Enterprise Resource Planning Enterprise Resource Planning ) entre outros. Se as empresas souberem como) entre outros. Se as empresas souberem como utilizar esses dados poderão saber o que precisa ser feito para melhorar e utilizar esses dados poderão saber o que precisa ser feito para melhorar e personalizar os seus produtos e serviços, entender melhor o seu cliente, personalizar os seus produtos e serviços, entender melhor o seu cliente, desenvolver campanhas de marketing direcionadas, disponibilizar serviços desenvolver campanhas de marketing direcionadas, disponibilizar serviços parapara clientes especiais, escolher os melhores talentos para a sua empresa, melhorar clientes especiais, escolher os melhores talentos para a sua empresa, melhorar a segurança digital e assim por diante.

a segurança digital e assim por diante.

Grande parte destas informações são disponibilizadas atualmente pelas Grande parte destas informações são disponibilizadas atualmente pelas gerações Y e Z que

gerações Y e Z que nasceram em uma época de grandes avanços tecnológicos.nasceram em uma época de grandes avanços tecnológicos. Estas gerações são compostas por pessoas acostumadas a criar, consumir e Estas gerações são compostas por pessoas acostumadas a criar, consumir e divulgar conteúdos e que pela quantidade de acessos às informações são divulgar conteúdos e que pela quantidade de acessos às informações são consumidores extremamente exigentes.

consumidores extremamente exigentes.

Esta ‘explosão de dados’ será ainda maior com a Internet das

Esta ‘explosão de dados’ será ainda maior com a Internet das Coisas (rede deCoisas (rede de dispositivos conectados que se comunicam entre si),

dispositivos conectados que se comunicam entre si), quando vários dispositivosquando vários dispositivos das nossas casas tais como T

das nossas casas tais como TVs, lavadoras de roupa, cafeteiras, Vs, lavadoras de roupa, cafeteiras, computadorescomputadores e smartphones estiverem conectados à internet e gerando dados.

e smartphones estiverem conectados à internet e gerando dados. Inicialmente a IBM definiu que uma solução

Inicialmente a IBM definiu que uma solução big databig data  se baseava em 3 Vs:  se baseava em 3 Vs: Volume (quantidade de dados que crescem exponencialmente), Velocidade Volume (quantidade de dados que crescem exponencialmente), Velocidade (obtenção, gravação e transformação dos dados em tempo hábil ou até mesmo (obtenção, gravação e transformação dos dados em tempo hábil ou até mesmo em tempo real) e Variedade (formato estruturado ou não). Veracidade (qualidade em tempo real) e Variedade (formato estruturado ou não). Veracidade (qualidade dos dados) e Valor (agregação de valor que compense o investimento) surgiram dos dados) e Valor (agregação de valor que compense o investimento) surgiram posteriormente.

posteriormente.  Antes as empresas

 Antes as empresas já trabalhavam cojá trabalhavam com soluções dem soluções de Business IntelligenceBusiness Intelligence,, DataData Mining 

(3)

data

data  aparece neste cenário agregando volume de dados, inteligência às  aparece neste cenário agregando volume de dados, inteligência às soluções e utilizando-se de análise preditiva para antecipar possíveis soluções e utilizando-se de análise preditiva para antecipar possíveis comportamentos, permitindo assim a geração de insights poderosos com os comportamentos, permitindo assim a geração de insights poderosos com os quais as empresas podem obter vantagens de negócio.

quais as empresas podem obter vantagens de negócio.  A previsão é que as marcas q

 A previsão é que as marcas que se prepararem melhor para obteue se prepararem melhor para obter inteligência ar inteligência a partir das informações geradas pelos consumidores nesse novo ambiente, partir das informações geradas pelos consumidores nesse novo ambiente, estarão na dianteira dessa nova era e

estarão na dianteira dessa nova era e serão as empresas do futuro.serão as empresas do futuro.

Como usuárias deste poderoso conceito surgem as instituições financeiras que Como usuárias deste poderoso conceito surgem as instituições financeiras que enfrentam o desafio de alcançar o seu espaço neste universo online o quanto enfrentam o desafio de alcançar o seu espaço neste universo online o quanto antes já que inovações como bancos totalmente digitais, Google Wallet e antes já que inovações como bancos totalmente digitais, Google Wallet e Square, iZettle e Alipay estão penetrando no território bancário, apresentando Square, iZettle e Alipay estão penetrando no território bancário, apresentando um novo desafio

um novo desafio competitivo.competitivo.

Segundo a Accenture, até 2020 mais de 30%

Segundo a Accenture, até 2020 mais de 30% das receitas bancárias estarão emdas receitas bancárias estarão em risco para esses novos competidores e tendências e que 40% dos clientes risco para esses novos competidores e tendências e que 40% dos clientes gostariam que empresas como Apple e Amazon oferecessem serviços gostariam que empresas como Apple e Amazon oferecessem serviços financeiros.

(4)

PROBLEMA DE PESQUISA PROBLEMA DE PESQUISA Como o

Como o big databig data  pode ajudar as instituições financeiras a se destacarem no  pode ajudar as instituições financeiras a se destacarem no mercado e a não sucumbirem

mercado e a não sucumbirem diante dos novos concorrentes?diante dos novos concorrentes?

OBJETIVO PRINCIPAL OBJETIVO PRINCIPAL

Identificar as aplicabilidades do conceito

Identificar as aplicabilidades do conceito big databig data nas Instituições Financeiras nas Instituições Financeiras com objetivo de torná-las ainda mais

com objetivo de torná-las ainda mais competitivas.competitivas.

OBJETIVOS ESPECÍFICOS OBJETIVOS ESPECÍFICOS

- Compreender o conceito Big Data, seus benefícios, aplicabilidades e as - Compreender o conceito Big Data, seus benefícios, aplicabilidades e as questões de ética e de privacidade que o

questões de ética e de privacidade que o envolvem;envolvem;

- Descrever de forma sucinta a infraestrutura e tecnologia necessárias para - Descrever de forma sucinta a infraestrutura e tecnologia necessárias para utilização do conceito Big Data, as

utilização do conceito Big Data, as formas de geração, captura, armazenamento,formas de geração, captura, armazenamento, processamento e análise dos dados e identificar quem

processamento e análise dos dados e identificar quem são os consumidores dossão os consumidores dos dados e informações geradas;

dados e informações geradas; - Identificar como o

- Identificar como o big databig data pode ajudar as Instituições Financeiras na tomada pode ajudar as Instituições Financeiras na tomada de decisões estratégicas, na geração de informações gerenciais para fins de decisões estratégicas, na geração de informações gerenciais para fins regulatórios e na redução de perdas com operações fraudulentas.

(5)

REFERENCIAL TEÓRICO REFERENCIAL TEÓRICO

B I G D A T A

B I G D A T A – – Um pouco de história Um pouco de história

 Atualmente temos várias

 Atualmente temos várias suposições sobre o nascimento do suposições sobre o nascimento do conceitoconceito Big DataBig Data.. Seguem abaixo alguns deles:

Seguem abaixo alguns deles:

““ A história  A história de como de como os dados os dados se tornaram se tornaram grandes começa muitos grandes começa muitos anosanos antes da atual febre em torno do conceito

antes da atual febre em torno do conceito big databig data. Há 70 anos atrás,. Há 70 anos atrás, encontramos as primeiras tentativas de quantificar a taxa de crescimento encontramos as primeiras tentativas de quantificar a taxa de crescimento do volume de dados ou o que popularmente é conhecida

do volume de dados ou o que popularmente é conhecida como acomo a ‘‘explosãoexplosão da informação

da informação’”’”. (Gil Press da. (Gil Press da Forbes MagazineForbes Magazine, 2013)., 2013).

““O termoO termo big databig data nasceu no início da década de 1990, na NASA, para nasceu no início da década de 1990, na NASA, para descrever grandes conjuntos de dados complexos que desafiam os

descrever grandes conjuntos de dados complexos que desafiam os limiteslimites computacionais tradicionais de captura, processamento, análise e computacionais tradicionais de captura, processamento, análise e armazenamento informacional.

armazenamento informacional.”” (Rodrigo Arrigoni, 2013). (Rodrigo Arrigoni, 2013).

““O conceitoO conceito big databig data  começou a ser discutido a cerca de 70 anos, a  começou a ser discutido a cerca de 70 anos, a produção escrita da humanidade crescia a

produção escrita da humanidade crescia a taxas exponenciais e o acessotaxas exponenciais e o acesso à informação enfrentava grandes desafios devido ao seu volume. Essa à informação enfrentava grandes desafios devido ao seu volume. Essa discussão restringia-se ao universo da filosofia, já que a tecnologia da discussão restringia-se ao universo da filosofia, já que a tecnologia da informação ainda estava em etapa embrionária

informação ainda estava em etapa embrionária.”.”(Marcos Vieira, 2014).(Marcos Vieira, 2014). ““O termoO termobig databig data é relativamente novo e  é relativamente novo e ao mesmo tempo velho, surgindoao mesmo tempo velho, surgindo por volta de 2005

por volta de 2005 com o Google e recebeu uma alavancada em 2008 comcom o Google e recebeu uma alavancada em 2008 com o pessoal do Yahoo que transformou a plataforma

o pessoal do Yahoo que transformou a plataforma HadoopHadoop emem OpenOpen Source

Source..”” (Alexandre Tarifa e Diego Nogare, 2015). (Alexandre Tarifa e Diego Nogare, 2015).

“B

“Big dataig data é um nome relativamente recente (ou, ao menos, começou a é um nome relativamente recente (ou, ao menos, começou a aparecer na mídia recentemente) [...] Há tempos que departamentos de aparecer na mídia recentemente) [...] Há tempos que departamentos de TI contemplam aplicações de

TI contemplam aplicações de Data Data Mining Mining ,, BusinessBusiness Intelligence

(6)

para tratar justamente de análise de dados, tomadas de decisões e outros para tratar justamente de análise de dados, tomadas de decisões e outros aspectos relacionados ao negócio.

aspectos relacionados ao negócio.”” (Emerson Alecrim, 2015). (Emerson Alecrim, 2015).

B I G D A T A

B I G D A T A – – Um conceito Um conceito

 Abaixo conceitos de

 Abaixo conceitos de big databig data segundo alguns autores: segundo alguns autores:

“ 

“ Big dataBig data  é um termo utilizado para descrever o conjunto de soluções  é um termo utilizado para descrever o conjunto de soluções tecnológicas ou uma ciência feita a partir das megabases de dados tecnológicas ou uma ciência feita a partir das megabases de dados disponíveis na internet, que analisam e dão sentido a essas informações. disponíveis na internet, que analisam e dão sentido a essas informações.”” (Carolina Cunha, 2015).

(Carolina Cunha, 2015).

““Um conceito criado pelo mercado relacionando novas arquiteturasUm conceito criado pelo mercado relacionando novas arquiteturas tecnológicas à capacidade de analisar qualquer volume e variedade de tecnológicas à capacidade de analisar qualquer volume e variedade de informações em uma velocidade próxima ao tempo real, abrindo novas informações em uma velocidade próxima ao tempo real, abrindo novas possibilidades a nível de negócio.

possibilidades a nível de negócio.”” (Jefferson Stela). (Jefferson Stela).

““Podemos definir o conceito dePodemos definir o conceito de big databig data como sendo conjuntos de dados como sendo conjuntos de dados extremamente amplos e que, por este motivo,

extremamente amplos e que, por este motivo, necessitam de ferramentasnecessitam de ferramentas especialmente preparadas para lidar com grandes volumes, de

especialmente preparadas para lidar com grandes volumes, de forma queforma que toda e qualquer informação nestes meios possa ser

toda e qualquer informação nestes meios possa ser encontrada, analisadaencontrada, analisada e aproveitada em tempo hábil.

e aproveitada em tempo hábil.”” (Emerson Alecrim, 2015). (Emerson Alecrim, 2015).

““É a ponta doÉ a ponta do iceberg iceberg  de uma tendência maior que a gente esta vivendo de uma tendência maior que a gente esta vivendo na sociedade hoje. É a tendência de

na sociedade hoje. É a tendência de automação do processo de produçãoautomação do processo de produção de bens de informação... desde os dados brutos até os resultados das de bens de informação... desde os dados brutos até os resultados das análise [...]

análise [...] Big dataBig data é um pedacinho deste contexto. é um pedacinho deste contexto.”” (Thoran) (Thoran)

B I G D A T A

(7)

Em 2001, Doug Laney

Em 2001, Doug Laney (analista da(analista da Gartner Gartner ) baseou a definição do termo) baseou a definição do termo big databig data em três Vs: Volume,

em três Vs: Volume, Velocidade e Variedade.Velocidade e Variedade. Cézar Taurion definiu big data

Cézar Taurion definiu big data inicialmente como sendo a soma inicialmente como sendo a soma destes mesmosdestes mesmos 33‘‘VsVs’’. Posteriormente acrescentou os. Posteriormente acrescentou os ‘‘VVs’ veracidade e valor e ressaltou que ass’ veracidade e valor e ressaltou que as oportunidades que esses 5 ‘Vs’ trazem não podem ser desperdiças.

oportunidades que esses 5 ‘Vs’ trazem não podem ser desperdiças.

O Sebrae Nacional define os

O Sebrae Nacional define os 5 ‘Vs’5 ‘Vs’ conforme abaixo:conforme abaixo: Volume

Volume – – São informações medidas em São informações medidas em ZetabytesZetabytes que são  que são compostas porcompostas por e-mails, mensagens, vídeos, fotos, imagens e comentários que circulam e-mails, mensagens, vídeos, fotos, imagens e comentários que circulam na rede.

na rede. Variedade

Variedade – – São dados estruturado e não estruturados que por  São dados estruturado e não estruturados que por não teremnão terem padrão exigem um maior esforço na análise.

padrão exigem um maior esforço na análise. Velocidade

Velocidade  – –  É a possibilidade de obter dados sobre determinado  É a possibilidade de obter dados sobre determinado fenômeno em tempo real diminuindo o tempo entre a obtenção da fenômeno em tempo real diminuindo o tempo entre a obtenção da informação e a tomada de decisão.

informação e a tomada de decisão. Veracidade

Veracidade – – São dados fidedignos porque  São dados fidedignos porque representam interações reaisrepresentam interações reais em redes sociais ou rastros de

em redes sociais ou rastros de navegação.navegação. Valor

Valor – – As informações devem gerar valor para  As informações devem gerar valor para o negócio.o negócio.

B I G D A T A

B I G D A T A – – Diferenças para o CRM e BI Diferenças para o CRM e BI

Em 2014, Edson Cardoso diferenciou o

Em 2014, Edson Cardoso diferenciou o conceitoconceito big databig data do BI e CRM de forma do BI e CRM de forma brilhante.

brilhante.

Para ele, CRM é uma ferramenta para análise de comportamento e Para ele, CRM é uma ferramenta para análise de comportamento e relacionamento com os clientes com a

(8)

que permite conhecer o perfil do público atendido, separado por critérios como que permite conhecer o perfil do público atendido, separado por critérios como regiões de atuação, ramo de vendas e horários de

regiões de atuação, ramo de vendas e horários de frequência e compras.frequência e compras. O Big Data é mais

O Big Data é mais abrangente porque engloba ferramentas que permite interagirabrangente porque engloba ferramentas que permite interagir e coletar dados de diversas fontes tais como: bancos de dados internos, e coletar dados de diversas fontes tais como: bancos de dados internos, sistemas ERP, redes sociais e até mesmo do CRM.

sistemas ERP, redes sociais e até mesmo do CRM.

O BI normalmente entrega análise de informações passadas que são extraídas O BI normalmente entrega análise de informações passadas que são extraídas das bases locais e analisadas e entregues em

das bases locais e analisadas e entregues em dashboards.dashboards. Já oJá o big databig data interpreta cenários e faz projeções antecipando possíveis acontecimentos interpreta cenários e faz projeções antecipando possíveis acontecimentos tornando a vida corporativa mais fácil.

tornando a vida corporativa mais fácil.

Todas as soluções que possuem os 5 V’s po

Todas as soluções que possuem os 5 V’s podem ser dem ser consideradasconsideradas big databig data..

B I G D A T A

B I G D A T A – – Geração de  Geração de conteúdoconteúdo

 As f

 As fontes de ontes de geração de geração de conteúdo que conteúdo que impulsiona e impulsiona e serve como serve como base para base para osos resultados do conceito big data são diversas. Em

resultados do conceito big data são diversas. Em 2014, a IBM definiu que 2014, a IBM definiu que estasestas fontes podem vir de todos os canais e podem ser internos e externos às fontes podem vir de todos os canais e podem ser internos e externos às empresas.

empresas.

Segundo a IBM (2013), 90% das informações disponíveis no mundo foram Segundo a IBM (2013), 90% das informações disponíveis no mundo foram geradas entre 2010 e 2012 e

geradas entre 2010 e 2012 e dobrará até o final dobrará até o final de 2015 com uma geração diáriade 2015 com uma geração diária 2,5 exabytes de conteúdo. Esta quantidade de dados é tão grande que a única 2,5 exabytes de conteúdo. Esta quantidade de dados é tão grande que a única maneira de aproveitá-la é

maneira de aproveitá-la é utilizando automação máquina a máquina ou consultautilizando automação máquina a máquina ou consulta inteligente de

inteligente de big databig data..

Cézar Taurion afirmou em 2012 que o volume de dados do planeta dobra

Cézar Taurion afirmou em 2012 que o volume de dados do planeta dobra

a cada 18 meses e

a cada 18 meses e que a geração diária chega a

que a geração diária chega a

 petabytes petabytes

 de dados. Ele

 de dados. Ele

ressaltou também o ‘V’ variedade ao escrever que estes dados são

ressaltou também o ‘V’ variedade ao escrever que estes dados sãogeradosgerados

a partir de sistemas estruturados e não estruturados tais como:

a partir de sistemas estruturados e não estruturados tais como: emailsemails, mídias, mídias sociais (

(9)

apresentações estilo

apresentações estilo Powerpoint Powerpoint , mensagens instantâneas, sensores, etiquetas, mensagens instantâneas, sensores, etiquetas RFID e câmeras de vídeo.

RFID e câmeras de vídeo. Em seu site, a

Em seu site, a Hekima (2015) descreve que tudo é matéria prima para oHekima (2015) descreve que tudo é matéria prima para o big databig data.. Segundo ela, as empresas podem utilizar desde banco de dados de call center Segundo ela, as empresas podem utilizar desde banco de dados de call center até conteúdo de planilhas financeiras e contábeis para conhecerem melhor os até conteúdo de planilhas financeiras e contábeis para conhecerem melhor os seus clientes e concorrentes e preverem tendências.

seus clientes e concorrentes e preverem tendências.

Carolina cunha (2015) atribui a grande geração de informação atual à utilização Carolina cunha (2015) atribui a grande geração de informação atual à utilização de aplicativos de celular e tablet, GPS e câmeras, à interação em canais digitais de aplicativos de celular e tablet, GPS e câmeras, à interação em canais digitais tais como sites e redes sociais além da geração de dados pelos sensores e tais como sites e redes sociais além da geração de dados pelos sensores e equipamentos médicos. Ela ainda afirma que um dos impulsionadores do equipamentos médicos. Ela ainda afirma que um dos impulsionadores do conceito big data é a ascensão da Internet das Coisas com dispositivos que conceito big data é a ascensão da Internet das Coisas com dispositivos que podem gerar dados sobre meio-ambiente,

podem gerar dados sobre meio-ambiente, cidades, energia, saúde, entre outros.cidades, energia, saúde, entre outros.  A revista Super Interes

 A revista Super Interessante (2012) cita os csante (2012) cita os cookies como impreookies como imprescindíveis ao bigscindíveis ao big data ao ajudarem a conhecer melhor o

data ao ajudarem a conhecer melhor o internauta.internauta.

Jefferson Stela acrescenta que grande parte das informações usadas em Jefferson Stela acrescenta que grande parte das informações usadas em decisões são estruturadas e que as informações não estruturadas podem decisões são estruturadas e que as informações não estruturadas podem agregar ainda mais valor para as empresas e os consumidores. Ele cita como agregar ainda mais valor para as empresas e os consumidores. Ele cita como exemplo de dados não estruturados o conteúdo de redes sociais, vídeos, exemplo de dados não estruturados o conteúdo de redes sociais, vídeos, sensores, voz e dados de maquinas.

sensores, voz e dados de maquinas.

Em 2014, Paschoal Pipolo mencionou também a importância dos dados não Em 2014, Paschoal Pipolo mencionou também a importância dos dados não estruturados. Vide abaixo sua opinião sobre os dados gerado a partir da estruturados. Vide abaixo sua opinião sobre os dados gerado a partir da interação com o mundo digital:

interação com o mundo digital: “Aplicativos sociais como

“Aplicativos sociais como Facebook, Twitter, Linkedin, Waze, Foursquare, YouTube,Facebook, Twitter, Linkedin, Waze, Foursquare, YouTube, TripAdvisor 

TripAdvisor , permitem que nos expressemos livremente e que nossas opiniões possam, permitem que nos expressemos livremente e que nossas opiniões possam ser vistas e ouvidas em qualquer lugar do planeta. Ao interagirmos com esse mundo ser vistas e ouvidas em qualquer lugar do planeta. Ao interagirmos com esse mundo digital passamos, ainda que inconscientemente, a deixar marcas e revelar quem somos, digital passamos, ainda que inconscientemente, a deixar marcas e revelar quem somos, como agimos e como nos posicionamos perante qualquer assunto, permitindo o como agimos e como nos posicionamos perante qualquer assunto, permitindo o estabelecimento de conexões em todos os níveis. [...] Diariamente, por meio desses estabelecimento de conexões em todos os níveis. [...] Diariamente, por meio desses

(10)

dispositivos e conexões, compartilhamos 30 bilhões de

dispositivos e conexões, compartilhamos 30 bilhões de informações, 10 bilhões da quaisinformações, 10 bilhões da quais relativas a novas mensagens n

relativas a novas mensagens no Facebook e 500 milhões de tweets [...].”o Facebook e 500 milhões de tweets [...].”

Marcos Panichi (2012), líder da área de soluções de

Marcos Panichi (2012), líder da área de soluções de Information Information ManagementManagement da IBM, conclui que esta grande geração de informações, que foi a da IBM, conclui que esta grande geração de informações, que foi a impulsionadora da era big data, está diretamente relacionada com a forma de impulsionadora da era big data, está diretamente relacionada com a forma de trabalhar da geração Y, sempre em equipe e

trabalhar da geração Y, sempre em equipe e conectada em redes sociais.conectada em redes sociais.

B I G D A T A

B I G D A T A - Tecn- Tecnologia ologia e Infre Infraestruturaaestrutura

Cézar Taurion esclareceu em 2012, que tecnologias como o modelo relacional Cézar Taurion esclareceu em 2012, que tecnologias como o modelo relacional utilizado pelas empresas para armazenarem e gerenciarem os dados gerados utilizado pelas empresas para armazenarem e gerenciarem os dados gerados pelos sistemas internos não suportam dados não estruturados e em grande pelos sistemas internos não suportam dados não estruturados e em grande volume utilizados pelo

volume utilizados pelo big databig data..

Segundo ele, as tecnologias que sustentam o conceito big data

Segundo ele, as tecnologias que sustentam o conceito big data são assão as  Analytics Analytics,, tendo

tendo HadoopHadoop ee MapReduceMapReduce  como nomes principais, e as tecnologias de  como nomes principais, e as tecnologias de infraestrutura como os bancos de dados

infraestrutura como os bancos de dados NoSQL (Not Only SQL) NoSQL (Not Only SQL) que armazenamque armazenam e processam os

e processam os petabytes petabytes de dados. Cita também: de dados. Cita também: - Sistemas colunares como o

- Sistemas colunares como o Big TableBig Tablequeque sãosão usados internamente pelo usados internamente pelo Google;

Google; - Modelo

- Modelo Key/valueKey/value como DynamoDB da Amazon; como DynamoDB da Amazon; - Modelo

- Modelo document databasedocument database baseado no conceito proposto pelo Lotus baseado no conceito proposto pelo Lotus Notes da IBM e aplicado em

Notes da IBM e aplicado em softwaressoftwares como MongoDB; como MongoDB; - Modelo baseado em grafos como o Neo4j.

- Modelo baseado em grafos como o Neo4j. Para a IBM (2013), os aplicativos de

Para a IBM (2013), os aplicativos de big databig data precisam muitas vezes de soluções precisam muitas vezes de soluções que incluem APIs baseadas na nuvem para fazer interface com pesquisas que incluem APIs baseadas na nuvem para fazer interface com pesquisas colunares avançadas, algoritmos de aprendizado de máquina e analítica colunares avançadas, algoritmos de aprendizado de máquina e analítica avançada, como visão de computador, analítica de vídeo e ferramentas de avançada, como visão de computador, analítica de vídeo e ferramentas de visualização.

(11)

B I G D A T A

B I G D A T A – – Captura de conteúdo Captura de conteúdo

Segundo a IBM (2014), os dados são coletados diretamente ou através de Segundo a IBM (2014), os dados são coletados diretamente ou através de provedores de dados, em tempo real ou em modo em lote.

provedores de dados, em tempo real ou em modo em lote. Marcos Vieira (2014) relata a fase de

Marcos Vieira (2014) relata a fase de captura de dados como uma etapa em quecaptura de dados como uma etapa em que o trabalho varia muito de

o trabalho varia muito de acordo com o volume e a acordo com o volume e a complexidade dos dados.complexidade dos dados. Segundo ele, algumas fontes como

Segundo ele, algumas fontes como Google Analytics, Facebook, Twitter,Google Analytics, Facebook, Twitter, ferramentas de

ferramentas de Email Marketing Email Marketing  e alguns publicadores de conteúdo possuem e alguns publicadores de conteúdo possuem extratores já programados, caso contrário

extratores já programados, caso contrário será necessário o desenvolvimento deserá necessário o desenvolvimento de um webservice para tal função.

um webservice para tal função.

“ 

“ Quando se faz necessário coletar dados de páginas, sejam estáticas ou dinâmicas, éQuando se faz necessário coletar dados de páginas, sejam estáticas ou dinâmicas, é necessário entender a estrutura dos dados contidos nessa página a fim de desenvolver necessário entender a estrutura dos dados contidos nessa página a fim de desenvolver um crawler capaz de buscar e armazenar esses dados. Quando a página não possui API um crawler capaz de buscar e armazenar esses dados. Quando a página não possui API de consumo ou a API possui limites indesejados, é possível utilizar ferramentas para de consumo ou a API possui limites indesejados, é possível utilizar ferramentas para capturar as páginas e extrair os dados sem a utilização de APIs

capturar as páginas e extrair os dados sem a utilização de APIs.”..”. (Node, 2014).(Node, 2014).

 A

 A Graph API Graph API  e e aa Public Feed API Public Feed API   são utilizadas para consumo de dados  são utilizadas para consumo de dados disponibilizados pelo Facebook. A diferença entre as duas é que a

disponibilizados pelo Facebook. A diferença entre as duas é que a Public FeedPublic Feed  API 

 API  possui acesso restrito a um conjunto de editores de mídia e seu uso requer possui acesso restrito a um conjunto de editores de mídia e seu uso requer aprovação prévia. (Facebook, 2014).

aprovação prévia. (Facebook, 2014).

Segundo Eduardo Harada (2015), a Data API v3 é a API mais recente do Segundo Eduardo Harada (2015), a Data API v3 é a API mais recente do YouTube

YouTube e conta com  e conta com suporte à utilização de comentários nos suporte à utilização de comentários nos vídeos, legendasvídeos, legendas e notificações.

e notificações.  Abaixo

 Abaixo Tiago Tiago Cruz Cruz França, França, Fabrício Fabrício Firmino Firmino de de Faria, Faria, Fabio Fabio Medeiros Rangel,Medeiros Rangel, Claudio Miceli de Farias e Jonice Oliveira (2014) descrevem formas e dão Claudio Miceli de Farias e Jonice Oliveira (2014) descrevem formas e dão exemplos de APIs de acesso à dados do Twitter :

exemplos de APIs de acesso à dados do Twitter :

““Normalmente, há duas formas diferentes de coleta de dados das redes sociaisNormalmente, há duas formas diferentes de coleta de dados das redes sociais onlineonline..  A primeira forma consiste em determinar termos e coletar por

 A primeira forma consiste em determinar termos e coletar por citações destes termos nocitações destes termos no passado. Desta forma, existe a possibilidade de restrições na obtenção de dados antigos, passado. Desta forma, existe a possibilidade de restrições na obtenção de dados antigos,

(12)

pois normalmente há um período de tempo viável para a coleta dos dados. A segunda pois normalmente há um período de tempo viável para a coleta dos dados. A segunda se baseia em um conceito de

se baseia em um conceito de streaming streaming , onde a aplicação criada funciona como um, onde a aplicação criada funciona como um ‘ouvinte’ da rede e captura os dados à medida que estes surgem.

‘ouvinte’ da rede e captura os dados à medida que estes surgem.[...] O[...] O Twitter Twitter  é uma é uma rede social

rede socialonlineonlineque possui duas APIs diferentes para a captura dos que possui duas APIs diferentes para a captura dos seus dados: RESTseus dados: REST  API e

 API e Streaming API Streaming API . [...] O. [...] OTwitter Twitter  trabalha com o padrão de arquivo JSON (JavaScript trabalha com o padrão de arquivo JSON (JavaScript Object Notation). Todos os dados são recebidos nesse formato.

Object Notation). Todos os dados são recebidos nesse formato.””

B I G D A T A

B I G D A T A  - Armazenamento  - Armazenamento

Carolina Cunha (2015) reforça que os Sistemas de Gerenciamento de Banco de Carolina Cunha (2015) reforça que os Sistemas de Gerenciamento de Banco de Dados Relacional, embora tenha sido um dos grandes desenvolvimento Dados Relacional, embora tenha sido um dos grandes desenvolvimento tecnológicos em computação do século passado, não são compatíveis com os tecnológicos em computação do século passado, não são compatíveis com os dados não estruturados.

dados não estruturados.

Para solucionar este problema, a IBM (2014) cita o

Para solucionar este problema, a IBM (2014) cita o distributed file storagedistributed file storage (DFS), (DFS), nuvem e NoSQL como opções de armazenamento para estes dados.

nuvem e NoSQL como opções de armazenamento para estes dados.

Emerson Alecrim justifica que os bancos de dados tradicionais não são Emerson Alecrim justifica que os bancos de dados tradicionais não são adequados para tratar grandes volumes de dados não estruturados por serem adequados para tratar grandes volumes de dados não estruturados por serem menos

menos flexíveis. Cflexíveis. Como solução omo solução ele cita ele cita também também o conceo conceito NoSQito NoSQL L queque possibilita o armazenamento de diversas formas e é compatível com um grupo possibilita o armazenamento de diversas formas e é compatível com um grupo

de premissas que compete com as propriedades ACID

de premissas que compete com as propriedades ACID

(( Atomicity  Atomicity ,, Consistency Consistency ,, IsolationIsolation e eDurability)Durability): a: aBASE BASE  ( (Basically AvailableBasically Available,, SoftSoft state

state,, Eventually consistency)Eventually consistency)..

 A

 A seguir seguir alguns alguns exemplos exemplos de de bancos bancos de de dado dado NoSQL NoSQL segundo segundo EmersonEmerson  Alecrim:

 Alecrim: Cassandra,Cassandra, MongoDB, MongoDB, HBase, HBase, CouchDB CouchDB e oe o Redis. Redis.

BIG DATA

BIG DATA - Processame- Processamento e nto e análiseanálise

Renna Setti ressalta que o grande diferencial das soluções big data é a análise Renna Setti ressalta que o grande diferencial das soluções big data é a análise de dados não estruturados que dependem do contexto para terem sentido.

(13)

Na revista FEBRABAN de 2014, Paschoal Pipolo menciona que uso do

Na revista FEBRABAN de 2014, Paschoal Pipolo menciona que uso do big databig data através de

através de analyticsanalytics (um conjunto de  (um conjunto de técnicas sofisticadas de análise quantitativatécnicas sofisticadas de análise quantitativa e estatística) aliada ao uso de modelos preditivos pode aumentar a e estatística) aliada ao uso de modelos preditivos pode aumentar a competitividade das empresas e proporcionar diferenciação num mercado competitividade das empresas e proporcionar diferenciação num mercado saturado de produtos similares.

saturado de produtos similares.

Segundo a IBM (2014), esta é uma tarefa complexa que exige processos Segundo a IBM (2014), esta é uma tarefa complexa que exige processos eficientes de alto desempenho com mecanismo de análise com vários fluxos de eficientes de alto desempenho com mecanismo de análise com vários fluxos de trabalho, algoritmos e ferramentas que apoiam

trabalho, algoritmos e ferramentas que apoiam o processamento paralelo.o processamento paralelo.

Para Carolina Cunha (2015), os sistemas e ferramentas implementados para o Para Carolina Cunha (2015), os sistemas e ferramentas implementados para o conceito

conceito big databig data  devem combinar matemática, estatística e ciência da  devem combinar matemática, estatística e ciência da computação e gerarem resultados em tempo hábil para tomada de decisões. computação e gerarem resultados em tempo hábil para tomada de decisões. Marcos Vieira (2014) descreve a etapa de pr

Marcos Vieira (2014) descreve a etapa de processamento e análise da seguinteocessamento e análise da seguinte forma:

forma:

““Uma vez que os dados já estão todos armazenados e disponíveis de forma adequada,Uma vez que os dados já estão todos armazenados e disponíveis de forma adequada, passamos para a etapa de tratamento e enriquecimento.

passamos para a etapa de tratamento e enriquecimento.  A

 A matéria matéria de de tratamento tratamento algorítmico algorítmico abrange: abrange: criação criação de de índices, índices, aplicação aplicação estatísticaestatística indutiva (análise de comportamento e clusters), modelagem preditiva (estimativa indutiva (análise de comportamento e clusters), modelagem preditiva (estimativa resultados futuros) e de algoritmos relativos a natureza de dados (processamento de resultados futuros) e de algoritmos relativos a natureza de dados (processamento de imagens, análise semântica de textos, etc).

imagens, análise semântica de textos, etc).

Esses processos têm grande dependência do resultado final que se deseja. Cada Esses processos têm grande dependência do resultado final que se deseja. Cada empresa possui uma necessidade e/ou uma capacidade técnica de aplicar alguns ou empresa possui uma necessidade e/ou uma capacidade técnica de aplicar alguns ou vários dos métodos citados.

vários dos métodos citados.  As habilidades necessárias

 As habilidades necessárias nessa etanessa etapa se dpa se dividem sobretudo ividem sobretudo entre conhecimentos entre conhecimentos dede economia (econometria), computação, matemática e estatística. Com

economia (econometria), computação, matemática e estatística. Com o se pode imaginaro se pode imaginar é muito difícil que uma empresa possua uma equipe que domine todas essa técnicas, é muito difícil que uma empresa possua uma equipe que domine todas essa técnicas, tanto mais difícil é encontrar um profissional que, sozinho, consiga resolver todas elas. tanto mais difícil é encontrar um profissional que, sozinho, consiga resolver todas elas. O padrão no mercado é terceirizar projetos com empresas especializadas que já O padrão no mercado é terceirizar projetos com empresas especializadas que já acumulam

(14)

Marcos Vieira ainda lista algumas técnicas que podem ser utilizadas na busca Marcos Vieira ainda lista algumas técnicas que podem ser utilizadas na busca dos dados. São elas:

dos dados. São elas: Análise Semântica, Análise Preditiva  Análise Semântica, Análise Preditiva e Análise de Cluster e Análise de Cluster  Emerson Alecrim cita a plataforma

Emerson Alecrim cita a plataforma openopensource Hadoopsource Hadoop como uma solução para como uma solução para o processamento e análise de grandes volumes de dados estruturados e não o processamento e análise de grandes volumes de dados estruturados e não estruturados e a tecnologia de

estruturados e a tecnologia de MapReduceMapReduce como um modelo de programação como um modelo de programação que distribui o processamento a ser realizado entre vários computadores para que distribui o processamento a ser realizado entre vários computadores para ajudar o seu mecanismo de busca a ficar mais rápido

ajudar o seu mecanismo de busca a ficar mais rápido e livre da necessidades dee livre da necessidades de servidores poderosos e caros.

servidores poderosos e caros.  Abaixo as r

 Abaixo as razões, segundo Emerson Alecrim, azões, segundo Emerson Alecrim, dodo HadoopHadoop ser considerado uma ser considerado uma solução adequada para o

solução adequada para o big data:big data: - Por ser um projeto

- Por ser um projeto open sourceopen source, permite modificações para fins de, permite modificações para fins de customização e o torna suscetível a melhorias constantes graças à

customização e o torna suscetível a melhorias constantes graças à sua rede desua rede de colaboração;

colaboração;

- Não exige o pagamento de licenças e suporta

- Não exige o pagamento de licenças e suporta hardwarehardware convencional tornando convencional tornando os projetos mais baratos;

os projetos mais baratos; - Tem recursos de t

- Tem recursos de tolerância a falhas, como replicação de dados;olerância a falhas, como replicação de dados; - É escalável, isto

- É escalável, isto é, permite o acréscimo de é, permite o acréscimo de computadores sem necessidade decomputadores sem necessidade de realizar reconfigurações complexas no sistema.

realizar reconfigurações complexas no sistema.

BIG DATA

BIG DATA - Consumidores d- Consumidores dos dados os dados e informaçõese informações

Em 2014 a IBM definiu como consumidores

Em 2014 a IBM definiu como consumidores das informações geradas pelo

das informações geradas pelo

conceito big data os aplicativos de visualização, seres humanos,

conceito big data os aplicativos de visualização, seres humanos,

processos de negócios ou serviços.

(15)

Paschoal Pipolo ressalta, na revista FEBRABAN de 2014, a importância das Paschoal Pipolo ressalta, na revista FEBRABAN de 2014, a importância das ferramentas de visualização. Segundo ele, estas ferramentas auxiliam as áreas ferramentas de visualização. Segundo ele, estas ferramentas auxiliam as áreas de negócio a interpretarem as informações geradas pelo

de negócio a interpretarem as informações geradas pelo big databig data e muitas vezes e muitas vezes possibilitam a descoberta e exploração visual de padrões e a identificação de possibilitam a descoberta e exploração visual de padrões e a identificação de relacionamentos, de maneira eficiente e

relacionamentos, de maneira eficiente e sem necessidade de programação. Elesem necessidade de programação. Ele cita o tableau como exemplo de ferramenta.

cita o tableau como exemplo de ferramenta.

BIG DATA - Benefícios BIG DATA - Benefícios

Jefferson Stela esclarece que: Jefferson Stela esclarece que:

““Big dataBig data não é uma tecnologia específica e, quando tratamos deste assunto focando não é uma tecnologia específica e, quando tratamos deste assunto focando nessa parte técnica, abstraímos aquilo de melhor que este novo conceito traz ao nessa parte técnica, abstraímos aquilo de melhor que este novo conceito traz ao mercado: a capacidade real de transformar o negócio mudando a maneira como mercado: a capacidade real de transformar o negócio mudando a maneira como analisamos as informações usadas em tomadas de decisão. Consumidores passarão a analisamos as informações usadas em tomadas de decisão. Consumidores passarão a serem tratados como únicos e serão mais entendidos em relação a anseios, desejos e serem tratados como únicos e serão mais entendidos em relação a anseios, desejos e comportamento. [...] Do outro lado empresas passarão a se beneficiar dessas comportamento. [...] Do outro lado empresas passarão a se beneficiar dessas informações e entenderão qual cliente precisa de qual produto ou serviço. Os benefícios, informações e entenderão qual cliente precisa de qual produto ou serviço. Os benefícios, de ambos os lados, são inúmeros, basicamente depende da criatividade de quem cria e de ambos os lados, são inúmeros, basicamente depende da criatividade de quem cria e atrelado a necessidade de quem usa.”

atrelado a necessidade de quem usa.”

Para Manyika, o grande benefício do big data é permitir a análise de qualquer Para Manyika, o grande benefício do big data é permitir a análise de qualquer tipo de informação digital em tempo real, gerando base para a tomada de tipo de informação digital em tempo real, gerando base para a tomada de decisões e consequentemente melhorando a competitividade, produtividade, decisões e consequentemente melhorando a competitividade, produtividade, inovação e benefícios ao consumidor.

inovação e benefícios ao consumidor.

Segundo Dyche Apud Computerworld (2013), o verdadeiro fascínio do big data Segundo Dyche Apud Computerworld (2013), o verdadeiro fascínio do big data para os executivos é a promessa de

para os executivos é a promessa de inovação.inovação.

B I G D A T A

B I G D A T A - A- Aplicabilidades e plicabilidades e CasesCases

Carolina Cunha cita comos aplicabilidades mais comum do conceito

Carolina Cunha cita comos aplicabilidades mais comum do conceito big databig data: a: a geração de informação para apoio na tomada de decisões, o maior geração de informação para apoio na tomada de decisões, o maior

(16)

conhecimento do comportamento do consumidor ou de determinado público e a conhecimento do comportamento do consumidor ou de determinado público e a identificação de tendências.

identificação de tendências. Jefferson Stela afirma que: Jefferson Stela afirma que:

“Não há uma indústria ou área específica que

“Não há uma indústria ou área específica que não se possa aplicar este novo conceito.não se possa aplicar este novo conceito. Basicamente, em todo lugar onde há informação, trabalhada de uma forma criativa e Basicamente, em todo lugar onde há informação, trabalhada de uma forma criativa e estratégica, e que possa trazer um valor agregado como objetivo final, terá credito na estratégica, e que possa trazer um valor agregado como objetivo final, terá credito na utilização de

utilização de Big DataBig Data. Temos desde casos complexos como a utilização na análise de. Temos desde casos complexos como a utilização na análise de sedimentos coletados no fundo de oceanos identificados possíveis melhores pontos de sedimentos coletados no fundo de oceanos identificados possíveis melhores pontos de perfuração de poços petrolíferos, como na utilização de lojas que querem entender se perfuração de poços petrolíferos, como na utilização de lojas que querem entender se um consumidor que comprou um determinado produto pode ser o futuro consumidor de um consumidor que comprou um determinado produto pode ser o futuro consumidor de um outro produto ou serviço específico.”

um outro produto ou serviço específico.”

Segundo a Hekima, as soluções

Segundo a Hekima, as soluções big databig data estão para os gestores modernos como estão para os gestores modernos como um radar está para um piloto de aeronave pois auxiliam a gerarem respostas um radar está para um piloto de aeronave pois auxiliam a gerarem respostas imediatas às mudanças.

imediatas às mudanças.

O site da Hekima cita

O site da Hekima cita também muitas outras aplicabilidades dotambém muitas outras aplicabilidades do big databig data. Seguem. Seguem algumas:

algumas:

““OObig databig data pode ser usado para coibir fraudes pode ser usado para coibir fraudes em sistemas corporativos, compreenderem sistemas corporativos, compreender o consumidor, identificar processos internos ineficientes, entre outras funções. Porta de o consumidor, identificar processos internos ineficientes, entre outras funções. Porta de entrada para entender 

entrada para entender  mudanças ainda mais profundas mudanças ainda mais profundas na maneira como o ser humanona maneira como o ser humano se relaciona com a tecnologia, essa solução e suas variáveis (como o Social

se relaciona com a tecnologia, essa solução e suas variáveis (como o Social Big DataBig Data,, que trabalha exclusivamente com m

que trabalha exclusivamente com mineração de dados em mídias sociais) é hoje a ineração de dados em mídias sociais) é hoje a maismais importante arma de diferencial competitivo às em

importante arma de diferencial competitivo às em presas ousadaspresas ousadas—— independentemente independentemente do porte

do porte—— e de gestores modernos. e de gestores modernos.””

““Dados capturados de redes sociais comoDados capturados de redes sociais como LinkedIn, FacebookLinkedIn, Facebook ee Twitter  Twitter , por exemplo,, por exemplo, podem trazer metadados que acrescentam informações adicionais sobre os usuários, podem trazer metadados que acrescentam informações adicionais sobre os usuários, como geolocalização, o que permitie a um departamento de marketing compreender de como geolocalização, o que permitie a um departamento de marketing compreender de quais regiões surgem o maior percentual de

quais regiões surgem o maior percentual de hashtagshashtags de engajamento. Essa percepção de engajamento. Essa percepção mais apurada possibilita direcionar diferentes trabalhos de

(17)

mercados consumidores específicos (garantindo retorno sobre o investimento muito mais mercados consumidores específicos (garantindo retorno sobre o investimento muito mais elevado do que o que seria alcançado em uma campanha feita

elevado do que o que seria alcançado em uma campanha feita ‘às cegas’‘às cegas’).).”” Para Emerson Alecrim, os benefícios que o

Para Emerson Alecrim, os benefícios que o big databig data pode proporcionar com a pode proporcionar com a geração mais eficiente de informações são

geração mais eficiente de informações são:: geração de produtos melhores,geração de produtos melhores, estratégias de marketing mais eficientes, redução de gastos, melhoria no estratégias de marketing mais eficientes, redução de gastos, melhoria no processo de produção, superação de

processo de produção, superação de concorrentes e atendimento personalizadoconcorrentes e atendimento personalizado dos clientes.

dos clientes.

Michael Slaby, diretor de

Michael Slaby, diretor de inovação da campanha de reeleição de Barack Obamainovação da campanha de reeleição de Barack Obama nos EUA, conta como o

nos EUA, conta como o big databig data foi utilizado na  foi utilizado na campanha de 2012:campanha de 2012:

““Campanha de Obama teve 35 milhões de pessoas naCampanha de Obama teve 35 milhões de pessoas na fan pagefan page oficial do oficial do Facebook Facebook  e e 26 milhões de seguidores no

26 milhões de seguidores no Twitter Twitter . [...] Hoje, a tecnologia desempenha um papel que. [...] Hoje, a tecnologia desempenha um papel que não permite que seja vista como um departamento apartado dentro de uma organização. não permite que seja vista como um departamento apartado dentro de uma organização. [...] Nossos voluntários foram capazes de se comunicar com mais pessoas, fazendo bom [...] Nossos voluntários foram capazes de se comunicar com mais pessoas, fazendo bom uso de mídias e das funcionalidades das ferramentas. [...] Outro pilar da campanha de uso de mídias e das funcionalidades das ferramentas. [...] Outro pilar da campanha de Obama foi a estratégia de aplicar ferramentas de

Obama foi a estratégia de aplicar ferramentas deanalyticsanalytics, usadas para medição, coleta,, usadas para medição, coleta, análise e produção de relatórios de dados. Parte do sucesso deve-se à capacidade de análise e produção de relatórios de dados. Parte do sucesso deve-se à capacidade de apoiar a tomada de decisão em dados mais abrangentes e precisos, um benefício apoiar a tomada de decisão em dados mais abrangentes e precisos, um benefício inerente da arquitetura de integração. As ferramentas de

inerente da arquitetura de integração. As ferramentas de analyticsanalytics passaram a trabalhar passaram a trabalhar sobre uma base integrada de informações e puderam correlacionar o que ocorria online sobre uma base integrada de informações e puderam correlacionar o que ocorria online eeoff-lineoff-line. [...] A mobilidade e a geolocalização acabam abrindo mais uma frente para as. [...] A mobilidade e a geolocalização acabam abrindo mais uma frente para as disciplinas relacionadas a

disciplinas relacionadas a big databig data ee analyticsanalytics. Há um velho adágio que diz que toda. Há um velho adágio que diz que toda atividade política é local. Eu acrescentaria que toda atividade política é pessoal. atividade política é local. Eu acrescentaria que toda atividade política é pessoal. Precisamos usar os avanços dessa tecnologia para interagir com cada vez mais gente e Precisamos usar os avanços dessa tecnologia para interagir com cada vez mais gente e prover uma experiência pessoal a cada um

prover uma experiência pessoal a cada um.”.”

Cezar Tourion cita como aplicabilidade para o conceito

Cezar Tourion cita como aplicabilidade para o conceito big big  datadata a análise de a análise de fraudes com o objetivo de minimizar os riscos e um

fraudes com o objetivo de minimizar os riscos e um casecase de uma empresa de de uma empresa de fabricação de semicondutores que monitora em tempo real o processo de fabricação de semicondutores que monitora em tempo real o processo de detecção e classificação de falhas possibilitando que os

detecção e classificação de falhas possibilitando que os waferswafers  defeituosos  defeituosos sejam reprocessados e ajustes sejam feitos em tempo real nos próprios sejam reprocessados e ajustes sejam feitos em tempo real nos próprios processos de fabricação.

processos de fabricação.  Abaixo mais algumas ap

(18)

- Geoprocessamento para identificação de vagas de estacionamento e - Geoprocessamento para identificação de vagas de estacionamento e situação de navios atracados em portos;

situação de navios atracados em portos;

- Decifração da linguagem humana em redes sociais pela ONU para - Decifração da linguagem humana em redes sociais pela ONU para prever o desemprego, a situação econômica e epidemias;

prever o desemprego, a situação econômica e epidemias; - Monitoramento de hábitos de consumo;

- Monitoramento de hábitos de consumo; - Detecção da concentração de chips de

- Detecção da concentração de chips de celulares em ações humanitáriascelulares em ações humanitárias como aconteceu no terremoto ocorrido no Haiti;

como aconteceu no terremoto ocorrido no Haiti; - Uso de monitoramento em tempo

- Uso de monitoramento em tempo real de bebês pré-maturos no Canadáreal de bebês pré-maturos no Canadá que possibilitaram o cruzamento de dados e a antecipação de ações que que possibilitaram o cruzamento de dados e a antecipação de ações que salvaram a vida de di

salvaram a vida de diversas crianças.versas crianças. C

Casesases de sucesso premiados em 2013  de sucesso premiados em 2013 pelo IDCpelo IDC Brazil Brazil  BI & BI &Big Data ConferenceBig Data Conference segundo a Exame Info:

segundo a Exame Info: - Projeto

- Projeto IntelligereIntelligere  que tem como objetivo melhorar o processo de  que tem como objetivo melhorar o processo de aprendizagem e assegurar o sucesso do aluno em completar seu aprendizagem e assegurar o sucesso do aluno em completar seu percurso acadêmico no prazo definido e dentro dos parâmetros de percurso acadêmico no prazo definido e dentro dos parâmetros de qualidade especificados. Isto é possível com aplicação de estudos qualidade especificados. Isto é possível com aplicação de estudos analíticos aos processos de

analíticos aos processos de aprendizagem, avaliação e acompanhamentoaprendizagem, avaliação e acompanhamento da vida do aluno.

da vida do aluno.

- Escritório de Prioridades Estratégicas de Minas Gerais

- Escritório de Prioridades Estratégicas de Minas Gerais que disponibilizaque disponibiliza informações da gestão pública com o objetivo de conseguir desenvolver informações da gestão pública com o objetivo de conseguir desenvolver novas políticas públicas com participação da população.

novas políticas públicas com participação da população.

O Uber é mais um usuário do conceito

O Uber é mais um usuário do conceito Big DataBig Data conforme informado pelo site daconforme informado pelo site da Hekima.

(19)

““No minuto em que você clica no seu aNo minuto em que você clica no seu aplicativo, oplicativo, obig databig data também está lá, dando suporte também está lá, dando suporte para que se ache um motorista nas cidades onde está o serviço, cruzando os dados da para que se ache um motorista nas cidades onde está o serviço, cruzando os dados da carona mais próxima, tornando o serviço mais ágil. Antes de você entrar no carro, os carona mais próxima, tornando o serviço mais ágil. Antes de você entrar no carro, os serviços de GPS já cruzaram outros tantos dados de quilometragem, ruas, tarifas e serviços de GPS já cruzaram outros tantos dados de quilometragem, ruas, tarifas e tempo em um algorítimo refinado, que determinam previamente o tempo estimado de tempo em um algorítimo refinado, que determinam previamente o tempo estimado de viagem e quanto ela custará. E se você mudar de ideia sobre o seu destino no meio do viagem e quanto ela custará. E se você mudar de ideia sobre o seu destino no meio do trajeto, não tem problema. Em tempo real, o aplicativo refaz o caminho, vê as condições trajeto, não tem problema. Em tempo real, o aplicativo refaz o caminho, vê as condições de tráfego e você já está em um novo trajeto com um novo

de tráfego e você já está em um novo trajeto com um novo preço.”.preço.”.

B I G D A T A

B I G D A T A – – Ética e Privacidade Ética e Privacidade

O big data cria

O big data cria um contexto em que as questões de privacidade precisam serum contexto em que as questões de privacidade precisam ser repensadas pois ainda não há entendimento consolidado sobre a viabilidade repensadas pois ainda não há entendimento consolidado sobre a viabilidade ética de replicação e uso de

ética de replicação e uso de dados de algumas fontes.dados de algumas fontes.

Para a Hekima, esta discursão ficou em maior evidência quando os EUA Para a Hekima, esta discursão ficou em maior evidência quando os EUA revelaram em 2013 que a Agência Nacional de Segurança dos Estados Unidos revelaram em 2013 que a Agência Nacional de Segurança dos Estados Unidos e o FBI possuíam

e o FBI possuíam acesso direto aos servidores centrais das mais importantes acesso direto aos servidores centrais das mais importantes empresas de internet

empresas de internet do mundo. Segundo o site, dados oriundos do Google, dodo mundo. Segundo o site, dados oriundos do Google, do Facebook, do Skype e do Aol, por exemplo, eram totalmente monitorados pelas Facebook, do Skype e do Aol, por exemplo, eram totalmente monitorados pelas agências de inteligência norte-americanas.

agências de inteligência norte-americanas.

Mas o site da Hekima ressalta também que inúmeros juristas no Brasil e no Mas o site da Hekima ressalta também que inúmeros juristas no Brasil e no exterior defendem a idéia de que as informações inseridas em mídias sociais exterior defendem a idéia de que as informações inseridas em mídias sociais não podem ser posteriormente reivindicadas como confidenciais porque já f

não podem ser posteriormente reivindicadas como confidenciais porque já f oramoram expostas ao acesso livre.

expostas ao acesso livre.

Carolina Cunha (2015) discorda quando afirma que o Marco Civil da internet Carolina Cunha (2015) discorda quando afirma que o Marco Civil da internet regulamenta que a privacidade é um direito e uma condição para ‘o pleno regulamenta que a privacidade é um direito e uma condição para ‘o pleno exercício do direito de acesso à internet’. Segundo ela, embora o usuário tenha exercício do direito de acesso à internet’. Segundo ela, embora o usuário tenha direito à inviolabilidade da intimidade e da vida privada, a facilidade de acesso direito à inviolabilidade da intimidade e da vida privada, a facilidade de acesso às informações públicas tornou mais frequente a coleta de informações às informações públicas tornou mais frequente a coleta de informações particulares sem autorização.

(20)

B I G D A T A

B I G D A T A – – Futuro Futuro

Para Carlos Barbieri (2011), quando as empresas começam a se fundir, comprar Para Carlos Barbieri (2011), quando as empresas começam a se fundir, comprar ou buscar parcerias com outras com o objetivo de dominar uma tecnologia ou buscar parcerias com outras com o objetivo de dominar uma tecnologia específica é sinal que esta tendência tecnológica está em evolução. Ele cita específica é sinal que esta tendência tecnológica está em evolução. Ele cita como exemplo desta tendências o

como exemplo desta tendências o conceitoconceito big databig data e e analyticsanalytics..

Feinberg em 2013, afirmou que as empresas que tiverem a capacidade de Feinberg em 2013, afirmou que as empresas que tiverem a capacidade de predição serão recompensadas pois conseguirão antecipar as necessidades e predição serão recompensadas pois conseguirão antecipar as necessidades e desejos dos clientes.

desejos dos clientes.

Cézar Tauron (2012) ressalta que o conceito

Cézar Tauron (2012) ressalta que o conceito big databig data  disponibiliza um novo  disponibiliza um novo território com conhecimentos, experiências e

território com conhecimentos, experiências e expertiseexpertise  profissional que é  profissional que é inevitável para os CIOs das empresas.

inevitável para os CIOs das empresas.

Jefferson Stela pontua que o mercado global já movimenta mais de US$70 Jefferson Stela pontua que o mercado global já movimenta mais de US$70 bilhões anuais em tecnologias do conceito big data e que a tendência de bilhões anuais em tecnologias do conceito big data e que a tendência de crescimento supera o percentual de 40% até

crescimento supera o percentual de 40% até 2016.2016.

Mas Edson Cardoso informa que, conforme um estudo da Bain & Company, o Mas Edson Cardoso informa que, conforme um estudo da Bain & Company, o mercado de

mercado de big databig data movimentará cerca de R$ 47 bilhões em 2018. Segundo movimentará cerca de R$ 47 bilhões em 2018. Segundo ele, este grande investimento será motivado pela capacidade de garantir aos ele, este grande investimento será motivado pela capacidade de garantir aos executivos tomadas de decisões até cinco vezes mais rápidas.

executivos tomadas de decisões até cinco vezes mais rápidas. Para a Hekima, os investimento com

Para a Hekima, os investimento com big databig data tende a crescer 6 vezes mais do tende a crescer 6 vezes mais do que o setor de TI em 2018 e Carolina Cunha (2015) faz uma previsão que o que o setor de TI em 2018 e Carolina Cunha (2015) faz uma previsão que o Brasil movimentará US$ 965 milhões em 2018

Brasil movimentará US$ 965 milhões em 2018 nesta área.nesta área.  A revista

 A revista FEBRABAN, FEBRABAN, em 2014, em 2014, ressaltou ressaltou que a que a maior evmaior evolução deolução desses ssses serviçoserviços se dará com a computação cognitiva ou

(21)

máquinas tiverem a capacidade de tomar suas próprias decisões após auto máquinas tiverem a capacidade de tomar suas próprias decisões após auto aprendizagem.

aprendizagem.

BIG DATA

BIG DATA – – Aplicabilidade nas Instituições Financeiras Aplicabilidade nas Instituições Financeiras

Segundo a Revista FEBRABAN (2014), quando a frase em que dizia que os Segundo a Revista FEBRABAN (2014), quando a frase em que dizia que os dados sabem bem mais sobre nós do que nós mesmos surgiu em 2008, o dados sabem bem mais sobre nós do que nós mesmos surgiu em 2008, o conceito

conceitobig databig data deixou de ser tratado apenas em discussões acadêmicas paradeixou de ser tratado apenas em discussões acadêmicas para ganhar espaço também nas áreas de TI das grandes instituições f

ganhar espaço também nas áreas de TI das grandes instituições f inanceiras.inanceiras.  Abaixo algumas informaç

 Abaixo algumas informações que foram divulgões que foram divulgadas na publicação aadas na publicação anula donula do CIAB FEBRABAN 2012:

CIAB FEBRABAN 2012:

Tendências e prioridades na visão dos executivos de TI dos grandes Tendências e prioridades na visão dos executivos de TI dos grandes bancos brasileiros:

bancos brasileiros:

“O

“O tema temabig databig data tem sido usado mais frequentemente para denotar grandes programas tem sido usado mais frequentemente para denotar grandes programas que as instituições têm executado para criação de bases de dados que serão usadas que as instituições têm executado para criação de bases de dados que serão usadas para geração das informações para Basileia II e III, atrelada a uma demanda ainda para geração das informações para Basileia II e III, atrelada a uma demanda ainda crescente por informações gerenciais que devem ser reconciliadas com dados para fins crescente por informações gerenciais que devem ser reconciliadas com dados para fins regulatórios. A visão de comportamento de clientes também está presente aqui, uma vez regulatórios. A visão de comportamento de clientes também está presente aqui, uma vez que as necessidades de informações regulatórias sobre riscos de clientes tem gerado que as necessidades de informações regulatórias sobre riscos de clientes tem gerado uma necessidade de compartilhar essas informações também com dados antes uma necessidade de compartilhar essas informações também com dados antes exclusivos de bases para

(22)

Importância do

Importância do big databig data na indústria de serviços financeiros: na indústria de serviços financeiros:

Iniciativas de

Iniciativas de big databig data específicas de setores financeiros: específicas de setores financeiros:

SETOR INICIATIVA EXEMPLOS

SETOR INICIATIVA EXEMPLOS RELEVANTERELEVANTESS

 A

 A publicação publicação anual anual CIAB CIAB FEBRABAN FEBRABAN 2012 2012 destacou destacou também também os os desafiosdesafios enfrentados pelas empresas financeiras para operacionalizar o conceito enfrentados pelas empresas financeiras para operacionalizar o conceito BigBig Data.

(23)

- Falta de

- Falta de uma abordagem ou plano estruturado para a uma abordagem ou plano estruturado para a operacionalizoperacionalização doação do BigBig Data

Data;;

- Pouca definição quanto à

- Pouca definição quanto à organização da gestão de dados nas empresas, seusorganização da gestão de dados nas empresas, seus papéis, responsabilidades e capacitações;

papéis, responsabilidades e capacitações; -

- Falta de um plano para mudançFalta de um plano para mudança de cultura ou consa de cultura ou construção de capacitações;trução de capacitações; - Falta de

- Falta de profissional capacitado;profissional capacitado;

- Pouca de agilidade para identificar e se adaptar a soluções, plataformas e - Pouca de agilidade para identificar e se adaptar a soluções, plataformas e infraestrutura de

infraestrutura de big databig data  de última geração, dificultando o processo de  de última geração, dificultando o processo de implementação das soluções;

implementação das soluções;

- Poucas empresas possuem as capacitações para

- Poucas empresas possuem as capacitações para lidar com a lidar com a escala, variedadeescala, variedade e complexidade das informações atuais.

e complexidade das informações atuais.

Em 2013 a Revista FEBRABAN fez várias referências importantes sobre a Em 2013 a Revista FEBRABAN fez várias referências importantes sobre a aplicabilidade do conceito big data nas instituições financeiras. Abaixo algumas aplicabilidade do conceito big data nas instituições financeiras. Abaixo algumas delas:

delas:

-- “Hoje, dois terços dos bancos no mundo todo “Hoje, dois terços dos bancos no mundo todo já têm projetos dejá têm projetos de big databig data em funcionamento.” (

em funcionamento.” (Panichi, da IBM, 2013Panichi, da IBM, 2013 – – Revista FEBRABAN). Revista FEBRABAN). - A

- A Booz&Company dBooz&Company destacou que o menor número de vestacou que o menor número de visitas dos clientesisitas dos clientes às agências bancárias incentivou o

às agências bancárias incentivou o incremento expressivo da capacidadeincremento expressivo da capacidade de armazenamento de dados nas instituições financeiras com o objetivo de armazenamento de dados nas instituições financeiras com o objetivo de apurar tendências e particularidades dos clientes, de forma individual de apurar tendências e particularidades dos clientes, de forma individual ou segmentada.

ou segmentada.

- Jason White, gerente de desenvolvimento de negócios da HP-3PAR na - Jason White, gerente de desenvolvimento de negócios da HP-3PAR na  América Latina,

 América Latina, alertou que alertou que os grandes os grandes bancos brasileiros bancos brasileiros devem sofrerdevem sofrer modificações para se alcançar a rapidez esperada para soluções de modificações para se alcançar a rapidez esperada para soluções de bigbig data

data  pois possuem sistemas altamente diversificados e compostos de  pois possuem sistemas altamente diversificados e compostos de sistemas antigos convivendo com novos. Ele ainda ressaltou que a sistemas antigos convivendo com novos. Ele ainda ressaltou que a arquitetura deve ser convergente, suportando várias camadas em arquitetura deve ser convergente, suportando várias camadas em funcionamento simultâneo e capaz de agregar o

funcionamento simultâneo e capaz de agregar o poder de processamentopoder de processamento de vários servidores.

Referências

Documentos relacionados

A definição da amostra de participantes foi efectuada antes da obtenção da autorização para a investigação nos estabelecimentos prisionais por parte da

O presente trabalho, tendo como base o Método dos Elementos Finitos, trata de um problema de otimização estrutural, portanto as seções seguintes tratam

Terapêutica anti-HER-2 (trastuzumab, lapatinib) em combinação com QT, TE ou em monoterapia deverá se oferecida precocemente a todos os pacientes com CMM HER-2 positivo ,

Posteriormente, a análise qualitativa com o método dos Percursos Comentados se mostrou eficaz não apenas para o conhecimento das condições de acessibilidade

8 Os alunos já ingressam no ensino médio com certo receio da disciplina, pois ela é nova em seu currículo escolar, e a partir das primeiras aulas, já a relacionam

Adotou-se como referência o estudo do Instituto de Pesquisa Econômica Aplicada (IPEA, 2008) que identificou 15 ILPIs em Ser- gipe, às quais se somaram 03 criadas poste-

Neste relatório de estágio procurámos perceber qual o lugar da reportagem no Jornal de Notícias. Começámos por descrever o estágio, as suas rotinas e o

Do mesmo modo que o comprimento de um segmento de reta, a sua direção e a sua orientação no espaço representam uma série de grandezas físicas, chamadas então