• Nenhum resultado encontrado

Proposta de método para identificação e caracterização de criação de valor em cenários Big Data

N/A
N/A
Protected

Academic year: 2021

Share "Proposta de método para identificação e caracterização de criação de valor em cenários Big Data"

Copied!
139
0
0

Texto

(1)

PROPOSTA DE MÉTODO PARA IDENTIFICAÇÃO E CARACTERIZAÇÃO DE CRIAÇÃO DE VALOR EM

CENÁRIOS BIG DATA

Dissertação submetida ao Programa de Pós-Graduação em Ciência da Informação do Centro de Ciências da Educação da Universidade Federal de Santa Catarina, para a obtenção do Grau de Mestre em Ciência da Informação.

Orientador: Prof. Dr. Moisés Lima Dutra

Coorientador: Prof. Dr. Douglas Dyllon Jeronimo de Macedo

Florianópolis 2017

(2)
(3)

PROPOSTA DE MÉTODO PARA IDENTIFICAÇÃO E CARACTERIZAÇÃO DE CRIAÇÃO DE VALOR EM CENÁRIOS

BIG DATA

Esta Dissertação foi julgada adequada para obtenção do título de “Mestre em Ciência da Informação” e aprovada em sua forma final pelo Programa de Pós-Graduação em Ciência da Informação, do Centro de Ciências da

Educação da Universidade Federal de Santa Catarina. Florianópolis, 30 de maio de 2017.

__________________________________________________ Prof.ª Rosângela Schwarz Rodrigues, Dra.

Coordenadora do Curso Banca Examinadora:

________________________________________________ Prof. Moisés Lima Dutra, Dr.

Orientador

Universidade Federal de Santa Catarina

________________________________________________ Prof. Douglas Dyllon Jeronimo de Macedo, Dr.

Coorientador

Universidade Federal de Santa Catarina

________________________________________________ Prof. Adilson Luiz Pinto, Dr.

Examinador

Universidade Federal de Santa Catarina

________________________________________________ Prof. Celson Pantoja Lima, Dr.

Examinador Externo

Universidade Federal do Oeste do Pará

_________________________________________________ Prof. Claudelino Martins Dias Júnior, Dr.

Examinador Externo

(4)
(5)

Este trabalho apresenta um método para identificação e caracterização de criação de valor, por meio da percepção de valor em análises de implementações em cenários Big Data. Para isso, fez-se uma comparação entre o cenário tradicional de criação de valor, fixada na era industrial, e do conceito contemporâneo de cenário de criação de valor em empresas que implementam soluções em cenários Big Data. Para isso, realizou-se uma pesquisa bibliográfica para caracterizar o cenário tradicional de valor, outra para caracterizar o cenário Big Data de criação de valor e assim foi possível compará-las e discuti-las. Por fim, aplicou-se o método proposto em um estudo de caso, sobre um problema apresentado pela Prefeitura Municipal de Vitória-ES, para análise de dados de agendamentos de consultas médicas, onde objetivou-se caracterizar o perfil dos pacientes que faltam às consultas. Segundo à Prefeitura de Vitória-ES, em torno de 30% do total de consultas não acontece, por motivo de ausência dos pacientes, o que resultou em um prejuízo de aproximadamente 2 milhões de reais entre 2014 e 2015. Como resultados finais, observou-se que o método proposto ajudou na antecipação de percepção de criação de valor por parte da equipe de análise, que é possível de ser aplicado em diferentes tipos de análises e que possibilita gestão de riscos. Quanto a comparação, observou-se que o cenário tradicional de criação de valor tem foco maior em redução de custos, enquanto no cenário Big Data o foco está mais citado em relação a tomada de decisão. Para trabalhos futuros, sugere-se que sejam desenvolvidos indicadores de percepção de criação de valor, que podem explicitar de forma quantitativa, as percepções de criação de valor.

Palavras-chave: Big Data. Criação de Valor. Análise de Dados. Caracterização de Valor.

(6)
(7)

This work presents a method for identification and characterization of value creation, through the perception of value in analysis of implementations under the Big Data concept. For this, a comparison was made between the traditional view of value creation, fixed in the industrial era, and the contemporary concept of vision of value creation in companies that implement solutions under Big Data concepts. For this, a bibliographic research was conducted to characterize the traditional view of value, another to characterize the Big Data vision of value creation and thus it was possible to compare and discuss them. Finally, the proposed method was applied in a case study on a problem presented by the City Hall of Vitória-ES, to analyze data from medical appointment schedules, which aimed to characterize the profile of the patients who are missing consultations. According to the City Hall of Vitória-ES, around 30% of the total number of consultations does not happen, due to patients' absence, which resulted in a loss of approximately 2 million reais between 2014 and 2015. As final results, The proposed method helped to anticipate the perception of value creation by the analysis team, which is possible to be applied in different types of analysis and allows risk management. As for the comparison, it was observed that the traditional view of value creation has a greater focus on cost reduction, while in the Big Data vision the focus is more cited in relation to decision making. For future work, it is suggested that indicators of perception of value creation be developed, which can quantify the perceptions of value creation in a quantitative way.

Keywords: Big Data. Value creation. Data Analysis. Value Characterization.

(8)

Figura 1 - 5Vs do Big Data... 33

Figura 2 - Exemplo de dados estruturados - Cadastro de Cliente em Excel... 37

Figura 3 - Exemplo de dado não estruturado - Rede Social... 37

Figura 4 - Exemplo de dados semiestruturados - Cadastro de Cliente em formato XML... 38

Figura 5 - Principais tecnologias de Big Data e suas definições... 43

Figura 6 - Exemplo de ambiente Big Data e tecnologias associadas... 48

Figura 7 – Captura de Tela do Software RapidMiner... 55

Figura 8 – Captura de Tela do Software Pentaho Business Intelligence... 58

Figura 9 - Metadados das pesquisas da Revisão Sistemática de Literatura... 61

Figura 10 - Processo tradicional de análise de dados... 65

Figura 11 - Caracterização da criação de valor... 77

Figura 12 - Comparação de criação de valor entre cenário tradicional e cenário Big Data... 79

Figura 13 - Desenho do processo do método proposto... 85

Figura 14 - Determinar a diretriz estratégica... 86

Figura 15 - Definição da pergunta principal da análise... 86

Figura 16 - Dados que podem responder à pergunta da análise... 87

Figura 17 - Preparação dos dados para análise... 88

Figura 18 - Processamento dos dados para análise... 89

Figura 19 – Realização da análise de dados... 90

Figura 20 - Identificação de valor... 91

Figura 21 - Exemplo de gráfico de densidade dos dados de presenças e faltas... 101

Figura 22 - Exemplo de análise de dados... 103

Figura 23 - Gráfico de distribuição de frequência sobre tempo de espera da consulta... 104

Figura 24 - Gráfico de distribuição de frequência sobre envio de SMS... 105

Figura 25 - Análise de faltas por dias da semana... 106

(9)

Quadro 1 - Cenário tradicional da Criação de Valor... 25

Quadro 2 - Características do termo Big Data... 29

Quadro 3 – Desafios de Pesquisas em Big Data... 41

Quadro 4 – Etapas da Revisão de Literatura... 61

(10)

Tabela 1 - Características dos grupos... 102 Tabela 2 - Resumo da análise preditiva... 107 Tabela 3 – Comparação entre Comparecimentos e Ausências em consultas médicas... 110

(11)

ACID - Atomicidade, Consistência, Isolamento e Durabilidade AI - Inteligência Artificial

BD2K - Big Data para o conhecimento BDA - Big Data Analytics

BI & A - Business Intelligence and Analytics BI - Business Intelligence

BPMN - Business Process Model and Notification CI - Ciência da Informação

CPS - Cyber-Physical Systems

CRM - Gestão do Relacionamento com o Cliente DATASUS - Departamento de Informática do SUS DBaaS - Banco de dados como Serviço ERP - Enterprise Resource Planning

e-SUS - Prontuário Eletrônico do sistema de gestão hospitalar GDS - Gerência de Desenvolvimento de Sistemas

GNU - General Public

IDSUS - Índice de Desempenho do Sistema Único de Saúde LLE - Locally linear embedding

LOD - Linked Open Data

ML - Machine learning

NIH - Institutos Nacionais de Saúde NLP - Linguagem natural

PMI - Project Management Institute

RDBMS - Sistemas de Gerenciamento de Banco de Dados Relacional

RDD - Resilient Distributed Dataset SQL - Structured Query Language SSD - Solid-state disks

SUS - Sistema Único de Saúde TI - Tecnologia da Informação

(12)
(13)

1 INTRODUÇÃO... 15 1.1 JUSTIFICATIVA... 17 1.2 OBJETIVOS... 20 1.2.1 Objetivo Geral... 20 1.2.2 Objetivos Específicos... 20 2 REVISÃO DE LITERATURA... 23

2.1 CRIAÇÃO DE VALOR TRADICIONAL... 23

2.2 BIG DATA... 27

2.2.1 Os Vs que caracterizam o Big Data... 33

2.2.2 As estruturas dos dados em cenários Big Data... 36

2.2.3 Desafios do Big Data... 38

2.3 TECNOLOGIAS, TÉCNICAS E FERRAMENTAS ASSOCIADAS... 42

2.3.1 Armazenamento e infraestrutura... 44

2.3.2 Framework de arquitetura... 47

2.3.3 Linguagens de programação... 49

2.3.4 Técnicas de mineração de dados... 51

2.3.5 Tecnologias e software de mineração de dados... 54

2.3.6 Visualizações de análises... 56

3 ASPECTOS METODOLÓGICOS... 59

3.1 CARACTERIZAÇÃO DA PESQUISA... 59

3.2 DEFINIÇÃO DO CORPUS DA REVISÃO DE LITERATURA... 60

3.3 ETAPAS DA PESQUISA... 63

4 CRIAÇÃO DE VALOR: ABORDAGENS TRADICIONAL E BIG DATA... 65

4.1 CRIAÇÃO DE VALOR EM ORGANIZAÇÕES QUE IMPLEMENTAM BIG DATA... 66

4.2 COMPARAÇÃO ENTRE AS VISÕES TRADICIONAL E BIG DATA DE CRIAÇÃO DE VALOR... 77

5 PROPOSTA DE MÉTODO PARA IDENTIFICAÇÃO E CARACTERIZAÇÃO DE CRIAÇÃO DE VALOR EM CENÁRIOS BIG DATA. 83 6 ESTUDO DE CASO... 95

6.1 SISTEMA ÚNICO DE SAÚDE (SUS)... 95

6.2 DESCRIÇÃO DO ESTUDO DE CASO... 97

(14)

APÊNDICE A – 01 - Plano de Análise de Dados... 133

APÊNDICE B – 02 - Análise de Dados... 135

APÊNDICE C – 03 – Relatório Final... 137

(15)

1 INTRODUÇÃO

A tecnologia está presente em um escopo cada vez mais abrangente, atingindo diferentes áreas e setores, proporcionando automações em processos, agilidade em comunicações, interações entre humanos e máquinas. Impulsionadas pela popularização do uso da Internet, ferramentas como redes sociais e sistemas de informação, estão produzindo cada vez mais dados, o que se tornou um ponto de atenção para acadêmicos e comunidade empresarial.

Na Ciência da Informação (CI), área na qual os cientistas pesquisam sobre armazenamento, acesso, processamento, recuperação, segurança e descarte de dados, o crescente volume de dados tem impacto direto em diversos destes pontos de interesse, pois potencializa os desafios científicos da área.

Nos últimos anos pode-se observar os fenômenos que abrangem os desafios tecnológicos da popularização da Internet, que são parte dos paradigmas estudados na Ciência da Informação e que estão ligados ao conceito conhecido pelo termo Big Data. O termo Big Data pode ser referenciado como um cenário, um contexto, um ambiente ou um paradigma. Neste trabalho usa-se o termo Big Data como um conceito e será referenciado sempre simplesmente como Big Data.

O Big Data representa um cenário informacional, tecnológico e cultural, que aborda desafios como: recuperação, armazenamento, velocidade de processamento, exploração de diferentes origens de dados e criação de valor, a partir de dados em grande volume, variedade de tipos e velocidade de processamento e resposta. Nesse sentido, os dados resultantes de operações, comunicações e monitoramentos, por exemplo, ganham importância como recursos que podem ser revisitados como base para criação de valor para as organizações.

Conceitualmente, o Big Data representa um conteúdo informacional que requer formas inovadoras e sustentáveis de processamento, com potencial de promover a descoberta de insights, tomada decisão e otimização de processos, por exemplo. Em particular, as características destes de dados, nas quais se destacam volume, velocidade e variedade, que são produzidas em várias fontes, subsidiam o entendimento do Big Data.

Os chamados Vs que caracterizam os cenários Big Data são o Volume, que se refere aos grandes volumes de dados gerados por sistemas organizacionais, públicos, redes sociais, entre outros. A Velocidade, que é aplicada em tempo de processamento e rapidez de feedback, por exemplo. A Variedade, que diz respeito aos diferentes

(16)

tipos de dados, que podem ser apresentados em texto, vídeos, imagens, etc. A Veracidade, que dá resposta à autenticidade dos dados, o que pode garantir a sua fidelidade nas informações e assegura a sua usabilidade. O Valor, que se refere ao processo de transformação dos dados em informação de valor para as organizações que implementam projetos em cenários Big Data.

Para Maitrey e Jha (2015), o termo Big Data tem suas raízes na criação, captura e exploração de grandes volumes de dados. Entretanto, afirmam que a criação de valor aplicada em Big Data representa um problema a ser superado. Sustenta-se que o desafio está em transformar os dados em informações que contenham valor, ou seja, que possam ser usadas nas tomadas de decisões ou em outros negócios, como em incremento de inteligência artificial na logística, por exemplo.

O termo valor é usado em áreas de diferentes aplicações, conforme o seu sentido e dependendo do contexto onde está sendo empregado (CSILLAG, 1995). O valor abordado neste trabalho é uma variável qualitativa, que caracteriza a criação de valor em Big Data. Quando tratamos o termo valor em Big Data, o objetivo central está em caracterizar as diferentes formas de criação de valor e não em termos monetários.

Com vistas aos cenários de Big Data e de valor, é possível observar que a criação de valor é um processo que depende de muitas variáveis, pois depende do objetivo a ser alcançado, quais as informações estão à disposição para serem analisadas e onde, com quais técnicas e tecnologias podem ser trabalhadas. Todos esses pontos são importantes, e são utilizados neste estudo, para que a criação de valor possa ser obtida.

Ao exemplo de empresas de informação, como a Google, Facebook e Amazon, a criação de valor se dá por meio de análises de dados. Como, por exemplo, os algoritmos de recomendação de produtos da Amazon (BARNES et al., 2015). Segundo os autores, estes algoritmos foram pioneiros e suas proposições foram ideias que deram origem a muitos outros sistemas de recomendação que compõem inúmeras soluções, como a funcionalidade de recomendações de conexões da rede de relacionamentos profissionais Linkedin. Nestes casos, buscou-se transformar dados de navegação e compras em informações de valor para recomendações de produtos similares, como argumentos de vendas.

Organizações com foco em valor adicional tendem a ampliar seus esforços, para agregar benefícios de melhoria contínua. Em Big Data, esta atitude implica em uma vontade de se adaptar e desenvolver

(17)

ativamente uma capacidade de inovar, para gerar informações de valor a partir dos dados. Consequentemente, as organizações tradicionais precisam entender como trabalhar para serem capazes de medir, pesquisar, analisar e produzir eficiência organizacional, a partir de seus dados (DAVENPORT, 2014).

Acredita-se que a utilização de grandes volumes de dados, característica do Big Data, amplia a diferença entre a real e a possível criação de valor para a maioria das organizações. Novas estratégias e iniciativas poderiam reduzir essa lacuna, estimulando novas formas de percepção de como criar valor ao se desenvolver aplicações em Big Data (MONOSTORI et al., 2015). Para este estudo a caracterização da criação de valor está relacionada a redução de custos, geração de insights para melhoria de processos e produtos, ou geração de insumos para redução de incertezas no processo de tomada de decisão.

Essa dissertação procura responder a seguinte pergunta: Como identificar e caracterizar a criação de valor em organizações que desenvolvem aplicações para Big Data?

Acredita-se que a proposição de um método para apoiar a identificação e caracterização de criação de valor em Big Data colabora para explicitação da criação de valor, para antecipação da percepção de criação de valor e permite gestão de risco, durante as análises. Em adição, a pesquisa apresentada pode fomentar novas discussões sobre como o valor é criado em Big Data, que podem ser úteis para acadêmicos e analistas de negócios.

Dessa forma, a contribuição inicial é a proposição de um método para identificação e caracterização da criação de valor em Big Data e a proposição de uma discussão comparativa entre as visões Big Data e Tradicional de Criação de Valor. Por meio deste trabalho é possível analisar as diferentes formas de criação de valor, de obtenção de resultados, da participação dos atores que contribuem para a criação de valor e da redefinição dos processos organizacionais.

1.1 JUSTIFICATIVA

Ao aprofundar o conhecimento sobre os cenários Big Data, bem como suas características, é possível observar a aproximação com os desafios da Ciência da Informação, principalmente quando evocados os propósitos interdisciplinares desta Ciência.

O conceito e a abrangência da CI têm se modificado ao longo do tempo. Observa-se a evolução, no que diz respeito às tendências e enfoques de pesquisa, desde que surge em meados do Século XX, bem

(18)

como sem seu desenvolvimento, apresentando elementos de sua relação com outras ciências. Neste curso evolutivo, a CI apresenta mudanças em seus paradigmas essenciais (BORGES, 2004).

No estudo de Pinheiro (1999), a autora sustenta que a CI tem o reconhecimento de sua interdisciplinaridade em suas características sociais relacionadas à tecnologia da informação e com o papel da informação na sociedade e cultura contemporânea. Essas características são também ressaltadas por Saracevic (1992), que acrescenta ser de natureza interdisciplinar as relações com outras disciplinas, como a conexão com a tecnologia da informação, a perspectiva de longa duração da evolução da interdisciplinaridade e a participação da CI na evolução de outras áreas, como Educação, Saúde, Tecnologia da Informação, etc.

Segundo Araújo (2003), uma importante característica da CI é a aceitação de sua essência de natureza interdisciplinar, pois vem se consolidando a partir de elementos emprestados de ciências que puderem contribuir para sua fundamentação e aplicabilidade (CARDOSO, 1996).

Algumas novas disciplinas são consideradas tendências, como Inteligência Competitiva, Gestão do Conhecimento e Mineração de Dados, por consequência da globalização e das tecnologias de informação e comunicação (TICs). Dessa forma, apresentam novas relações interdisciplinares, como por exemplo, com a Ciência da Computação, em relação à mineração de dados e de bibliotecas digitais e virtuais (PINHEIRO, 2005).

Alguns destes desafios também são temas característicos da CI, na qual pesquisa-se conhecimentos relacionados à origem, coleta, organização, estocagem, recuperação, interpretação, transmissão, transformação e ao uso de informação (BORKO, 1968).

As pesquisas sobre Big Data utilizam os recursos e os conhecimentos necessários para concluir com êxito esses estudos significativos, como utilização de dados para vendas ou identificação de destinos para viagens. Os conjuntos de dados massivos de hoje requerem cientistas de dados com experiência em análise de dados, mineração de dados e modelagem preditiva, bem como especialistas em domínios. A combinação de conhecimentos e recursos de parcerias acadêmicas/corporativas pode prover esses recursos e promover o desejo das instituições de ensino em conduzir pesquisas sobre desenvolvimentos em Big Data (CHIH-LIN et al., 2017).

Tendo em vista os desafios apresentados na literatura sobre Big Data e a CI, no âmbito dos desafios informacionais, observa-se um

(19)

encontro interdisciplinar a ser explorado para identificar a criação de valor, aplicadas em Big Data, como por exemplo, em análises de perfis de pacientes, para geração de informações valiosas que permitam melhorias em processos, produtos e serviços, além de redução de custos e suporte informacional para tomadas de decisões.

O termo Big Data tornou-se um tema relevante na indústria de computadores, em negócios financeiros e também chama a atenção dos governos, pois os dados governamentais também podem ser transformados em informações de valor, já que são de grande volume e contém dados complexos sobre a população. O surgimento do Big Data nos últimos anos, além de um requisito para o desenvolvimento ágil de aplicativos baseados em dados, criou um novo conjunto de desafios e oportunidades (ZHU et al., 2017).

Considerando o aumento da produção de dados nos últimos anos, Eric Schmidt, presidente do Google, chegou a afirmar que, no final da primeira década dos anos 2000, a cada dois dias, teriam sido criadas a mesma quantidade de dados acumulada desde o início de nossa civilização até o ano de 2003 (ECONOMIST INTELLIGENCE UNIT, 2012). Tais informações sobre o crescimento dos volumes de dados, ainda que aproximadas, caracterizam um desafio a ser estudado, analisado, trabalhado e explorado.

E como é possível transformar todos esses dados em informações de valor? Um princípio básico para essa transformação pode ser a criação de indicadores que apontem a existência de valor para posterior caracterização, que pode explicitar a utilidade destas informações, e possível confirmação e exploração das conclusões estabelecidas.

Objetiva-se também desenvolver formas de antecipar a identificação de valor, pois as análises podem ser prolongadas, o que reflete em tempo e recursos valiosos, portanto, é desejável obter indicativos de que a probabilidade de êxito aumenta ou diminui conforme o avanço da análise. Isso permite, por exemplo, tomada de decisão em relação à persistência ou abandono da análise.

Em se tratando de uma percepção subjetiva, ou seja, complexa de medir com clareza o resultado possível, a necessidade de controle de risco é relevante, pois permite gestão a partir dos dados observados ao longo das análises de dados.

Nesse contexto, observa-se que não existe uma fórmula para extrair valor de em Big Data, pois depende da aplicação realizada. Dessa forma, configura-se a necessidade e a dificuldade de definir formas de identificar e caracterizar a criação de valor no universo do Big Data. Assim, vistas às dificuldades em caracterizar a criação de valor,

(20)

interessa aos cientistas da informação desenvolver uma pesquisa para explicitar a identificação e caracterização de criação do valor em Big Data. Existe a necessidade de encontrar formas de especificar a criação de valor em Big Data, bem como identificar o seu potencial para as organizações (TAURION, 2012).

Até o momento não foram encontrados quaisquer trabalhos que tratem especificamente desta proposta de pesquisa, conforme dados apresentados na seção de Definição do corpus da revisão de literatura, junto ao capítulo de Aspectos Metodológicos.

1.2 OBJETIVOS

Nas próximas seções apresenta-se o objetivo geral e objetivos específicos delineados para este estudo.

1.2.1 Objetivo Geral

Propor um método para identificação e caracterização de criação de valor em Big Data.

1.2.2 Objetivos Específicos

a) Identificar as formas tradicionais de criação de valor;

b) Caracterizar a criação de valor em organizações que utilizam aplicações para Big Data;

c) Comparar as visões tradicional e Big Data de Criação da Valor;

d) Desenvolver o método proposto;

e) Analisar um estudo de caso para validação do método proposto.

O restante deste trabalho está estruturado da seguinte forma: no primeiro capítulo apresenta-se, além da introdução, a justificativa, o objetivo geral e os objetivos específicos; o segundo capítulo é dedicado à revisão de literatura; o terceiro capítulo apresenta os aspectos metodológicos da pesquisa; o quarto capítulo é dedicado à discussão sobre as abordagens tradicional e big data de criação de valor; o quinto capítulo apresenta a proposta de método para identificação e caracterização da criação de valor em Big Data; o sexto capítulo traz o estudo de caso; e o sétimo capítulo apresenta as conclusões.

(21)

apresentadas e conceituadas a Criação de Valor o Big Data e as tecnologias, técnicas, ferramentas existentes para utilização em Big Data, onde estão descritas as tecnologias, técnicas, ferramentas utilizadas no estudo de caso apresentado neste trabalho.

(22)
(23)

2 REVISÃO DE LITERATURA

Neste capítulo são apresentados os cenários de Criação de Valor, Big Data e tecnologias, técnicas, ferramentas, modelos e exemplos, bem como os fatores relacionados à criação de valor em Big Data.

No que diz respeito às tecnologias, técnicas, ferramentas, a revisão apresenta uma amostragem na qual estão relacionadas algumas das mais utilizadas, bem como para qual tipologia de análise elas são mais úteis. É importante salientar que as tecnologias, técnicas e ferramentas podem ser usadas de forma complementar, dependendo da natureza da análise e dos dados.

Sendo assim, quando se inicia uma análise de dados em Big Data é importante saber o objetivo, os dados disponíveis, os tipos de técnicas, tecnologias e ferramentas possíveis de exploração para cada conjunto de dados, pois estas informações são base para o planejamento da análise e definição dos recursos que serão utilizados para a criação de valor. 2.1 CRIAÇÃO DE VALOR TRADICIONAL

Os primeiros estudos sobre análise de valor são referenciados durante a Segunda Guerra Mundial. Nessa época houve escassez de trabalho, matérias-primas e componentes para produtos, como consequência da própria Guerra.

“As técnicas de Análise de Valor e de Engenharia de Valor tiveram início durante a última guerra mundial e foram consolidadas efetivamente nos EUA entre 1947 e 1952”. (CSILLAG, 1995).

Portanto, a referência de cenário tradicional de criação de valor utilizada neste trabalho é o cenário descrito neste período, entre 1947 e 1952, e relatada por Csillag (1995) no livro Análise de Valor.

A história conta que, em 1947, a indústria americana General Electric (GE) enfrentou dificuldade para encontrar um item essencial para a empresa, que eram a folhas de amianto. Então Lawrence Miles, Jerry Leftow e Harry Erlicher, homens de confiança dos executivos da empresa, passaram a pesquisar insumos alternativos, que permitissem a produção do mesmo produto final, com menor custo (ADHIKARI, 2013).

Coube a Lawrence Miles, desenvolver um método de análise de valor, que foi descrita no livro Techniques of Value Analysis and Engineering, em 1989. Nesse trabalho, Miles afirma que o valor é caracterizado quando o produto, bem ou serviço tem desempenho e custo adequados. Portanto, para aumentar o seu valor é possível

(24)

aumentar o seu desempenho ou reduzir o seu custo. O valor sempre aumenta quando o seu custo é diminuído (MILES, 1989).

A expressão valor é referenciada por Csillag (1995), como sendo um trabalho que busca determinar o valor dos bens e serviços, sendo na visão do fornecedor ou cliente, ou seja, um esforço organizado, dirigido para as funções de produtos, bens e serviços, que busca atingir seus objetivos de maneira mais rentável.

O autor sustenta que o termo foi referenciado inicialmente como Engenharia de Valor e foi aplicado na identificação da função de um produto ou serviço, para estabelecer um valor para a função e para obter tal função ao menor custo total. No entanto, com o passar do tempo, o termo Engenharia de Valor passou a ser considerado sinônimo de Análise de Valor, por abranger os setores técnicos, produtivos, administrativos, financeiros e de mercado, no que se refere ao termo valor. Passou, então, a ser nomeado Gerenciamento de Valor, quando deixou de ser considerado um produto em si, para englobar processos das empresas, como investimentos, procedimentos e sistemas organizacionais.

Com o intuito de caracterizar o cenário tradicional para a criação de valor, foi elaborado o Quadro 1, contendo as referências da literatura e respectivas obras.

(25)

Quadro 1 - Cenário tradicional da Criação de Valor

Autor Caracterização

Heller (1971)

O conjunto de técnicas desenvolvidas para identificar as funções necessárias de um produto, estabelecer um valor para o mesmo e desenvolver alternativas para produzi-los com menor custo.

Ramírez

(1999) No modelo tradicional, o valor é criado pelas empresas, os clientes são apenas destinatários de valor. Vargo e Lusch (2004) Vargo e Morgan (2005)

O valor é criado pela empresa e distribuído no mercado, geralmente por meio de troca de bens e dinheiro. A partir desta perspectiva o papel de “produtores” e “consumidores” é distinto e a criação de valor é vista como uma série de atividades realizadas pela empresa.

Vargo, Maglio e Akaka (2008)

Os modelos tradicionais de criação de valor se concentram na produção orientada a métodos de produção ao menor custo para a empresa.

Milyakov, Tanev e Ruskov

(2011)

A mercadoria lógica dominante está preocupada principalmente com a produção de saída na forma de bens manufaturados. Isto está de acordo com o desenvolvimento tradicional do produto, no qual a preocupação é a produção e venda de valor na forma de produtos físicos.

Rapitsenyane, Bhamra e Trimingham

(2014)

As abordagens de criação de valor tradicionais, muitas vezes, desconectam os produtores dos clientes finais que estão no ponto de venda.

Moritz et al. (2015)

A capacidade de criar e manter vantagens competitivas é crucial para uma empresa para realizar lucros e sobreviver em longo prazo. Além dos fatores tradicionais, como tempo, custo, qualidade, etc., nos últimos anos têm evoluído fatores secundários que permitem às empresas a manter sua posição, enquanto as condições de mercado ou o ambiente da indústria estão mudando rapidamente.

Fonte: Furtado, Dutra e Macedo (2016b).

A entrega de valor compreende todas aquelas atividades envolvidas em entregar o produto, bens ou serviços. Estes atributos são considerados necessários para criar a satisfação do cliente e de manter um relacionamento contínuo de longo prazo com os clientes, com o intuito de criar vantagens competitivas para a organização.

A natureza do termo valor vem sendo discutida na literatura desde Aristóteles, há mais de 2.000 anos (CSILLAG, 1995). Desde então, foram sendo formadas as bases da concepção tradicional do

(26)

processo de criação de valor. Nesse cenário tradicional, os consumidores não tinham participação efetiva, pois a criação de valor encontrava-se dentro das empresas, por meio de suas atividades (PRAHALAD; RAMASWAMY, 2004) e criação de novos produtos e serviços, configurando-se em um fluxo de dentro para fora.

No entanto, um dos motivos que proporciona as diferenças de cenários sobre o valor é a dificuldade de tangibilização, no sentido de permitir mensuração ou de tornar palpável, somada ao fato que de estes cenários são aplicados em diferentes áreas. Segundo Walters e Lancaster (1999), em um contexto tradicional de contabilidade, o valor é definido como o preço de venda menos o custo de matéria-prima e das atividades de produção.

Em um contexto coloquial, é utilizado para benefícios perceptíveis pelos clientes, sendo que estes podem ser tangíveis ou intangíveis e são, por definição, muitas vezes difíceis de terem seu valor mensurado.

Os termos valor e criação de valor são descritos como essenciais para o conceito de serviço, definidos como a aplicação de competências, conhecimentos e habilidades, por uma entidade em benefício da outra (VARGO; LUSCH, 2004, 2006).

Os modelos tradicionais de criação de valor baseiam-se na produção e preço sendo, o serviço representado pela aplicação de competências e o sistema de serviço representado pelos recursos, incluindo as pessoas, informações e tecnologia, conectados a outros sistemas de propostas de valor. A ciência serviço é o estudo dos sistemas de serviços e da cocriação de valor (VARGO; MAGLIO; AKAKA, 2008).

Em complemento, cabe citar que para criar novos ou melhores produtos, as empresas precisam realocar recursos, para combinar novos recursos ou para combinar os recursos existentes de novas maneiras. Argumentos semelhantes aparecem na literatura sobre a inovação organizacional (TSAI; GHOSHAL, 1998).

Entretanto, as características dos mercados virtuais combinados com os custos muito reduzidos de processamento de informação permitem mudanças profundas na forma como as empresas operam e em como as trocas econômicas são estruturadas. Estas características permitem novas oportunidades para a criação de valor (AMIT; ZOTT, 2001).

Portanto, observa-se que a criação de valor no cenário tradicional, que data de 1947 a 1952, se caracterizava por ser um esforço do produtor, para produção de produtos ao menor custo. Além disso, o

(27)

cenário tradicional de criação de valor era uma responsabilidade isolada da organização e que estava desconexa com o desejo do cliente, que não tinha oportunidade de participar da escolha do que devia ser produzido. Ao consumidor apenas era oferecida a novidade proposta pelo produtor. No cenário tradicional existiam duas formas básicas para a criação de valor, sendo que uma delas era a redução de custos e a outra era melhoria dos produtos para geravam maior valor agregado, aumentando a possibilidade de venda com maior preço e maior rentabilidade.

Na literatura consultada, a mais citada é a redução de custos, caracterizada pela busca por formas alternativas de entregar o mesmo produto com menor custo, um conceito que teve origem na escassez de matéria prima, logo após a Segunda Guerra Mundial.

Neste contexto, observa-se que as organizações desenvolveram processos internos para buscar otimização em suas atividades, alternativas para substituição de matéria-prima por insumos de menor custo, entre outras práticas que resultam em redução dos gastos em todo o processo produtivo.

Em complemento, pode-se observar que o segundo ponto de atenção era geração de novos produtos, com a percepção da própria empresa sobre oportunidades de mercado. Nestes casos, a criação de valor acontecia de dentro para fora, ou seja, quando existia uma ação da organização em explorar um novo negócio.

Contudo, no cenário tradicional esta percepção ocorria de forma isolada, sem a participação dos clientes, o que demandava toda a responsabilidade de inovação para a organização, aumentando o risco de sucesso de uma proposta, muitas vezes não validada pelo mercado e seu público.

Portanto, evidencia-se que as formas tradicionais de criação de valor eram conservadoras em relação às praticadas atualmente, onde se busca participação dos clientes, para minimizar riscos, e exploração de novas formas de criação de valor, conforme é apresentado na próxima seção, na qual são relacionados trabalhos com relatos de criação de valor em Big Data.

2.2 BIG DATA

Big Data é um termo criado para denominar um cenário caracterizado por necessidades de captura, processamento, armazenamento e análises superiores às capacidades das estruturas tradicionais.

(28)

Para Akerkar (2014), Big Data é um termo usado para descrever grandes volumes de dados, sendo estes estruturados e não estruturados, por organizações que querem aproveitar e analisar tais informações. Sendo assim, Big Data corresponde às grandes quantidades de dados, suas variações de tipos, em áudio, vídeo, texto, entre outros, e sua necessidade de velocidade, no que diz respeito ao acesso, processamento, consulta e resposta.

Nesse sentido, pode-se dizer que a capacidade que as organizações têm de obter informações de maneiras novas, a fim de gerar ideias úteis, bens e serviços de valor significativo, é uma característica do Big Data. Ciências como a Astronomia e a Genômica, que vivenciaram uma "explosão" de dados nos anos 2000. Atualmente, o cenário está migrando para todos os campos do conhecimento humano (MAYER-SCHONBERGER; CUKIER, 2013a), como na saúde, para identificação de semelhanças em tratamentos de clientes, ou no turismo, para identificação de destinos de interesse para determinados perfis de clientes.

Muitas organizações em todos os setores são levadas a lidar com uma enorme quantidade de dados, em função do seu modelo de negócios. Dados em grandes quantidades podem oferecer insights valiosos e vantagem competitiva, se as organizacionais tiverem os recursos tecnológicos necessários. Recentemente, vários acadêmicos e profissionais enfatizaram a necessidade de entender como, porque e quando as aplicações de análises de dados em Big Data podem ser consideradas um recurso valioso para as empresas obterem vantagem competitiva (CÔRTE-REAL; OLIVEIRA; RUIVO, 2017).

O aumento do volume de informação e a ampliação da capacidade de armazenamento são frutos do desenvolvimento tecnológico e influenciam características do Big Data. Nesse contexto, arquivos como filmes em vídeos e áudios, que eram considerados grandes ao ponto de não se poder armazená-los em grande quantidade, por exemplo, nos disquetes do tipo 3½ utilizados nos anos 1980 e 1990, atualmente são tão comuns que são compartilhados facilmente por e-mail, WhatsApp, Google Drive, DropBox, pen drives, smartphones, entre outros. Portanto, percebe-se como a relação entre capacidade de armazenamento e geração de dados tem mudado, e quanto os volumes são maiores atualmente.

Existem muitos fatores que caracterizam o Big Data. Para melhor compreensão, o Quadro 2 apresenta as características de trabalhos citados na literatura.

(29)

Quadro 2 - Características do termo Big Data

Autor Característica

Maitrey e Jha (2015)

Big Data refere-se a várias formas de grandes conjuntos de informações, que requerem plataformas computacionais especiais, a fim de serem analisadas. YU et al.

(2015)

A quantidade de dados torna proibitiva a análise em um software comum, tal como o Microsoft Excel, pois os dados devem ser analisados em um ambiente para Big Data. Uma vez que este desafio é vencido, há uma oportunidade para o usuário obter melhorias no processo de tomada de decisão.

Malliu et al. (2015)

Aplicações de Big Data: os conjuntos de dados são tão grandes que as técnicas de armazenamento e análise convencionais não são apropriadas para processá-los. Hurwitz et al.

(2013)

Com Big Data é possível virtualizar dados e armazená-los de forma eficiente, em nuvem. Ficou mais fácil gerenciar grandes quantidades de dados a partir das melhorias de velocidade e confiabilidade das redes. Soma-se a isso a diminuição de cursos e a melhoria das memórias dos computadores.

Stubbs (2014)

Estamos gerando mais dados do que nunca. Estamos gerando mais tipos de dados do que nunca. E nós os estamos gerando mais rápido do que antes. Big data representa um ponto de inflexão no que consideramos a relação "normal" para volumes históricos, variedade e velocidade de dados.

Sakr, Gabersakr (2014)

Em princípio, o cerne do desafio de Big Data é ganhar a capacidade de analisar e compreender a informação em grande escala, de forma tão fácil quanto se faz atualmente para analisar e compreender volumes menores de informações estruturadas.

Fonte: O autor.

Entre 2000 e 2003, Hal Varian e Peter Lyman, da Universidade da Califórnia em Berkeley, conduziram um projeto chamado "Quanta informação?", sendo uma pesquisa sobre a quantidade de dados produzidos, armazenados e transmitidos, por organizações, governos e pessoas. Esse estudo revelou que a quantidade de dados armazenados, em todo o mundo, dobrou de 1999 a 2002, com uma taxa de crescimento anual de vinte e cinco por cento (25%) (MANYIKA et al., 2011).

A empresa de gestão de informações EMC (2011) patrocinou a empresa de pesquisas IDC para produzir uma série anual de relatórios sobre o "Universo Digital" para dimensionar a quantidade de

(30)

informações digitais criadas e replicadas a cada ano. Estes relatórios mostram que a quantidade de dados digitais gerados no ano de 2007, ultrapassou a capacidade de armazenamento do mundo, pela primeira vez. Também foi evidenciado que a quantidade de dados produzidos crescera mais rápido do que a quantidade de armazenamento. Eles projetaram que o volume deve crescer 44 vezes até 2020, com uma taxa de crescimento de 40% (MANYIKA et al., 2011).

Nos Estados Unidos, após a iniciativa apresentada pela Administração Obama em 2012, na qual as intenções de votos foram analisadas por algoritmos que rodaram em Big Data, o Gartner listou Big Data em ambas as "Top 10 Tendências Estratégicas de Tecnologia para 2013" e "Top 10 Tendências de tecnologia crítica para os próximos cinco anos". Muitos outros projetos e solicitações, como a US National Science Foundation e a National Science Foundation da China, se comprometeram a investigar e enfrentar os desafios em Big Data. Os cenários de Big Data trazem grande valor, pois o valor assume a forma de uma cadeia de valor e é criado por meio dos processos de descoberta, integração e exploração de dados (WANG et al., 2016).

Para exemplificar diferentes necessidades de utilização de dados pode-se citar, no setor financeiro, as repartições administrativas governamentais, varejo e atacado que geram a maioria de suas informações em textos e dados numéricos, incluindo dados de clientes, informações de transações e modelagens matemáticas, enquanto setores como fabricação, saúde e meios de comunicação geram mais informações em multimídia (MANYIKA et al., 2011).

No setor de segurança, é possível citar o trabalho com dados de vídeos coletados por aparelhos voadores não tripulados chamados de drones, feito pelo Pentágono, também nos Estados Unidos. Neste caso, destaca-se a necessidade de uma análise confiável, eficaz, robusta e passível de ser automatizada, segundo Davenport (2014).

Já no setor de varejo, as aplicações do tipo e-commerce exigem necessidade de velocidade de processamento, em recomendação de compra, para que o sistema seja capaz de interagir com o cliente em tempo real, durante processo de compra.

Entretanto, a definição do termo Big Data é considerada inerentemente vaga. É um cenário, que se refere ao estudo da gerência e o processamento de grandes conjuntos de dados, usados para a interpretação direta e individual. Esta limitação da interpretação comporta o risco de confusão, pois ela realmente tem dois significados. Primeiramente, se refere ao limite atual no poder de computação, pois à medida que a quantidade de dados coletados cresce em relação ao limite,

(31)

novas técnicas precisam ser desenvolvidas. Também pode-se citar como limitante a interpretação humana, na qual o desenvolvimento orientado pelo homem é necessário porque somente os cientistas podem declarar o que os dados realmente significam (SHA; CAROTTI-SHA, 2016).

A proposição de valor da computação cognitiva baseia-se na capacidade de oferecer insights contextualizados a um tomador de decisões humano (REYNOLDS, 2016). Portanto, se refere à análise de dados utilizada em favor da geração de insights para os tomadores de decisão.

A mudança oportunizada por Big Data também está na capacidade de capturar e filtrar dados em várias plataformas de forma fácil, rápida e barata. A agilidade em lidar com grandes dados é um diferencial para obter uma vantagem competitiva com decisões tomadas com base em informações colhidas em dados (MONTEIRO, 2016).

Ao observar a evolução da tecnologia e suas tendências, é possível analisar algumas questões inerentes aos conhecimentos relacionados com os cenários Big Data, como a preparação das equipes e infraestruturas para um novo cenário com grandes volumes de dados, a observação sobre as ações das empresas em relação a essas tendências, a exploração de dados externos às organizações, a possibilidade de redução de custos, a variação dos tipos de dados, a necessidade de maior agilidade para capturar, analisar e tomar decisão e, sendo assim, a comunidade científica aproxima seus olhares do assunto e seus interesses.

Em março de 2016 a revista KMWord1 realizou uma pesquisa com 483 de seus assinantes, sendo eles executivos e gerentes. O objetivo foi saber se os cenários Big Data fazem parte do mundo destes profissionais. A maioria dos entrevistados se disse desafiado pelo gerenciamento de dados com grandes volumes, diferentes formatos e alta velocidade, chegando a 57% das respostas. No entanto, relatou-se que é necessária maior colaboração, como troca de experiências, entre profissionais de gestão em relação aos que trabalham com grandes tecnologias de dados. Observou-se que 20% dos profissionais não colaboram em tudo, 25% informaram que não estão cientes de que existem colaborações em andamento, 35% disseram que existe algum tipo de colaboração entre gestores e analistas de dados, e em 14% os analistas de dados e gerentes são os mesmos (MCKENDRICK, 2016).

De acordo com o relatório Forrester 2016, do governo dos EUA, sobre o impacto da tecnologia nos programas de viagens, as maiores

(32)

mudanças na Tecnologia da Informação (TI) do governo estão em áreas de experiência do cliente, mobilidade, Big Data e governo digital. Os pontos mais citados foram a segurança em viagens, segurança de dados e relatórios de coletas de dados, pois os gerentes de viagens também informam que dão grande valor ao acesso a dados de viagem, às negociações de contratos com fornecedores, ao monitoramento de conformidade e à identificação formas de poupar grandes somas de dólares (KIERSTEAD, 2016).

Essa pesquisa revela que existem desafios a serem ultrapassados, em relação aos próprios conhecimentos dos gestores em relação ao valor oferecido pela oportunidade de exploração de dados, bem como pela relação, ainda distante dos profissionais que trabalham com análises de dados em relação aos executivos e gerentes de algumas organizações.

Em contraponto, um exemplo de bons resultados com antecipação de tendências, com análises de dados em Big Data, que revelam subsídios de informações para tomada de decisões está no caso Ebola Response, dos Centros de Controle e Prevenção de Doenças (CDC), na China. Este estudo coordenou uma força-tarefa de Modelagem da Resposta de Emergência ao Ebola. Foram analisados dados epidemiológicos com um modelo de cadeia baseado em planilhas para fornecer projeções de incidência, com e sem escalonamento de intervenções eficazes, aos formuladores de políticas. Usando-o como uma ferramenta de comunicação, a força-tarefa comunicou as possíveis consequências, como por exemplo, a possibilidade de um surto de Ebola, reportando-se para altos tomadores de decisão (FUNG; TSE; FU, 2015).

Segundo os autores, este estudo teve um impacto substancial na política sobre a resposta global ao Ebola, em função da mensagem que levou a políticos, o que resultou em maiores facilidades para mobilizar recursos e ações imediatas contra o Ebola. (FUNG; TSE; FU, 2015).

O avanço das TIs é um dos fatores considerados influentes na mudança dos sistemas de saúde em todo o mundo. O uso de grandes dados nos cuidados de saúde continua a gerar um intenso interesse. Há muita especulação sobre as perspectivas de explorar grandes bases de dados com ferramentas de análises preditivas, como por exemplo, para identificar as crises de saúde antes mesmo de começarem (RISLING, 2017).

O Big Data tem despertado grande interesse da comunidade organizacional, governamental e científica, pois ainda é pouco explorado e apresenta grandes limitações técnicas, principalmente pela complexidade que apresenta, o que afasta sua manipulação da maioria

(33)

da população mundial, que não é técnica. Sendo assim, a sua aplicabilidade ainda é pouco explorada, bem como a sua possibilidade de criação de valor.

2.2.1 Os Vs que caracterizam o Big Data

Atualmente os cenários Big Data estão apoiados em três características mais citadas na literatura, que são o Volume, a Velocidade e a Variedade, adicionadas a duas que se pode considerar emergentes, que são o Valor e a Veracidade, conforme mostra a Figura 1.

Figura 1 - 5Vs do Big Data

Fonte: Adaptado de Ishwarappa e Anuradha (2015).

Big Data refere-se às quantidades de dados armazenados em servidores locais ou em nuvem, que crescem, por exemplo, a cada comentário postado nas redes sociais, foto compartilhada, imagem captada por câmeras de vigilância.

Entre os desafios das estruturas de TI convencionais podemos citar os armazenamentos escaláveis, ou seja, com facilidade de

(34)

ampliação de infraestrutura, como aumentar memória ou número de processadores, bem como as abordagens para realizar consultas, pois muitas empresas que têm grandes quantidades de dados arquivados, sem capacidade de processá-los (DUMBILL, 2012).

O número de usuários de informações de pesquisa sofisticadas também está crescendo com o aumento no Volume de dados e resolução. Por exemplo, por meio de aplicações de novas tecnologias e novas metodologias para adquirir, processar e descobrir dados em Big Data, o desenvolvimento econômico sustentável e o gerenciamento de recursos para o ambiente marinho podem ser alcançados (HOLLAND; A HOGGARTH; NICHOLSON, 2016).

Quanto à Velocidade, observa-se que está caracterizada pelo uso de equipamentos que permitem mobilidade, como smartphones e tablets, representam uma nova forma de entregar e consumir produtos e serviços, que está cada vez mais instrumentada, gerando um aumento no fluxo de dados nos servidores. A importância reside na velocidade do ciclo de feedback, ou seja, velocidade de resposta aos comandos dos usuários, processando dados de entrada por meio de algoritmos de decisão (DUMBILL, 2012).

Atualmente, existem expectativas e necessidades de processamentos on-line, como por exemplo, os sites de compras on-line, que contam com algoritmos de recomendação, capazes de recomendar produtos de forma rápida, pois podem interferir na decisão de compra do cliente. Outro exemplo é o aplicativo Waze2, um sistema de trânsito e navegação utilizado por milhares de pessoas, que apresenta compartilhamento de informações do trânsito em tempo real.

O Twitter3 é citado como exemplo de capacidade de processamento e velocidade, pois faz até 1% de todos os tweets disponíveis em tempo real, por meio de uma técnica de amostragem aleatória que representa a maior população de tweets. Embora seja possível pensar que 1% pareça insignificante, a velocidade está associada a dezenas de milhares de tweets por segundo. O acesso a até 1% de todos os tweets públicos é significativo (RUSSELL, 2013).

Quanto à Variedade, observa-se que se refere à complexidade dos dados em várias estruturas diferentes, que são encontradas em diferentes repositórios de dados, desde bases de dados relacionais até fontes de textos com dados brutos (SAKR; GABERSAKR, 2014).

Análises de textos extraem informações de dados textuais, como

2 Waze: https://www.waze.com 3 Twitter: https://twitter.com/

(35)

postagens em redes social, e-mails, textos publicados em blogs, Fóruns online, respostas a pesquisas, documentos corporativos, notícias e registros de centro de chamadas são exemplos de dados textuais mantidos por organizações. As análises de texto envolvem com apoio de análise estatística, linguística computacional e aprendizado de máquina. As análises de texto permitem que as organizações convertam grandes volumes de texto gerado por seres humanos em valores significativos, que suportam a tomada de decisões baseadas em evidências (GANDOMI; HAIDER, 2015).

Muitas vezes a Variedade é citada, com o mesmo sentido, utilizando-se o termo heterogeneidade. Para Dumbill (2012), por exemplo, a heterogeneidade dos dados é caracterizada por diferentes naturezas, que podem ser, por exemplo, em texto, a partir de redes sociais, de imagem, vinda de smartphones, ou uma alimentação não tratada a partir de sensores. Em sua maioria, nenhuma dessas origens está pronta para integração em uma aplicação.

A Veracidade depende de vários fatores que incluem a idoneidade e experiência, das fontes de dados. Esses dois fatores são responsáveis por fornecer credibilidade sobre a qualidade dos dados (RAMACHANDRAMURTHY; SUBRAMANIAM; RAMASAMY, 2015). Os autores Ishwarappa e Anuradha (2015) acrescentam que a acurácia das análises depende da veracidade dos dados de origem.

Finalmente o Valor, que é foco deste trabalho, refere-se ao processo de extrair valor das informações a partir de grandes conjuntos de dados e é, normalmente, referido em análises de Big Data. Valor é a característica chave em qualquer aplicação baseada em Big Data, pois permite gerar informações úteis para o negócio (BELLO-ORGAZ; JUNG; CAMACHO, 2016), sendo assim, refere-se aos resultados econômicos e sociais gerais dos desenvolvimentos em Big Data (MONOSTORI et al., 2015).

Como exemplo, pode-se citar tecnologias aplicadas em Big Data para realização de pesquisas sobre cuidados com a saúde, combinados com eficiência dos diagnósticos e redução de custos, entre outros (LAVANYA et al., 2015).

Além das cinco características mais citadas do Big Data, alguns autores fazem referência a algumas outras, como por exemplo, Xie (2015) que cita a Variabilidade, como tendo multicamadas que causam as variações de dados a partir das diferentes camadas e a Visualização, que se refere às possibilidades de explicitar os resultados de análises de dados.

(36)

Wu e Wang (2015) sustentam que os recursos de computação são limitados, mas que os sistemas devem fornecer serviços escaláveis e eficientes, pois devem ser capazes de suportar diferentes trabalhos de análise.

O conhecimento das características do Big Data está ligado ao próprio conhecimento do cenário, pois são elas que permitem o reconhecimento destas condições e é por meio delas que se estabelece as necessidades de técnicas e tecnologias que as funcionalidades propostas por cada análise podem demandar.

2.2.2 Estruturas de dados em Big Data

O desafio do Big Data tem sido o de mostrar-se eficiente na adaptação de tecnologias, face à forma com que as informações são geradas, sendo que estas podem ser apresentadas de diversas maneiras, seja como textos publicados em campos de observações em sistemas de informação ou em comentários de redes sociais, seja como fotos em sites na Internet ou aplicativos para tablets e celulares, seja como informações capturadas por sensores, por exemplo, de medidores de temperatura ou velocidade, seja de outra forma.

A utilização de bases de dados relacionais e não relacionais tem reflexo na estrutura dos dados, que podem ser estruturados, não estruturados ou semiestruturados, sendo considerados estruturados quando organizados de forma fixa em linhas e colunas de bancos de dados relacionais; não estruturados, quando não residem campos fixos, incluem textos de forma livre, como livros, artigos, corpo de mensagens em correio eletrônico, microblogs, sites, entre outros, áudios sem etiqueta, imagens e dados de vídeos; e semiestruturados que não têm campos fixos, mas contêm tags de identificação ou marcadores com elementos de dados separados, por exemplos arquivos eXtensible Markup Language (XML) (MANYIKA et al., 2011).

Cada tipo de estruturação de dados apresenta seus desafios e pode ser caracterizado a partir de exemplos, conforme segue (SAWANT; SHAH, 2013):

 Dados estruturados: dados estruturados são analisados em organizações usando métodos de acesso estruturado como Structured Query Language (SQL), com origem em bancos de dados relacionais, utilizadas na maioria dos sistemas organizacionais, como Enterprise Resource Planning (ERPs), usados para integração dos processos empresariais, Customer Relationship Management (CRM), usados para gestão de

(37)

relacionamento com clientes e/ou Sistemas de Gestão. A figura 2 apresenta um exemplo de dados estruturados.

Figura 2 - Exemplo de dados estruturados - Cadastro de Cliente em Excel

Fonte: O Autor, captura de tela do Excel.

 Dados não estruturados: novas fontes de dados que contribuem para os dados não estruturados são sensores, web logs, dados de interação gerada por humanos como fluxos de cliques, tweets, chats do Facebook, mensagens de texto para celular, e-mails, e assim por diante. Dados não estruturados são os dados armazenados em diferentes estruturas e formatos, ao contrário de um banco de dados estruturado, no qual os dados são armazenados em uma linha-coluna fixa como a estrutura. Figura 3 - Exemplo de dado não estruturado - Rede Social

(38)

 Dados semiestruturados: que contemplam elementos como tags ou marcadores como para elementos de dados separados, como XML, uma linguagem padronizada de marcação genérica. Figura 4 - Exemplo de dados semiestruturados - Cadastro de Cliente em formato XML

Fonte: O Autor.

Muitas organizações estão incorporando, ou esperam incorporar, todos os tipos de dados como parte de suas implementações em cenários Big Data, incluindo dados estruturados, semiestruturados e não estruturados (HURWITZ et al., 2013).

Na próxima seção são apresentados os desafios atribuídos aos cenários Big Data, bem como suas exemplificações.

2.2.3 Desafios do Big Data

Ao passo que acadêmicos e organizações identificaram oportunidades nas análises e exploração de Big Data, naturalmente houve necessidade de adaptação e criação de novas tecnologias específicas. Podem-se considerar como grandes desafios do Big Data itens como acesso, armazenamento, processamento, análise, visualização, validação, veracidade e criação de valor.

Para exemplificar um problema de armazenamento de dados, pode-se usar um processo de produção industrial complexo, no qual é gerado um grande número de dados, quando pontos de vigilância precisam ser monitorados e controlados. Estes pontos de vigilância são monitorados por sensores que informam periodicamente se o processo está acontecendo com sucesso. Entretanto, os volumes de dados são enormes.

Por exemplo, uma máquina que gera 1000 Megawatt (MW) de eletricidade, pode ter mais de 12.464 pontos de vigilância e até 1.400 instalações de controle, distribuídos em até 198 motores e 1.117

(39)

switches eletrônicas (XIE, 2015). O problema de armazenamento é inevitável, se existem tantos sensores gerando tantos dados. Com o passar do tempo, esta situação irá gerar uma sobrecarga de armazenamento.

Por outro lado, existem situações de negócio que exigem capacidade de processamento, com é o caso do setor bancário, que tem interesse em segmentar os seus clientes, a fim de concentrar seus esforços de marketing para com os clientes certos. Outro exemplo é na detecção de fraudes onde são identificadas operações suspeitas. Já no setor das telecomunicações, a previsão de índice de cancelamento de clientes é de importância vital devido ao ambiente altamente competitivo (CNUDDE; MARTENS, 2015).

A fim de obter diferenciação competitiva e sobreviver no mundo dos negócios, as empresas devem enfrentar os desafios estratégicos e operacionais exigidos pelos cenários Big Data. Exige-se que se (1) invista em infraestruturas de dados para capturar e armazenar dados valiosos, (2) vincule análise de negócios a cada estratégia de negócios e processo organizacional, (3) acompanhe as técnicas em evolução em desenvolvimentos para cenários, além de que se crie um sistema educacional eficaz de capacitar os colaboradores (DUAN; XIONG, 2015).

Junto com interesse acadêmico, profissionais em negócios, indústria e governo descobriram que Big Data oferece oportunidades para o comércio, inovação e engenharia social. Estes desenvolvimentos revelam desafios, interesses e expectativas em relação ao Big Data. Enquanto alguns acadêmicos veem uma oportunidade para uma nova área de estudo, outros enfatizam novas abordagens metodológicas e epistemológicas, e outros ainda veem riscos e armadilhas potenciais (EKBIA et al., 2015).

As aplicações que incluem indexação e pesquisa, análise gráfica, análise de texto, aprendizagem de máquina, transformação de dados e muitos mais, não são fáceis de implementar. Big Data refere-se a vários formatos de grandes conjuntos de informações que exigem plataformas computacionais especiais, para que possam ser analisadas. Muito trabalho é necessário para analisar grandes volumes de dados. Assim sendo, analisar esses dados é um problema muito desafiador (MAITREY; JHA, 2015).

Atualmente, a maioria das aplicações está gerando dados em tempo real, de modo que a captura e análise de dados é exigida em uma fração de segundo. Para isso, um foco de desenvolvimento deve ser o desenvolvimento de canais de comunicação de alta velocidade e redes

(40)

híbridas para transferência de dados, e uma plataforma distribuída heterogênea para armazenamento e análise de dados (BENDRE; THOOL, 2016).

Entretanto, segundo pesquisa realizada pela empresa Internacional Business Machine (IBM), as duas barreiras que têm sido consideradas como pontos chave a serem ultrapassadas são: o custo e a falta da certeza sobre o retorno do investimento. Ambos os problemas que estão se tornando cada vez mais importantes no domínio de marketing. Neste caso evidencia-se novamente a necessidade de se minimizar incertezas na criação de valor a partir do Big Data (INTERNACIONAL BUSINESS MACHINE, 2011).

Alguns estudos prévios sobre o valor derivado de investimentos em sistemas de informação (SI) relataram resultados mistos, resultando no chamado "paradoxo produtivo de TI". Alguns estudiosos chegam mesmo a argumentar que os investimentos em sistemas de informação não levam necessariamente a uma melhoria da eficiência e eficácia operacional. Esta posição pode ser explicada por vários fatores, como a indisponibilidade de dados apropriados, a existência de pouco tempo entre os investimentos e os resultados de valor esperados por esses investimentos, a ausência de uma avaliação dos benefícios indiretos e o nível de análise dos benefícios relacionados à análise de Big Data (WAMBA et al., 2017).

Além disso, os autores propõem a aplicação de uma visão mais ampla dos recursos de TI, integrando uma perspectiva multidimensional em estudos sobre o valor comercial de TI ou capacidades de TI.

Segundo Gunasekaran et al. (2017), a teoria da Visão Baseada em Recursos (RBV), defende que as organizações obtêm vantagem competitiva ao criar conjuntos de recursos e/ou capacidades estratégicas. O desempenho superior da empresa depende da organização em possuir simultaneamente recursos valiosos (V), raros (R), imperfeitamente imitáveis (I) e devidamente organizados (O). Os recursos podem ser capital físico, capital humano, capital tecnológico e capital de reputação, além de poderem ser tangíveis, como por exemplo, infraestruturas, ou intangíveis, como informações e conhecimento. Observa-se que, quando agrupados, os recursos têm valor significativo.

No entanto, os recursos não podem fornecer vantagem competitiva por si mesmos. Destaca-se o papel dos altos executivos na capacitação, estruturando o portfólio de recursos usando os processos específicos, tais como (aquisição, acumulação e alienação) (SIRMON; HITT; IRELAND, 2007).

(41)

Big Data, segundo 186 artigos selecionados pelos autores estão listados no Quadro 3, sendo que o desafio deste trabalho é citado como análise de “Governamentais e cuidados de saúde”.

Quadro 3 – Desafios de Pesquisas em Big Data Detecção de anomalias;

Aplicações empresariais Quimioinformática; Geoinformática;

Governamentais e cuidados de saúde; (Desafio deste trabalho). Big Data em nuvem;

Integrações em Big Data;

Métodos de mineração de dados em Big Data; Cenário geral de Big Data;

Algoritmos de Pesquisa aplicáveis em Big Data;

Armazenamento de grandes volumes de dados contendo desafios de métodos de armazenamento, indexação e gerenciamento de memória;

Sistemas cibernéticos;

Sistema de informação para Big Data; Infraestrutura;

Internet das coisas (IoT) e Computação ubíqua; Algoritmos de processamento;

Métodos de consulta;

Segurança, privacidade e confiança; Mídias Sociais;

Algoritmo de computação em fluxo contínuo;

Os 5Vs que caracterizam os cenários de Big Data (Volume, Variedade, Velocidade, Valor e Veracidade);

Transmissão para Big Data e Gerenciamento de informações da web Fonte: Adaptado de Chen et al. (2016).

Outro exemplo de um desafio enfrentado com Big Data está na capacidade de colher informações de valor por meio de dados de Biomedicina, para enriquecer o conhecimento sobre a saúde humana e suas doenças. Atentos para este desafio, os Institutos Nacionais de Saúde (NIH) lançaram a iniciativa Big Data to Knowledge (BD2K) em 2012, pois foi percebida uma lacuna na falta de ferramentas adequadas, na carente acessibilidade dos dados e a insuficiente formação de profissionais capacitados, que se constituem nos grandes entraves ao rápido impacto desejado.

Segundo o NIH, o programa Big Data para o conhecimento (BD2K) objetiva apoiar a comunidade de pesquisa biomédica em busca de beneficiar-se do potencial dos cenários Big Data. O BD2K permite o

Referências

Documentos relacionados

A proposta desta pesquisa objetivou desenvolver o estudante para realizar a percepção sobre o estudo da complexidade do corpo humano, onde o educando teve oportunidade

Neste capítulo, será apresentada a Gestão Pública no município de Telêmaco Borba e a Instituição Privada de Ensino, onde será descrito como ocorre à relação entre

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

v) por conseguinte, desenvolveu-se uma aproximação semi-paramétrica decompondo o problema de estimação em três partes: (1) a transformação das vazões anuais em cada lo-

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

A participação foi observada durante todas as fases do roadmap (Alinhamento, Prova de Conceito, Piloto e Expansão), promovendo a utilização do sistema implementado e a

A Figura 17 apresenta os resultados obtidos por meio da análise de DSC para a amostra inicial da blenda PBAT/PHBH-0 e para as amostras PBAT/PHBH-4, PBAT/PHBH-8 e

Essa tarefa não tem a necessidade de interface com o usuário, tornando-se uma boa candidata ao processamento em lotes, normalmente utilizados como a divisão