http://tede.mackenzie.br/jspui/bitstream/tede/3822/5/MAYCON%20FRANCO%20LOUREN%C3%87O%20GIMENEZ

Texto

(1)UNIVERSIDADE PRESBITERIANA MACKENZIE Centro de Ciências Sociais e Aplicadas Programa de Pós-Graduação em Administração de Empresas. MAYCON FRANCO LOURENÇO GIMENEZ. OS EFEITOS DA UTILIZAÇÃO DO BIG DATA NA INTELIGÊNCIA COMPETITIVA. São Paulo 2018.

(2) MAYCON FRANCO LOURENÇO GIMENEZ. OS EFEITOS DA UTILIZAÇÃO DO BIG DATA NA INTELIGÊNCIA COMPETITIVA. Dissertação apresentada ao Programa de Pós-Graduação em Administração de Empresas da Universidade Presbiteriana Mackenzie, como requisito para a obtenção do Título de Mestre em Administração.. Linha de pesquisa: Recursos Desenvolvimento Empresarial. Orientador: Prof. Dr. Gilberto Perez. São Paulo 2018. e.

(3) G491e Gimenez, Maycon Franco Lourenço Os efeitos da utilização do Big Data na inteligência competitiva / Maycon Franco Lourenço Gimenez. 84 f. : il. ; 30 cm Dissertação (Mestrado em Administração de Empresas) – Universidade Presbiteriana Mackenzie, São Paulo, 2018. Orientador: Prof. Dr. Gilberto Perez. Bibliografia: f. 71-75.. 1. Inteligência competitiva. 2. Big Data. I. Perez, Gilberto, orientador. II. Título. CDD 658.4 Bibliotecário Responsável: Aline Amarante Pereira – CRB 8/9549.

(4)

(5) Dedico a todos os meus familiares e amigos pelo apoio incondicional em todos os momentos. À academia para que auxilie na geração de maior conhecimento..

(6) AGRADECIMENTOS Ao meu orientador, Professor Dr. Gilberto Perez, por todo apoio, paciência e empenho, sempre disponível para orientar e contribuir para o êxito deste trabalho, pois durante todo o programa de Pós-Graduação esteve presente, apoiando e motivando em cada uma das etapas. A todos os meus familiares e amigos pela paciência, apoio e compreensão incondicional nos momentos em que estive ausente, dedicando-me ao mencionado programa. À banca examinadora, Professor Dr. Alberto de Medeiros Júnior e Professor Dr. Antonio Geraldo da Rocha Vidal pela disponibilidade e precisas orientações realizadas durante a fase de qualificação: foi muito importante para finalização da dissertação. A todos os professores com quem tive a oportunidade de frequentar as aulas durante o Programa de Pós-Graduação em Administração de Empresas da Universidade Presbiteriana Mackenzie. Aos meus colegas do Mestrado, pela convivência, pela troca de experiências e instigantes debates durantes as aulas, as quais foram muito importantes para minha formação no programa..

(7) RESUMO Com esta pesquisa, procurou-se verificar a influência da utilização do conjunto tecnológico do Big Data na Inteligência Competitiva. O método de pesquisa adotado foi o qualitativo, de caráter descritivo e exploratório, sendo a coleta de dados feita com entrevistas em profundidade, direcionadas por meio de um roteiro estruturado previamente elaborado. Foram entrevistados quatro especialistas e gestores que trabalham diretamente com o conjunto de técnicas e ferramentas que compõem o ecossistema de Big Data. A análise dos dados deu-se pela utilização da análise de conteúdo e os resultados da pesquisa, obtidos pela formação de cinco categorias, indicaram que há influência nos resultados obtidos pela Inteligência Competitiva com a utilização do Big Data. Os resultados também indicam a existência de relações entre as principais dimensões do Big Data com as etapas do Ciclo da Inteligência Competitiva. A revisão da literatura propiciou a criação do Modelo Conceitual que propõe a relação teórica entre os constructos, que veio a ser validada pela análise dos dados coletados. Também foram verificadas relações entre o ciclo da Inteligência Competitiva e o fluxo de dados do Big Data. Ao final da pesquisa, pôde-se inferir que o conjunto tecnológico do Big Data pode proporcionar resultados que dificilmente seriam obtidos com as tecnologias tradicionais utilizadas na Inteligência Competitiva.. Palavras-chave: Inteligência Competitiva. Inteligência Estratégica. Big Data..

(8) ABSTRACT With this research, we tried to verify the influence of the use of the technology of set Big Data on competitive intelligence. The method of research was the qualitative, descriptive and exploratory character, being data collection made with in-depth interviews, directed through a structured script previously prepared. Were interviewed four experts and managers who work directly with the set of techniques and tools that make up the Big Data ecosystem. The analysis of the data was for the use of content analysis and the results of the survey, obtained by the formation of five categories, indicated that there is influence on the results obtained by competitive intelligence through the use of Big Data. The results also indicate the existence of relationships between the main dimensions of the Big Data with the stages of the cycle of competitive intelligence. The literature review led to the creation of the conceptual model that proposes the theory relationship.. Keywords: Competitive Intelligence. Strategic Intelligence. Big Data..

(9) LISTA DE FIGURAS. Figura 1: Mapeamento dos termos de busca ............................................................................ 12 Figura 2: Volume de publicações 1960 – 2016 (Inteligência Competitiva & Big Data) ......... 13 Figura 3: Big Data por área de pesquisa 1960 - 2016 .............................................................. 14 Figura 4: Competitive Intelligence por área de pesquisa 1960 - 2016...................................... 14 Figura 5: Competitive Intelligence + Big Data por área de pesquisa 1960 - 2016 ................... 15 Figura 6: Volume de pesquisas BD, CI, CI + BD 1960 - 2016 ................................................ 16 Figura 7: Os três Vs do Big Data ............................................................................................. 21 Figura 8: Ciclo da Inteligência Competitiva............................................................................. 33 Figura 9: Modelo Conceitual da Pesquisa ................................................................................ 35 Figura 10: Evolução do Hadoop no decorrer do tempo ........................................................... 37 Figura 11: A pirâmide da Inteligência Competitiva – Fluxo geral dos dados .......................... 38 Figura 12: Exemplo de fluxo de dados em lotes ...................................................................... 39 Figura 13: Exemplo de fluxo de dados em tempo real ............................................................. 39 Figura 14: Macrofluxo do Big Data ......................................................................................... 40 Figura 15: Relação entre o Ciclo da IC e o Macrofluxo de dados do Big Data ....................... 41 Figura 16: Relação entre o Fluxo geral da IC e o Macrofluxo de dados do Big Data ............. 41 Figura 17: Macroprocesso de análise dos dados ...................................................................... 46 Figura 18: Nuvem de palavras das entrevistas ......................................................................... 50 Figura 19: Nuvem de palavras ordenadas................................................................................. 51 Figura 20: Unidades de Significado da CT01 - As principais dimensões do Big Data nas Etapas da Inteligência Competitiva ...................................................................................................... 52 Figura 21: Unidades de Significado da CT02 - Conjunto tecnológico de Big Data nas empresas .................................................................................................................................................. 55 Figura 22: Unidades de Significado da CT03 - Relações entre o ciclo da Inteligência Competitiva e o fluxo de dados do Big Data............................................................................ 59 Figura 23: Unidades de Significado da CT04 - Engajamento das empresas na adoção de Big Data .......................................................................................................................................... 61 Figura 24: Unidades de Significado da CT05 - Casos de uso do conjunto tecnológico de Big Data .......................................................................................................................................... 63 Figura 25: Relação das Categorias ........................................................................................... 66.

(10) LISTA DE QUADROS. Quadro 1: Web of Science Competitive Intelligence + Big Data 2014 - 2016 ......................... 16 Quadro 2: Rotinas afetadas pelo avanço tecnológico ............................................................... 19 Quadro 3: Conceitos de Big Data ............................................................................................. 22 Quadro 4: Volume de dados gerados ........................................................................................ 24 Quadro 5: Categorias de dados estruturados ............................................................................ 27 Quadro 6: Demais características do Big Data ......................................................................... 29 Quadro 7: Composição da amostra........................................................................................... 48 Quadro 8: Formação das Categorias ......................................................................................... 52 Quadro 9: Ferramentas apresentadas no referencial teórico. .................................................... 56 Quadro 10: Mapeamento das Ferramentas citadas pelos entrevistados ................................... 57 Quadro 11: Objetivos específicos e Categorias ........................................................................ 65.

(11) LISTA DE SIGLAS 3 V’s. Volume, Velocidade e Variedade. 5 V’s. Volume, Velocidade, Variedade, Veracidade e Valor. ABRAIC. Associação Brasileira dos Analistas de Inteligência Competitiva. BD. Big Data. BI. Business Intelligence (Inteligência de Negócios). CI. Competitive Intelligence (Inteligência Competitiva). DNA. Deoxyribonucleic acid. ERP. Enterprise Resource Planning. ETL. Extract, transform and load. IC. Inteligência Competitiva. IE. Inteligência Estratégica. ISBN. International Standard Book Number. ISSN. International Standard Serial Number. MP3. MPEG Audio Layer III. NFS. Network File System. SCIP. Strategic and Competitive Intelligence Professionals. SGI. Silicon Graphics Inc.. TI. Tecnologia da Informação. XFS. X File System.

(12) SUMÁRIO 1 INTRODUÇÃO .................................................................................................................. 8 1.1 Questão de Pesquisa ................................................................................................... 9 1.2 Objetivos da Pesquisa ............................................................................................... 10 2 REFERENCIAL TEÓRICO ............................................................................................. 11 2.1 Estudo Bibliométrico acerca de Inteligência Competitiva e Big Data ..................... 11 2.2 O Constructo Big Data ............................................................................................. 17 2.2.1 A Era dos Dados ................................................................................................... 17 2.2.2 Big Data - Conceitos ............................................................................................ 20 2.2.3 Volume ................................................................................................................. 24 2.2.4 Velocidade ............................................................................................................ 25 2.2.5 Variedade .............................................................................................................. 27 2.2.6 Demais Dimensões ............................................................................................... 28 2.3 O Constructo Inteligência Competitiva .................................................................... 30 2.3.1 Inteligência Competitiva - Conceitos ................................................................... 30 2.3.2 O Ciclo da Inteligência Competitiva .................................................................... 32 2.4 Estudos Envolvendo Big Data e Inteligência Competitiva ...................................... 34 2.4.1 Modelo Conceitual da Pesquisa............................................................................ 35 2.4.2 Fluxo de Dados ..................................................................................................... 38 3 PROCEDIMENTOS METODOLÓGICOS ..................................................................... 43 3.1 Quanto ao Método e Tipo de Pesquisa ..................................................................... 43 3.2 Instrumento de Coleta de Dados ............................................................................... 43 3.3 Técnica para Análise de Dados ................................................................................ 44 3.4 Amostra da Pesquisa ................................................................................................. 47 4 ANÁLISE E INTERPRETAÇÃO DOS RESULTADOS ................................................ 48 4.1 Pré-Análise ............................................................................................................... 50 4.2 Identificação das Unidades de Registro ................................................................... 50 4.3 Formação das Unidades de Significado.................................................................... 51 4.4 Formação das Categorias e Inferência dos resultados .............................................. 51 4.4.1 CT01 - As principais dimensões do Big Data nas Etapas da Inteligência Competitiva .............................................................................................................................. 52 4.4.2 CT02 - Conjunto tecnológico de Big Data nas empresas ..................................... 55 4.4.3 CT03 - Relações entre o ciclo da Inteligência Competitiva e o fluxo de dados do Big Data .............................................................................................................................. 59 4.4.4 CT04 - Engajamento das empresas na adoção de Big Data ................................. 61 4.4.5 CT05 - Casos de uso do conjunto tecnológico de Big Data ................................. 63 5 CONSIDERAÇÕES FINAIS ........................................................................................... 67 REFERÊNCIAS ....................................................................................................................... 71 APÊNDICE I – MATRIZ DE AMARRAÇÃO ....................................................................... 76 APÊNDICE II – ROTEIRO DE ENTREVISTAS ................................................................... 77 APÊNDICE III – UNIDADES DE REGISTRO X SIGNIFICADO ........................................ 79.

(13) 8 1. INTRODUÇÃO Nos últimos anos, sobretudo, a partir do final do século XX, as Tecnologias de. Informação e Comunicação vêm desenvolvendo-se velozmente e, frequentemente, são lançados novos aplicativos, softwares e plataformas on-line. De acordo com o estudo do Cisco Visual Networking Index (CISCO, 2016), em 2020, o tráfego global de dados será equivalente a 95 vezes o volume do tráfego global de 2005, e deve atingir 21 gigabytes por pessoa, muito acima dos 7 gigabytes por pessoa de 2015; em 2016, o tráfego anual de dados superou 1 zettabytes e, em 2020, deve atingir 2.3 zettabytes (um zettabyte corresponde a 1021 que é equivalente a mil exabytes ou 1018, um exabyte é equivalente a um bilhão de gigabytes que corresponde a 109). Um zettabyte é a quantidade de dados percorridos em toda Internet desde a sua criação e 300 zettabytes equivale a toda informação visual transmitida dos olhos para o cérebro de toda a raça humana no período de 1 ano (CISCO, 2016). O crescimento do tráfego de dados ocorre de maneira exponencial. Muitas podem ser as fontes desses dados: navegação na web; mídias sociais; dados transacionais de diferentes naturezas, como gerenciamento de risco, consumo, financeiro, seguros, telecomunicações, saúde e entretenimento; dados de biometria para identificação e validação como reconhecimento de voz, íris, retina e face; dados gerados no dia a dia pelas pessoas por envio de e-mails, logs, blogs, relatórios, apresentações e documentos em geral e, finalmente, a comunicação entre dispositivos fixos e móveis que monitoram processos, máquinas, localizam pessoas, liberam acessos e contabilizam estoques (TAURION, 2013). Em julho de 2017, o Facebook anunciou ter alcançado a marca de 2 bilhões de usuários ativos (FACEBOOK, 2017), em outras palavras, quase 1/3 da população mundial acessou o Facebook pelo menos uma única vez dentro do mês (ONU BRASIL, 2017). Para Marquesone (2017), todo esse engajamento dos usuários, curtindo e compartilhando informações, avaliando organizações e dando cada vez mais suas opiniões, geram uma fonte inesgotável de dados que podem ser extremamente valiosas para as organizações. Um exemplo é a identificação de tendências, a análise imediata das informações compartilhadas em redes sociais, as quais permitem gerar descobertas como pandemias de doenças em determinadas regiões. Neste sentido, as autoridades podem ter um panorama praticamente instantâneo sobre a saúde da população em determinadas regiões (MARQUESONE, 2017). No campo empresarial, as informações, que as empresas dispõem em seus sistemas de informação que, no geral, são bem-estruturadas, existem em grande quantidade e estão.

(14) 9 relacionadas com o passado (CARON-FASAN, 2001). Informações mal-estruturadas, esparsas e desconexas, normalmente, não são bem-aproveitadas. Exemplos deste tipo de informação podem ser frases, fotos, imagens, desenhos, pedaços de artigos ou qualquer observação pronunciada por alguém (LESCA; FASAN, 2001). Informação e Conhecimento gerados a partir da coleta, análise e disseminação de dados são as bases da Inteligência Competitiva, também referenciada como Inteligência Estratégica (PEREZ; SACRAMENTO; NAGANO, 2016). Para. Fleisher e Bensoussan (2003), a. Inteligência Competitiva pode ser entendida como uma função organizacional, variando em escopo entre a área mais ampla de Inteligência de Negócios e a versão mais pontual da análise da concorrência. A Inteligência Competitiva fornece a base sobre a qual estratégia e tática são construídas, avaliadas e modificadas. A Inteligência Competitiva costumava ser uma atividade intuitiva, entretanto, o Big Data está trazendo uma mudança para essa abordagem. Com a possibilidade de se obter uma maior quantidade de detalhes e realizar uma análise sistemática sobre o que se pretende descobrir a partir dos dados, as decisões estratégicas tendem a ser mais assertivas (DAVENPORT, 2014). Com o objetivo de gerar inteligência, a partir desse grande volume de dados estruturados e não estruturados, internos e externos das organizações, as tecnologias comuns perdem sua eficiência, pois não possuem capacidade adequada para coleta, armazenamento, processamento e disseminação desse conhecimento. Por esse motivo, as empresas estão buscando maneiras mais eficientes de armazenar, processar e analisar essa nova volumetria e variedade de dados disponíveis no mundo virtual (TAURION, 2013). 1.1. Questão de Pesquisa Com base na problemática, que envolve o desafio de se trabalhar com o crescente. volume de dados, sendo estes dados a matéria-prima para a geração de Inteligência Competitiva, a questão desta pesquisa é: A utilização do Big Data influencia no Ciclo da Inteligência Competitiva?.

(15) 10 1.2. Objetivos da Pesquisa Os objetivos são as metas a serem atingidas visando à obtenção da resposta à questão. de pesquisa. Sendo assim, o objetivo geral é: Verificar se o uso do Big Data pode influenciar o Ciclo da Inteligência Competitiva. Para tanto, os objetivos específicos deste estudo são:. 1) avaliar as possíveis relações entre as dimensões do Big Data com as etapas do Ciclo da Inteligência Competitiva; 2) verificar se existe relação entre o ciclo da Inteligência Competitiva e o fluxo de dados do Big Data; 3) identificar os Resultados dos projetos de Big Data relatados do uso do Big Data na Inteligência Competitiva; 4) identificar as tecnologias envolvidas no cenário de exponencial crescimento da volumetria de dados (Big Data) na Inteligência Competitiva..

(16) 11 2. REFERENCIAL TEÓRICO Consoante com Demo (2000), é essencial, para pesquisa, uma fundamentação teórica. de caráter explicativo. O autor também aponta alguns procedimentos necessários para a elaboração de uma fundamentação teórica consistente como: definir os conceitos-chave e estudar a fundo toda a bibliografia pertinente ao tema. Para a elaboração deste capítulo, foi realizado um estudo bibliométrico, consolidando referências bibliográficas de três importantes bases de dados a respeito de Big Data e de Inteligência Competitiva. O detalhamento desse estudo está apresentado na sessão 2.1. Com isso, foi possível constituir um referencial teórico consistente dentre os mais de 13.300 títulos mapeados no estudo bibliométrico, o que representa o atual estado da arte sobre os constructos que compõem esta pesquisa, demonstrando, de maneira clara, os conceitos-chave do estudo que são apresentados nas sessões 2.2 e 2.3. 2.1. Estudo Bibliométrico acerca de Inteligência Competitiva e Big Data Com o objetivo de identificar o volume, evolução, tipo, área e principais publicações. acadêmicas que foram e estão sendo desenvolvidas sobre a Inteligência Competitiva e o Big Data, foi realizado um estudo com base em dados bibliométricos extraídos dos portais EBSCOHost, ProQuest e Web of Science. A coleta dos dados foi realizada em novembro de 2017 com diferentes termos e combinações para a busca de produções acadêmicas sobre Inteligência Competitiva. Assim como utilizado por Perez; Sacramento e Nagano (2016), foram utilizados cinco diferentes termos de busca que compõem o entendimento acerca da Inteligência Competitiva ou Competitive Intelligence; Business Intelligence, Competitive Intelligence, Market Intelligence, Marketing Intelligence e Strategic Intelligence. Os termos foram empregados nos títulos das publicações e, nos resultados obtidos, foram aplicados os filtros: “revistas acadêmicas, periódicos científicos, revisão por pares, texto completo e idioma inglês”. O período das publicações foi definido entre os anos de 1960 e 2016, visto que o ano de 2017 ainda estava em curso durante a coleta. Para busca de produções acadêmicas sobre Big Data, foi empregado o termo Big Data nos títulos das publicações e, nos resultados obtidos, foram aplicados os filtros: “revistas acadêmicas, periódicos científicos, revisão por pares, texto completo e idioma inglês”. O período das publicações foi definido entre os anos de 1960 e 2016..

(17) 12 Com o objetivo de entender os estudos sobre Inteligência Competitiva que mencionam Big Data, foi feita a busca, utilizando os termos: Business Intelligence, Competitive Intelligence, Market Intelligence, Marketing Intelligence e Strategic Intelligence nos títulos das publicações e no corpo do texto o termo Big Data e, nos resultados obtidos, foram aplicados os filtros: “revistas acadêmicas, periódicos científicos, revisão por pares, texto completo e idioma inglês”. O período das publicações foi definido entre os anos de 1960 e 2016. Com o objetivo de entender os estudos sobre Big Data que mencionam a Inteligência Competitiva, foi realizada a busca utilizando o termo Big Data no título das publicações e no corpo do texto os termos: Business Intelligence, Competitive Intelligence, Market Intelligence, Marketing Intelligence e Strategic Intelligence e, nos resultados obtidos, foram aplicados os filtros: “revistas acadêmicas, periódicos científicos, revisão por pares, texto completo e idioma inglês”. O período das publicações foi definido entre os anos de 1960 e 2016. Dessa maneira, os termos de busca foram mapeados de acordo com a Figura 1.Erro! Fonte de referência não encontrada. Figura 1: Mapeamento dos termos de busca. Fonte: Elaborado pelo autor, 2017.. Após a coleta, foi executado um processo de enriquecimento dos dados, incluindo campos com as informações de sua origem, termo de busca e agrupamento por constructo. Também foi realizado um processo de normalização e consolidação dos resultados, utilizando a ferramenta Microsoft® Office Access®, visto que as bases possuem diferentes estruturas de dados e algumas produções possuíam diferentes campos para demonstrar a mesma informação, ou, ainda, diferentes formatos de dados nos mesmos campos. Após esse processo, as produções duplicadas foram removidas por meio do ISSN, ISBN e, para os casos os quais não havia tal informação, a eliminação foi executada, utilizando o.

(18) 13 título da produção em conjunto com o nome do autor, formando, assim, uma chave inequívoca para deleção. A revisão das eliminações foi preparada manualmente após a ordenação alfabética dos títulos, sendo possível identificar possíveis duplicatas. Para as análises comparativas entre as bases, os dados utilizados não passaram pelo processo de eliminação de duplicatas, onde foram obtidos os resultados indicados na Figura 2. Figura 2: Volume de publicações 1960 – 2016 (Inteligência Competitiva & Big Data). Fonte: Elaborado pelo autor, 2017.. Pôde-se observar na Figura 2 que a base Web of Science possui o maior volume de publicações de “Big Data”, seguida pela EBSCOHost e ProQuest respectivamente. O segundo maior volume de publicações são sobre “Competitive Intelligence”, seguido pelas publicações que abordam os dois constructos. Após o processo de eliminação de duplicatas e refinamento da análise, foram verificadas as áreas de pesquisa para cada um dos três conjuntos de termos de busca. Desta forma, a Figura 3 apresenta as áreas de pesquisa que permeiam as publicações de Big Data..

(19) 14 Figura 3: Big Data por área de pesquisa 1960 - 2016. Fonte: Elaborado pelo autor, 2017.. Utilizando o termo de busca “Big Data”, constatou-se que 73% das publicações são da área “Computer Science” e apenas 7% pertencem à área “Business & Economics”, evidenciando a falta de publicações que abordam o tema, do ponto de vista corporativo. A Figura 4 apresenta as áreas de pesquisa das publicações dos conjuntos de termos de busca que compõem a Inteligência Competitiva ou “Competitive Intelligence”. Figura 4: Competitive Intelligence por área de pesquisa 1960 - 2016. Fonte: Elaborado pelo autor, 2017.. De acordo com os dados apresentados na Figura 4, quando a análise de dados é feita sobre o conjunto de termos de busca que compõem o “Competitive Intelligence”, conforme explicado anteriormente, há um aumento significativo no volume de publicações da área “Business & Economics”, chegando a 32% das publicações. Contudo, essa diferença se.

(20) 15 equilibra na busca por publicações que abordam os dois temas, conforme evidenciado na Figura 5. Figura 5: Competitive Intelligence + Big Data por área de pesquisa 1960 - 2016. Fonte: Elaborado pelo autor, 2017.. Nas publicações que possuem o termo “Big Data” em seu título e mencionam “Competitive Intelligence” consolidadas com as publicações que possuem “Competitive Intelligence” em seu título e mencionam “Big Data”, foi constatado que os maiores volumes de publicações são da área “Computer & Science” com 67% dos registros e “Business & Economics” representa 18% das publicações. Com o objetivo de refinar a busca, foi realizada uma segunda coleta de dados, utilizando apenas o Web of Science por concentrar a maior parte do volume de publicações que abordam a temática desse estudo em comparação com o EBSCOHost e o ProQuest, sendo que essa comparação foi detalhada anteriormente na Figura 2. Na segunda coleta, foram utilizados os termos de busca “Competitive Intelligence” e “Big data”, individualmente e em conjunto no título das publicações entre o período de 1960 e 2016, filtrando por “publicações acadêmica e revisão por pares”, resultando nos dados evidenciados na Figura 6..

(21) 16 Figura 6: Volume de pesquisas BD, CI, CI + BD 1960 - 2016. Fonte: Elaborado pelo autor, 2017.. O maior volume de publicações foi obtido com o termo de busca "Big Data”, totalizando 7.635 registros, seguido por 742 publicações de “Competitive Intelligence” e 4 publicações que possuem tanto “Competitive Intelligence” quanto “Big Data” em seus títulos. A análise dessas 4 publicações revelou que a associação entre as duas temáticas é relativamente recente, pois foram publicadas entre 2015 e 2016 com diferentes nacionalidades e idiomas, conforme evidenciado no Quadro 1. Quadro 1: Web of Science Competitive Intelligence + Big Data 2014 - 2016 Título 01. Competitive intelligence service of sports science and technology in the era of big data. 02. Big Data - competitive intelligence. 03. Big Data as a source of competitive intelligence. 04. Competitive Intelligence Changes in Big Data Era Based on Literature Analysis. País. Idioma. Ano. China. Chinês. 2015. Índia. Inglês. 2015. Eslovaco. 2016. Inglês. 2016. República Checa China. Fonte: Elaborado pelo autor, 2017.. A pesquisa bibliométrica realizada sobre as publicações que abordam Big Data, Inteligência Competitiva e a relação entre os dois constructos denotou que a associação entre os constructos é recente e pouco explorada. Assim também ficou evidenciada a falta de estudos com investigação empírica do ponto de vista corporativo no ambiente em que os fenômenos (Big Data e Inteligência Competitiva) ocorrem e se influenciam, resultando na principal motivação para a realização dessa pesquisa. Os estudos apresentados no Quadro 1 são explanados com mais detalhes na sessão 2.4..

(22) 17 2.2. O Constructo Big Data Nesta sessão, abordam-se questões sobre o constructo Big Data, que é uma das bases. teóricas do estudo. Para melhor entendimento sobre sua teoria, o tema foi dividido em subseções: a subseção 2.2.1 contextualiza seu surgimento, motivações e evolução; na subseção 2.2.2, estão os conceitos e o entendimento geral acerca das características e dimensões; na subseção 2.2.3, é apresentada a dimensão Volume de diferentes perspectivas; na subseção 2.2.4, é exposta a dimensão Velocidade; na subseção 2.2.5, a dimensão Variedade e, na subseção 2.2.6, são abordadas as demais dimensões apontados por alguns autores do tema.. 2.2.1 A Era dos Dados Segundo Schönberger-Mayer e Cukier (2013), o termo Big Data foi concebido por autores de áreas da ciências como Astronomia e a Genômica, que vivenciaram a explosão dos dados nos anos 2000. Entretanto, Wainer, Gruvaeus e Blair (1974) já utilizaram o termo “Big Data” no título de seu estudo “TREBIG: A 360/75 FORTRAN program for three-mode factor analysts designed for big data sets”, que abordava a utilização de procedimentos para análise de dados multifatoriais e longitudinais da década de 1960 e 1970. Apesar de não abordar o Big Data com base em suas dimensões como é visto nos dias atuais (Volume, Velocidade e Variedade), já existia a preocupação sobre a dificuldade em se trabalhar com volumes maiores de dados. O volume que era tratado como “grande” em 1960 e 1970 é pequeno se comparado com a atual capacidade computacional. É possível afirmar que o volume de dados em si não é relevante, a expressividade do volume é relativa à capacidade computacional disponível (BLASIAK, 2014). A década de 1990 aumentou a recorrência de estudos que procuravam solucionar a dificuldade de se trabalhar com grandes volumes de dados. Brown (1995) publicou o artigo “Rambus DSP eyes big data sets” sobre o microchip A236 da Oxford Computer, abordando questões sobre eliminação da sobrecarga de memória em cachê para processamento de grandes volumes de dados em alta velocidade, aplicações e capacidade de armazenamento. No ano seguinte, em 1996, foi publicado o “SGI promotes Big Data extensions to NFS” (WIRBEL, 1996). O artigo traz um relatório sobre a experiência da Silicon Graphics Inc. (SGI) acerca do desenvolvimento de sua própria extensão de sistema de arquivos de rede, o XFS, que foi concebido para substituir o NFS e introduzir o conceito de “Big Data” do ponto de vista de.

(23) 18 armazenamento de dados, desenvolvido para suportar grandes volumes. O novo sistema de arquivos de redes foi concebido para o sistema operacional o IRIX da própria SGI que, posteriormente, teve seu código-fonte liberado e adaptado para funcionar no sistema operacional Linux (MOSTEK; EARL; KOREN, 1999). Em 1998, foi publicado na Revista Science o título “A Handler for Big Data” (CASS, 1998), que apresenta um software desenvolvido pela National Instruments Corporation. O sistema foi elaborado especificamente para se trabalhar com grandes volumes de dados. O software é apresentado como uma solução para coleta, processamento, análise e visualização de dados em um único pacote técnico. Esta publicação aborda a utilização do software em áreas como biologia molecular e sequenciamento de DNA. Já, em 2004, o termo passou a ser utilizado com mais frequência no mundo corporativo, demonstrado pelo artigo “Wal-Mart's Big Data Warehouse” (WHILTING, 2004), o qual explora como a empresa Wal-Mart Stores Inc. expandiu, o que se acreditava ser o maior Data Warehouse do setor varejista no mundo, de acordo com a Teradata Corp. que, na época, era a fornecedora de Data Warehouse da Wal-Mart. Esta empresa utilizava um Data Warehouse com centenas de terabytes de dados para estudar tendências de vendas e rastrear seu inventário. O sistema era acoplado com outro sistema que dava suporte para tomada de decisões relativas a inventário e a vendas (WHILTING, 2004). Atualmente, o Wal-Mart Stores Inc. está construindo o maior sistema de Cloud Computing privado do mundo, com o objetivo de processar 2,5 petabytes de dados por hora (MARR, 2017). Então, em 2008, a revista Nature publicou o título “Big data: science in the petabyte era” que abordou as principais questões sobre o desafio da ciência moderna em lidar com o que chamou de “inundação de dados” (NATURE, 2008). O surgimento do Big Data é uma reação à evolução e à expansão da tecnologia da informação em conjunto com a adesão por parte dos usuários. Como resultado deste fenômeno, a composição tradicional dos dados mudou, não sendo mais composta apenas por dados estruturados e servindo a um propósito específico. Este fato, aliado ao uso de novas ferramentas que podem possuir características de Machine Learning para mineração, processamento, análise e visualização oferecem uma nova. forma de. compreender o mundo, fazendo com que dados que antes eram considerados estáticos se tornaram matéria-prima no mundo dos negócios (AKERKAR, 2014). Para Marquesone (2017), o avanço da tecnologia da informação gerou um enorme volume de recursos que, com o passar do tempo, se tornaram cada vez mais acessíveis à população. Deste modo, nos dias atuais, é comum a utilização de smartphones desde o primeiro instante do dia, por meio de um alarme com a música favorita e intervalos de tempos.

(24) 19 predeterminados ou durante o café da manhã, sendo possível, solicitar, ainda, um serviço de transporte de passageiros por meio de um aplicativo. Se houver necessidade de um documento, basta acessar a internet e buscá-lo em um serviço de computação em nuvem para armazenamento de dados. Essas mudanças afetam várias categorias de rotinas como mapeado no Quadro 2. Quadro 2: Rotinas afetadas pelo avanço tecnológico Categoria. Como ocorre atualmente Comparação de preços de passagens. Compra de passagem pela internet. Check-in. Viagem. online. Recomendação de serviços de hospedagem; Serviços de reserva de hospedagem. Definição de trajeto por auxílio de GPS e trânsito em tempo real. Reuniões por videoconferência. Agenda de compromissos online. Hospedagem de. Trabalho. arquivos online. Serviços de financiamento coletivo (crowdfunding). Busca e candidatura de vagas de trabalho online. Serviços de streaming de filmes, seriados e músicas. Compartilhamento de. Lazer. momentos em redes sociais. Leitura de livros eletrônicos. Jogos online. Compras via comércio eletrônico. Avaliação online de produtos. Comparação de. Compras. preços. Compras coletivas. Pedidos online de serviços alimentícios. SAC online. Internet banking.. Fonte: Adaptado de Marquesone (2017).. Junto com o Big Data, estão surgindo empresas especialistas nesse novo conjunto de práticas e tecnologias. Essas empresas oferecem serviços de consultoria em tecnologia, avaliações, implementação, aplicativos, soluções, extensões e suporte (DAVENPORT, 2014). A utilização dos grandes volumes de dados, gerados pelo engajamento dos usuário na internet, possui forte potencial para diferentes setores da sociedade e, sobretudo, para as atividades econômicas, é também recente e crescentemente importante dadas as possibilidades de extração de informações valiosas para os negócios (CAMPOS, 2015). De acordo com Watson (2014), a necessidade de dados para apoiar a tomada de decisão baseada na capacidade computacional teve seu início na década de 1970. Este período pode ser pensado como a primeira geração (grifo nosso) de sistemas de gerenciamento de dados para suporte à decisão com dados estruturados para apoiar uma única decisão ou um conjunto de decisões relacionadas. Ainda, de acordo com Watson (2014), na década de 1990, havia a necessidade de suportar uma grande variedade de sistemas de informação executiva com base em dados que demandavam bases de dados independentes para cada aplicação. Isso foi dispendioso,.

(25) 20 resultando em inconsistências de dados em várias das aplicações e no surgimento do Data Warehouse empresarial, ou seja, a segunda geração (grifo nosso) de sistemas de gerenciamento de dados para suporte à decisão, que apresentou uma abordagem centrada para o gerenciamento de dados. A terceira geração (grifo nosso) foi o Data Warehouse real-time. Essa tecnologia evoluiu até os anos 2000, de modo que foi possível capturar dados em tempo real e armazenar imediatamente em Data Warehouse. Essa evolução mudou o paradigma para quais tipos de decisões poderiam ser suportadas (WATSON, 2014). E agora, mais importante ainda é a quarta geração (grifo nosso) de gerenciamento de dados de suporte à decisão. O Big Data oferece a capacidade de capturar, armazenar e analisar dados em grande volume, múltiplas variedades e, também, em tempo real, permitindo que novas decisões sejam suportadas, trazendo também um grande desafio para o gerenciamento de dados. 2.2.2 Big Data - Conceitos Ainda não existe consenso sobre o conceito de Big Data e cada organização entende este fenômeno por uma perspectiva diferente, entretanto, a essência do termo é contemplada por muitas organizações e autores por meio de três dimensões fundamentais: Volume, Velocidade e Variedade, À vista disso, o Big Data está associado ao crescimento e ao uso de dados estruturados e não estruturados com resultados em alta performance e disponibilidade (FRANKS, 2013). Apesar do termo “Big Data” ter sido formado ainda na década de 1970, Laney (2001) publicou o artigo seminal “3D Data Management: Controlling Data Volume, Velocity, and Variety”, sendo o primeiro a tratar o tema com base nas três dimensões principais denominadas “3 Vs” (Volume, Velocidade e Variedade) e relacionar a questão do gerenciamento de grandes volumes de dados aos desafios que as grandes empresas viriam a enfrentar com a escalada dos dados. Durante o ano de 2001 e 2002, as principais empresas vão utilizar um data warehouse centralizado para definir um vocabulário de negócios comum que melhore a colaboração interna e externa. Entre o ano de 2003 e 2004, os problemas de qualidade e integração de dados serão temperados por tecnologias com perfil de dados (para geração de metadados, esquemas consolidados e lógica de integração) e agentes de logística de informação. Em 2005 e 2006, o gerenciamento de dados, documentos e conhecimento se unirá, impulsionado por estratégias de indexação de esquema agnóstico e a maturidade dos portais (LANEY, 2001)..

(26) 21 Para Laney (2001), Volume é caracterizado por quantidades de dados maiores do que poderiam ser armazenados em bancos de dados tradicionais; Velocidade, pela possibilidade de analisar e processar grandes volumes de dados em tempo real e, por último, a Variedade, que é a combinação de dados com diferentes origens, tipos e estruturas. Na Figura 7, estão dispostas as sobreposições das dimensões que compõem o conceito central proposto por Laney (2001). Figura 7: Os três Vs do Big Data. Fonte: Elaborado pelo autor, 2017.. O Big Data é um corte horizontal do universo digital e pode incluir dados transacionais, dados mestres, metadados e outros dados que residem em arquivos de diferentes variedades. Os dados podem ser oriundos de entretenimento, saúde, vigilância por vídeo e redes sociais, como o Facebook e Twitter, que são as mais novas fontes de dados a gerar interesse de utilização pelas grandes empresas, em que os consumidores (consciente ou inconscientemente) estão fornecendo fluxos contínuos de dados sobre organizações, sobre si mesmos e sobre terceiros (GANTZ; REINSEL; GANTZ, 2011). O Quadro 3 contém uma série de definições a respeito do Big Data..

(27) 22 Quadro 3: Conceitos de Big Data Autor (es) MANYIKA et. al. (2011); DUMBILL (2012); MAHRT; SCHARKOW (2013); RAJESH (2013); DAVENPORT; BARTH; BEAN (2012); KWON; LEE; SHIN (2014); AMATO; DI MARTINO; VENTICINQUE (2014). Conceito. Big Data são conjuntos de dados cujo tamanho está além da capacidade de softwares típicos para coleta, armazenamento, processamento, gerenciamento e análise.. International Data Corporation (2011). Big Data é uma nova geração de tecnologias e arquiteturas desenvolvidas para extrair valor de grandes volumes de dados com ampla variedade, permitindo sua coleta, armazenamento, processamento e análise em alta velocidade.. GARTNER (2012). Big Data, em geral, é definido como ativos de alto volume, velocidade e variedade de informação que exigem custo-benefício, que se utiliza de formas inovadoras para processamento de dados que permitem maior visibilidade na tomada de decisão.. LOHR (2012). Big Data é considerado atalho para o avanço de tecnologias que armazenam, processam e exibem dados abrindo uma nova abordagem para a compreensão do mundo e a tomada de decisões.. MCAFEE; BRYNJOLFSSON (2012). Big Data se tornou essencial para melhorar a eficiência e a eficácia das organizações. Ao colocar Big Data a disposição de áreas como vendas e marketing, os insights podem ser aproveitados para melhorar a tomada de decisão em tempo real.. PHELAN (2012). O Big Data surgiu nos últimos anos devido à enorme quantidade de dados que as máquinas estão gerando em conjunto com dados de diversas fontes. A análise de todos esses dados por si só cria outro conjunto enorme de dados.. SATHI (2012). Big Data diz respeito a dados internos (estruturados, não estruturados ou semiestruturados) de uma organização que, devido à automação e ao acesso estão sendo cada vez mais compartilhados. Também diz respeito a dados de fora da organização, como as informações disponíveis em sites como mídias sociais, literatura de produto, hierarquias organizacionais, dicas úteis disponíveis a partir de terceiros e reclamações de clientes postados em sites de regulamentação.. DEMIRKAN; DELEN (2013). Existe o desafio do gerenciamento de Big Data, devido à evolução dos dados digitais e dispositivos como telefones móveis, laptops e sensores. Seu gerenciamento está ficando cada vez mais possível dada a queda do custo de armazenamento.. MINELLI; CHAMBERS; DHIRAJ (2013). Big data é a próxima geração de Data Warehouse e está pronto para entregar receitas economicamente eficientes para as empresas. Este fenômeno se deve, em maior parte, ao rápido ritmo de inovação e mudança que o mundo está vivenciando nos dias de hoje.. MAYER-SCHÖNBERGER; CUKIER (2013). Big data é a capacidade de uma sociedade de obter informações de maneira inovadora a fim de gerar ideias úteis, bens e serviços que agreguem algum tipo de valor. Assim, a verdadeira revolução não está nas máquinas que calculam, e sim nos dados em si e na maneira como os usamos.. TAURION (2013). Big Data em uma simples fórmula para conceitualização: Big Data = volume + variedade + velocidade + veracidade, tudo agregado + valor.. ZHAO (2013). Big data é o sonho dos cientistas de dados que virou realidade, pois se pode o que nunca se pode para obter insights interessantes. É o.

(28) 23 Autor (es). Conceito conjunto de soluções de armazenamento grandes e escaláveis, assim como capacidades e aplicações de análise também escaláveis.. AKERKAR (2014). Big Data refere-se a conjuntos de dados, cujo tamanho está além das capacidades tecnológicas dos bancos de dados atuais. Trata-se de um campo emergente onde um conjunto tecnológico inovador oferece alternativas para resolver os problemas inerentes que aparecem quando se trabalha com volumes massivos de dados, oferecendo novas maneiras de extrair valor de data sets onde não seria possível com as tecnologias atuais.. IBM (2012b). Big Data é o termo utilizado para descrever grandes volumes de dados que está cada vez mais relevante à medida que a sociedade se depara com o aumento exponencial da geração diária de dados.. KIM; TRIMI; CHUNG (2014). Trata-se de um termo geral para se referir a enorme quantidade de dados coletados a partir de diversos tipos de fontes diferentes.. Fonte: Elaborado pelo autor, 2017.. Para a maioria dos autores, desde os anos 2000, a humanidade está na era da explosão dos dados, em que os dados digitais vêm sendo criados e armazenados exponencialmente. Essa era pode ser chamada de era do big data que é caracterizada pela aplicação de novos métodos para armazenamento, processamento e análise desses dados (UEDA, 2012). Segundo Taurion (2013), Big Data é um conjunto tecnológico que permite às empresas alcançarem análises de dados que antes não tinham acesso, sendo composto por “5 Vs” que podem ser representados por uma simples fórmula: Big Data = (volume + variedade + velocidade + veracidade), a agregação dessa fórmula gera o quinto V que é valor. Mesmo que o Big Data envolva um grande volume de dados, não se refere somente a esse grande volume, pois também traz aumento na velocidade, complexidade e variedade em comparação com as fontes de dados do passado (FRANKS, 2013). A inovação do Big Data pode transformar por completo a maneira como trabalhamos e pensamos no desenvolvimento de novos produtos, serviços e estratégias (TAURION, 2013). Com base nos conceitos citados nessa sessão, nesse estudo considera-se que Big Data é um conjunto de práticas, processos e tecnologias, havendo consenso entre os autores em pelo menos três dimensões. Volume que se caracteriza pela grande quantidade de dados que podem ser coletados, armazenados, processados e analisados. Velocidade, que possibilita a coleta, armazenamento, processamento e análise dos dados em tempo real e Variedade, pois, possibilita o a utilização de dados estruturados e não estruturados gerados por e-mails, mídias sociais, documentos, mensagens, sensores, vídeos, fotos e áudios (AKERKAR, 2014; LANEY, 2001; WATSON, 2014)..

(29) 24 2.2.3 Volume Lévy (1999) já alertava para a questão do crescimento exponencial de dados, caracterizando este fenômeno como o “dilúvio” das informações que atribuiu sua causa para o avanço das tecnologias ligadas aos bancos de dados, hipertextos e redes. Esse “dilúvio informacional” é fluido por meio da internet sem nenhum sinal que deve em algum momento diminuir (PIERRE LÉVY, 1999). Ao se tratar sobre volumetria de dados, existem duas fontes comuns de dados agrupados sob a bandeira do Big Data: (1) são os dados internos de uma organização que podem ser estruturados, não estruturados ou semiestruturados; (2) são os dados de externos da organização, como as informações disponíveis em sites de mídias sociais, hierarquias organizacionais, dicas úteis disponíveis a partir de terceiros e reclamações de clientes postados em sites de regulamentação (SATHI, 2012). Grande volume de dados está além dos dados gerados pelos sistemas transacionais como ERPs. Nos dias atuais, há uma imensidão de dados sendo gerados a cada segundo por máquinas como sensores e câmeras. Também há um volume massivo de dados sendo gerados nas mídias sociais por meio de desktops, smartphones e tablets (LANEY, 2001; TAURION, 2013). Blasiak (2014) ressalta que volumes de dados hoje considerados demasiadamente grandes, no futuro muito próximo será considerado pequeno. Então, a palavra "grande" não descreve o tamanho real dos dados, mas seu tamanho relativo à capacidade das tecnologias dos dias de hoje. O Quadro 4 dimensiona o volume de dados, de acordo com sua unidade de medida. Quadro 4: Volume de dados gerados Unidade de medida Bit Byte (8 bits) Kilobyte (1.000 bytes) Megabyte (1.000.000 bytes) Gigabyte (1.000.000.000 bytes). Comparativo Abreviação do dígito binário. 8 bits é o suficiente para armazenar um caractere de texto.. 20 KB armazena pequenos textos.. 5 MB armazena uma música em MP3.. 1 GB armazena uma hora de vídeo.. Terabyte. 385 terabytes armazenam todo o catálogo da Biblioteca do. (1.000.000.000.000 bytes). Congresso americano, a maior do mundo..

(30) 25 Unidade de medida Petabyte (1.000.000.000.000.000 bytes) Exabyte (1.000.000.000.000.000.000 bytes) Zettabyte (1.000.000.000.000.000.000.000 bytes). Comparativo Armazena todos os jogos de WII, Xbox e Playstation.. Armazena mais do que pode ser visto em uma vida.. Todas as palavras já ditas na história da humanidade.. Yottabyte (1.000.000.000.000.000.000.000.000 bytes). Mais que toda informação disponível no mundo.. Fonte: Adaptado de Solci (2011).. De acordo com a Cisco (2017), apenas o tráfego mundial de dados oriundos de dispositivos móveis aumentará sete vezes até 2021, chegando a 49 Exabytes. Para Marquesone (2017), o poder de armazenamento, os recursos computacionais e o acesso à internet oferecidos por esses dispositivos ampliaram não somente a quantidade de dados gerados, mas também a quantidade de vezes que eles são compartilhados. Um vídeo gerado em um smartphone, por exemplo, pode facilmente ser compartilhado nas redes sociais, enviado por aplicativos de troca de mensagens e disponibilizado em diversos sites da Web em um curto espaço de tempo. O principal desafio relacionado à dimensão Volume do Big Data é o desenvolvimento de mecanismos capazes de armazenar grandes volumes de dados com escalabilidade. Em outras palavras, é uma infraestrutura capaz de se adequar e atender o aumento de uma determinada demanda que tende a crescer com o passar do tempo (DUMBILL, 2012). Com o propósito de superar esse desafio, a computação em nuvem está sendo amplamente utilizada por empresas que possuem ambientes de Big Data. Por meio da oferta de recursos computacionais (como processamento, armazenamento e rede) sob demanda, a computação em nuvem tem sido uma grande aliada para a criação de soluções de Big Data. Sendo um paradigma que oferece benefícios como a elasticidade de recursos, a escalabilidade e a qualidade de serviço, somada à redução de custo e ao aumento da eficiência, diversas empresas estão aproveitando o potencial da computação em nuvem para hospedar suas soluções de Big Data (MARQUESONE, 2017). 2.2.4 Velocidade Além dos desafios impostos pelos grandes volumes de dados, o Big Data possui outra dimensão importante: a Velocidade. Isto significa a velocidade com que os dados são coletados,.

(31) 26 processados e utilizados, além da velocidade de análise que também está relacionado à rapidez com que os dados estão sendo gerados. Assim, existem inúmeras aplicações que mantêm seus serviços em execução 24 horas por dia e dependem da velocidade de armazenamento, processamento e tráfego de dados (MARQUESONE, 2017). Para Laney (2001), a importância da velocidade surge da necessidade de utilização e da análise de dados em tempo real. A definição dessa dimensão refere-se ao estudo da velocidade em que os dados são produzidos e quão rápido deve ser o seu tratamento para que seu Valor seja maximizado. A velocidade no Big Data significa que os dados podem ser coletados e analisados em tempo real, também com soluções escaláveis e em Cloud Computing, o que permite que o ambiente de negócio de uma determinada empresa seja analisado e compreendido com mais rapidez que seus concorrentes, gerando vantagem competitiva com sua utilização (MINELLI; CHAMBERS; DHIRAJ, 2013; PARK; BAEK; PENG, 2016). McAfee e Brynjolfsson (2012) introduzem a ideia de que para boa parte das possíveis aplicações do Big Data dimensão Velocidade é ainda mais importante do que a dimensão Volume, tendo em vista a crescente necessidade das empresas em tomarem decisões imediatas, trabalhando com questões que podem perder sua importância, dependendo da velocidade de reação. Uma empresa que compreende bem o benefício da velocidade é a varejista Amazon, que adota um mecanismo de precificação dinâmica, podendo chegar a atualizar os valores de seus produtos a cada 10 minutos, de acordo com a análise da demanda em tempo. Além da velocidade de análise, o fator velocidade também está relacionado à rapidez com que os dados estão sendo gerados. Estatísticas mencionam que, em apenas 1 minuto, mais de 2 milhões de pesquisas são realizadas no buscador Google, 6 milhões real de seus suprimentos. O fator velocidade está se tornando tão importante, ao ponto que empresas que não conseguirem agilizar o tempo de análise dos dados terão dificuldades em se manterem competitivas no mercado. Estatísticas mencionam que, em apenas 1 minuto, mais de 2 milhões de pesquisas são realizadas no buscador Google, 6 milhões de páginas são visitadas no Facebook e 1.3 milhão de vídeos são vistos no YouTube. Em complemento, temos os inúmeros aplicativos que mantém seus serviços em execução 24 horas por dia e os sensores que geram dados continuamente a cada segundo (MARQUESONE, 2017).. Deste modo, o entendimento, sobre a velocidade como dimensão do Big Data, é que o acesso à inteligência gerada, a partir dos dados seja em tempo real, deixou de ser tendência e se tornou requisito primordial para tecnologias que suportam o tratamento e análise de dados, pois a baixa velocidade pode limitar diversas operações, diminuindo a vantagem competitiva de um determinado negócio ou organização (DINESHKUMAR et al., 2016; TAURION, 2013)..

(32) 27 2.2.5 Variedade Essa dimensão é caracterizada pela grande Variedade dos tipos de dados disponíveis no mundo virtual. Há poucos anos, a maior parte dos dados gerados eram estruturados, ou seja, organizados por linhas e colunas. Nos dias atuais, o cenário mudou, a maior parte dos dados gerados no ciberespaço são dados não estruturados, como imagens, sons, textos, bases de dados, e-mails, dados de sensores e redes sociais, o que exige grandes desenvolvimentos para sua coleta, armazenamento, processamento, disseminação gerenciamento e organização (CUKIER; MAYER-SCHÖENBERGER, 2013; LANEY, 2001; MANYIKA et al., 2011; WALKER; SCHÖNBERGER-MAYER, 2014). Para Taurion (2013), a dimensão variedade é tipificada por dados que possuem sua origem em sistemas estruturados e não estruturados como navegação na web, mídias sociais, dados transacionais de diferentes naturezas como gerenciamento de risco, consumo, financeiro, seguros, telecomunicações, saúde e entretenimento. Incluem-se também dados de biometria para identificação e validação como: reconhecimento de voz, íris, retina e face; dados gerados no dia a dia pelas pessoas por envio de e-mails, logs, blogs, relatórios, apresentações e documentos em geral, além da comunicação entre dispositivos fixos e móveis que monitoram processos, máquinas, localizam pessoas, liberam acessos e contabilizam estoques. Com relação aos dados estruturados, Meer (2013) relaciona cinco diferentes categorias principais que são mais familiares às pessoas que utilizam os sistemas de informação convencionais, conforme apresentado no Quadro 5. Quadro 5: Categorias de dados estruturados Categoria Criados. Provocados. Descrição do dado Um determinado indivíduo fornece esse tipo de dado ao responder um questionário de uma empresa. As opiniões que são registradas, como, por exemplo, na avaliação da página de uma loja no facebook.. Transacionados. As ações dos usuários que são geradas, por exemplo, numa compra no Mercado Livre.. Compilados. Algumas empresas os mantêm em suas bases com diversas informações de cada pessoa. Experimentais. Um conjunto dos dados criados e transacionados, com estes a área de marketing pode ofertar produtos específicos para cada cliente.. Fonte: Adaptado de Meer (2013)..

(33) 28 No campo dos dados não estruturados, McAfee e Brynjolfsson (2012) ressaltam a variedade dos dados que possuem relação com o Big Data e assumem a forma de mensagens, imagens postadas nas redes sociais, leituras de sensores e sinais de GPS, a partir de dispositivos móveis. Com este cenário, os dispositivos móveis assumem grande importância, visto que são responsáveis por enormes fluxos de dados ligados às pessoas, às atividades e aos locais. De acordo com a Cisco (2017), em 2021, haverá no mundo mais dispositivos móveis do que contas bancárias, casas com água canalizada ou linhas de telefone fixo. Toda essa quantidade de dispositivos deverá trafegar 587 exabytes de dados por ano, mais de 122 vezes todo o tráfego mundial de dados móveis gerado em 2011. Para Tufekci (2013), os dados gerados por engajamento nas redes sociais podem induzir a uma análise rasa por trazer amostras distorcidas não suficientes para conclusões assertivas, nessa linha. Esse autor defende que as análises realizadas com base em dados coletados em plataformas como Facebook, Tweeter, Instagram, Snapchat, Linkedin, Pinterest não devem ser replicados para o restante da população. Entretanto, para Marquesone (2017), a utilização de dados coletados em redes sociais, associados com a capacidade de processamento em tempo real, tem sido cada vez mais importante para sociedade. Um exemplo é a identificação de tendências com velocidade nunca alcançada antes, pois a análise imediata das informações compartilhadas e pesquisadas pelas redes permite gerar descobertas como pandemias de doenças em regiões específicas. Isso significa um grande avanço, visto que, em muitos casos, se gastariam dias para realizar essa identificação, observando que os dados analisados já estariam desatualizados. Os dados gerados por humanos fornecem uma valiosa fonte de informação que, quando avaliados em tempo real, podem gerar conhecimentos imensuráveis (MARQUESONE, 2017). Pensando no mundo corporativo, o fluxo de geração de registros é contínuo e resultante de interações sociais e econômicas em todo o mundo, por meio de dispositivos móveis computadores e tablets. Esses dados, quando coletados, armazenados, processados, correlacionados, compartilhados e visualizados, são fonte de importante inteligência que podem colocar as decisões à frente de concorrentes (FERNANDES; LIMA-MARQUES, 2014; FRANKS, 2013; TAURION, 2013). 2.2.6 Demais Dimensões Apesar da convergência sobre as dimensões Volume, Velocidade e Variedade para representar o Big Data, como visto no Quadro 3, parte dos autores mencionam mais dimensões.

(34) 29 além dos tradicionais “3Vs”, utilizando 5 dimensões para descrever o Big Data: Volume, Velocidade, Variedade, Veracidade e Valor (DEMCHENKO; DE LAAT; MEMBREY, 2014; TAURION, 2013; ZIKOPOULOS; EATON, 2011). Taurion (2013) defende que é preciso incluir a dimensão Veracidade, pois é preciso ter a certeza de que os dados fazem sentido e são autênticos e, também a dimensão Valor, dada a necessidade de as organizações implementarem projetos de Big Data que obtenham retorno destes investimentos. Valor vem da importância de extrair benefícios de diversas naturezas a partir do uso do Big Data, ou seja, agregar valor aos processos, produtos, serviços e negócios mediante dados confiáveis. Quanto maior a veracidade dos dados e sua riqueza, maior será a chance de a análise ser realizada de maneira clara a gerar vantagens para as organizações (TAURION, 2013). Para Marquesone (2017), as três dimensões formam a base necessária para o conhecimento sobre Big Data, mas ressalta a validade sobre as dimensões Valor e Veracidade, descrevendo Valor como uma dimensão que faz referência ao quão valioso e significativo um dado pode ser em uma solução. Um exemplo seria: qual o valor dos dados de mídias sociais para uma solução de Big Data no departamento de marketing de uma empresa? É importante fazer essa análise de valor para se determinar quais dados serão priorizados. Já a dimensão Veracidade está relacionada à confiabilidade dos dados. Pelo fato de que Big Data está inserido em um contexto de dados em grande volume e variedade, pois é comum a existência de dados inconsistentes. Assim, a veracidade refere-se ao quão confiável é um conjunto de dados usado em uma solução de Big Data (MARQUESONE, 2017). Sathi (2012) também adiciona a dimensão Veracidade ao contexto de Big Data e a descreve por meio da credibilidade das fontes de dados utilizadas, bem como a adequação dos dados para um determinado fim. Além das dimensões Volume e Veracidade, Lyon (2014) ressalta outras características que devem ser consideradas ao se tratar de Big Data. Quadro 6: Demais características do Big Data Característica Exaustividade de escopo. Resolução dos dados. Interconexão dos dados. Descrição Dados coletados tendem a englobar um número cada vez maior de pessoas e sistemas. Dados não estruturados possuem uma enorme quantidade de detalhes. Dados possuem campos em comum que permitem o relacionamento de diferentes conjuntos de dados..

(35) 30 Característica Flexibilidade e escalabilidade horizontal Flexibilidade e escalabilidade vertical. Descrição Dados que permitem adicionar mais detalhes sobre uma mesma coleta de dados. Possibilidade de novas coleta de dados na mesma análise.. Fonte: Adaptado de Lyon (2014). Um estudo realizado pela IBM (2012a) ressalta que a Veracidade dos dados está associada com sua grandeza de Valor, de maneira que tipos específicos de dados, em que os métodos de limpeza não são eficazes para remoção de suas incertezas, como o tempo, a economia, ou a real decisão de compra futura de um cliente, tem seu Valor reduzido. Deste modo, saber escolher e processar as fontes de dados para diminuir incertezas é um objetivo a ser alcançado pelas organizações que trabalham com Big Data. 2.3. O Constructo Inteligência Competitiva Esta sessão refere-se à Inteligência Competitiva, que é a outra base teórica desse estudo.. Assim como na sessão que trata sobre o Big Data, esta sessão foi dividida em subseções: na subseção 2.3.1, estão os conceitos e o entendimento geral sobre a Inteligência Competitiva; na subseção 2.3.2, está descrito, com detalhes, o ciclo da Inteligência Competitiva, assim como cada uma de suas etapas.. 2.3.1 Inteligência Competitiva - Conceitos O processo de Inteligência Competitiva já se encontra difundido e amadurecido na literatura. Inteligência Competitiva gera recomendações praticáveis advindas do processo sistemático de planejar, coletar e disseminar informação sobre o ambiente externo para oportunidades ou desenvolvimentos, que tem o potencial de afetar a situação competitiva de uma companhia ou país (CALOF, 2007). A Inteligência Competitiva surgiu como campo de estudo, na década de 1980, como uma disciplina capaz de integrar o planejamento estratégico de modo a possibilitar o monitoramento constante do ambiente externo e, assim, conseguir acompanhar com mais rapidez os movimentos do mercado. Dessa maneira, o que torna o processo de Inteligência Competitiva diferente é a geração de informações em tempo real, de forma dinâmica e cíclica. O tempo e a velocidade se tornam importantes para o processo de Inteligência Competitiva, visto que propiciam aos sujeitos organizacionais se anteciparem às mudanças.