• Nenhum resultado encontrado

Para realização do tratamento de dados da pesquisa realizada nesse trabalho, será necessário a criação de uma plataforma de BI

2.4.1 Conceitos e definições

O conceito de BI pode ter diferentes abordagens dependendo do autor escolhido como referência. De acordo com Gartner Group (2011 apud SILVA; SILVA; GOMES, 2016, p. 2783):

O termo BI foi usado pela primeira vez pelo Gartner Group e está relacionado ao processo de obtenção, organização, análise, compartilhamento e monitoramento de informações e possui com o objetivo de suporte à gestão de negócios. BI é um termo genérico que inclui as aplicações, infraestrutura e as ferramentas e melhores práticas

que permitem o acesso e a análise de informações para melhorar e otimizar decisões e desempenho.

Já Turban et al. (2009), explica que Business Intelligence é “como um apoio computadorizado para a tomada de decisões gerenciais”.

Segundo Gomes e Costa (2013 apud SILVA;SILVA;GOMES, 2016), "O mundo contemporâneo exige das empresas uma capacidade de atender às demandas do mercado em tempo hábil e realizar, constantemente, a prospecção de cenários, tornando-as cada vez mais competitivas", e os sistemas de Business Intelligence, atendem os requisitos citados.

Para Fraga et al. (2017, p. 47):

Sistemas de BI combinam dados operacionais com ferramentas analíticas para apresentar informação complexa e competitiva. Desta forma, o BI é uma coleção de tecnologias de apoio à decisão para a empresa destinada a permitir que os trabalhadores do conhecimento, tais como executivos, gerentes e analistas para tomar decisões melhores e mais rápidas.

De acordo com Anandarajan, Anandarajan e Srinivasan (2012, p. 19, tradução nossa), aplicações de Business Intelligence incluem as atividades de suporte a sistemas de decisão, consultas e relatórios, processos analíticos online, análises estatísticas, text e data mining e visualização.

Os principais pontos em comum nas diferentes definições, podem ser sintetizadas da seguinte forma: um sistema de Business Intelligence é um conjunto de tecnologias que dão suporte ao processo decisório, e para isso, capturam dados das operações, transformam os dados brutos em informação através da transformação e apresentação dos mesmos, na forma de

dashboards, relatórios, gráficos, tabelas e indicadores, que permitem ao analista de negócios

analisar, visualizar e interpretar as relações e tendências entre os dados que o auxiliarão no processo decisório.

2.4.2 Arquitetura de um sistema de BI

A arquitetura de BI é composta por três partes que são facilmente distinguíveis: o processo ETL, dedicado a extração, transformação e carga (load) dos dados provenientes dos ambientes de operação, um segundo módulo que é o repositório de dados, onde os dados do processo ETL serão persistidos e o terceiro módulo, é a área de apresentação de dados (front-end), onde os dados do repositório são apresentados na forma de dashboards, relatório, gráficos, KPIs.

2.4.3 ETL - Processo de Extração, Transformação e Carga

O processo ETL tem como principal objetivo fazer a integração de dados provenientes dos diversos sistemas transacionais da organização, e até de dados externos à organização. Este processo, é organizado em três etapas, sendo a primeira a extração dos dados necessários relacionados aos requisitos de informação do sistema de BI. Os dados necessários para atender os requisitos, podem vir de diferentes fontes, formatos e nomenclaturas.

A segunda etapa é a transformação, que inclui a limpeza e o tratamento dos dados. A limpeza de dados está relacionada com a qualidade dos dados, e é um ponto que merece especial atenção, já que os dados coletados serão utilizados para apoiar o processo decisório.

Quando é comentado sobre a qualidade dos dados, temos que imaginar que os dados de entrada geralmente vêm de fontes diferentes (Figura 2), e que dependendo das fontes (tabelas, formulários, banco de dados, etc), os dados podem chegar danificados ou com problemas. Por exemplo, em algumas fontes, o dado "País" pode chegar como "Brasil", e de outras, pode chegar como "BR". O ETL garante que os dados serão padronizados de acordo com a regra que o gerenciador determinar. (CHAUDHURI; DAYAL; NARASAYYA, 2011)

O processo ETL é também utilizado para a transformação dos dados, já que a granularidade dos dados das fontes é diferente aos detalhes dos dados para análises, e o processo ETL é quem sumariza, agrupa e resume os dados para serem analisados. Depois de coletados, esses dados são armazenados em um repositório chamado "Data warehouse" (CHAUDHURI; DAYAL; NARASAYYA, 2011).

A terceira parte do processo ETL é a carga dos dados tratados no repositório de dados do sistema de BI, onde eles serão persistidos para posterior consumo pelas ferramentas de apresentação de dados.

Figura 2 - Arquitetura de BI

Fonte: Chaudhuri, Dayal, Narasayy (2011 apud SILVA; SILVA; GOMES 2016)

Existem várias ferramentas de ETL disponíveis no mercado, assim como há a possibilidade de serem desenvolvidas diretamente no projeto de data warehouse, caso haja um grande conhecimento dos dados operacionais por parte dos envolvidos.

Esta etapa é crítica e essencial e deve ser muito bem realizada, para que não haja comprometimento dos resultados do projeto.

2.4.4 Data Warehouse (DWH)

O segundo módulo de uma arquitetura de um sistema de BI, é o repositório de dados, isto é, a estrutura onde os dados coletados e tratados pelo processo ETL serão persistidos. Uma das principais características que diferencia os sistemas de BI dos sistemas transacionais, é que os sistemas de BI, são sistemas de consumo de dados e os sistemas transacionais se caracterizam pela captura dos dados. Neste sentido, de acordo Turban et al. (2009), um DWH é um repositório central de dados históricos, organizado de forma que o acesso seja fácil (usando um navegador da Web) e a manipulação para o suporte a decisões é conveniente. Em outros termos, um DWH é um repositório que tem as características necessárias para atender as necessidades de um sistema de BI.

Conforme Inmon (2005, p. 29, tradução nossa): “um data warehouse é orientado ao assunto, integrado, não volátil e realiza coleta de dados com variação no tempo para apoiar as decisões da administração.”

De acordo com Kimball (2002, p.3, tradução nossa), os principais requisitos de um Data Warehouse são:

● Fazer com que informações de uma empresa possam ser facilmente acessadas. O conteúdo do data warehouse deve ser compreensível. Os dados devem ser intuitivos e óbvios para o usuário da área de negócios e não apenas para o desenvolvedor.

● Apresentar informações da organização de modo consistente. Os dados na warehouse devem ser confiáveis e devem ser obtidos cuidadosamente a partir de várias fontes na organização, filtrados, submetidos a um controle de qualidade e liberados apenas quando estiverem prontos para serem utilizados.

● Ser adaptável e resiliente a mudanças. [...] As necessidades dos usuários, as condições comerciais, os dados e a tecnologia, todos estão sujeitos às mudanças decorrentes do tempo. O data warehouse deve ser projetado para lidar com essa mudança inevitável. ● Ser um baluarte seguro que protege as informações. O tesouro de informações da

empresa está guardado no data warehouse. [...]

● Servir como fundação para melhorar a tomada de decisão. [...] O data warehouse deve conter os dados apropriados para dar suporte à tomada de decisões.

● Se for bem sucedido, deverá fazer com que a comunidade de negócio, aceite-o. [...] Se a comunidade de negócio não adotar o data warehouse e continuar a usá-lo ativamente por seis meses após o treinamento, indica que ele não passou no teste de aceitação.

Para a administração desses dados armazenados em um data warehouse, é utilizado um sistema de gerenciamento de banco de dados (SGBD). Um SGBD é um software que possibilita a criação, modificação, exclusão e a leitura dos dados de um banco. Ele ainda garante a integridade e a segurança dos dados. (SCHIMIGUEL, 2014)

Sobre o armazenamento de grandes quantidades de dados e seu gerenciamento, Chaudhuri, Dayal, Narasayya (2011, p.88-98, tradução nossa) comenta:

Grandes depósitos de dados normalmente implantam mecanismos SGBD paralelos para que as consultas SQL possam ser executadas em grandes volumes de dados com baixa latência. À medida que mais dados nascem digitais, há um desejo crescente de arquitetar plataformas de dados de baixo custo que possam suportar um volume de dados muito maior do que o tradicionalmente manipulado por SGBDs. Isso geralmente é descrito como o desafio do "Big Data".

2.4.4.1 Modelagem Dimensional

A modelagem dimensional é uma forma de técnica de modelagem de dados que preserva as características de um DWH, isto é, a modelagem dimensional é uma forma de implementar um repositório de dados do tipo DWH.

Para Kimball (2002, p. 10, tradução nossa):

Modelagem dimensional é um novo nome para uma técnica antiga que permitia tornar os bancos de dados fáceis e compreensíveis. Caso após caso, a partir da década de 1970, as empresas de TI, as consultorias, os usuários finais e os fornecedores migraram para uma estrutura dimensional simples para atender à necessidade humana fundamental de simplicidade.

A modelagem dimensional é uma técnica de modelagem de dados voltada especialmente para a implementação de um modelo que permita a visualização de dados de forma intuitiva e com altos índices de performance na extração de dados. O produto final de uma modelagem dimensional consiste em um modelo de dados com tabelas de fato e tabelas de dimensão.

Conforme Kimball (2002, p. 16, tradução nossa), “uma tabela fato é a tabela primária em um modelo dimensional onde as medidas de performance numérica são armazenadas”.

De acordo com Kimball (2002, p. 19, tradução nossa), “tabelas de dimensão são companheiras integrais de uma tabela de fato. As tabelas de dimensão contêm os descritores textuais do negócio”.

2.4.5 Front-end de um sistema de BI

O terceiro e último módulo de uma arquitetura de um sistema de BI, é a área de informação ou de apresentação de dados (front-end), onde os dados do repositório são apresentados através de cubos OLAP (Online Analytical Processing) e suas operações, KPIs (Key Performance Indicators),e Dashboards (painéis de indicadores), e relatórios entre outras foram de apresentação.

Os gráficos são ferramentas que ajudam na visualização de tendências, desempenhos e outros, dentro de um período, de forma clara e simples. Todos os dados que são exibidos nos gráficos, assim como em outras formas de exibir resultados de um sistema de BI, agem como uma forma de apoio à decisão, dando um direcionamento para os próximos resultados e estratégias. (DURÃES, 2019).

Os indicadores ou KPIs são conhecidos como Indicador-Chave de desempenho, eles são mensuráveis, podem ser calculados dinamicamente e funcionam como um medidor de desempenho. O principal objetivo é acompanhar se as ações implementadas estão obtendo o resultado esperado ou não, de acordo com as diretrizes definidas, sendo assim, também são uma parte importante da tomada de decisão, pois demonstra onde a empresa está errando ou

acertando, podendo continuar com os planos ou alterá-los, para adquirir novos resultados. (BONEL, 2017)

As Dashboards apresentam suas informações através de combinação de textos e gráficos, agregando indicadores de desempenho (KPIs), gráficos e relatórios.

OLAP é um conjunto de ferramentas que possibilitam navegar nos dados de um data warehouse, utilizando um conjunto de operadores que permitem alterar a granularidade dos dados, filtrar os dados e ter diferentes visões dos dados. (THOMSEN, 2002)

3 METODOLOGIA

Neste capítulo, serão apresentadas a caracterização do tipo de pesquisa, as atividades metodológicas e as delimitações do projeto.

Com a coleta de dados através de um questionário, espera-se construir uma solução de BI para o auxílio de estudantes na escolha das competências técnicas e comportamentais requeridas pelas empresas e as tecnologias utilizadas e emergentes demandadas aos profissionais de desenvolvimento no mercado de trabalho.

Documentos relacionados