Equação 2: Conversão de escalas (regra de três simples)
2.2 DATA SCIENCE
2.2.1 Analytics
Analytics é um termo que sofreu modificações no decorrer do tempo. Press (2013) efetua um resgate histórico do Data Science e, deste modo, afirma que o termo Analytics surgiu em 2005 com a publicação de Davenport, Cohen e Jacobson intitulada Competing on Analytics – posteriormente expandido e publicado em livro pela Harvard Business Review em 2007. Davenport, Cohen e Jacobson (2005) afirmam que, devido à competitividade crescente nas organizações, houve o incentivo para emprego de análises estatísticas no gerenciamento organizacional, em oposição a antigos métodos de gestão e tomada de decisão intuitiva. No
entanto, a partir desse início, vários outros conceitos surgiram para qualificar Analytics (vide Quadro 2).
Autores Conceitos
Davenport e Harris (2007, p. 7)
“Uso extensivo de dados, análise estatística e quantitativa, modelos explicativos e preditivos e gestão baseada em fatos para orientar decisões e ações.”
Chandler (2011, p. 16)
“(a) Uma capacidade ou técnica específica de BI, especialmente uma técnica mais avançada (por exemplo, análise preditiva); (b) A estratégia comercial de usar a análise para resolver um problema comercial específico (por exemplo, análise de fraude); (c) Aplicações analíticas; uma coleção de recursos de BI empacotados para um determinado domínio ou processo de negócios (por exemplo, análise de previsão de vendas); (d) Todo o domínio, abrangendo hardware, software, pessoal e processos.”
Chen, Chiang e Storey (2012, p. 1174)
“Refere-se às tecnologias (...) que são baseadas principalmente em mineração de dados e análise estatística.”
Cosic, Shanks e Maynard (2012, p. 1)
“Abrange as pessoas, processos e tecnologias envolvidas na coleta, análise e transformação de dados utilizados para apoiar a tomada de decisões gerenciais. (...) Também inclui análise estatística, visualização de dados, modelagem preditiva e sistemas de previsão.”
Banerjee, Bandyopadhyay e Acharya (2013, p. 1)
“É examinar os dados cuidadosamente e em detalhes para identificar causas, fatores-chave, possíveis resultados, etc. ‘Analytics’ é o processo de análise de dados que é feito logicamente auxiliado por ciências (estatísticas, computadores, etc.).”
Sharma, Mithas e Kankanhalli (2014, p. 435)
“Permite que analistas e gerentes participem de um processo de criação de sentido baseado em TI, no qual eles usam os dados e a análise como um meio de entender os fenômenos que os dados representam.”
Gandomi e Haider (2015, p.
140) “Refere-se a técnicas usadas para analisar e adquirir inteligência de Big Data.”
Kulin (2015, p. 4)
“Analytics exige a capacidade de coletar, gerenciar, analisar e atuar em quantidades cada vez maiores de dados diferentes, na velocidade certa e no prazo certo. Inclui metodologias para desenvolvimento, bem como tecnologias.”
Wilder e Ozgur (2015, p. 180)
“Aplicação de processos e técnicas que transformam dados brutos em informações significativas para melhorar a tomada de decisões.”
Provost e Fawcett (2016, p. 12)
“Compreender os conceitos fundamentais e ter estruturas para organizar o pensamento analítico de dados (...) para melhorar a tomada de decisões orientada por dados ou para ver ameaças competitivas orientadas a dados.”
Cao (2017, p. 5; 17)
“Ciência multidisciplinar que analisa quantitativa e qualitativamente os dados com o objetivo de extrair novas conclusões ou insights (exploratórios ou preditivos) ou extrair e provar hipóteses (confirmatórias ou baseadas em fatos) sobre essas informações para tomada de decisão e ação.”
“Jornada da exploração de dados (por análise descritiva e preditiva) até a entrega de informações e decisões acionáveis por meio de análises prescritivas e fornecimento de conhecimento acionável.”
Delen e Zolbanin (2018, p. 188)
“Um processo que emprega várias técnicas para analisar e interpretar diferentes formas de dados para permitir melhores decisões e melhorar o desempenho da empresa.”
Quadro 2: Definições de Analytics, por diversos autores. Fonte: Elaboração Própria (2019).
Pelo Quadro 2, observando as contribuições dos autores ao campo de Data Science, o que se nota é a diversidade nas definições de Analytics. Supõe-se que esta diversidade exista, uma vez que o campo de estudo ainda está sendo estruturado e alguns conceitos acabam por se misturarem. Existem autores que consideram Analytics como ferramenta, técnica ou tecnologia (CHEN; CHIANG; STOREY, 2012; GANDOMI; HAIDER, 2015), como um processo de análise de dados (DAVENPORT; HARRIS, 2007; BANERJEE; BANDYOPADHYAY; ACHARYA, 2013; SHARMA; MITHAS; KANKANHALLI, 2014; PROVOST; FAWCETT, 2016; CAO, 2017; DELEN; ZOLBANIN, 2018) e como grande área que engloba aspectos teóricos e ferramentais (COSIC; SHANKS; MAYNARD, 2012; WILDER; OZGUR, 2015). Contudo, os estudos mais recentes (2016 a 2018) apresentados já indicam convergência de pensamento dos autores: Analytics como processo de análise de dados, que faz uso de técnicas definidas, de modo a extrair sentido dos dados.
Para fins do presente trabalho, Analytics se configura como um processo de análise de dados com etapas definidas, de modo a dar suporte à tomada de decisão em âmbito organizacional. Para tanto, com o intuito de analisar os dados e, a partir daí, extrair significados úteis para o tomador de decisão, são necessários processos prévios e aporte ferramental que permitirão que as análises ocorram: Data Mining e Business Intelligence. Data Mining, ou em tradução literal, mineração de dados, derivou-se da Aprendizagem de Máquinas (Machine Learning) (PROVOST; FAWCETT, 2016). Originou-se do aumento significativo da produção de dados e a consequente capacidade de coletá-los (CHEN; HAN; YU, 1996) e, para tanto, preocupa-se com desenvolvimento de algoritmos e técnicas para análise de dados (PROVOST; FAWCETT, 2016).
O campo da mineração dos dados evoluiu com a evolução da tecnologia da informação, e possui ênfase na exploração do conhecimento, por intermédio da identificação de padrões
úteis nos dados (HAN; PEI; KAMBER, 2011). No que tange à operacionalização, Data Mining
é executado por etapas semiestruturadas, que envolvem compreensão da problemática que se quer resolver a partir dos dados, preparação dos dados, modelagem, avaliação e implantação do modelo (PROVOST; FAWCETT, 2016).
Após a etapa de preparação e modelagem dos dados, tem-se a organização e apresentação dos dados, de modo a permitir que o tomador de decisão possa, a partir daí, fazer uso deles. Esta é a função de Business Intelligence. O BI, assim como Analytics, possui definições diferentes, a depender dos autores. Pode indicar grande área de análise de dados na
pode representar todo o processo por trás da análise – coleta, armazenamento, transformação, de modo a dar subsídios para quem o analise (NEGASH, 2004; SIRIN; KARACAN, 2017), ou pode representar o ferramental que dá suporte às análises de dados (MOSS; ATRE, 2003; CHAUDHURI; DAYAL; NARASAYYA, 2011).
Para efeito do presente trabalho, Business Intelligence é entendido como o conjunto de ferramentas que dão subsídios para tomada de decisão nas organizações. Relaciona-se com o modo como os dados são apresentados para visualização, permitindo sua análise (KULIN, 2015). Essas ferramentas – interativas, inovadoras – estão cada vez mais sendo demandadas pelas organizações (CHAUDHURI; DAYAL; NARASAYYA, 2011), uma vez que permite rica visualização dos dados, simulações, integrações entre variáveis, tornando dinâmico o processo decisório.
Nesse sentido, após a operacionalização de Data Mining e, posteriormente, apresentação visual propiciado por Business Intelligence, a etapa Analytics está apta para ser desenvolvida. É válido ressaltar que a análise de dados não é um processo que ocorre de forma “mágica”, no sentido de que apenas a inclusão dos dados garante resultados valiosos para a organização (JAGADISH, 2015, p. 50). É necessário “processo ativo de engajamento” dos profissionais da organização, com etapas complexas e desafios a serem superados, de modo a se extrair conhecimento dos dados (SHARMA; MITHAS; KANKANHALLI, 2014, p. 435; JAGADISH, 2015). Envolve a análise do que é conhecido pelos gestores, do que é desconhecido, previsão do futuro e intervenções antecipadas bem fundamentadas (CAO, 2017).
Desse modo, são quatro os níveis evidenciados no Analytics: análise descritiva, análise diagnóstica, análise preditiva e análise prescritiva (BANERJEE; BANDYOPADHYAY;
ACHARYA, 2013; CAO, 2017; DELEN; ZOLBANIN, 2018). A análise descritiva conta a
história dos dados, entende quais comportamentos são evidenciados. A análise diagnóstica é a etapa seguinte, em que se busca explicações para os comportamentos observados. A partir daí, surge a análise preditiva com estimação de comportamento futuro e, por fim, a análise prescritiva com recomendações de ações para produção de efeito desejado – ou desvio de comportamento indesejado – nos dados, conforme visualização na Figura 4.
Figura 4: Quatro fases do Analytics.
Fonte: Elaboração Própria (2019), baseado em Banerjee, Bandyopadhyay e Acharya (2013) e Delen e Zolbanin (2018).
Legenda: As elipses representam as quatro fases de Analytics. As setas representam o caminho que o responsável pela análise deve percorrer.
À medida que as etapas da análise avançam, aumenta-se a complexidade e robustês nas análises (DELEN; ZOLBANIN, 2018). Dessa maneira, são utilizadas mensurações na etapa descritiva; para que a etapa diagnóstica ocorra, são necessárias ferramentas de apresentação dos dados; na etapa preditiva são necessárias modelagens estatísticas para previsão de comportamentos e, além disso, é necessário auxílio computadorizado de simulações na etapa prescritiva (BANERJEE; BANDYOPADHYAY; ACHARYA, 2013). É importante ressaltar que as quatro fases de Analytics – descritiva, diagnóstica, preditiva e prescritiva – são iterativas, logo, assim que a etapa prescritiva ocorre, retorna-se à primeira fase – descritiva – para avaliar se as ações foram bem sucedidas. Logo, é um processo que está em constante retroalimentação. Nesse sentido, as organizações estão, cada vez mais, utilizando Data Science na gestão e processos decisórios. Em organizações voltadas para a educação, também há a procura por gestão e tomada de decisão baseada em dados, seja para entender e lidar com sua complexidade, seja pela competitividade do sistema que impulsiona a definição de estratégias para que o aluno permaneça na instituição (DANIEL; BUTSON, 2013; NJENGA et al., 2017). Essa motivação, aliada ao desenvolvimento tecnológico (DANIEL, 2015), permitiu que cada vez mais as instituições adotassem esse modelo. Nas instituições de ensino superior, os fundamentos do
Analytics são aplicados para melhor gerenciamento as organizações e melhoria na aprendizagem dos atores que compõem a instituição. Esses processos recebem os nomes de
Academic Analytics (AcAn) e Learning Analytics (LA), respectivamente. AcAn diz respeito à análise da gestão do ensino, já LA se refere à análise em âmbito de ensino-aprendizagem.
Academic Analytics é a análise de dados em âmbito estratégico em organizações vinculadas à educação (DANIEL; BUTSON, 2013). Envolve “todas as atividades do ensino superior que afetam administração, pesquisa, alocação de recursos e gerenciamento” da instituição (DANIEL, 2015, p. 912). Utilizada para decisões administrativas (CAMPBELL;
DEBLOIS; OBLINGER, 2007), Academic Analytics tem o potencial de melhorar os resultados
(DANIEL; BUTSON, 2013; AGASISTI; BOWERS, 2017). Adicionalmente, busca minimizar a retenção e a evasão (CAMPBELL; DEBLOIS; OBLINGER, 2007), que são fenômenos nacionais (COSTA; COSTA; MOURA JR., 2017; BAGGI; LOPES, 2011) e internacionais adversos com grande repercussão nas universidades.
Learning Analytics, por sua vez, está diretamente relacionada com os alunos e seu sucesso na organização, logo, o ensino-aprendizagem (DANIEL; BUTSON, 2013). Tem o potencial para avaliar as práticas atuais de educação e propor mudanças caso não sejam viáveis (KNIGHT; SHUM, 2017). Diz respeito, entre outras questões, a como modelagens de dados impactam no aluno – seu comportamento, aprendizado – e no ensino em geral – currículo, ambiente em que as atividades ocorrem (KLEIN et al., 2019; DANIEL, 2015).
O foco do presente trabalho é Academic Analytics. É o impacto da análise dos dados em instituições de ensino superior que afeta toda a organização, em nível estratégico. Campbell, Deblois e Oblinger (2007) apresentam casos de sucesso da utilização de Academic Analytics
em universidades para impulsionar matrícula de alunos e minorar retenção. Além disto, Daniel e Butson (2013) apresentam a aplicação do AcAn, de modo a melhoria dos processos e desempenho da universidade estudada.