• Nenhum resultado encontrado

Orientação acadêmica apoiada por learning analytics e visualização de dados

N/A
N/A
Protected

Academic year: 2021

Share "Orientação acadêmica apoiada por learning analytics e visualização de dados"

Copied!
114
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE INSTITUTO METRÓPOLE DIGITAL

PROGRAMA DE PÓS-GRADUAÇÃO EM INOVAÇÃO EM TECNOLOGIAS EDUCACIONAIS

MESTRADO PROFISSIONAL EM INOVAÇÃO EM TECNOLOGIAS EDUCACIONAIS

TOBIAS FERREIRA DA ROCHA NETO

ORIENTAÇÃO ACADÊMICA APOIADA POR LEARNING ANALYTICS E VISUALIZAÇÃO DE DADOS

NATAL-RN 2019

(2)
(3)

TOBIAS FERREIRA DA ROCHA NETO

ORIENTAÇÃO ACADÊMICA APOIADA POR LEARNING ANALYTICS E VISUALIZAÇÃO DE DADOS

Dissertação apresentada ao Programa de Pós-Graduação em Inovação em Tecnologias Educacionais da Universidade Federal do Rio Grande do Norte como requisito para à obtenção do grau de Mestre em Inovação em Tecnologias Educacionais

Aprovada em: 01/11/2019

BANCA EXAMINADORA

______________________________________ Profa. Dra. Isabel Dillmann Nunes

Orientadora

Universidade Federal do Rio Grande do Norte ______________________________________ Profa. Dra. Márcia Jacyntha Nunes Rodrigues Lucena

Coorientadora

Universidade Federal do Rio Grande do Norte ______________________________________

Profa. Dra. Apuena Vieira Gomes Membro interno

Universidade Federal do Rio Grande do Norte ______________________________________

Prof. Dr. Fabiano Azevedo Dorça Membro externo

(4)

AGRADECIMENTOS

Gostaria de agradecer eternamente ao Deus da minha vida que me deu forças e inspiração para a condução deste sonho. À minha avó Maria do Carmo Ferreira in memorian que foi meu primeiro exemplo de amor e dedicação, contribuindo na minha criação e educação. Aos meus pais Valtércio Ferreira da Rocha e Ailma Barros da Rocha in memorian pelo exemplo e peso no que sou hoje no que se refere ao meu caráter, guardo para sempre na minha memória todos os momentos felizes em família. À minha esposa Renally Raiani Guimarães da Silva Rocha, meus filhos Matheus e Mariana por todo o amor e suporte dado para a concretização do mestrado, aos momentos investidos para os estudos, esses furtaram o convívio da família, mas num propósito maior de crescimento e desenvolvimento pessoal que confio no impacto na minha universidade UFRN e na sociedade. À minhas orientadoras Isabel Dillmann Nunes e Márcia Jacyntha Nunes Rodrigues Lucena que são exemplos de dedicação e compromisso com a educação no ensino superior, me incentivaram e acreditaram desde o primeiro momento em que nos conhecemos, conduziram a orientação com muita paciência, cooperação e responsabilidade. Por fim, a equipe de desenvolvimento de sistemas da UFRN pela disponibilidade nas reuniões e disponibilização de dados para análises, à Pró-Reitoria de Gestão de Pessoas da UFRN pela oportunidade dada aos servidores técnicos-administrativos poderem obter a sua qualificação, direcionando pesquisas e produtos com inovação e tecnologia em prol ao desenvolvimento institucional.

(5)

Mas, buscai primeiro o reino de Deus, e a sua justiça, e todas estas coisas vos serão acrescentadas. Mateus 6:33

(6)

RESUMO

A orientação acadêmica é uma atividade regimental a ser desempenhada pelo docente nas instituições de ensino superior. Através desta atividade o docente pode guiar, acompanhar e aconselhar o discente em sua vida acadêmica e nas trilhas a serem percorridas durante o curso e em atividades de estágio, pesquisa e extensão. O Sistema Integrado de Gestão de Atividades Acadêmicas (SIGAA), desenvolvido pela Universidade Federal do Rio Grande do Norte (UFRN), que informatiza os procedimentos da área acadêmica e possibilita ao orientador visualizar algumas informações do orientando como o histórico escolar, troca de mensagens e autorizar a matrícula em disciplinas por ele solicitada. Porém, não há a exibição do lançamento de notas e faltas do aluno ao longo do tempo. Também não apresenta informações de forma simplificada de desempenho do orientando durante a disciplina, que possam proporcionar a observação, possíveis intervenções e um aconselhamento contínuo. Entretanto, o professor se torna mais efetivo no papel de orientador caso disponha de recursos tecnológicos que o proporcionem melhores condições no acompanhamento e na tomada de decisões acadêmicas para o orientando. Com isto, poderão realizar análises individualizadas para cada aluno, baseadas na análise de dados de seu perfil e características, notificando em canais de comunicação. Diante desta perspectiva, o presente trabalho apresenta uma abordagem para orientação acadêmica, apoiada na análise dos dados acadêmicos e socioeconômicos dos alunos utilizando Learning Analytics e Visualização de Dados. O objetivo é proporcionar o acompanhamento da performance do aluno através de informações voltadas para o professor. O trabalho foi dividido nas seguintes etapas: na primeira, foi realizada a aplicação de um questionário on line com os professores da UFRN. Em seguida foi feita uma análise qualitativa das respostas da pesquisa, onde foi possível identificar requisitos para o desenvolvimento da proposta. Depois realizamos a extração, transformação e aplicação dos dados de alunos de alguns cursos da UFRN em ferramentas de análise de dados, gerando visualizações gráficas pensadas para auxiliar o professor nas suas atividades de orientação acadêmica numa futura implementação. Por fim, foi feita uma busca de trabalhos relacionados com o objetivo de identificar as similaridades e diferenças à pesquisa, ajudando na caracterização e domínio do problema de pesquisa.

Palavras-chave: Orientação Acadêmica, Acompanhamento discente, Análise de Dados, Learning Analytics, UFRN.

(7)

ABSTRACT

Academic guidance is a regimental activity to be performed by the professor in higher education institutions. Through this activity, the professor can guide, accompany and advise the student in his academic life and in the paths to be taken during the course and in internship, research and extension activities. The Integrated System for the Management of Academic Activities (SIGAA), developed by the Federal University of Rio Grande do Norte (UFRN), which computerizes the procedures of the academic area and allows the supervisor to view some information of the student, such as school transcripts, exchange of messages and authorize enrollment in disciplines requested by him. However, there is no display of student grades and absences over time. Nor does it present information in a simplified form of the student's performance during the discipline, which can provide observation, possible interventions and continuous counseling. However, the counseling becomes more effective in the role of advisor if he has technological resources that provide him with better conditions for monitoring and making academic decisions for him. With this, they will be able to carry out individualized analyzes for each student, based on the analysis of data of their profile and characteristics, notifying in communication channels. Given this perspective, the present work presents an approach for academic guidance, supported by the analysis of the academic and socioeconomic data of students using Learning Analytics and Data Visualization. The goal is to provide monitoring of student performance through information geared to the professor. The work was divided into the following steps: in the first, an online questionnaire was applied with UFRN professors. Then, a qualitative analysis of the research responses was made, where it was possible to identify requirements for the development of the proposal. Then we performed the extraction, transformation and application of student data from some UFRN courses in data analysis tools, generating graphical visualizations designed to assist the professor in his academic guidance activities in a future implementation. Finally, a search was made for works related to the purpose of identifying similarities and differences to research, helping to characterize and master the research problem.

Keywords: Academic Orientation, Student’s follow-up, Data Analysis, Learning Analytics, UFRN.

(8)

LISTA DE FIGURAS

Figura 1 - Interface inicial do módulo de orientação acadêmica do SIGAA ... 17

Figura 2 - Interface das orientações dadas pelo docente ao seu orientando ... 17

Figura 3 - Relatório de integralização de currículo de um orientando ... 18

Figura 4 - Modelo de referência de quatro dimensões ... 22

Figura 5 - Modelo de referência de seis dimensões ... 24

Figura 6 - Processo conceitual de LA ... 26

Figura 7 - Processo conceitual de Learning Analytics ... 27

Figura 8 - Processo pedagógico com Learning Analytics ... 28

Figura 9 - Processo intrapessoal de análise ... 29

Figura 10 - Processo técnico de Learning Analytics ... 30

Figura 11 - Técnicas de EDM ... 32

Figura 12 - Exemplo da estrutura de um algoritmo supervisionado ... 39

Figura 13 - Hierarquia das técnicas de Machine Learning... 40

Figura 14 - Equação do método Elbow ... 41

Figura 15 - Trecho de código para gerar o gráfico do método Elbow ... 41

Figura 16 - Gráfico do método Elbow ... 42

Figura 17 - Exemplo de um gráfico a partir de clusters gerado pelo K-Means ... 42

Figura 18 - Teorema de Thomas Bayes ... 43

Figura 19 - Modelo de Referência de Visualização de Dados ... 46

Figura 20 - Tela do Portal de Dados Abertos da UFRN ... 48

Figura 21 - Tela do Jupyter Notebook ... 53

Figura 22 - Arquitetura do processo das análises de apoio à Orientação Acadêmica ... 57

Figura 23 - Diagrama Entidade-Relacionamento entre os datasets alvos das análises ... 58

Figura 24 - Processo para geração das análises propostas para a orientação acadêmica ... 62

Figura 25 - Gráfico de Desempenho Geral do aluno durante o período cursado ... 63

Figura 26 - Gráfico de Desempenho dos alunos nas Turmas matriculadas ... 64

Figura 27 - Gráfico de Desempenho de um aluno comparado com a mediana das notas das turmas ... 65

Figura 28 - Método Elbow para definir o número de clusters ... 66

Figura 29 - Gráfico Resultado do Agrupamento do algoritmo K-Means ... 67

(9)

Figura 31 - Tela do Orange (mostra o objeto Boxplot) permite visualizar os valores mínimo

máximo, média e desvio padrão, mediana e os quartis referente a primeira nota da disciplina ... 68

Figura 32 - Matriz de confusão do modelo gerada pelo Orange Desktop... 69

Figura 33 - Tela do Orange mostrando gráfico de dispersão dos dados das notas dos alunos .... 70

Figura 34 - Tela do Orange Desktop mostrando nomograma com percentual de probabilidade de aprovação diante as notas dos alunos ... 70

Figura 35 - Figura proposta com alerta referente à situação do aluno fora da situação de RODA ... 71

Figura 36 - Figura proposta com alerta referente à situação do aluno em risco de entrar em RODA ... 72

Figura 37 - Figura proposta com alerta referente à situação do aluno em RODA ... 72

Figura 38 - Gráfico quantitativo de orientações realizadas ... 73

Figura 39 - Tela de aplicativo de celular mostrando mensagem referente a orientação acadêmica ... 74

Figura 40 - Bolsa de apoio técnico e Vínculos com Projeto de Iniciação Científica na UFRN ... 75

Figura 41 - Bolsas de Auxílio concedidas pela UFRN para o orientando (Quantidade de meses com o benefício) ... 76

Figura 42 - Informações Socioeconômicas, de Assistência Saúde e NEE ... 77

Figura 43 - Nível de formação do docente ... 99

Figura 44 - Lotação do docente na UFRN... 99

Figura 45 - Formação acadêmica do docente da UFRN ... 100

Figura 46 - Ingresso de docentes na UFRN... 100

Figura 47 - Os recursos disponíveis no SIGAA atendem para a realização da Orientação Acadêmica ... 102

Figura 48 - Como você considera a preparação do Docente para a Orientação Acadêmica na UFRN ... 102

Figura 49 - Gráfico associado relacionado às perguntas referentes à satisfação dos docentes frente aos recursos do SIGAA (resposta “sim”) e ao momento de utilização do sistema para orientação acadêmica ... 104

Figura 50 - Gráfico associado relacionado às perguntas referentes à satisfação dos docentes frente aos recursos do SIGAA (resposta “não”) e ao momento de utilização do sistema para orientação acadêmica ... 105

(10)

LISTA DE QUADROS

Quadro 1 - Quadro comparativo entre os trabalhos relacionados a pesquisa... 82 Quadro 2 - Quantitativo de respondentes da pesquisa correspondente aos meios de comunicação com os orientandos ... 101 Quadro 3 - Quantitativo de respondentes da pesquisa sobre a questão relacionada ao momento de utilização do SIGAA para a Orientação Acadêmica ... 103 Quadro 4 - Tabela com uma seleção de respostas relacionadas à pergunta sobre a necessidade da Orientação Acadêmica ... 106 Quadro 5 - Comentários enquadrados nas categorias conceituais ... 109 Quadro 6 - Categorias nocionais após a codificação axial ... 110

(11)

LISTA DE ABREVIATURAS E SIGLAS SIGAA - Sistema Integrado de Gestão e Atividades Acadêmicas UFRN - Universidade Federal do Rio Grande do Norte

SoLAR - Sociedade de Pesquisa em Learning Analytics LAK – Learning Analytics & Knowledge

LASI - Learning Analytics Summer Institute NEE - Necessidades Educacionais Especiais SINFO - Superintendência de Informática LA - Learning Analytics

API - Application Programming Interface

CONSEPE - Conselho de Ensino, Pesquisa e Extensão NDE – Núcleo Docente Estruturante

CAENE - Comissão Permanente de Apoio ao Estudante com Necessidades Educacionais Especiais AVA – Ambiente Virtual de Aprendizagem

LMS - Learning Management System PLE - Personal Learning Edition EDM – Educational Data Minning ML - Machine Learning

LAI - Lei de Acesso à Informação CSV - Comma-separated values SSE - Sum of squared error

PPgITE - Programa de Pós-graduação em Inovação em Tecnologias Educacionais GT - Grounded Theory

IDE - Integrated Development Environment AGECOM - Agência de Comunicação da UFRN ECT - Escola de Ciências e Tecnologia

CCHLA - Centro de Ciências Humanas, Letras e Artes CCS - Centro de Ciências da Saúde

CCET - Centro de Ciências Exatas e da Terra CT - Centro de Tecnologia

RODA - Regime de Observação de Desempenho Acadêmico TCC - Trabalho de Conclusão de Curso

UFPI - Universidade Federal do Piauí API - Application Programming Interface

(12)

SUMÁRIO 1 INTRODUÇÃO ... 14 1.1 Problemática ... 15 1.2 Objetivos ... 19 1.3 Justificativa ... 19 1.4 Estrutura do Trabalho ... 20 2 FUNDAMENTAÇÃO TEÓRICA ... 21 2.1 Learning Analytics ... 21 2.1.1 Modelos de Referência ... 22

2.1.2 Processos de Learning Analytics ... 25

2.1.2.1 Processo Conceitual ... 25

2.1.2.2 Processo Pedagógico ... 28

2.1.2.3 Processo Intrapessoal ... 29

2.1.2.4 Processo Técnico ... 30

2.1.3. Técnicas de Learning Analytics ... 31

2.1.3.1 Estatística ... 31

2.1.3.2 Education Data Minning (EDM) ... 32

2.1.3.3 Análise das Redes Sociais ... 34

2.1.3.4 Visualização da Informação ... 34

2.1.3.5 Mineração de Texto, Processamento de Linguagem Natural e Análise do Discurso ... 36

2.1.4 Machine Learning ... 38

2.1.4.1 Algoritmo de Clustering K-Means ... 41

2.1.4.2 Algoritmo Naive Bayes ... 43

2.2 Visualização de Dados... 44

2.2.1 Contextualização Histórica ... 44

2.2.2 Modelo de Referência ... 45

2.2.3 Aplicação das Técnicas de Visualização de Dados ... 46

2.3 Dados Abertos ... 47 2.4 Discussão ... 49 3 METODOLOGIA ... 50 3.1 Atores ... 51 3.2 Objetivo ... 52 3.3 Dados ... 52

(13)

3.4 Instrumentos utilizados ... 52

3.4.1 Estudos e análises preliminares dos dados ... 54

3.4.2 Técnicas de Análise de Dados ... 54

3.5 Limitações Externas ... 55

3.6 Limitações Internas... 55

3.7 Considerações finais do capítulo ... 56

4 ABORDAGEM PROPOSTA ... 57

4.1 Extração de Dados ... 57

4.2 Pré-processamento de dados ... 59

4.3 Eliminação Manual de Atributos ... 59

4.4 Integração de Dados ... 59

4.5 Amostragem de Dados ... 59

4.6 Balanceamento de Dados... 60

4.7 Limpeza de Dados ... 60

4.8 Transformação de Dados ... 60

4.9 Análise e Interpretação do Resultado ... 61

4.10 Desempenho e Acompanhamento do Aluno ... 62

4.10.1 Medição Comparada de Desempenho do aluno ... 62

4.10.2 Aplicando o Algoritmo de Agrupamento K-Means ... 65

4.10.3 Aplicando o Algoritmo Naive Bayes ... 67

4.10.4 Acompanhamento do Aluno em Regime de Observação do Desempenho Acadêmico – RODA ... 71

4.11 Comunicação Orientador-Orientando ... 73

4.12 Informações Extracurriculares do Aluno ... 74

4.13 Informações Pessoais do Aluno ... 76

4.14 Considerações finais do capítulo ... 77

5 TRABALHOS RELACIONADOS ... 78

5.1 Busca dos trabalhos ... 78

5.2 Trabalho de GUTIÉRREZ et al. (2018) ... 79

5.3 Trabalho de SCHUMACHER e IFENTHALER (2017) ... 80

5.4 Trabalho de SILVA et al. (2017)... 80

5.5 Trabalho de FIDALGO-BLANCO et al. (2015) ... 81

5.6 Trabalho de CHARLEER et al. (2014) ... 81

(14)

5.8 Semelhanças e diferenças ... 82

5.9 Considerações finais do capítulo ... 83

6 CONSIDERAÇÕES FINAIS ... 84

REFERÊNCIAS ... 87

Apêndice A - TERMO DE COMPROMISSO ... 93

Apêndice B - TERMO DE COMPROMISSO, SIGILO E CONFIDENCIALIDADE .... 94

Apêndice C – ORIENTAÇÃO ACADÊMICA ... 96

Apêndice D - PESQUISA SOBRE ORIENTAÇÃO ACADÊMICA NA UFRN ... 98

Apêndice E - Pesquisa aplicada para Docentes e Coordenadores da UFRN - Universidade Federal do Rio Grande do Norte ... 113

(15)

14 1 INTRODUÇÃO

As universidades são instituições especializadas que realizam múltiplas atividades, sendo assim consideradas uma organização complexa. Segundo LEITÃO (1985), cada uma dessas atividades, relacionada com ensino, pesquisa e extensão, têm uma metodologia de trabalho singular, gerando assim uma estrutura organizacional mais complexa.

Além da tríade de atuação, algumas instituições de ensino superior tentam adotar ações de apoio aos alunos, como por exemplo a orientação acadêmica. Na UFRN, a orientação é apoiada pelo SIGAA, Sistema Integrado de Gestão e Atividades Acadêmicas, que gera dados acadêmicos que constitui informações que possibilitam a análise desses dados em prol do acompanhamento discente. A orientação acadêmica é uma das atividades dos docentes que tem como objetivo contribuir para a integração dos estudantes à vida universitária, orientando-os às atividades acadêmicas (UFRN, 2014) através da resolução 110/1975 da Universidade Federal do Rio Grande do Norte.

Outra área de estudo deste trabalho, Learning Analytics (LA), apresenta definições diferentes. Todas convergem para o processo de conversão de dados educacionais em informações permitindo a tomada de ações para apoiar a melhoria no processo de aprendizagem (CHATTI et al ., 2012).

SIEMENS e GASEVIC (2012) descrevem que LA vêm da integração da computação, estatística e educação. Definem como sendo a medição, coleta, análise de relatórios de dados sobre os alunos e seus contextos, com o objetivo de compreender e otimizar a aprendizagem e ambientes em que ocorre. A tecnologia à disposição na tentativa da melhoria dos processos de ensino e aprendizagem impulsionou o desenvolvimento desta área e contou com uma comunidade de pesquisadores, Sociedade de Pesquisa em Learning Analytics (SoLAR ), que vem produzindo trabalhos neste contexto (DAWSON et al., 2014).

Complementando, o autor ECKERSON (2006) ressalta que análise de aprendizado busca tirar proveito da capacidade de modelagem da análise em: prever o comportamento, agir de acordo com as previsões e depois alimentar esses resultados de volta ao processo, a fim de melhorar as previsões ao longo do tempo, no que se refere às práticas de ensino e aprendizagem.

(16)

15 Originalmente a abordagem de Learning Analytics se deu em ambientes virtuais de aprendizagem visando avaliar os dados gerados a partir da execução de cursos, como participação nos fóruns, frequência e notas para identificar situações como o andamento da aprendizagem e comportamento dos alunos com o intuito de melhorar o ensino (SANTOS et al ., 2014). No caso desta pesquisa, as definições e técnicas de LA são utilizadas para apoiar o ensino presencial.

No contexto deste trabalho também é abordado o conceito de visualização de dados, sendo a combinação de aspectos da computação gráfica, interfaces homem-computador e mineração de dados. A visualização de informações permite a apresentação de dados em formas gráficas de modo que o usuário possa utilizar sua percepção visual para melhor analisar e compreender as informações (GERSHON e EICK, 1997).

De acordo com COLPAERT et al . (2013), nos dias atuais a disponibilização de dados se tornou um processo rotineiro facilitada tanto pela democratização da Internet, derivando serviços como e-mail, fóruns de discussão, redes sociais e mais recentemente a abertura de dados governamentais e educacionais conhecidos como Dados Abertos. Em repositórios de dados educacionais abertos é possível estabelecer relações entre os agrupamentos de dados gerando informações que sendo visualizadas, podem revelar algo implícito, influenciando assim na tomada de decisões do docente, por exemplo, no processo de orientação acadêmica, além de impactar na melhoria da trilha acadêmica percorrida pelo aluno na universidade.

Diante desta perspectiva, é apresentado nesta pesquisa uma nova abordagem, podendo ser implementada futuramente, que, mediante a análise estatística e visualização de dados educacionais e socioeconômicos dos alunos, proporcionará ao professor da UFRN compreender o contexto personalizado dos seus orientandos acadêmicos.

1.1 Problemática

O SIGAA é um sistema integrado de atividades acadêmicas, parte integrante dos sistemas de gestão da UFRN, que foi desenvolvido pela UFRN e implantado desde dezembro de 2006. Ele vem sendo distribuído para diversas universidades no país através de cooperação

(17)

16 técnica regulamentada por meio do Decreto Presidencial nº 6.619/2008. A cooperação é um 1 instrumento que permite a transferência de crédito entre órgãos da administração pública federal direta, autarquias, fundações públicas e/ou entidades federais da mesma natureza. O SIGAA é modularizado e possui a funcionalidade para auxiliar o corpo docente da universidade na sua atribuição no processo de orientação acadêmica junto aos estudantes no período de matrícula em componentes curriculares.

Para uma instituição de ensino superior que possua um sistema que proporciona não só o controle das atividades acadêmicas, assim como a orientação dos alunos é uma quebra de paradigma no que se refere às práticas presenciais, pois como aponta CUNHA (2006), “o docente ensina a partir de sua experiência como aluno, inspirado em seus antigos docentes”.

No SIGAA, para acessar a funcionalidade de orientação acadêmica, o professor deve efetuar o acesso através de seu usuário e senha dos sistemas da universidade e em seguida clicar no menu suspenso “ensino” e novamente em “gerenciar orientações acadêmicas”. Então ele terá acesso às orientações realizadas aos alunos vinculados.

A seguir, veremos telas da interface do SIGAA mostrando alguns relatórios e funções disponíveis ao docente. A Figura 1 apresenta uma visão geral dos discentes orientandos acadêmicos de um determinado orientador. As informações dos discentes que são visíveis são o status “ativo” ou “inativo”; o seu nome completo; endereço de e-mail; início da orientação; se está em regime de observação. São disponibilizados botões que são associados às ações de enviar uma mensagem ao aluno; ver seu histórico escolar; orientações dadas e relatório de integralização de currículo. Há também a visualização das últimas mensagens enviadas.

1 O projeto detalhado de cooperação técnica dos sistemas de gestão da UFRN acessado pelo endereço eletrônico portalcooperacao.info.ufrn.br.

(18)

17 Figura 1 - Interface inicial do módulo de orientação acadêmica do SIGAA

Fonte: SINFO (2018)

A Figura 2 ilustra informações mais detalhadas do aluno, a troca de mensagens do orientador com o orientando e os motivos de trancamento solicitados pelo orientando.

Figura 2 - Interface das orientações dadas pelo docente ao seu orientando

(19)

18 A Figura 3 ilustra a visão da integralização de currículo do orientando acadêmico, mostrando as disciplinas cursadas e não cursadas listadas a cada período do curso.

Figura 3 - Relatório de integralização de currículo de um orientando

Fonte: SINFO (2018)

Através destas telas é possível notar a predominância das informações textuais nas telas do sistema com informações sucintas do histórico, das intenções de matrícula em componentes e o envio de mensagens unilaterais por parte do orientador. Assim percebe-se que estas telas não proporcionam um ambiente de diálogo e;ou que possa expressar emoções e intenções na escolha das disciplinas relacionadas a sua trajetória na universidade.

Um ponto importante é a falta de informação de desempenho dos alunos para o acompanhamento do orientador durante o andamento das disciplinas. No SIGAA não é possível ter essa informação em tempo real, seja gerando notificações ao orientador via mensagens de e-mail ou alertas visuais no módulo, fazendo com que a tarefa de orientação seja pontual a cada escolha de componente curricular a ser cursado no período de matrículas.

Exploramos algumas dificuldades e limitações que o professor enfrenta em realizar a orientação acadêmica usando as características atuais oferecidas pela ferramenta SIGAA. Procuramos neste trabalho apresentar uma abordagem que venha a mitigar tal problemática trazida nesta subseção.

(20)

19 1.2 Objetivos

O objetivo geral deste trabalho é apresentar uma abordagem para orientação acadêmica, apoiada na análise dos dados gerados pelo SIGAA utilizando Learning Analytics e Visualização de Dados, no intuito de proporcionar o acompanhamento da performance do aluno através de informações voltadas para o orientador.

A partir do objetivo geral atingimos temos os seguintes objetivos específicos:

- Realização de uma pesquisa online como público alvo os professores da UFRN, com quem levantamos requisitos importantes para a abordagem proposta;

- Avaliação do grau de relevância que o acompanhamento poderá produzir na orientação acadêmica;

- Propositura de uma nova abordagem na apresentação dos dados gerados através do SIGAA, ampliando a visão do professor observando a performance do aluno, apoiando a sua orientação e melhoria na comunicação;

- Criar subsídios para uma futura implementação dos recursos trazidos pela abordagem, tal como possibilitar com que o professor mostre ao seu orientando antes do ato da matrícula em uma determinada disciplina, sabendo da sua probabilidade de aprovação ou reprovação, de acordo com sua nota na unidade inicial, baseando-se no desempenho de turmas anteriores.

1.3 Justificativa

O uso da Learning Analytics para se ter o entendimento do que ocorre no processo de ensino-aprendizagem pode gerar diversas oportunidades, as quais incidem no auxílio na inovação ou até mesmo transformar o sistema de uma universidade, bem como seus modelos acadêmicos e abordagens pedagógicas (SIEMENS e LONG, 2011).

As verificações das mensagens postadas em fóruns de discussão, número de exercícios concluídos, notas de provas, entre outras, são analisados permitindo assim com que os

(21)

20 educadores possam identificar os alunos que estão em risco de reprovação (MACFADYE e DAWSON, 2010).

Num sistema de informações acadêmicas os dados gerados apresentam uma certa complexidade, bem como o grande volume de informações a serem analisadas, pode tornar a análise destes dados uma atividade desafiadora, longa e complexa. Segundo FREITAS (2011), uma abordagem para contornar as dificuldades de analisar grandes blocos de informações é utilizar técnicas de Visualização de Dados.

Assim, é necessário também difundir os benefícios de estudo da aplicação de Learning Analytics, Visualização de Dados, dentre as metodologias que podem auxiliar e contribuir no desenvolvimento e melhoria da performance do aluno.

1.4 Estrutura do Trabalho

Este documento está organizado da seguinte forma:

- No capítulo 2, a fundamentação teórica da pesquisa será apresentada envolvendo as definições de Learning Analytics , Visualização de Dados, como também o Portal de Dados Abertos;

- No capítulo 3 é apresentada a metodologia;

- No capítulo 4 são mostrados os procedimentos de extração, análise e como os dados serão apresentados; e também as análises e interpretação do resultado;

- No capítulo 5 são apresentados os trabalhos relacionados à pesquisa;

- No capítulo 6 são feitas as considerações finais da pesquisa, destacando as contribuições do estudo.

(22)

21 2 FUNDAMENTAÇÃO TEÓRICA

Neste capítulo são discutidos os principais temas de interesse deste trabalho, que são: Learning Analytics , Visualização de Dados e Dados Abertos.

2.1 Learning Analytics

Learning Analytics (LA) visam a análise dos dados de alunos para um melhor entendimento do processo de ensino-aprendizagem e tem o objetivo de melhorá-lo o processo e o ambiente onde ocorre (SIEMENS, 2010).

Reforçando este conceito, LESTER (2017) cita em seu livro que a SoLAR é uma rede interdisciplinar de pesquisadores internacionais líderes que estão explorando o papel e o impacto da análise no ensino, aprendizagem, treinamento e desenvolvimento. A autora organiza a Conferência Internacional sobre Aprendizagem de Análise e Conhecimento (LAK) e do Learning Analytics Summer Institute (LASI), lançando várias iniciativas para apoiar pesquisas colaborativas e abertas sobre análise de aprendizagem, promovendo a publicação e disseminação de análises de aprendizagem. pesquisa, consultoria e consultoria com governos estaduais, provinciais e nacionais.

Importância do surgimento desta nova área foi dada por ELIAS (2011), quando trouxe em seu pensamento a idéia que o desenvolvimento da área de Learning Analytics se mostra oportuna, sendo fator que agrega à disponibilização de dados pelas instituições de ensino e na forma como tais dados podem ser utilizados para melhorar o processo de ensino e aprendizagem, permitindo o desenvolvimento da área.

Na seção 2.2.1 serão abordados os modelos de referência, de acordo com autores da área, na seção 2.2.2 veremos os processos de LA. Na seção 2.2.3 abordaremos as técnicas comumente utilizadas em trabalhos. Finalmente, a seção 2.2.4 apresentaremos as considerações finais deste capítulo.

(23)

22 2.1.1 Modelos de Referência

Na literatura consultada foram encontrados dois modelos de referência, o primeiro de CHATTI et al. (2012). Nele há quatro dimensões: (i) O que? ; (ii) Por quê? ; (iii) Quem? e (iv) Como? , conforme ilustrado na Figura 4.

Figura 4 - Modelo de referência de quatro dimensões

Fonte: Adaptado de CHATTI et al . (2012)

A primeira dimensão: O quê? faz referência aos tipos de dados que são coletados. Eles podem ser provenientes do ambiente de aprendizagem, de redes sociais como o Facebook e o Twitter ou de fontes institucionais.

A segunda dimensão: Quem? faz referência a quem os resultados da análise serão direcionados, podendo ser a alunos, docentes, instituições educacionais (administradores), pesquisadores e projetistas de sistemas. Cada um tem suas próprias perspectivas, objetivos e expectativas relativas aos resultados.

A terceira dimensão: Por quê? relaciona-se aos resultados e objetivos da análise dos dados realizada pelo sistema. Estes objetivos são:

- Monitoramento e Análise: tem como objetivo monitorar as ações do aluno e gerar relatórios com os resultados para realizar análises;

(24)

23 - Predição e Intervenção: desenvolver um modelo que tente prever o desempenho do aluno no futuro com base em suas ações e realizações atuais, fornecendo indicativos de alunos que precisam de atenção especial para então realizar intervenções;

- Tutoria/Mentoria: ajudar o aluno em módulos específicos do curso (tutoria) ou durante todo o curso (mentoria);

- Avaliação e Feedback: procura auxiliar na avaliação da aprendizagem para fornecer o feedback adequado;

- Adaptação: busca dizer ao aluno o que fazer através da reorganização dos recursos de aprendizagem e das atividades de acordo com as suas necessidades;

- Personalização e Recomendação: busca permitir que o aluno defina como vai aprender (personalização), mas fornecendo mecanismos (recomendação) para auxiliá-lo nesta busca de modo a evitar a sobrecarga de informações;

- Reflexão: permite que as informações sejam comparadas entre alunos, turmas e cursos permitindo a verificação da eficácia das práticas de ensino e/ou aprendizagem.

Por último, a dimensão: Como? que refere-se às diversas técnicas que podem ser empregadas para detectar padrões contidos nos dados e atingir os objetivos contidos na dimensão Por quê?. Segundo CHATTI et al. (2012), alguns exemplos destes meios são Estatísticas, Visualização da Informação, Mineração de Dados e Análise das Redes Sociais.

O modelo de referência proposto por GRELLER e DRACHSLER (2012) é composto por seis dimensões, que conforme a ilustração da Figura 5, são: (i) Atores ; (ii) Objetivos ; (iii) Dados ; (iv) Instrumentos ; (v) Restrições Externas ; e (vi) Limitações Internas . A dimensão Atores inclui os usuários, aqueles que verão os resultados e deverão tomar decisões baseadas nos resultados e os objetos que serão monitorados e terão o seu comportamento analisado. Em alguns casos, os usuários e os objetos podem ser a mesma pessoa. Por exemplo, em uma ferramenta que permite que o aluno analise suas interações com o ambiente.

De acordo com GRELLER e DRACHSLER (2012), os atores principais são os alunos, docentes e a instituição de ensino, mas esta dimensão pode ser estendida para incluir, por exemplo, pesquisadores, provedores de serviço ou agências governamentais.

(25)

24 Figura 5 - Modelo de referência de seis dimensões

Fonte: Tradução de GRELLER e DRACHSLER (2012)

A dimensão Objetivos é dividida em duas : reflexão e predição . A partir da reflexão, um usuário obtém o auto-conhecimento. A reflexão permite, por exemplo, que o aluno entenda seus pontos fortes e fracos ou que o docente reflita sobre sua prática pedagógica e entenda quais ações trazem melhores resultados. A predição permite que o desempenho final do aluno ou a sua desistência sejam identificados com antecedência, podendo acarretar em intervenções, que são as ações realizadas por um ator para impactar no processo de ensino-aprendizagem e corrigir o problema.

A dimensão Dados refere-se aos dados que serão utilizados, visto que as LA podem aproveitar-se de dados provenientes de diferentes fontes, exemplificamos os AVAs, redes sociais como Facebook e Twitter e sistemas acadêmicos. Além disso definir se os dados educacionais são abertos, de livre acesso ou protegidos, de acesso restrito não é uma tarefa trivial, visto que esta questão envolve a instituição, os funcionários, os alunos e, em alguns casos, os pais dos alunos.

A dimensão Instrumentos refere-se às tecnologias que podem ser aplicadas no desenvolvimento dos serviços e aplicações educacionais. Estes instrumentos incluem técnicas,

(26)

25 métodos e algoritmos computacionais, por exemplo: aprendizagem de máquina e estatísticas; teorias educacionais; entre outros.

A dimensão Restrições Externas engloba as diferentes restrições que podem limitar os benefícios do processo de LA. Estas restrições podem ser convenções (questões éticas, sociais e de privacidade) e normas (leis, políticas de organizações e padrões).

Enfim a dimensão, Limitações Internas , complementa a dimensão Restrições Externas . Dentre as limitações internas encontram-se a competência e a aceitação. A competência refere-se às habilidades necessárias para desfrutar dos benefícios de LA, compreender as informações expostas. A aceitação influencia em como a ferramenta é aplicada/utilizada e nas decisões tomadas em relação ao processo de ensino-aprendizagem, se o usuário aceita a ferramenta ele vai utilizá-la, caso contrário, a ferramenta será rejeitada pelo usuário e não impactará no processo de ensino-aprendizagem.

2.1.2 Processos de Learning Analytics

Apresentamos nesta seção seis processos relacionados a LA. e são divididos em em quatro categorias: processo conceitual, processo pedagógico, processo intrapessoal e processo técnico.

2.1.2.1 Processo conceitual

O conceito do processo de LA. foi descrito por CLOW (2012) e CHATTI et al . (2012). Para CLOW (2012), o processo consiste em um ciclo de quatro etapas: (i) Alunos; (ii) Dados; (iii) Análise; e (iv) Intervenções. Conforme ilustração da Figura 6, o primeiro passo são os alunos que necessitam de recursos de aprendizagem. A captura dos dados sobre estes alunos ou a geração por parte deles é o segundo passo.

(27)

26 Figura 6 - Processo conceitual de LA

Fonte: Tradução de CLOW (2012)

O terceiro passo é a análise destes dados de forma a convertê-los em informações úteis como visualizações, listas de alunos em risco de reprovação. De acordo com CLOW (2012), esta é a etapa principal de vários projetos de LA e possibilitou muitas inovações e novos métodos como modelagem preditiva, sistemas de recomendação.

Os resultados obtidos devem ser usados para guiar intervenções de forma a impactar no processo de ensino-aprendizagem. Por exemplo, um tutor pode entrar em contato com um aluno em alto risco de desistir do curso, um docente pode analisar os dados de uma turma, informando-se sobre como ministrar as aulas com a próxima turma.

CLOW (2012) aponta que um projeto de LA não precisa necessariamente incluir as quatro etapas, mas que um projeto que cria relatórios sobre os alunos e não oferece nenhum mecanismo para modificar o processo de ensino-aprendizagem é um projeto não muito efetivo, uma vez que são as intervenções que geram impactos sobre o processo de ensino-aprendizagem.

O processo conceitual descrito por CHATTI et al . (2012), ilustrado na Figura 7, também é cíclico, possuindo três etapas: (i) Coleta e pré-processamento ; (ii) Análise e ação ; e (iii) Pós-processamento .

Na primeira etapa, Coleta e pós-processamento , os dados são coletados de diferentes ambientes educacionais e sistemas. Para CHATTI et al . (2012), esta etapa é crítica para a

(28)

27 descoberta de padrões no dados, pois o conjunto de dados pode ser muito grande e/ou envolver atributos irrelevantes, tornando necessário o pré-processamento deste conjunto. Este pré-processamento permite transformar os dados brutos em um formato que pode ser utilizado como entrada para algum método. Várias tarefas de processamento podem ser emprestadas da área de Mineração de Dados, tais como limpeza (detectar e corrigir, ou remover registros com erros ou incompletos), integração (unificar dados de diferentes fontes de dados) e transformação (converter um dado em outro, como data de nascimento em idade).

Figura 7 - Processo conceitual de Learning Analytics

Fonte: Tradução de CHATTI et al . (2012)

Na segunda etapa, Análise e ação , as técnicas de análise como clusterização, classificação, estatísticas são aplicadas para explorar os dados e descobrir padrões. Esta etapa também inclui as ações que devem ser realizadas como, por exemplo, monitorar, analisar, predizer, intervir, avaliar, adaptar, personalizar, recomendar e refletir. Estas ações estão relacionadas com a dimensão Por quê? do modelo de referência.

A última etapa, o Pós-processamento , envolve compilar novos dados de fontes adicionais, refinar o conjunto de dados analisado, determinar novos atributos necessários, identificar novos indicadores, modificar as variáveis da análise ou escolher novos métodos.

Ambos os processos descritos nesta seção são cíclicos e abordam os mesmos elementos como dados, análise, intervenções, porém de formas diferentes. Ambos os processos iniciam com a coleta de dados, seguem com a análise dos dados e ações subsequentes. Entretanto, no ciclo do CLOW (2012) as intervenções possuem uma etapa

(29)

28 própria (destacando a sua importância), enquanto no ciclo de CHATTI et al . (2012) as intervenções podem ou não ocorrer (juntamente com outras ações) e estão na mesma etapa que as análises. Além disso, o ciclo de CHATTI et al . (2012) possui uma etapa para aperfeiçoar as análises realizadas que não consta no ciclo de CLOW (2012).

2.1.2.2 Processo Pedagógico

GRELLER e DRACHSLER (2012) descreveram um processo pedagógico envolvendo as dimensões de LA. Este processo que está ilustrado na Figura 8 possui três etapas: (i) Comportamento Pedagógico , (ii) Learning Analytics e (iii) Consequências Pedagógicas . De acordo com GRELLER e DRACHSLER (2012), este processo dá suporte a diversas estratégias pedagógicas e atividades com o suporte de LA. Estas estratégias são vistas por meio dos dados que descrevem o comportamento dos alunos, que dependem do AVA utilizado e da visão sobre a qual este foi construído como os dados de uma plataforma de compartilhamento de conteúdo possuem uma visão pedagógica behaviorista/cognitivista associada ao comportamento do aluno.

O Comportamento Pedagógico refere-se ao comportamento do usuário motivado pelo design instrucional. Já as Consequências Pedagógicas são os ajustes realizados na estratégia utilizada ou no design instrucional com base nos resultados das LA.

Figura 8 - Processo pedagógico com Learning Analytics

(30)

29 O processo proposto por GRELLER e DRACHSLER (2012) consiste na análise dos dados que representam o comportamento pedagógico dos alunos. Estas análises são realizadas através das LA. Os resultados da análise destes dados resultam em consequências pedagógicas. Ou seja, o comportamento dos alunos, que reflete o design instrucional, é analisado pela ferramenta de LA e os resultados obtidos direcionam mudanças nesta estratégia. É importante a realização periódica deste processo, pois o mesmo é cíclico.

2.1.2.3 Processo Intrapessoal

VERBERT et al . (2013) descreveu um processo que refere-se, de modo geral, ao processo intrapessoal de análise de dados e pode ser aplicado a ferramentas de LA. Este processo, ilustrado na Figura 9, possui quatro estágios: (i) Percepção ; (ii) Reflexão ; (iii) Compreensão ; e (iv) Impacto .

O estágio da Percepção preocupa-se apenas com os dados, que podem ser visualizados como fluxos, tabelas, etc. No estágio de Reflexão , o foco está no questionamento do usuário. No estágio da Compreensão , o usuário responde às perguntas realizadas no estágio anterior e formula novas ideias. No estágio do Impacto , o objetivo é induzir um novo significado ou uma mudança comportamental.

Figura 9 - Processo intrapessoal de análise

(31)

30 No processo, inicialmente, o usuário está preocupado em saber quais são os dados disponíveis, para em seguida questionar o objeto de estudo e obter as respostas desejadas com base nos dados expostos. Com base nos questionamentos realizados e respostas obtidas, o usuário pode então realizar mudanças comportamentais consideradas necessárias. Este processo intrapessoal também é um ciclo e, assim, o usuário deve realizar este processo periodicamente para que os resultados sejam melhores.

2.1.2.4 Processo Técnico

Conforme ilustração da Figura 10, DYCKHOFF et al . (2012) descreveram o processo técnico de LA. Ele mostra como ocorre o fluxo de dados/informações e ações tomadas pelos atores em uma ferramenta de LA. O processo inicia com a coleta dos dados (1) das diferentes atividades dos alunos como a participação em exercícios colaborativos e fóruns de discussão em um AVA, LMSs ou PLEs. Em seguida, os dados são pré-processados e armazenados em um banco de dados considerando aspectos de privacidade (2).

Figura 10 - Processo técnico de Learning Analytics

Fonte: Tradução de DYCKHOFF et al . (2012)

A mineração destes dados é realizada através de diferentes técnicas (3). O resultado desta etapa é então exibido (4) como um widget, componente de uma interface gráfica, que pode ser integrado em um AVA ou em um dashboard , tela com representações visuais das

(32)

31 informações mais importantes/necessárias. Com base nas visualizações gráficas apropriadas, o docente deve ser capaz de analisar os dados facilmente e refletir sobre o impacto de sua estratégia de ensino no comportamento de seus alunos, e assim verificar a eficácia da estratégia adotada (5). As suas descobertas devem motivar o docente a realizar as intervenções que julgar necessárias (6).

2.1.3 Técnicas de Learning Analytics

Os autores CHATTI et al . (2012), GRELLER e DRACHSLER (2012), BAKER e INVENTADO (2014), afirmam que a área de LA empresta técnicas das seguintes áreas, tais como a Estatística, EDM, Análise das Redes Sociais, Visualização da Informação, Processamento da Linguagem Natural, Mineração de Texto e Análise do Discurso. Abordaremos estas áreas nas seções a seguir.

2.1.3.1 Estatística

CHATTI et al . (2012), menciona que a maioria dos LMSs implementam ferramentas que geram relatórios fornecendo estatísticas básicas da interação dos alunos com o sistema.

O Tempo de Acesso, Total de Acessos, Total de Acessos a cada Página, Frequência de Publicações e Respostas no Fórum de Discussão e Porcentagem de Materiais Acessados são alguns exemplos destes indicadores (CHATTI et al. , 2012). As técnicas empregadas para criar estes indicadores são operações como média e desvio padrão.

ALI et al . (2012) mostram em seu trabalho que as métricas estatísticas como, por exemplo, o kappa de Cohen e testes estatísticos como o teste de normalidade Kolmogorov-Smirnov , utilizado no trabalho de GASEVIC et al . (2013); o teste não-paramétrico de Mann-Whitney U , utilizado por GASEVIC et al . (2014); e o teste paramétrico T, usado por (NIEMAMNN et al ., 2012).

(33)

32 2.1.3.2 Educational Data Minning (EDM)

As técnicas da área de EDM, conforme BAKER e INVENTADO (2014), podem ser divididas em quatro grupos: (i) Modelos Preditivos ; (ii) Descoberta de Estrutura ; (iii) Mineração de Relações ; e (iv) Descoberta com Modelos . Estes grupos possuem outras subdivisões, conforme ilustrado na Figura 11.

Figura 11 - Técnicas de EDM

Fonte: Traduzido de BAKER e INVENTADO (2014)

Conforme com BAKER e INVENTADO (2014), o objetivo das técnicas desta categoria é desenvolver um modelo que pode inferir algum aspecto dos dados (a variável dependente, similar às variáveis dependentes nas análises estatísticas tradicionais) ou alguma

(34)

33 combinação de outros aspectos dos dados (variáveis preditoras, similares às variáveis independentes das análises estatísticas tradicionais). Estas técnicas são subdivididas em Classificação, Regressão e Latent Knowledge Estimation (não encontradas nos trabalhos de LA) e diferem-se pelos tipos de dados analisados. Na Classificação , as variáveis preditoras podem ser binárias ou categóricas e, dentre os métodos populares, encontram-se árvores de decisão, random forest , regras de decisão, step regression e regressão logística. Na Regressão , a variável preditora é uma variável contínua e seus métodos populares são a regressão linear e as árvores de regressão.

A Descoberta da Estrutura engloba as técnicas de Clusterização , Factor Analysis e Domain Structure Discovery . O objetivo das técnicas de Descoberta da Estrutura é encontrar a estrutura dos dados desconsiderando qualquer ideia do que deve ser encontrado. TAN et al . (2009) descreve as técnicas de Clusterização tem como objetivo agrupar os objetos analisados com base nas informações encontradas nos dados que os descrevem de forma que os objetos contidos em cada grupos sejam semelhantes. Já o objetivo das técnicas de Factor Analysis é encontrar variáveis que possuem características similares, dividindo-as em conjuntos de fatores latentes.

TAN et al . (2009) ainda descrevem a Mineração de Relações engloba técnicas de Mineração de Regras de Associação , Mineração de Padrões Sequenciais, Mineração de Correlações e Causal Data Mining . A Mineração de Relações é útil para descobrir relacionamentos escondidos no conjunto de dados. O objetivo das técnicas de Mineração de Regras de Associação é encontrar regras SE-ENTÃO (IF-THEN) de forma que se algum conjunto de variáveis for encontrado, haverá outra variável com um valor específico, por exemplo, SE o aluno está frustrado ou possui um objetivo de aprendizagem maior que seu desempenho ENTÃO pedirá ajuda frequentemente. Já as técnicas de Mineração de Padrões Sequenciais buscam encontrar associações entre eventos, como sequências de eventos que ocorrem com uma determinada frequência.

Por último, a Descoberta com Modelos é uma técnica de EDM que utiliza modelos previamente desenvolvidos com técnicas descritas anteriormente para analisar um novo conjunto de dados.

(35)

34 2.1.3.3 Análise das Redes Sociais

As redes sociais tornaram-se importantes para dar suporte à aprendizagem e as técnicas de Análise das Redes Sociais podem ser aplicadas para analisar estas redes, permitindo que conexões interessantes sejam percebidas, como por exemplo, subgrupos e o papel e o prestígio de uma pessoa na rede social (LIU, 2011).

CHATTI et al . (2012) descreve que uma rede social é modelada na forma de um grafo onde os nós podem, por exemplo, representar os atores e as arestas a relação entre estes. Uma das características principais das redes sociais é a centralidade, que refere-se à posição estrutural de um nó em um grafo e detalha a importância e a relação deste nó com os demais. De acordo com CHATTI et al . (2012) as três medidas de centralidade utilizadas são grau de centralidade, closeness centrality e betweenness centrality .

OLIVEIRA e GAMA (2012) descrevem que o grau de centralidade representa o número de ligações diretas que um nó possui; a closeness centrality é uma métrica que indica o quão rápido um nó pode comunicar-se com todos os outros, formalmente esta métrica é definida como a média de todos os caminhos de um determinado nó a todos os outros (considerando sempre os caminhos mais curtos de um nó A a um nó B); e a métrica betweenness centrality mede entre quantos grupos distintos um nó se encontra, os nós com maior grau de betweenness centrality ocupam um papel crítico na rede social, visto que permitem que estes funcionem como uma conexão entre grupos distintos.

2.1.3.4 Visualização da Informação

Segundo FREITAS et al. (2011), Visualização da Informação é uma área de aplicação de técnicas de processamento gráfico com o objetivo de auxiliar o processo de análise de um grande conjunto de dados por meio de representações gráficas manipuláveis. Possui dois grupos distintos de técnicas: as técnicas de representação e as técnicas de interação.

De acordo com CARD et al. (1999), as técnicas de representação são os gráficos que, são classificadas em:

(36)

35 - Representações ortogonais: utilizam eixos ortogonais ou algum tipo de marcação, são conhecidas e bastante efetivas para representar dados tabulares com poucas variáveis como histogramas, gráficos de barras, gráficos de setores, gráficos de bolhas, gráficos de área, gráficos de dispersão, gráficos de superfície, mapas geográficos;

- Representações multidimensionais: são utilizadas quando os dados tabulares possuem mais de três variáveis e as visualizações ortogonais são insuficientes (e.g., gráfico de coordenadas paralelas, gráfico de radar);

- Árvores: representam relações hierárquicas como, por exemplo, um diretório de arquivos, uma árvore genealógica e um sumário de um livro (VAZ; CARVALHO, 2004). É possível representar árvores através de nós e arestas; de aninhamentos, onde os elementos filhos são inseridos dentro do elemento pai; através de adjacências, onde os elementos filhos são posicionados próximos ao nós pai (através de uma orientação pré-definida, e.g., de cima para baixo, de dentro para fora); através de identações; e através de matrizes, onde cada linha e coluna preenchida representa a relação entre pais e filhos (as colunas são os pais e as linhas os filhos ou vice-versa), mas dificulta a identificação dos níveis da hierarquia e, por isso, é pouco adotada (GRAHAM; KENNEDY, 2010). - Redes: representam relacionamentos entre elementos, porém estes

relacionamentos não são obrigatoriamente hierárquicos como, por exemplo, a rede de computadores e diagramas entidade-relacionamento utilizado para representar a estrutura de bancos de dados (VAZ; CARVALHO, 2004).

De acordo com YI et al . (2007), estas técnicas podem ser de seleção, permitindo que os usuários selecionem os itens de seu interesse; de exploração, de forma que os usuários possam analisar diferentes subconjuntos; de reconfiguração, permitindo que o usuário modifique a organização dos elementos representados; de codificação, permitindo que o usuário altere a representação dos dados; de abstração/elaboração, possibilitando a troca entre uma visão geral e uma visão mais detalhada; de filtragem, de modo que o usuário pode selecionar os dados que deseja analisar; e de conexão, fazendo com que a relação de um determinado item com os demais seja realçada ou mostrando novos itens.

(37)

36 2.1.3.5 Mineração de Texto, Processamento de Linguagem Natural e Análise do Discurso

GUPTA e LEHAL (2009) descrevem que a Mineração de Texto é a descoberta de informações novas e previamente desconhecidas através da extração automática de dados de diferentes fontes escritas e é subdivida em técnicas como:

- Extração da Informação: idêntica as frases principais e a relação destas dentro do texto, procurando por sequências pré-definidas em um processo chamado de correspondência de padrões;

- Rastreio de Tópicos: funciona a partir dos perfis dos usuários e, com base nos documentos visualizado por estes perfis, infere outros documentos que podem ser do interesse do usuário. Entretanto, esta técnica possui limitações, se o usuário define que quer ser avisado quando arquivos referentes a Mineração de Texto forem adicionados, ele poderá receber diversas notificações referentes à mineração de minerais;

- Sumarização: auxilia a identificar se um documento corresponde às necessidades de um usuário a partir da sumarização do texto contido em um determinado documento realizada no tempo que o usuário levaria para ler o primeiro parágrafo. Uma das estratégias para a Sumarização é a Extração de Sentenças, que extrai as sentenças importantes de um texto através de uma análise estatística;

- Categorização: identifica os principais temas de um documento atribuindo-o a um conjunto pré-definido de tópicos, isto é feito através do número total de ocorrências de cada palavra contida no documento;

- Clusterização: é uma técnica utilizada para agrupar documentos similares com base nos tópicos abordados;

- Relacionamento de Conceitos: identifica os conceitos comumente compartilhados entre os documentos e auxilia os usuários a identificar informações que não teriam sido encontradas através de métodos tradicionais de pesquisa;

(38)

37

- Visualização da Informação: coloca diversas fontes de texto em uma representação hierárquica ou mapa e fornece meios de procurar documentos. A área de Processamento de Linguagem Natural é uma subárea da Inteligência Artificial que busca compreender de modo automático a linguagem natural do ser humano. Para COLLOBERT et al . (2011) Algumas técnicas desta área são Part-Of-Speech Tagging, Chunking, Named Entity Recognition e Semantic Role Labeling . A técnica Part-Of-Speech Tagging visa categorizar cada palavra de acordo com sua função sintática como o advérbio, artigo definido, substantivo. A técnica Chunking , também conhecida como Shallow Parsing , categoriza segmentos de uma sentença de acordo com seus componentes sintáticos (e.g., frases com substantivos ou frases com verbos), sendo que a cada segmento é atribuído apenas uma categoria, que pode ser definido como o primeiro ou não. A técnica de Named Entity Recognition atribui categorias aos elementos atômicos de uma sentença, como Pessoa ou Localização e, da mesma maneira que a técnica de Chunking , cada categoria também recebe uma identificação de localização (primeira ocorrência ou não). Por fim, a técnica de Semantic Role Labeling atribui um papel semântico a cada componente de uma sentença. De acordo com CARRERAS e MÁRQUEZ (2005), a função semântica de uma linguagem é a relação de um componente sintático com o predicado (verbo). Alguns argumentos semânticos comuns são Agente, Paciente e Instrumento; os argumentos adjuntivos são Localização, Temporalidade, Maneira, Causa, etc. Reconhecer e categorizar os argumentos semânticos é uma tarefa chave para responder as perguntas Quem?, Quando?, O quê?, Onde? e Por quê?, dentre outras.

Para CHOULIARAKI (2008) a Análise do Discurso questiona como analisar e compreender a cultura e fornece os textos ao analista cultural como um objeto concreto de investigação. As premissas desta área são baseadas na teoria do discurso de Foucault e na linguagem de jogos de Wittgenstein , que veem a linguagem como um componente do mundo social.

Referências

Documentos relacionados

Utilizando a taxa de homicídios como proxy para a criminalidade, e controlando a dependência espacial nos dados regionalmente agrupados por microrregiões, essa hipótese não

No Brasil, alguns estudos (SCHIEHLL; 1996; PRUX JUNIOR; 1998; BERNARDO; 2001; LOPES, 2001; SARLO NETO et al, 2005; SANTOS; LUSTOSA, 2008; REZENDE et al; 2010), que relacionaram

Primeiro, ainda que o salário mínimo tenha sido importante para o crescimento das transferências (Orair; Gobetti, 2010) e, um pouco menos importante, para o crescimento

of some species may increase when tissue culture techniques are applied (Fay 1992). In vitro germination was successfully conducted for M. coriacea, providing plantlets that

EMENTA: Não existe exigência ética ou legal em nosso estado, que torne obrigatória a apresentação de um atestado médico para que um indivíduo possa ser autorizado

Tese apresentada como requisito parcial para obtenção do título de Doutor pelo Programa de Pós-graduação em Direito da PUC-Rio.. Aprovada pela Comissão Examinadora abaixo

Os resultados obtidos com este estudo mostram que a incorporação da perspetiva CTSA nos manuais escolares estudados não está ainda completamente conseguida, pois nem sempre, quer

A título de exemplo, utilizam-se nesta pesquisa obras como a de Warren Dean (1996) criada com base em análises de relatos de viagens, livros, tratados de