• Nenhum resultado encontrado

Enriquecimento do modelo e cálculos analíticos

No documento Plataforma de Indicadores Académicos (páginas 74-76)

3. Análise do problema

4.4 Enriquecimento do modelo e cálculos analíticos

Uma vez concluídas as transformações no Editor de Consultas, é necessário enriquecer o modelo de dados com outros elementos ou transformações realizadas no Power BI Desktop: gestão das relações, criação de hierarquias, ordenação de dados, agrupamento de dados, obtenção de medidas e colunas calculadas.

4.4.1 Relações

Depois de fechar o Editor de Consultas, o Power BI Desktop cria automaticamente algumas relações entre as tabelas carregadas no modelo. Contudo, o algoritmo utilizado nem sempre deteta todas as relações existentes, pelo que pode ser necessário fazer esta gestão manualmente [19]. A correta criação das relações entre tabelas é um aspeto muito importante uma vez que, qualquer erro cometido aqui, tem a grave consequência de poder vir a gerar informação errada e de estar a falsear os resultados das análises. Esta verificação ou eventual definição de relações em falta, foi feita através do Modo de Relações do Power BI que permite graficamente visualizar a relação entre tabelas ou elementos.

4.4.2 Hierarquias

As hierarquias também devem ser definidas nesta fase de complementar o modelo. As hierarquias em dimensões permitem a análise de medidas em vários níveis de detalhe. A hierarquia relacionada com a dimensão Data, é criada automaticamente pelo Power BI, isto é, desde que no modelo exista um campo de data, o Power BI vai gerar automaticamente diferentes hierarquias de tempo.

Para além da data, foram criadas as hierarquias que tinham sido identificadas na descrição das dimensões (ver Subsecção 4.2.2), e que podem ser visualizadas na Figura 4.7:

59

Para criar uma hierarquia é necessário arrastar e soltar o(s) atributo(s) que se pretende, de forma manual, de modo a ficarem organizados pelos agrupamentos pretendidos.

4.4.3 Ordenação de dados

Para além de gerir as relações e as hierarquias, existem outros procedimentos necessários à melhoria do modelo: um deles tem a ver com a ordenação dos dados de visualização. No caso dos diplomados, este procedimento foi usado para ordenar o atributo Nível de formação por uma ordem lógica e não por ordem alfabética (este procedimento é muito utilizado para ordenar os meses do ano, por ordem temporal e não por ordem alfabética).

Para isso, na dimensão Curso foi criada uma coluna adicional com a ordem pretendida. Esta nova coluna, denominada “Ordem” foi obtida através da criação de uma Coluna Personalizada, ainda na fase de ETL, mas poderia também ser obtida nesta fase de modelação de dados através da opção de criação de uma Nova Coluna. Caso seja na fase de ETL, a coluna aparece no modelo como sendo uma coluna de origem (uma vez que é carregada como tal). Caso seja criada na fase de modelação, fica identificada com o símbolo de uma função.

4.4.4 Agrupamento de dados

Na dimensão Instituição, as Unidades Orgânicas foram agrupadas do modo a distinguir a FCUL das restantes e permitir obter o indicador Percentagem de diplomados com habilitação anterior obtida na FCUL (D3). Assim, o código 0701, que correspondia à FCUL antes da fusão, e 1503, que corresponde ao código oficial e atual da FCUL, foram agrupados como proveniência interna e as restantes faculdades como externa.

Na medida Número de Anos até à Conclusão também foi criado um grupo de modo a agrupar esta variável em apenas duas categorias: N anos e > N anos, sendo N a duração do curso.

4.4.5 Medidas calculadas

Por último, foram criadas as medidas calculadas usando a linguagem DAX. Para criar uma medida, é necessário selecionar a opção Nova Medida no menu Modelação. Automaticamente aparece a barra de fórmulas, em que é possível digitar a expressão DAX que define a medida. Depois de criar uma nova medida, ela aparece numa das tabelas no painel Campos, localizado no lado direito do ecrã, identificada com um ícone de uma calculadora.

Na tabela de factos dos Colocados foi criada a seguinte medida, em linguagem DAX, para dar resposta ao indicador da Média da Nota de Ingresso (A4):

• Média da nota de ingresso = AVERAGE (‘FactColocados’[Nota de candidatura])

Na tabela de factos das Inscrições foi criada a seguinte medida, para dar resposta ao indicador Número médio de ECTS inscritos (I3):

• Número médio de ECTS inscritos = AVERAGE (‘FactInscrições’[ECTS inscritos])

Por último, na tabela de factos dos Diplomas, foram criadas três medidas, necessárias à obtenção dos indicadores académicos identificados na Subsecção 3.4.4: Classificação Média dos Diplomados (D1), quer a classificação final, quer a parcial e o Número médio de Inscrições até à Conclusão do Curso (D2). As fórmulas utilizadas na sua obtenção foram as seguintes:

• Média da Classificação Final = AVERAGE (‘FactDiplomas’[Classificação Final]) • Média da Classificação Parcial = AVERAGE (‘FactDiplomas’[Classificação Final MD])

60

• Média Anos Conclusão = AVERAGE (‘FactDiplomas’[NumInscConclusão])

A vantagem de ter estas medidas, que poderiam ser obtidas apenas em termos de cálculos ao fazer os respetivos gráficos, tem a ver com o desempenho bem como com a possibilidade de voltarem a ser usadas em qualquer visualização. Para isso, basta, como qualquer outra coluna de tabela, arrastá-la e soltá-la no ecrã do relatório ou nos campos de visualização.

4.4.6 Colunas Calculadas

Em termos de colunas calculadas, na tabela de factos dos Diplomas foi criada a Idade de Graduação. Uma coluna calculada é uma nova coluna que transforma ou combina dois ou mais elementos existentes, podendo também servir para estabelecer uma relação entre tabelas. Neste caso, a fórmula, em linguagem DAX, foi a seguinte:

• Idade de Graduação = DATEDIFF(RELATED(DimAluno[Data de Nascimento]); FactDiplomas[Data Diploma];YEAR)

Neste exemplo, uma vez que a nova coluna foi criada na tabela de factos dos Diplomas e a data de nascimento consta na tabela Aluno, é necessário utilizar a função Related na tabela Aluno.

A idade de uma pessoa é um dado calculado que se determina a partir da data de nascimento. Os dados calculados, de um modo geral, não constam nos sistemas operacionais. Contudo, no data warehouse os dados calculados, mesmo os de mais fácil determinação têm sempre lugar, uma vez que simplificam a tarefa do utilizador.

No documento Plataforma de Indicadores Académicos (páginas 74-76)