• Nenhum resultado encontrado

É muito comum, ao divulgarmos uma

No documento Estatística e Probabilidades (páginas 63-68)

síntese de uma

variável quantitativa,

apresentarmos a sua

média, seguida do

seu desvio padrão no

responder essa questão comparando os dois desvios padrões, estará cometendo dois erros:

1º Não se pode comparar diferentes unidades de medida (s versus m); 2º Deve-se considerar a magnitude da média ao se avaliar um desvio padrão.

Então, como efetivamente obter o grau de variabilidade de uma variável? Isso é feito pelo coeficiente de variação (cv), uma relação percentual entre o desvio padrão e a média:

cv = s x100(%).

Além de ser uma medida adimensional, o que possibilita comparações entre diferentes variáveis, o CV pode ser interpretado de forma absoluta:

x

QUADRO 2 – Definição e interpretação do grau de variabilidade de um conjunto de dados.

Fonte: Elaborado pelo autor.

CV <= 20% Dados com pouca variabilidade, bem comportados, homogêneos. A variável

tem um comportamento bem previsível.

20 < CV <= 30% Dados com variabilidade intermediária.

CV > 30% Dados com muita variabilidade, heterogêneos. A variável tem um

comportamento muito imprevisível.

CV > 100% Neste caso, o desvio padrão é maior que a média. Dados com variabilidade

extrema, muito heterogênea. A variável tem um comportamento caótico, completamente imprevisível.

CV INTERPRETAÇÃO

No caso do atleta, teremos os seguintes valores de coeficiente de variação:

Tempo para correr 100 metros: cv = 2,1 x 100 = 18,26%; Salto em altura: cv = 0,8 x 100 = 36%;

11,5

Podemos dizer então que o atleta tem pouca variabilidade nos seus resultados da corrida de 100 m e muita variabilidade nos saltos em altura.

Quando você fizer uma análise exploratória de dados, lembre-se de corrigir os gráficos produzidos pelo Excel. Lembre-se também de colocar os títulos das tabelas e das figuras o mais informativo possível. E, ao calcular o desvio padrão, não se esqueça de considerar que você tem dados amostrais. Confira na sua calculadora e/ou no próprio Excel qual a fórmula que está sendo usada. Resuma os dados por meio de gráficos, números e tabelas. Esse é o primeiro e fundamental passo para entender os dados e o problema investigado.

A análise exploratória dos dados é o primeiro passo para que você se torne especialista na área investigada. Suas ferramentas de análise não produzem conclusões definitivas sobre um problema, mas possibilitam que hipóteses sejam construídas de forma consistente.

O artigo “Avaliação do impacto do Cálculo Zero no desempenho de alunos ingressantes de cursos de Engenharia”, apresentado em 2013 por COUTO e cols. no COBENGE - Congresso Brasileiro de Educação em Engenharia, teve como objetivo avaliar o impacto do “Cálculo Zero” no desempenho de alunos ingressantes em cursos de Engenharia e Ciência da Computação, tanto em termos da nota final em Cálculo Diferencial e Geometria Analítica e Álgebra Linear (GAAL), quanto na chance de aprovação nessas disciplinas. As perguntas-chave do trabalho eram: O “Cálculo Zero” afeta de forma significativa o resultado dos alunos nas disciplinas obrigatórias de Cálculo Diferencial e GAAL? Vale a pena investir em projetos de “Cálculo Zero”? Quais são os fatores, as características que afetam o desempenho dos alunos nessas duas disciplinas?

Várias técnicas de análise exploratória de dados foram utilizadas no artigo. Por exemplo, usando um gráfico de linhas, uma série temporal, mostrou-se no artigo a elevação no número de matrículas nas duas disciplinas-alvo do trabalho, Cálculo Diferencial e GAAL:

FIGURA 19 - Evolução do número de alunos matriculados e o percentual de aprovados em Cálculo Diferencial e GAAL. Entre o 2º semestre de 2009 e o 2º semestre de 2012, o percentual

de aprovação em ambas as disciplinas apresentou elevação, principalmente em Cálculo Diferencial. O número de alunos matriculados nas disciplinas também aumentou de forma

importante no período, principalmente após o 1º semestre de 2011.

Fonte: COUTO et al., 2013.

Um diagrama de dispersão foi construído mostrando claramente o efeito das faltas às aulas na nota final de Cálculo Diferencial:

FIGURA 20 – Gráfico de dispersão considerando o percentual de faltas/ausências às aulas de Cálculo Diferencial e a nota final do aluno nessa disciplina: análise considerando somente alunos em que foram registradas pelo menos uma falta às aulas durante o semestre. Há uma forte correlação negativa (r= -0,77) entre ausências às aulas e a nota final do aluno: quanto mais faltas às aulas o aluno tiver,

menor a sua nota final em Cálculo Diferencial. IET/ UniBH, 1º semestre de 2011.

Fonte: COUTO et al., 2013.

Além de gráficos, tabelas com a síntese numérica dos dados coletados no estudo também foram apresentadas no artigo. O uso dessas ferramentas estatísticas de análise de dados mostrou de forma inequívoca que valia a pena implementar ações como o “Cálculo Zero”, pois o fato de se ofertar essa disciplina afetava o resultado dos alunos nas disciplinas obrigatórias de Cálculo Diferencial e GAAL. Esse é um exemplo real de como usar a análise exploratória dos dados e outras técnicas de Estatística e Probabilidades para se entender a fundo um problema, resolvendo-o e se tornando um especialista na área.

Referência:

XLI CONGRESSO BRASILEIRO DE EDUCAÇÃO EM ENGENHARIA, 2013. Avaliação do Impacto do Cálculo Zero no Desempenho de Alunos Ingressantes de Cursos de Engenharia. Paraná: FADEP, 2013. Disponível em: <http://www.fadep.br/ engenharia-eletrica/congresso/pdf/116280_1.pdf>. Acesso em 14 maio 2015.

Revisão

Vimos nesta unidade os principais tópicos da análise exploratória de dados, também denominada de Estatística Descritiva:

Síntese gráfica: Uma figura vale mais que mil palavras! Isso é verdade, entretanto um gráfico vale mais que mil palavras se e somente se ele for desenhado de forma clara, correta e concisa. Sempre desenhe gráficos a partir de seus dados, mas tente fazê-los de tal forma que a frase “basta olhar para entender” seja válida. Os gráficos mais úteis para análise de dados de experimentos de pequeno e médio porte na área de Ciências Exatas e Engenharia são: gráficos de pizza, barras, colunas, linha, séries históricas, histograma, gráfico de Pareto, gráfico misto, de coluna e de linha, diagrama de dispersão e box-plot. Na prática devemos construir gráficos usando ferramentas computacionais como o Excel.

Síntese tabular de dados: Na análise exploratória de dados, em última instância, todos os resultados são apresentados ou na forma de figuras ou de tabelas. Assim, invista no título da tabela e sempre coloque respostas claras para pelo menos quatro perguntas: O que? Quem? Quando? Onde? Também sugiro que a interpretação das informações na tabela seja colocada no próprio título. Se necessário, coloque notas explicativas, usando siglas somente para coisas realmente conhecidas.

Síntese numérica: O resumo de uma variável categórica é muito simples, basta que você apresente suas categorias, a frequência de valores em cada categoria e os respectivos percentuais. Já a síntese de variáveis quantitativas é mais ampla e envolve resumir dois aspectos:

1. Um valor típico ou característico para a variável, que é definido pela média ( X ) e pela mediana (Md). Se média e mediana forem semelhantes, então a média deve ser usada para representar os dados. Entretanto, caso haja

Na análise

No documento Estatística e Probabilidades (páginas 63-68)

Documentos relacionados