Universidade Estadual de Alagoas – UNEAL. Campus II – Santana do Ipanema.
Curso: Licenciatura em Pedagogia.
Disciplina: Estatística Aplicada à Educação. Professor: Wellyngton Chaves Monteiro da Silva
Estatística Descritiva: organização dos dados 1 – SÉRIES ESTATÍSTICAS
I - REPRESENTAÇÃO TABULAR
Quando os dados estão organizados em forma de tabelas, temos uma Representação Tabular. Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas segue normas específicas, editadas pelo IBGE. Vejamos a representação esquemática de uma tabela:
Título
Cabeçalho
Corpo
Rodapé
Elementos de uma tabela:
1) TÍTULO: O título deve responder as seguintes questões:
O que? - Assunto a ser representado (Fato)
Onde? - O lugar onde ocorreu o fenômeno (local)
Quando? - A época em que se verificou o fenômeno (tempo)
2) CABEÇALHO: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. 3) CORPO: parte da tabela composta por linhas e colunas.
4) RODAPÉ: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de natureza informativa (fonte, notas e chamadas).
Fonte: refere-se à entidade que organizou ou forneceu os dados expostos.
Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação geral; chamada - esclarecer minúcias em relação a uma célula).
II - SÉRIE ESTATÍSTICA
Série estatística é um conjunto de dados ordenados segundo uma característica comum. A partir dessa sistematização em torno de uma ou mais características comuns, poderemos, posteriormente, submeter os dados à análises e inferências.
De acordo com o fenômeno, o local e a época de ocorrência, as séries estatísticas classificam-se em
SÉRIE TEMPORAL: É a série estatística em que os dados são observados segundo a época de sua ocorrência.
A esse conjunto de observações ordenadas no tempo, comumente em intervalos iguais, chamamos de série temporal.
Tabela 1 - Percentagem de reprovação no 6º ano do Ensino Fundamental na Escola Sant’Ana nos últimos 5
anos. Ano % 2008 7,5 2009 4,8 2010 5,3 2011 4,3 2012 4,0
Fonte: Secretaria da Escola Sant’Ana.
SÉRIE GEOGRÁFICA: É a série estatística em que os dados são observados segundo o local onde ocorreram. Tabela 2 - Média das avaliações da disciplina de português dos alunos de ensino fundamental das escolas
municipais do médio sertão de Alagoas - 2012
Município Nota média
Carneiros 7,5
Dois Riachos 8,3
Maravilha 9,0
Olho D’Água das Flores 8,3
Olivença 7,9
Ouro Branco 8,8
Poço das Trincheiras 7,6
Santana do Ipanema 9,1
São José da Tapera 7,6
Senador Rui Palmeira 8,0
Fonte: Dados fictícios.
SÉRIE ESPECIFICATIVA: É a série estatística em que os dados são agrupados segundo a modalidade
(espécie) de ocorrência.
Tabela 3 - Quantidade de computadores distribuídos às escolas da rede estadual no médio sertão de acordo com
o fabricante - 2012 Fabricante Quantidade Computech 10 Dell 15 Itautec 20 Samsung 35
Fonte: Dados da Secretaria de Educação (dados fictícios).
SÉRIE MISTA: Corresponde à fusão de duas ou mais séries simples.
Tabela 4 - Quantidade de computadores distribuídos nas escolas da rede estadual no médio sertão de acordo com
o trimestre do ano de 2012
Fabricante 1º tri 2º tri 3º tri 4º tri
Computech 2 2 2 4
Dell 5 5 5 0
Itautec 5 5 5 5
Samsung 10 10 10 5
2 – GRÁFICOS
A organização, sumarização e descrição de dados pode ser feita por meio da construção de gráficos e tabelas. Os Gráficos são representações pictóricas dos dados, muito valiosas para a visualização dos resultados, e se constituem de recursos pictóricos auxiliares para a visualização de um fenômeno.
Os principais tipos de gráficos usados na representação estatística são: a) Histograma e polígono de frequência;
b) Ogiva;
c) Gráfico em barras (ou em colunas); d) Gráfico em setores;
e) Gráfico em linhas.
Histograma e Polígono de freqüência
Os histogramas são os gráficos mais adequados para a descrição de dados oriundos de variáveis quantitativas. Basicamente, eles mostram as frequências de observações para cada valor ou conjunto de valores da variável que se deseja descrever. Trata-se de uma representação gráfica adequada para o tratamento de conjuntos de dados quantitativos com elevada quantidade de elementos.
Constitui-se em um conjunto de retângulos com as bases sobre um eixo dividido de acordo com os tamanhos de classes, centros nos pontos médios das classes e áreas proporcionais às frequências.
Já um polígono de frequência é um gráfico que se obtém unindo-se por uma poligonal os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos médios.
O histograma e o polígono de frequências são gráficos alternativos e contém a mesma informação. A escolha entre um e outro depende da preferência do analista de dados.
Como exemplo, a partir dos dados da Tabela 5, vejamos o Gráfico 1, que consiste em um histograma com polígono de frequências inscrito, e o Gráfico 2, que consiste em um histograma com uma ogiva (polígono da frequência percentual acumulada).
Tabela 5 - Distribuição de frequências das idades dos alunos da Disciplina de Estatística Aplicada à Educação
do Curso de Licenciatura em Pedagogia do Campus II/UNEAL. Semestre 2013/2
Idade Frequência (F) F% F% acumulada 18 – 21 3 12 12 22 – 25 3 12 23 26 – 29 6 23 46 30 – 33 6 23 69 34 – 37 5 19 88 38 – 41 3 12 100 Total 26 100 - - -
Gráfico 1 - Frequências das idades dos alunos da Disciplina de Estatística Aplicada à Educação do Curso de
pedagogia do Campus II/UNEAL. Semestre 2013/2
0 1 2 3 4 5 6 7 18 20 22 24 26 Mais Intervalos de idade Freqüência
Fonte: dados fictícios.
Gráfico 2 - Frequências das idades dos alunos da Disciplina de Estatística Aplicada à Educação do Curso de
pedagogia do Campus II/UNEAL. Semestre 2013/2
0
1
2
3
4
5
6
7
18 20 22 24 26 MaisIntervalos
Fre
qüê
nc
ia
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
Fonte: dados fictícios.
18 – 21 22 – 25 26 – 29 30 – 33 34 – 37 38 – 41
Ogiva
É o gráfico representativo de uma distribuição acumulada de freqüências. Consta de uma poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe, e no eixo vertical, as freqüências acumuladas. A freqüência acumulada relacionada com o limite inferior da primeira classe é sempre zero.
Como exemplo, e a partir dos dados da Tabela 5, temos o Gráfico 3 que consiste no polígono referente à frequência percentual acumulada.
Gráfico 3 - Ogiva das idades dos alunos da Disciplina de Estatística Aplicada à Educação do Curso de
Licenciatura em Pedagogia da UNEAL/Campus II. Semestre 2013/2
0,00% 20,00% 40,00% 60,00% 80,00% 100,00% 120,00% 18 20 22 24 26 Mais Intervalos de idade Freqüência
Fonte: dados fictícios.
Gráfico em barras (horizontais e verticais)
O gráfico de barras (horizontais ou verticais) são os gráficos mais comuns na descrição de dados oriundos de variáveis qualitativas (bem como o gráfico em setores), ou de dados de natureza discreta, como os provenientes de contagens (quando não existe um número muito grande de valores distintos). Basicamente eles mostram as freqüências de observações para cada nível, ou categoria, da variável que se deseja descrever.
Por vezes, os dados consistem em contagens, e não em mensurações em uma escala contínua. Com esses dados, e se o número de valores distintos não é muito grande, construímos uma distribuição de freqüência utilizando-se os próprios valores individuais como “classes”, em lugar de intervalos de classe. Esses valores são colocados no eixo horizontal, e em cada um deles traça-se um segmento vertical de altura proporcional à respectiva frequência, relativa ou absoluta.
Seguem dois exemplos, Gráficos 4 e 5, a partir dos dados da Tabela 6.
Tabela 6 - Distribuição de frequências das idades dos alunos da Creche Sant’Ana. Ano de 2013
Idade Frequência (F) 1 3 2 3 3 6 4 6 5 5 6 3 Total 26 18 – 21 22 – 25 26 – 29 30 – 33 34 – 37 38 – 41
Fonte: dados fictícios. Fonte: dados fictícios.
Gráfico em setores (setorial, setograma)
O Gráfico em setores é utilizado para se representar uma série categórica ou nominal. São dos mais comuns na descrição de dados oriundos de variáveis qualitativas (como os gráficos em barras).
O Gráfico 6 constitui-se em um exemplo de setograma tridimensional.
Gráfico 6 - Percentual de alunos, por curso, na aula de abertura do semestre 2013/2 da UNEAL/Campus II
Fonte: dados fictícios.
Gráfico em linhas
É um dos gráficos mais importantes, pois representa observações feitas ao longo do tempo, em intervalos iguais ou não. Tais conjuntos de dados constituem as chamadas séries históricas ou temporais. Traduzem o comportamento de um fenômeno em certo intervalo de tempo.
Gráfico 7 - Comparação entre a evolução da reprovação nos ensinos fundamental e médio da Escola Sant’Ana,
em percentagem, no período de 2000 a 2006. 25 30 35 40 45 50 55 60 2000 2001 2002 2003 2004 2005 2006 Ano Percentagem Médio Fundamental
Fonte: dados fictícios.
0 1 2 3 4 5 6 7 1 2 3 4 5 6 Idade F req u ên ci a 0 2 4 6 8 1 2 3 4 5 6 Id ad e Frequência
Gráfico 5 - Gráfico em barras horizontais da Tabela 6 Gráfico 4 - Gráfico em barras verticais da Tabela 6