Estatística
Estatística
A Estatística é um ramos da Matemática que dispõe de processos apropriados para recolher, organizar, classificar, apresentar e interpretar determinados conjuntos de dados.
A Estatística tem por objectivo extrair informação dos dados para obter uma melhor compreensão das situações que representam.
Tipos de dados
Os dados estatísticos nem sempre são da mesma natureza. É diferente estudar a cor dos olhos ou a cor do cabelo do que fazer o estudo sobre a altura ou o número de pessoas de um agregado familiar.
As primeiras duas variáveis (cor dos olhos e cor do cabelo) são
expressas através de uma qualidade, categoria ou característica, não
susceptível de medida, mas de classificação. São chamados dados
qualitativos.
Tipos de dados
As outras duas variáveis (altura e número de pessoas do agregado familiar) representam informação resultante de características susceptíveis de serem medidas. São chamados dados quantitativos.
O número de pessoas de um agregado familiar é expresso através de um número inteiro, por exemplo:
1, 5, 6, 3, 3, 4, 2, 3, 6, 3, 2, 5
Pode representar o número de pessoas que constituem o agregado familiar numa amostra de 12 famílias consideradas ao acaso.
Este tipo de dados é quantitativo discreto. Este tipo de variável pode tomar um número finito (ou infinito numerável) de valores.
Os dados quantitativos podem ser de natureza discreta ou contínua.
Tipos de dados
Escolhida agora uma amostra de 12 pessoas ao acaso, os dados relativos à altura, em centímetro, podem ser os seguintes, por exemplo:
142, 175, 166, 133, 143, 144, 172, 163, 176, 193, 182, 185
Este tipo de dados é quantitativo contínuo. As alturas podem tomar
qualquer valor, dependendo da precisão com que podemos ou
queremos efectuar a medição.
Tipos de dados
Qualitativos
Dados Quantitativos Discretos Continuos
Organização e representação de dados
Relativamente a uma amostra de 20 portugueses, com mais de 18 anos, obtiveram-se os seguintes dados relativos ao seu estado civil.
Solteiro Solteiro Casado Solteiro Solteiro Divorciado Solteiro Viúvo Casado Divorciado Solteiro Casado Solteiro Solteiro Casado
Dados Qualitativos
Organização e representação de dados
Dados Qualitativos
Tabela de frequências Estado Cívil
(Valores da variável estatística) N.º de pessoas
(Frequência absoluta) % de pessoas
(Frequência relativa)
Solteiro 10 10/20 x 100 =
50%
Casado 6 6/20 x 100 =
30%
Viúvo 1 1/20 x 100 =
5%
Divorciado 3 3/20 x 100 =
O tamanho ou dimensão da amostra é 20. Repara que a soma das 15%
frequências absolutas tem de ser igual ao tamanho da amostra e que a somas das frequências relativas igual a 100%.
Organização e representação de dados
Dados Qualitativos
Como as variáveis qualitativas não tomam valores numéricos não existe a possibilidade de se determinar a média ou a mediana.
No entanto, pode determinar-se a moda da distribuição.
No exemplo, a moda corresponde ao estado civil “Solteiro”, uma vez que é a característica (valor da variável qualitativa) que se repete com maior frequência.
Organização e representação de dados
Dados Qualitativos
Os dados qualitativos podem ser representados através de gráficos de barras ou gráficos circulares, como os abaixo representados.
Neste exemplo, o gráfico de barras foi construído com as frequências absolutas e o circular com as respectivas frequências relativas.
Organização e representação de dados
Dados Qualitativos
Repara que, nos gráficos de barras, cada uma das barras é separada da anterior. As barras têm todas a mesma largura e a sua altura é proporcional à frequência absoluta.
Organização e representação de dados
Dados Qualitativos
Nos gráficos circulares, o ângulo definido por cada um dos sectores é proporcional à frequência observada. Assim, para determinar a amplitude do sector relativo aos portugueses com o estado civil “Solteiro”, faremos:
360º 360 50 180º
100% 50% x x 100 x
(Nota: A frequência relativa de “Solteiros” é de 50%)
Organização e representação de dados
Dados Quantitativos Discretos
Na organização de dados quantitativos discretos podem usar-se técnicas semelhantes, quer na organização, quer na representação, às utilizadas para os dados qualitativos.
No entanto, como estamos a trabalhar com variáveis que assumem valores numéricos, temos a possibilidade de determinar, para além da moda, também a média e a mediana.
Organização e representação de dados
Dados Quantitativos Discretos
A tabela acima refere-se a um estudo sobre o número de irmãos, tendo por base uma amostra de 135 alunos de uma Escola Básica do 2.º e 3.º ciclos.
N.º de irmãos N.º de alunos % de alunos
0 60 44,5%
1 40 29,6%
2 20 14,8%
3 10 7,4%
4 3 2,2%
5 2 1,5%
Organização e representação de dados
Dados Quantitativos Discretos
Observando a tabela é fácil verificar que a moda é ser filho único, isto é, ter 0 irmãos.
N.º de
irmãos N.º de
alunos % de alunos
0 60 44,5%
1 40 29,6%
2 20 14,8%
3 10 7,4%
4 3 2,2%
5 2 1,5%
m
o= 0.
Logo:
Organização e representação de dados
Dados Quantitativos Discretos
O que fazer para determinar a média?
N.º de
irmãos N.º de
alunos % de alunos
0 60 44,5%
1 40 29,6%
2 20 14,8%
3 10 7,4%
4 3 2,2%
5 2 1,5%
Vamos multiplicar cada valor da variável pela respectiva frequência absoluta. De seguida, somamos todos os resultados obtidos. Por último, dividimos pelo número total de observações (a dimensão da amostra).
Organização e representação de dados
Dados Quantitativos Discretos
N.º de
irmãos N.º de
alunos % de alunos
0 60 44,5%
1 40 29,6%
2 20 14,8%
3 10 7,4%
4 3 2,2%
5 2 1,5%
O número médio de irmãos por aluno é aproximadamente 1.
Escreve-se: X = 1.
Organização e representação de dados
Dados Quantitativos Discretos
N.º de
irmãos N.º de
alunos % de alunos
0 60 44,5%
1 40 29,6%
2 20 14,8%
3 10 7,4%
4 3 2,2%
5 2 1,5%
Para determinarmos a mediana podemos usar as frequências relativas.
Vamos somando as frequências relativas até atingirmos o valor 50% ou superior.
Podemos, para isso, criar uma nova coluna na tabela.
Organização e representação de dados
Dados Quantitativos Discretos
N.º de
irmãos N.º de
alunos % de alunos
% acumula
da
0 60 44,5% 44,5%
1 40 29,6% 74,1%
2 20 14,8%
3 10 7,4%
4 3 2,2%
A frequência relativa acumulada correspondente a 50% refere-se ao valor 1 da variável (n.º de irmãos).
X
~Então, a mediana é 1.
Escreve-se:
Organização e representação de dados
Dados Quantitativos Contínuos
Para efectuarmos um estudo sobre a altura dos alunos do 3.º ciclo da escola, escolheu-se uma amostra aleatória constituída por 23 alunos.
Os dados obtidos, em centímetro, foram os seguintes:
145 151 147 167 175 174 153 167 173 162 158 149 170 167 168 175 174 157 149 150 169 156 171
Como deveremos organizar este tipo de dados?
Organização e representação de dados
Dados Quantitativos Contínuos
Os dados quantitativos contínuos organizam-se de uma forma diferente dos discretos.
145 151 147 167 175 174 153 167 173 162 158 149 170 167 168 175 174 157 149 150 169 156 171
Devemos, em primeiro lugar, identificar o valor mínimo e o valor máximo de entre todas as observações, bem como o número total de observações.
Organização e representação de dados
Dados Quantitativos Contínuos
Os dados quantitativos contínuos organizam-se por classes ou intervalos de valores.
Sabemos o valor da letra n (n.º de observações) e o objectivo é determinar o valor de k (n.º de classes).
2
k≥ n
Uma das formas de determinar o número de classes ( k ) é através da fórmula:
Existem formas de determinar o melhor número de classes, tendo em conta o número de observações recolhidas.
Organização e representação de dados
Dados Quantitativos Contínuos
Usando a fórmula anterior já podemos descobrir o melhor número de classes pelas quais vamos distribuir os valores das alturas dos 23 alunos.
Fazendo alguns cálculos vimos que:
Temos de encontrar o valor de k que é solução da desigualdade:
2
k≥ 23
Vamos procurar qual é a potência de base 2 cujo valor é maior ou igual a 23.
Organização e representação de dados
Dados Quantitativos Contínuos
Já sabemos, então, que temos de formar 5 classes para organizarmos os dados que foram recolhidos.
Xmax – Xmin
(diferença entre o valor máximo e o valor mínimo das observações) Em primeiro lugar vamos efectuar a seguinte operação:
Como vamos obter as classes?
Organização e representação de dados
Dados Quantitativos Contínuos
Temos, então:
O próximo passo é formar 5 classes, cada
Neste caso
: h = 30 / 5 = 6
Dividindo aquele valor pelo n.º de classes, obtemos a amplitude ( h ) de cada uma das classes.
Xmax – Xmin = 175 – 145 = 30
Organização e representação de dados
Dados Quantitativos Contínuos
Para formar a primeira classe, partimos do valor mínimo das observações que é, neste caso, 145.
Nesta classe iremos colocar o número de observações cujo valor é igual ou maior do que 145 e menor do que 151.
A classe a considerar é a seguinte: [145, 151[ . 145 + 6 = 151.
Este é o limite inferior da classe. Para obtermos o limite superior da classe adicionamos o valor da amplitude ao limite inferior. Neste caso, o limite superior da classe é:
Organização e representação de dados Dados Quantitativos Contínuos
Para as classes seguintes vamos agir da mesma forma, tomando por limite inferior da classe seguinte, o limite superior da classe anterior.
[163, 169[
[157, 163[
[151, 157[ (151 é o limite superior da classe anterior) Por exemplo:
Organização e representação de dados
Dados Quantitativos Contínuos
Já temos, assim, as 5 classes formadas:
[145, 151[
[151, 157[
[157, 163[
[163, 169[
[169, 175]
Podemos, então, fazer uma tabela de frequências tendo em conta cada uma das classes.
Organização e representação de dados
Dados Quantitativos Contínuos
Tabela de frequências
Classes
(Altura dos alunos) N.º de alunos % de alunos
[145, 151[ 5 21,8%
[151, 157[ 3 13,0%
[157, 163[ 3 13,0%
[163, 169[ 4 17,4%
[169, 175] 8 34,8%
Organização e representação de dados
Dados Quantitativos Contínuos
Observando a tabela de frequências podemos verificar que uma das classes têm maior frequência de observações.
Classes
(Altura dos alunos) N.º de alunos % de alunos
[145, 151[ 5 21,8%
[151, 157[ 3 13,0%
[157, 163[ 3 13,0%
[163, 169[ 4 17,4%
[169, 175] 8 34,8%
A classe modal, neste caso, é a classe [169, 175].
Organização e representação de dados
Dados Quantitativos Contínuos
Os gráficos das distribuições usando dados contínuos têm um aspecto diferente dos gráficos de barras das distribuições de dados discretos. Neste caso chamam-se histogramas.
3 4 5 6 7 8 9
Alturas dos alunos
(Estudo efectuado para uma amostra aleatória de 23 alunos)
N.º de alunos
Num histograma as barras são contíguas, ou seja, são unidas umas às outras.
Organização e representação de dados
Dados Quantitativos Contínuos
É também usual traçar-se uma linha que une os pontos médios das barras do histograma. À região limitada por essa linha chama-se polígono de frequências.
A linha a vermelho limita o chamado polígono de frequências..
[145, 151[ [151, 157[ [157, 163[ [163, 169[ [169, 175]
0 1 2 3 4 5 6 7 8 9
Alturas dos alunos
(Estudo efectuado para uma amostra aleatória de 23 alunos)
Altura (em cm)
N.º de alunos
Organização e representação de dados
Exercício
Para estudar o peso dos alunos do 3.º ciclo de uma Escola Básica foi recolhida, aleatoriamente, uma amostra constituída por 15 alunos dessa Escola.
Os pesos (em kg) observados são os seguintes:
45,3 70,0 64,8 60,5 54,2 51,1 60,4 69,8 67,6 44,3 47,9 50,6 65,3 56,9 61,9
a) Constrói uma tabela de frequências absolutas e relativas.
Organização e representação de dados
Exercício - Resolução
Variável estatística: X – Peso dos alunos
(Trata-se de uma variável quantitativa contínua)
45,3 70,0 64,8 60,5 54,2 51,1 60,4 69,8 67,6 44,3 47,9 50,6 65,3 56,9 61,9
n = 15 (dimensão da amostra = n.º total de observações) Xmin = 44,3 Xmax = 70,0
Organização e representação de dados
Exercício - Resolução
2
k≥ 15 k = 4 (
Nota:2
4=16)
Devemos distribuir os dados por
4
classes.Xmax - Xmin = 70,0 – 44,3 = 25,7
h = 25,7 / 4 = 6,5 (aproximadamente)
Organização e representação de dados
Exercício - Resolução
Classes a considerar:
[44,3 ; 50,8[
[50,8 ; 57,3[
[57,3 ; 63,8[
[63,8 ; 70,3]
Nota:
Ao limite inferior de cada classe, soma-se a amplitude da classe de modo a se determinar o respectivo limite superior.
Organização e representação de dados
Exercício - Resolução
Tabela de frequências absolutas e relativas:
Peso dos alunos Contagem N.º de alunos % de alunos
[44,3 ; 50,8[ IIII 4 27%
[50,8 ; 57,3[ III 3 20%
45,3 70,0 64,8 60,5 54,2 51,1 60,4 69,8 67,6 44,3 47,9 50,6 65,3 56,9 61,9
Organização e representação de dados
Exercício - Resolução
Classe modal:
Peso dos alunos N.º de alunos % de alunos
[44,3 ; 50,8[ 4 27%
[50,8 ; 57,3[ 3 20%
[57,3 ; 63,8[ 3 20%
[63,8 ; 70,3] 5 33%
A Classe modal é a classe [63,8 ; 70,3] uma vez que é a que tem maior frequência.