Introdu¸c˜ ao ` a Probabilidade e Estat´ıstica I
Tabelas de Frequˆencias e Gr´aficos
Prof. Alexandre G Patriota Sala: 298A
Email: patriota@ime.usp.br Site: www.ime.usp.br/∼patriota
Tabela de dados Brutos
A tabela de dados brutos nos traz toda a informa¸c˜ao dispon´ıvel sobre os objetos de interesse.
Por´em, como podemos perceber na Tabela 2.1 de Bussab e
Morettin o excesso de informa¸c˜ao pode tornar extremamente dif´ıcil extrair conclus˜oes desta tabela.
Portanto, se faz necess´ario sumarizar esta tabela para que a informa¸c˜ao seja mais compreens´ıvel.
Uma forma das formas de sumarizar os dados qualitativos de uma tabela de dados brutos ´e atrav´es de frequˆencias e propor¸c˜oes.
Tabela 2.1
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.
Frequˆ encias para vari´ aveis Qualitativas
Tabela de frequˆencias para vari´aveis Qualitativas
Frequˆ encias
Frequˆencia absoluta(frequˆencia): n´umero de casos favor´aveis ao evento. Ser´a denotado porni, a frequˆencia do valor i e porn a frequˆencia total.
Frequˆencia relativa(propor¸c˜ao): n´umero de casos favor´aveis ao evento dividido pela frequˆencia totalfi =ni/n. Frequˆencia relativa tamb´em ser´a chamada de propor¸c˜ao.
Porcentagem: ´e a frequˆencia relativa multiplicada por 100%.
Observe que as frequˆencias absolutas e relativas condensam efetivamente a informa¸c˜ao apenas em vari´aveis qualitativas e quantitativas discretas.
Tabelas de frequˆ encias
Criamos uma tabela para uma vari´avel escolhida em que:
I as linhas referem-se aos valores que esta vari´avel pode tomar;
I as colunas referem-se a frequˆencias (absoluta, relativa, porcentagem)
Suponha que a vari´avel de interesse pode assumirk categorias.
Vari´avel Frequˆencia Propor¸c˜ao Porcentagem
C1 n1 f1 f1100%
C2 n2 f2 f2100%
... ... ... ...
Ck nk fk fk100%
Total n 1 100
Tabelas 2.2 e Tabela 2.3
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.
Representa¸c˜ ao gr´ afica de vari´ aveis qualitativas
Utilizaremos dois gr´aficos para representar a tabela de frequˆencias para vari´aveis qualitativas: gr´aficos de barras e gr´aficos em setores (ou tipo pizza).
Os gr´aficos de barras s˜ao feitos colocando uma barra vertical em cima de cada categoria que a vari´avel pode assumir representando frequˆencias ou propor¸c˜oes
Os gr´aficos de pizza s˜ao c´ırculos de raio arbitr´ario em que cada peda¸co ´e proporcional a sua frequˆencia relativa.
Figura 2.2
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.
Figura 2.3
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.
Exerc´ıcios
I Considere o conjunto de dados (classe social):
{B;B;C;B;C;C;A;B;A;B;C;B;B}.
Encontre as frequˆencias e propor¸c˜oes. Fa¸ca os gr´aficos.
I Considere o conjunto de dados (status fumante):
{S;N;S;S;N;N;S;N;N;N;S;N;S}.
Encontre as frequˆencias e propor¸c˜oes. Fa¸ca os gr´aficos.
Comente os resultados.
Exerc´ıcios
I Considere o conjunto de dados (n´umero de irm˜aos):
{1; 2; 1; 1; 1; 2; 2; 2; 3; 3; 3; 3; 1}.
Encontre as frequˆencias e propor¸c˜oes. Fa¸ca os gr´aficos.
I Considere o conjunto de dados (tempo de uso do telefone da empresa, em horas):
{1,1; 1,0; 2,1; 2,3; 2,0; 2,4; 2,5; 2,2; 2,8; 3,1; 3,0; 3,1; 4}.
Encontre as frequˆencias e propor¸c˜oes. Fa¸ca os gr´aficos.
Comente os resultados.
Frequˆ encias para vari´ aveis Quantitativas
Tabela de frequˆencias para vari´aveis Quantitativas
Tabela de frequˆ encias para vari´ aveis discretas
Em vari´aveis discretas ´e usual observar v´arias ocorrˆencias de um mesmo valor. Nestes casos as tabelas de frequˆencias para vari´aveis qualitativas tamb´em podem ser aplicadas.
Al´em das frequˆencia (ni) e propor¸c˜ao (fi) podemos tamb´em utilizar a frequˆencia acumulada.
Frequˆencia acumulada: ´E a soma das frequˆencias at´e o ponto especificado. Este conceito faz sentido para vari´aveis qualitativas ordinais e quantitativas em geral. Ser´a denotada pornaci a frequˆencia acumulada at´e o valori.
Propor¸c˜ao acumulada: ´E a soma das propor¸c˜oes at´e o ponto especificado. Este conceito faz sentido para vari´aveis qualitativas ordinais e quantitativas em geral. Ser´a denotada porfiac a frequˆencia acumulada at´e o valori.
Exemplo de tabela para uma vari´ avel discreta
dados de Magalh˜aes e Lima.
Idade ni fi naci fiac
17 9 0,18 9 0,18
18 22 0,44 31 0,62
19 7 0,14 38 0,76
20 4 0,08 42 0,84
21 3 0,06 45 0,90
22 0 0,00 45 0,90
23 2 0,04 47 0,94
24 1 0,02 48 0,96
25 2 0,04 50 1,00
Total n= 50
Observe que 62% = 0,62×100% dos alunos tem idade at´e 18 anos.
Quantos por cento dos alunos tem idade at´e 20 anos?
Quantos por cento dos alunos tem idade at´e 22 anos?
Tabela de frequˆ encias para vari´ aveis cont´ınuas
Como j´a dito anteriormente, dificilmente observaremos frequˆencias em uma vari´avel cont´ınua.
Considere o conjunto de dados (tempo de uso do telefone da empresa, em horas, por semana):
{1,1; 1,0; 2,1; 2,3; 2,0; 2,4; 2,5; 2,2; 2,8; 3,1; 3,0; 3,1; 4}.
Encontre as frequˆencias e propor¸c˜oes. Fa¸ca os gr´aficos.
Contudo, ´e poss´ıvel categoriz´a-la em intervalo de classes para que existam repeti¸c˜oes dentro de cada classe.
Intervalos de classe
O primeiro passo consiste em ordenar os dados e definir o n´umero de classes que queremos criar, digamosk. Depois, encontrar o valor m´ınimo (m) e m´aximo (M) e calcular
δ = (M −m)/k.
Aj-´esima classe ´e definida por todos os valores que est˜ao entre m+ (j −1)δ e m+jδ.
Denotaremos aj-´esima classe pela nota¸c˜ao
“m+ (j−1)δ|−−m+jδ”
e a ´ultima classe por “m+ (k−1)δ|−−|m+kδ”.
Exemplo de Intervalos de Classe
Considere o conjunto de dados (tempo de uso do telefone da empresa, em horas, por semana):
{1,1; 1,0; 2,1; 2,3; 2,0; 2,4; 2,5; 2,2; 2,8; 3,1; 3,0; 3,1; 4}.
Crie os intervalos de classe usando k=3.
Note quem= 1 e M = 4, ent˜ao δ= (4−1)/3 = 1.
Continua¸c˜ ao
Criamos ent˜ao uma tabela de frequˆencias:
P. M´edio Freq Prop Feq Ac Prop Ac.
IC si ni fi naci fiac
1|−−2 1,5 2 0,15 2 0,15
2|−−3 2,5 7 0,54 9 0,69
3|−−|4 3,5 4 0,31 13 1
Total 13
Tabela 2.6
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.
Continua¸c˜ ao
Pode-se ainda criar tabelas de distribui¸c˜ao de frequˆencia com amplitudes diferentes para os intervalos de classe. Ou seja, se temosk classes, poderemos formar intervalos com amplitudes δ1, δ2, . . . , δk.
Considere o conjunto de dados (tempo de uso do telefone da empresa, em horas, por semana):
{1,1; 1,0; 2,1; 2,3; 2,0; 2,4; 2,5; 2,2; 2,8; 3,1; 3,0; 3,1; 4}.
Crie os intervalos de classe usando k=3 com as seguintes amplitudes δ1 = 1,2,δ2 = 0,6,δ3= 1,2 .
Continua¸c˜ ao
P. M´edio Freq Prop
IC si ni fi
1,0|−−2,2 1,6 4 0,31
2,2|−−2,8 2,5 4 0,31
2,8|−−|4,0 3,4 5 0,38
Total 13
Histogramas
Podemos criar gr´aficos utlizando as tabelas de distribui¸c˜ao de frequˆencias para vari´aveis cont´ınuas.
Para isso criamos mais uma coluna na tabela de distribui¸c˜oes de frequˆencia chamada densidade de frequˆencia:
di = fi
δi
O Histograma ´e o gr´afico de barras obtido inserindo os intervalos de classes no eixo das abscissas e as densidades de frequˆencias no eixo das ordenadas.
Histograma
Exemplos
Tabela 1:
P. M´edio Freq Prop Dens. freq
IC si ni fi di
1|−−2 1,5 2 0,15 0,15
2|−−3 2,5 7 0,54 0,54
3|−−|4 3,5 4 0,31 0,31
Total 13
Tabela 2:
P. M´edio Freq Prop Dens. freq
IC si ni fi di
1,0|−−2,2 1,6 4 0,31 0,26
2,2|−−2,8 2,5 4 0,31 0,52
2,8|−−|4,0 3,4 5 0,38 0,32
Total 13
Fazer histogramas. Existe perda de informa¸c˜ao?
Ramo-e-folhas
Sal´arios
4,00 8,12 11,06 16,22 4,56 8,46 11,59 16,61 5,25 8,74 12,00 17,26 5,73 8,95 12,79 18,75 6,26 9,13 13,23 19,40 6,66 9,35 13,60 23,30 6,86 9,77 13,85
7,39 9,80 14,69 7,59 10,53 14,71 7,44 10,76 15,99
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.