Distribui¸
c˜
ao de Frequˆ
encia de Vari´
aveis
Quantitativas Cont´ınuas
(Tabelas e Gr´
aficos)
Prof. Gilberto Rodrigues Liska
UNIPAMPA
21 de Marc¸o de 2017
Material de Apoio
Sum´
ario
1 Introduc¸˜ao
Exemplo 1
Tabela 1:Informac¸˜ao do sexo (M=0,F=1), idade, peso, altura e renda (B=1, M=2 e A=3) e n´umero de faltas de 40 alunos de uma turma da UNIPAMPA, cˆampus Itaqui.
Id Sexo Idade(anos) Peso(Kg) Altura(m) Renda Faltas Id Sexo Idade(anos) Peso(Kg) Altura(m) Renda Faltas
1 1 23 62 1.610 1 1 21 0 18 54 1.803 2 1 2 0 24 57 1.624 2 2 22 0 19 65 1.811 3 2 3 1 20 73 1.647 2 0 23 1 19 75 1.816 2 0 4 1 20 80 1.656 3 1 24 1 26 74 1.826 3 1 5 0 18 70 1.677 2 2 25 0 21 66 1.827 1 2 6 0 19 61 1.692 2 3 26 0 19 67 1.828 2 3 7 1 23 89 1.698 2 0 27 0 22 83 1.829 1 0 8 1 21 64 1.713 2 1 28 0 18 84 1.841 3 1 9 1 21 65 1.716 1 2 29 1 25 72 1.842 2 2 10 1 22 71 1.717 1 1 30 1 24 74 1.853 1 1 11 0 20 73 1.731 1 0 31 0 26 66 1.861 2 0 12 1 22 71 1.749 1 2 32 0 23 70 1.887 2 2 13 1 26 70 1.750 1 2 33 0 19 72 1.889 3 2 14 0 22 62 1.752 1 0 34 1 23 73 1.891 1 0 15 0 20 67 1.753 2 5 35 1 26 86 1.898 2 5 16 0 21 68 1.758 3 2 36 0 27 71 1.904 3 2 17 1 24 61 1.785 2 1 37 0 27 77 1.915 2 1 18 0 19 68 1.786 2 3 38 1 18 57 1.921 2 3 19 0 23 59 1.799 2 2 39 1 24 67 1.929 2 2 20 1 19 66 1.802 3 3 40 0 25 73 1.977 2 3
1 Introduc¸˜ao
2 Vari´avel Quantitativa Cont´ınua
Representac¸˜ao tabular Representac¸˜ao gr´afica
Vari´
avel Quantitativa Cont´ınua
Tabela
• Os valores (dados) s˜ao distribu´ıdos em intervalos de classe. Assim, cada intervalo de classe ter´a um n´umero (frequˆencia absoluta e/ou relativa) associado a ela, o qual representa a quantidade (absoluta e/ou relativa) de valores daquela classe.
• A tabela resultante ´e denominada dedistribuic¸˜ao de frequˆencia por intervalo de classe. Tamb´em pode-se incluir na tabela os pontos m´edios de cada classe e a distribuic¸˜ao de frequˆencia acumulada (absoluta e/ou relativa).
Gr´aficos
• A partir da distribuic¸˜ao de frequˆencia por intervalo de classe podem ser constru´ıdos trˆes gr´aficos: Histograma, Pol´ıgono de frequˆencia e Ogiva.
(1) Determinar o n´umero de classes k, para a qual podem-se ser
utilizados os seguintes crit´erios:
• A familiaridade do pesquisador com os dados.
• Crit´erio baseado no n´umero de observac¸˜oes n.
Tabela 2:N´umero ideal de classes baseado no n´umero de observac¸˜oes
N´umero de Observac¸˜oes (n) N´umero de Classes
At´e 100 √n (Inteiro mais pr´oximo)
Procedimento de construc¸˜
ao de tabela de frequˆ
encia para
vari´
aveis quantitativas cont´ınuas.
(2) Determinar a Amplitude de Classe (C ): Que ´e a diferenc¸a entre os limites superior e inferior de uma determinada classe.
C = A
k − 1
em que A = xmax− xmin, xmax e xmin ´e o maior e menor valor observado da vari´avel X, respectivamente, e k ´e o n´umero de classes.
(3) Determinar o limite inferior da primeira classe (LI1): LI1= xmin−
C 2
(4) Determinar as Classes: Sejam LIi e LSi os limites inferior e superior da classe i , respectivamente. Logo
LI1= xmin− C 2 LS1= LI1+ C LI2= LS1 .. . LIi +1= LSi LSi +1= LIi +1+ C .. . LSk = LIk + C ou LSk = xmax+ C 2
Procedimento de construc¸˜
ao de tabela de frequˆ
encia para
vari´
aveis quantitativas cont´ınuas.
(5) Determinar o ponto m´edio da classe ( ¯Xi) e as Freq¨uˆencias
Absoluta (fi), Relativa (fri) e Percentual (fpi). ¯ Xi = LSi + LIi 2 fi = n X i =1 I{xi:xi⊂Ci}(xi) fri = fi n fpi = fri × 100% em que n P i =1
I{xi:xi⊂Ci}(xi) ´e o n´umero total de observac¸˜oes contidas
Tabela 3:Representac¸˜ao gen´erica de uma tabela de distribuic¸˜ao de Frequˆencias de uma vari´avel quantitativa cont´ınua, em que f representa a frequˆencia absoluta e F a frequˆencia acumulada absoluta. Da mesma forma obt´em-se as outras frequˆencias.
Classe X¯i f fr fp Fp [LI1; LS1) LS1+LI2 1 f1 fr 1 fp1 Fp1= fp1 [LI2; LS2) LS2+LI2 2 f2 fr 2 fp2 Fp2= fp1+ fp2 . . . ... ... ... ... ... [LIk; LSk) LSk+LI2 k fk frk fpk Fpk= fp1+ · · · + fpk TOTAL X =¯ Pk i =1fri× ¯Xi n 1, 00 100, 00% −
Exemplo 1
Exemplo 1
Com base na tabela 1:
(a) Construir a distribuic¸˜ao de frequˆencias da altura dos 40 alunos de uma turma da UNIPAMPA, cˆampus Itaqui (Tabela 1).
(b) Construir gr´aficos apropriados.
1,610 1,624 1,647 1,656 1,677 1,692 1,698 1,713 1,716 1,717 1,731 1,749 1,750 1,752 1,753 1,758 1,785 1,786 1,799 1,802 1,803 1,811 1,816 1,826 1,827 1,828 1,829 1,841 1,842 1,853 1,861 1,887 1,889 1,891 1,898 1,904 1,915 1,921 1,929 1,977
Exemplo 1 (a)
Contruir a tabela de distribuic¸˜ao de frequˆencia da vari´avel “Altura” da Tabela 1.
SOLUC¸ ˜AO:
• O n´umero de classes ´e dado por n = 40 ⇒ k =√40 ≈ 6.
• A amplitude da classe ´e dado por C = k−1A = 1,977−1,6106−1 = 0, 0734.
• O limite inferior da primeira classe ´e LI1= xmin−C2 = 1, 610 −0,07342 = 1, 573.
Exemplo 1 (a) (cont.)
• Com isso, podemos obter os outros limites: LS1 = LI1+ C = 1, 573 + 0, 0734 = 1, 647 LI2 = LS1 = 1, 647 LS2 = LI2+ C = 1, 647 + 0, 0734 = 1, 720 LI3 = LS2 = 1, 720 LS3 = LI3+ C = 1, 720 + 0, 0734 = 1, 793 LI4 = LS3 = 1, 793 LS4 = LI4+ C = 1, 7935 + 0, 0734 = 1, 867 LI5 = LS4 = 1, 867 LS5 = LI5+ C = 1, 867 + 0, 0734 = 1, 940 LI6 = LS5 = 1, 940 LS6 = LI5+ C = 1, 940 + 0, 0734 = 2, 014
¯ X1= LS1+ LI1 2 = 1, 573 + 1, 647 2 = 1, 610 ¯ X2= LS2+ LI2 2 = 1, 647 + 1, 720 2 = 1, 683
• Frequˆencia relativa: fr 1= f1 n = 2 40 = 0, 05 fr 2= f2 n = 8 40 = 0, 20
• Frequˆencia absoluta acumulada: F2 = f1+ f2 = 2 + 8 = 10 • Frequˆencia relativa acumulada:
Exemplo 1 (cont.)
Tabela 4:Distribuic¸˜ao de Frequˆencias da vari´avel altura em uma amostra de 40 alunos da UNIPAMPA.
Classe X¯i fi fri fpi Fi Fpi [1, 573; 1, 647) 1,610 2 0,05 5,00 2 5,00 [1, 647; 1, 720) 1,683 8 0,20 20,00 10 25,00 [1, 720; 1, 793) 1,757 8 0,20 20,00 18 45,00 [1, 793; 1, 867) 1,830 13 0,33 32,50 31 77,50 [1, 867; 1, 940) 1,904 8 0,20 20,00 39 97,50 [1, 940; 2, 014) 1,977 1 0,03 2,50 40 100,00 TOTAL 1, 793 40 1, 00 100, 00 − −
Com base nos dados da tabela de distribuic¸˜ao de frequˆencias por intervalo de classe, pode-se construir trˆes gr´aficos: histograma,
pol´ıgono de frequˆencia e ogiva.
Histograma Para cada intervalo de classe constr´oi-se colunas justa-postas (sem espac¸o) com altura equivalente a frequˆencia (absoluta ou relativa)
Pol´ıgono de Frequˆencia Trac¸ar uma linha cont´ınua que une os pares ordenados formados pelos pontos m´edios e frequˆencias. Ajuda a ter melhor ideia sobre simetria/achatamento da distribuic¸˜ao dos dados.
Ogiva Trac¸ar uma linha cont´ınua que une os pares ordenados forma-dos pelos limites de classe e frequˆencias acumuladas. Responde
a pergunta: Quantos elementos existem abaixo de um
Representac¸˜
ao gr´
afica de var. quantitativas cont´ınuas.
Histograma - Exemplo 1
Figura 1:Histograma da altura de 40 alunos da UNIPAMPA, cˆampus Itaqui.
Pol´ıgono de frequˆencias- Exemplo 1
Figura 2:Pol´ıgono de frequˆencias da altura de 40 alunos da UNIPAMPA, cˆampus Itaqui.
Exemplo 1 - No R
C´odigo em R ## E s t a t i s t i c a d e s c r i t i v a p a r a o s d a d o s de A l t u r a # p a r a chamar a r q u i v o e x t e r n o s i g a o s p a s s o s a s e g u i r #1o) mudar d i r e t o r i o : S e s s i o n #2o) s e t w o r k i n g d i r e c t o r y #3o) c h o o s e d i r e c t o r y #4o) e s c o l h e r p a s t a com a r q u i v o ” nome . t x t ” #a p o s mudar d i r e t o r i o , chamar o a r q u i v o## f a z e n d o o s h i s t o g r a m a com o s d a d o s de a l t u r a # numero de c l a s s e s h e a d ( a l u n i ) v a r=round ( a l u n i [ , 5 ] , 2 ) n=l e n g t h ( v a r ) #numero de o b s e r v a c o e s k=round ( s q r t ( n ) ) ; k #numero de c l a s s e s # a m p l i t u d e da c l a s s e v a r m i n=min ( v a r ) ; v a r m i n varmax=max ( v a r ) ; varmax c=(varmax−v a r m i n ) / ( k − 1 ) ; c # l i m i t e s d a s c l a s s e s L I 1=v a r m i n − c / 2 ; L I 1 LSk=varmax + c / 2 ; LSk L i m C l a s s=s e q ( L I 1 , LSk , c ) ; L i m C l a s s
Exemplo 1 - No R
C´odigo em R # h i s t o g r a m a h i s t ( v a r ) #v e r s a o p a d r a o do R h i s t ( v a r , b r e a k s=L i m C l a s s , c o l=r a i n b o w ( 8 ) ) h=h i s t ( v a r , b r e a k s=L i m C l a s s , c o l=” g r a y ” , main=” H i s t o g r a m a d a s a l t u r a s ” , x l a b=” p e s o s ” , y l a b=” F r e q u ˆe n c i a s a b s o l u t a s ” , a x e s=FALSE ) a x i s ( 1 , a t=L i m C l a s s , pos = −0.5) a x i s ( 2 , a t=s e q ( 0 , 3 0 , by =1)) #p o l i g o n o de f r e q u e n c i a p o i n t s ( h$ mids , h$ c o u n t s , t y p e=” l ” , l w d =2)C´odigo em R # p o n t o medio da c l a s s e s h$ m i d s h$ c o u n t s # f r e q u e n c i a a b s o l u t a f a=h$ c o u n t s f a # f r e q u e n c i a r e l a t i v a f r =f a /n f r #f r e q u e n c i a p e r c e n t u a l f p= f r ∗ 100 f p
Representac¸˜
ao gr´
afica de dados quantitativos
Interpretac¸˜ao do Histograma e Pol´ıgono de frequˆencias
1 Observar legendas dos eixos.
2 Observar as classes com as maiores e menores frequˆencias.
3 Analisar a simetria da distribuic¸˜ao da vari´avel (sim´etrica, assim´etrica a direita, assim´etrica a es-querda).
4 Analisar o achatamento (curtose) da distribuic¸˜ao da vari´avel (mesoc´urtica, platic´urtica, lep-toc´urtica).
Representac¸˜
ao gr´
afica de dados quantitativos
Figura 4:Tipos de achatamento.
Gr´afico de Ogiva - Exemplo 1
Figura 6:Gr´afico de Ogiva da altura de 40 alunos da UNIPAMPA, cˆampus Itaqui.
Representac¸˜
ao gr´
afica de dados quantitativos
Interpretac¸˜ao da Ogiva
1 Observar legenda dos eixos.
2 A partir de um valor do eixo x trace uma linha paralela ao eixo y at´e tocar a linha da ogiva. Verificar o valor da projec¸˜ao em y .
INTERPRETAC¸ ˜AO:Existem y valores abaixo do valor x .
EX.: Aproximadamente 50% dos alunos tem altura at´e 1, 80 metros.
3 A partir de um valor do eixo y trace uma linha paralela ao eixo x at´e tocar a linha da ogiva. Verificar o valor da projec¸˜ao em x .
INTERPRETAC¸ ˜AO:Existem x valores abaixo do valor y .
EX.: Abaixo de 1, 90 metros, existem aproximadamente 85% dos alunos.