Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherAula 2 – Cap 02
Estatística Descritiva
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherestudaremos formas de organizar e
descrever conjuntos de dados. O objetivo
é tornar os dados mais compreensíveis
de modo a enxergar neles tendências,
médias e variações.
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherDados etários da população de
Akhiok-Alasca
63 56 55 54 53 52 51 50 50 49 48 47 46 45 42 41 39 36 34 33 33 32 32 31 31 30 29 28 28 27 27 26 25 25 24 23 22 21 21 17 17 16 16 15 13 12 12 11 11 11 10 10 10 9 8 8 7 7 6 6 6 6 5 5 5 4 4 4 3 3 2 2 2 1 1 1 0Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherDistribuição de freqüência e seus gráficos
Distribuição de freqüências é uma tabela que mostra
classes
ou intervalo de entrada de dados com um número
total de entradas em cada classe. A freqüência f de uma
classe é o número de entrada de dados na classe.
As classes possuem
amplitudes iguais e cada
classe possui um
limite inferior da classe
, que
é menor número que pode
pertencer à
classe, e o
limite superior
que é o maior
número que pode pertencer
a classe.
4 26-30 5 21-25 8 16-20 6 11-15 8 6-10 5 1-5 Frequência, f ClasseEstatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherAmplitude das classes: Distância entre os limites inferiores (ou superiores) de classes consecutivas.
Amplitude total:
4
26-30
5
21-25
8
16-20
6
11-15
8
6-10
5
1-5
Frequência,f
Classe
O número de classes deve
estar entre 5 e 20.
Diferença entre o máximo e o mínimo das entradas.
Amplitude total:
30 - 1 = 29
Amplitude das classes:
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macher102 124
108
86
103
82
71
104
112
118
87
95
103
116
85
122
87 100
105
97
107
67
78 125
109
99
105
99
101
92
Faça uma tabela de distribuição de freqüência com
5 classes.
Minutos/mês gastos na internet para 30 assinantes
Valores-chave:
Valor mínimo
=
Valor máximo
=
67
125
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macher4. Marque um risco | em cada entrada de dado na classe apropriada. 1. Decida o número de classes, que deve ficar entre 5 e 20.
2. Calcule a amplitude das classes.
3.
Calcule os limites das classes. (Para este problema use 5.)Primeiro calcule: amplitude total = valor máximo – mínimo. Em seguida, divida o resultado pelo número de classes. Por fim, arredonde até o
próximo número conveniente. (125 – 67)/5 = 11,6 (arredondado para 12)
O limite inferior da classe é o valor mais baixo que pertence a ela e o limite superior é o mais alto. Use o valor mínimo (67) como limite inferior da primeira classe.
Quando todos os valores estiverem marcados, conte os riscos em cada classe para determinar a freqüência dessa classe.
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherMínimo = 67, Máximo = 125
Número de classes = 5
Amplitude de classe = 12
5
| | | |
115 - 126
9
| | | | | | | |
103 - 113
8
| | | | | | |
91 - 102
5
| | | |
79 - 90
3
| | |
67 - 78
Freqüência
Riscos
Classe
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherPonto médio de uma classe: é a caracteristica de uma classe. É a metade da
soma entre os limites inferior e superior da classe
(limite inferior + limite superior) / 2
Freqüência relativa de uma classe: é a porção ou porcentagem dos dados
que entra nessa classe.
frel= (freqüência da classe) / (tamanho da amostra n)
Freqüência cumulativa de uma classe: é a soma da frequencia daquela
classe com a de todas as classes anteriores. A frequencia cumulativa da última classe é igual ao tamanho da amostra n.
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macher 0,17 0,30 0,27 (5 / 30) = 0,17 (3 / 30) = 0,10 Freqüência relativa ( f / n) 120,5 108 96,5 84,5 72,5 Ponto médio (67 + 78)/2 5 9 8 5 3 f 30 115-126 25 103-113 16 91-102 8 79-90 3 67-78 Freqüência cumulativa ClasseDefinições importantes
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherGráficos das distribuições
de freqüência
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherHistograma de freqüência
é um gráfico de barras que representa a distribuição de freqüência de um conjunto de dados. Um histograma possui as seguintes propriedades: 1 – A escala horizontal é quantitativa
2 – A escala vertical mede as freqüências das classes
3 – Barras consecutivas devem estar encostadas umas as outras Como as barras de freqüência devem se encostar elas começam e terminam na fronteira das classes, e não nos limites das classes.
Fronteira das classes são os números que separam as classes sem deixar uma falha entre elas.
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macher 126,5 114,5 102,5 90,5 78,5 66,5 9 8 7 6 5 4 3 2 1 0 5 9 8 5 3Tempo na internet
minutos 5 9 8 5 3 f 114,5–126,5 115-126 102,5–114,5 103-113 90,5–102,5 91-102 78,5–90,5 79-90 66,5–78,5 67-78 Fronteiras ClassePara determinar a fronteira de classe encontre a média do valor entre o
limite inferior da segunda classe e o limite superior da primeira classe. Subtraia este valor da fronteira inferior da primeira classe e some ao valor superior da primeira classe e assim sucessivamente para as outras classes.
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherPara traçar um polígono de freqüência marque o ponto médio no topo de cada barra. Conecte os pontos médios consecutivos. Estenda o polígono até os eixos.
9 8 7 6 5 4 3 2 1 0 5 9 8 5 3
Tempo na internet
minutos
72,5 84,5 96,5 108,5 120,5Polígono de freqüência
é um gráfico em forma de linha que enfatiza a mudança contínua nas freqüências.
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherApresenta em sua escala vertical as freqüências relativas.
Tempo na internet
minutos
Freqüência
relativa
0,30 0,20 0,10 0,10 0,17 0,27 0,30 0,17 66,5 78,5 90,5 102,5 114,5 126,5 0Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherUm gráfico de freqüência cumulativa (ou ogiva) mostra o número de valores, em um conjunto de dados, que são iguais ou inferiores a um dado valor x. 0 3 8 16 25 30 66,5 78,5 90,5 102,5 114,5 126,5 0 10 20 30
Freqüência
cumulativa
minutos
Tempo na internet
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherEstatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macher 102 124 108 86 103 82 71 104 112 118 87 95 103 116 85 122 87 100 105 97 107 67 78 125 109 99 105 99 101 92Diagrama de tronco e folhas
é similar ao histograma, mas com a vantagem de que o gráfico ainda contém os valores dos dados originais.
Se o valor mais baixo é 67 e o mais alto é 125,
o tronco vai de 6 a 12.
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macher 102 124 108 82 103 85 71 104 112 118 86 95 103 116 87 122 87 100 105 97 107 67 78 125 109 99 105 99 101 92Diagrama de tronco e folhas
6 | 7 7 | 1 8 8 | 2 5 6 7 7 9 | 2 5 7 9 9 10 | 0 1 2 3 3 4 5 5 7 8 9 11 | 2 6 8 12 | 2 4 5 Chave: 6|7 significa 67 tronco folhas
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macher 6 | 6 | 7 7 | 1 7 | 8 8 | 2 8 | 5 6 7 7 9 | 2 9 | 5 7 9 9 10 | 0 1 2 3 3 4 10 | 5 5 7 8 9 11 | 2 11 | 6 8 12 | 2 4 12 | 5 Chave: 6|7 significa 67 Dígitos da 1a linha 0 1 2 3 4 Dígitos da 2a linha 5 6 7 8 9 Dígitos da 1a linha 0 1 2 3 4 Dígitos da 2a linha 5 6 7 8 9Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherPlote de pontos
Em um plote de pontos cada entrada é desenhada, usando um ponto ●
sobre um eixo horizontal.
Um plote de pontos permite que se veja como os dados estão distribuídos e se determinem entradas específicas de dados.
66
76
86
96
106
116
126
minutos/mês na Internet
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherDiagrama de Pizza
tem a forma de um círculo que mostra as relações das partes como um todo.
Para encontrar o angulo central para uma entrada de dados multiplique 3600 pela frequência relativa da entrada de dados.
O orçamento da Nasa (em bilhões de dólares) dividido em
três categorias
Construa um diagrama de pizza para esses dados.
Vôo espacial humano
5,7
Tecnologia
5,9
Apoio às missões
2,7
Bilhões de US$
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherOrçamento da Nasa
(em bilhões de dólares)
Vôo espacial humano
40%
Total
Bilhões de US$
Vôo espacial humano
5,7
Tecnologia
5,9
Apoio às missões
2,7
14,3
Graus143
149
68
360
Apoio às missões 19% Tecnologia 41% 5,7 14,3 5,9 14,3Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherDiagrama de Pareto
é um gráfico de dados qualitativos no qual a altura de cada barra representa a freqüência ou a freqüência relativa. É frequentemente usado no contexto de negócios.
Exemplo: Recentemente uma industria varejista perdeu 45 milhões de dólares de seus ativos. Os dados das perdas são mostrados na tabela abaixo: 2,9 fraudes nas vendas 14,7 assaltos a lojas 15,6 furtos de funcionários 7,8 administrativas Valores (em milhões) Causas
Se você fosse o varejista qual causa escolheria para atacar primeiro?
0 2 4 6 8 10 12 14 16 18 administrativas furtos de funcionários assaltos a lojas fraudes nas vendas M il h õe s de d ó la re s
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macherGráficos de conjuntos de dados
emparelhados
Se dois conjuntos de dados têm o mesmo número de entradas e cada entrada do primeiro corresponde a uma entrada do segundo, eles são chamados de conjuntos de dados emparelhados.
Uma maneira de fazer o gráfico de dados emparelhados é usar um mapa de dispersão.
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her . Dr. Alys son Stei macheré um plote dos pares (x,y) de dados sendo a horizontal o eixo x e a vertical o eixo y.
Exemplo:
Na tabela abaixo temos a duração do vínculo empregatício e o salário anual correspondente de dez trabalhadores
28000 3 45100 9 39225 6 41650 7 43000 10 25000 2 27350 4 40000 8 32500 4 32000 5 Salário (R$) Permanência no emprego (anos)
Mapa de Dispersão
2 4 6 8 10 25000 30000 35000 40000 45000salario (em reais)
Estatística e Probabilidade
Prof. Dr. Alysson Steimac her Prof. Dr. Alysson Steimac herGráfico da série temporal
Exemplo:
Na tabela ao lado, número deassinantes de telefones celulares em milhões e o valor médio da conta mensal local.
41.24 86 1999 39.43 69.2 1998 42.78 55.3 1997 47.7 44 1996 51 33.8 1995 56.21 24.1 1994 61.48 16 1993 68.68 11 1992 72.74 7.6 1991 80.9 5.3 1990 89.3 3.5 1989 98.02 2.1 1988 96.83 1.2 1987 Conta média (em reais) Assinantes (em milhões) Ano
é um plote de um conjunto de entradas de dados tomadas a intervalos regulares durante um período de tempo.
1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 0 20 40 60 80 100
Assinantes (em milhoes)