ESTATÍSTICA DESCRITIVA
Distribuição de frequência
Distribuição de frequência: tabela com classes ou intervalos de entrada de dados com um número total de entradas em cada classe.
Frequência (f): número de entrada de dados na classe.
Limite inferior da classe: menor número que pode pertencer à classe.
Limite superior da classe: maior número que pode pertencer à classe.
Amplitude da classe: diferença entre os limites inferiores ou superiores de classes consecutivas.
Amplitude total: diferença entre o máximo e o mínimo das entradas de dados.
Distribuição de frequência
Técnica:
1) Divida o número de classes entre 5 e 20;
2) Determine a amplitude da classe: determine a amplitude total dos dados, divida pelo número de classes e arredonde para cima;
3) Limites das classes: use a entrada mínima dos dados como limite inferior da primeira classe, adicione a amplitude da classe para obter os demais limites;
4) Conte os números de cada entrada de dado na linha da classe;
Distribuição de frequência
Ex 1: Tempo em minutos que 50 assinantes da internet gastaram na conexão quando Cristiano Araújo faleceu. Construa uma distribuição de frequência com 7 classes.
50 40 41 17 11 7 22 44 28 21 19 23 37 51 54 42 88 41 78 56 72 56 17 7 69 30 80 56 29 33 46 31 39 20 18 29 34 59 73 77 36 39 30 62 54 67 39 31 53 44
Distribuição de frequência
Ponto médio de uma classe ou característica da classe: metade da soma entre os limites inferior e superior da classe.
Frequência relativa de uma classe: porcentagem dos dados que entra nesta classe.
(f da classe/n tamanho da amostra)
Frequência cumulativa de uma classe: soma da frequência de uma classe com a das anteriores. A frequência cumulativa da última classe é igual ao tamanho da amostra n.
Gráficos das distribuições de frequência
Histograma de frequência:
- Y: quantitativa, valores dos dados;
- X: frequências das classes;
Gráficos das distribuições de frequência
Polígono de frequência: gráfico em forma de linha (ligando os pontos médios) que enfatiza a mudança contínua nas frequências.
Histograma de frequência relativa: escala vertical mede as frequências relativas.
Gráfico de frequência cumulativa ou ogiva: linha poligonal mostrando frequência cumulativa de classe em seu limite superior.
Plote tronco-e-folha: cada número é separado em um tronco (dígitos mais à esquerda)e uma folha (dígitos mais à direita). Similar ao histograma, mas o gráfico contém os valores dos dados originais.
Plote de pontos: cada entrada é um ponto sobre o eixo horizontal.
Diagrama de pizza: dados qualitativos, forma de círculo mostrando as relações das partes como todo.
Gráficos das distribuições de frequência
155 159 144 129 105 145 126 116 130 114 122 112 112 142 126 118 118 108 122 121 109 140 126 119 113 117 118 109 109 119 139 139 122 78 133 126 123 145 121 134 124 119 132 133 124 129 112 126 148 147
Ex 2: Os números a seguir são os pontos por bolas rebatidas que os líderes da Liga Americana de beisebol obtiveram durante um período recente de 50 anos. Disponha os dados em uma tabela de tronco-e-folha. Tire conclusões.
Gráficos das distribuições de frequência
Tipo de veículo Número de mortos
Carros 20.818
Caminhões 12.001
Motocicletas 2.472
Outros 515
Ex: Ocupantes de veículos motorizados mortos em 2014, conforme tabela abaixo. Organize os dados em um diagrama de pizza.
Gráficos das distribuições de frequência
Diagrama de pareto: barras verticais, onde a altura de cada barra representa a frequência ou frequência relativa. As barras são posicionadas em ordem de altura decrescente. Torna visivelmente clara a relação ação/benefício, ou seja, prioriza a ação que trará o melhor resultado . (Figura fonte: Google)
Gráficos das distribuições de frequência
Dados emparelhados: 2 conjuntos de dados têm mesmo número de entradas e cada entrada do primeiro corresponde a uma entrada do segundo → mapa de dispersão → pares ordenados no gráfico como pontos de um plano de coordenadas. (Figura fonte: Google)
Gráficos das distribuições de frequência
Série temporal: conjuntos de dados tomados com intervalos regulares durante um período de tempo → gráfico de série temporal.
Medida de tendência central: valor que representa uma entrada típica, ou central, de um conjunto de dados. As mais usadas são: média, mediana e moda.
Média da população:
Média da amostra:
Média ponderada:
Mediana: dado no meio quando as entradas são colocadas em ordem crescente ou decrescente. Se o conjunto de dados tiver número par de entradas, a mediana será a média entre os dois pontos que estiverem no meio do conjunto.
Moda: entrada que ocorre com maior frequência. Se duas entradas ocorrem com mesma frequência elevada → dados bimodais.
Medidas de tendência central
Medidas de tendência central
Ex 3: Encontre a média, a mediana e a moda da seguinte amostra de idades de uma classe.
20 20 20 20 20 20 21 21 21 21 22 22 22 23 23 23 23 24 24 14
Medidas de tendência central
Média de uma distribuição de frequência:
x é o ponto médio de uma classe.
Medidas de tendência central
Definições de distribuição de frequência em gráficos:
- Simétrica: coincidem a média, mediana e moda. Traçamos linha vertical pelo ponto médio do gráfico e as duas metades forem .
- Uniforme (retangular): todas as entradas, ou classes, tiverem frequências iguais, também é simétrica!
- Assimétrica: se a “cauda” do gráfico se prolongar mais de um lado que de outro.
Negativamente assimétrica se a cauda ocorrer à esquerda, a média será menor que a mediana, que será menor que a moda.
Positivamente assimétrica se a cauda ocorrer à direita, a média será maior que a mediana, que será maior que a moda.
Amplitude total de conjunto de dados:
Amplitude total = (entrada máxima) – (entrada mínima) Desvio de uma entrada: diferença entre a entrada e a média.
Variância populacional: média dos quadrados dos desvios.
Desvio padrão populacional:
Medidas de
variação
Variância e desvio padrão amostrais:
Desvio padrão da amostra de uma distribuição de frequência:
Desvio padrão da amostra de uma distribuição de frequência:
Medidas de variação
Ex 4: Uma empresa contratou10 pessoas com curso superior. O salário inicial, por ano, é mostrado a seguir:
- Salário inicial na empresa (em milhares de reais)
Obtenha a amplitude total, desvio e desvio padrão populacional.
Medidas de variação
Sal 41 38 39 45 47 41 44 41 37 42
Medidas
de posiçãoQuartis: números que dividem em partes iguais um conjunto ordenado de dados Amplitude interquartil (AIQ) = Q3 – Q1
Plote Maria-Chiquinha: realça as partes importantes de um conjunto de dados.
trança
Q1 entrada
mín
entrada Q3 máx
Mediana, Q2 cabeça
trança
Medidas de posição
Fractil Ação Variável
Quartis Divide em 4 partes iguais Qn
Decis Divide em 10 partes iguais Dn Percentis Divide em 100 partes iguais Pn
Escore padrão ou escore → número de desvios padrão no qual está um valor dado x a partir da média.