Introdução à Estatística
Ementa:
1.1 – Coleta de Dados 1.2 – Amostragem
1.3 – Estatística Descritiva
1.4 – Medidas de Tendência Central 1.5 – Medidas de Dispersão
1.6 – Gráficos
1.1 – Coleta de Dados
• É a fase inicial de muitos estudos sociais,
tecnológicos, econômicos ou biológicos.
• Trata-se da escolha das unidades de análise que
serão consideradas no estudo, na determinação das características destas unidades que serão medidas e da logística do trabalho de campo.
• Conforme as necessidades, os dados serão
coletados através de amostragem ou de métodos de planejamento de experimentos.
Dados primários e secundários
Dados primários são aqueles dados que são coletados diretamente da fonte pelo pesquisador, através de questionários de pesquisa, entrevistas, etc.
Dados secundários são dados que foram coletados
por outras pessoas com outros propósitos, que você aproveita em sua pesquisa.
Unid.1 – Introdução à Estatística
Além da classificação entre primários e secundários, relativas à origem dos dados, eles ainda podem ser classificados como:
-Dados quantitativos: consistem de números que
representam contagens ou medidas.
-Dados qualitativos: são aqueles que podem ser
separados em diferentes categorias que se distinguem por alguma característica não numérica.
Unid.1 – Introdução à Estatística
Os dados quantitativos são separados em:
Dados contínuos: possuem um número infinito de
valores que podem ser associados a pontos em uma escala contínua de forma que não haja lacunas ou interrupções entre um ponto e o próximo.
Dados discretos: possuem um número finito de
valores, sendo que não existem valores
Unid.1 – Introdução à Estatística
Os dados qualitativos são separados em:
Dados nominais: São caracterizados por dados que
consistem apenas em nomes, rótulos ou categorias. Os dados não podem ser dispostos em ordem.
Dados Ordinais: São dados que podem ser dispostos
em ordem, mas as diferenças entre os valores não podem ser determinados ou não têm sentido.
Dados intervalares: Semelhantes aos ordinais, onde
podemos determinar diferenças significativas entre os dados. Todavia, não existe um ponto de partida zero inerente, ou natural.
Unid.1 – Introdução à Estatística
Exemplos de classificação de dados:
Dados Quantitativos
Discretos Ovos postos por uma galinha. Acidentes em uma estrada.
Contínuos Peso de uma pessoa.
Comprimento de uma barra de aço.
Dados Qualitativos
Nominais Sexo dos estudantes de estatística.
Respostas do tipo “sim”, “não” ou “indeciso”.
Ordinais
Classificação de livros entre excelente, bom e ruim.
Ordem de chegada em uma corrida.
Intervalares
Os anos. (O tempo não começou no ano zero.
Portanto, 0 é arbitrário, e não um ponto de partida zero natural)
Unid.1 – Introdução à Estatística
– Tabelas de frequênciaVamos começar este tópico com um exemplo. Vamos considerar as alturas em centímetros de 30 atletas do sexo masculino de uma universidade:
168 172 170 181 169 173
164 175 182 177 176 173
170 186 183 170 168 166
169 180 175 164 181 179
Unid.1 – Introdução à Estatística
Estes dados são chamados de dados brutos, pois ainda não sofreram nenhum tipo de tratamento. Do jeito que estão têm pouca utilidade, passando-nos somente a informação de que são 30 dados. Colocando-os então em ordem crescente:
164 164 166 166 168 168
169 169 169 170 170 170
171 172 172 173 173 174
175 175 176 177 178 179
Unid.1 – Introdução à Estatística
Nesta forma, percebemos que o menor valor é 164 e o maior 186, fazendo com que a amplitude do conjunto de observações seja: 186-164 = 22cm.
Mesmo com esta separação, pode ser difícil
visualizar mais informações, principalmente se a quantidade de observações for muito grande.
Neste caso, seria melhor agrupar os dados em um certo número de classes, em uma tabela de
Unid.1 – Introdução à Estatística
A tabela de frequências relaciona categorias (ou classes) de valores, juntamente com contagens (ou frequências) do número de valores que se enquadram em cada categoria.
Os limites inferiores de classes são os menores números que podem efetivamente pertencer às diferentes classes.
Os limites superiores de classes são os maiores números que podem efetivamente pertencer às classes.
Unid.1 – Introdução à Estatística
As fronteiras de classes são os números usados para separar as classes, mas sem as lacunas deixadas pelos limites de classe. A fronteira de duas classes é a média entre o limite superior de uma classe e o limite inferior da classe subseqüente.
Marcas de classe são o ponto médio das classes,
encontrados calculando-se a média entre os limites da classe.
Amplitude da classe é a diferença entre dois limites
Unid.1 – Introdução à Estatística
Para agruparmos os dados em uma tabela de frequência, seguimos os passos:
1 – Determinar o número de classes;
2 – Determinar a amplitude das classes;
3 – Escolher o limite inferior da primeira classe;
4 – Determinar os limites inferiores das demais classes;
5 – Determinar os limites superiores;
Unid.1 – Introdução à Estatística
1 – Determinar o número de classes:Não existe uma regra fixa para o número de classes. Alguns autores defendem a tese de que este número deve estar entre 5 e 25, sendo que normalmente são utilizadas as seguintes fórmulas de cálculo:
Neste curso utilizaremos a primeira equação.
) log( 32 , 3 1 n k n k
Unid.1 – Introdução à Estatística
2 – Determinar a amplitude das classesPara isso, devemos ter em mãos a amplitude do conjunto de dados, e então fazemos:
O resultado encontrado deve ser arredondado para cima, até um número conveniente. Isto garante que todos os elementos do conjunto de dados estarão incluídos na tabela. classes de número amplitude Classe da Amplitude
Unid.1 – Introdução à Estatística
3 – Escolher o limite inferior da primeira classeDeve-se tomar o menor valor do conjunto de dados ou algum valor menor mais próximo.
Deve-se tomar o cuidado para que a amplitude de todas as classes seja suficiente para receber todo o conjunto de dados.
Se necessário, pode-se aumentar a amplitude de cada classe ou mesmo o número de classes.
Unid.1 – Introdução à Estatística
4 – Determinar os limites inferiores das demais classes:
Basta somar a amplitude das classes ao limite inferior já encontrado.
Coloca-se cada limite inferior em uma linha da tabela de frequência.
5 – Determine os limites superiores
Coloca-se na tabela os limites superiores, que são os maiores números que podem ser representados na classe ou o limite inferior da próxima classe.
Unid.1 – Introdução à Estatística
6 – Realizar a contagem dos dados de cada classeConte os dados do conjunto de dados original, separando-os por classe de acordo com seu valor.
Os valores totais da contagem serão a tabela de frequência, que ainda pode se apresentar na forma percentual, aplicando-se a seguinte fórmula:
elementos de Total X Classe da Frequência % F
Unid.1 – Introdução à Estatística
Exemplo:Para os dados dos atletas:
Passo 1 – Número de classes:
164 164 166 166 168 168 169 169 169 170 170 170 171 172 172 173 173 174 175 175 176 177 178 179 180 181 181 182 183 186 classes k n k 6 48 , 5 30
Unid.1 – Introdução à Estatística
Passo 2 – Amplitude das classesArredondamos o valor para 4.
Passo 3 – Limite Inferior
O menor valor da tabela é 164. Se tomarmos ele como limite inferior, no outro extremo da escala teremos 6*4+164=188.
Para centralizarmos os dados na amplitude
calculada, dividimos a sobra (2cm) nos extremos da tabela: Limite inferior = 163.
6666666 , 3 6 164 -186 Classe da Amplitude
Unid.1 – Introdução à Estatística
4 – Limites inferiores das demais classes:Tomando como base o primeiro limite inferior, somamos 4 a cada limite para encontrarmos o próximo. Assim: Lim. Inferior 163 167 171 175 179 183
Unid.1 – Introdução à Estatística
Passo 5 – Limites superiores:Basta buscar o limite inferior da classe seguinte. A última classe é obtida somando-se 4 ao limite superior da classe anterior.
Lim. Inferior Lim. Sup. 163 167 167 171 171 175 175 179 179 183 183 187
Unid.1 – Introdução à Estatística
Passo 6 – ContagemContamos os dados da tabela e os colocamos nas classes correspondentes. Lim. Inferior Lim. Sup. n 163 167 | | | | 4 167 171 | | | | | | | | 8 171 175 | | | | | | 6 175 179 | | | | | 5 179 183 | | | | | 5 183 187 | | 2 Total 30
Unid.1 – Introdução à Estatística
Podemos também representar a tabela de frequências em forma de percentual. Para isso, basta dividir cada valor pelo número total de observações:
Lim. Inferior Lim. Sup. n f (%) 163 167 | | | | 4 0,133 167 171 | | | | | | | | 8 0,267 171 175 | | | | | | 6 0,20 175 179 | | | | | 5 0,167 179 183 | | | | | 5 0,167 183 187 | | 2 0,067 Total 30 1,000
Unid.1 – Introdução à Estatística
Também podemos construir uma tabela de
frequências acumulada, fazendo cada linha igual à soma de todas as anteriores:
Lim. Inferior Lim. Sup. n f (%) fa(%) 163 167 | | | | 4 0,133 0,133 167 171 | | | | | | | | 8 0,267 0,400 171 175 | | | | | | 6 0,20 0,600 175 179 | | | | | 5 0,167 0,767 179 183 | | | | | 5 0,167 0,933 183 187 | | 2 0,067 1,000 Total 30 1,000
Unid.1 – Introdução à Estatística
Observe que, ao construir uma tabela de frequências, os dados originais são codificados de tal forma que não é mais possível restaurar os valores individuais dos elementos.
Desta forma, considera-se que há perda de
informação ao gerar a tabela (mas ganha-se pela
compactação dos dados e visualização mais
Unid.1 – Introdução à Estatística
Exercício:1) Trinta estudantes foram submetidos a um exame de estatística, obtendo as seguintes notas:
Construa a tabela de distribuição de freqüências absoluta e acumulada para este conjunto de dados.
70 76 76 77 77 78 80 81 81 83 83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99
1.2 – Amostragem:
Em estatística, define-se população como a coleção
de todas as observações potenciais sobre
determinado fenômeno.
O conjunto de dados realmente observados, ou extraídos, constitui uma amostra da população. É sobre a amostra que se desenvolvem os estudos,
visando à produção de inferências sobre a
população.
População, Estatística e Amostra
Iniciaremos o estudo definindo formalmente alguns conceitos básicos da estatística:
-População: É uma coleção completa de todos os
elementos (valores, pessoas, medidas, etc) a serem estudados;
-Amostra: É uma sub coleção de elementos extraídos
de uma população;
-Censo: É uma coleção de dados relativos a todos os
elementos de uma população.
Unid.1 – Introdução à Estatística
-Parâmetro: É uma medida numérica que descreve
uma característica de uma população;
-Estatística: É uma medida numérica que descreve
uma característica de uma amostra.
População Amostra Parâmetros Estatísticas Média Desvio padrão Proporção etc. Média Desvio padrão Proporção etc. Inferência
Unid.1 – Introdução à Estatística
Exemplos:
População Amostra
Altura de todos os alunos da faculdade. Altura dos alunos da sala 318.
Quantidade de carros que passam por um cruzamento em um dia.
Número de carros que passam por um cruzamento em 1 hora.
Produção mensal de uma fábrica. Produção de 1 dia de uma fábrica.
N° de notas fiscais emitidas em 2007. Notas fiscais emitidas em Julho/2007.
Ph de todos os vinhos produzidos no Brasil em 2007.
Ph de 300 garrafas de vinho produzidas no Brasil em 2007.
Exercício:
Classifique os dados entre contínuos e discretos:
Unid.1 – Introdução à Estatística
1 – Número de jogadores convocados para a seleção brasileira 2 – Massa da terra
3 – Nº de alunos da sala
4 – Peso médio das mulheres da sala
5 – Número de faturas emitidas na semana pelo comércio 6 – Valor das faturas emitidas pelo comércio
7 – Idade média da população de Ipatinga
8 – Número de carros emplacados em Ipatinga em 2003
9 – Volume de água despejado pelas chuvas de janeiro/2004 10 – Diâmetro de uma bola de futebol em centímetros
1.3 – Estatística Descritiva
É a parte mais conhecida da Estatística.
Freqüentemente somos bombardeados com médias, índices e gráficos na descrição de uma realidade social ou econômica.
No entanto, seu conceito é mais amplo.
Na realidade, nunca devemos fazer análises
estatísticas baseadas em modelos sofisticados sem uma prévia descrição dos dados.
Exemplos:
- O INPC, construído pelo IBGE, é um índice da
maior importância em nossa sociedade. Sua
construção envolve a sintetização, em um único número, dos aumentos dos produtos de uma cesta básica. Seu processo de cálculo é um sucessivo cálculo de médias.
- Anuário Estatístico Brasileiro, publicado a cada
ano pelo IBGE, sintetiza os mais diver-sos dados sobre o Brasil em tabelas fáceis de se entender.
1.4 – Medidas de Tendência Central
Uma medida de tendência central é um valor no centro ou no meio de um conjunto de dados. Veremos nesta seção as seguintes medidas de tendência central:
- Média aritmética simples;
- Média aritmética ponderada; - Mediana;
- Moda.
1.4.1 – Média Aritmética Simples
A média aritmética simples é, de modo geral, a mais importante de todas as mensurações numéricas descritivas. Ela é definida como o centro do conjunto de dados, no sentido de que é um ponto de equilíbrio dos mesmos.
2 4
3
+1 -1
Definição:
A média aritmética simples de um conjunto de dados é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores.
Esta definição é melhor expressa pela fórmula abaixo: ou n x x n i i 1 n x x
Uma distinção importante deve ser feita com relação à representação das estatísticas e dos parâmetros. Via de regra, os valores das estatísticas são representados por letras do alfabeto latino, enquanto que parâmetros populacionais são representados por letras gregas. Exemplos:
População Amostra
Média µ x
Desvio Padrão σ s
Tamanho do conjunto de dados N n
Exemplo:
1) Calcule a média aritmética simples da seguinte amostra de dados:
10 29 26 28 15 23 17 25 0 20
Resolução:
Como se trata de uma amostra de dados, utilizamos as representações da amostra: 3 , 19 10 193 10 20 0 25 17 23 15 28 26 29 10 1
x n x x n i iOutro conceito importante a ser abordado é o
arredondamento de valores. Sempre que for necessário arredondar algum valor, valerão as seguintes regras:
-Se o algarismo a se arredondar for menor que 5,
mantemos o penúltimo algarismo;
-Se o algarismo a se arredondar for maior que 5,
somamos 1 ao penúltimo algarismo;
-Se o algarismo a se arredondar for 5, fazemos com
que o penúltimo algarismo seja par.
Exemplos:
Arredonde o valor 1,594066935 para: a) 0 casas decimais:
1,594066935 → 2 (o penúltimo dígito tem que ser par quando o último é 5)
b) 1 casa decimal:
1,594066935 → 1,6 (o último dígito é maior que 5) c) 2 casas decimais:
1,594066935 → 1,59 (o último dígito é menor que 5)
1.4.2 – Média aritmética ponderada
Em alguns casos, os valores dos dados têm graus de importância diferentes, o que nos leva a calcular a média ponderada destes dados. Esta média é também uma média, mas afetada pelos diferentes pesos de cada valor: ou
n i i n i i i p x p x 1 1 ) . (
p x p x ( . )Exemplo:
Dada a amostra abaixo, calcule a média das 5 notas de prova abaixo, sabendo que as 4 primeiras têm peso 15 e a última tem peso 40.
Notas: 85 90 75 80 95 Resolução: 5 , 87 100 8750 40 15 15 15 15 95 . 40 80 . 15 75 . 15 90 . 15 85 . 15 ) . (
x p x p x1.4.3 – Mediana
A Mediana de um conjunto de valores é o valor do meio deste conjunto, quando os valores estão dispostos em ordem crescente (ou decrescente). A
Mediana é representada geralmente por . Para
calcular a Mediana:
- Coloque os dados em ordem crescente;
- Se o número de dados é ímpar, a mediana será o
valor do meio da lista.
- Se o número de dados é par, a mediara será a média
dos dois valores do meio da lista.
x
~
Exemplos: Calcule a Mediana dos conjuntos de dados abaixo: a) 10 29 26 28 15 b) 500 600 800 5000 1000 500 Resolução: a) Colocando em ordem: 10 15 26 28 29
Como o número de dados é ímpar, a mediana será 26. b) Em ordem: 500 500 600 800 1000 5000
Como o número de dados é par, a mediana será: (600+800)/2 = 700.
1.4.4 – Moda
A moda de um conjunto de dados é o valor que ocorre com maior frequência. Quando dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda e o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda. Costuma-se denotar a moda por M.
Exemplos:
Determine a moda nos conjuntos de dados abaixo: a) 5 5 5 3 1 5 1 4 3 5
b) 1 2 2 2 3 4 5 6 6 6 7 9 c) 1 2 3 6 7 8 9 10
Solução:
a) A moda é 5 (ocorre 5 vezes)
b) As modas são 2 e 6 (3 vezes cada) c) Não há moda.
Exercício:
1) Trinta estudantes foram submetidos a um exame de estatística, obtendo as seguintes notas:
Determine a média, mediana e moda destes dados. 70 76 76 77 77 78 80 81 81 83
83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99
1.5 – Medidas de Variabilidade
Abordaremos a característica da variação em um conjunto de dados. Os seguintes conceitos chave serão apresentados:
-A variação se refere a quanto os valores diferem
entre si e pode ser medida;
-Conjuntos de dados com valores próximos entre si
possuem baixa medida de variação
-O desvio padrão é uma medida de variação
importante, e devemos saber calculá-lo e interpretá-lo corretamente.
Exemplo:
Atualmente, todos os bancos empregam a fila única em seu atendimento ao invés de filas separadas por caixa. Na época desta mudança, dois grandes bancos americanos tiveram seus tempos de fila medidos, sendo observados os seguintes valores:
Banco Jefferson Valley (fila única) 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7
Banco da Providência (filas múltiplas) 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10
De acordo com estes dados, ambos os bancos têm a mesma média de 7,15, a mesma mediana de 7,20 e a mesma moda de 7,7. Com base apenas nestas medidas de tendência central, podemos estabelecer qual modelo é o melhor? Não.
Observando os dados individuais, vemos que o banco Jefferson Valley possui tempos de espera com variação menor que o banco da Providência. Estudaremos agora justamente como medir esta variação.
1.5.1 – Amplitude, Range ou Intervalo
A amplitude é a diferença entre o maior e o menor
valor do conjunto de dados. Esta medida é
representada por A ou R.
O cálculo da amplitude é bastante fácil, mas como ele depende apenas do maior e menor valor do conjunto de dados, em geral ele não é tão bom quanto outras medidas de variação.
No exemplo dos bancos, a amplitude seria: Banco Jefferson Valley: A=7,7–6,5 = 1,2 min. Banco da Providência: A = 10–4,2 = 5,8 min.
1.5.2 – Desvio padrão
Se tomarmos o quadrado da diferença de cada valor para a média, tirarmos a média entre estes valores e em seguida tirar a raiz quadrada do valor obtido, teremos uma medida importante da estatística chamada de desvio padrão.
Ele é amplamente utilizado porque a sua unidade é sempre a mesma unidade do conjunto de dados.
A fórmula para o cálculo do desvio padrão de uma amostra é:
Como alternativa, podemos reescrever a fórmula acima da seguinte forma:
1 ) ( 2
n x x s ) 1 ( ) ( ) ( . 2 2
n n x x n sQuando os dados se referem à população, devemos calcular o desvio padrão com outra fórmula:
TOMAR CUIDADO: o valor no denominador é
diferente do cálculo do desvio padrão de uma amostra. Muitas calculadoras trazem ambas as formas de cálculo. Verificar no manual da sua qual a forma correta. N x )2 (
O desvio padrão é a medida de variabilidade mais utilizada. Quanto maior o desvio padrão, maior será a dispersão dos dados em torno da média.
s = 3 1 2 3 4 5 6 7 s = 1,0 1 2 3 4 5 6 7 s = 0,8 1 2 3 4 5 6 7 1 2 3 4 5 6 7 s = 0 7 6 5 4 3 2 1 0
O desvio-padrão cresce quando a dispersão dos dados aumenta
Exemplo: Desvio padrão dos bancos: Jefferson Valley Tempo (x) x (x-x)2 6,5 7,15 0,4225 6,6 7,15 0,3025 6,7 7,15 0,2025 6,8 7,15 0,1225 7,1 7,15 0,0025 7,3 7,15 0,0225 7,4 7,15 0,0625 7,7 7,15 0,3025 7,7 7,15 0,3025 7,7 7,15 0,3025 Banco da Providência Tempo (x) x (x-x)2 4,2 7,15 8,7025 5,4 7,15 3,0625 5,8 7,15 1,8225 6,2 7,15 0,9025 6,7 7,15 0,2025 7,7 7,15 0,3025 7,7 7,15 0,3025 8,5 7,15 1,8225 9,3 7,15 4,6225 10 7,15 8,1225
Para o banco Jefferson Valley:
Para o banco da Providência:
Pode-se ver novamente que a dispersão dos dados do banco da providência é muito maior.
min 48 , 0 2272222 , 0 9 0450 , 2 1 10 3025 , 0 3025 , 0 3025 , 0 ... 2025 , 0 3025 , 0 4225 , 0 1 ) ( 2 s n x x s min 82 , 1 318333333 , 3 9 8650 , 29 1 10 1225 , 8 6225 , 4 8225 , 1 ... 0625 , 3 7025 , 8 1 ) ( 2 s n x x s
1.5.3 – Variância
A variância é simplesmente o quadrado do desvio padrão. A razão para ela existir é que o desvio padrão nos fornece um significado físico para a dispersão, mas não um significado matemático. A variância nos fornece um significado matemático para a variação, sendo utilizada em diversas equações, enquanto carece de um significado físico.
As fórmulas para o cálculo da variância são as mesmas do desvio padrão. Inclusive, a variância é
representada pela sigla s2 ou σ2, dependendo se o
conjunto de dados se refere a uma amostra ou população. 1 ) ( 2 2
n x x s ) 1 ( ) ( ) ( . 2 2 2
n n x x n s N x 2 2
( ) Exemplo: Variância dos bancos: Jefferson Valley Tempo (x) x (x-x)2 6,5 7,15 0,4225 6,6 7,15 0,3025 6,7 7,15 0,2025 6,8 7,15 0,1225 7,1 7,15 0,0025 7,3 7,15 0,0225 7,4 7,15 0,0625 7,7 7,15 0,3025 7,7 7,15 0,3025 7,7 7,15 0,3025 Banco da Providência Tempo (x) x (x-x)2 4,2 7,15 8,7025 5,4 7,15 3,0625 5,8 7,15 1,8225 6,2 7,15 0,9025 6,7 7,15 0,2025 7,7 7,15 0,3025 7,7 7,15 0,3025 8,5 7,15 1,8225 9,3 7,15 4,6225 10 7,15 8,1225
Para o banco Jefferson Valley:
Para o banco da Providência:
Pode-se ver novamente que a dispersão dos dados do banco da providência é muito maior.
2 2 2 min 2272222 , 0 9 0450 , 2 1 10 3025 , 0 3025 , 0 3025 , 0 ... 2025 , 0 3025 , 0 4225 , 0 1 ) ( s n x x s 2 2 min 318333333 , 3 9 8650 , 29 1 10 1225 , 8 6225 , 4 8225 , 1 ... 0625 , 3 7025 , 8 1 ) ( s n x x s
1.5.5 – Coeficiente de Variação
Por vezes, é conveniente exprimir a variabilidade em
termos relativos. Toma-se, então, uma medida
relativa de variabilidade, comparando-se o desvio padrão com a média. Essa medida é o coeficiente de variação.
Como o desvio padrão e a média possuem a mesma unidade de medida, o coeficiente de variação é adimensional.
x s CV
Exemplo:
Calcule o coeficiente de variação para os bancos do início desta unidade.
Resolução: Para o Jefferson Valley, a média é 7,15 e
o desvio padrão 0,48: Já no banco da providência: % 713 , 6 ou 06713 , 0 15 , 7 48 , 0 x s CV % 5,45 2 ou 2545 , 0 15 , 7 82 , 1 x s CV
Unid.1 – Introdução à Estatística
Exercício:1) Trinta estudantes foram submetidos a um exame de estatística, obtendo as seguintes notas:
Determine a amplitude, variância, desvio padrão e coeficiente de variação destes dados.
70 76 76 77 77 78 80 81 81 83 83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99
1.6 – Gráficos
Gráficos são representações pictóricas dos dados, muito valiosas na visualização dos resultados. Nesta unidade veremos:
-Histograma
-Gráfico de barras
1.6.1 – Histograma
Utilizados para representar a distribuição de
frequências de dados contínuos.
Trata-se de um conjunto de retângulos com as bases sobre um eixo dividido de acordo com o tamanho das classes, centros nos pontos médios das classes e áreas proporcionais às frequências.
Exemplo: Com os dados das alturas dos atletas,
resumidos na tabela de frequência abaixo, construa o histograma dos dados.
Lim. Inferior Lim. Sup. n % 163 167 4 0,133 167 171 8 0,267 171 175 6 0,20 175 179 5 0,167 179 183 5 0,167 183 187 2 0,067 Total 30 1,000
Solução:
Basta calcular os centros das classes e plotar as barras com alturas proporcionais às contagens.
As barras se tocam entre as classes.
Com relação ao eixo vertical, podemos colocar tanto os valores das contagens como os valores das frequências (o gráfico não se altera por causa disso).
0 1 2 3 4 5 6 7 8 9 165 169 173 177 181 185
1.6.2 – Gráfico em Barras
Por vezes, os dados consistem em contagens, tais como o número de filhos em um conjunto de famílias, o número de acidentes de trânsito por dia – e não em mensurações em uma escala contínua. Se o número de valores distintos não é muito grande, constrói-se uma distribuição de frequência utilizando os próprios valores individuais como “Classes”, em lugar de intervalos de classes.
Neste gráfico, as barras não se tocam.
Exemplo:
Construir o gráfico de barras das frequências relativas do número de filhos por família em 25 domicílios de uma certa localidade.
N° de Filhos n f 0 1 0,04 1 4 0,16 2 10 0,40 3 6 0,24 4 2 0,08 5 2 0,08 Total 25 1,00 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0 1 2 3 4 5
Lim. Inf. da Classe Lim. Sup. da Classe n Freq. relativa (%) 70 75 1 3,3 75 80 5 16,7 80 85 7 23,3 85 90 6 20,0 90 95 8 26,7 95 100 3 10,0 Totais 30 100,0
Unid.1 – Introdução à Estatística
Exercício: Construa o histograma para a tabela de