Unidade 1 - Introdução à Estatística - 2013

(1)

Introdução à Estatística

(2)

Ementa:

1.1 – Coleta de Dados 1.2 – Amostragem

1.3 – Estatística Descritiva

1.4 – Medidas de Tendência Central 1.5 – Medidas de Dispersão

1.6 – Gráficos

(3)

1.1 – Coleta de Dados

• É a fase inicial de muitos estudos sociais,

tecnológicos, econômicos ou biológicos.

• Trata-se da escolha das unidades de análise que

serão consideradas no estudo, na determinação das características destas unidades que serão medidas e da logística do trabalho de campo.

• Conforme as necessidades, os dados serão

coletados através de amostragem ou de métodos de planejamento de experimentos.

(4)

Dados primários e secundários

Dados primários são aqueles dados que são coletados diretamente da fonte pelo pesquisador, através de questionários de pesquisa, entrevistas, etc.

Dados secundários são dados que foram coletados

por outras pessoas com outros propósitos, que você aproveita em sua pesquisa.

(5)

Unid.1 – Introdução à Estatística

Além da classificação entre primários e secundários, relativas à origem dos dados, eles ainda podem ser classificados como:

-Dados quantitativos: consistem de números que

representam contagens ou medidas.

-Dados qualitativos: são aqueles que podem ser

separados em diferentes categorias que se distinguem por alguma característica não numérica.

(6)

Unid.1 – Introdução à Estatística

Os dados quantitativos são separados em:

Dados contínuos: possuem um número infinito de

valores que podem ser associados a pontos em uma escala contínua de forma que não haja lacunas ou interrupções entre um ponto e o próximo.

Dados discretos: possuem um número finito de

valores, sendo que não existem valores

(7)

Unid.1 – Introdução à Estatística

Os dados qualitativos são separados em:

Dados nominais: São caracterizados por dados que

consistem apenas em nomes, rótulos ou categorias. Os dados não podem ser dispostos em ordem.

Dados Ordinais: São dados que podem ser dispostos

em ordem, mas as diferenças entre os valores não podem ser determinados ou não têm sentido.

Dados intervalares: Semelhantes aos ordinais, onde

podemos determinar diferenças significativas entre os dados. Todavia, não existe um ponto de partida zero inerente, ou natural.

(8)

Unid.1 – Introdução à Estatística

Exemplos de classificação de dados:

Dados Quantitativos

Discretos Ovos postos por uma galinha. Acidentes em uma estrada.

Contínuos Peso de uma pessoa.

Comprimento de uma barra de aço.

Dados Qualitativos

Nominais Sexo dos estudantes de estatística.

Respostas do tipo “sim”, “não” ou “indeciso”.

Ordinais

Classificação de livros entre excelente, bom e ruim.

Ordem de chegada em uma corrida.

Intervalares

Os anos. (O tempo não começou no ano zero.

Portanto, 0 é arbitrário, e não um ponto de partida zero natural)

(9)

Unid.1 – Introdução à Estatística

– Tabelas de frequência

Vamos começar este tópico com um exemplo. Vamos considerar as alturas em centímetros de 30 atletas do sexo masculino de uma universidade:

168 172 170 181 169 173

164 175 182 177 176 173

170 186 183 170 168 166

169 180 175 164 181 179

(10)

Unid.1 – Introdução à Estatística

Estes dados são chamados de dados brutos, pois ainda não sofreram nenhum tipo de tratamento. Do jeito que estão têm pouca utilidade, passando-nos somente a informação de que são 30 dados. Colocando-os então em ordem crescente:

164 164 166 166 168 168

169 169 169 170 170 170

171 172 172 173 173 174

175 175 176 177 178 179

(11)

Unid.1 – Introdução à Estatística

Nesta forma, percebemos que o menor valor é 164 e o maior 186, fazendo com que a amplitude do conjunto de observações seja: 186-164 = 22cm.

Mesmo com esta separação, pode ser difícil

visualizar mais informações, principalmente se a quantidade de observações for muito grande.

Neste caso, seria melhor agrupar os dados em um certo número de classes, em uma tabela de

(12)

Unid.1 – Introdução à Estatística

A tabela de frequências relaciona categorias (ou classes) de valores, juntamente com contagens (ou frequências) do número de valores que se enquadram em cada categoria.

Os limites inferiores de classes são os menores números que podem efetivamente pertencer às diferentes classes.

Os limites superiores de classes são os maiores números que podem efetivamente pertencer às classes.

(13)

Unid.1 – Introdução à Estatística

As fronteiras de classes são os números usados para separar as classes, mas sem as lacunas deixadas pelos limites de classe. A fronteira de duas classes é a média entre o limite superior de uma classe e o limite inferior da classe subseqüente.

Marcas de classe são o ponto médio das classes,

encontrados calculando-se a média entre os limites da classe.

Amplitude da classe é a diferença entre dois limites

(14)

Unid.1 – Introdução à Estatística

Para agruparmos os dados em uma tabela de frequência, seguimos os passos:

1 – Determinar o número de classes;

2 – Determinar a amplitude das classes;

3 – Escolher o limite inferior da primeira classe;

4 – Determinar os limites inferiores das demais classes;

5 – Determinar os limites superiores;

(15)

Unid.1 – Introdução à Estatística

1 – Determinar o número de classes:

Não existe uma regra fixa para o número de classes. Alguns autores defendem a tese de que este número deve estar entre 5 e 25, sendo que normalmente são utilizadas as seguintes fórmulas de cálculo:

Neste curso utilizaremos a primeira equação.

) log( 32 , 3 1 n k n k   

(16)

Unid.1 – Introdução à Estatística

2 – Determinar a amplitude das classes

Para isso, devemos ter em mãos a amplitude do conjunto de dados, e então fazemos:

O resultado encontrado deve ser arredondado para cima, até um número conveniente. Isto garante que todos os elementos do conjunto de dados estarão incluídos na tabela. classes de número amplitude Classe da Amplitude 

(17)

Unid.1 – Introdução à Estatística

3 – Escolher o limite inferior da primeira classe

Deve-se tomar o menor valor do conjunto de dados ou algum valor menor mais próximo.

Deve-se tomar o cuidado para que a amplitude de todas as classes seja suficiente para receber todo o conjunto de dados.

Se necessário, pode-se aumentar a amplitude de cada classe ou mesmo o número de classes.

(18)

Unid.1 – Introdução à Estatística

4 – Determinar os limites inferiores das demais classes:

Basta somar a amplitude das classes ao limite inferior já encontrado.

Coloca-se cada limite inferior em uma linha da tabela de frequência.

5 – Determine os limites superiores

Coloca-se na tabela os limites superiores, que são os maiores números que podem ser representados na classe ou o limite inferior da próxima classe.

(19)

Unid.1 – Introdução à Estatística

6 – Realizar a contagem dos dados de cada classe

Conte os dados do conjunto de dados original, separando-os por classe de acordo com seu valor.

Os valores totais da contagem serão a tabela de frequência, que ainda pode se apresentar na forma percentual, aplicando-se a seguinte fórmula:

elementos de Total X Classe da Frequência %  F

(20)

Unid.1 – Introdução à Estatística

Exemplo:

Para os dados dos atletas:

Passo 1 – Número de classes:

164 164 166 166 168 168 169 169 169 170 170 170 171 172 172 173 173 174 175 175 176 177 178 179 180 181 181 182 183 186 classes k n k 6 48 , 5 30    

(21)

Unid.1 – Introdução à Estatística

Passo 2 – Amplitude das classes

Arredondamos o valor para 4.

Passo 3 – Limite Inferior

O menor valor da tabela é 164. Se tomarmos ele como limite inferior, no outro extremo da escala teremos 6*4+164=188.

Para centralizarmos os dados na amplitude

calculada, dividimos a sobra (2cm) nos extremos da tabela: Limite inferior = 163.

6666666 , 3 6 164 -186 Classe da Amplitude  

(22)

Unid.1 – Introdução à Estatística

4 – Limites inferiores das demais classes:

Tomando como base o primeiro limite inferior, somamos 4 a cada limite para encontrarmos o próximo. Assim: Lim. Inferior 163 167 171 175 179 183

(23)

Unid.1 – Introdução à Estatística

Passo 5 – Limites superiores:

Basta buscar o limite inferior da classe seguinte. A última classe é obtida somando-se 4 ao limite superior da classe anterior.

Lim. Inferior Lim. Sup. 163 167 167 171 171 175 175 179 179 183 183 187

(24)

Unid.1 – Introdução à Estatística

Passo 6 – Contagem

Contamos os dados da tabela e os colocamos nas classes correspondentes. Lim. Inferior Lim. Sup. n 163 167 | | | | 4 167 171 | | | | | | | | 8 171 175 | | | | | | 6 175 179 | | | | | 5 179 183 | | | | | 5 183 187 | | 2 Total 30

(25)

Unid.1 – Introdução à Estatística

Podemos também representar a tabela de frequências em forma de percentual. Para isso, basta dividir cada valor pelo número total de observações:

Lim. Inferior Lim. Sup. n f (%) 163 167 | | | | 4 0,133 167 171 | | | | | | | | 8 0,267 171 175 | | | | | | 6 0,20 175 179 | | | | | 5 0,167 179 183 | | | | | 5 0,167 183 187 | | 2 0,067 Total 30 1,000

(26)

Unid.1 – Introdução à Estatística

Também podemos construir uma tabela de

frequências acumulada, fazendo cada linha igual à soma de todas as anteriores:

Lim. Inferior Lim. Sup. n f (%) fa(%) 163 167 | | | | 4 0,133 0,133 167 171 | | | | | | | | 8 0,267 0,400 171 175 | | | | | | 6 0,20 0,600 175 179 | | | | | 5 0,167 0,767 179 183 | | | | | 5 0,167 0,933 183 187 | | 2 0,067 1,000 Total 30 1,000

(27)

Unid.1 – Introdução à Estatística

Observe que, ao construir uma tabela de frequências, os dados originais são codificados de tal forma que não é mais possível restaurar os valores individuais dos elementos.

Desta forma, considera-se que há perda de

informação ao gerar a tabela (mas ganha-se pela

compactação dos dados e visualização mais

(28)

Unid.1 – Introdução à Estatística

Exercício:

1) Trinta estudantes foram submetidos a um exame de estatística, obtendo as seguintes notas:

Construa a tabela de distribuição de freqüências absoluta e acumulada para este conjunto de dados.

70 76 76 77 77 78 80 81 81 83 83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99

(29)

1.2 – Amostragem:

Em estatística, define-se população como a coleção

de todas as observações potenciais sobre

determinado fenômeno.

O conjunto de dados realmente observados, ou extraídos, constitui uma amostra da população. É sobre a amostra que se desenvolvem os estudos,

visando à produção de inferências sobre a

população.

(30)

População, Estatística e Amostra

Iniciaremos o estudo definindo formalmente alguns conceitos básicos da estatística:

-População: É uma coleção completa de todos os

elementos (valores, pessoas, medidas, etc) a serem estudados;

-Amostra: É uma sub coleção de elementos extraídos

de uma população;

-Censo: É uma coleção de dados relativos a todos os

elementos de uma população.

(31)

Unid.1 – Introdução à Estatística

-Parâmetro: É uma medida numérica que descreve

uma característica de uma população;

-Estatística: É uma medida numérica que descreve

uma característica de uma amostra.

População Amostra Parâmetros Estatísticas Média Desvio padrão Proporção etc. Média Desvio padrão Proporção etc. Inferência

(32)

Unid.1 – Introdução à Estatística

Exemplos:

População Amostra

Altura de todos os alunos da faculdade. Altura dos alunos da sala 318.

Quantidade de carros que passam por um cruzamento em um dia.

Número de carros que passam por um cruzamento em 1 hora.

Produção mensal de uma fábrica. Produção de 1 dia de uma fábrica.

N° de notas fiscais emitidas em 2007. Notas fiscais emitidas em Julho/2007.

Ph de todos os vinhos produzidos no Brasil em 2007.

Ph de 300 garrafas de vinho produzidas no Brasil em 2007.

(33)

Exercício:

Classifique os dados entre contínuos e discretos:

Unid.1 – Introdução à Estatística

1 – Número de jogadores convocados para a seleção brasileira 2 – Massa da terra

3 – Nº de alunos da sala

4 – Peso médio das mulheres da sala

5 – Número de faturas emitidas na semana pelo comércio 6 – Valor das faturas emitidas pelo comércio

7 – Idade média da população de Ipatinga

8 – Número de carros emplacados em Ipatinga em 2003

9 – Volume de água despejado pelas chuvas de janeiro/2004 10 – Diâmetro de uma bola de futebol em centímetros

(34)

1.3 – Estatística Descritiva

É a parte mais conhecida da Estatística.

Freqüentemente somos bombardeados com médias, índices e gráficos na descrição de uma realidade social ou econômica.

No entanto, seu conceito é mais amplo.

Na realidade, nunca devemos fazer análises

estatísticas baseadas em modelos sofisticados sem uma prévia descrição dos dados.

(35)

Exemplos:

- O INPC, construído pelo IBGE, é um índice da

maior importância em nossa sociedade. Sua

construção envolve a sintetização, em um único número, dos aumentos dos produtos de uma cesta básica. Seu processo de cálculo é um sucessivo cálculo de médias.

- Anuário Estatístico Brasileiro, publicado a cada

ano pelo IBGE, sintetiza os mais diver-sos dados sobre o Brasil em tabelas fáceis de se entender.

(36)

1.4 – Medidas de Tendência Central

Uma medida de tendência central é um valor no centro ou no meio de um conjunto de dados. Veremos nesta seção as seguintes medidas de tendência central:

- Média aritmética simples;

- Média aritmética ponderada; - Mediana;

- Moda.

(37)

1.4.1 – Média Aritmética Simples

A média aritmética simples é, de modo geral, a mais importante de todas as mensurações numéricas descritivas. Ela é definida como o centro do conjunto de dados, no sentido de que é um ponto de equilíbrio dos mesmos.

2 4

3

+1 -1

(38)

Definição:

A média aritmética simples de um conjunto de dados é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores.

Esta definição é melhor expressa pela fórmula abaixo: ou n x x n i i    1 n x x  

(39)

Uma distinção importante deve ser feita com relação à representação das estatísticas e dos parâmetros. Via de regra, os valores das estatísticas são representados por letras do alfabeto latino, enquanto que parâmetros populacionais são representados por letras gregas. Exemplos:

População Amostra

Média µ x

Desvio Padrão σ s

Tamanho do conjunto de dados N n

(40)

Exemplo:

1) Calcule a média aritmética simples da seguinte amostra de dados:

10 29 26 28 15 23 17 25 0 20

Resolução:

Como se trata de uma amostra de dados, utilizamos as representações da amostra: 3 , 19 10 193 10 20 0 25 17 23 15 28 26 29 10 1             



 x n x x n i i

(41)

Outro conceito importante a ser abordado é o

arredondamento de valores. Sempre que for necessário arredondar algum valor, valerão as seguintes regras:

-Se o algarismo a se arredondar for menor que 5,

mantemos o penúltimo algarismo;

-Se o algarismo a se arredondar for maior que 5,

somamos 1 ao penúltimo algarismo;

-Se o algarismo a se arredondar for 5, fazemos com

que o penúltimo algarismo seja par.

(42)

Exemplos:

Arredonde o valor 1,594066935 para: a) 0 casas decimais:

1,594066935 → 2 (o penúltimo dígito tem que ser par quando o último é 5)

b) 1 casa decimal:

1,594066935 → 1,6 (o último dígito é maior que 5) c) 2 casas decimais:

1,594066935 → 1,59 (o último dígito é menor que 5)

(43)

1.4.2 – Média aritmética ponderada

Em alguns casos, os valores dos dados têm graus de importância diferentes, o que nos leva a calcular a média ponderada destes dados. Esta média é também uma média, mas afetada pelos diferentes pesos de cada valor: ou



   _n i i n i i i p x p x 1 1 ) . (



 p x p x ( . )

(44)

Exemplo:

Dada a amostra abaixo, calcule a média das 5 notas de prova abaixo, sabendo que as 4 primeiras têm peso 15 e a última tem peso 40.

Notas: 85 90 75 80 95 Resolução: 5 , 87 100 8750 40 15 15 15 15 95 . 40 80 . 15 75 . 15 90 . 15 85 . 15 ) . (            



x p x p x

(45)

1.4.3 – Mediana

A Mediana de um conjunto de valores é o valor do meio deste conjunto, quando os valores estão dispostos em ordem crescente (ou decrescente). A

Mediana é representada geralmente por . Para

calcular a Mediana:

- Coloque os dados em ordem crescente;

- Se o número de dados é ímpar, a mediana será o

valor do meio da lista.

- Se o número de dados é par, a mediara será a média

dos dois valores do meio da lista.

x

~

(46)

Exemplos: Calcule a Mediana dos conjuntos de dados abaixo: a) 10 29 26 28 15 b) 500 600 800 5000 1000 500 Resolução: a) Colocando em ordem: 10 15 26 28 29

Como o número de dados é ímpar, a mediana será 26. b) Em ordem: 500 500 600 800 1000 5000

Como o número de dados é par, a mediana será: (600+800)/2 = 700.

(47)

1.4.4 – Moda

A moda de um conjunto de dados é o valor que ocorre com maior frequência. Quando dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda e o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda. Costuma-se denotar a moda por M.

(48)

Exemplos:

Determine a moda nos conjuntos de dados abaixo: a) 5 5 5 3 1 5 1 4 3 5

b) 1 2 2 2 3 4 5 6 6 6 7 9 c) 1 2 3 6 7 8 9 10

Solução:

a) A moda é 5 (ocorre 5 vezes)

b) As modas são 2 e 6 (3 vezes cada) c) Não há moda.

(49)

Exercício:

Determine a média, mediana e moda destes dados. 70 76 76 77 77 78 80 81 81 83

83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99

(50)

1.5 – Medidas de Variabilidade

Abordaremos a característica da variação em um conjunto de dados. Os seguintes conceitos chave serão apresentados:

-A variação se refere a quanto os valores diferem

entre si e pode ser medida;

-Conjuntos de dados com valores próximos entre si

possuem baixa medida de variação

-O desvio padrão é uma medida de variação

importante, e devemos saber calculá-lo e interpretá-lo corretamente.

(51)

Exemplo:

Atualmente, todos os bancos empregam a fila única em seu atendimento ao invés de filas separadas por caixa. Na época desta mudança, dois grandes bancos americanos tiveram seus tempos de fila medidos, sendo observados os seguintes valores:

Banco Jefferson Valley (fila única) 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7

Banco da Providência (filas múltiplas) 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10

(52)

De acordo com estes dados, ambos os bancos têm a mesma média de 7,15, a mesma mediana de 7,20 e a mesma moda de 7,7. Com base apenas nestas medidas de tendência central, podemos estabelecer qual modelo é o melhor? Não.

Observando os dados individuais, vemos que o banco Jefferson Valley possui tempos de espera com variação menor que o banco da Providência. Estudaremos agora justamente como medir esta variação.

(53)

1.5.1 – Amplitude, Range ou Intervalo

A amplitude é a diferença entre o maior e o menor

valor do conjunto de dados. Esta medida é

representada por A ou R.

O cálculo da amplitude é bastante fácil, mas como ele depende apenas do maior e menor valor do conjunto de dados, em geral ele não é tão bom quanto outras medidas de variação.

No exemplo dos bancos, a amplitude seria: Banco Jefferson Valley: A=7,7–6,5 = 1,2 min. Banco da Providência: A = 10–4,2 = 5,8 min.

(54)

1.5.2 – Desvio padrão

Se tomarmos o quadrado da diferença de cada valor para a média, tirarmos a média entre estes valores e em seguida tirar a raiz quadrada do valor obtido, teremos uma medida importante da estatística chamada de desvio padrão.

Ele é amplamente utilizado porque a sua unidade é sempre a mesma unidade do conjunto de dados.

(55)

A fórmula para o cálculo do desvio padrão de uma amostra é:

Como alternativa, podemos reescrever a fórmula acima da seguinte forma:

1 ) ( 2   



n x x s ) 1 ( ) ( ) ( . 2 2   



n n x x n s

(56)

Quando os dados se referem à população, devemos calcular o desvio padrão com outra fórmula:

TOMAR CUIDADO: o valor no denominador é

diferente do cálculo do desvio padrão de uma amostra. Muitas calculadoras trazem ambas as formas de cálculo. Verificar no manual da sua qual a forma correta. N x )2 (



   

(57)

O desvio padrão é a medida de variabilidade mais utilizada. Quanto maior o desvio padrão, maior será a dispersão dos dados em torno da média.

s = 3 1 2 3 4 5 6 7 s = 1,0 1 2 3 4 5 6 7 s = 0,8 1 2 3 4 5 6 7 1 2 3 4 5 6 7 s = 0 7 6 5 4 3 2 1 0

O desvio-padrão cresce quando a dispersão dos dados aumenta

(58)

Exemplo: Desvio padrão dos bancos: Jefferson Valley Tempo (x) x (x-x)2 6,5 7,15 0,4225 6,6 7,15 0,3025 6,7 7,15 0,2025 6,8 7,15 0,1225 7,1 7,15 0,0025 7,3 7,15 0,0225 7,4 7,15 0,0625 7,7 7,15 0,3025 7,7 7,15 0,3025 7,7 7,15 0,3025 Banco da Providência Tempo (x) x (x-x)2 4,2 7,15 8,7025 5,4 7,15 3,0625 5,8 7,15 1,8225 6,2 7,15 0,9025 6,7 7,15 0,2025 7,7 7,15 0,3025 7,7 7,15 0,3025 8,5 7,15 1,8225 9,3 7,15 4,6225 10 7,15 8,1225

(59)

Para o banco Jefferson Valley:

Para o banco da Providência:

Pode-se ver novamente que a dispersão dos dados do banco da providência é muito maior.

min 48 , 0 2272222 , 0 9 0450 , 2 1 10 3025 , 0 3025 , 0 3025 , 0 ... 2025 , 0 3025 , 0 4225 , 0 1 ) ( 2                s n x x s min 82 , 1 318333333 , 3 9 8650 , 29 1 10 1225 , 8 6225 , 4 8225 , 1 ... 0625 , 3 7025 , 8 1 ) ( 2               s n x x s

(60)

1.5.3 – Variância

A variância é simplesmente o quadrado do desvio padrão. A razão para ela existir é que o desvio padrão nos fornece um significado físico para a dispersão, mas não um significado matemático. A variância nos fornece um significado matemático para a variação, sendo utilizada em diversas equações, enquanto carece de um significado físico.

(61)

As fórmulas para o cálculo da variância são as mesmas do desvio padrão. Inclusive, a variância é

representada pela sigla s2 ou σ2, dependendo se o

conjunto de dados se refere a uma amostra ou população. 1 ) ( 2 2   



n x x s ) 1 ( ) ( ) ( . 2 2 2   



n n x x n s N x 2 2 



(  ) 

(62)

Exemplo: Variância dos bancos: Jefferson Valley Tempo (x) x (x-x)2 6,5 7,15 0,4225 6,6 7,15 0,3025 6,7 7,15 0,2025 6,8 7,15 0,1225 7,1 7,15 0,0025 7,3 7,15 0,0225 7,4 7,15 0,0625 7,7 7,15 0,3025 7,7 7,15 0,3025 7,7 7,15 0,3025 Banco da Providência Tempo (x) x (x-x)2 4,2 7,15 8,7025 5,4 7,15 3,0625 5,8 7,15 1,8225 6,2 7,15 0,9025 6,7 7,15 0,2025 7,7 7,15 0,3025 7,7 7,15 0,3025 8,5 7,15 1,8225 9,3 7,15 4,6225 10 7,15 8,1225

(63)

Para o banco Jefferson Valley:

Para o banco da Providência:

Pode-se ver novamente que a dispersão dos dados do banco da providência é muito maior.

2 2 2 min 2272222 , 0 9 0450 , 2 1 10 3025 , 0 3025 , 0 3025 , 0 ... 2025 , 0 3025 , 0 4225 , 0 1 ) (               s n x x s 2 2 min 318333333 , 3 9 8650 , 29 1 10 1225 , 8 6225 , 4 8225 , 1 ... 0625 , 3 7025 , 8 1 ) (              s n x x s

(64)

1.5.5 – Coeficiente de Variação

Por vezes, é conveniente exprimir a variabilidade em

termos relativos. Toma-se, então, uma medida

relativa de variabilidade, comparando-se o desvio padrão com a média. Essa medida é o coeficiente de variação.

Como o desvio padrão e a média possuem a mesma unidade de medida, o coeficiente de variação é adimensional.

x s CV 

(65)

Exemplo:

Calcule o coeficiente de variação para os bancos do início desta unidade.

Resolução: Para o Jefferson Valley, a média é 7,15 e

o desvio padrão 0,48: Já no banco da providência: % 713 , 6 ou 06713 , 0 15 , 7 48 , 0 _   x s CV % 5,45 2 ou 2545 , 0 15 , 7 82 , 1 _   x s CV

(66)

Unid.1 – Introdução à Estatística

Exercício:

Determine a amplitude, variância, desvio padrão e coeficiente de variação destes dados.

70 76 76 77 77 78 80 81 81 83 83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99

(67)

1.6 – Gráficos

Gráficos são representações pictóricas dos dados, muito valiosas na visualização dos resultados. Nesta unidade veremos:

-Histograma

-Gráfico de barras

(68)

1.6.1 – Histograma

Utilizados para representar a distribuição de

frequências de dados contínuos.

Trata-se de um conjunto de retângulos com as bases sobre um eixo dividido de acordo com o tamanho das classes, centros nos pontos médios das classes e áreas proporcionais às frequências.

(69)

Exemplo: Com os dados das alturas dos atletas,

resumidos na tabela de frequência abaixo, construa o histograma dos dados.

Lim. Inferior Lim. Sup. n % 163 167 4 0,133 167 171 8 0,267 171 175 6 0,20 175 179 5 0,167 179 183 5 0,167 183 187 2 0,067 Total 30 1,000

(70)

Solução:

Basta calcular os centros das classes e plotar as barras com alturas proporcionais às contagens.

As barras se tocam entre as classes.

Com relação ao eixo vertical, podemos colocar tanto os valores das contagens como os valores das frequências (o gráfico não se altera por causa disso).

(71)

0 1 2 3 4 5 6 7 8 9 165 169 173 177 181 185

(72)

1.6.2 – Gráfico em Barras

Por vezes, os dados consistem em contagens, tais como o número de filhos em um conjunto de famílias, o número de acidentes de trânsito por dia – e não em mensurações em uma escala contínua. Se o número de valores distintos não é muito grande, constrói-se uma distribuição de frequência utilizando os próprios valores individuais como “Classes”, em lugar de intervalos de classes.

Neste gráfico, as barras não se tocam.

(73)

Exemplo:

Construir o gráfico de barras das frequências relativas do número de filhos por família em 25 domicílios de uma certa localidade.

N° de Filhos n f 0 1 0,04 1 4 0,16 2 10 0,40 3 6 0,24 4 2 0,08 5 2 0,08 Total 25 1,00 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0 1 2 3 4 5

(74)

Lim. Inf. da Classe Lim. Sup. da Classe n Freq. relativa (%) 70 75 1 3,3 75 80 5 16,7 80 85 7 23,3 85 90 6 20,0 90 95 8 26,7 95 100 3 10,0 Totais 30 100,0

Unid.1 – Introdução à Estatística

Exercício: Construa o histograma para a tabela de