• Nenhum resultado encontrado

Resumo da Estatística Descritiva

N/A
N/A
Protected

Academic year: 2021

Share "Resumo da Estatística Descritiva"

Copied!
32
0
0

Texto

(1)

Resumo da

Estatística

(2)

O que é estatística?

Estatística

É a ciência de

c

oletar,

o

rganizar,

a

nalisar e interpreta

r

(3)

O que são dados?

Dados

Consistem em informações advindas de observações, contagens,

medidas ou respostas.

(4)

Exemplos de dados

sim

sim

sim

sim

sim

não

não

não

não

sim

1,70

1,60

1,72

1,50

1,70

1,71

1,80

1,48

4

4

3

4

4 1

4

4

4

2

5

3

KK

KC

CK

CK

CC

KK

CC

(5)

População

Coleção de todos os resultados, respostas, medições

ou contagens que são de interesse.

Amostra

(6)

Etapas da Estatística

Coleta de

dados

Organização

Análise

Tomada

de decisão

(7)

População

Amostra

Altura de todos alunos do colégio

Altura dos alunos da turma 23 do colégio

Carros que passam no posto de pedágio no

período de 24:00h

Carros que passam no posto de pedágio no

período de 11:00 às 12:00h

Produção de 30 dias de uma fábrica

Produção de 1 dia de uma fábrica

Número de notas fiscais emitidas em 2006 Número de notas fiscais emitidas em 1

mês do ano de 2006

PH dos vinhos produzidos na safra de

2006 no Brasil

PH dos vinhos de 800 garrafas da safra de

2006 no Brasil

Peso dos pacotes (1Kg) de macarrão

Peso de 300 pacotes de macarrão (1 kg) da

(8)

Parâmetro e estatística

Parâmetro

Um número que descreve uma característica

populacional

.

Estatística

(9)

Exemplo: distinguindo entre

parâmetro e estatística

Decida se o valor numérico descreve um parâmetro populacional

ou uma estatística amostral.

1.

Uma pesquisa recente de uma amostragem de MBAs revelou

que o salário médio de um MBA é superior a $ 82.000.

(Fonte: The Wall Street Journal.)

Solução:

Estatística amostral (a média de $ 82.000 é baseado em uma

parte da população).

(10)

Decida se o valor numérico descreve um parâmetro

populacional ou uma estatística amostral.

1.

O salário inicial dos 667 MBAs da University of Chicago

Graduate School of Business aumentou 8,5% desde o

ano passado.

Solução:

Parâmetro populacional (a porcentagem de 8,5% é

(11)

Notações de Medidas

n

N

Número de

elementos

p

proporção

s , s

x

σ

Desvio padrão

s

2

, s

2 x

σ

2

variância

μ

média

Estatísticas

(amostras)

Parâmetros

(população)

Medidas

p

x

(12)
(13)

Estatística

Estatística Descritiva

X

Estatística Inferencial

(14)

Estatística

Estatística Descritiva

X

Estatística Inferencial

S

0 5 10 15 20 Classes F.A. F.R. 10 - 20 2 0,02 20 - 30 4 0,04 30 - 40 6 0,06 40 - 50 12 0,11 50 - 60 10 0,09 60 - 70 25 0,24 70 - 80 12 0,11 80 - 90 19 0,18 90 - 100 7 0,07 100 - 110 5 0,05 110 - 120 3 0,03

média

moda

mediana

desvio médio

desvio padrão

assimetria

+ + classe 1 classe 2 100 90 80 70 60 50 + + classe 1 classe 2 + + ++ classe 1 classe 2 100 90 80 70 60 50

(15)

Objetos da

(16)
(17)

x

i

f

i

0

3

1

3

2

5

3

6

4

9

5

7

6

7

7

6

8

3

9

1

Tabela de

Distribuição de

Frequencia

Por Pontos

(18)

Tabela de

Distribuição de

Frequencia

Por Classes

x

i

f

i

0 | 5

3

5 | 10

13

10 | 15

52

15 | 20

16

20 | 25

5

(19)
(20)

Histograma

1 2 3 4 5 0 0.05 0.1 0.15 0.2 0.25 0.3

Traços passivo-agressivos

Escore, x

P

ro

ba

bi

li

da

de

, P

(x

)

Como a largura de cada barra é 1, a área de cada

barra é igual à probabilidade de um resultado em

(21)
(22)

Polígono de Frequência

Pode-se perceber que a frequência dos assinantes aumenta até

O gráfico deve

começar e terminar no

eixo horizontal, então

estenda o lado

esquerdo até o

tamanho de uma

classe antes do ponto

médio da primeira

classe e estenda o

lado direito até o

tamanho de uma

classe depois do ponto

médio da última

classe.

Uso de Internet

Tempo conectado (em minutos)

Fr

eq

nc

(23)

Ogiva

6.5 18.5 30.5 42.5 54.5 66.5 78.5 90.5

A partir da ogiva, pode-se perceber que aproximadamente 40

assinantes passaram 60 minutos ou menos conectados em sua

última sessão. O maior aumento no uso ocorre entre 30,5 minutos

e 42,5 minutos.

Uso de Internet

F

re

qu

ên

ci

a

cu

m

ul

at

iv

a

(24)

Gráfico de Pizza

Gráfico de pizza

Um círculo é dividido em vários setores, que

representam categorias

A área de cada setor é proporcional à frequência de cada

categoria

(25)

Gráfico de Pareto

Gráfico de Pareto

Um gráfico de barras verticais no qual a altura de cada

barra representa uma frequência ou uma frequência

relativa

As barras são posicionadas por ordem decrescente de

altura; a barra mais alta é posicionada à esquerda

Fr

eq

nc

(26)

Diagrama de Ramos e Folhas

Diagrama de ramos-e-folhas

Cada número é separado em um ramo e uma folha

Similar a um histograma

Ainda contém os valores dos dados originais

Dados: 21, 25, 25, 26, 27,

28, 30, 36, 36, 45

26

2 1 5 5 6 7 8

3 0 6 6

4 5

(27)

Diagrama de Pontos

Partindo do diagrama de pontos, pode-se perceber que

a maioria dos valores se agrupam entre 105 e 148 e que

o valor que mais ocorre é 126. Pode-se notar também

que 78 é um valor incomum.

155

159 144 129 105 145 126 116 130 114 122 112 112 142 126

156

118 108 122 121 109 140 126 119 113 117 118 109 109 119

139

139 122 78 133 126 123 145 121 134 124 119 132 133 124

129 112 126 148 147

(28)

Conforme o comprimento da pétala aumenta, o que

tende a acontecer com a largura?

Cada ponto no

esquema

disperso

representa o

comprimento e a

largura da pétala

de uma flor.

Conjunto de dados de Íris de Fisher

L

ar

gu

ra

d

a

p

ét

al

a

(e

m

m

il

ím

et

ro

s)

Diagrama de Dispersão

(29)

Diagrama Box-Plot

Desenhe um gráfico de caixa-e-bigodes que represente as 15

pontuações dos testes.

Lembre-se: Mín. = 5 Q

1

= 10 Q

2

= 15 Q

3

= 18

Máx. = 37

Solução:

Cerca de metade das notas estão entre 10 e 18. Olhando para o

comprimento do bigode direito, pode-se concluir que 37 é um

possível valor discrepante.

(30)

Média

Média de uma distribuição de probabilidade discreta

μ = ΣxP(x)

Cada valor de x é multiplicado por sua probabilidade

correspondente e os produtos são somados

(31)

Medidas de Dispersão

Variância de uma distribuição de probabilidade

discreta

σ

2

= Σ(x – μ)

2

P(x)

Desvio padrão de uma distribuição de probabilidade

discreta

2

(

x

)

2

P x

( )

(32)

Medidas de Posição

Fractis

Sumário

Símbolos

Quartis

Divide os dados em 4 partes

iguais

Q

1

, Q

2

, Q

3

Decis

Divide os dados em 10 partes

iguais

D

1

, D

2

, D

3

,…, D

9

Percentis

Divide os dados em 100

Referências

Documentos relacionados

De seguida, vamos adaptar a nossa demonstrac¸ ˜ao da f ´ormula de M ¨untz, partindo de outras transformadas aritm ´eticas diferentes da transformada de M ¨obius, para dedu-

29. Na especificação da receita e da despesa é utilizada a tabela de Medidas que consta do Anexo IV. O Orçamento inscrito em projetos e atividades abrange as despesas

Código Descrição Atributo Saldo Anterior D/C Débito Crédito Saldo Final D/C. Este demonstrativo apresenta os dados consolidados da(s)

A espectroscopia de Infravermelho Próximo foi utilizada para avaliar o ponto de início de precipitação dos asfaltenos extraídos por diferentes técnicas, como também

O populismo, depois de uma longa fase durante a qual se recusou a responder pelo nome, voltou a assumir protagonismo num Mundo ainda à procura de uma Nova Ordem Mundial. Muitos

Em relação ao hodierno contexto do lugar, é cada vez mais comum a eleição de um símbolo em particular por parte dos moradores de Ilha de Guaratiba, qual seja o Túnel da Grota

Nesse contexto, o presente estudo se propôs a investigar o processamento atencional na segunda infância e sua relação com o tipo de escola, analisando o desempenho

Dentre os problemas enfrentados pela empresa e que tem resultado em muita insatisfação por parte dos clientes, devoluções e perdas de receita se refere as falhas nas