• Nenhum resultado encontrado

Aula Introdutória Aula Introdutória

N/A
N/A
Protected

Academic year: 2022

Share "Aula Introdutória Aula Introdutória"

Copied!
38
0
0

Texto

(1)

Aula Introdutória Aula Introdutória

Autoria de

Prof. Carlos Alberto (Caio) Dantas

FORMATAÇÃO & DESIGN Cléber da Costa Figueiredo figuecl@usp.br Thiago Rodrigo Alves Carneiro thiagorodrigo@ime.usp.br

(2)

A Estatística originou-se com a coleta e construção de tabelas de dados para o governo.

A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística.

O Que é Estatística?

O Que é Estatística?

(3)

Estatística Estatística

População Características

Amostra

Informações contidas nos dados

Conclusões sobre as

características da população

Técnicas de amostragem

Análise descritiva Inferência

estatística

(4)

Amostragem Amostragem

É a area da Estatística que trata da obtenção de amostras que sejam

representativas da população

Exemplos de utilização: Pesquisa de Mercado, Pesquisa de opinião pública,

Ensaios de medicamentos e em

praticamente todo experimento.

(5)

Estatística

Estatística Descritiva Descritiva

A disponibilidade de uma

grande quantidade de dados e de métodos computacionais

muito eficientes revigorou esta

área da Estatística.

(6)

Inferência Estatística Inferência Estatística

A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a

população.

(7)

Probabilidade Probabilidade

A inferência estatística baseia-

se na Teoria das Probabilidades que constrói modelos para os

fenômenos aleatórios, isto é ,

aqueles em que está presente a

incerteza.

(8)

Exemplo: Intenção de

Exemplo: Intenção de voto voto

Numa pesquisa eleitoral, um

Instituto de Pesquisa procura, com base nos resultados de um

levantamento aplicado a uma amostra da população, prever o

resultado da eleição.

(9)

Considere o Candidato “A”

Considere o Candidato “A”

Denomine por a proporção de pessoas que votarão em “A” na eleição.

Denomine por a proporção de pessoas no levantamento de opinião (amostra) que expressam intenção de voto em “A”.

^ p

p

(10)

Podemos usar o valor de Podemos usar o valor de para estimar a proporção para estimar a proporção

da população.

da população.

p ^ p

Estimação

Estimação

(11)

Evolução da intenção de voto para prefeito de São Paulo Evolução da intenção de voto para prefeito de São Paulo realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno).

realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno).

Pesquisa contratada pela TV Globo, em % do total de votos.Pesquisa contratada pela TV Globo, em % do total de votos.

A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com

95% de confiança.

95% de confiança.

(12)
(13)

Estatística Descritiva Estatística Descritiva

Etapa inicial da análise utilizada para descrever e

resumir os dados

(14)

Exemplo Exemplo

Arquivo

Arquivo Pulse Pulse do Minitab do Minitab

Refere-se a um experimento feito por alunos.

Cada aluno registrou sua altura, peso, sexo, hábito de fumar, nível de atividade física

usual e pulsação em repouso.

Então todos eles jogaram moedas e aqueles que tiraram cara fizeram corrida estacionária

por um minuto.

Depois disso todos os alunos mediram

novamente sua pulsação.

(15)

Informações do arquivo

Informações do arquivo Pulse Pulse

Information of the worksheet Information of the worksheet

Column Count

Column Count Name Name C1 92 Pulse1 C1 92 Pulse1 C2 92 Pulse2 C2 92 Pulse2

C3 92 Ran (1:correu, 2:não correu) C3 92 Ran (1:correu, 2:não correu)

C4 92 Smokes (1:fumante, 2:não fumante) C4 92 Smokes (1:fumante, 2:não fumante)

C5 92 Sex (1:masculino, 2:feminino) C5 92 Sex (1:masculino, 2:feminino)

C6 92 Height C6 92 Height C7 92 Weight C7 92 Weight

C8 92 Activity (1:leve, 2:moderada, 3:forte) C8 92 Activity (1:leve, 2:moderada, 3:forte)

(Pulsação antes de correr) (Pulsação antes de correr) (Pulsação depois de correr) (Pulsação depois de correr)

MTB > INFO

MTB > INFO

(16)

Pulse1 Pulse2 Ran Smokes Sex Height Weight ActivityPulse1 Pulse2 Ran Smokes Sex Height Weight Activity 64 88 1 2 1 66.00 140 2

64 88 1 2 1 66.00 140 2 58 70 1 2 1 72.00 145 2 58 70 1 2 1 72.00 145 2 62 76 1 1 1 73.50 160 3 62 76 1 1 1 73.50 160 3 66 78 1 1 1 73.00 190 1 66 78 1 1 1 73.00 190 1 64 80 1 2 1 69.00 155 2 64 80 1 2 1 69.00 155 2 74 84 1 2 1 73.00 165 1 74 84 1 2 1 73.00 165 1 84 84 1 2 1 72.00 150 3 84 84 1 2 1 72.00 150 3 68 72 1 2 1 74.00 190 2 68 72 1 2 1 74.00 190 2 62 75 1 2 1 72.00 195 2 62 75 1 2 1 72.00 195 2

...

...

Informações do arquivo Pulse

Informações do arquivo Pulse

(17)

Diâmetro

Diâmetro AlturaAltura VolumeVolume

8,3 70 10,3 12,9 85 33,8

8,6 65 10,3 13,3 86 27,4

8,8 63 10,2 13,7 71 25,7

10,5 72 16,4 13,8 64 24,9

10,7 81 18,8 14,0 78 34,5

10,8 83 19,7 14,2 80 31,7

11,0 66 15,6 14,5 74 36,3

11,0 75 18,2 16,0 72 38,3

11,1 80 22,6 16,3 77 42,6

11,2 75 19,9 17,3 81 55,4

11,3 79 24,2 17,5 82 55,7

11,4 76 21,0 17,9 80 58,3

11,4 76 21,4 18,0 80 51,5

11,7 69 21,3 18,0 80 51,0

12,0 75 19,1 20,6 87 77,0

12,9 74 22,2

Arquivo “Trees” do Minitab

Arquivo “Trees” do Minitab

(18)

Classificação Classificação

NOMINAL NOMINAL NOMINAL NOMINAL ORDINAL ORDINAL ORDINAL ORDINAL QUALITATIVA

QUALITATIVA QUALITATIVA QUALITATIVA

QUANTITATIVA QUANTITATIVA QUANTITATIVA QUANTITATIVA

CONTÍNUA CONTÍNUA CONTÍNUA CONTÍNUA DISCRETA DISCRETA DISCRETA DISCRETA

peso, altura

número de filhos, número de carros sexo, cor dos olhos

classe social, grau de instrução

Variável Variável

Qualquer característica associada a uma população.

(19)

Variáveis Quantitativas Variáveis Quantitativas

Mínimo, Máximo, Moda, Média, Mediana, Quartis

Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação

MEDIDAS DE POSIÇÃO:

MEDIDAS DE DISPERSÃO:

(20)

Máximo (max):

Máximo (max): a maior observação a maior observação Mínimo (min):

Mínimo (min): a menor observação a menor observação Moda (mo):

Moda (mo): é o valor (ou atributo) que é o valor (ou atributo) que ocorre com maior frequência.

ocorre com maior frequência.

Medidas de Posição Medidas de Posição

Ex.: 4, 5, 4, 6, 5, 8, 4 Ex.: 4, 5, 4, 6, 5, 8, 4

mo = 4 mo = 4 max = 8

max = 8 min = 4 min = 4

(21)

Ex: 2, 5, 3, 7, 8

2+5+3+7+8

5 = 5

n x n

x x

x x x

n

i i

n

1

2 3

...

1

Média Média

- X =

(22)

Valor que deixa

Valor que deixa 50% 50% das observações à sua esquerda das observações à sua esquerda

Ex(A): 2, 5, 3, 7, 8

Dados ordenados: 2, 3, 5, 7, 8 Md = 5

Ex(B): 3, 5, 2, 1, 8, 6

Dados ordenados: 1, 2, 3, 5, 6, 8 Md = (3 + 5) / 2 = 4

Mediana (Md) Mediana (Md)

A mediana pode ser obtida ordenando-se os dados e A mediana pode ser obtida ordenando-se os dados e

encontrando-se o valor que corresponde a posição encontrando-se o valor que corresponde a posição

(n+1)/2, se

(n+1)/2, se n n for ímpar. for ímpar.

Se Se n n for par, a mediana corresponde a média for par, a mediana corresponde a média

aritmética dos valores da posição anterior e posterior aritmética dos valores da posição anterior e posterior

a (n+1)/2.

a (n+1)/2.

(23)

Primeiro Quartil (Q1):

Primeiro Quartil (Q1): valor que deixa 25% valor que deixa 25%

das observações à sua esquerda.

das observações à sua esquerda.

Terceiro Quartil (Q3):

Terceiro Quartil (Q3): valor que deixa 75% valor que deixa 75%

das observações à sua esquerda.

das observações à sua esquerda.

Ex(A): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 Md = 3,05 Q1 = 2,05 Q3 = 4,9

Ex(B): 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 Md = 5,3 Q1 = 1,7 Q3 = 12,9

1º e 3º Quartil

1º e 3º Quartil

(24)

Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5

Temos: x

1

= x

2

= x

3

= 5 md

1

= md

2

= md

3

= 5 Exemplo: Considere as notas de um teste de Exemplo: Considere as notas de um teste de

3 grupos de alunos 3 grupos de alunos

G 1 0 10

* * * * *

G 2 0 * * * * * 10

G 3 0 10

*

*

*

*

*

(25)

Amplitude (A): máximo - mínimo [máx - min]

Amplitude (A): máximo - mínimo [máx - min]

Medidas de Dispersão Medidas de Dispersão

Finalidade: encontrar um valor que resuma a Finalidade: encontrar um valor que resuma a

variabilidade de um conjunto de dados variabilidade de um conjunto de dados

Para os grupos anteriores, temos:

Para os grupos anteriores, temos:

Grupo 1, A = 4

Grupo 1, A = 4

Grupo 2, A = 8

Grupo 2, A = 8

Grupo 3, A = 0

Grupo 3, A = 0

(26)

É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q3 - Q1

Ex.(A): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7

Q1 = 2,05 e Q3= 4,9 Q3 - Q1 = 4,9 - 2,05 = 2,85

Intervalo-Interquartil

Intervalo-Interquartil

(27)

n

x x

n

x x

x x

x x

n i

i

n

 

 

1

2 2

2 2

2 2 1

) ) (

( ...

) (

)

 (

Variância ão

DesvioPadr

Variância e Desvio Padrão

Variância e Desvio Padrão

(28)

Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5

Temos: x

1

= x

2

= x

3

= 5 md

1

= md

2

= md

3

= 5 Exemplo: Considere as notas de um teste de Exemplo: Considere as notas de um teste de

3 grupos de alunos 3 grupos de alunos

G 1 0 10

* * * * *

G 2 0 * * * * * 10

G 3 0 10

*

*

*

*

*

(29)

Variância para os Grupos 1, 2 e 3 Variância para os Grupos 1, 2 e 3

G1: 

2

= 2,0  = 1, 41

G2: 

2

= 8  = 2,83

G3: 

2

= 0  = 0

(30)

Fórmulas Alternativas Fórmulas Alternativas

 

 

 

 

 

 

 

 

 

 

 

  

 

 

n 2

1 i

i n

1 i

2 i n 2

1 i

2 i 2

n x x 1

n 1

x n n x

 1

Exemplo: Considere o grupo G1

   

2,0

5 125 10

5 135 5 1

5 5 135

1

135 49

36 25

16 9

7 6

5 4

3

2 2

2 2

2 2

2 1

2

n i

xi

(31)

é uma medida de dispersão relativa é uma medida de dispersão relativa

elimina o efeito da magnitude dos dados elimina o efeito da magnitude dos dados

exprime a variabilidade em relação à média exprime a variabilidade em relação à média

%

 100

x CV

Coeficiente de Variação (CV)

Coeficiente de Variação (CV)

(32)

Exemplo 1 Exemplo 1

Altura e peso de alunos

Altura 1,143m 0,063m 5,5%

Peso 50 kg 6kg 12%

Média

DesvioPadrão Coef. de Variação

Conclusão: Os alunos são duas vezes mais

dispersos quanto ao peso do que quanto à altura

(33)

Exemplo 2 Exemplo 2

Alturas de meninos e homens adultos de uma população.

Conclusão: Em relação às médias, as alturas dos

homens e dos meninos apresentam variabilidade quase iguais.

Desvio

Padrão Coef. De

Variação Média

Meninos 50 6 12%

Homens 160 16 10%

Referências

Documentos relacionados

A proposta aqui apresentada prevê uma metodologia de determinação da capacidade de carga de visitação turística para as cavernas da região de Bulhas D’Água

Objetivo: Garantir estimativas mais realistas e precisas para o projeto, ao considerar nesta estimativa o esforço necessário (em horas ou percentual do projeto) para

Tem como diretrizes, a integração com as políticas e diretrizes das Secretarias Municipais, das Subprefeituras e órgãos equiparados; o incentivo e apoio às

A tabela 25 apresenta os resultados brutos desta avaliação em relação à característica busca e a tabela 26 exibe o resultado ponderado para esta característica.. A tabela 27

Considerando uma avaliação de qualidade de forma quantitativa e classificatória, na variável de dados relevantes da realidade, utilizados para medidas serem

Como cada algoritmo classificador possui sua característica própria, sendo seu desempenho dependente das características extraídas dos textos, e dos dados utilizados para

Lula da Silva no 2º turno Pesquisa aponta empate técnico entre os candidatos Considerando a margem de erro de 3% para mais ou para menos. Proibida a reprodução

Se a eleição para presidente fosse hoje e os candidatos fossem estes ___________, em quem você votaria. E se os candidatos fossem estes ____________, em quem você votaria