• Nenhum resultado encontrado

Med.Tend.Disper.

N/A
N/A
Protected

Academic year: 2021

Share "Med.Tend.Disper."

Copied!
40
0
0

Texto

(1)

Medidas de Tendência

Central e Dispersão

(2)

• Formato de sino onde a maioria dos valores se concentram em torno

da média.

• É uma distribuição simétrica em relação a média

• Variável quantitativa

σ

σ

σ

σ = 1

Distribuição normal

(3)

Distribuição normal

Por que é importante que as variáveis possam

ser descritas por uma distribuição normal?

Para utilizar uma gama modelos estatísticos mais robustos e utilização de

testes paramétricos

(4)

Distribuição normal

População (N) | Média: µ

µ

µ

µ

| Variância: σ

σ

σ

σ

2

Se a distribuição da população for normal e a amostra

retirada aleatoriamente for maior que 30 casos, vale afirmar

que a distribuição da amostra também será normal

(5)

Bernoulli (1654-1705) Moivre (1667-1754) Gauss (1777-1855)

Teorema binomial (Ars conjectandi, Bernoulli 1713)

Approximatio ad summam terminorum binomii (Moivre, 1733)

0 5 10 15 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

% y

Acontecimentos favoráveis

x

Distribuição binomial simétrica

Distribuição normal

Distribuição binomial tende para a normal quando a amostra > 30

Histograma: (p=q=0,5) n=31, ou seja, (0,5 + 0,5)

31

*Probabilidade de sucesso: p e Probabilidade de falha q=1-p

(6)

MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO

Representação por meio de um valor único ou

central, determinado conjunto de informações

que variam

Valor central = “abstração”

Medidas mais utilizadas em análise estatística

Média Aritmética

Mediana

Moda

(7)

soma de um conjunto de observações (∑

x) dividida

pelo número de observações (n)

x

n

x

=

x

x

=

X1+X2+X3+...+Xn

n

(8)

Centro de gravidade – ponto de equilíbrio

Média Aritmética

19, 4, 14, 4, 25, 4, 10, 12, 14, 4, 16, 3, 20, 21, 4

(9)

É o valor que divide a distribuição ordenada da amostra

em duas partes iguais

~

Mediana

50%

50%

(10)

Centro de gravidade – ponto de equilíbrio

Mediana

12, 4, 4, 25, 4, 49, 12, 3, 20, 26, 25, 4, 30, 4

(11)

Centro de gravidade – ponto de equilíbrio

Mediana

Média = 16

Moda = 4

Mediana = 12

Amplitude = 46

12, 4, 4, 25, 4, 49, 12, 3, 20, 26, 25, 4, 30, 4

19, 4, 14, 4, 25, 4, 10, 12, 14, 4, 16, 3, 20, 21, 4

Média = 12

Moda = 4

Mediana = 12

Amplitude = 22

(12)

• Não sofre influência quando temos no conjunto

valores discrepantes (tanto para mais como para

menos)

Para definir a mediana os dados devem estar

ordenados (crescente ou decrescente)

A mediana é o ponto central da distribuição

Quando o total de observações for um número par a

mediana é a média aritmética dos valores centrais

(13)

Comparação

(14)

Simetria

MÉDIA<MEDIANA<MODA

MÉDIA=MEDIANA=MODA

(15)

Valor mais freqüente em uma distribuição

Única medida de tendência central que pode ser utilizada

para variáveis categóricas

Uma distribuição pode ser modal, bimodal ou polimodal

Moda

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9 10 11 12 13

(16)

Estatura em 213 estudantes universitários da UFRGS (Callegari-Jacques)

Moda

0 5 10 15 20 25 30 0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30

(17)

Quartis

1 2 3 4 5 6 7

8

9 10 11 12 13 14 15

Q

1

Q

3

P

25

Q

2

P

75

P

50

Mediana

Valores que dividem uma série ordenada de dados em quatro

grupos, cada um reunindo 25%.

• A distância interquartílica (Q

3

– Q

1

) representa melhor uma

distribuição assimétrica, quando comparada ao desvio-padrão

ou amplitude.

(18)

MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

Amplitude de Variação

Variância

Desvio Padrão

Quartis e Percentis

Distância Interquartílica

Conceitos

(19)

Definição:

Diferença entre o mais alto e o mais baixo

escore em uma distribuição

A = S – I

S – escore mais alto

I – escore mais baixo

(20)

• Vantagens:

Rápido e fácil

• Desvantagens:

Índice aproximado da variabilidade de uma

distribuição

Sensível a um único valor

(21)

Exemplo de Amplitude

Turm a

Idade

A m plitude

A

1 3 4 5 6 7 8

8 – 1 = 7

B

2 4 5 6 6 7 9

9 – 2 = 7

C

1 2 3 3 4 4

4 – 1 = 3

(22)

Centro de gravidade – ponto de equilíbrio

Média = 16

Moda = 4

Mediana = 12

Amplitude = 46

12, 4, 4, 25, 4, 49, 12, 3, 20, 26, 25, 4, 30, 4

19, 4, 14, 4, 25, 4, 10, 12, 14, 4, 16, 3, 20, 21, 4

Média = 12

Moda = 4

Mediana = 12

Amplitude = 22

Amplitude da variação

(23)

Variância

Média = 16

Moda = 4

Mediana = 12

Amplitude = 46

12, 4, 4, 25, 4, 49, 12, 3, 20, 26, 25, 4, 30, 4

Desvio = X - X

Exemplo: 49 – 16 = 33

(24)

Variância

Média = 15,857

Moda = 4

Mediana = 12

Amplitude = 46

12, 4, 4, 25, 4, 49, 12, 3, 20, 26, 25, 4, 30, 4

49-15,857 49 4-15,857 4 26-15,857 25 4-15,857 4 25-15,857 26 4-15,857 4 12-15,857 12 3-15,857 3 30-15,857 30 4-15,857 4 25-15,857 25 4-15,857 4 20-15,857 20 4-15,857 4 Res X-X X Res X-X X

Quanto > desvio >

distância da média

(25)

Variância

Média = 15,857

Moda = 4

Mediana = 12

Amplitude = 46

12, 4, 4, 25, 4, 49, 12, 3, 20, 26, 25, 4, 30, 4

0

Total

-3,857 12-15,857 12 33,143 49-15,857 49 -11,857 4-15,857 4 10,143 26-15,857 25 -11,857 4-15,857 4 9,143 25-15,857 26 -11,857 4-15,857 4 -3,857 12-15,857 12 -12,857 3-15,857 3 14,143 30-15,857 30 -11,857 4-15,857 4 9,143 25-15,857 25 -11,857 4-15,857 4 4,143 20-15,857 20 -11,857 4-15,857 4 Res X-X X Res X-X X

Soma dos desvios

acima da média é

igual a soma dos

desvios abaixo da

média

(26)

Variância

Média = 15,857

Moda = 4

Mediana = 12

Amplitude = 46

12, 4, 4, 25, 4, 49, 12, 3, 20, 26, 25, 4, 30, 4

1098,458 49-15,857 49 140,5884 4-15,857 4 102,8804 26-15,857 25 140,5884 4-15,857 4 83,59445 25-15,857 26 140,5884 4-15,857 4 14,87645 12-15,857 12 165,3024 3-15,857 3 200,0244 30-15,857 30 140,5884 4-15,857 4 83,59445 25-15,857 25 140,5884 4-15,857 4 17,16445 20-15,857 20 140,5884 4-15,857 4 Res X-X X Res X-X X

Σ

Σ

Σ

Σ

(x – x)

2

Limitação: neste formato

só é possível comparar

conjuntos de dados com

tamanhos idênticos

(mesmo número de

observações)

(27)

Σ

Σ

Σ

Σ

(x – x)

2

(n-1)

n

i=l

s

2

=

Variância

2483,714

Total

14,87645 12-15,857 12 1098,458 49-15,857 49 140,5884 4-15,857 4 102,8804 26-15,857 25 140,5884 4-15,857 4 83,59445 25-15,857 26 140,5884 4-15,857 4 14,87645 12-15,857 12 165,3024 3-15,857 3 200,0244 30-15,857 30 140,5884 4-15,857 4 83,59445 25-15,857 25 140,5884 4-15,857 4 17,16445 20-15,857 20 140,5884 4-15,857 4 Res X-X X Res X-X X

=

2.483,714

14

=

177,4082

(28)

• Vantagens:

Valores absolutos

Dá maior ênfase aos valores extremos (>sensibilidade ao grau

de desvio na distribuição)

• Desvantagens:

Dificuldade na interpretação devido a alteração da medida

(elevado ao quadrado)

Valores elevados

Apresenta unidade de medida igual ao quadrado da unidade de

medida dos dados originais

Ex: variável medida em metros, a variância será expressa em m

2

(29)

Desvio Padrão

v

s

2

s =

Vantagens

• Apresenta as propriedades da variância

(30)

v

s

2

s =

s= 13

(31)

Relação entre a média e desvio padrão em uma

distribuição normal

v

s

2

s =

(32)

+-1s

+-1,96 s

Relação entre a média e desvio padrão em uma

distribuição normal

(33)
(34)

Exercício

Um treinador deseja selecionar, dentre os jovens que estão prestando

serviço militar no quartel Q, aqueles com uma estatura de no mínimo 180

cm, para formar um time de basquete. Que percentagem é esperada de

jogadores em potencial, sabendo-se que a estatura tem distribuição

(35)

Resultado

Para X = 175, z = (x - µ)/σ = 175 – 175) / 6 = 0

Para x = 180, z = (x - µ)/σ = 180 – 175) / 6 = 0,83

A área entre z = 0 e z = 0,83 é 0,2967 e a área além de 0,83 é (0,5 – 0,2967) = 0,2033

175 180

Portanto, 20,33% dessa população são constituídos de indivíduos com

estatura igual ou superior a 180 cm.

0,83

0

Z (variável padronizada)

(36)

Exercício

Se 140 jovens estão prestando serviço militar no quartel Q o número

esperado de rapazes que pode ser convidado para participar do time de

basquete é?

(37)

Resultado

175 180

Portanto, 20,33% de 140 = 0,2033 x 140 = 28,46, isto é 28 jovens.

0,83

0

Z (variável padronizada)

(38)
(39)

“Nós (epidemiologistas) usamos a

estatística da mesma maneira que um

bêbado usa um poste de luz: muito

mais para suporte do que para

iluminação”

(40)

• www.famat.ufu.br/ednaldo/ednaldo.htm

• Jekel, James F. Epidemiologia, bioestatística e medicina preventiva — Porto

Alegre: Artes Médicas Sul, 1999

• Beiguelman, Bernardo. Curso prático de bioestatística — Ribeirão Preto, SP:

Fundação de Pesquisas Científicas de Ribeirão Preto, 2002

• Métodos quantitativos em medicina / Eduardo Massad... [et al.] — Barueri, SP:

Manole, 2004

• Leão, Ennio, et al. Pediatria ambulatorial — 3ª ed. Belo Horizonte: COOPEMED,

1998

• Triola, Mario. Introdução à Estatística. LTC – Livros Técnicos e Científicos

Editora S.A., 1999

• Epi Info 6.04d Manual

• Sidia M. Callegari-Jacques. Bioestatística – Princípios e Aplicações – Editora

Referências

Documentos relacionados

Mais da metade (55%) das empresas de serviços financeiros com mais de 20.000 funcionários afirmam que a nuvem é essencial para o sucesso geral das aplicações com IA, comparado a

Aproximadamente 17% dos varejistas se enquadram no subconjunto de entrevistados cujas organizações estão mais avançadas que outras em termos de adoção tanto da nuvem como da IA,

Our contributions are: a set of guidelines that provide meaning to the different modelling elements of SysML used during the design of systems; the individual formal semantics for

Outras possíveis causas de paralisia flácida, ataxia e desordens neuromusculares, (como a ação de hemoparasitas, toxoplasmose, neosporose e botulismo) foram descartadas,

A espectrofotometria é uma técnica quantitativa e qualitativa, a qual se A espectrofotometria é uma técnica quantitativa e qualitativa, a qual se baseia no fato de que uma

No final, os EUA viram a maioria das questões que tinham de ser resolvidas no sentido da criação de um tribunal que lhe fosse aceitável serem estabelecidas em sentido oposto, pelo

E os maiores fabricantes estão mais propensos que os seus pares de menor porte a estar atualmente em ambiente de nuvem híbrida (73% contra 61%) – mas mais de um quinto das

Na nossa pesquisa, as empresas que estão mais avançadas na adoção da nuvem e da IA consideram a nuvem como a base essencial que elas têm para o gerenciamento de dados e IA, com