• Nenhum resultado encontrado

AULA 2 Est1

N/A
N/A
Protected

Academic year: 2021

Share "AULA 2 Est1"

Copied!
47
0
0

Texto

(1)

ESTATÍSTICA I

Professora Kelly Alonso

Medidas de Posição e Dispersão

(2)

2

Através da distribuição de frequência podemos

observar a distribuição dos valores em diferentes formas.

Dessa forma, podemos localizar também a concentração

dos valores. Existem diferentes elementos estatísticos para

observar as tendências características dos valores. E as

medidas mais conhecidas são:

-

medidas de posição;

- medidas de variabilidade ou dispersão;

- medidas de assimetria;

- medidas de curtose.

*Vamos concentrar nossos estudos nas duas primeiras.

(3)

3

As medidas de posição mais importantes são as

Medidas de Tendência Central. Essas medidas são

assim denominadas por indicarem um ponto em torno

do qual se concentram os dados. Este ponto tende a

ser o centro da distribuição dos dados. Entre as

medidas de tendência central, as principais são:

-

a média aritmética;

- a mediana;

- a moda.

(4)

Medidas de Posição – Média Aritmética

A média aritmética é a soma de todos os valores

observados da variável dividida pelo número total de

observações. Sob uma visão geométrica a média de uma

distribuição é o centro de gravidade, representa o ponto de

equilíbrio de um conjunto de dados. É a medida de tendência

central mais utilizada para representar a massa de dados.

Seja (x1, ..., xn) um conjunto de dados. A média é dada por:

, onde n é o tamanho da amostra.

, onde N é o tamanho da população.

(5)

Medidas de Posição – Média Aritmética

Caso os dados estejam apresentados segundo uma

distribuição de freqüência, tem-se:

, onde n é o tamanho da amostra.

, onde N é o tamanho da população.

Dados agrupados:

(6)

Dados agrupados:

Neste caso, como as frequências são números indicadores

da intensidade de cada valor da variável, elas funcionam como

fatores de ponderação, o que nos leva a calcular a média

aritmética ponderada.

Medidas de Posição – Média Aritmética

=

i i i

f

f

x

x

O modo mais prático de obtenção da

média ponderada é abrir, na tabela, uma coluna

correspondente aos produtos

x

i

f

i

:

(7)

Medidas de Posição – Média Aritmética

Exemplos:

1) Sabendo-se que a produção leiteira diária da vaca B, durante

uma semana foi (em litros):

12 18 16 15 13 14 10 Dom Sab Sex Qui Quar Ter Seg

Qual é a produção média da semana?

litros

X

14

7

12

18

16

15

13

14

10

=

+

+

+

+

+

+

=

(8)

Medidas de Posição – Média Aritmética

Exemplos:

Qual é a média de filhos do sexo masculino?

2) Consideremos a distribuição relativa a 34 famílias de quatro

filhos, tomando para variável o número de filhos do sexo

masculino:

(9)

Medidas de Posição – Média Aritmética

Então:

Logo:

(10)

2) Consideremos a distribuição relativa a estatura de alunos de

uma disciplina:

Medidas de Posição – Média Aritmética

Qual é a estatura média dos alunos?

(11)

Como, neste caso: Temos:

,

40

,

440

.

6

=

=

=

i i i i i i

f

f

x

x

e

f

f

x

cm

x

x

161

161

40

440

.

6

=

=

=

Conclusão? 11

(12)

Medidas de Posição – Mediana

A mediana de um conjunto de dados é o número central,

quando os números estão ordenados segundo suas grandezas

(crescente ou decrescente). Se o tamanho da amostra é impar, a

mediana, Md, é o número central, quando o tamanho da amostra

é par, a mediana é a média dos dois números centrais.

Exemplos:

1) Encontre a mediana dos dados abaixo:

4, 13, 11, 2, 21, 15, 6, 16, 9

Em ordem: 2, 4, 6, 9, 11, 13, 15, 16, 21

(13)

Medidas de Posição – Mediana

2) Encontre a mediana dos dados abaixo:

2, 18, 7, 12, 6, 10, 21, 13

Em ordem: 2, 6, 7, 10, 12, 13, 18, 21

Md =

2

12

10 +

Md = 11

(14)

Medidas de Posição – Mediana

Se os dados se agrupam em uma distribuição

de frequência, o cálculo da mediana se processa de

modo muito semelhante àquele dos dados

não-agrupados, implicando, porém, a determinação prévia

das frequências acumuladas.

Para o caso de uma distribuição, a ordem, a partir

de qualquer um dos extremos, é dada por:

2

(15)

Sem intervalos de classe: identificar a frequência acumulada

imediatamente superior à metade da soma das frequências. A

mediana será aquele valor da variável que corresponde a tal

frequência acumulada.

Medidas de Posição – Mediana

Exemplo: 8 2 fa 30 18 34

2

17

2

34

2

=

=

=

Md

f

i

meninos

(16)

Com intervalos de classe: Neste caso, o problema consiste em

determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos que determinar a classe na qual se acha a mediana

-classe mediana. Tal -classe será aquela correspondente à frequência

acumulada imediatamente superior a .

2

fi

Medidas de Posição – Mediana

(17)

- é o limite inferior da classe mediana;

- é a frequência acumulada da classe anterior à classe mediana;

- é a frequência simples da classe mediana; - é a amplitude do intervalo da classe mediana.

(18)

20

2

2

40

2

=

=

f

i

f

i

[

]

cm

Md

Md

.

4

160

,

5

11

13

20

158

+

=

=

l*

l*

l*

l*

= 158 F(ant)= 13 h*= 4 f*= 11 20 2 = ∑ fi 11 fa 4 13 24 32 37 40 OBS

(19)

Medidas de Posição – Moda

A moda (Mo) é o valor que ocorre maior número de vezes no conjunto de dados.

Exemplos:

1) Encontre a moda dos dados abaixo:

a) 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 Mo = 10

b) 3, 5, 8, 10, 12, 13 Mo = Amodal

c) 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9 Mo = 4 e 7 Bimodal

(20)

2) Encontre a moda da distribuição abaixo:

Medidas de Posição – Moda

(21)

3) Encontre a moda da distribuição abaixo:

Obs.: Com intervalo de classe

Medidas de Posição – Moda

A classe que apresenta a maior frequência é

denominada classe modal. Pela definição, podemos afirmar que

a moda, neste caso, é o valor dominante que está compreendido

entre os limites da classe modal.

O método mais simples para o cálculo da moda consiste

em tomar o ponto médio da classe modal. Damos a esse valor

denominação de moda bruta.

Temos então:

Onde llll* é o limite inferior da classe modal;

L* é o limite superior da classe modal.

2

*

L

l

(22)

3) Encontre a moda da distribuição abaixo:

Medidas de Posição – Moda

Temos que a classe modal é i=3, l*=158 e L*=162.

(23)

Medidas de Posição

A mediana caracteriza uma série de valores devido à sua posição central, mas também separa a série em dois grupos que

apresentam o mesmo número de valores.

Assim, além das medidas de posição, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica. Essas medidas _ os quartis, os percentis e os decis _ são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes.

Quartis: os valores de uma série que a dividem em quatro partes iguais.

- o primeiro quartil – Q1 – 25% das observações;

- o segundo quartil – Q2 - (igual à mediana);

(24)

Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, por:

2 ∑ fi

4

f

i

k

*

*

)

(

4

*

1

h

f

ant

F

f

l

Q

i





+

=

, sendo k o número de ordem do quartil.

Assim temos:

*

*

)

(

4

3

*

3

h

f

ant

F

f

l

Q

i





+

=

(25)

Medidas de Posição

1) Encontre o primeiro e terceiro quartis da distribuição abaixo: Exemplo

(26)

Medidas de Posição

(27)

Percentis: os noventa e nove valores que separam uma série em 100 partes iguais.

Medidas de Posição

Indicamos

O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém a fórmula passa a ser:

.

,...,

...,

,

,

2 32 99 1

P

P

P

P

100

f

i

k

K – número de ordem do percentil

Obs.: com intervalo de classe

Pk

k

(28)

Exemplo:

Calcule o 37o percentil para a distribuição abaixo:

P37

37

(29)

[

]

cm

P

P

P

7

,

158

65

,

158

4

11

13

8

,

14

158

37 37 37

=

=

+

=

8

,

14

100

40

.

37

100

37

=

f

i K = 37

(30)

37%

P10 Q

1 Md Q3 P90

(31)

Exercício: Observando a distribuição abaixo, calcule: a) a média

b) a mediana c) a moda

d) o primeiro e o terceiro quartis e) o 23º percentil Estaturas (cm) 150 l 158 5 158 l 166 166 l 174 174 l 182 182 l 190 12 18 27 8 70

(32)
(33)

São utilizadas para medir a variabilidade dos dados de uma amostra ou população. As principais medidas são:

- a amplitude, - a variância,

- o desvio padrão.

Medidas de Dispersão ou Variabilidade

São medidas da dispersão de um conjunto de dados em torno da média, ou seja, da maior ou menor variabilidade dos resultados obtidos.

Elas permitem identificar até que ponto os resultados se concentram ou não ao redor da tendência central de um conjunto de observações.

(34)

Medidas de Dispersão – Amplitude

É a diferença entre o maior e o menor valor observado num conjunto de dados, servindo para caracterizar a abrangência do estudo. Exemplo: Calcule a média, mediana e amplitude para as amostras abaixo: Amostra 1: 40, 60, 70, 50, 80, 90 Amostra 2: 67, 63, 64, 66, 40, 90 40, 50, 60, 70, 80, 90 Média: 65 Mediana: 65 Amplitude: 90 - 40 = 50 40, 63, 64, 66, 67, 90 Média: 65 Mediana: 65 Amplitude: 90 - 40 = 50 Amostra 3: 64, 63, 60, 70, 67, 66 60, 63, 64, 66, 67, 70 Média: 65 Mediana: 65 Amplitude: 70 - 60 = 10

(35)

Medidas de Dispersão – Variância

É a soma dos quadrados dos desvios da média dividido por n-1, em amostras.

Sendo n, o número de elementos da amostra.

Sendo N, o número de elementos da população.

1

)

(

1 2 2

=

=

n

X

X

s

n i i

N

X

n i i

=

=1 2 2

(

µ

)

σ

(36)

Medidas de Dispersão – Desvio Padrão

É definido pela raiz quadrada positiva da variância

Sendo n, o número de elementos da amostra.

Sendo N, o número de elementos da população.

1

)

(

1 2

=

=

n

X

X

s

n i i

N

X

n i i

=

=1 2

)

(

µ

σ

(37)

2 2

 ∑

=

n

X

n

X

s

i i 2 2





=

i i i i i i

f

X

f

f

X

f

s

Com intervalo de classe Observação:

(38)

Exemplos:

1) Calcule a variância e o desvio padrão para os dados abaixo: 8, 10, 11, 15, 16, 18 ∑ =1090 ∑ = 78 324 18 256 16 225 15 121 11 100 10 64 8 Xi2 Xi 2 2

 ∑

=

n

X

n

X

s

i i

7

,

3

6

78

6

1090

2

=

=

s

s

S2 = 12,67

(39)

8, 10, 11, 15, 16, 18 n = 6 X = 13

1

)

(

1 2

=

=

n

X

X

s

n i i

(

)

(

)

(

)

(

)

(

)

(

)

1

6

13

18

13

16

13

15

13

11

13

10

13

8

2 2 2 2 2 2 2

+

+

+

+

+

=

s

S2 = 15,2 S = 3,9

(40)

Exemplos:

(41)

fiXi fiXi2 0 6 20 36 16=78=218 0 6 40 108 64 2 2





=

i i i i i i

f

X

f

f

X

f

s

2

34

78

34

218

=

s

S2 = 1,149 S = 1,07 Xi

(42)

Exemplos:

(43)

S2 = 31

(44)

Observações sobre desvio padrão:

Através da sua definição e propriedades, para distribuições normais*, isso significa que:

a) 68,26% dos casos estão incluídos entre X-s e X+s (isto é, um desvio padrão de cada lado da média)

b) 95,46% dos casos estão incluídos entre X-2s e X+2s (isto é, dois desvio padrão de cada lado da média)

c) 99,73% dos casos estão incluídos entre X-3s e X+3s (isto é, três desvio padrão de cada lado da média)

X-s X X s

X-2s X 2s

(45)

Observações sobre desvio padrão:

Variável reduzida, escores reduzidos:

A variável

, que mede o desvio em relação à

s

X

X

z

=

média, em unidades de desvio padrão, é denominada variável

reduzida e é uma quantidade abstrata (ou seja, independe das

unidades usadas).

Se os desvios em relação à média forem dados em unidades

de desvio padrão, diz-se que estão expressos em unidades

reduzidas ou escores reduzidos. Essas grandezas são muito

importantes em comparações entre distribuições.

(46)

Exemplos:

1) Um estudante recebeu grau 84 em um exame final de matemática, para o qual o grau médio foi 76 e o desvio padrão 10. No exame de geografia, para o qual o grau médio foi 82 e o desvio 16, ele recebeu o grau 90. em que matéria sua posição relativa foi mais elevada?

8

,

0

10

76

84

=

=

z

z

s

X

X

z

=

Para matemática: Para geografia: Conclusões?

5

,

0

16

82

90

=

=

z

z

(47)

Referências

Documentos relacionados

O Diretor-Geral do Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - CEFET/RJ, no uso de suas atribuições e considerando o Regulamento do

Seus filhos não apenas deveriam ouvir, mas contar e recontar o que Deus tinha feito por eles, de modo que não se esquecessem.. Haveria melhor maneira de preservar o conhecimento do

A cabeça estava com muita pressa para chegar a casa e nem olhou para Antónia?. Ele acenou-lhe com o pano

Tabela 7.3 – Base de dados: opiniões dos especialistas sobre os investimentos diante dos fatores de influência, nas condições definidas pelas seções.. Com suas opiniões

Com relação ao CEETEPS, o tema desta dissertação é interessante por se inserir no Programa de Educação de Jovens e Adultos (PROEJA), sob a tutela da Coordenação de

comemorativos são tradicionais desde a inauguração do restaurante, há 15 anos Opção com estadia no Hotel Mercure Lourdes Belo Horizonte tem preço especial - Fotos: Paulo Cunha /

O santo que não bate – aí tem os que não votam “de jeito nenhum” em determinados candidatos porque “detesto elel/a não vou com a cara.” E detesta

O processo de transformação bacteriana utilizada na Biologia Molecular ocorre in vitro, e pode ser afetado pelo tamanho e conformação da molécula de DNA a ser introduzida na