• Nenhum resultado encontrado

MATERIAL DE ESTATÍSTICA II PROF. MÁRIO ROBERTO

N/A
N/A
Protected

Academic year: 2021

Share "MATERIAL DE ESTATÍSTICA II PROF. MÁRIO ROBERTO"

Copied!
75
0
0

Texto

(1)

VARIÁVEIS ALEATÓRIAS

O que se entende por variável aleatória?

Até agora nossos estudos estavam praticamente voltados mais para definirmos nosso Espaço Amostral U, sem associarmos suas respectivas probabilidades aos experimentos aleatórios.

Existem, contudo, experimentos cujos resultados podem ser expressos por quantidades numéricas. Ou ainda, por vezes, desejamos atribuir um valor específico a cada resultado do experimento aleatório.

Quando realizamos a observação dos resultados de um experimento que pode ser resultado repetidamente sob condições essencialmente inalteradas (experimento aleatório), não poderemos, de antemão, dizer qual particular resultado irá ocorrer na próxima tentativa, muito embora sejamos capazes de descrever o conjunto de todos os possíveis resultados do experimento. Assim, por exemplo, antes de lançar um dado poderemos descrever que os possíveis resultados são: l, 2, 3, 4, 5, 6, mas qual desses, em particular, irá ocorrer, no próximo lançamento é impossível predizer com absoluta certeza. Variável aleatória é, pois

o resultado da observação de experimentos não determinísticos.

Entretanto o resultado de um experimento não é necessariamente, um número. De fato na observação das peças que saem de uma máquina poderemos, simplesmente, anotar as categorias "defeituosas" ou "não defeituosas". Contudo, em muitas situações experimentais, estamos interessados na mensuração de alguma coisa e no seu registro como um número. Mesmo no exemplo acima, poderemos atribuir um número a cada resultado (não numérico) do experimento.

U: observação das peças (telhas) que saem de uma máquina X número de peças defeituosas

X = 0, 1, 2, 3, ...,n

Portanto, chama-se variável aleatória a uma variável cujo valor é um número

determinado pelo resultado de um experimento ou através da observação, e aos quais podemos associar probabilidade.

As variáveis aleatórias podem ser classificadas em: 1- VARIÁVEIS ALEATÓRIAS DISCRETA

Seja X uma variável aleatória que assume os valores x1, x2, x3, ...xn. Diremos que X é uma variável aleatória discreta. Se o número de valores tomados por X é finito ou infinito numerável.

Exemplo: U: Lançamento de quatro moedas Seja,

X: o número de caras observadas. X = 0, 1, 2, 3, 4

De modo geral podemos dizer que as variáveis aleatórias discretas são as que resultem de contagens.

2- VARIÁVEIS ALEATÓRIAS CONTÍNUAS

Seja X uma variável aleatória que pode assumir qualquer valor num intervalo, diremos que X é uma variável aleatória contínua.

Exemplos:

(2)

b)

b) A altura de um indivíduo que pode ser: 1,65m, l,652m, 1,6524m, conforme a precisão de medida.

De modo geral podemos afirmar que as variáveis aleatórias contínuas são aquelas

que resultem de "medição", em especial, de tempo, temperatura, comprimento, peso, volume, etc.

Um aspecto interessante é o que o mesmo experimento pode dar margem à observações de várias variáveis, e a escolha da que vai ser observada fica a critério do observador. Como exemplo vejamos o experimento "jogar 4 moedas simultaneamente". Como variável aleatória poderemos escolher "o número de caras obtidas ou a distância mínima entre 2 moedas". A primeira seria uma variável aleatória discreta e a Segunda seria uma variável aleatória contínua.

1- VARIÁVEL ALEATÓRIA DISCRETA

1.1- FUNÇÃO DE PROBABILIDADE

A probabilidade de que a variável aleatória assuma o valor X, é a função de

probabilidade de X que representamos por P(X = xi) ou simplesmente por P(X).

f(x) = P(X = xi) f(x) = 0 se X  xi n

 f(xi) = 1 i = 1

Portanto a função que associa probabilidade aos possíveis valores de uma variável aleatória, denomina-se função de probabilidade.

A função P(X) pode ser expressa por uma tabela ou gráfico Exemplo

Seja E: o espaço amostral no lançamento de 2 moedas e X: o número de caras C obtidas. Isto é: E = (K,K); (K,C); (C,K); (C,C) X = 0, 1, 2  TABELA: X 0 1 2 P(X) 1/4 1/2 1/4 GRÁFICO: P(X) 1/2 1/4 0 1 2 X

(3)

1.2- FUNÇÃO REPARTIÇÃO

Define-se função repartição da variável aleatória X, no ponto x, como sendo a probabilidade de que x assuma um valor menor ou igual a X, isto é:

F(X) = P(X  x). No exemplo acima teremos:

F(X) = 1/4 se x  0 F(X) = 1/2 se 1  x  2 F(X) = 1/4 se x  2

2- VARIÁVEL ALEATÓRIA CONTÍNUA 2.1- FUNÇÃO DENSIDADE DE PROBABILIDADE

Seja X uma variável aleatória contínua. A função densidade de probabilidade f(x) é uma função que satisfaz as seguintes condições.

f(x)  0 f(x).d(x) = 1 b Assim P( a  x  b) = f(x).d(x) a

2.2- FUNÇÃO REPARTIÇÃO +oo

F(X) = P(X  x) = P( -oo  x  +oo) = f(x).dx = 1 -oo

Seja X uma variável aleatória contínua com a seguinte função densidade de probabilidade.

f(x) = 2x para 0  x  1

0 para  (qualquer) outro valor

para x  0  F(x) = 0

f(x) = para 0  x  1  F(x) = 2x.dx = 2x2 x = x2 0 2 0

para x  1  F(x) = 1

(4)

F(x) 1

1 x

Exemplo/Exercício Seja f(x) = 3/2 (1 - x2 ), 0  x  1 0, caso contrário Ache a função repartição e esboce o gráfico.

3- DISTRIBUIÇÃO DISCRETAS DE PROBABILIDADES 3.1- DISTRIBUIÇÃO DE PROBABILIDADE

No contexto das distribuições de probabilidades, os valores individuais de probabilidades podem ser designados pelo símbolo f(x), que enfatiza a existência de uma função matemática (variáveis contínuas). Por P(X = x), que enfatiza que a variável aleatória pode assumir diversos valores, ou simplesmente por P(X).

Para uma variável aleatória discreta todos os possíveis valores da variável aleatória podem ser listados numa tabela com as probabilidades correspondentes: distribuição de probabilidade Binomial, Hipergeométrica e de Poisson. Para uma variável aleatória contínua não podem ser listados todos os possíveis valores fracionários da variável, e desta forma as probabilidades são determinadas por uma função matemática, são retratadas, tipicamente, por uma função densidade ou por uma curva de probabilidade.

3.2 VALOR ESPERADO E VARIÂNCIA DE VARIÁVEIS ALEATÓRIAS DISCRETAS. n

Média, Valor Esperado ou Esperança Matemática:  = E(X) =  xi.P(xi)

(5)

3.3 PROPRIEDADES DA ESPERANÇA MATEMÁTICA: 3.3.1- A média de uma constante é a própria constante E(X) =  k.P(xi) = k. P(xi) = k

3.3.2- A média de uma variável multiplicada por uma constante é igual à constante multiplicada pela média da variável.

E(k.X) =  k.xi.P(xi) = k. xi.P(xi) = k.E(xi)

3.3.3- A média da soma ou da diferença é a soma ou diferença das médias. E( X + Y) = E( X ) + E( Y ) ou E(X - Y) = E(X) - E(Y)

3.3.4- Somando ou subtraindo uma constante a uma variável aleatória, a sua média fica somada ou subtraída da mesma constante.

E(X + k) = E(X) + E(k) = E(X) + k ou E(X- k) = E(X) - k

3.3.5- A média do produto de duas variáveis aleatórias independentes é o produto das médias.

E(X.Y) =  xi.yj.P(xiyj) = xi.yi.P(xi).P(yj) =  xi.P(xi). yj.P(yj) = E(X).E(Y)

3.4- VARIÂNCIA

A forma geral de desvios para a fórmula da variância de uma distribuição discreta de probabilidade é:

V(X) = 2(X) =  xi - E(X)2.p(xi) ou

V(X) = 2(X) = E(X2) - E(X)2 ( Fórmula Computacional) 3.5- PROPRIEDADE DA VARIÂNCIA

3.5.1- A variância de uma constante é zero 2

(X) = V(k) = E k - E(k)2 = E(k - k)2 = 0

3.5.2- Multiplicando-se uma variável aleatória por uma constante, sua variância fica multiplicada pelo quadrado da constante.

V(k.X) = 2(k.X) = kX - E(k.X)2 = k.X - k.E(X)2 = k(X - E(X)2 = k2.X - E(X)2 = k2.V(X)

3.5.3- Somando-se ou subtraindo-se uma constante à variável aleatória, sua variância não se altera.

(6)

2

(X + k) = 2(X) + 2(k) = 2(X) + 0 = 2(X)

3.5.4- A variância da soma ou da diferença de duas variáveis aleatórias independentes é a soma das respectivas variâncias.

2

(X +Y) = 2(X) + 2(Y) e 2

(X - Y) = 2(X) + 2(-Y) = 2(X) + (-1)2.2(X) = 2(X) + 2(Y) EXEMPLO:

A tabela abaixo está registrado o número de caminhonetes solicitadas em uma agência de aluguel de carros durante um período de 50 dias.

Demanda possível X Nº de dias Probabilidade P(X) Valor Ponde-rado X:P(X) Demanda ao quadrado X2 Quad. Ponde-rado X2.P(X) 3 3 0,06 = 3/50 0,18 9 0,54 4 7 0,14 = 7/50 0,56 16 2,24 5 12 0,24 1,20 25 6,00 6 14 0,28 1,68 36 10,08 7 10 0,20 1,40 49 9,80 8 4 0,08 0,64 64 5,12

TOTAL 50 1,00 E(X) = 5,66 E(X2) = 33,78

OBS. A probabilidade de serem solicitadas exatamente sete (7) caminhonetes em um determinado dia aleatoriamente escolhido no período é de 0,20 e de cinco (5) é de 0,24. Determine:

a) A esperança matemática

b) A variância, cálculo computacional.

a) E(X) = 5,66 Isto é, o valor esperado para dados discretos pode ser fracionário porque ele representa um valor médio de longo prazo e não o valor específico para qualquer observação dada.

(7)

Isto é a variação do número de caminhonetes em torno da média ao quadrado é de 1,74. Exercícios

1- Um dentista tem 5 cadeiras disponíveis para pacientes em sua sala de espera. A probabilidade do número de cadeiras ocupadas X é dada por:

X P(X) 0 0,304 1 0,228 2 0,171 3 0,128 4 0,096 5 0,073

a) Ache a média E(X) =  da variável aleatória X. E(x) = 1,7 b) Calcule a variância e o desvio padrão, da variável aleatória X. V(X) = 2,53 c) Calcule P( 2  X  5). 0.468 d) Desenvolva no formato tabular a cdf ( Função de Distribuição Acumulada) dessa

distribuição.

e) Desenvolva a função repartição dessa distribuição.

2- Considere uma moeda perfeita lançada 3 vezes. Seja X o número de caras obtida. Calcule

a) a distribuição de X

b) média de X E(x) = 1,5 c) a variância ² = 0,75

3- Considere uma urna contendo três bolas vermelhas e cinco pretas. Retire três bolas sem reposição, e defina a V.A X igual a número de bolas pretas.

a) Obtenha a distribuição de X

b) Obtenha a média e a variância da V.A X E(X) =1,875 ² = 0,502

(8)

a) a distribuição de Y

b) a média e variância de Y  = 2 , ² = 1

5- Considere uma mesa contendo 10 frutas das quais 4 estão estragadas. Retire três dessas frutas ao acaso, sem reposição e defina a V.A. X igual a número de frutas estragadas. a) Obtenha a distribuição de X

b) Obtenha a média e a variância da V.A.  = 1,2 , ² = 0,560

4-DISTRIBUIÇÃO BINOMIAL 4.1- INTRODUÇÃO: DISTRIBUIÇÃO DE BERNOULLI

Seja um experimento que consiste na realização de uma prova, cujos resultados só podem ser "sucesso" ou "fracasso". Observando ainda que na realização desta prova os eventos são independentes, vamos chamar de X uma variável aleatória que de acordo com a pressuposição citada, somente assumirá valores 0 e 1, sendo 0 a ocorrência do evento "fracasso" e 1 a ocorrência do evento "sucesso" com probabilidades

P(X = 0) = q X 0 1

P(X = 1) = p P(X) q p  p + q = 1  q = 1 - p Obs.

q = l- p é complementar de p, pois p + q = 1.

2- E(X) =  xi.p(xi) = 0.q + 1.p = p  E(X) = p

3- V(X) = E(X2) - E(X)2 = 02.q + 12.p - p2 = p - p2 = p(1 - p) = p.q  V(X) = p.q

Consideremos que:

a) n provas independentes e do mesmo tipo são realizadas.

b) Cada prova é uma prova de Bernoulli ou seja, admite dois resultados: sucesso ou fracasso que são mutuamente exclusivos.

(9)

d) p é a probabilidade de sucesso em cada prova e q = 1 - p a ocorrência do fracasso.

4.2- DISTRIBUIÇÃO BINOMIAL

Se p é a probabilidade de um evento acontecer em uma tentativa única (sucesso), e q = 1 - p é a probabilidade de que o evento não ocorra (insucesso), então a probabilidade do evento ocorrer exatamente x vezes em n tentativas, isto é, de que haja X sucessos e n - x insucesso, é dado por:

P(X = x) = n px . qn - x x

PARÂMETROS DA DISTRIBUIÇÃO BINOMIAL

Baseados na propriedades da E(X) e V(X) e como a variável binomial X é uma soma de variáveis independentes do tipo Bernoulli, teremos que:

E(X) = E( x1 + x2 + x3 + ...+ xn) = E(x1) + E(x2) + E(x3) +...+ E(xn) = np  V(X) = V(x1 + x2 + x3 + ...+ xn) = V(x1) + V(x2) + V(x3) + ...+ V(xn) = p.q + p.q + p.q + ...+ p.q = n.pq. = n.p.(1 - p)  FÓRMULAS GERAIS: E(X) = xi.p(xi) P(X = xi) = n . pxi.(1 - p) n - xi xi E(X) =  xi. n .pxi. (1 - p)n - xi xi V(X) = (xi – E(X))².p(xi) E(x) =  = n.p V(x) = ² = n.p.q

(10)

TRIÂNGULO DE PASCAL UMA FERRAMENTA IMPORTANTE P = 0 P = 1 P = 2 P = 3 P = 4 P = 5 P = 6 n = 0 0 0 n = 1 1 1 0 1 n = 2 2 2 2 0 1 2 n = 3 3 3 3 3 0 1 2 3 n = 4 4 4 4 4 4 0 1 2 3 4 n = 5 5 5 5 5 5 5 0 1 2 3 4 5 n = 6 6 6 6 6 6 6 6 0 1 2 3 4 5 6 n n n n n n n n ... n 0 1 2 3 4 5 6 n

Substituindo-se cada número combinatório pelo respectivo valor, o triângulo de Pascal fica assim:

Números Combinatórios n n! Ou binomiais p = Cn,p =

(11)

P = 0 P = 1 P = 2 P = 3 P = 4 P = 5 P = 6 n = 0 1 n = 1 1 1 n = 2 1 2 1 n = 3 1 3 3 1 n = 4 1 4 6 4 1 n = 5 1 5 10 10 5 1 n = 6 1 6 15 20 15 6 1 . . .

Observe que o triângulo de Pascal continua infinitamente, à medida que vai aumentando o valor de n.

APLICAÇÕES

1- Em uma fábrica de parafusos um terço da produção é defeituosa. Em uma amostra de 6 parafusos, pergunta-se

a) Qual a probabilidade de que não tenham nenhum defeituoso?

b) Qual a probabilidade de que o número de parafusos defeituosos seja no máximo 2? c) Qual o número esperado de parafusos defeituosos?

d) Qual a dispersão em torno do número esperado de parafusos defeituosos? Solução

X = 0, 1, 2, 3, 4, 5, 6  defeituosos a) P(X = 0) = 6 . (1/3) 0.(2/3)6-0 = (2/3)6 = 64/729 0

(12)

= 496 / 729 = 68% c) E(X) =  xi.P(xi) = 0.64 / 729 + 1.192 / 729 + 2.240 / 729 + 3.160 / 729 + 4.60 / 729 5.12 / 729 + 6.1 / 729  E(X) = 2 defeituosos ou E(X) = n.p = 6.1/3 = 2 defeituosos d) V(X) = 2(X) = E(X2) - E(X)2 V(X) = 02.64/729 + 12.192/729 + 22.240/729 + 32.160/729 + 42.60/729 + 52.12/729 + 62.1/729 = 5,33 V(X) = 5,33 - 22 = 1,33 ou V(X) = n.p.q = 6.1/3.2/3 = 1,33  = 1,33 = 1,15

2- Num hospital 5 pacientes devem submeter-se a um tipo de operação da qual 80% sobrevivem. Qual a probabilidade de que:

a) Todos sobrevivem R 32,775 b) Pelos menos dois sobrevivem R 99,33% c) No máximo 3 não consigam sobreviver. R 99,33%

d) Qual é o número esperado de sobreviventes? R 4 sobreviventes 3- Se 2/3 da população de certo município não assistem regularmente a programas de

televisão e, colocando 250 pesquisadores cada um entrevistando 8 pessoas, estimar quantos desse pesquisadores informarão que até 2 das pessoas consultadas são telespectadores habituais.

Solução

X . Assistem regularmente televisão p = 1/3 q = 2/3 X = 0, 1, 2 P(X=0) = 8 .(1/3)0.(2/3)8 = 256/6561 0 P(X=1) = 8 .(1/3)1.(2/3)7 = 1024/6561 P(X  2) = 256 + 1024 + 1792 1 6561

(13)

P(X=2) = 8 .(1/3)2.(2/3)6 = 1792/6561 P(X) = 3072 = 46,82% 2 6561

Logo E(X) = n.p 250.(3072/6561) = 117,055  117 pesquisadores.

4- DISTRIBUIÇÃO HIPERGEOMÉTRICA

Quando a amostragem se faz sem reposição de cada item amostrado de uma população finita, não se pode aplicar o processo de Bernoulli, uma vez que exite uma mudança sistemática na probabilidade de sucesso á medida que os itens são retirados da população. A distribuição Hipergeométrica é uma distribuição discreta de probabilidade apropriada quando existe amostragem sem reposição em uma situação que, se não fosse por isso, seria um processo de Bernoulli.

Suponha-se que tenhamos um lote de N peças e M das quais são defeituosas.

Suponha-se que escolhemos, ao acaso n peças desse lote ( n  N); sem reposição. Seja X o

número de peças defeituosas encontradas. Desde que X = x se, e somente se, obtivermos exatamente k peças defeituosas ( dentre as M defeituosas do lote) e exatamente ( n - x) não defeituosas ( dentre as N - M não defeituosas do lote, teremos:

M N - M P(X = x) = x . n - x N n

PARÂMETROS DA DISTRIBUIÇÃO HIPERGEOMÉTRICA E(X) = n.p

V(X) = 2(X) = n.p.q. N - n

N - 1

E(x) =  xi.p(xi) =  xi. M N - M

x n - x (*) N

n APLICAÇÕES

1- Em uma sala há 6 homens e 5 mulheres. Uma comissão de 4 pessoas é formada ao acaso. Qual a probabilidade de que:

(14)

a) apareçam 3 homens na comissão, b) não apareça nenhum homem,

c) Qual o número esperado de homens na comissão e o número de mulheres? Solução

a)

N = 11 (total de pessoas)

n = 4 ( número de pessoas na comissão) M = 6 ( quantidade de homens)

N - M = 5 ( quantidade de mulheres) x = 3 (quantidade de homens na comissão) 6 5 P(X = 3) = 3 1 = 20.5/330 = 10 / 33 11 4 6 5 b) P(X = 0) = 0 4 = 1.5 / 330 = 1 / 66 11 4

c) E(X) = E(x) = 4.6/11 = 24/11 = 2,l8  2 homens

E(X) = E( N - x) = 4.5/11 = 20/11  2 mulheres

Poderia calcular E(X) usando a fórmula (*).

2- Uma caixa contém 12 lâmpadas das quais 5 estão queimadas. São escolhidas 6 lâmpadas ao acaso para iluminação de uma sala. Qual a probabilidade de que:

a) exatamente duas estejam queimadas? b) Pelo menos uma seja boa?

c) Pelo menos duas estejam queimadas?

d) Encontre o número esperado de lâmpadas queimadas e a dispersão em torno da média. Solução

X: lâmpadas queimadas

M: total de lâmpadas queimadas = 5 k: lâmpadas queimadas (ao acaso) n: número de lâmpadas (ao acaso) = 6 N: total de lâmpadas = 12. 5 7 a) P(X=2) = 2 4 = 10.35/924 = 350/924 12 6

(15)

b) X = 0, 1, 2, 3, 4, 5 P(X  5) = P(0) + P(1) + P(2) + P(3) + P(4) + P(5) = 5 7 5 7 5 7 5 7 5 7 5 7 0 6 + 1 5 + 2 4 + 3 3 + 4 2 + 5 1 12 12 12 12 12 12 6 6 6 6 6 6 = 7/924 + 105/924 + 350/924 + 350/924 + 105/924 + 7/924 = 924/924 = 1 = 100% c) P(X  2) = p(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 350 + 350 + 105 + 7 = 812 / 924 = 87,88% 924

d) E(X) = n.p = 6.5/12 = 2,5  2 lâmpadas queimadas

2(X) = V(X) = n.p.q. N - n = 6. 5/12. 7/12. 12 - 6 = 0,795 N - 1 12 - 1

2

(X) = 0,795 = 0,89  1 lâmpada

5-DISTRIBUIÇÃO DE POISSON

A distribuição de Poisson pode ser usada par determinar a probabilidade de um dado número de sucessos quando os eventos ocorrem em um continuum de tempo ou espaço. Tal processo, chamado de processo de Poisson é similar ao processo de Bernoulli, exceto que os eventos ocorrem em um continuum ao invés de ocorrerem em tentativas ou

observações fixadas. Um exemplo de tal processo é a chegada de chamadas em uma

central telefônica. Tal como no caso do processo de Bernoulli, supõe-se que os eventos são independentes e que o processo é estacionário (a média não altera dentro da especificação). Somente um valor é necessário para determinar a probabilidade de um dado número de sucessos em um processo de Poisson: o número médio de sucessos para a específica dimensão de tempo ou espaço de interesse. Este número médio é geralmente representado

por  ou . A fórmula para determinar a probabilidade de um dado número X de sucessos

(16)

P(X / ) = X.e- e = 2,71828... X!

PARÂMETRO DA DISTRIBUIÇÃO DE POISSON E(X) =  e V(X) = 2 = 

EXEMPLOS

1- Em um cruzamento de 2 ruas o número médio de acidentes é igual a 2 semanais. Determinar

a) a probabilidade de que uma determinada semana ocorram 3 acidentes. b) A probabilidade de que não ocorra nenhum acidente

c) A probabilidade de que ocorra acidente. Solução X = 0, 1, 2, 3, ..., n a) P(X = 3) = 23.e-2 = 8/6.2,7183-2 = 4/3.0,13534 = 0,18 = 18% 3! b) P(X = 0) = 20.e-2 = 0,13534 = 13,53% 0! d) P(X  1) = 1 - P(X = 0) = 1 - 0,13534 = 0,86466 = 86,47%

2- Um departamento de conserto de máquinas recebe uma média de cinco chamadas por hora. A probabilidade de que menos do que três chamadas sejam recebidas durante uma hora aleatoriamente escolhida é:

P(X < 3) /  = 5) = P(X  2) = P(X = 0) + P(X = 1) + P(X = 2) = 50.e-5 + 51.e-5 0! 1! + 52.e-5 = 0,0067 + 0,0337 + 0,0842 = 0,1248 = 12,5% 2!

EXERCÍCIOS

DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES

1- Descobriu-se que a chegada de clientes a um Banco, durante intervalos aleatoriamente escolhidos de 10minutos, segue a distribuição de probabilidade da

(17)

tabela, abaixo. Calcular o número esperado de chegadas por intervalo de 10 minutos bem como calcular a variância das chegadas. E(X) = 2, V(X) = 1,9

Nº de chegadas X 0 1 2 3 4 5 Probabilida -de P(X) 0,15 0,25 0,25 0,20 0,10 0,05

2- Em um levantamento recente, a probabilidade de que um acidente de carro é causado por um motorista embriagado é cerca de 0,229. Nos próximos três acidentes, qual a é probabilidade de que:

a) exatamente um acidente seja causado por um motorista embriagado? 40,8% b) No mínimo um acidente seja causado por um motorista embriagado? 57,6% c) Se você tem os seguintes resultados de probabilidade de acidentes causados por

motoristas embriagados nos 10 próximos acidentes: Pdf (*) Cdf (**) 0 0,0742 0,0742 1 0,2205 0,2947 2 0,2947 0,5893 3 0,2334 0,8227 4 0,1213 0,9440 5 0,0432 0,9873 6 0,0107 0,9980 7 0,0018 0,9998 8 0,0002 1,0000 9 0,0000 1,0000 10 0,0000 1,0000

(*) pdf - Probability Distribution Function (Função de Distribuição de Probabilidade) (**) Cdf - Cumulative Distribution Function ( Função de Distribuição Cumulativa) 1- ache P(x=3) 23,34% 2- ache P(5  x  9) 1,27%

3- qual é a média e a variância da distribuição tabulada acima? =2,29, ² =1,77

3- Existem 90% de probabilidade de que um certo tipo de componente se comporte de forma adequada sob condições de elevadas temperatura. Se o dispositivo em questão tem quatro de tais componentes, determinar, por meio da fórmula de probabilidades binomiais a probabilidade de cada um dos eventos.

a) Todos os componentes se comportam de forma adequada, por conseguinte, o dispositivo funciona. 65,61% b) O dispositivo não funciona por falhar um dos quatro componentes. 29,16% c) O dispositivo não funciona por que falham um ou mais dos componentes. 34,39%

(18)

4-Suponha que 40% dos empregados horistas de uma grande empresa estejam a favor da representação sindical e que se peça uma resposta anônima a uma amostra aleatória de 10 empregados. Qual a probabilidade de estarem a favor da representação sindical:

a) a maior parte dos que responderam? 16,08% b) Menos da metade dos que responderam? 63,92% 5- De 20 estudantes em uma classe, 15 não estão satisfeitos com o texto utilizado. Se uma amostra aleatória de quatro alunos se perguntar sobre o texto, determinar a probabilidade de que estivessem descontentes com o texto:

a) exatamente três estudantes. 46,96% b) No mínimo três estudantes. 75,13% 6- Somente um de cada mil geradores montados em uma fábrica apresenta defeitos, sendo que os geradores defeituosos se distribuem aleatoriamente ao longo da produção.

a) Qual a probabilidade de que um carregamento de 500 geradores não inclua gerador defeituoso algum? 60,65% b) Qual a probabilidade de um carregamento de 100 geradores contenha no mínimo

um gerador defeituosos? 9,52% 7- Suponha que a probabilidade de que um item produzido por uma máquina seja

defeituoso é de 0,2. Se dez itens produzidos por essa máquina são selecionados ao acaso, qual a probabilidade de que não mais do que um defeituoso seja encontrado? Use a binomial e a distribuição de Poisson e compare os resultados. Pb = 37,58% e Pp = 40,6%

8- Num certo tipo de fabricação de fita magnética, ocorrem corte a uma taxa de um por 2000 pés. Qual a probabilidade de que um rolo com 2000 pés a fita magnética tenha: a) nenhum corte? 36,79% b) No máximo 2 cortes? 91,97% c) Pelo menos dois cortes? 26,42% 9- Numa central telefônica, o número de chamadas chega segundo uma distribuição de

Poisson, com a média de 8 chamadas por minuto. Determinar a probabilidade de que num minuto aleatoriamente escolhido se tenha.

a) três ou mais chamadas 98,62% b) menos do que 5 chamadas 9,96% c) entre 7 (inclusive) e nove (exclusive) chamadas. 27,92% 10- Uma máquina, fabrica placas de papelão que podem apresentar nenhum defeito, um,

dois, três ou quatro defeitos, com probabilidade 90%, 5%, 3%, 1% e 1%, respectivamente. O preço de venda de uma placa perfeita é 10 u.m. e à medida que apresente defeito, o preço cai 50% para cada defeito apresentado. Qual o preço médio de venda destas placas? E(x) = 9,34 u.m 11- Uma empresa distribuidora costuma falhar em suas entregas de mercadorias 15% das

vezes, por atraso na entrega, mercadoria fora de especificação danos, etc. causando reclamações por parte dos clientes. Calcule a probabilidade de:

a) não ocorrer reclamações nas 10 entregas de hoje. R 19,69% b) Acontecer pelo menos uma reclamação nas 4 primeiras entregas. R 47,80%

(19)

c) Acontecer no máximo uma reclamação nas 10 entregas. R 54,43% 12- Em um pedágio de determinada rodovia chegam em média 600 carros por hora.

Determine a probabilidade de :

a) chegarem exatamente 10 carros em um minuto R: 12,51% b) chegarem menos que 5 caros em um minuto R:2,92%

II-DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE : EXPONENCIAL E NORMAL

1– DISTRIBUIÇÃO DE PROBABILIDADE EXPONENCIAL

É uma distribuição de Poisson, uma vez que o tempo ou espaço são um continuum(distribuição contínua).

Uma vez que o processo de Poisson é estacionário, a distribuição exponencial aplica-se quer estejamos interessados com o tempo entre dois eventos sucessivos, ou quer no tempo decorrido até acontecer o primeiro evento após um ponto aleatoriamente selecionado A probabilidade exponencial de que o primeiro evento ocorrerá dentro do intervalo especificado de tempo ou espaço é:

P(T  t) = 1 – e-

A probabilidade exponencial de que o primeiro evento não ocorrerá dentro do intervalo especificado de tempo ou espaço é:

P(T > t) = e-

PARÂMETROS DA DISTRIBUIÇÃO EXPONENCIAL E(t) = 1/

V(T) = 1/² EXEMPLOS

1- Um departamento de conserto de máquinas recebe em média, 5 chamadas por hora. Iniciando em um ponto do tempo aleatoriamente escolhido, qual a probabilidade de que a primeira chamada chegue dentro de meia hora?

Solução

/hora = 5   = 2,5

(20)

2- Em média, um navio atraca um certo porto a cada 2 dias. Qual a probabilidade de que, a partir da partida de um navio, se passem 4 dias antes da chegada do próximo navio?

Solução

Média a cada 2 dias = 1

 = média pó período de 4 dias = 1.2 = 2

Logo P(T > 4 ) = e- = e-2 = 0,1353 = 13,53%

EXERCÍCIO

Em média seis pessoas por hora se utilizam de um caixa-automático de um banco em uma grande loja de departamentos.

a) Qual a probabilidade de que se passem pelo menos 10 minutos entre a chegada de dois clientes? R. 0,3678

b) Qual a probabilidade de que, depois da saída de um cliente, não se apresente outro em pelo menos 20 minutos R.0,1353

c) Qual a probabilidade de que chegue um segundo cliente dentro de 1 minuto após a chegado do primeiro R0,0952

2-DISTRIBUIÇÃO NORMAL

A distribuição normal de probabilidade é uma distribuição de probabilidade contínua que é simétrica ( X = Me = Mo) e mesocúrtica K = Q3 - Q1 = 0,263 2(P90 - P10)

A curva que representa a distribuição normal de probabilidade é freqüentemente descrita como tendo uma forma de sino, como segue o exemplo.

F(X)

(21)

A distribuição de probabilidade normal é importante na inferência estatística por três razões distintas.

1- As medidas produzidas em diversos processos aleatórios seguem esta distribuição 2- Probabilidades normais podem ser usadas freqüentemente como aproximações de

outras distribuições de probabilidades, tais como as distribuições Binomiais e de Poisson.

3- As distribuições de estatísticas da amostra tais como a Média e a Proporção freqüentemente seguem a distribuição normal independentemente da distribuição da população.

Como para qualquer distribuição contínua de probabilidade, o valor da probabilidade pode somente ser determinado para um intervalo de valores da variável. A altura da função densidade, ou curva de probabilidade, para uma variável normalmente distribuida é dada por: -1/2( x - )2 f(x) = l .e  2 .  onde:  = 3,14159... e = 2,7183... : é a média da distribuição

: é o desvio padrão da distribuição

Em particular, a distribuição normal de probabilidade com  = 0 e  = 1 é conhecida como distribuição normal padronizada(reduzida), na qual as tabelas de probabilidades da normal são construídas.

Qualquer conjunto de valores de X normalmente distribuídos pode ser convertido em valores normais padronizados Z pelo uso da fórmula.

Z = x -   Logo -1/2.z2 -z2/2 f(x) = 1 .e = 1 . e (-oo, + oo) 2 . 2 .

(22)

f(z) -3 -2 -1 0 1 2 3 z   Parâmetros da distribuição N(, ) E(x) =  = 0 V(x) = 2 = 1  N ( 0 , 1) Exemplos

1- As alturas dos alunos de uma determinada escola são normalmente distribuídas com média de 1,60 m e desvio padrão 0,30 m. Encontre a probabilidade de um aluno aleatório medir:

a) entre 1,50m e 1,80m

b) mais de 1,75 m

(23)

d) qual deve ser a medida mínima para escolher 10% dos mais altos?

e) abaixo de qual estatura estão os 20% mais baixos?

2- Sabe-se que a vida útil de um componente elétrico segue uma distribuição normal

com média  = 2000 horas e desvio padrão  = 200 horas, determine.

a) a probabilidade de que um componente aleatoriamente selecionado dure entre 2000 e 2400 horas 47,72% b) a probabilidade de que um componente aleatoriamente selecionado dure mais do

que 2200 horas. 15,87% c) a probabilidade de que um componente aleatoriamente selecionado dure entre 1500

e 2100 horas. 68,53% d) A probabilidade de que um componente aleatoriamente selecionado dure entre 2100

e 2500 horas. 30,23%

2- APROXIMAÇÃO PELA NORMAL DAS PROBABILIDADES BINOMIAIS Quando o número de observações ou tentativas forem relativamente grande, a distribuição de probabilidade normal pode ser utilizada para a aproximações das probabilidades binomiais.

Regra aceitável n  30 "regra de bolso" n.p  5 n.(1 - p)  5

(24)

Para uso da distribuição normal de probabilidade como uma aproximação da distribuição de probabilidade binomial, a média e o desvio padrão se baseiam no valor esperado e na variância do número de sucessos de uma distribuição binomial, ou seja: E(x) =  = n.p

 = n.p.(1 - p) Aplicações

1- Para um grande número de clientes potenciais, sabe-se que 20% dos contactados pessoalmente por agentes de vendas realizarão uma compra. Se um representante de vendas visita 30 clientes potenciais, podemos determinar a probabilidade de que 10 ou mais farão uma compra.

a) utilizando as probabilidades binomiais.

b) Utilizando a aproximação normal do valor de probabilidade binomial. Solução a) P(x  10) = ... 6,11% b)  = n.p = 30.2/10 = 6  = n,p.(1-p) = 30.0,2.0,8 = 2,19 P binomial (x  10) = Pbin.( x  9,5 / = 6,  = 2,19) = …. = 5,48%

Obs. Supõe-se que a classe de eventos "10 ou mais começa em 9,5 quando se utiliza a aproximação normal. Esta subtração de meia unidade é chamada correção de

(25)

entre 9 e 10 sucessos, a área sob a curva normal deve ser distribuída entre duas classes adjacentes. Se no exemplo, fosse pedida a probabilidade de "mais de 10" sucessos, a correção apropriada de continuidade implicaria adicionar 0,5 a 10 e determinar a área do intervalo começando em 10,5.

A correção de continuidade tem um efeito muito pequeno e pode, portanto, ser omitida quando existir um grande número de valores da viável X.

Portanto Pbin(x  10) = P(x  9,5) = ....

2- Uma moeda é lançada 12 vezes. Determinar a probabilidade de que o número de coroas ocorra entre 4 e 7 inclusive o 4 e o 7.

a) pela distribuição binomial b) pela distribuição normal

3- APROXIMAÇÃO PELA NORMAL DAS PROBABILIDADES DE POISSON

Quando a média  de uma distribuição de Poisson for relativamente grande a

distribuição normal de probabilidade pode ser usada como uma aproximação das probabilidades de Poisson. Uma regra conveniente é que tal aproximação é aceitável quando   10.

A média e o desvio padrão da distribuição normal de probabilidade, n o caso, baseiam-se no valor esperado e na variância do número de sucessos em uma processo de Poisson, ou seja:

 =   =  Aplicação

Um departamento de conserto de máquinas recebe em média, 10 chamadas em cada período de 8 horas. Podemos determinar a probabilidade de que mais de 15 chamadas serão recebidas em um período de 8 horas aleatoriamente escolhido.

a) pela distribuição de Poisson b) pela distribuição normal

(26)

4-

Métodos de Amostragem e Distribuições Amostrais

OBJETIVOS DO CAPÍTULO:

 Explicar porque em muitas situações uma amostra é a única forma plausível de

aprender alguma coisa sobre uma população.

 Explicar os métodos de selecionar uma amostra

 Distinguir entre amostragem probabilística e amostragem não probabilística

 Definir e construir uma distribuição amostral de médias amostrais

 Explicar o Teorema do Limite Central e sua importância para a Inferência Estatística

 Calcular Intervalos de Confiança para Médias e Proporções

 Determinar que tamanho uma amostra deve ter para estimar médias e proporções

Porque amostrar uma população

 Natureza destrutiva de certos testes

 A impossibilidade física de checar todos os itens na população

 O custo de estudar todos os itens em uma população é freqüentemente proibitivo

 Muitas vezes as estimativas baseadas em uma amostra são mais precisas do que os

resultados obtidos através de um levantamento censitário

 Tempo muito elevado para a apuração de resultados em censos

6.1 Amostragem Probabilística

 O que é uma amostragem probabilística ?

 É uma amostra selecionada de tal forma que cada item ou pessoa na população estudada

têm uma probabilidade (não nula) conhecida de ser incluída na amostra.

Métodos de Amostragem Probabilística:

(27)

Uma amostra escolhida de tal forma que cada item ou pessoa na população tem a mesma probabilidade de ser incluída.

Se a população tem um tamanho N, cada pessoa desta população tem a mesma probabilidade igual a 1/N de entrar na amostra. Utilizamos uma tabela de números aleatórios para sortear (com mesma probabilidade) os elementos da amostra. Também pode ser utilizada uma função randômica: No Excel, por exemplo, temos a função ALEATÓRIO ENTER.

Amostragem Aleatória Sistemática

Os itens ou indivíduos da população são ordenados de alguma forma – alfabeticamente ou através de algum outro método. Um ponto de partida aleatório é sorteado, e então cada k-ésimo membro da população é selecionado para a amostra.

Amostragem Aleatória Estratificada

A população é inicialmente dividida em subgrupos (estratos) e uma subamostra é selecionada a partir de cada estrato da população.

Amostragem aleatória Estratificada com Repartição Proporcional

Suponhamos que a população é subdividida em k estratos. Sejam: N = o número de indivíduos na população

n = o número de indivíduos na amostra

Ni = o número de indivíduos contidos no i-ésimo estrato da população

ni = o número de indivíduos contidos no i-ésimo estrato na amostra

k

1,2,....,

i

N

N

n

n

i i

os estratos devem ser o mais homogêneos possíveis com relação às características relevantes da pesquisa (variáveis que se correlacionam fortemente com a variável estudada) para um mesmo tamanho amostral, a amostragem aleatória estratificada com repartição proporcional é mais precisa (menor variância do estimador) do que a amostragem aleatória simples (AAS).

Amostragem Aleatória Estratificada com Repartição de Neyman (ou repartição

(28)

Se conhecermos a variância de cada estrato populacional referente a variável que estamos desejando estimar o seu parâmetro, um método mais adequado é o da repartição de Neyman.

 

k i i i i i k i i i i i

N

N

n

W

w

n

n

i 1 1

para um mesmo tamanho amostral a precisão é maior para amostra aleatória estratificada com repartição de Neyman (repartição ótima) do que para a amostra aleatória estratificada com repartição proporcional que por sua vez é maior do que a amostra aleatória simples

Amostragem por Conglomerados

A população é inicialmente subdividida inicialmente em subgrupos (estratos) e uma amostra de estratos é selecionada (por exemplo, com probabilidade proporcional ao tamanho de cada estrato). A seguir, amostras são selecionadas dos estratos selecionados previamente.

A principal vantagem da amostra por conglomerados é a de possibilitar considerável redução de custos (em relação por exemplo a uma amostragem aleatória estratificada) para um mesmo tamanho amostral.

O método costuma ser empregado quando não dispomos de um cadastro da população (como no caso da amostragem sistemática) e os custos de ser elaborado um cadastro para toda a população é muito elevado.

 Erro amostral: A diferença entre a estatística amostral e seu correspondente parâmetro.

 Uma distribuição de probabilidade consiste de uma lista de todos os possíveis valores

das médias amostrais de um dado tamanho amostral constante selecionado da população e a probabilidade de ocorrência associada a cada média amostral.

Exemplo 1 – Uma empresa tem 5 sócios. Semanalmente, os sócios relatam o número

de horas de atendimento a clientes

Sócio Horas 1 22 2 26 3 30 4 26 5 22

(29)

 Dois sócios são selecionados aleatoriamente. Quantas amostras ‘distintas são possíveis?

 O número de amostras distintas de dois elementos tomados em 5 objetos corresponde a:

10

)

!

3

)(

!

2

(

!

5

2 5

C

Sócios Total Média

1,2 48 24 1,3 52 26 1,4 48 24 1,5 44 22 2,3 56 28 2,4 52 26 2,5 48 24 3,4 56 28 3,5 52 26 4,5 48 24

 Organize as médias amostrais em uma distribuição de freqüências.

Média Amostral

freqüência Freqüência Relativa

(Probabilidade)

22 1 1/10

24 4 4/10

26 3 3/10

28 2 2/10

 Calcule a média das médias amostrais e compare-a com a média da população.

 A média da população é: 2 , 25 5 22 26 30 26 22     

 A média das médias amostrais é:

2 , 25 10 ) 2 )( 28 ( ) 3 )( 26 ( ) 4 )( 24 ( ) 1 )( 22 (    

(30)

6.2 Teorema do Limite Central

 Para uma população com média  e uma variância 2, a distribuição amostral das

médias de todas as possíveis amostras de tamanho n, geradas a partir da população, será aproximadamente normalmente distribuída – com a média da distribuição amostral

igual e variância igual 2/n - assumindo que o tamanho amostral é

suficientemente grande, ou seja, n30.

Em outras palavras, se a população tem qualquer distribuição (não precisa ser

necessariamente normal) com média igual a e variância igual a 2 , então a

distribuição amostral dos valores médios amostrais é normalmente distribuída com a

média das médias (

X

) igual a média da população (

X

) e o erro

padrão das médias amostrais igual a

n

, desde que n30.

 Note que o erro padrão das médias amostrais mostra quão próximo da média da

população a média amostral tende a ser.

 O erro padrão das médias amostrais é calculado por:

n

X

X

X

é o símbolo para o erro padrão das médias amostrais

X

é o desvio padrão da população

n é o tamanho da amostra

Se

não é conhecido e n  30 (considerada uma amostra grande), o desvio padrão da

amostra, designado por s, é usado para aproximar o desvio padrão da população,

. A

fórmula para o erro padrão torna-se:

n

s

s

X

(31)

onde

1

)

(

1 2

n

X

X

s

n i i 6.3 Estimativa de Ponto

 Estimativa de ponto é um valor (chamado um ponto) que é usado para estimar um

parâmetro populacional

 Exemplos de estimativas de ponto são a média amostral, o desvio padrão amostral, a

variância amostral, a proporção populacional, etc.

Exemplo: O número de itens defeituosos produzidos por uma máquina foi registrado em cinco horas selecionadas aleatoriamente durante uma semana de trabalho de 40 horas. O número observado de defeituosos foi 12,4,7,14 e 10. Portanto, a média amostral é 9,4. Assim a estimativa de ponto para a média semanal do número de defeituosos é 9,4.

6.4 Estimativa de Intervalo

 Uma Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um

parâmetro populacional provavelmente cai.

 O intervalo dentro do qual um parâmetro populacional é esperado ocorrer é chamado de

intervalo de confiança.

 Os intervalos de confiança que são extensivamente usados são os de 95 % e 99 %.

 Um intervalo de confiança de 95 % significa que cerca de 95 % dos intervalos

construídos similarmente conterão o parâmetro que está sendo estimado.

 Outra interpretação do intervalo de confiança de 95 % é que 95 % das médias amostrais

para um tamanho de amostra especificado cairão a uma distância máxima de 1,96 desvios padrões da média populacional.

 Para o intervalo de confiança de 99 %, 99 % das médias amostrais para um tamanho

amostral especificado cairão a uma distância máxima de 2,58 desvios padrões da média populacional.

Os intervalos de confiança para 95 % e 99 % são construídos como segue, para n  30:

O IC de 95 % para a média populacional

é dado por:

n

s

X

1

,

96

(32)

n

s

X

2

,

58

 Em geral, um intervalo de confiança para a média, é calculado por:

n

s

Z

X

onde Z é obtido da tabela de distribuição normal padrão. Exemplo 2

Uma universidade quer estimar o número médio de horas trabalhadas por semana por seus estudantes. Uma amostra de 49 estudantes mostrou uma média de 24 horas com um desvio padrão de 4 horas.

A estimativa de ponto do número médio de horas trabalhadas por semana é 24 horas (média amostral).

Qual é o intervalo de confiança de 95 % para o número médio de horas trabalhadas por semana ?

Usando a fórmula anterior (

n

s

X

1

,

96

) temos

49

4

96

,

1

24

ou 22,88 a

25,12. O limite de confiança inferior é 22,88. O limite superior de confiança é 25,12. O grau de confiança (nível de confiança) utilizado é 0,95.

Interprete os resultados

 Se nós tivéssemos tempo para selecionar aleatoriamente 100 amostras de tamanho 49 da

população de alunos do campus e calcular as médias amostrais e os intervalos de confiança para cada uma destas 100 amostras, a média populacional (parâmetro) do número de horas trabalhadas estaria contida em cerca de 95 dos 100 intervalos de confiança. Cerca de 5 dos 100 intervalos de confiança não conteriam a média populacional.

6.5 Intervalo de Confiança para Uma Proporção Populacional

Um intervalo de confiança para uma proporção populacional é dado por:

p

Z

p

(33)

p

é a proporção amostral

p

é o erro padrão da proporção amostral e é dado por:

n

p

p

p

)

1

(

O intervalo de confiança é construído por:

n

p

p

p

Z

(

1

)

onde:

p

é a proporção amostral

Z é o valor da variável normal padrão para o grau de confiança adotado. n é o tamanho amostral

Exemplo 3

Um planejador financeiro está estudando os planos de mudança de jovens executivos. Uma amostra de 500 jovens executivos que possuem suas próprias casas revelou que 175 planejam vendê-las e retirarem-se para o interior do País. Construa um intervalo de confiança de 98 % para o parâmetro proporção populacional de executivos que planejam mudar para o interior.

 Aqui n = 500,

0

,

35

500

175

p

e Z = 2,33 (para  0,98  níveldeconfiançaadotado)

 O CI de 98 % é ou 0,35 0,0497 500 ) 65 , 0 ( ) 35 , 0 ( 33 , 2 35 , 0    Interprete a resposta

6.6 Fator de Correção de População Finita

 Uma população que tem um limite superior definido é chamada de finita. Em

estatística, considera-se como população finita quando 0,05

N

n (ou seja, quando a

(34)

Para uma população finita, onde o número total de objetos é N e o tamanho da amostra é n, o seguinte ajuste é feito para os erros padrões da média amostral e da proporção amostral.

 Erro padrão da média amostral:

1

N

n

N

n

X

 Erro padrão da proporção amostral:

1

)

1

(

N

n

N

n

p

p

p

 Este ajuste é chamado de Fator de Correção de População Finita (FCPF)

Nota: se

0

,

05

N

n

, o fator de correção de população finita é ignorado.

Exemplo 4

A universidade do exemplo 2 quer estimar o número médio de horas trabalhadas por semana pelos estudantes. Uma amostra de 49 estudantes mostrou uma média de 24 horas e um desvio padrão de 4 horas. Construa um intervalo de confiança para o número médio de horas trabalhadas se há somente 500 estudantes no campus.

 Agora

0

,

098

0

,

05

500

49

N

n

. Portanto, temos que usar o FCPF

22

,

93

;

25,11

1

500

49

500

49

4

96

,

1

24

6.7 Selecionando uma Amostra

 Há 3 fatores que determinam o tamanho de uma amostra, nenhum dos quais tendo uma

relação direta com o tamanho da população. Eles são: 1. O grau de confiança adotado

2. O máximo erro permissível 3. A variabilidade da população

(35)

2

E

Zs

n

onde: E é o erro permissível

Z é o valor da variável normal padrão associado ao grau de confiança adotado s é o desvio padrão da amostra piloto

Exemplo 5

Um grupo de consumidores deseja estimar a média de gasto mensal em eletricidade para um domicílio familiar simples em Julho. Baseado em estudos similares o desvio padrão é estimado como sendo R$ 20,00. Deseja-se construir um intervalo de confiança de 99 %

com um erro máximo admissível de

R

$

5

,

00

. Qual deve ser o tamanho da amostra?

  

107

50

,

106

5

20

58

,

2

2

n

6.8 Tamanho Amostral para Estimativa de Proporções

A fórmula para determinar o tamanho amostral no caso de estimativa de proporções é:

2

)

1

(

E

Z

p

p

n

onde

p

é a proporção estimada, baseada na experiência passada ou em uma amostra piloto

Z é o valor da variável normal padrão associado ao grau de confiança adotado. E é o máximo erro permissível que o pesquisador tolera.

(36)

 Um clube deseja estimar a proporção de crianças que tem um cachorro. Se o clube deseja que a estimativa esteja no máximo afastada 3 % da proporção populacional, quantas crianças devem conter a amostra? Assuma um intervalo de confiança de 95 % e que o clube estimou, com base em experiência anterior, que aproximadamente 30 % das crianças têm um cachorro.



893

,

4

893

03

,

0

96

,

1

70

,

0

30

,

0

2

n

7

.

Teste de Hipóteses – Amostras Grandes

OBJETIVOS:

 Definir hipóteses e Testes de Hipóteses

 Descrever os 5 passos do procedimento de Teste de Hipóteses

 Distinguir entre Teste de Hipóteses Unicaudal e Bicaudal

 Realizar um teste para a média populacional

 Realizar um teste para a diferença entre duas médias ou proporções populacionais

 Descrever os erros estatísticos associados aos testes de hipóteses

Nota:

 Se nada é conhecido acerca da população, a estimação é usada para fornecer uma

estimativa de ponto e de intervalo acerca da população.

 Se alguma informação acerca da população é proposta ou suspeitada, o Teste de

Hipóteses é usado para determinar a plausibilidade desta informação.

O que é uma hipótese ?

 Hipótese: uma sentença sobre o valor de um parâmetro populacional desenvolvida para

o propósito de teste.

 Exemplos de hipóteses, ou sentenças, feitas acerca de um parâmetro populacional são:

 A renda média mensal proveniente de todas as fontes para os analistas de sistemas é de

US 3625

 Vinte por cento de todos os transgressores juvenis são presos e sentenciados a prisão.

(37)

 Teste de Hipóteses: um procedimento, baseado na evidência amostral e na teoria da probabilidade, usado para determinar se a hipótese é uma afirmação razoável e não seria rejeitada, ou é não razoável e seria rejeitada.

 A seguir são propostos 5 passos para um teste de hipóteses:

Passo 1: Estabeleça a Hipótese Nula e a Hipótese Alternativa Passo 2: Selecione um nível de significância

Passo 3: Identifique a Estatística de teste Passo 4: Formule uma regra de decisão

Passo 5: Tome uma amostra e obtenha uma decisão: Não rejeitar H0 ou rejeitar H0 e

aceitar H1

 Hipótese Nula H0: Uma afirmação (sentença) sobre o valor de um parâmetro

populacional

 Hipótese Alternativa H1: Uma afirmação (sentença) que é aceita se os dados amostrais

fornecem evidência de que a hipótese nula é falsa.

 Nível de Significância: A probabilidade de rejeitar a hipótese nula quando ela é

efetivamente verdadeira, ou seja, valor de  (alfa)

Erro Tipo I: Rejeitar a Hipótese Nula, H0, quando ela é efetivamente verdadeira. A

probabilidade do erro tipo I é igual ao nível de significância,  (alfa).

Erro Tipo II: Aceitar a Hipótese Nula, H0, quando é efetivamente falsa. A

probabilidade do erro tipo II é igual a  (beta)

Tipos de Erros

Aceita H0 Rejeita H0

H0 é verdadeira Decisão Correta Erro Tipo I

H0 é falsa Erro Tipo II Decisão Correta

(38)

Estatística de Teste (ou z efetivo ou valor de t): Um valor, determinado a partir da informação amostral, usado para determinar se devemos ou não rejeitar a hipótese nula.

 Valor Crítico (ou z crítico ou valor de t): O ponto divisor entre a região onde a hipótese

nula é rejeitada e a região onde ela não é rejeitada. Este valor é obtido a partir da tabela de z (normal padrão) ou da tabela de t (t de Student).

7.1 Testes de Significância Unicaudais

 Um teste é unicaudal quando a hipótese alternativa, H1, estabelece uma direção tal

como:

 H0: A renda média das mulheres é menor que ou igual a renda média dos homens.

 H1: A renda média das mulheres é maior que a renda média dos homens.

 A região de rejeição neste caso é a cauda direita (superior) da curva.

Figura com distribuição normal mostrando a região de rejeição para um teste unicaudal

7.2 Testes de Significância Bicaudais

 Um teste é bicaudal quando não existe uma direção especificada para a hipótese

alternativa H1, tal com:

 H0: A renda média das mulheres é igual a renda média dos homens.

 H1: A renda média das mulheres não é igual a renda média dos homens.

 A região de rejeição neste caso é dividida igualmente em duas caudas da curva.

Figura com distribuição normal mostrando a região de rejeição para um teste bicaudal (distribuição amostral para a estatística z para um teste bicaudal, 0.05 de nível de significância.

Testando a Média Populacional: Amostra Grande, Desvio Padrão da População é conhecido.

(39)

n

X

z

Exemplo 1

 Os processadores de uma indústria indicam o ponto (marca) que a garrafa contem 16

onças (medida inglesa de peso) do produto. O Departamento de Controle de Qualidade é responsável pelo controle da quantidade incluída na garrafa. Uma amostra de 36 garrafas é selecionada por hora e o seu conteúdo pesado. Na última hora uma amostra de 36 garrafas apresentou um peso médio de 16,12 onças com um desvio padrão de 0,5 onças.

 Ao nível de significância de 0,05 podemos concluir que o processo está fora de

controle?

Passo 1: Estabelecer a Hipótese Nula e a Hipótese Alternativa:

16

:

H

16

:

1

0

H

Passo 2: Estabelecer a regra de decisão:

H0 é rejeitado se o z (efetivo – calculado com base nos valores amostrais) < -1,96 ou z >

1,96.

Passo 3: calcule o valor da estatística de teste ( z efetivo)

44

,

1

]

36

5

,

0

[

]

16

12

,

16

[

z

Passo 4: Qual é a decisão sobre H0?

(40)

7.3 P-value de um Teste de Hipótese

 P-value: Esta é a probabilidade (considerando que a hipótese nula é verdadeira) de ter

um valor para a estatística de teste no mínimo tão extremo como o valor calculado (efetivo) para o teste.

 Se o p-value é menor que o nível de significância (alfa), H0 é rejeitada.

 Se o p-value é maior que o nível de siginificância (alfa), H0 não é rejeitada.

7.4 Cálculo do P-value

 Teste Unicaudal (para a direita ou cauda superior):

p-value = P{z  valor da estatística de teste calculada}

 Teste Unicaudal (para a esquerda ou cauda inferior):

p-value = P{z  valor da estatística de teste calculada}

 Teste Estatístico Bicaudal

p-value = 2P{z valor absoluto do valor da estatística de teste calculado}

Para o exemplo anterior, z = 1,44, e desde que era um teste bicaudal, então o

p-value = 2P{z 1,44}2(0,50,4251)0,1498. Desde que 0,1498 > 0,05, não é rejeitada H0.

Testando para a Média Populacional: Grandes Amostras, Desvio Padrão Populacional desconhecido

 Aqui  é desconhecido, portanto o estimamos com o desvio padrão amostral s.

 Quanto maior for o tamanho amostral for n  30, o z efetivo pode ser aproximado com

n

s

X

(41)

Exemplo 2

 A cadeia de Lojas Arjo emite o seu próprio cartão de crédito. O administrador de

crédito quer verificar se o saldo não pago mensal é maior do que US$ 400. O nível de significância é fixado em 0,05. Uma amostra aleatória de 172 saldos não pagos revelou uma média amostral de US$ 407 e o desvio padrão amostral de US$ 38. O admistrador de crédito pode concluir que a média populacional é maior que US$ 400, ou é razoável assumir que a diferença de US$ 7 (US$ 407 – US$ 400 é devido a chance (variação aleatória)?

 Etapa 1: Estabeleça a Hipótese Nula e a Hipótese Alternativa.

0: 400 H :1 400

H  

 Etapa 2: Estabeleça a regra de decisão.

H0 é rejeitada se o z (efetivo) > 1,645.

 Etapa 3: Calcule o valor da estatística de teste.

42 , 2 172 38 400 407    z

 Etapa 4: Qual é a decisão sobre H0?

H0 é rejeitada. O administrador conclui que a média dos saldos nào pagos é maior do que

US$ 400.

Figura ilustrando a região de rejeição do exemplo

7.5 Teste de Hipóteses: Duas Médias Populacionais

 Assuma que os parâmetros para duas populações são:

1

,

2

,

1

e

2.

(42)

2 2 2 1 2 1 2 1

n

n

X

X

z

 Caso II: Quando

1

,

2 não são conhecidos mas os tamanhos amostrais n1 e n2 são

maiores ou iguais a 30, a estatística de teste (Z efetivo) é:

2 2 2 1 2 1 2 1

n

s

n

s

X

X

z

Exemplo 3

 Na indústria X foi realizado um estudo para comparar o número médio de anos de

serviço para aqueles que se aposentaram em 1975 com aqueles que se aposentaram no último ano. Os seguintes dados amostrais foram obtidos. A um nível de significância de 0,01 podemos concluir que os trabalhadores que se aposentaram no último ano tiveram mais anos de serviço?

Característica 1975 Último ano

Média Amostral 25,6 30,4

Desvio Padrão Amostral 2,9 3,6

Tamanho amostral 40 4,5

 Estabeleça a Hipótese Nula e a Hipótese Alternativa

Considere que a população 2 é aquela dos que se aposentaram no último ano. 1 2 1 1 2 0

:

H

:

H

 Estabeleça a regra de decisão

Rejeitar H0 se o z (efetivo) > 2,33.

(43)

80

,

6

40

9

.

2

45

6

,

3

6

,

25

4

,

30

2 2

z

 Nota: Desde que neste problema estamos testando para:

 H0 :

2

1

Precisamos trocar as posições das variáveis na equação do z efetivo (a seguinte equação).

2 2 2 1 2 1 2 1

n

s

n

s

X

X

z

Z efetivo

 Qual é a decisão sobre a hipótese nula ? Interprete os resultados?

Desde que o Z efetivo = 6,80 > Z crítico = 2,33, H0 é rejeitada. Aqueles que se aposentaram

no último ano tiveram mais anos de serviço.

LISTA DE EXERCÍCIOS- ESTATÍSTICA II:

ASSUNTO: INTERVALO DE CONFIANÇA E TESTE DE HIPÓTES.

1-Uma amostra aleatória simples de 40 itens resultou em uma média amostral de 25. O

desvio-padrão da população é  = 5

a) Qual é o erro-padrão da média, x ? R. 0,79

Referências

Documentos relacionados

Recolhidas amostras independentes nas zo- nas de Lisboa (índice 1) e Porto (índice 2) de dimensão 400 e 500 respetivamente, qual a probabilidade de se observar uma proporção maior

Suponha que o número de consultas que essa pessoa recebe por semana (7 dias) como resposta ao anúncio seja uma variável aleatória com distribuição de Poisson com média

Utilizando gêneros textuais em aulas de L2, o aluno será exposto a conhecimentos que talvez ele não tenha dito acesso anteriormente, sendo assim, ele

I risultati hanno rilevato un' accuratezza totale del test monofase di Gravidanza Diagnosi Precoce &gt;99,0% se comparato con un altro test su membrana per hCG.. Quanto è sensibile

Os desastres naturais, tais como terramotos, tempestades, cheias, tornados, seca, temperaturas extremas e vulcões, os ataques terroristas e os incêndios são, nos

sample: A função sample() não é restrita à distribuição uniforme discreta, podendo ser usada para sorteios, com ou sem reposição (argumento replace, default sem reposição), com

é discreta quando o conjunto de valores possíveis que ela assume for finito ou infinito enumerável.. Uma

Para o teste in vitro, três isolados mais patogênicos foram utilizados para a avaliação de inibição com os óleos de gengibre (Zingiber officinale), sangue de dragão