• Nenhum resultado encontrado

PROBABILIDADE & ESTATÍSTICA

N/A
N/A
Protected

Academic year: 2021

Share "PROBABILIDADE & ESTATÍSTICA"

Copied!
88
0
0

Texto

(1)

PROBABILIDADE & ESTATÍSTICA

Prof. Hélio Radke Bittencourt 2019/1

1. CONCEITOS BÁSICOS DE ESTATÍSTICA

1.1 Conjuntos de dados. População e Amostra 1.2 Tipos de variáveis

1.3 Escalas de mensuração

1.4 Estatística descritiva e inferencial

2. ESTATÍSTICA DESCRITIVA

2.1 Tabelas de freqüência simples e cruzadas 2.2 Análise gráfica

2.3 Medidas de Tendência Central 2.4 Separatrizes

2.5 Medidas de Variabilidade

3. PROBABILIDADE

3.1 Experimentos, Espaço Amostral e Eventos 3.2 Operações com eventos

3.3 Conceitos de Probabilidade

3.4 Probabilidade Condicional e Independência 3.5 Teorema de Bayes

3.6 Variáveis aleatórias discretas 3.7 Principais modelos discretos 3.8 Variáveis aleatórias contínuas 3.9 Principais modelos contínuos

4. AMOSTRAGEM

4.1 Conceitos básicos

4.2 Principais técnicas de amostragem probabilística

5. DISTRIBUIÇOES AMOSTRAIS E ESTIMAÇÃO

5.1 Parâmetros e Estimadores 5.2 Distribuição amostral da média 5.3 Estimação por ponto

5.4 Estimação por intervalos de confiança

6. TESTES DE HIPÓTESES

6.1 Teste t de Student para uma média

6.2 Testes t de Student - duas amostras independentes 6.3 Análise de Variância (ANOVA)

6.4 Teste Qui-quadrado

7. CORRELAÇÃO E REGRESSÃO

7.1 Coeficiente de correlação de Pearson 7.2 Regressão Linear Simples

(2)

Cap. 1. CONCEITOS BÁSICOS DE ESTATÍSTICA

1.1 Conjunto de dados. População e amostra

A Estatística pode ser definida como o conjunto de ferramentas para coleta,

organização, análise e interpretação de dados experimentais. O objeto de estudo em

Estatística é um conjunto de dados que pode constituir uma população ou uma

amostra.

População é um conjunto finito ou infinito de elementos.

Amostra é um subconjunto da população. Geralmente buscamos amostras

representativas. Uma amostra representativa é aquela que mantém as

características da população.

1.2 Tipos de Variáveis

Em estatística não trabalhamos diretamente com os elementos que formam o conjunto

de dados, mas sim com suas características. Variáveis são características dos

elementos que formam o conjunto de dados.

As variáveis podem ser classificadas em qualitativas ou quantitativas: as variáveis

qualitativas expressam uma classificação em categorias e, por isso, também são

chamadas de categóricas. As variáveis quantitativas expressam quantidades numéricas

e se dividem em discretas e contínuas. As variáveis discretas assumem apenas

determinados valores num dado conjunto enumerável, enquanto as variáveis contínuas

podem assumir, ao menos teoricamente, qualquer valor num dado intervalo numérico.

Exemplo – Listar variáveis qualitativas e quantitativas para um laptop

Na prática todas as variáveis são discretas, devido à limitação dos instrumentos de

mensuração.

(3)

1.3 Escalas de Mensuração

As variáveis ainda podem ser classificadas de acordo com o nível ou escala de

mensuração: Nominal, Ordinal ou Intervalar/Razão.

O nível nominal de mensuração é caracterizado por números que apenas

diferenciam ou rotulam as categorias.

Exemplos: Sexo (1-M, 2-F), Estado Civil, Naturalidade, Curso.

O nível ordinal de mensuração envolve números que, além de diferenciar,

hierarquizam as categorias. Também são chamadas de escalas Likert em homenagem

ao americano Rensis Likert que publicou o artigo "A Technique for the measurement of

attitudes" em 1932, onde sugeriu escalas de 5 pontos com uma categoria neutra ao

centro.

Exemplos: Nível de satisfação, Nível de concordância, Escala de Avaliação, Níveis de

solubilidade.

O nível intervalar ou de razão apresenta números que expressam diretamente uma

quantidade seguindo uma métrica. Podemos tranqüilamente realizar operações

matemáticas com variáveis deste tipo.

Exemplos: Temperatura, tamanho de objetos, pesos, contagens.

(4)

1.4 Estatística Descritiva e Inferencial

A estatística é um conjunto de ferramentas utilizadas para a coleta, tabulação, análise e

interpretação de um conjunto de dados experimentais. A Estatística pode ser dividida

em duas grandes áreas: Descritiva e Inferencial.

A estatística descritiva é aquela que costumamos encontrar com maior freqüência

em jornais, revistas, relatórios, etc. Essa parte da estatística utiliza números para

descrever fatos. Seu foco é a representação gráfica e o resumo e organização de um

conjunto de dados, com a finalidade de simplificar informações. Nessa categoria se

enquadram as médias salariais, taxas de inflação, índice de desemprego, etc.

A estatística inferencial consiste na obtenção de resultados que possam ser

projetados para toda população a partir de uma amostra da mesma. Ela fundamenta-se

na teoria da amostragem e no cálculo de Probabilidades. Essa é a área mais importante

da Estatística.

Figura - Esquema geral de um curso de Estatística

Descritiva Estatística Inferencial Probabilidade Amostragem

(5)

Cap. 2 ESTATÍSTICA DESCRITIVA

2.1 Tabelas de freqüência simples e cruzadas

Vamos introduzir o tema de tabelas de freqüência simples construindo tabelas para o

banco de dados coletado em sala de aula:

Exemplo 1 – Banco de dados coletado em sala de aula

Aluno

Sexo

(M ou F)

Semestre Nº pessoas

domicílio

Nº contas de

email

Altura (cm)

Criar uma tabela de freqüências para cada uma das variáveis.

Tabelas de freqüência são encontradas em jornais informativos (Zero Hora, Correio do

Povo, etc.), relatórios técnicos, monografias, dissertações, teses e revistas científicas.

As tabelas de freqüência simples apresentam de forma concisa o número de

ocorrências (absoluta e relativa) dos valores de uma variável.

Uma tabela de freqüência genérica tem a seguinte configuração:

Tabela 1 – Tabela de freqüências genérica

i

x

i

f

i

fr

i

1

x

1

f

1

fr

1

2

x

2

f

2

fr

2

k

x

k

f

k

fr

k

n

100,0%

(6)

A notação utilizada é a seguinte:

X é uma variável qualquer

x é um particular valor da variável X

i é um índice útil para enunciar as expressões matemáticas

k é o número de linhas da tabela

Os componentes da tabela de freqüências são:

Freqüência absoluta (f

i

): número de ocorrências do valor x

i.

Freqüência relativa (fr

i

): percentual de ocorrências do valor x

i

Freqüência absoluta acumulada (F

i

): número de ocorrências até o valor x

i.

Freqüência relativa acumulada (Fr

i

): percentual de ocorrências até o valor x

i

As Tabelas cruzadas apresentam a distribuição de freqüências de duas variáveis

simultaneamente. As tabelas cruzadas são abundantes em jornais e revistas

especializadas.

Exemplo 2 – Tabela Cruzada 2X2

Matriz de confusão / Tabela de classificação

Realidade

Sem

Classificação

mudanças Mudanças

Total

Sem mudanças

80

20

100

Mudanças

5

45

50

(7)

5,7% 1,9% 2,4% 2,8% 3,3% 8,5% 9,4% 28,3% 37,7% 0% 20% 40% 60% 80% 100% Outras Drogas Acidente de carro Doenças venéreas Armas de fogo Doenças infecciosas Ãlcool Obesidade Cigarro

2.2 Análise Gráfica

O tipo de gráfico adequado para cada variável depende do tipo de variável. Segue uma

relação de exemplos de variáveis e tipos de gráficos adequados.

Variável Qualitativa Nominal (com poucas categorias)

GRÁFICO DE SETORES (Pizza ou Torta)

Figura – Distribuição da turma por sexo

Masculino 40%

Feminino 60%

Base: 50 alunos de uma turma

Fonte: dados coletados em aula (numa turma, obviamente, não de CC)

Variável Qualitativa Nominal (com muitas categorias):

GRÁFICO DE BARRAS

Figura – Principais causas de morte - EUA

Base: ???

(8)

Variável Qualitativa Ordinal:

GRÁFICO DE BARRAS

Figura – Avaliação do atendimento da equipe de um call-center

2% 5% 8% 20% 35% 25% 0% 10% 20% 30% 40% Péssimo Ruim Regular Bom Muito Bom Ótimo % A v a li a ç ã o Base: 100 usuários Fonte: Dados fictícios.

Variável Quantitativa Discreta

GRÁFICO DE COLUNAS

Figura – Número de pessoas por domicílio

7,5% 20,0% 35,0% 25,0% 12,5% 0,0% 20,0% 40,0% 60,0% 80,0% 100,0% 1 2 3 4 5

Número de pessoas por domicílio

Base: 40 domicílios

(9)

Variável Quantitativa Contínua

HISTOGRAMA

Figura – Distribuição de uma turma por altura

Altura (cm) 200 ,0 190 ,0 180 ,0 170 ,0 160 ,0 150 ,0 F re q ü ê n c ia 10 8 6 4 2 0 Base: 20 observações

(10)

2.3 Medidas de Tendência Central

São valores que trazem informação sobre a região em torno da qual os dados estão

posicionados. As medidas de tendência central mais utilizadas são: Média, Mediana e

Moda.

2.3.1 – Média Aritmética (

 , X )

A média aritmética é definida como a soma de todas observações da variável X,

dividida pelo número de elementos do conjunto de dados. Freqüentemente a média

aritmética é o valor que melhor representa um conjunto de dados.

Quando os dados não estão organizados na forma de uma tabela de freqüências e,

portanto, estão na forma isolada, as expressões genéricas para encontrar a média

são:

População

Amostra

N x N i i

  1

n x X n i i

  1

Quando os dados estão organizados na forma de uma tabela de freqüências deve-se

ponderar os diferentes valores x

i

pelas respectivas freqüências f

i

. Procedendo desta

forma o cálculo da média aritmética torna-se mais simples e rápido.

População

Amostra

N f x k i i i

   1

n f x X k i i i

   1

Exemplo 3 – Número de disciplinas cursadas no semestre

Encontrar a média para o número de disciplinas cursadas no semestre.

(11)

2.3.2 – Mediana (Md)

A mediana é o valor que divide o conjunto de dados ordenado em duas partes com

igual número de observações. Para calcular a mediana iremos utilizar uma nova

notação. Seja

x[1],x[2],,x[n]

um conjunto de dados ordenado (ordem crescente),

onde o valor entre colchetes representa a posição no conjunto ordenado.

Deduzindo a posição mediana:

n ímpar n par

n

Fila

Md

n

Fila

Md

3

4

5

6

7

8

As expressões genéricas para encontrar a média são:

n ímpar n par

Quando os dados estão organizados na forma de uma tabela de freqüências pode-se

encontrar a posição mediana na coluna acumulada F

i

.

Exemplo 4 – Número de disciplinas cursadas no semestre

(12)

2.3.3 – Moda (Mo)

A moda é definida como o valor mais freqüente de um conjunto de dados. É possível

que o conjunto seja bimodal (duas modas) ou até mesmo multimodal (três os mais

modas).

 

x

i

f

i

Mo

com

maior

Exemplo 5 – Número de disciplinas cursadas no semestre

Encontrar a moda para o número de disciplinas cursadas no semestre.

Considerações IMPORTANTES sobre as MTC

1. A média é a MTC mais influenciada por valores extremos, entretanto é a medida

mais “rica”, porque considera todos valores do conjunto de dados.

2. A mediana não é afetada por valores extremos.

3. A moda é a MTC mais “pobre”, porque considera apenas os valores mais freqüentes.

4. Existem outros tipos de média usadas em ocasiões especiais. A média harmônica é

muito utilizada em concursos públicos e a geométrica pode ser usada em situações de

alta variabilidade, visto que ela é mais estável. Discutiremos isto em aula.

Média harmônica

Média geométrica

  n i i h x n X 1 1

n n G x x x X12

Pode-se estabelecer a seguinte relação entre as médias:

X X XhG

(13)

Exemplo – Desempenho no Vestibular

Veja os quatro candidatos a seguir e seus respectivos desempenhos no vestibular.

Comente sobre a ação das médias.

Tabela – Desempenho de quatro alunos no vestibular

Aluno A Aluno B Aluno C Aluno D

Química 500 498 410 580 Física 500 502 405 580 Matemática 500 500 415 580 Geografia 500 515 425 580 História 500 485 445 580 Português 500 500 900 100 Média Aritmética 500,0 500,0 500,0 500,0 Média Harmônica 500,0 499,8 460,5 322,2 Média Geométrica 500,0 499,9 476,7 432,7

(14)

2.4 Separatrizes

São valores que separam o conjunto de dados ordenado em partes com igual número

de observações.

A Mediana é, portanto, uma separatriz porque divide o conjunto de dados em duas

partes iguais.

Min |---|---| Máx

Md

Os Quartis (Q

i

) dividem o conjunto de dados em 4 partes iguais.

Min |---|---| Máx

Os Percentis (P

i

) dividem o conjunto de dados em 100 partes iguais.

Min |---|---| Máx

Exemplo 6 – Boletim de Desempenho do Provão do MEC

Exemplo 7 – Distribuição de Renda no Brasil

A régua de percentis a seguir apresenta a distribuição de renda per capita para a

população do Brasil todo no ano de 2012.

R$6000 R$ 286 R$ 533 R$ 936 R$ 1681 R$2600

Min|---|---|---|---|----|---|--| Max P25 P50 P75 P90 P95 P99

(15)

2.5 Medidas de Variabilidade

São medidas que complementam as MTC trazendo informação sobre a dispersão

existente no conjunto de dados. Para introduzi-las vamos recorrer a um exemplo onde

temos três diferentes processadores e o tempo necessário por eles para realizar uma

tarefa.

Exemplo 8 – Entendendo as Medidas de Variabilidade

Tabela – Tempos de processamento (ms)

Processador

Alfa ®

Processador

Beta ®

Processador

Gama ®

120

118

120

120

121

100

120

124

135

120

117

155

120

120

120

120

120

90

Média ( X )

Moda (Mo)

Mediana (Md)

Questões

1 – O que aconteceu com as MTC na tabela acima?

2 – Os três processadores são iguais em relação ao tempo de processamento?

3 – O que diferencia um processador do outro?

A partir de agora aprenderemos a calcular medidas capazes de quantificar a

variabilidade existente num conjunto de dados

(16)

2.5.1 – Amplitude (R, do termo Range)

É a diferença entre o maior e o menor valor de um conjunto de dados.

 

x

i

mín

 

x

i

máx

R

Calcular R nos três processadores do Exemplo 8.

2.5.2 – Variância (

2

, s

2

)

A variância é uma medida da variação em torno da média. Por definição,

variância é a média dos quadrados dos desvios em torno da média.

População Amostra

N x N i i

   1 2 2

1 1 2 2   

n X x s n i i

A variância, ao contrário da Amplitude, considera todos elementos do conjunto de

dados no seu cálculo. Quanto maior for a variação dos valores do conjunto de dados,

maior será a variância.

Quando os dados estão organizados na forma de uma tabela de freqüências,

deve-se ponderar os quadrados dos desvios pela freqüência. Esdeve-se procedimento facilita o

cálculo.

População Amostra

N f x i k i i   

1 2 2

1 1 2 2    

n f X x s k i i i

(17)

2.5.3 – Desvio-padrão (

,

s)

O desvio-padrão é a raiz quadrada positiva da variância. Essa medida corrige o

problema de unidade que surge na variância. O desvio-padrão também é uma

medida da variação em torno da média.

População Amostra

2

2

s

s 

O desvio-padrão expressa a variação média do conjunto de dados em torno da média,

para mais ou para menos.

Calcular s nos três processadores do Exemplo 8.

2.5.4 – Coeficiente de Variação (CV)

O CV é a razão entre o desvio-padrão e a média de um conjunto de dados. Ele expressa

a variação relativa (%) presente no conjunto de dados em relação à média.

População Amostra

%

100

CV

 100% X s CV

Quanto maior o CV, mais heterogêneos serão os dados.

(18)

Considerações sobre as Medidas de Variabilidade (MV)

1. A Amplitude á a MV mais “pobre”, porque considera apenas os dois valores

extremos do conjunto de dados.

2. A Variância não é interpretada na prática devido ao problema da unidade, que está

ao quadrado.

3. O Desvio-padrão é a MV mais conhecida, sendo amplamente utilizada.

4. Dentre as MV estudadas, sugere-se que o CV seja utilizado para comparação da

variabilidade entre diferentes conjuntos de dados. Por não ter unidade, o CV pode ser

utilizado até mesmo para comparar a variabilidade entre variáveis expressas em

diferentes unidades.

Exemplo 9 – Número de pixels corretamente classificados

Suponha que numa amostra de 30 imagens de satélite de uma mesma região

submetidas ao mesmo classificador, os números de pixels classificados de forma errada

foram:

10 5 6 5 6 9 5 7 5 10

5 10 7 8 8 9 9 6 6 10

5 6 6 7 6 6 7 6 8 7

a) Construir uma tabela de freqüências para a variável X.

b) Encontrar e interpretar as MTC.

(19)

Cap. 3 – Probabilidade

3.1 – Experimentos, Espaço Amostral e Eventos

Probabilidade é o ramo da matemática que trata de fenômenos aleatórios. A observação de um fenômeno aleatório por parte do homem é chamada de experimento aleatório.

Características de um experimento aleatório:

1ª) Não se conhece um particular valor do experimento antes dele ser executado, porém podemos descrever todos os possíveis resultados - as possibilidades;

2ª) Quando o experimento é repetido algumas vezes, os resultados ocorrem de uma forma aparentemente acidental. Mas quando o número de repetições aumenta, uma regularidade aparecerá. E esta regularidade que torna possível construir um modelo matemático útil para análise do experimento.

Exemplos de fenômenos aleatórios:

1) Condições meteorológicas

2) Produção de arroz anual numa cidade 3) Mercado Financeiro

4) Lançamento de uma moeda 5) Resultados de loterias

Exemplos de experimentos aleatórios:

E1: Jogue um dado e observe o n.º na face de cima.

E2: Jogue uma moeda 3 vezes e observe o número de caras obtido.

E3: Jogue uma moeda 3 vezes e observe a seqüência de caras e coroas obtida. E4: O estado (conforme, não-conforme) de três peças produzidas é verificado. E5: O número de peças produzidas até a obtenção de uma defeituosa é anotado. E6: A temperatura de uma máquina é verificada por um supervisor.

Nos seis exemplos anteriores não somos capazes de precisar o resultado, entretanto conseguimos listar os possíveis resultados.

Espaço amostral de um experimento aleatório é o conjunto de todos os resultados possíveis

do experimento. É denotado por S ou . A cardinalidade do espaço amostra é denotada por #.

(20)

Exemplos de espaços amostrais relacionados aos experimentos anteriores. S1 = S2 = S3 = S4 = S5 = S6 =

Um evento é um subconjunto de S. Em particular, S e  (conjunto vazio) são eventos; S é dito o evento certo e  o evento impossível.

Exemplo de eventos no lançamento de um dado S = {1,2,3,4,5,6}

A: ocorre um n.º par A = {2,4,6} B: ocorre a face 6 B = {6} C: ocorre um n.º maior que 6 C =  D: ocorre nº 6 ou nº par D = {2,4,6}

E: ocorre nº par ou nº ímpar E = {1,2,3,4,5,6} = S

3.2 Operações com eventos

É possível realizar operações com eventos que nada mais são do que as operações com conjuntos já estudadas no Ensino Fundamental.

Operações com eventos

Sejam A e B dois eventos associados a um espaço amostral S. 1) União: AB  A ocorre ou B ocorre ou ambos ocorrem 2) Interseção: AB  A ocorre e B ocorre

3) Complementar: Ac ou A  não ocorre A

(21)

1) Dois eventos A e B são excludentes ou mutuamente exclusivos se a ocorrência de um impedir a ocorrência de outro. Em outras palavras, não podem ocorrer simultaneamente, logo, P(AB)=0.

2) Eventos ou resultados equiprováveis têm a mesma probabilidade de ocorrência. Se A e B são equiprováveis, então P(A)=P(B).

Exemplo – Lançamento de um dado e uma moeda, ambos honestos

Escreva o espaço amostral. Os resultados são todos equiprováveis? Qual a probabilidade de um particular par (x,y) ser selecionado. Assinale os seguintes eventos:

3.3 Conceitos de probabilidade

Os conceitos de probabilidade podem ser enunciados de três formas distintas. O conceito clássico - simples e antigo; o conceito frequentista - baseado na observação e o conceito moderno ou axiomático introduzido pelo russo Andrei Kolmogorov em 1933.

Considere P(A) = probabilidade de ocorrência do evento A.

 Conceito clássico

Esse conceito só é válido se todos resultados de S forem equiprováveis. Para casos assim a probabilidade de ocorrência do evento A é obtida por:

)

(

)

(

)

(

S

Total

A

n

A

P

n(A) é o número de resultados favoráveis ao evento A

Total (s) é o número total de resultados em S

Exemplos – Conceito clássico

(22)

 Conceito freqüentista

Neste conceito a probabilidade é tratada como um limite. Aqui é possível fazer uma relação entre probabilidade (teórica) e estatística (empírica). Para casos assim a probabilidade de ocorrência do evento A é obtida por:

1º) O experimento é repetido n vezes.

2º) Observa-se a freqüência relativa de ocorrência de um certo resultado A: fr(A) = ( ),

n A n

onde n(A) é o nº de vezes em que ocorre o resultado A em n realizações do experimento.

3º) Probabilidade como limite. A medida que n aumenta, a fr(A) converge para a real probabilidade P(A).

)

A

(

P

)

A

(

fr

lim

n

Exemplos – Conceito freqüentista

1) Verificando se um dado é honesto.

2) Encontrando a probabilidade de ocorrência de um acidente aéreo. 3) Qual a probabilidade de uma criança nascer com Síndrome de Down ?

TAREFA 1: “Não dê o peixe, ensine a pescar”

Desenvolver um dado no EXCEL de forma que seja possível verificar o funcionamento do Conceito Frequentista. Verifique se a fr(6) converge para 1/6 à medida que n aumenta.

Dica: Veja como podemos fazer uma moeda no Excel e como contar quantas caras ocorreu:

=SE(ALEATÓRIO()<0,5;”Cara”;”Coroa”)

Se o número aleatório entre 0 e 1 gerado pelo Excel for inferior a 0,5,então escreva “Cara”; caso contrário escreva “Coroa”. Depois, copie e cole esta fórmula para as células A2 até A1000. = CONT.SE(A2:A1000;”Cara”)

(23)

 Conceito Axiomático

Os Axiomas da Probabilidade devem-se ao russo Kolmogorov. Seja A um evento de S. A probabilidade de ocorrência de A, denotada por P(A), deverá satisfazer os seguintes axiomas (propriedades fundamentais).

Axioma 1: 0  P(A)  1 Axioma 2: P(S) = 1

Axioma 3: Para eventos Ai excludentes, P(A1 A2) = P(A1) + P(A2)

3.4 Probabilidade Condicional e Independência

A probabilidade de ocorrência de um evento pode ser influenciada pela ocorrência de um evento paralelo. Considere que A e B são eventos de um mesmo espaço amostral S. Chamaremos de P(A|B) a probabilidade de ocorrência do evento A dado que o evento B já ocorreu.

Graficamente:

Olhando para o desenho podemos estabelecer as seguintes relações:

P(A|B) = P(B|A) =

Exemplo – Escolhendo alguém na sala de aula

Suponha que um aluno da turma será sorteado. Após saber o resultado o professor faz algumas perguntas utilizando probabilidade condicional.

(24)

Exemplo – Fornecedor X Devoluções

Devolução

Fornecedor Sim Não Total

A 30 50 80

B 60 40 100

C 50 50 100

Total 140 140 280

Resolver as seguintes probabilidades:

=> Independência

Dois eventos A e B são considerados independentes se a ocorrência de um não interfere na probabilidade de ocorrência do outro:

P(A|B) = P(A) e P(B|A) = P(B)

Isolando a intersecção na expressão de probabilidade condicional obtemos: P(AB) = P(A) x P(B)

Esse conceito é fundamental para aplicações em Estatística.

Exemplo – Lançamento de um dado e uma moeda, ambos honestos.

Exemplo – Três operadores diferentes realizam a mesma tarefa em máquinas distintas. Eles

produzem caixas com três peças, cada uma feita por um operado. A probabilidade do operador A falhar é de 3/1000 ; do operador B 5/1000 e do operador C, 1/100.

(25)

3.5 Teorema de Bayes

Considere um espaço amostral formado por n eventos Ai excludentes de forma que A1A2...An = S. Suponha que as probabilidades dos Ai´s sejam conhecidas bem como todas as condicionais P(B|Ai). Será possível determinar a probabilidade P(Ai|B)?

Dedução da “Regra de Bayes”:

... ) B ( P ) A | B ( P ) A ( P ) B ( P ) B A ( P ) B | A ( P i i i i     

Exemplo – Máquinas e não-conformidade

Uma empresa possui três máquinas (A,B,C) com as seguintes probabilidades de produção de uma peça não-conforme (NC): 1%, 2% e 5%. A máquina A é responsável por 40% da produção; a máquina B por 50% e a máquina C é responsável pelo restante.

a) Se uma peça não-conforme é encontrada, qual a probabilidade dela ter sido produzida pela máquina A? Encontre as probabilidades para as máquinas B e C também.

b) Qual a probabilidade de uma peça não-conforme ser encontrada na produção conjunta?

Exemplo – Bayes numa tabela cruzada

Suponha uma sala de aula com 60 alunos, sendo 30 das Ciências da Computação, 20

da Engenharia Elétrica e 10 da Eng de Produção. Sabe-se que, nesta turma, 20 alunos

estão em G2, sendo 12 da CCO e seis da EEL. Sabendo que um aluno está em G2,

qual a probabilidade ele ser a Eng de Produção?

(26)

3.6 – Variáveis aleatórias discretas

3.6.1 Definições Básicas

Uma variável aleatória discreta X é uma função que associa números aos resultados do Espaço Amostral.

Exemplo – Prova

Para exemplificar vamos admitir uma prova composta de n=4 questões com cinco alternativas cada onde apenas uma está correta.

Q1) a) b) c) d) e) Q2) a) b) c) d) e) Q3) a) b) c) d) e) Q4) a) b) c) d) e)

Escreva o espaço amostral S considerando apenas questão certa (C) ou errada (E).

S = { EEEE; CEEE; CCEE; CCCE; CCCC } onde temos 24 = 16 ECEE; CECE; CCEC;

EECE; CEEC; CECC; EEEC; ECCE; ECCC;

ECEC EECC

Agora considere X=número de acertos em cada ponto amostral de S. Logo, os valores possíveis para X são 0,1,2,3 ou 4. O resultado EEEE implica em X=0; os resultados CEEE, ECEE, EECE, EEEC implicam num X=1, etc.

A função de probabilidade de X, denotada por P(X=x) ou f(x), indica o comportamento probabilístico de X.

Neste caso:

x 0 1 2 3 4

P(X=x)

Características da função de probabilidade: 1a)

0

P

(

X

x

)

1

2a)

x x X P( ) 1

(27)

A Função de probabilidade acumulada de X, denotada por F(X) ou P(Xx), indica a

probabilidade de ocorrerem valores menores ou iguais a x. Características da F(X) ou P(Xx):

1a) Ela é contínua à direita; 2a) F()0 e F( )1

3a) F(x) é sempre não decrescente.

Graficamente:

Esperança e Variância de uma Variável Aleatória Discreta

O valor esperado ou esperança de uma variável discreta é o seu “centro de equilíbrio”. É uma média da variável X, mas do ponto de vista teórica, sem coleta de dados empíricos. A

esperança de uma variável discreta é calculada por:

   x ) x X ( P x ) X ( E Exemplo – Prova

Calcular o número esperado de acertos no caso da prova.

A variância de uma variável aleatória discreta indica a variabilidade em torno de sua média. A expressão da variância pode ser melhor entendida se comparada a expressão da variância que aprendemos em Estatística Descritiva:

2

 

2

2 ) X ( E X E ) X ( E X E ) X ( Var    

O desvio-padrão, conseqüentemente é encontrado extraindo-se a raiz quadrada positiva da variância:

)

X

(

Var

)

X

(

DP

(28)

Exemplo - Prova

Encontrar a variância e o desvio-padrão para o número de acertos na prova.

Exemplo – Dados

Criar a variável X=soma das faces no lançamento de dois dados e construir a sua função de probabilidade.

Exercício completo – Para a função de probabilidade a segui, encontre o valor de k, construa a distribuição acumulada, encontre a Esperança e a Variância de X.

x 0 1 2 3 4

P(X=x) 0,35 0,30 0,20 k 0,05

3.7 Principais modelos discretos

A partir de agora veremos modelo (fórmulas, expressões) que retratam o comportamento probabilístico de variáveis discretas. Veremos apenas dois: Binomial e Poisson.

3.7.1 Distribuição Binomial

Um caso como o da prova de quatro questões pode ser resolvido pela Distribuição Binomial. Sempre que um experimento que assume apenas dois possíveis resultados em cada repetição for repetido n vezes e que a probabilidade de sucesso for constante em cada repetição, podemos modelar o número de sucessos pela distribuição Binomial.

X = número de sucessos, variando de 1 até n p = probabilidade de sucesso em cada repetição 1-p = probabilidade de fracasso em cada repetição n = número de repetições X ~ Binomial (n ; p) x=0,1,...,n

n

x

p

x

p

n x

x

n

x

X

P

(

1

)

!

!

!

)

(

(29)

Exemplo – Prova

No exemplo da prova, encontre os parâmetros da Binomial e calcule P(X=2).

Exemplo – Peças defeituosas

Numa fábrica peças são produzidas em larga escala (podemos considerar produção infinita). Sabe-se que 5% das peças são defeituosas (D) e o restante perfeitas (P).

a) Qual a probabilidade de obtermos 2 peças defeituosas?

Exemplo – Loteria Esportiva

Numa loteria com 13 jogos de futebol, qual a probabilidade de um “desentendido de futebol” acertar 11 ou mais jogos?

Esperança e Variância na Binomial

O número esperado ou esperança de sucessos na distribuição Binomial é facilmente encontrado. Intuitivamente, responda as perguntas a seguir:

1) Se lançarmos uma moeda honesta 100 vezes, qual o número esperado de caras? 2) Se lançarmos um dado 600 vezes, qual o número esperado de faces “5”.

3) No exemplo da prole de 6 filhos, qual o número esperado de meninos?

E(X) =

      n x x n x x n n x ) p ( p C ) x X ( P 0 0 1 = np Var(X) = np(1-p)

Exemplos – Nos exemplos anteriores encontre a esperança Prova: E(X) Var(X) Peças: E(X) Var(X) Loteria: E(X) Var(X)

(30)

3.7.2 A distribuição de Poisson

A distribuição de Poisson é conhecida com a distribuição de um só parâmetro. Uma variável aleatória discreta X segue uma distribuição de Poisson se a sua função de probabilidade é dada por: X ~ Poisson ()

!

x

e

x

X

P

x

 

, x = 0,1,2,... >0

Geralmente X representa o número de ocorrências num determinado espaço de tempo e o parâmetro  é a média de ocorrências neste intervalo. Conhecidamente, o número de chamadas telefônicas recebidas numa central, a chegada de navios a um porto, pode ser modelada pela distribuição de Poisson.

Atenção: o parâmetro  deve estar em sintonia com a variável X. Provando que P(X=x) é função de probabilidade:

   0 x x

!

x

e

=1

Esperança e Variância na Poisson

E(X) =

 

   0 x 0 x x

x

!

e

x

)

x

X

(

xP

Var(X) =  Exemplo – Navios

A taxa de chegadas de navios a uma porto segue a média de 1 por dia e pode ser modelada pela distribuição de Poisson.

a) Qual a probabilidade de chegarem três navios em um mesmo dia?

b) Qual a probabilidade de chegar ao menos um navio em três dias?

c) Qual o número esperado de navios em uma semana?

Exemplo – Erros em um livro

Um revisor aponta que encontrou 100 erros em um livro de 200 páginas. Considere X=número de erros por página, podendo ser modelada pela distribuição de Poisson.

(31)

a) Qual a probabilidade de encontrar, em uma página escolhida ao acaso, dois erros?

b) Qual a probabilidade de encontrar, em uma página escolhida ao acaso, ao menos um erro?

Aproximação entre Binomial e Poisson

A medida que ninfinito e p0 a distribuição Binomial pode ser aproximada pela Poisson.

 

! x np e ) p ( p x n ) x X ( P x np 0 p n x n x               1

Para np7 já temos uma boa aproximação.

Exemplo – X ~ Binomial (n=30 ; p=1/20)

Comparar a probabilidade P(X=0) e P(X=1) pela Binomial e Poisson.

Binomial -0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0 3 6 9 12 15 18 21 24 27 30 Poisson -0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0 3 6 9 12 15 18 21 24 27 30

(32)

3.8 Variáveis aleatórias contínuas 3.8.1 Definições Básicas

As variáveis contínuas podem, ao menos teoricamente, assumir qualquer valor num intervalo numérico. Sendo assim fica impossível representarmos variáveis contínuas da mesma forma que as variáveis discretas. Diferenciando um caso discreto de um contínuo:

Importante

As variáveis contínuas são representadas por curvas, chamadas de função densidade de

probabilidade, e a área sob essa função representa a probabilidade de ocorrência. Nas

variáveis contínuas não existe a probabilidade de ocorrência de um valor exato, mas sim de intervalos.

A função densidade de probabilidade, denotada por fx(x), é a função que indica o

comportamento probabilístico da variável aleatória contínua X. A função densidade de probabilidade deverá satisfazer as seguintes condições:

a)

f(x)  0, para todo x  R.

b)

f(x)dx 1

A área sob a curva fx(x) nos informa a probabilidade de ocorrência de valores da variável X. Caso discreto -0,05 0,10 0,15 0,20 0,25 0,30 0 1 2 3 4 5 6 7 8 9 10 11 12 P (X = x ) Caso contínuo -0,05 0,10 0,15 0,20 0,25 0,30 1 2 3 4 5 6 7 8 9 10 11 12 13 P (X = x )

(33)

Supondo que o gráfico acima represente a função de probabilidade de uma variável aleatória X. Como sabermos a probabilidade de ocorrência de valores entre a e b ?

b a

dx

)

x

(

f

)

b

X

a

(

P

A função de distribuição acumulada de X, denotada por F(x), indica a a probabilidade acumulada até o valor x.

     x dx ) x ( f ) x X ( P ) x ( F Propriedades da F(x):

1o) F(x) é contínua e não decrescente 2o) F(-)=0 F() = 1 3o) P(a < X < b) = F(b) – F(a) 4o) F(x) dx d ) x ( f

Exercício – Fixação do conteúdo

Esboce graficamente a f(x). Verifique se f(x) é função densidade, encontre a F(x) e calcule P(X<0,5).       . c . c ; x ; x ) x ( f 0 1 0 2

Exercício – Fixação do conteúdo II

Esboce graficamente a f(x). Verifique se f(x) é função densidade, encontre a F(x) e calcule a P(1/4<X<3/4).

contrário

caso

;

0

1

x

1/2

;

4x

-4

1/2

x

0

;

x

)

x

(

f

4

Esperança e Variância de uma variável aleatória contínua

O cálculo da esperança e da variância no caso contínuo pode ser feito de forma análoga ao caso discreto. Agora o  será substituído pela

:

(34)

xf(x)dx ) X ( E

2 2 ) X ( E ) X ( E ) X ( Var   onde E(X2 )

x2f(x)dx Em geral:

g(x)f(x)dx )) x ( g ( E

Exemplo – Encontrar E(X) e Var(X) nos exercícios de fixação I e II

3.9 - Principais Modelos Contínuos

Existe uma gama de modelos contínuos bastante utilizados. Eles já se encontram descritos na literatura e suas principais características são conhecidas.

3.9.1 Distribuição Uniforme ou Retangular

Uma v.a.c X tem distribuição Uniforme se a sua função densidade f(x) descreve um retângulo que dá sempre a mesma probabilidade de ocorrência para intervalos de mesmo tamanho. X ~ Uniforme [a , b] b x a        contrário caso ; 0 b x a ; 1 ) (x b a f a b 1/(b-a) x f(x)

(35)

Provar que

a

b

a

x

x

F

)

(

para axb.

Esperança e Variância na Uniforme

2 ) (X b a E  

12

)

(

)

(

2

a

b

X

Var

Exemplo - Tempo de produção (Distribuição Uniforme)

O tempo para produzir uma peça é igualmente provável de estar entre 60s e 70s. a) Esboce graficamente a função densidade de probabilidade para X = tempo (s).

b) Calcular a probabilidade do tempo na exceder 66s.

Exemplo - O gerador de números pseudo-aleatórios do EXCEL

O gerador de números pseudo-aleatórios do Excel deveria seguir uma Uniforme [0;1]. a) Calcule a esperança e a variância de X e a probabilidade P(X>0,7).

(36)

3.9.2 Distribuição Exponencial

A distribuição Exponencial pode ser utilizada na modelagem do tempo entre ocorrência de acidentes, tempo de ocorrência entre chamadas telefônicas. Na distribuição Exponencial consideramos que a probabilidade de ocorrência de um evento é constante em intervalos de amplitude .

Uma v.a.c. X tem distribuição Exponencial se a sua função densidade de probabilidade é dada por: X ~ Exponencial ()

c.c.

;

0

0

;

)

(

x

e

x

f

x

0

Vejamos a forma da função densidade f(x) para diferentes valores de :

0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 0 1 2 3 4 5 6 Lambda=0,5 Lambda=1 Lambda=2

Provando que f(x) é função densidade:

 

0

1

dx

e

x

Função de distribuição acumulada F(x):

xx

x

e

dx

e

0

1

 

(37)

Esperança e Variância na Exponencial

Relembrando Integral por partes:

vu

'

vu

uv

'

neste caso, escolher x e u' 

 

1

)

(

)

(

0

dx

e

x

dx

x

xf

X

E

x 2 1 ) (

X Var

Exemplo – O período de quebra entre componentes eletrônicos segue uma distribuição

Exponencial com média de 2 anos.

a) Qual a probabilidade de que haja uma quebra dentro de 4 anos?

b) Qual a probabilidade de que haja uma quebra entre 2 e 4 anos?

Exemplo – O tempo entre chamadas telefônicas segue uma distribuição Exponencial com

média de 15 minutos.

a) Qual a probabilidade de que chegue uma chamada dentro de 20 minutos?

b) Sabendo que já se passaram 20 minutos, qual a probabilidade de que chegue uma ligação antes dos 40 minutos?

A letra b) do exercício anterior nos leva a perceber uma importante característica da distribuição exponencial: a falta de memória (memorylessness).

) ( ) | (X s t X t P X s P      No exemplo: ) 20 ( ) 20 | 20 20 (X   X   P XP

(38)

3.9.3 Distribuição Normal, Gaussiana ou Curva de Gauss

A distribuição normal ou curva de Gauss é, sem dúvida, o principal modelo probabilístico contínuo, pois serve de base para a principal área da Estatística: a Estatística Inferencial.

Uma v.a.c. X tem distribuição normal com parâmetros  e  se sua função densidade de probabilidade é dada por:

 

0

;

+

<

<

-,

parâmetros

são

onde

,

,

2

1

2 2 2 ) (

 

 

e

x

e

x

f

x Notação X  N(,)

X tem distribuição Normal com média  e desvio-padrão .

Os parâmetros da Normal são a média e o desvio-padrão, que permitem infinitas curvas normais com diferentes formatos (mas sempre simétricas). O gráfico da fX é apresentado a

seguir:

Características da Normal

f(x)dx1

(39)

-10 -5 0 5 10 Valores de X f(x) -10 0 10 Valores de X f( x ) -10 -5 0 5 10 Valores de X f(x )  DP(X) =

2

2

dx

)

x

(

f

x

Outra característica importante da Normal é que, independentemente dos valores dos parâmetros, a seguinte relação é sempre válida:

Entendendo os parâmetros da curva Normal:  (média) é uma parâmetro de locação  (desvio-padrão) é um parâmetro de forma Vejamos exemplos:

(40)

Coletar a altura dos alunos em sala de aula e realizar alguns cálculos.

Os cálculos integrais envolvendo a distribuição Normal são bastante complicados. Felizmente, veremos a seguir uma relação que facilita muito nossa vida.

Distribuição Normal-padrão ou Normal reduzida

Seja X uma variável aleatória normalmente distribuída com quaisquer parâmetros média  e desvio-padrão . Se realizarmos a seguinte transformação obteremos uma nova variável Z com média 0 e desvio-padrão 1: X  N(,) 

X

Z

 Z (0,1)

Qualquer variável com distribuição Normal pode ser padronizada para a Normal. A

distribuição Normal padronizada (Z) é tabelada.

Exemplo – Aprendendo a usar a tabela

1) Calcule:

a) P(Z  1,64) d) P(Z  0)

b) P(Z  0,38) e) P(-1,96  Z  1,96) c) P(2,57  Z  2,57)

2) O peso de sacos de arroz com valor nominal de 1kg segue uma distribuição aproximadamente Normal com média de 1010g com desvio-padrão de 20g.

a) Qual a probabilidade de um saco ter peso inferior a 1040g? b) Qual a probabilidade de um saco ter peso superior a 1050g? c) Qual a probabilidade de um saco ter menos de 1kg?

(41)

Cap. 4. - Amostragem

4.1 Conceitos Básicos

Amostragem é o nome dado ao conjunto de procedimentos e técnicas para extração

de elementos da população para compor a amostra. O objetivo da amostragem é obter

amostras representativas das populações em estudo. Um Censo seria a investigação da

população completa.

Por que trabalhar por amostragem?

________________________________________

________________________________________

________________________________________

________________________________________

A fração de amostragem é a razão entre o tamanho amostral e o tamanho

populacional. Não existem regras fixas para tamanho de amostra, ou seja cada caso

merece um cuidado especial. Frases como “20% da população é ideal”, quase sempre

não são verdadeiras.

As técnicas de amostragem se dividem em: probabilísticas e não-probabilísticas.

As técnicas probabilísticas são aquelas onde todos elementos da população têm uma

probabilidade não nula de seleção. Nas técnicas não-probabilísticas não podemos

garantir que todos elementos têm probabilidade de serem selecionados para a amostra.

4.2 Principais técnicas de amostragem probabilística

Geralmente as técnicas probabilísticas produzem melhores resultados do que as não

probabilísticas. A seleção dos elementos envolve obrigatoriamente a utilização de algum

dispositivo aleatório para seleção das unidades amostrais.

(42)

4.2.1 Amostragem Aleatória Simples (AAS)

Apesar de ser uma forma extremamente simples de seleção de elementos da

população, é considerada uma das melhores técnicas de amostragem.

Na AAS cada elemento da população tem igual probabilidade de seleção e o

pesquisador não introduz nenhum vício no processo.

Etapas:

1) Enumerar a população de 1 até N.

2) Sortear n números no intervalo de 1 até N. Caso haja números repetidos, sortear

novamente mais alguns valores.

Probabilidade de seleção de um elemento na AAS:

Número de amostras possíveis SEM reposição:

Número de amostras possíveis COM reposição:

Exemplo 23 – Amostra n=2 da população N=5

Verificar quantas amostras são possíveis COM e SEM reposição da população de

tamanho 5 verificando também as probabilidades de seleção de cada unidade.

(43)

4.2.2 Amostragem Estratificada

Na Amostragem estratificada a população é dividida em subpopulações ou estratos de

forma que N

1

+ N

2

+ ... + N

K

= N.

Um tamanho amostral n é repartido proporcionalmente entre os estratos, respeitando

as frações N

i

/ N. Depois de estabelecidos o valor de n

i

, procede-se uma seleção

aleatória dentro de cada estrato.

Exemplo 24 – Amostra estratificada na região sul

Dividir proporcionalmente uma amostra de 1300 pessoas em três estratos,

correspondentes aos três estados da região sul.

i Estado Pop. % Amostra

1 Rio Grande do Sul 9.637.682 2 Santa Catarina 4.875.244

3 Paraná 9.003.804

Total 23.516.730

4.2.3 Amostragem Sistemática

A amostragem sistemática inicia com o cálculo do intervalo de amostragem f=N/n.

Depois, selecionamos um número entre 1 e f e vamos indo sistematicamente de f em f

elementos, até o final.

A amostragem sistemática é útil quando temos cadastros impressos que estão

ordenados segundo algum critério que nada tem a ver com os interesses da pesquisa.

Exemplo 25 – Escolhendo 8 alunos de um total de 40

Planta da sala de aula

1 11 21 31 2 12 22 32 3 13 23 33 4 14 24 34 5 15 25 35 6 16 26 36 7 17 27 37 8 18 28 38 9 19 29 39 10 20 30 40

(44)

Cap. 5. - Distribuições Amostrais e Estimação

5.1 – Parâmetros e Estimadores

O que é inferência estatística?

Inferir consiste na retirada de informações para TODA população baseando-se numa

amostra da mesma. Chamamos de parâmetros as quantidades populacionais e de

estimadores as funções de dados amostrais que irão gerar as estimativas para os

parâmetros populacionais.

Tabela - Exemplos de parâmetros e seus respectivos estimadores

Parâmetros

Estimadores

Média populacional

Média amostral

X

Desvio-padrão populacional

Desvio-padrão amostral

s

Proporção populacional

p

Proporção amostral

Há dois tipos de estimação de parâmetros: a estimação por ponto e por intervalo.

Também existe uma outra forma de inferência estatística muito utilizada em situações

práticas: os testes de hipóteses.

5.2 Distribuição Amostral da Média

A base da estatística inferencial é o TEOREMA DO LIMITE CENTRAL.

O teorema diz que se extrairmos TODAS as possíveis amostras de tamanho

n de uma

população de tamanho

N a distribuição das médias amostrais X tende a se distribuir

como uma curva Normal com média igual ao parâmetro

e desvio-padrão

n

.

Exemplo – População de tamanho N = 6

Considere a seguinte população de cinco elementos e X = Idade (anos)

20

30

40

50

60

70

A

B

C

D

E

F

a) Quais são os parâmetros populacionais?

(45)

Exemplo – Selecionando uma amostra na sala de aula

Suponha que seja necessário selecionar uma amostra de n=5 alunos da turma para

representar a nossa turma numa reunião na reitoria. Qual o número de amostras

possíveis de serem selecionadas?

Exemplo – População com média 0,5

Considere uma população infinitamente grande com média

0,5

. Vamos avaliar as

distribuições amostrais da média amostral X com n = 30 e 300.

-0,5 1,0 1,5 2,0 0 0,2 0,4 0,6 0,8 1 Médias amostrais -0,5 1,0 1,5 2,0 2,5 3,0 3,5 0 0,2 0,4 0,6 0,8 1 Médias amostrais

n = 30

n = 300

Percebemos claramente que com o aumento do tamanho amostral a distribuição de X

fica cada vez mais concentrada em torno do parâmetro

. Isso quer dizer que, quanto

maior amostra maior a possibilidade de acerto.

RESULTADO

X

tem distribuição Normal com

Média =  e Desvio-padrão =

n

(46)

5.3 – Estimação por ponto

Visa estimar o valor do parâmetro através de estimativas pontuais (únicas). A vantagem

é ser de fácil interpretação e rápida, mas a probabilidade de acerto “na mosca” é

praticamente nula, pois os estimadores podem ser encarados como variáveis aleatórias

contínuas.

Exemplo – World Trade Center

Um mês após o ataque ao WTC de NY perguntamos a 1000 americanos, escolhidos de

maneira aleatória, se estão com medo de viajar em vôos domésticos em território

americano.

Se 852 pessoas da amostra afirmam estar com medo, podemos estimar que 85,2% dos

americanos estão com medo de viajar de avião após os ataques terroristas de

11/Set/2001.

5.4 – Estimação por intervalo de confiança

Consiste em cercar o valor da estimativa pontual por uma região cuja probabilidade de

conter o verdadeiro parâmetro seja conhecida.

NOTAÇÕES que serão utilizadas a partir de agora

 (alfa) = nível de significância

1 -

 = nível de confiança

2 1  ; n

t

= valor da distribuição t de Student com

n-1 graus de liberdade e área

2 

à

direita.

2 

z = valor da distribuição normal padrão com área

2 

à direita.

1

o

) Intervalo de Confiança para

 (teórico)

Conhecendo o teorema do limite central podemos construir intervalos de confiança para

a média populacional. Para isso basta cercarmos a estimativa pontual X por um

intervalo cuja probabilidade de conter o parâmetro seja conhecida.

I.C. para

 com 1- de confiança =

1

2

N

n

N

n

z

X

(47)

Na fórmula de IC acima percebemos a presença de um parâmetro (). Se estamos

procurando um intervalo de confiança para

 é porque NÃO conhecemos . É

praticamente impossível conhecermos

 e não conhecermos . Por isso esse resultado

acaba sendo INÚTIL na prática.

2

o

) Intervalo de Confiança para

 (prático)

Ao substituirmos o parâmetro

 por seu estimador

s , a distribuição amostral de X

deixa de ter uma distribuição Normal e passa a ter uma distribuição t de Student. Desta

forma os Intervalos de confiança podem ser utilizados em situações práticas.

I.C. para

 com 1- de confiança =

1

2 1

N

n

N

n

s

t

X

n ,

Obs: O fator de correção

1

N

n

N

é omitido em caso de populações infinitas. O EXCEL

simplesmente ignora esse fator de correção.

Exemplo:

Numa amostra de 121 ligações, o tempo médio foi de

Construir um IC 95% para o verdadeiro tempo médio de uma ligação.

I.C. 95% para  =

        n s t X n 2 , 1

(48)

O EXCEL constrói Intervalos de Confiança sem o fator de correção com o comando

Estatísticas Descritivas que fica dentro da opção “Análise de Dados” no Menu

“Ferramentas”. Para incluir essa opção deve-se ir até “Suplementos” e assinalar a

opção “Ferramentas de Análise”.

ATENÇÃO: é necessário ter o banco de dados digitado em EXCEL para fazer

isso.

Figura – Tela do Excel: Ferramentas > Análise de dados > Estatística Descritiva

Tabela - Saída do EXCEL:

Tempo Média 13,041 Erro padrão 0,264 Mediana 13 Modo 13 Desvio padrão 2,908 Variância da amostra 8,457 Curtose -1,209 Assimetria 0,041 Intervalo 10 Mínimo 8 Máximo 18 Soma 1578 Contagem 121 Nível de confiança(95,0%) 0,523

(49)

3

o

) Intervalo de Confiança para uma proporção populacional p

A estimativa pontual para uma proporção é dada diretamente pela proporção amostral.

É muito útil construirmos um intervalo em torno da estimativa pontual que possua uma

probabilidade conhecida de conter a verdadeira proporção populacional.

I.C. para p com 1-

 de confiança =

1

1

2

N

n

N

n

p

p

z

p

ˆ

(

ˆ

)

onde

z

0,05

=1,645 (90%)

z0,025 1,96

(95%)

z0,005 2,576

(99%)

Obs: O fator de correção

1

N

n

N

é omitido em caso de populações infinitas.

O EXCEL NÃO faz intervalos de confiança para proporções.

Exemplo – Proporção de canhotos da PUCRS

Numa amostra de n=_______ alunos de uma população de N=30.000 de toda PUCRS,

verificamos que _______ são canhotos.

a) Qual a estimativa pontual de canhotos?

b) Construa intervalos de confiança 95% e 99% para a proporção de canhotos. Agora

use o fator de correção.

Referências

Documentos relacionados

Nos termos da legislação em vigor, para que a mensagem de correio eletrônico tenha valor documental, isto é, para que possa ser aceito como documento original, é necessário existir

MATRÍCULA nº 4.540 do 1º CRI de Piracicaba/SP: 01 (UMA) GLEBA DE TERRAS, situada no imóvel denominado “Algodoal”, contendo a área de 53.982,00m², desta cidade, que assim

Buscaram-se, assim, elementos da arte e arquitetura cemiterial como cruzes, esculturas, lápides, símbolos para serem usados em estamparia na aplicação em

Os prováveis resultados desta experiência são: na amostra de solo arenoso ou areia, a água irá se infiltrar mais rapidamente e terá maior gotejamento que na amostra de solo

libras ou pedagogia com especialização e proficiência em libras 40h 3 Imediato 0821FLET03 FLET Curso de Letras - Língua e Literatura Portuguesa. Estudos literários

Aula no Laboratório de Estatística 1 Dias 05 e 19.11.2018 39 Es tatís tica I - UN IR Es tatís tica I -UN IR Correlação e Regressão Es tatís tica I - UN IR Correlação

Suponha que c seja um ponto crítico de uma função contínua f e que f seja derivável em qualquer ponto de um interval. que contenha c, exceto possivelmente no próprio

As mudanças que se observam no mundo contemporâneo são de tal modo profundas, que inauguram a necessidade de repensar alguns dos nossos pressupostos teóricos para manter