• Nenhum resultado encontrado

ESTATÍSTICA REsumo - Probabilidade 2

N/A
N/A
Protected

Academic year: 2021

Share "ESTATÍSTICA REsumo - Probabilidade 2"

Copied!
21
0
0

Texto

(1)

ESTATÍSTICA – Resumo Prof. Ricardo Luís Rocha

Estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões.

5 etapas:

1) Definir cuidadosamente o problema 2) Formular um plano para coleta dos dados 3) Coligir os dados

4) Analisar e interpretar os dados 5) Relatar as conclusões

É dividida em três partes:

Estatística Descritiva, Probabilidade e Amostragem

1. Definições:

1. MODELO

Versão simplificada de algum problema ou situação da vida real destinado a ilustrar certos aspectos.

2. PROBABILIDADES

A teoria da probabilidade proporciona uma base racional para lidar com situações influenciadas por fatores relacionados ao acaso.

3. AMOSTRAGEM

Diz respeito à análise e interpretação de dados amostrais.

A idéia básica é efetuar determinada mensuração sobre uma parcela pequena, mas típica, de determinada “população” e utilizar esta informação para fazer inferência sobre a população toda.

4. POPULAÇÃO

É uma coleção completa de todos elementos (valores, pessoas, medidas etc.) a serem estudados.

5. AMOSTRA

É uma parte extraída dos elementos da população.

6. CENSO

É uma coleção de dados relativos a todos elementos de uma população.

7. PARÂMETRO

Medida numérica que descreve uma característica da população.

8. ESTATÍSTICA

Medida numérica que descreve uma característica de uma amostra.

9. DADOS QUANTITATIVOS

Constituem-se em números que representam contagens ou medidas.

10. DADOS CONTÍNUOS

São os dados quantitativos referentes às variáveis contínuas que podem assumir qualquer valor num intervalo contínuo. (Para solução de problemas: 1- Determinar intervalo de dados; 2- Determinar o número k de classes; 3- Calcular a amplitude da classe; 4- Estabelecer limites de classes; 5- Relacionar os intervalos e fazer a contagem; 6- Construir a tabela.)

11. DADOS DISCRETOS

São dados quantitativos referentes às variáveis discretas que assumem valores inteiros e são resultantes de uma contagem de itens. (Para solução de problemas: 1- Estabelecer as classes; 2- Enquadrar os dados nas classes; 3- Contar o número em cada classe; 4- Apresentar os resultados em tabela.)

12. DADOS QUALITATIVOS (ou categóricos ou atributos)

Podem ser separados em diferentes categorias que se distinguem por uma característica não-numérica. NOTAÇÃO

Característica amostra população

 

Somatório de um conjunto de valores

Valores individuais dos dados xi xi

Número de valores (tam. do conjunto) n N

Média x  Desvio padrão s  2 s2 Variância Range R -CV= Sx x100 Coef. Variação Proporção x/n x/N x

(2)

-13. DADOS NOMINAIS

Surgem quando se definem categorias e se conta o número de observações pertencentes a cada categoria. São dados qualitativos e não podem ser dispostos em um esquema ordenado.

14. DADOS POR POSTOS OU ORDINAIS

Consistem de valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, pequeno, médio, grande, pouco, médio, muito etc. São dados qualitativos, referem-se tipicamente a avaliações subjetivas

15. MEDIDAS DE POSIÇÃO (tendência central)

Média aritmética de um conjunto de valores

n

x

x

ou

n

x

x

1 i

n i

Características:

- É a mais importante das medidas de tendência central

- A média de um conjunto de números pode ser sempre calculada - Para um dado conjunto de números, a média é única

- É sensível a (ou afetada) todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica - Somando-se ou reduzindo-se uma constante a cada valor do conjunto, a média ficará aumentada ou reduzida dessa

constante. µ(x ± k) = µ (x) ± k

- Multiplicando-se ou dividindo-se cada valor do conjunto por uma constante, a média ficará multiplicada ou reduzida por essa constante. µ(x .\ k) = µ (x) .\ k

- µ(x ± y) = µ (x) ± µ (y) e µ (x.\y) = µ (x) .\ µ (y) (só se x e y forem independentes - A somas dos desvios dos números de um conjunto a contar da média é zero

- É conhecida como o centro de gravidade do conjunto de valores

Média ponderada

n i i x

x

n

x

1

1

Média geométrica

n n n n g

x

x

x

x

x

x

x

1

*

2

....

1

*

2

....

1  Média harmônica

 

n i i n i i i p

w

x

w

x

1 1

W – peso de cada elemento X – valor de cada elemento

natureza dos dados

alunos 2º grau idades, pesos nº da classe menino/menina 2º grau

automóveis velocidade Km/h nº defeitos / carro cores grau de limpeza vendas de imóveis

valor Cr$ n º ofertas acima do preço muito

dispendioso populações

(3)

Mediana

Divide um conjunto de dados ordenados em dois grupos iguais. Conjunto de valores pares ( n = par)

 

2

1 2 2

valor

n

valor

n

MD

Conjunto de valores impares ( n = par)

 21

valor

Intn

MD

Moda

É o valor ou classe de maior freqüência num conjunto de dados. - pode não existir

- pode não ser única

Quartis, decis, percentis

Os 3 quartis dividem conjuntos de dados ordenados (ordem crescente) em 4 partes iguais: Q1  25% dos valores serão inferiores ao primeiro quartil (Q1)

Q2  50% serão inferiores ao segundo quartil (Q2 = mediana)

Q3  75% serão inferiores ao terceiro quartil (Q3) e 25% serão superiores ao terceiro quartil

Há 9 decis denotados por D1, D2, D3, ...D9, que dividem os dados (ordem crescente) em 10 grupos com cerca de 10% deles em cada grupo.

Há 99 percentis que dividem os dados (ordem crescente) em 100 grupos com cerca de 1% em cada grupo.

16. MEDIDAS DE DISPERSÃO

Amplitude, range ou intervalo

É expresso pela diferença entre o maior e o menor número num grupo, ou pela identificação desses dois números. Limitação: só leva em conta os dois valores extremos do conjunto, nada informando sobre os outros valores.

Desvio médio absoluto

n

x

x

DMA

i

Conquanto o desvio médio absoluto seja fácil de entender, não é muito usado como medida de dispersão, porque outras medidas apresentam propriedades matemáticas mais interessantes.

O DMA apresenta algumas aplicações no controle de inventários.

apropriada para dados ao nível nominal não

não pode não existir;

pode ter mais de uma moda usada às vezes valor mais freqüente moda

costuma ser boa escolha se há valores extremos não não existe sempre usada valor médio mediana muito utilizada em estatística sim sim existe sempre “média” mais familiar média vantagens e desvantagens afetada pelos valores extremos? leva em conta todos os valores? existência quão freqüente definição medida x =  x n

(4)

Variância

1

ou

1

2 2 2 2 2

n

n

x

x

S

n

x

x

S

x i x i i n – 1 amostra; n população Características:

- A variância de uma constante é nula 2(k) = 0

- Se multiplicarmos todos os valores de uma variável aleatória por uma constante, sua variância fica multiplicada pelo quadrado da constante 2(kx) = k2 . 2(x)

- A variância de uma soma ou diferença de variáveis aleatórias independentes é igual à soma das variâncias dessas variáveis

2(x ± y) = 2(x) + 2(y)

- Se somarmos ou subtraímos uma constante aos valores de uma variável aleatória, sua variância permanece inalterada

2 (x ± k) = 2(x)  Desvio padrão

1 ou 1 2 2 2      

n n x x S n x x Sx i x i i

- só raiz positiva da variância

- O desvio padrão é mais comumente usado porque se apresenta na mesma unidade da variável em análise. Assim, se a unidade da variável for mm, o desvio padrão também será mm. Isso não acontece com a variância.

- O desvio padrão é a medida de dispersão mais usada. Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da média.  Coeficiente de variação

100

*

x

S

CV%

x Nos dá a idéia do tamanho do desvio padrão em relação à média.

Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável

17. DISTRIBUIÇÕES DE FREQÜÊNCIA

É um grupamento de dados em classes, exibindo o número ou percentagem de observações em cada classe. Uma distribuição pode ser apresentada em forma gráfica ou tabular.

DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS CONTÍNUOS Etapas para construção

1 - Determinar o intervalo dos dados

2 - Determinar o número K de classes

É aconselhável tomar entre 5 a 20 classes

Regra prática:

K

n

Ajustá-la se for necessário

Certifique-se que k vezes a amplitude é maior que o intervalo, pois, de outra forma, os valores extremos não serão incluídos

3 - Calcular a amplitude da classe

Amplitude = intervalo / nº de classes (k)

É importante que não ocorra lacunas na fixação das classes (deve haver uma classe para cada valor) As classes não devem intercepta-se (um valor deve pertencer a só uma classe

4 - Estabelecer limites de classes preliminares. Rever os limites, que devem tocar-se mas não intercepta-se

5 - Relacionar os intervalos e fazer a contagem dos pontos por classe (a contagem total dever ser igual a n)

(5)

Histograma

Alternativa ao histograma  POLÍGONO DE FREQÜÊNCIA

Certa quantidade de informação é perdida porque os valores individuais perdem sua identidade quando são grupados em classes.

Para dados discretos isto também pode ocorrer dependendo da natureza dos dados e do objetivo do analista.

DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS DISCRETOS 1. Estabelecer as Classes

2. Enquadrar os dados nas classes 3. Contar o nº em cada classe 4. Apresentar os resultados em tabela

0,30 0,20 0,10 0,00 3 8 13 18 23 28 33 classes fr eq ü ên ci a re la ti v a o u a b so lu ta 3 8 13 18 23 28 33 fr eq ü ên ci a classes 0,30 0,20 0,10 0,00 safras P er ce n ta g em d e ár v o re s

Gráfico de barras Histograma

0 1 2 3 4 5 6 7 8 9 4 acidentes por dia

ocorreram 9 vezes (18%)

a) sem perda de informação 20 15 10 5 fr eq ü ên ci a d e ac id en te s

b) com perda de informação 20 15 10 5 0-1 2-3 4-5 6-7 8-9 fr eq ü ên ci a d e ac id en te s

(6)

fre qü ê nc ia fre qü ê nc ia

Determinação da moda num gráfico a) sem perda b) com perda

moda classe modal

DISTRIBUIÇÃO DE FREQÜÊNCIA ACUMULADA PARA DADOS DISCRETOS

A freqüência acumulada tem por objetivo indicar o número ou percentagem de itens menores do que, ou iguais a determinado valor.

18. MEDIDAS DA DISTRIBUIÇÃO DE FREQÜÊNCIA

Média n f x x n f c x n i i i n i i i              

 1 1 ou

n - número de elementos do conjunto de dados c i - centro de cada classe de freqüência

f i - freqüência de cada classe  Mediana - MD

 

mf md a i h f F n L MD  2 

L i - limite inferior da classe que contém a mediana n - número de elementos do conjunto de dados

F a - soma das freqüências das classes anteriores à que contém a mediana

f md - freqüência da classe que contém a mediana

h md - amplitude da classe que contém a mediana

(1. Identificar o intervalo que contém a mediana; 2. determinar a posição; ordenar os valores da classe; 4. identificar a mediana)

Moda - MO

h

d

d

d

L

MO

i

2 1 1

Mo - valor ou valores num conjunto de dados L i - limite inferior da classe modal

d 1 - diferença entre a freqüência da classe modal e da classe

imediatamente anterior

d 2 - diferença entre a freqüência da classe modal e da classe

imediatamente seguinte h - amplitude das classes

DADOS DISCRETOS

Sem perda de informação

fr eq ü ên ci a ac u mu la d a 1,00 0,80 0,60 0,40 0,20 0,00 78% dos acidentes acorreram 6 vezes por dia ou menos

0 1 2 3 4 5 6 7 8 9

Com perda de informação

fr eq ü ên ci a ac u mu la d a 1,00 0,80 0,60 0,40 0,20 0,00 0-1 2-3 4-5 6-7 8-9

(7)

Variância

1

ou

1

2 2 2 2 2

n

n

x

f

x

f

s

n

x

x

f

s

i i i i i

Na utilização da classe de freqüência com perda de informação, x i é o centro da classe de freqüência.

O desvio padrão é a raiz positiva da variância.

19. MEDIDAS DE FORMAS DAS DISTRIBUIÇÕES DE FREQÜÊNCIA

ASSIMETRIA

ACHATAMENTO

O coeficiente de achatamento (Kurtosis) é uma medida de planicidade (flatness) da distribuição.

2 = 3 - planicidade de uma curva normal - mesocúrtica 2 = 4,5 - curva bastante aguda -leptocúrtica (leptokurtosis) 2 = 1 - curva mais achatada – platicúrtica (platykurtosis)

20. BOX-AND-WHISKER PLOTS OU DIAGRAMA EM CAIXA

Os diagramas em caixa são convenientes para revelar tendências centrais, dispersão, distribuição de dados e presença de outliers (valores extremos)

Para a construção são necessários: valor mínimo

primeiro quartil Q1,

a mediana (ou segundo quartil Q2) terceiro quartil Q3 e

valor máximo

A mediana revela a tendência central Os quartis indicam a dispersão dos dados

O diagrama em caixa tem a vantagem de não ser tão sensível a valores extremos

Não dão informações tão detalhadas quanto o histograma ou gráfico de ramo-e-folhas

A melhor aplicação do diagrama em caixa é na comparação de dois ou mais conjuntos de dados (é necessário usar a mesma escala).

Não há diferenças substanciais nos dois conjunto de dados. Os não fumantes têm mais valores extremos, mas as medianas parecem coincidir. A dispersão dos dados são parecidas

Obs.: os outliers 8 e 15 foram excluídos

moda mediana média

média mediana

moda moda = mediana = média

Assimétrica à esquerda: média e mediana estão a esquerda da moda Simétrica: média, moda e

mediana coincidem Assimétrica à direita:

média e mediana estão à direita da moda

 = 4,5  = 3,0

 = 1,0

platícúrtica mesocúrtica leptocúrtica (normal)

fumantes não fumantes

puls aç ão 80 90 70 40 60 50 100

(8)

2.

PROBABILIDADES

1. Conceito:

É a chance que alguma coisa tem para ocorrer. Exprime a chance de ocorrência de determinado evento. Empírico: Fazer vários experimentos e anotar resultados

Subjetivo: Opinião pessoal.

2. Notação:

P – denota probabilidade

A, B, C – denotam eventos específicos

P(A) – denota a probabilidade do evento A ocorrer

Pode ser expressa em fração decimal (0 a 1) ou percentagem (0 a 100%), sendo: - 0 ou 0% a probabilidade de um evento impossível e

- 1 ou 100% a probabilidade de ocorrência um evento certo

3. Definição de Probabilidade:

As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado evento.

A probabilidade de um certo evento A ocorrer é igual à freqüência relativa de vezes que A é observado, quando o experimento é repetido um número infinitamente grande de vezes.

A probabilidade de ocorrência de um evento é dada por um número que varia de 0 a 1.

4. Definição de Eventos:

São os resultados possíveis de um experimento.

ex.: Se o experimento fosse o lançamento de uma moeda, os eventos possíveis seriam cara e coroa.

5. Definição de Conjunto:

Coleção bem definida de objetos ou itens. ex.: conjunto A = {João, Maria , José}

6. Definição de Espaço Amostral:

É o conjunto de todos os resultados possíveis de um experimento.

7. Definição de Complemento:

Complemento de um evento consiste de todos os outros resultados do espaço amostral que não façam parte do evento.

8. Definição de Eventos Mutuamente Exclusivos:

São aqueles que não podem ocorrer simultaneamente.

ex.: Na extração de uma carta, os eventos a carta é de copas e a carta é de ouros são mutuamente excludentes, pois uma carta não pode ser simultaneamente de copas e de ouros.

9. Definição de Eventos Coletivamente Exaustivos:

Quando somente um resultado é possível de ocorrer em um dado experimento.

ex.: Na extração de uma carta, os eventos carta preta e carta vermelha são coletivamente exaustivos. Ou seja, somente um resultado é possível.

10. Definição de Eventos Independentes:

Dois eventos são independentes quando a ocorrência ou a não-ocorrência de um não influencia a ocorrência do(s) outro(s).

ex.: A se jogar duas moedas, verificar a probabilidade de ambas darem cara.

11. Eventos dependentes

(9)

Os eventos são mutuamente exclusivos ? Sim P(A e B) = 0, quando ocorrerem dois eventos

P(A ou B) = P(A) + P(B), quando ocorrer ao menos um de dois eventos Não

Os eventos são independentes ? por ex.: P(A|B)=P(A) ?

Sim P(A e B) = P(A) x P(B), quando ocorrerem dois eventos

P(A ou B) = P(A) + P(B) - P(A e B), quando ocorrer ao menos um de dois eventos

Amostras com reposição Amostras sem reposição

Binomial Quando o valor de n é grande e o de p é pequeno, usar a Tabela ou

a Fórmula de Poisson. Hipergeométrica

O eventos são condicionais ? (é um evento dependente do outro ?)

Quando ocorrerem dois eventos e um depender da ocorrência do outro.

P(A e B) = P(A) x P(B|A) P(A e B) = P(B) x P(A|B) Não Sim PROBABILIDADE Probabilidade do evento E: n(A) n(E) P(E) seja, ou amostral espaço do elementos de nº E evento do elementos de nº ) (   E P N n E P( ) 00 , 1 ) ( 00 , 0 PE  1 ) ( 

P Ei E de ocorrência -não de ade probabilid a ) ' ( sendo ) ( 1 ) ' (E P E P E P   CHANCE E em NÃO resultados de nº E em SIM resultados de nº E de

Chance  Exemplo: Uma urna tem 10 bolas, 8 vermelhas e 2 verdes. A chance a favor da vermelha é de 8:2 ou 4:1.

PROBABILIDADE DE OCORREREM DOIS EVENTOS

(A e B)

Eventos independentes -> a ocorrência ou não de um não influencia a

ocorrência do outro.

Ex.: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas darem cara ?

Sol.: P(cara) = 1/2 logo, P(cara e cara) = 1/2 x 1/2 = 1/4.

P(B) x P(A) B) P(A : notação Outra . idem B), | P(A x P(B) B) e P(A ou P(B) A) | P(B tes independen são eventos os como mas A), | P(B x P(A) B) e P(A           P(A) x P(B) B) e P(A P(B) x P(A) B) e P(A

Eventos dependentes um do outro.

(Probabilidade Condicional)

Ex.: A urna Y tem 8 fichas vermelhas e 2 brancas. A urna Z tem 5 vermelhas e 5 brancas. Escolhendo a urna Y, qual a probabilidade de sair uma ficha

vermelha ?

Sol.: P(Urna Y e ficha vermelha) = 8/20 = 0,40, ou seja: A = Urna Y B= ficha vermelha

P(A)= ½ P(B|A)=8/10, logo P(A e B) = 1/2 x 8/10 = 8/20 ou 0,40. B) | P(A x P(B) B) P(A A) | P(B x P(A) B) P(A : notação Outra B) | P(A x P(B) B) e P(A A) | P(B x P(A) B) e P(A      

Se A e B são dois eventos, a probabilidade de B ocorrer, depois de A ter ocontecido é definida por P(B|A), ou seja, é chamada "probabilidade condicional de B".

Eventos mutuamente exclusivos

quando a realização de um exclui a realização do(s) outro(s).

0 B) P(A : notação Outra 0 B) e (A P    PROBABILIDADE DE OCORRER AO MENOS UM DE DOIS EVENTOS (A ou B)

Eventos mutuamente exclusivos (ou seja, que não podem ocorrer

simultaneamente), a probabilidade de ocorrência de um deles é a soma de suas probabilidades individuais.

ex.: A probabilidade de ocorrer 5 ou 6 numa jogada com um dado é:

P(cinco) + P(seis) = 1/6 + 1/6 = 2/6 P(A B) P(A) P(B)

: Notação Outra P(B) P(A) B) ou P(A     

Eventos não mutuamente exclusivos, ou seja, é possível a ocorrência

conjunta de ambos.

ex.: Em um baralho de 52 cartas há 13 cartas de paus, 4 dez e 1 dez de paus. A probabilidade de se tirar 1 carta de paus, ou dez ou ambos (dez de paus) é: P(paus) = 13/52 P(dez) = 4/52 P(dez de paus) = 1/52

Logo,

P(paus, ou dez, ou ambos) =P(paus) + P(dez) – P(dez de paus)=

13/52 + 4/52 – 1/52 = 16/52. vêzes. duas somada seja não intersecão a que para B), P(A ou B) e P(A têrmo o se -Subtrai : Nota B) P(A -P(B) P(A) B) P(A : notação Outra B) e P(A -P(B) P(A) B) ou P(A       

Quando se tem mais de dois eventos, por ex., P(A  B  C ) = (1-P(A)) x (1-P(B)) x (1-P(C))

12. FLUXOGRAMA DA PROBABILIDADE

(10)

13. REGRAS DE CONTAGEM

QUANDO A ORDEM É IMPORTANTE

ARRANJO

Número de grupamentos em que interfere a ordem.

(

)!

!

A

n,x

x

n

n

ex.: Tomando 4 cores: V, A, B, L Temos A4,3 = 24

VAB,VBA,AVB,ABV,BAV,...,etc

PERMUTAÇÃO

Uma permutação é um arranjo com a totalidade dos elementos. Com repetição n1, n2, ..., nk

)

!

)...(

!

2

)(

!

1

(

!

P

nn1,n2,...,nk

nk

n

n

n

QUANDO NÃO INTERESSA A ORDEM

COMBINAÇÃO

Uma combinação é um maior número de grupamentos possíveis. O número de combinações é sempre inferior ao número de arranjos.

)!

(

!

!

C

n,x

x

n

x

n

x

n





ex.:Tomando 4 cores: V, A, B, L Temos C4,3=4

VAB, VAL, VBL, ABL

PROBABILIDADE TOTAL

Sejam B1, B2, B3,...,Bk um conjunto de eventos mutuamente exclusivos cuja união forma o espaço amostral.

Seja A outro evento no mesmo espaço amostral, tal que P(A) > 0. Logo,

P(A)= P(AB1) + P(AB2) + +P(AB3)+...+P(ABk) P(A) = P (B1) x P(A|B1) + P(B2) x P(A|B2) +...+P(Bk) x P(A|Bk)

Logo,

Probabilidade Total =  [P(Bi) x P(A|Bi)]

14. REGRA DE BAYES:

Thomas Bayes (1702 ~1761) afirmou que as probabilidades devem ser revistas, quando conhecemos algo mais sobre os eventos. O teorema de Bayes é uma técnica utilizada para revisar estimativas probabilísticas iniciais com base em dados amostrais.

Na solução pelo Teorema de Bayes, temos de definir: 1- a probabilidade a priori.

2- a probabilidade do evento em questão. Fórmulas:

P(A) =  [P(Bi) x P(A|Bi)

P(A  Bi) = P(A) x P(Bi|A) => P(Bi|A) = P(ABi) / P(A) P(Bi|A) = P(Bi) x P(A|Bi) /  [P(Bi) x P(A|Bi)]

15. DISTRIBUIÇÕES DE PROBABILIDADE

Uma distribuição de probabilidades é uma distribuição de freqüências para os resultados de um espaço amostral. Uma distribuição de probabilidade dá a probabilidade de cada valor de uma variável aleatória.

Variável aleatória - va

É uma variável (geralmente representada por x), que tem um valor numérico único (determinado aleatoriamente) para cada resultado de um experimento.

É uma função com valores numéricos, cujo valor é determinado por fatores de chance

Variável aleatória discreta toma valores que podem ser contados.

Número final da placa de carros que chegam ao aeroporto de congonhas Número de mulheres entre 10 empregados recém-admitidos

Variável aleatória contínua

toma qualquer valor de um determinado intervalo.

(11)

Valor esperado

O valor esperado de um experimento é uma média e pode ser calculado

 

P

Deve

ser

interpreta

do

como

um

valor

médio

de

longo

prazo.

E

1

n i i i x

x

Para se ter uma distribuição de probabilidades é necessário:

 P(x) = 1, onde x toma todos valores possíveis 0  P(x)  1 para todo o x.

DESCONTÍNUAS OU DISCRETAS

Envolvem distribuições de probabilidades de variáveis aleatórias relativas a dados que podem ser contados. - BINOMIAL

- BINOMIAL NEGATIVA OU DE PASCAL - GEOMÉTRICA

- POISSON

- MULTINOMIAL OU POLINOMIAL - HIPERGEOMÉTRICA

PROCESSO DE BERNOULLI - O experimento tem n provas

- Cada prova tem duas possibilidades: sucesso e falha - Cada prova é independente da outra

- A probabilidade de sucesso ou falhas é constante para todas as provas - A distribuição binomial é um processo de Bernoulli

- A distribuição hipergeométrica não é um processo de Bernoulli

DISTRIBUIÇÃO BINOMIAL

Designa situações em que os resultados de uma variável aleatória podem ser grupados em duas classes ou categorias (prova de Bernoulli)

Exemplos de eventos binomiais

- Respostas nominais (sucesso ou falha; V ou F; sim ou não; perfeito ou defeituoso; bolas verdes ou não verdes) - Deve comportar um número fixo n de provas idênticas

- As provas devem ser independentes (uma prova não afeta a probabilidade de outra acontecer) - Categorias mutuamente excludentes (sucesso e falha)

- As probabilidades devem permanecer constantes para cada prova

- Categorias coletivamente exaustivas (soma de todos resultados possíveis igual a 1) - Eventos = observações = provas = experimentos = trials

Cálculo das probabilidades binomiais 1. Fórmula binomial

2. Tabela de probabilidades binomiais tabela individual tabela acumulada NOTAÇÃO

Se S e F (sucesso e falha) denotam as duas categorias possíveis de todos os resultados; p e q denotam as probabilidades de S e F respectivamente, assim:

P(S) = p e P(F) = 1 – p = q n número fixo de provas

x número específico de sucessos em n provas (nº inteiro entre 0 e n) p probabilidade de sucesso em uma das n provas

q probabilidade de falha em uma das n provas

P(x) probabilidade de obter exatamente x sucessos em n provas

 

x

 

nx

p

x

q

n x

(12)

Para nº de sucessos:

Média

np

Desvio

Padrão

npq

Para percentagem de sucessos:

Média

p

Desvio

Padrão

pq

n

DISTRIBUIÇÃO DE POISSON

ocorrências típicas do modelo de distribuição de Poisson

3. Dados de tempo ou espaço (def./cm2; acid./dia; cham./h; vaca/acre) OBSERVAÇÃO

A unidade de medida é contínua (tempo, área etc.), mas o número de ocorrências (variável aleatória) é discreta

A distribuição de Poisson é útil para descrever a probabilidade do número de ocorrências num campo ou intervalo contínuo (em geral tempo ou espaço)

CARACTERÍSTICAS

- A variável aleatória x é o número de ocorrências de um evento num intervalo

- A probabilidade de uma ocorrência é a mesma em todo o intervalo considerado (ocorrências aleatórias) - As ocorrências são distribuídas uniformemente ao longo do intervalo considerado

- O número de ocorrências em qualquer intervalo é independente do número de ocorrências em outros intervalos - A probabilidade de mais de 1 ocorrência no mesmo ponto é praticamente nula

FÓRMULA DE POISSON  

 

 

!

!

x

e

x

t

e

P

x x t x

   

A média é o parâmetro que caracteriza a distribuição de Poisson µ =  t , logo P(x) = probabilidade de ocorrer x ocorrências

µ = é a média de ocorrências no intervalo t

 = taxa média por unidade

t = é o número de unidades ou intervalo x = número de ocorrências

e = é a base dos logaritmos neperianos = 2,71828

t

Variância

Desvio

Padrão

Média

2

DISTRIBUIÇÃO POISSON COMO APROXIMAÇÃO DA BINOMIAL Quando deve-se fazer a aproximação por Poisson?

- Número n de observações é grande n 100 e np <10 (regra prática) - Probabilidade de sucesso “p” está próxima de 0 ou 1

- Porque fazer a aproximação por Poisson?

- A distribuição binomial descreve adequadamente muitas situações de interesse - A maioria das tabelas está limitada a n  20

(13)

DISTRIBUIÇÃO MULTINOMIAL OU POLINOMIAL

Utilizada nas situações onde há mais de dois resultados mutuamente excludentes. (tste de múltipla escolha) EXIGE-SE:

- Que as provas sejam independentes

- Tenham probabilidade de ocorrência constante

A probabilidade multinomial de que, em n observações, o resultado E1 ocorra n1 vezes, E2 ocorra n2 vezes, ... , e Ek ocorra nk vezes é dado pela fórmula:

 

knk

n n n K

p

p

p

p

n

n

n

n

n

...

!

!...

!

!

!

P

33 2 2 1 1 3 2 1 x

DISTRIBUIÇÃO HIPERGEOMÉTRICA

Utiliza-se a distribuição hipergeométrica em situações com dois ou mais resultados, em que a probabilidade de sucessos varia de uma prova para outra (extração sem reposição de uma população finita).

- Observações dependentes

- Probabilidade variável de prova para prova - Amostragem sem reposição

  

 

N n r x r N x n  

n r, N, | x

P

N = tamanho da população n = tamanho da amostra r = nº de sucessos da população x = nº de sucessos da amostra  

N

 

 

V

E

x

Desvio

Padrão

1

-N

n

-N

p

-1

np

V

Variância

r

p

np;

Média

x

DISTRIBUIÇÃO GEOMÉTRICA

Seja o experimento que consiste em se repetir a prova de Bernoulli tantas vezes quantas forem necessárias, até se obter o primeiro sucesso.

Se forem provas independentes e de mesma probabilidade de sucesso p, o número de tentativas X terá distribuição geométrica.

   

V

E

x

Desvio

Padrão

p

q

V

Variância

;

p

1

Média

....

3,

2,

1,

k

;

pq

k

x

P

2 x 1 k

DISTRIBUIÇÃO DE PASCAL OU BINOMIAL NEGATIVA

Nas condições em que foi definida a distribuição geométrica, se considerarmos X o número de tentativas até se obter o r-ésimo sucesso (exemplo: 17º sucesso), teremos uma distribuição de Pascal.

Sendo r a ordem do sucesso desejado e k o número de tentativas para o obter o sucesso desejado, temos: Qual a probabilidade de ocorrer k provas até que ocorra r sucessos (ou falhas)

 

   

V

E

p

x k r

Padrão

Desvio

p

rq

V

Variância

;

p

r

Média

....

3,

r

2,

r

1,

r

r,

k

;

q

p

k

x

P

2 x 1 k r 1 1

  

(14)

COMPARAÇÃO ENTRE BINOMIAL E POISSON BINOMIAL

- Afetada pelo tamanho amostral n e pela probabilidade p - Valores possíveis da variável aleatória x são 0, 1, 2, 3 ...n - Contagem de sucessos e falhas

POISSON

- Afetada apenas pela média µ

- Valores possíveis da variável aleatória x são 0, 1, 2, 3 ... sem limite superior - Contagem de sucessos somente

APLICAÇÕES DAS DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE

Distribuição

exemplos

Hipóteses

binomial

dois resultados

jogada de uma moeda

teste V ou F

defeituoso, não defeituoso

observações independentes

probabilidades constantes

de poisson

só ocorrências

acidentes / ano

defeitos / jarda

chamadas / minuto

observações independentes

probabilidades constantes

hipergeométrica

dois ou mais

resultados

amostragem sem reposição

observações dependentes

multinomial

mais de dois

resultados

teste de múltipla escolha

observações independentes

probabilidades constantes

DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS - UNIFORME OU RETANGULAR - NORMAL - EXPONENCIAL - LOGNORMAL - BETA - GAMA - WEIBULL - F DE SNEDECOR - QUI-QUADRADO 2 - t DE STUDENT - ERLANG - BIVARIADA NORMAL

Quando se usa as distribuições contínuas?

- A variável aleatória discreta apresenta um grande número de resultados - A variável aleatória em questão é contínua

Os ponteiros de um relógio podem parar em qualquer dos infinitos pontos do círculo logo, A probabilidade de parar em um ponto definido é zero

- Nas distribuições contínuas utilizam-se a probabilidade da ocorrência em um intervalo P(a < x < b). - Em uma distribuição contínua, a probabilidade é dada pela área contida no intervalo considerado.

(15)

P(x)

f(x)

0 a c d b

DISTRIBUIÇÃO UNIFORME OU RETANGULAR

Quando se usa as distribuições uniformes?

Quando a variável aleatória pode tomar qualquer valor numa escala contínua entre dois pontos (intervalo) e que estes valores sejam igualmente prováveis.

 

12

a

-b

Variância

2

b

a

Média

2

 

a

b

c

d

P

c x dDISTRIBUIÇÃO NORMAL

IMPORTÂNCIA DA DISTRIBUIÇÃO NORMAL

- Retrata com boa aproximação, as distribuições de freqüência de muitos fenômenos naturais e físicos - Serve como aproximação das probabilidades binomiais quando n é grande

- Representa a distribuição das médias e proporções em grandes amostras, o que tem relevante implicação na amostragem (a mais importante)

Também é conhecida por “Distribuição Gaussiana”, em função do modelo matemático desenvolvido por Karl F. Gauss para este comportamento.

CARACTERÍSTICAS

- A curva normal tem a forma de sino - É simétrica em relação a média

- Prolonga-se de - a + (apenas em teoria)

- Fica completamente especificada por sua média e seu desvio padrão; há uma distribuição normal para cada par média e desvio padrão

- A área total sob a curva é considerada 100% ou igual a 1

- A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses pontos

- A probabilidade de uma variável aleatória normalmente distribuída tomar exatamente determinado valor é zero (característica da distribuição contínua)

- A área sob a curva entre a média e um ponto arbitrário é função do número de desvios padrões entre a média e aquele ponto

A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos     2 2 2

2

1

 

x x

e

f

x – ponto considerado da distrib.

µ - média da distribuição  - desvio padrão da distribuição

OBSERVAÇÃO

x - µ = distância do ponto considerado à média

Curva normal típica

Média = µ Desvio padrão =

média

forma de uma boca de sino

50% 50%

(16)

x

z

número de desvios padrões a contar da média. Ex.: 2,5 desvios padrões z = valor z ou score z. Pode-se obter valores negativos de z para valores de x inferiores à média A distância entre a média e um ponto qualquer é dado em número de desvios padrões (z)

DISTRIBUIÇÃO BINOMIAL aproximada Pela NORMAL quando : np 5 e nq 5 Por POISSON quando: n 100 e np < 10

GRAUS DE LIBERDADE

“A razão pela qual se recomenda usar n-1 ao invés de n no denominador da expressão de s2 está relacionada com o número de grau de liberdade.

Esta questão é, possivelmente, abstrata; tomemos, por exemplo, as estatísticas µ e o2. Essas estatísticas têm n graus de

liberdade, ou seja, n valores xi, livres que devem ser considerados para cálculo dos valores das estatísticas. Em outras palavras, desconhecendo-se qualquer valor xi, torna-se impossível a determinação do valor da estatística. Já a estatística s2, por usar x ao invés de µ, tem um grau de liberdade a menos, porque seu cálculo pressupõe-se que anteriormente já se tenha calculado x (usamos já uma vez todos os valores da amostra). No momento de usarmos novamente os valores xi, para cálculo de s2, esses valores tem n-1 graus de liberdade, pois, dados quaisquer n-1 deles, o valor restante estará perfeitamente determinado, pelo fato de já conhecermos a média, não sendo, portanto, livre”.

Normal padronizada Normal não padronizada z = x - µ  µ x 0 z P P -3 -2 -1 0 +1 +2 +3 68% 95,5% 99,7% n n 0% 50% 100% P(“sucesso”) 20 1 20 1

use a aproximação normal para n e p nesta área

aprox. de Poisson aprox. de

Poisson

use a tabela ou a fórmula binomial para n e p nesta área

(17)

DISTRIBUIÇÃO t DE STUDENT

E QUANDO TIVERMOS A VARIÁVEL CONTÍNUA DE UMA POPULAÇÃO COM DESVIO PADRÃO DESCONHECIDO E AMOSTRA PEQUENA ?

- William Gosset (1876 – 1937), Irlandês, químico da Cervejaria Guinness. - A distribuição t se assemelha à distribuição normal

Propriedades importantes

- A distribuição t de varia conforme o tamanho da amostra (veja figura)

- A distribuição t tem a mesma forma geral simétrica que a distr. normal, mas reflete a maior variabilidade que é esperada nas pequenas amostras

- A distribuição tem média t = 0 (tal como a distr. normal padronizada com z = 0)

- para grandes amostras, n > 30, a distribuição t se aproxima muito da distribuição normal. Nestes casos utiliza-se os valores de z (curva normal) no lugar de t (curva t).

RELAÇÃO COM A CURVA NORMAL

Pode-se observar ainda que a distribuição t é muito semelhante à curva normal. À medida em que aumentam os gl, a distribuição t aproxima-se da distribuição normal padronizada (média = 0, desvio-padrão = 1). A curva normal padronizada é um caso particular da distribuição t quando gl tende ao infinito. Para os propósitos práticos, os valores da distribuição t aproximam-se dos valores da distribuição normal padronizada relativamente depressa, tal que quando gl = 30 esses valores são quase idênticos.

A distribuição t é uma distribuição de probabilidade teórica. É simétrica, campaniforme, e semelhante à curva normal standard. Difere da curva normal standard, porém, nisso tem um parâmetro adicional, os chamados graus de liberdade que mudam sua forma.

GRAUS DE LIBERDADE

Graus de liberdade, normalmente simbolizados por gl, são um parâmetro da distribuição t que pode ser qualquer número real maior que zero. Fixando o valor de gl definimos uma situação particular da família de distribuições t. Uma distribuição t com um gl menor tem mais área nas caudas da distribuição que uma distribuição com um gl maior.

O efeito dos gl na distribuição de t está ilustrado nas três distribuições t mostradas na figura.

Note-se que quanto menor o número de gl, mais aplainada (platocurtica) é a forma da distribuição, resultando em maior área nas caudas da distribuição.

t0 gl =  gl = 6 gl = 3 2,45 -3,18 -1,96 1,96 3,18 -2,45 n = 7 n = 4

Distribuição t de student com n = 3

Distribuição t de student com n = 12

Distribuição normal padronizada

(18)

Distribuição normal ou t ? início n > 30 população tem distr. normal  população é conhecido usar distribuição t

pelo teorema do limite central podemos usar a distrib. normal (use s se  não for conhecido)

usar métodos não-paramétricos ou de reamostragem

usar a distribuição normal sim sim sim não não não

(19)

n = 100 n = 80 n = 60 n = 40 p= 0,1 p=0,5 p= 0,9

AMOSTRAGEM PROBABILÍSTICA

1. Sistemática – Lista aleatória de itens 2. Estratificada – Subgrupos homogêneos

3. Por Conglomerado – Itens fisicamente próximos uns dos outros

AMOSTRAGEM NÃO PROBABILÍSTICA

AMOSTRAGEM POR JULGAMENTO

ERRO AMOSTRAL (ou randon error)

Sabemos de antemão que no baralho existem 4 ases. A esse desvio na amostra em relação ao valor real é chamado de erro amostral.

- Este tipo de erro não pode ser evitado mas pode ser controlado - De uma forma ou de outra ele interfere em nossa decisão

- Esse erro, entretanto não ocorre de forma descontrolada, desde que a amostra seja retirada aleatoriamente do lote - Leis probabilísticas regem os limites de variação desse erro.

- Ao retirar uma amostra com critério de aceitação definido, existe o risco de: - Um lote de má qualidade poder ser aprovado ou

- Um lote de boa qualidade poder ser reprovado ERRO AMOSTRAL depende de três fatores

1 – Estatística que está sendo considerada

A variabilidade associada a diferentes estatísticas amostrais, são descritas por diferentes distribuições de probabilidades 2 – Tamanho da amostra

Há menor variabilidade entre estatísticas de grandes amostras do que entre pequenas amostras 3 – Variabilidade existente na própria população submetida a amostragem

Populações com muita variabilidade produzem estatísticas amostrais com maior variabilidade do que populações com pequena variação entre os valores populacionais

Distribuição Amostral

Uma distribuição amostral é uma distribuição de probabilidades que indica até que ponto uma estatística amostral tende a variar devido a variações casuais na amostragem aleatória

Duas distribuições amostrais mais usadas são a Binomial e a Normal Quanto a amostra aumenta:

- A distribuição amostral das proporções tende para a forma da distribuição normal - A variabilidade amostral decresce

- A média da distribuição amostral é sempre igual à proporção da população Quanto a Probabilidade de cada evento muda:

DISTRIBUIÇÕES DE MÉDIAS AMOSTRAIS

É uma distribuição de probabilidade que indica quão prováveis são as diversas médias amostrais. É função: - da média da população

- do desvio padrão da população - do tamanho da amostra

Conclusões importantes das distribuições de médias

- A média da distribuição é sempre igual à média da população

- desvio padrão (variabilidade) diminui quando aumenta o tamanho da amostra Média da distribuição amostral:

x x

(20)

Desvio padrão da distribuição amostral

n

x x

TEOREMA DO LIMITE CENTRAL (válido para médias amostrais)

Capacidade de fazer inferência sobre parâmetros populacionais depende do conhecimento da distribuição amostral Precisamos conhecer:

As estatísticas de interesse como média amostral e desvio padrão amostral Forma da distribuição amostral

O teorema do limite central se refere exatamente à forma da distribuições amostrais:

1 - Se a população sob amostragem tem distribuição normal, a distribuição das médias amostrais também será normal para todos tamanhos de amostras.

2 - Se a população básica é não-normal, a distribuição de médias amostrais será aproximadamente normal para grande amostras.

Após a análise do teorema do limite central, concluímos que não é necessário conhecer a forma da distribuição da população, bastando que o tamanho da amostra seja grande pois assim a distribuição amostral será normal. Uma regra prática muito usada é que a amostra deve consistir de 30 ou mais observações.

População original

normal uniforme assimétrica

médias amostrais n = 5 médias amostrais n = 30 médias amostrais n =10

(21)

DISTRIBUIÇÕES AMOSTRAIS DAS PROPORÇÕES E DO NÚMERO DE OCORRÊNCIAS

As distribuições amostrais de proporções e número de ocorrências são essencialmente as mesmas. Ambas dizem respeito à contagem de dados, e não à mensurações.

amostra menor que 20 tab. binomial cálculo de probabilidade

amostra maior que 20 normal

Distribuição Amostral Média Desvio Padrão

Pop. infiita Pop. Finita (n/N > 0,05) Médias x

n

x x

1

N

n

N

n

x x

Proporções

p

1

n

p

p

p

1

1

N

n

N

n

p

p

p

Nº de Ocorrências

np

np

1

p

np

1

1

N

n

N

p

np

np

AMOSTRAGEM DE UMA POPULAÇÃO

Populações grandes ou infinitas - Não há necessidade de reposição

- Probabilidades de cada prova é constante

Populações finitas ou quando amostra é superior a 5% da população ( n/ N > 5%) - Deveria se fazer a reposição, mas não se faz

- A probabilidade de cada prova varia

- Os desvios padrões das distribuições amostrais devem ser multiplicados pelo fator de correção finita

1

N

n

N

N – população; n - amostra

Referências

Documentos relacionados

Em 20 de fevereiro de 1988, os membros armênios do Conselho dos Deputados do Povo do NKAR adotaram uma resolução para apelar aos Conselhos Supremos da RSS do Azerbaijão e à RSS

Nesta seção também foram inseridas algumas perguntas introdutórias na avaliação acadêmica e profissional, tais como: ano de início e de conclusão da

Nenhum prato, produto alimentar ou bebida, incluindo o couvert, pode ser cobrado se não for solicitado pelo cliente ou por este for inutilizado.. iva incluído à taxa legal

Caso a licitante qualificada como microempresa ou empresa de pequeno porte melhor classificada desista ou não se manifeste no prazo estabelecido, serão convocadas

A embalagem procura cumprir as funções básicas de uma embalagem secundária como segurança, fácil empilhamento e arma- zenagem, sem deixar de lado o apelo visual que busca se

Germana SALA CUIDADO AO ADOLESCENTE Profª Adria 19:20 às 20:10 CUIDADO INTEGRAL À SAÚDE DA MULHER Profª Kalline CENTRO CIRURGICO E CME Prof.Wagner SALA CUIDADO INTEGRAL

A qualidade técnica está em satisfazer exigências e expectativas concretas, tais como tempo, finanças, taxa de defeitos, funcionabilidade, durabilidade, segurança e garantia.

Como no caso das outras quinolonas, foram relatados distúrbios na glicose sanguínea em pacientes tratados com levofloxacino, geralmente em pacientes diabéticos em