Probabilidade
e
Este material não pode ser copiado, reproduzido, reimpresso, utilizado em filmes ou gravações de vídeo ou armazenado em dispositivos eletrônicos sem a permissão escrita dos detentores dos direitos de copyright. O material não pode ser incorporado em programas de treinamento com exceção da supervisão de algum instrutor da EDTI Consultoria e Treinamento LTDA.
Autores:
Ademir J Petenate, , EDTI Projetos Marcelo M Petenate, EDTI Projetos
Sumário
Probabilidade...2
Modelos Probabilísticos...35
Inferencia...91
Probabilidade
Incerteza e intuição
A intuição humana é mal adaptada a situações que envolvem incerteza.
Pesquisas recentes mostram que em situações que envolvem o acaso nossos processos cerebrais costumam ser gravemente deficientes.
Os processos aleatórios são fundamentais na natureza, e
onipresentes em nossa vida cotidiana; aind assim, a maioria das pessoas não os compreende nem pensa muito a respeito.
Jogo das cores
É mostrado a um grupo de pessoas uma série de lâmpadas de duas cores (vermelho e verde). As cores aparecem em
sequencia com diferentes probabilidades.
Depois de observar o a sequencia por um tempo a pessoa deve tentar prever a próxima cor.
O jogo tem duas estratégias básicas. Uma delas é arriscar na cor percebida como a que ocorre com mais frequência. A outra é ajustar a nossa percepção conforme padrões que identificamos. Qual estratégia é melhor?
Concha
Exercício
Linda tem 31 anos de idade, solteira, franca e muito brilhante. Ela graduou-se em Filosofia. Como estudante, esteve
profundamente preocupada com os assuntos de discriminação e justiça social e também participou de manifestações
anti-nucleares.
Por favor, ordene as três seguintes alternativas na ordem de mais provável (1) para menos provável (3).
A. Linda participa do movimento feminista
B. Linda é bancária e participa do movimento feminista C. Linda é bancária
Exercício
Aproximadamente 80 bebês por semana nasceram na Santa Casa de Santos em 1993. Durante o mesmo ano, cerca de 20 bebes por semana nasceram na Maternidade em São Vicente. Enquanto cerca de 50% de todos os bebes nascidos em qualquer semana considerada eram meninos, a porcentagem exata varia de semana para semana, algumas vezes mais, outras menos.
Dos dois hospitais, qual você acha que registrou mais semanas na qual o número total de meninos nascidos foi maior que 70%?
Santa Casa de Santos
Maternidade em São Vicente Mais ou menos a mesma quantia
Exercício
O que é maior, o número de palavras de seis letras na língua inglesa que tem o n como quinta letra ou o número de palavras de seis letras que terminam em ing?
Exercício
Suponha que uma companhia aérea tenha um lugar restante no voo e ainda restem dois passageiros por chegar. Suponha que a partir da experiência a companhia saiba que existe uma chance de 2/3 de que um passageiro que reservou um voo se apresente para viajar.
Qual é a probabilidade que ela tenha que lidar com um cliente insatisfeito?
Um pouco de História
A teoria da probabilidade tal como a conhecemos hoje, foi em grande parte desenvolvida por cientistas como Girolamo Cardamo (1501-1576), Galileu Galilei (1564-1642), Blaise Pascal (1623-1662), Pierre de Fermat (1601-1665), Jackob Bernoulli (1654-1705), Abraham de Moivre (1667-1754), entre outros.
O desenvolvimento da teoria da probabilidade é muitas vezes associado com os jogos de azar em famosos cassinos europeus, como o que está em Monte Carlo.
Muitos livros sobre probabilidade e estatística contam a história de Chevalier de Mère, um jogador francês, que contou com a ajuda de Pascal em um esforço para obter as probabilidades de ganhar em certos jogos de azar, desenvolvendo assim esse campo do conhecimento.
Um pouco de História
Os gregos da Antiguidade se destacam por terem inventado a maneira como a matemática é levada a cabo: por meio de axiomas, provas, teoremas etc.
Por que motivo eles não criaram uma teoria para demonstrar que se jogamos dois dados seria pouco sábio apostar uma grande quantia na possibilidade de que ambos caiam com o número 6?
• O futuro se desvelava conforme a vontade dos Deuses
• Insistência na verdade absoluta, provada pela lógica e sustentada pelos axiomas
• Desconhecimento da aritmética; ausência de um sistema de
representação numérica fácil de trabalhar. Imagine tentar subtrair
ΛΤΩde ΨΠ. A notação base 10 só começa a ser usada no século VII d.C.
• Ausência do zero (só surgiu no século IX d.C.)
Conceitos básicos
O que significa Probabilidade?
É uma medida de incerteza.
A probabilidade de um evento é uma medida numérica da chance de ocorrência do evento
Probabilidade é medida por um número que varia entre 0 e 1 (0 é a probabilidade de um evento impossível e 1 a
probabilidade de um evento certo
Experimento aleatório
Um experimento aleatório é um processo que tem como
resultado um de um conjunto possível de resultados. O resultado é uma observação ou medição documentada.
Exemplos
• Pagar a conta no prazo: {Sim, Não}
• Tempo para completar uma ligação: {t: t>0}
Evento e espaço amostral
Cada resultado possível de um experimento aleatório é um evento simples
O espaço amostral é a coleção de todos os eventos simples
Um espaço amostral pode ser finito, finito enumerável ou infinito não enumerável
Um evento é um subconjunto do espaço amostral (um conjunto com um ou mais eventos simples)
O evento vazio é o conjunto com nenhum evento simples (conjunto vazio)
A probabilidade de um evento é a soma das probabilidades dos eventos simples que formam o evento
A probabilidade do evento vazio é zero
Tipos de Probabilidade
Probabilidade clássica: eventos igualmente prováveis
S= {S1, S2, ..., Sn} é o espaço amostral =1
onde simboliza a probabilidade e é o resultado de um
experimento aleatório com resultados possíveis, =
1, … , .
Seja um evento formado por eventos igualmente
prováveis:
Tipos de Probabilidade
Probabilidade clássica: eventos não necessariamente igualmente prováveis
S= {S1, S2, ..., Sn} conjunto de eventos possíveis =
onde é a probabilidade de ocorrência de , =
1, … , e calculável a partir de suposições.
Exemplo: Uma moeda com duas faces (Cara e Coroa) não equilibrada.
S={Cara, Coroa}
P(Cara)=P1, P(Coroa)=P2; P1≠P2
Probabilidade clássica: cálculo
Tipicamente envolve problemas de contagem Pode ser muito simples
Exemplo: dado honesto
Resultados possíveis 1, 2, 3, 4, 5, 6, , tal que
= =16
para = 1, … , 6
Evento = resultados pares
Probabilidade clássica: cálculo
Pode ser bastante complexo: Exemplo: Poker fechado , 52 cartas (sem curinga)
Sequencia real: 5 cartas seguidas do mesmo naipe do 10 ao Ás.
P (Sequencia real) = ?
Sequência de cor: 5 cartas seguidas do mesmo naipe.
P (Sequencia de cor) = ?
Cuidado!
Qual é a probabilidade que o primeiro bebê que vai nascer em 2014 na cidade de São Paulo seja do sexo masculino?
Probabilidade frequentista
Seja + , … , +, o conjunto de resultados possíveis de
um experimento realizado vezes e que cada resultado
ocorre vezes. Então
+ = e
= = 1
Probabilidade subjetiva
Chance de ocorrência de um evento atribuída por um indivíduo com base em sua experiência, conhecimento do assunto, grau de convicção ou simplesmente expressão de desejo
Suponha que você reúna amigos para assistir a um jogo de futebol entre os times A e B pergunte a cada um deles qual a chance do time A ganhar. Provavelmente cada um fará uma afirmação diferente. Estamos nesse caso atribuindo probabilidade de forma subjetiva.
Lei de Bendford
A Lei de Bendford (descoberta pelo astrônomo Simon
Newcomb observando páginas de livros de logaritimos)sugere que a porcentagem de ocorrência dos dígitos 1 a 9 na
primeira posição em números de diversas fontes segue um padrão. Esse padrão é exibido na tabela abaixo.
Qual é o tipo de probabilidade?
Como esse resultado poderia ser utilizado em ambiente de negócios? Prim dígito 1 2 3 4 5 6 7 8 9 Freq Relat 0.301 0.176 0.125 0.097 0.079 0.067 0.058 0.051 0.046
União e intersecção de eventos
A união de dois eventos A e B é o evento formado por todos os resultados que estão em A ou B
Notação A∪B
A intersecção de dois eventos A e B é o evento formado por todos os resultados que estão em A e B
Notação A∩B
O evento complementar de um evento A é formado pelos resultados que não estão em A
Notação A´
Dois eventos A e B tal que a intersecção deles é vazia são mutuamente excludentes ou disjuntos
União e intersecção de eventos
A
∪
B
A
∩
B
A´ AAxiomas de probabilidade
Qualquer que seja o tipo de probabilidade (clássica, frequentista, subjetiva), o mesmo conjunto de regras é válido para manipular e analisar probabilidades.
Axiomas de probabilidade
1. P (S) = 1, S o espaço amostral
2. Qualquer que seja o evento - 0 ≤ - ≤ 1 0 ≤ - ≤ 1
3. Se A 1e A2são dois eventos que disjuntos - ∩ -2= ∅ , então (-1 ∪ -2) = (-1) + ( -2)
Generalizando, se A1, A2, ... , Aksão eventos mutuamente disjuntos, então (-1∪ -2∪ … ∪ -7 ) = (-1) + (-2) + … + ( -7) 4. Se A1e A2são dois eventos quaisquer, então
(-1 ∪ -2) = (-1) + ( -2) − (-1∩ -2)
Notação
Denotaremos eventos por letras maiúsculas -, 9, …
Seja - um evento
Ex1: -: evento dos números pares no jogo de dados - = 2, 4, 6
Ex2: -: evento onde o tempo para responder a uma solicitação de crédito é maior que 9 dias úteis
Probabilidade condicional e independência
Exemplo: um grupo de bancários foi classificado de acordo com o peso corporal e hipertensão
A: pessoa com hipertensão → - = 0.20
B: pessoa com peso acima do normal→ (9) = 0.25
condição em relação ao peso
acima normal abaixo total hipertenso
sim 0.10 0.08 0.02 0.20
não 0.15 0.45 0.20 0.80
total 0.25 0.53 0.20 1.00
Probabilidade condicional e independência
Qual a chance de um pessoa que tem peso acima do normal ser hipertensa? Denotamos essa probabilidadepor (-/9)
-/9 = 0.25 = 0.40.1
Qual a chance da pessoa ser hipertensa e ter peso acima do normal
Probabilidade condicional e independência
Probabilidade condicional -/9 = -99 desde que (9) > 0. Ou -/9 9 = (-9)que chamamos de lei da multiplicação das probabilidades
Probabilidade condicional e independência
Dois eventos são independentes se/9 = -Condições equivalentes
Regras de produto para eventos
independentes
As regras para a união e a interseção de dois eventos
independentes são extensíveis para sequências de mais de dois eventos.
Estudos enumerativos envolvem, em geral, amostragem aleatória de alguma população.
Quando retiramos uma amostra aleatória de uma grande
população, ou quando retiramos uma amostra com reposição de uma população de qualquer tamanho, os itens da amostra são independentes uns dos outros.
Regras de produto para eventos
independentes
Por exemplo, suponha que temos uma urna contendo 10 bolas, sendo 7 vermelhas e 3 azuis. Uma bola é sorteada, observa-se que é vermelha e devolve-se a bola na urna.
Qual é a probabilidade de que a segunda bola que escolhemos aleatoriamente será vermelho?
A resposta ainda é 3/10 porque o processo não tem memória nesse caso.
Amostragem com a reposição assegura a independência dos elementos.
O mesmo é válido para a amostragem aleatória sem restituição se a população é relativamente grande em comparação com o tamanho da amostra.
Regra da probabilidade total
- = - ∩ 9 + - ∩ 9´ = -/9) (9) + (-/9´) (9´)
Para quaisquer dois eventos A e B
Generalizando, se A é um evento qualquer e B1, B2, ..., Bk uma partição do espaço amostral S, então
- = (- ∩ 9 ) = -/9 ) (9 )
Exemplo
Suponha que a probabilidade é 0.10 de que um chip que seja sujeito a altos níveis de contaminação durante a fabricação cause falha no produto e é 0.005 caso não esteja sujeito a altos níveis de contaminação.
Em um lote produzido 20% dos chips estão sujeitos a altos níveis de contaminação.
Qual é a probabilidade que um produto usando um chip desse lote venha a falhar?
Seja F o evento que o produto falhe e A o evento que o chip foi exposto a altos níveis de contaminação
P(F/A)=0.10, P(F/A´ )=0.005 P(A)=0.20, P(A´ )=0.80
Probabilidade condicional e independência
Exemplo: um grupo de bancário foi classificado de acordo com o peso corporal e hipertensãoTer peso acima do normal é independente de ser hipertenso?
condição em relação ao peso
acima normal abaixo total
hipertenso
sim 0.10 0.08 0.02 0.20 não 0.15 0.45 0.20 0.80 total 0.25 0.53 0.20 1.00
Teorema de Bayes
As fórmulas de probabilidade condicional eram conhecidas no século XVIII. Elas dependiam de que o evento condicionante tivesse ocorrido antes do evento que estivesse sendo
examinado.
No final do século XVIII o reverendo Thomas Bayes descobriu algo inusitado. Era possível calcular a “probabilidade do antes condicionada ao depois”.
Exercicíos
Uma empresa de consultoria está negociando contratos de serviço com duas grandes multinacionais. Os executivos da companhia estimam que a probabilidade fechar o contrato com a empresa A, o evento A, é de 0,45. Os executivos também sentem que se se fecharem com a empresa A a probabilidade de entrarem em acordo com a empresa B é de 0.9. Qual a chance da companhia obter os dois serviços?
Formados em Direito devem passar por um exame de da OAB para poderem exercer a profissão. Suponha que a porcentagem de aprovados na primeira vez que prestam o exame é 72%. Os reprovados na primeira vez podem fazer um segundo exame. A proporção de aprovados na segunda tentativa é 88%. Qual é a probabilidade de que um graduado seja aprovado?
Exercício
Um analista de investimentos coleta dados sobre ações: informações sobre o pagamento ou não de dividendos e o crescimento ou não do preço dessas ações para um dado período. Os dados estão na tabela a seguir.
a. Se uma ação for selecionada ao acaso dentre as 246 da lista do analista, qual é a probabilidade de que o preço tenha subido?
b. Se uma ação for selecionada ao acaso, qual é a probabilidade de que ela pagou dividendos?
c. Se uma ação for selecionada aleatoriamente, qual é a probabilidade de que o preço subiu e pagou dividendos?
d. Qual é a probabilidade de que uma ação selecionada aleatoriamente não tenha pago dividendos nem tenha subido o preço?
e. Dado que o preço de uma ação subiu, qual a probabilidade de que ela também tenha pago dividendos?
f. Se for conhecido que uma ação não pagou dividendos, qual a probabilidade de seu preço ter subido?
g. Qual a probabilidade de uma ação selecionada aleatoriamente ter sido um bom negócio, ou seja, ter subido de preço e/ou pago dividendos?
Preço subiu Preço não subiu Total Dividendo pago 34 78 112 Dividendo não pago 85 49 134 Total 119 127 246
Exercício
Em um artigo sobre o crescimento do investimento, a revista Money informou que as ações de companhias farmacêuticas mostram tendências excelentes de longo prazo e oferecem aos investidores potencial incomparável de ganhos altos e constantes. O Health Care Financing Administration fundamenta essa conclusão por meio de sua previsão de que os gastos anuais com prescrição de medicamentos atingirão 366 bilhões de dólares em 2010, acima dos US $ 117 bilhões de dólares em 2000. Muitos indivíduos com 65 anos ou mais dependem fortemente de medicamentos prescritos. Para esse grupo, 82% tomam medicamentos regularmente, 55% tomam pelos menos 3 medicamentos e 40% consomem cinco ou mais remédios. Em contraste, 49% das pessoas com menos de 65 anos de idade tomam remédios regularmente, com 37% tomando pelo menos 3 drogas 28% com cinco ou mais drogas (Money, Setembro de 2001). O censo dos EUA mostrou que dos 281.421.906 de pessoas nos Estados Unidos, 34.991.753 tem pelo menos 65 anos (EUA Census Bureau, Censo 2000).
a. Calcule a probabilidade de que uma pessoa escolhida ao acaso nos Estados Unidos tenha 65 anos ou mais.
b. Calcule a probabilidade de que uma pessoa toma medicamentos regularmente. c. Calcule a probabilidade de que uma pessoa escolhida ao acaso tenha 65 anos ou mais e
toma cinco ou mais drogas.
d. Dado que uma pessoa usa cinco ou mais prescrições, calcular a probabilidade de que a pessoa tem 65 anos ou mais.
Teorema de Bayes
No exemplo do semicondutor, F é o evento posterior e A e o evento anterior e sabemos P(F/A)
Mas podemos estar interessados em saber o seguinte: se o chip no produto falhar, qual é a probabilidade que tenha sido exposto a altos níveis de contaminação, ou seja P(A/F)? Observe que sabemos P(F/A), P(F/A´), P(A) e P(A´). Com isso podemos calcular P(F). Mas queremos calcular P(A/F) O Teorema de Bayes permite realizar esse cálculo
Teorema de Bayes
Sejam A e B dois eventos-/9 = 9/- (-)(9) 9 > 0
P(A) é a probabilidade à priori e P(A/B) é a probabilidade à posteriori
Extensão do Teorema de Bayes
Se E1, E2, ..., Ekforem eventos mutuamente excludentes e exaustivos e B um evento qualquer então
/9 = ? @/AB ?(AB)
? @/AC ? ACD? @/AE? AE D⋯D? @/AG?(AG) 9 > 0
Teorema de Bayes
No exemplo do semicondutor, F é o evento posterior e A e o evento anterior e sabemos P(F/A)
Aplicando o Teorema de Bayes temos
Exercício
Um banco estava interessado em rever sua política em relação ao produto “cartão de crédito” com a intenção de cancelar os cartões de alguns clientes. No passado, aproximadamente 5% dos portadores de cartões ficaram inadimplentes e o banco não pode cobrar o saldo devedor. Assim, a administração estabeleceu probabilidade à priori para a inadimplência de qualquer cliente igual a 0,05. O banco também descobriu que a probabilidade de não pagamento em um determinado mês é de 0,20 para os clientes adimplentes. Claro que, para um cliente inadimplente, a probabilidade de não pagamento em um mês é 1.
a. Dado que um cliente deixou de pagar pelo menos um mês, compute a probabilidade à posteriori de que um cliente vire inadimplente.
b. O banco gostaria de cancelar o cartão caso a probabilidade de que um cliente vire inadimplente seja maior do que 0.2. O banco deveria cancelar o cartão caso o cliente deixe de realizar o pagamento de um mês? Por quê?
Exercício
Em cirurgias de transplante de coração há risco de que o corpo rejeite o coração transplantado. Um novo teste foi desenvolvido para detectar os primeiros sinais de que o corpo possa rejeitar o coração transplantado. No entanto, o teste não é perfeito. Quando o teste é realizado em alguém cujo coração será rejeitado, cerca de dois em cada dez testes serão negativos (falso negativo). Quando o teste é realizado em uma pessoa cujo coração não será rejeitado, 10% irá mostrar um resultado positivo (falso positivo). Os médicos sabem que em cerca de 50% dos transplantes de coração o corpo tenta rejeitar o órgão transplantado.
a. Suponha que o teste foi realizado em uma pessoa submetida ao transplante e o teste foi positivo (indicando sinais de alerta precoce de rejeição). Qual é a probabilidade de que o corpo está propenso a rejeitar o coração?
b. Suponha que o teste foi realizado e o resultado é negativo (indicando que não há sinais de rejeição). Qual é a probabilidade de que o corpo está propenso a rejeitar o coração?
Distribuições de probabilidade
Variáveis aleatórias
Uma variável aleatória (v.a.) é uma função que atribui um número real a cada resultado do espaço amostral de um experimento aleatório
Variável aleatória discreta
Assume valores em um conjunto finito ou infinito enumerável
Variável aleatória contínua
Assume valores em um intervalo finito ou infinito de números reais
Notação: em geral a v.a. é denotada por uma letra maiúscula do final do alfabeto (X, Y, Z, …);
Exemplo
Um banco classifica seus clientes como “rentável”, “neutro”, “não rentável”. Na base de clientes, a proporção é a seguinte:
Classificação Porcentagem
R 50%
N 40%
NR 10%
Seja X a v.a. definida como: 1 se cliente é R; 0 se cliente é N e -1 se cliente é NR.
Distribuição de X: X Prob
-1 0.1
0 0.4
1 0.5
Distribuição de probabilidade discreta
Exemplo: em um censo é coletado o número de filhos do casal
Para uma família escolhida ao acaso, qual a probabilidade que ela tenha 2 filhos?
Nº de Filhos %. 0 10% 1 30% 2 35% 3 20% 4 5%
Distribuição de probabilidade discreta
Para uma variável aleatória discreta X com valoresx1, x2, ..., xna distribuição de probabilidade é dada por
K(L ) = (M = L )
A distribuição de probabilidade satisfaz
K L = 1
Distribuição de probabilidade discreta
Seja M o número de filhos do casal;
M = {0, 1, 2, 3, 4}
(M = L ) = {0.1, 0.3, 0.35, 0.20, 0.05}, para L = {0, 1, 2, 3, 4}
M é uma v.a. discreta ∑ M = = 1
Distribuição de probabilidade discreta
Distribuição de probabilidade da variável aleatória M
X 0 1 2 3 4 Soma P(X=xi) 0.10 0.30 0.35 0.20 0.05 1 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 P (X ) 0 1 2 3 4 X
Média e variância populacional
Média ou valor esperado
Seja M v.a. discreta com distribuição{L , (L ); = 1,2, … }, onde (L ) = (M = L ) então, E X = Té (M) = ∑(V × X X ), ou M = Y = L L Z
Exercício
Calcule o valor esperado da variável aleatória M que
representa o número de filhos do exemplo anterior
X 0 1 2 3 4 Soma
P(X) 0.10 0.30 0.35 0.20 0.05 1
Exercício
Calcule o valor esperado da variável aleatória M que
representa os resultados de um dados honesto
X 0 1 2 3 4 5 6 Soma
Exercício
Seja M uma v.a. discreta que representa o número de
carros vendidos por dia em uma revendedora, cuja distribuição de probabilidades é dada por
Calcule (M)
Distribuição do número de carros vendidos por dia
x 0 1 2 3 4 5 Total
P(x) 0.10 0.10 0.20 0.30 0.20 0.10 1.00
Interpretação do valor esperado
Suponha que você invista no mercado de ações e M seja a
variável aleatória que representa o resultado desse investimento;
M = {−27, 120};
Ganho (g) 120,00 -27,00 Total
P(g) 0.20 0.80 1.00
Exercício
Um sistema de radar é programado para registrar automaticamente a velocidade de todos os veículos trafegando por uma avenida, onde passam em média 300 veículos por hora, sendo 55 km/h a velocidade máxima permitida. Um levantamento estatístico dos registros do radar permitiu a elaboração da distribuição percentual de veículos de acordo com sua velocidade aproximada.
A velocidade média dos veículos que trafegam nessa avenida é de: (a) 35 km/h (b) 44 km/h (c) 55 km/h (d) 76 km/h (e) 85 km/h
Exercício
Uma empresa de seguros vende uma apólice para 1500 proprietários de um modelo de bicicleta mountain bike que protege contra roubo por dois anos. O custo de reposição dessa bicicleta é $300.00. Suponha que a probabilidade de um indivíduo ser roubado durante o período de proteção é 0.15. Assuma que a probabilidade de mais de um roubo por indivíduo é zero e que os eventos são independentes. a. Qual é o preço de venda da apólice para que haja um equilíbrio para a
empresa(ganho zero, perda zero)?
b. Se a probabilidade de roubo for 0.10, qual é o ganho esperado por apólice dado o valor de venda determinado em (a)?
Aplicação do valor esperado em processos
decisórios
Uma fábrica de móveis deve decidir se realiza uma ampliação da capacidade instalada agora ou se aguarda mais um ano.
Uma análise econômica diz que se ela expande agora e as condições econômicas permanecerem boas, ela realizará um lucro de R$328.000,00 no próximo ano; caso haja uma recessão, ela terá um prejuízo de R$80.000,00.
Se ela adia a expansão para o próximo ano, ela terá um lucro de R$160.000,00 se as condições permanecerem boas e terá um lucro de R$16.000,00 se houver recessão.
Se as chances de que ocorra uma recessão é de 2/3, qual é a decisão que maximiza seu lucro?
Propriedades da média
Seja e X duas constantes e M e \ duas variáveis
aleatórias. Então:
A. ( ) =
B. (XM) = X (M)
C. ( + M) = + (M)
Variância
Fornece uma medida de dispersão (variação) dos valores em torno da média
a M = b2 = L − Y 2 L
c V ã M = b = a M
Pode-se mostrar que
a M = M2 − M 2
onde M2 = ∑ L2 L
Propriedades da variância
Seja a e b duas constantes e M e \ duas variáveis
aleatórias. Então: A. a M ≥ 0 B. a ( ) = 0 C. a ( + M) = a (M) D. a (XM) = X2a (M) E. a + XM = X2a M F. a M ± \ = a M + a \ , M \ ã í i
Exercício
Um sistema de envasamento consiste em encher um vidro com líquido.
Os vidros utilizados tem peso médio de 20g e desvio padrão 0.5g.
A quantidade de líquido em peso que é colocada no litro pode ser regulada, sendo o valor nominal igual a 185g.
O desvio padrão do sistema de envasamento é 2g.
Modelos probabilísticos
Introdução
Modelos são utilizados em todos os campos da ciência.
Devem simplificar a realidade ao mesmo tempo que representam suas principais características.
“Todos os modelos estão incorretos, mas alguns são úteis” (George Box)
Distribuição Discreta Uniforme
O modelo mais simples de distribuição discreta é o uniforme
f(x) = 1/n
sendo
n= número de valores que a variável aleatória pode assumir
Ensaios de Bernoulli
a) Em cada ensaio podem ocorrer somente dois resultados possíveis (Sucesso (S) e Fracasso (F)).
b) Para cada ensaio, a probabilidade de que
ocorra um Sucesso, denotada por ( ), é a
mesma, e é denotada por p, ou seja, ( ) = . A
probabilidade de um Fracasso, (H), é dada
por 1 − , ou seja, (H) = 1 − . A quantidade
1 − é denotada por j. Temos então + j = 1. c) Cada ensaio é independente.
Considere repetições sucessivas de um ensaio (ou teste) com apenas dois resultados possíveis que respeite as seguintes regras:
Ensaios de Bernoulli
Se associarmos ao evento S o valor e 0 ao valor F a distribuição de probabilidade de X é Além disso: a) (M) = 0 ∗ (1 − ) + 1 ∗ = b) a M = M2 − M 2 = 02 ∗ 1 − + 12 ∗ + 2 = (1 − ) X P(X) 0 1-p 1 p
Experimento Binomial
Um experimento Binomial obedece as seguintes propriedades
1. O experimento consiste de um sequencia de n ensaios idênticos
2. Dois resultados são possíveis em cada ensaio: Sucesso e Fracasso (Ensaio de Bernoulli)
3. p=P(S) não muda de ensaio para ensaio
Distribuição Binomial
Considere um experimento Binomial
Seja X o número de Sucessos nos n ensaios
A variável M pode assumir os valores 0,1,2, . . , .
Então, M = = 1 − Z onde = ! Zm !Z! , para = 0,1,2, … , Denotamos M~9 ,
Triangulo de Pascal
Linha 0 1 1 1 1 2 1 2 1 3 1 3 3 1 4 1 4 6 4 1 5 1 5 10 10 5 1 6 1 6 15 20 15 6 1 7 1 7 21 35 35 21 7 1 8 1 8 28 56 70 56 28 8 1 9 1 9 36 84 126 126 84 36 9 1 10 1 10 45 120 210 252 210 120 45 10 1Triangulo de Pascal
0 10 20 30 40 50 60 0 1 2 x_2 0 5 10 15 20 25 30 35 0 1 2 3 4 5 6 x_6 0 5 10 15 20 25 30 0 1 2 3 4 5 6 7 8 9 10 x_10 0 5 10 15 20 x_20Propriedades da B(n,p)
1. M = Y = 2. a M = b2= 1 − Se definirmos po=∑nXi=Xp, então 1. ̂ = Mr = 2. a ( ̂) = a Mr =s( ms) ZExercício
Um gerente de conta especial faz vinte ligações por dia para clientes para oferecer um novo produto.
De experiência passada ele estima que a chance de vender o produto para um cliente é 0.10
Se sua meta diária é realizar 4 vendas, qual é a
probabilidade que ele atinja a meta em um determinado dia?
Qual é o número médio de vendas que ele realiza por dia?
Qual é o desvio padrão do número de vendas? Qual é o valor mais provável de venda?
Distribuição de Poisson
a) Independência: o número de vezes que S ocorre em
qualquer intervalo de tempo é independente do número de ocorrências de S em qualquer outro intervalo de tempo disjunto.
b) Falta de agrupamento: a chance de duas ou mais ocorrências de S simultâneas pode ser assumida como sendo zero.
c) Razão: a número médio de ocorrências de S por unidade de tempo é uma constante, denotada por l, e ela não muda com o tempo.
Um evento S ocorre no tempo (ou espaço) obedecendo os seguintes postulados:
Distribuição de Poisson
Seja X o número de ocorrências de S por unidade de tempo. Se os postulado anteriores são válidos, então M~ t e
M = L = uL! ,tv L = 0,1,2, . . .
onde t é o parâmetro que indica o número médio de
ocorrências de X em um intervalo de tempo unitário
Propriedades da Distribuição de Poisson
1. M = t
Exercício
Durante a segunda guerra, Londres foi bombardeada por aviões alemães. Para verificar se os alemães estavam atirando bombas com informações sobre alvos o sul de Londres foi divido em 576 quadrados, cada um com ¼ de milha quadrada. O número de bombas que caiu em cada quadrado foi anotado e está na tabela seguinte.
Pode-se concluir que os alemães estavam atirando bombas ao
acaso?K (n de bombas) 0 1 2 3 4 ≥ 5
Nk(n de quadrados
229 211 93 35 7 1
Exercício
Faça um gráfico de barras do número de bombas por quadrado. Use a frequência relativa como altura da barra. Aplique a distribuição de Poisson para o número de número de bombas por quadrado.
Calcule a frequência predita pela distribuição de Poisson Compare a frequência observada com a frequência esperada e discuta se a distribuição de Poisson é apropriada para essa situação
Escolhida aleatoriamente uma região, determine a
probabilidade dela ter sido atingida por exatamente duas vezes?
Exercício
Ao enlatar leite em pó, é necessário acrescentar um dosador. A não inclusão do dosador é considerada uma falha. O número de falhas que ocorrem em um lote produzido tem distribuição de Poisson com número médio de falhas igual a 5.
1. Qual é a probabilidade que em um lote:
a) Uma lata esteja sem o dosador?
b) Duas ou mais latas estejam sem o dosador?
2. Qual é o número mais provável de falhas que ocorrem
em um lote?
Aproximação da Binomial pela Poisson
Quando é grande e é pequeno
9 , ≈
M = L = L v 1 − v ≈ mZs v
Exercício
O número de clientes especiais , digamos, N, que solicitam atendimento por dia segue a distribuição de Poisson com parâmetro λ=2. As atuais instalações de atendimento especial podem atender a três clientes por dia. Se mais de três clientes solicitarem atendimento o quarto em diante não será atendido, o que pode impactar de forma negativa o negócio.
1. Em um dia, qual é a probabilidade de ter clientes não atendidos?
2. De quanto deverão ser aumentadas as instalações atuais para que todos os clientes possam ser atendidos em 90% dos dias?
3. Qual é o número médio de clientes que solicitam serviços por dia? 4. Qual é o número mais provável de clientes que solicitam serviços por
dia?
5. Qual é o número médio de clientes atendidos por dia?
Exercício
Uma empresa de seguros vende uma apólice para 1500 proprietários de um modelo de bicicleta mountain bike que protege contra roubo por dois anos. O custo de reposição dessa bicicleta é $300.00. Suponha que a probabilidade de um indivíduo ser roubado durante o período de proteção for 0.15. Assuma que a probabilidade de mais de um roubo por indivíduo é zero e que os eventos são independentes.
1. Qual é o preço de venda da apólice para que haja um equilíbrio para a empresa(ganho zero, perda zero)?
2. Se a probabilidade de roubo for 0.10, qual é o ganho esperado por apólice dado o valor de venda determinado em (a)?
Exercício
Considere o exemplo do leite em pó enlatado com dosador discutido anteriormente. Considere que o lote é formado por 10.000 latas e que o processo de enlatar é tal que a
probabilidade que uma lata esteja sem dosador é 0.0005. Qual é a probabilidade que em um lote uma lata esteja sem o dosador utilizando o modelo binomial? E utilizando o modelo de Poisson?
Distribuição Hipergeométrica
Considere uma população com N indivíduos sendo que r indivíduos são Sucesso (S) e (N-r) são Fracasso (F).
Uma amostra aleatória sem reposição de tamanho n é retirada.
Seja X o número de indivíduos S na amostra
Os valores possíveis de X são: 0, 1, 2, ..., min{n,r}
A distribuição de X é dada por
(M = L) = L
x − − L
Distribuições de variáveis aleatórias
contínuas
Variável aleatória contínua
Em um Call Center o tempo de atendimento de um cliente é monitorado. Os valores possíveis são em princípio, infinitos dentro de um intervalo (a,b), a<b).
Nesse caso, não faz sentido perguntar qual é a probabilidade de que o tempo de atendimento seja
igual a um valor to . Na realidade, essa probabilidade
é igual a zero
O que se pode perguntar é qual é a probabilidade que o tempo de atendimento esteja dentro de um
A figura abaixo mostra o histograma de amostras de tamanho 20, 100, 1000 e 10000 da mesma distribuição com uma função contínua f(x) aproximando o histograma.
Observe que quanto maior o tamanho da amostra, melhor a aproximação.
A porcentagem de valores abaixo de 9 é aproximada pela área sob a curva à esquerda de 9. Quanto maior o tamanho da amostra, melhor a aproximação
%(t < 9) ≅ | K L Lm~}
Exemplo
Valores % de valores (histograma) Probabilidade (distribuição) (Y < 60) •• \ < 60 = 0.185 P( Y < 60) = 0.167 (Y >70 •• \ > 70 = 0.140 P (Y > 70) = 0.146 60 ≤ y ≤70 •• 60 ≤ € ≤ 70 = 0.675 P(60 ≤ y ≤70) = 0.687Função densidade de probabilidade
Propriedades da fdp
1. K L ≥ 0, ∀ L
2. A área sob a curva definida por f(x) é igual a 1, ou seja,
‚ K L L = 1~ m~ 3. ( ≤ L ≤ X) = á X i V X, ou seja, ‚ K L L„ …
Função distribuição acumulada
Se M é um v.a. contínua a função de distribuição
acumulada (fda) é H(L) = (M <= L).
Propriedades
1. H(L) é uma função não decrescente de L
2. H −∞ = 0
Média e variância de v.a. contínuas
Uma variável aleatória contínua M, em geral, também tem
uma média e uma variância com o mesmo significado e as mesmas interpretações discutidas anteriormente para o caso discreto, mas o seu cálculo envolve integrais e não serão objeto de nosso trabalho aqui.
Para as distribuições que estudaremos aqui, a média e a variância serão fornecidas em cada caso.
A distribuição Normal (Gaussiana)
Dentre as muitas distribuições contínuas usadas em estatística, a mais importante é a Distribuição Normal ou Gaussiana.
Ela tem a forma de um sino e está associada com os nomes de Pierre Laplace e Carl Gauss.
A distribuição Normal (Gaussiana)
Importância
O “efeito central do limite”.
A robustez ou insensibilidade dos procedimentos estatísticos mais comumente usados a desvios da suposição de distribuição normal.
O Efeito Central do Limite
Seja ‡ o erro “total” de medição
Sob certas condições, geralmente encontradas no mundo
da experimentação, podemos escrever ‡ como a soma
dos seus componentes
‡ = ‡ + ⋯ + Z‡Z Exemplo: ‡: çã ‡ : ‰ ‡2: í i ‡Š: çã etc...
O Efeito Central do Limite
Se a porcentagem individual de contribuição é pequena e o número de componente é grande, a distribuição dos erros tende a ser normal
O Efeito Central do Limite - exemplo
A distribuição de médias de amostras pode ser aproximada pela Distribuição Normal
Teorema Central do Limite
n X X n 1 i i∑
= =Resultado Importante:
Seja X1, X2, ..., Xnuma amostra aleatória de uma variável aleatória X com média µ, variância σ2e distribuição F(x) e seja
a média da amostra
Então a distribuição de X-barra converge para a distribuição Normal com média µe variância σ2/n, ou seja,
) , N( X 2 n σ µ ≈
Procedimentos robustos derivados da
suposição de normalidade
Muitas técnicas estatísticas são derivadas da suposição de normalidade das observações originais.
Em muitos casos, aproximação, em vez de normalidade exata, é tudo que se requer para que estes métodos sejam aplicáveis.
Considerando isto, eles são ditos robustos à não-normalidade.
Desta forma, a menos que seja especificamente alertado, não se deve ter excessiva preocupação acerca de
Distribuição Normal
Muitas características de qualidade contínuas tem distribuição razoavelmente simétrica e podem ser aproximadas por uma curva em forma de sino conhecida como Curva Normal, que corresponde à distribuição Normal ou Gaussiana; D e n s it y 207 205 204 203 202 201 200 199 198 197 196 195 0.4 0.3 0.2 0.1 0.0 Normal
Definição de uma Curva Normal
Toda Curva Normal é definida por dois números:1) Média: medida do centro.
Distribuição Normal
Utilizamos a notação M~x Y, b2
A fdp de X é dada por
K L = 2‹b1 2 m2ŒE vm• E
−∞ ≤ L ≤ ∞, −∞ ≤ Y ≤ ∞, b2 > 0
Propriedades da Distribuição Normal
Cálculo de probabilidades com a curva
normal
Quando X~x(0,1), chamamos distribuição normal padrão
e as probabilidades encontram-se tabeladas
Softwares, como o Excel, também possuem fórmulas que realizam esse cálculo
Cálculo de probabilidades com a
x Y, b
2Seja M~x Y, b2
Considere Ž = •m•Œ . Pode-se mostrar que Ž tem
distribuição normal e
Ž = M − Yb =1b M − Y = 0
a Ž = a M − Yb =b12a M = bb22 = 1
Cálculo de probabilidades com a
x Y, b
2Se quisermos calcular (M < X) fazemos
M < X = M − Yb <X − Yb = Ž < •‘
onde •‘ =„m•
Œ
Procuramos na tabela x(0,1) o valor •‘
Exemplo
92% 0.91924 0.00000 0.91024 4.6) P(Z 1.4) P(Z 1.4) Z 4.6 P( 0.0005 0.2508 -0.2515 Z 0.0005 0.2508 -0.2485 P 0.2515) X P(0.2485 ≅ = − − ≤ − ≤ = ≤ ≤ − ≤ ≤ = ≤ ≤ O diâmetro de uma peça pode ser aproximado pela distribuição Normal com média 0.2508 e desvio padrão 0.0005. A especificação para do diâmetro da peça é 0.2500±0.0015. Qual é a proporção de peças que são produzidas dentro da especificação?
Exercício
As notas atribuídas em um teste seguem uma distribuição
normal com média 14 e desvio padrão 2 M~x 14,22 .
Se as pessoas que tem nota menor ou igual a 11 são reprovadas, qual é a porcentagem de pessoas reprovadas?
Exercício
Uma máquina enlata leite evaporado. O peso líquido de cada lata tem distribuição normal com média 273,3 g e desvio padrão 3,9 g.
Se o limite inferior de especificação é 264,3 g, qual é a porcentagem de latas que são produzidas fora de especificação?
Propriedade da distribuição Normal
O seguinte resultado é útil quando temos de trabalhar com a soma de duas ou mais variáveis aleatórias Normais.Se Xi ~ N(μi,σi2) , i=1,2,...,n são variáveis aleatórias independentes e a1, a2, ... an constantes. Então
Σ
a
iX
i~ N(Σa
iμ
i, Σa
i2σ
i2
)
ou seja, a combinação de variáveis com distribuição Normal também tem distribuição Normal.
Propriedade da distribuição Normal
Se ai=1/n e se os Xi’s forem identicamente distribuídos,
então n σ ) X D.P.( n σ n nσ σ n 1 σ a ) X Var( µ n nµ µ n 1 µ a ) X E( X X n 1 X n 1 X a 2 2 2 n 1 i 2 2 n 1 i 2 2 i n 1 i n 1 i i n 1 i i n 1 i i n 1 i i i = = = = = = = = = = = =
∑
∑
∑
∑
∑
∑
∑
= = = = = = =Exercício
O peso bruto de um produto é a soma do peso líquido mais o peso da embalagem. Suponha que a máquina que embala o produto é tal que o peso líquido colocado na embalagem tem distribuição Normal com média igual a 300 g e desvio padrão igual a 2 gramas. O peso da embalagem tem distribuição Normal com média igual a 5 g e desvio padrão igual a 0.5 g.
Qual é a distribuição do peso bruto do produto? Qual dos dois processos é mais preciso?
Aproximação da Binomial pela Normal
Se M é uma variável aleatória com distribuição 9 ( , ),
temos que Y = e b2 = (1 − ). Então
Ž = M −
1 − ~x 0,1
Observações:
1. Esse resultado é uma aplicação do Teorema Central do
Limite exposto anteriormente.
2. Essa aproximação é tão mais acurada quanto maior for
o valor de n e quanto mais próximo de 0.5 estiver o valor de p.
Exercício
1. Se 20% das peças produzidas por uma máquina forem
defeituosas, utilizando a aproximação da Binomial pela Normal, qual é a probabilidade que em uma amostra aleatória de 100 peças não mais que 15 serão
defeituosas.
2. Compare com o valor que seria obtido se utilizássemos
a distribuição Binomial
M ≤ 15 = 100 0.2 0.8 ‘‘m = 0.1285
’ ‘
Distribuição exponencial
A distribuição exponencial é muito utilizada quando
trabalhamos com tempo para ocorrência de um evento, por exemplo, tempo para atendimento de uma chamada)
K L = “ m”v, onde x ≥0 10 8 6 4 2 0 2.0 1.5 1.0 0.5 0.0 D e n s it y 0.5 1 2 A lfa Distribution Plot Exponential
Distribuição exponencial
A função distribuição acumulada é dada por:
H L = M ≤ L = 1 − mv ”⁄ 10 8 6 4 2 0 1.0 0.8 0.6 0.4 0.2 0.0 x F( x )
Distribuição Exponencial: Função Distrib. Acum.
Distribuição exponencial
Propriedades:
Se M~ L “ , então:
M =”
Relação entre a Poisson e a Exponencial
Quando usamos a distribuição de Poisson para modelar, por exemplo, o número de ligações em um intervalo de tempo é possível mostrar que o tempo entre duas ligações
sucessivas terá distribuição exponencial, ou seja, sob certas condições:
Seja
M: o número de chamadas \: tempo entre essas chamadas
M~ t ⇔ \~ L t
Exercício
Suponha que o tempo entre duas ligações seja modelada por uma distribuição exponencial de parâmetro 1 minuto. Qual a chance de não acontecerem mais do que 3 ligações em um minuto?
Propriedade de falta de memória
Para uma variável aleatória X com distribuição Exponencial
(M < + 2|M > ) = (M > )
Ou seja, a informação de quanto tempo decorreu desde o último evento não afeta a probabilidade de que tenhamos que esperar um tempo maior que t para a ocorrência do próximo evento
A distribuição exponencial é a única distribuição contínua com essa propriedade
>
Exemplo
Seja X o tempo entre chegadas de um cliente em um banco e considere que X tem distribuição exponencial com
parâmetro α=2 minutos.
A probabilidade de que chegue um cliente dentre 30 segundos a partir do momento em que começamos a registrar as chegadas é
M < 0.5 = 1 − m‘.’ 2˜= 0.22
Suponha agora que estamos esperando há 3 minutos e não chegou nenhum cliente nesse tempo. Qual é a probabilidade que chegue um cliente nos próximos 30 segundos?
Exercício
1. O tempo entre chegada de aeronaves em um aeroporto
tem distribuição exponencial com parâmetro α = 1
hora. Qual é a probabilidade de que cheguem mais de três aeronaves dentro de um período de uma hora?
2. Uma empresa aérea oferece de tempos em tempos
quatro passagens com preço especial. Quando isso ocorre, o tempo entre ligações para comprar passagens tem distribuição exponencial com média de 30 minutos. Assuma que cada chamada compre um bilhete. Qual é a probabilidade que as quatro passagens sejam vendidas em menos de 3 horas desde o anuncio?
Lei dos grandes números
Quando estamos nos preparando para estimar Y por
meio de Mr, pode ser de interesse estabelece um valor
máximo para a diferença entre a estimativa e o parâmetro, para uma dada probabilidade.
A Lei dos grandes números estabelece que para
quaisquer ‡ > 0 e 0 ≤ ™ ≤ 1
−‡ ≤ Mr − Y ≤ ‡ ≥ 1 − ™
Exercício
Suponha que o interesse seja pesquisar o tempo médio de atendimento de uma determinada central de
atendimento e que b2 = 1. Qual o tamanho de amostra
necessário para que tenhamos uma probabilidade de pelo
menos 0.95 de que Mr esteja a uma distância máxima de
0.5 de Y?
Lei dos grandes números
Observação: a lei dos grandes números nos mostra que Mr ⟶ Y quando ⟶ ∞
Exercício
Uma empresa produz leite enlatado e que o processo é tal que 1% das latas tem peso inferior ao limite.
1. Se uma amostra aleatória de 20 latas é retirada da produção, qual a probabilidade que
a) Nenhuma lata esteja com peso inferior ao limite
b) Não mais que uma lata esteja com peso inferior ao limite
2. Qual é o número médio esperado de latas com peso inferior ao limite?
3. Qual é o tamanho da amostra para que a amostra contenha em média 1 lata com peso inferior ao limite?
Transformação de Variáveis
Como saber se a Curva Normal é
uma boa aproximação?
Uma forma: Olhe o Histograma
Distribuição Normal
tiempo Fr e q u e n c y 40 35 30 25 20 15 10 5 35 30 25 20 15 10 5 0 Mean20.94 StDev6.389 N 200 Histogram of tiempo Normal Sim tiempo1 P e rc e n t 15 12 9 6 3 0 -3 30 25 20 15 10 5 0 Mean 1.672 StDev2.030 N 1000 Histogram of tiempo1 Normal Não35 40 4 550 556 06570 7 5 0 1 2 3 4 5 6 C1 F re q ue n c y 30 35 40 45 50 55 60 6 5 0 1 2 3 4 5 6 7 8 C2 F re q ue n c y 35 40 45 50 55 60 65 0 1 2 3 4 5 6 7 C3 F re q ue n c y 25303540455 05560657 0 0 1 2 3 4 5 6 C4 F re q u e n cy 3540 45 50 556 065 70 75 0 1 2 3 4 5 6 7 8 9 C5 F re q u e n cy 30 35 40 45 50 55 60 65 0 1 2 3 4 5 6 7 C6 F re q u e n cy 3 5 4 0 45 50 55 60 65 0 1 2 3 4 5 6 7 C7 F re qu e n c y 303540 45505560 657 075 0 1 2 3 4 5 6 C8 F re qu e n c y 2530354045505 5606570 0 1 2 3 4 5 6 C9 F re qu e n c y
Qual delas pode ser aproximada por uma distribuição Normal?
Nove Histogramas de amostras de tamanho 25
35 40 4 550 556 06570 7 5 0 1 2 3 4 5 6 C1 F re q ue n c y 30 35 40 45 50 55 60 6 5 0 1 2 3 4 5 6 7 8 C2 F re q ue n c y 35 40 45 50 55 60 65 0 1 2 3 4 5 6 7 C3 F re q ue n c y 25303540455 05560657 0 0 1 2 3 4 5 6 C4 F re q u e n cy 3540 45 50 556 065 70 75 0 1 2 3 4 5 6 7 8 9 C5 F re q u e n cy 30 35 40 45 50 55 60 65 0 1 2 3 4 5 6 7 C6 F re q u e n cy 3 5 4 0 45 50 55 60 65 0 1 2 3 4 5 6 7 C7 F re qu e n c y 303540 45505560 657 075 0 1 2 3 4 5 6 C8 F re qu e n c y 2530354045505 5606570 0 1 2 3 4 5 6 C9 F re qu e n c y 30354045505 56065707 5 0 5 10 C11 F re q u e nc y 30354045505560657 075 0 5 10 15 C12 F re q u e nc y 30 40 50 60 70 0 5 10 C13 F re q u e nc y 25 303 540 455 055 60 6 5 0 5 10 C14 F re q u e n cy 202530354 0455055606570 0 1 2 3 4 5 6 7 8 9 C15 F re q u e n cy 3035404550556 0657075 0 5 10 C16 F re q u e n cy 2025303540455055606570 0 5 10 C17 F re qu e n c y 30 35 40 45 50 5 560 6570 0 5 10 C18 F re qu e n c y 30 35 4045 50 5560 65 70 0 5 10 15 C19 F re qu e n c y
20 30 40 50 60 70 80 0 10 20 C21 F re q ue n c y 20 30 40 50 60 70 80 0 10 20 C22 F re q ue n c y 25 3035404550 55 6065 70 0 10 20 C23 F re q ue n c y 30 3540455055 6065707580 0 10 20 30 C24 F re q u en c y 30 40 50 60 70 80 90 0 1 0 2 0 C25 F re q u en c y 20 30 40 50 60 70 80 0 10 20 C26 F re q u en c y 25 3035404550 5560657075 0 10 20 C27 F re qu e n c y 253035404550 556065 7075 0 5 10 15 20 25 C28 F re qu e n c y 20 30 40 50 60 70 80 0 10 20 C29 F re qu e n c y
Nove Histogramas de amostras de tamanho
100
Qual delas pode ser aproximada por uma distribuição Normal?
Como saber se a Curva Normal é uma boa
aproximação?
Outra forma: Use o Gráfico Probabilístico Normal
Use o Gráfico Probabilístico Normal para determinar se a distribuição dos dados da amostra pode ser aproximada por uma Distribuição Normal. Se a Distribuição Normal se ajusta aos dados, os pontos no gráfico seguirão aproximadamente uma linha reta.
O eixo Y do gráfico é transformado de acordo com a escala da distribuição Normal
Gráfico Probabilístico Normal
O Gráfico Probabilístico Normal pode ser obtido facilmente com o recurso de um software de análise estatística
Abaixo, vemos o gráfico probabilístico normal para um conjunto de dados
P e rc e n t 99 95 90 80 70 60 50 40 30 20 10 5 Probability Plot of X Normal - 95% CI
X Y -1.6245 0.1970 0.4001 1.4920 -1.6631 0.1895 -0.0024 0.9976 -1.9902 0.1367 0.4476 1.5646 -1.0564 0.3477 1.6507 5.2104 -0.6148 0.5408 -0.3855 0.6801 0.6744 1.9629 -0.6713 0.5110 1.2229 3.3969 -0.4550 0.6344 -0.4050 0.6670 -1.0347 0.3553 0.0776 1.0806 -0.1372 0.8718 -1.6101 0.1999 -0.1330 0.8754 0.0685 1.0709 -1.0885 0.3367 0.5012 1.6507 0.2120 1.2362 2.3542 10.5300 0.9572 2.6044 -0.4615 0.6303 1.8076 6.0957 0.7742 2.1689 -0.6469 0.5237
Considere as duas amostras seguintes. Qual pode ser aproximada pela distribuição Normal?
P e rc e n t 10 5 0 -5 99 95 90 80 70 60 50 40 30 20 10 5 1 10 5 0 -5 X Y Probability Plot of X, Y Normal - 95% CI X Y 24 34 44 54 64 74 84 1 5 10 20 30 40 50 60 70 80 90 95 99 Data P e rc e n t
Normal Probability Plot for C1
ML Estimates Mean: StDev: 53.4797 9.60017 25 35 45 55 65 75 1 5 10 20 30 40 50 60 70 80 90 95 99 Data P e rc e n t
Normal Probability Plot for C2
ML Estimates Mean: StDev: 49.1024 8.04855 25 35 45 55 65 75 1 5 10 20 30 40 50 60 70 80 90 95 99 Data P e rc e n t
Normal Probability Plot for C3
ML Estimates Mean: StDev: 51.8801 8.35164 20 30 40 50 60 70 80 1 5 10 20 30 40 50 60 70 80 90 95 99 Data P e rc e n t
Normal Probability Plot for C4
ML Estimates Mean: StDev: 48.8893 10.2680 25 35 45 55 65 75 85 1 5 10 20 30 40 50 60 70 80 90 95 99 Data P e rc e n t
Normal Probability Plot for C5
ML Estimates Mean: StDev: 54.3933 9.50359 25 35 45 55 65 75 1 5 10 20 30 40 50 60 70 80 90 95 99 Data P e rc e n t
Normal Probability Plot for C6
ML Estimates Mean: StDev: 48.9405 8.79949 1 5 10 20 30 40 50 60 70 80 90 95 99 P e rc e n t
Normal Probability Plot for C7 ML Estimates Mean: StDev: 49.4396 8.98477 1 5 10 20 30 40 50 60 70 80 90 95 99 P e rc e n t
Normal Probability Plot for C8
ML Estimates Mean: StDev: 47.1290 10.6092 5 10 20 30 40 50 60 70 80 90 95 99 P e rc e n t
Normal Probability Plot for C9
ML Estimates Mean: StDev: 50.2510 10.4661 Gráficos Probabilísticos
Exemplo
Arquivo: Decisao.MTW Informações:
Uma empresa de crédito mediu, em 100 pedidos de empréstimo, o tempo para decidir sobre a concessão do empréstimo. O tempo foi medido em dias.
Instruções:
1. Faça um histograma do tempo.
2. Faça o Gráfico Probabilístico Normal do tempo. 3. A variável tempo pode ser aproximada pela Distribuição Normal?
4. Analise os dados por estratos (decisão e zona) para verificar se a distribuição é diferente em cada estrato.
Distribuição Normal
Muitas técnicas de análise de dados dependem de que a variável sendo analisada possa ser bem aproximada por uma Distribuição Normal
Gráfico de controle de individuais Índices de Capacidade (Cp, Cpk, Sigma) Etc.
Distribuição Normal
Quais as possíveis razões para que a distribuição de uma amostra de dados não possa ser aproximada por uma Distribuição Normal?
Presença de observações discrepantes (causas especiais) Os dados da amostra provem de dois ou mais processos diferentes (turno, máquina, operador, etc.)
Os dados seguem outra distribuição que não a Normal
Distribuição Normal
Se há causas especiais, analise-as e verifique se os dados devem permanecer na análise
Se os dados provem de dois ou mais processo ( técnicas gráficas como o histograma ou o dot plot ajudam a apontar se esse é o caso - o histograma apresenta duas ou mais modas) procure por variáveis de estratificação que permitam separar os dados
Se a distribuição é intrinsecamente não Normal, utilize técnicas de transformação de variáveis
Transformação de Dados
Uma transformação é uma re-expressão dos dados em outra escala.
Exemplo simples
Transformar Dólares em Reais:
$1 = R$3.03
Transformar minutos em segundos:
1 min = 60 segs
Transformar Graus Centígrados em Graus Fahrenheit:
Transformação de Dados
Transformações Lineares
Transformações lineares tem a seguinte forma: Y = aX + b; a e b constantes
Se X segue a distribuição Normal, multiplicar ou adicionar constantes não afeta a forma da distribuição; afeta somente a escala
Transformação de Dados
Transformações não lineares
Transformações não lineares podem mudar a forma da distribuição.
Exemplo: Transformação Raiz Quadrada
Histograma of Y 2 4 6 8 10 12 14 16 18 20 22 0 10 20 Y F re q u e n c y Histograma de SQRT(Y) 1 2 3 4 5 0 5 10 15 SQRT(Y) F re q u e n c y Y YT = YTdenota a variável transformada
Transformação de Dados
Transformação Logaritmo:
A transformação logaritmo é usualmente apropriada para dados de tempo.
Uma unidade na escala logarítmica é igual a um fator de 10 na escala original:
Escala original Escala Log
1000 3 100 2 10 1 1 0 0.1 -1 0.01 -2 0.001 -3
Transformação de Dados
Transformações LinearesTransformações lineares tem a seguinte forma: Y = aX + b; a e b constantes
Se X segue a distribuição Normal, multiplicar ou adicionar constantes não afeta a forma da distribuição; afeta somente a escala
Dados originais Dados Transformados -logaritmo
Exemplo
Transformação Log
Dados: Decisao.MTW
Relembre que a variável “Tempo” não é Normal
Use a seguinte transformação: YT=log(Y).
Dados originais 0 10 20 30 40 50 60 0 10 20 30 40 Time F re q u e n c y -20 -10 0 10 20 30 40 50 1 5 10 20 30 40 50 60 70 80 90 95 99 Data P e rc e n t
Normal Probability Plot for Time
ML Estimates Mean: StDev:
12.31 9.60801
Transformação Log
Faça um histograma e o Gráfico Probabilístico Normal dos dados transformados (Log_Tempo)
log_tiempo Fr e q u e n c y 1.6 1.4 1.2 1.0 0.8 0.6 0.4 20 15 10 5 0 Histogram of log_tiempo log_tiempo P e rc e n t 2.0 1.5 1.0 0.5 0.0 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Mean 0.299 0.9855 StDev 0.2973 N 100 A D 0.432 P-Value
Probability Plot of log_tiempo
Normal - 95% CI
Conclusão: podemos dizer que Log_tempo tem distribuição Normal
Transformação de Dados
Como escolher qual transformação é adequada?
Tentar uma transformação dentre um conjunto de possibilidades
Transformações Usadas com Freqüência
Log(Y) Y Y Y Raiz Quadrada Logarítmica Y YT = Log(Y) YT =Distribuição original Transformação Distribuição da variável transformada
Transformações Usadas com Freqüência,
cont.
Y 1 Y Y InversaRaiz Quadrada Inversa
Y
1
Y
T=
Y
1
Y
T=
Y 1Outras Transformações
Dados de classificação - Distribuição Binomial
k = # of unidades defeituosas n = tamanho da amostra
Use a transformação raiz quadrada do arcoseno de p
p arcsin YT = n k p=
Outras Transformações, cont.
Dados de contagem – Distribuição de Poisson
Use raiz quadrada da contagem:
Se o resultado da contagem é pequeno (c ≤10), use:
0.5 c Y T = + c YT =
Método de Box-Cox
Método de Box-Cox
Uma transformação potência eleva os valores de Y a uma potência lambda (λ): YT= Yλ
λé tipicamente um valor entre –2 e 2
O Método de Box-Cox sugere um valor de λque melhor aproxima os dados transformados de uma distribuição Normal
Método de Box-Cox
A transformação potencia inclui algumas que foram vistas anteriormente É trabalhoso fazer aplicar o método sem o apoio de um software λλλλ Yλλλλ Nome -2 2 Y 1 Inversa ao quadrado -1 Y 1 Inversa -0.5 Y 1 Inversa raiz Quadrada 0 Log(Y) Logarítmica 0.5 Y Raiz Quadrada 1 Sem Transformação 2 Y2 Quadrado
Método Box-Cox
Softwares (como o MINITAB) fazem a análise dos dados da amostra e sugerem um valor de lambida.
Escolha um lambida dentro da faixa de valores recomendada (barras vermelhas)
Se possível, escolha um valor que corresponde a um valor da tabela anterior -5 -4 -3 -2 -1 0 1 2 3 4 5 1 2 3 95% Confidence Interval S tD e v Lambda
Last Iteration Info
Lambda StDev 0.393 0.450 0.507 0.553 0.553 0.553 Low Est Up
Box-Cox Plot for Y
Selecionar uma Transformação com
Box_Cox
Dados: Decisao.MTW Lambda S tD e v 2 1 0 -1 -2 -3 -4 -5 180 160 140 120 100 80 60 40 20 0 Lower C L Upper C L Limit Lambda 0.000000 (using 95.0% confidence) Estimate -0.189558 Lower C L -0.497419 Upper C L 0.082957 Best ValueBox-Cox Plot of Tiempo
Atividade: Escolher uma Transformação
Um centro de atendimento ao consumidor mediu o tempo para responder e fechar uma reclamação de um cliente. Os dados dos últimos 100 clientes atendidos estão no arquivo de dados reclamacao.mtw
Analise os dados originais. Caso a Distribuição Normal não seja adequada, transforme os dados usando o Método Box-Cox
Método Científico
O ciclo de aprendizagem
“Seres humanos são distintos do resto dos animais pela sua extraordinária habilidade de aprender e inovar”
Como aprendemos?
O fundamento de toda ciência é, obviamente, a observação.
Oscar Kempthorne
Método Científico
O conhecimento é construído com base em teorias Há três componentes importantes do conhecimento
Os dados da experiência a partir do qual o processo de aquisição de conhecimento se inicia
A predição em termos de dados que se espera obter se realizamos um experimento no futuro
O grau de convicção na predição com base nos dados originais
Nossas teorias precisam ser sistematicamente revisadas e ampliadas por meio das comparações entre predições e observações (aprendizagem indutiva e dedutiva)
O aprendizado das pessoas sobre os processos é realizado de forma mais eficiente e eficaz pelo uso do Método Científico
Passos do Método Científico
Observar um evento
Formular uma teoria para a causa do evento Fazer predições com base na teoria
Testar a teoria através de um experimento
Analisar os resultados do experimento e concluir a respeito da teoria
Relatar os resultados à comunidade científica (publicar o trabalho) ou aplicar o conhecimento obtido em alguma situação de interesse
Passos do Método Científico
Fonte: Statistics for Experimenters, Box, Hunter & Hunter Comparação Plano de teste Mundo Observações (dados) Teoria Indução Consequências Dedução Teste Novos dados Comparação com a Teoria Teoria reforçada Teoria modificada Induçã o Dedução 1 2 3 4 5 6 7 8
Modelo de produção de conhecimento Indução e Dedução
Questões Teorias Modelos mentais Conhecimento Intuição Experiência Predições Consequências Testes (Planejamento para coletar e analisar Dados) Análise
Reforço ou alteração das teorias e modelos mentais
Novos conhecimentos Mais experiência
Produção de conhecimento específico Método Científico
O ciclo PDSA
O ciclo PDSA é uma adaptação do Método Científico Foi desenvolvido por Deming e colaboradores a partir de ideias iniciais de Shewhart
O Ciclo PDSA
Estudo de uma população
Variável resposta contínua
Inferência
Considere uma população ou um processo e uma variável de interesse medida em uma amostra
Os dados da amostra podem ser usados para realizar inferências sobre a população ou o processo
As características (parâmetros) de interesse são em geral
A forma da distribuição da variável A média
Inferência sobre a forma
O objetivo é identificar se existe uma distribuição conhecida que pode ser usada para aproximar a distribuição dos valores, como por exemplo a Distribuição Normal, ou Log Normal, ou Weibull
Isso pode ser feito ajustando-se o gráfico probabilístico de uma determinada distribuição aos dados. Caso o gráfico seja aproximadamente uma reta, a distribuição correspondente pode ser usada.
Exemplo
Chamada Tempo Chamada Tempo Chamada Tempo
1 2.53 11 5.57 21 4.81 2 5.52 12 4.60 22 4.82 3 3.53 13 3.84 23 7.19 4 3.26 14 5.37 24 2.39 5 6.31 15 3.42 25 5.52 6 4.04 16 4.51 26 5.01 7 4.09 17 1.84 27 1.94 8 1.22 18 6.89 28 4.60 9 3.42 19 3.53 29 2.35 10 5.01 20 6.75 30 2.07
Uma empresa monitorou o tempo gasto para atender uma chamada de um cliente em um call center. Trinta atendimentos forma
Inferência sobre a forma: Ajuste da
Distribuição Normal
tempo de atendimento P e rc e n t 10 8 6 4 2 0 99 95 90 80 70 60 50 40 30 20 10 5 1 Mean 4.198 StDev 1.588 N 30 A D 0.222 P-Value 0.813Probability Plot of tempo de atendimento
Normal - 95% CI
O gráfico Probabilístico Normal indica que a distribuição Normal é adequada para descrever a distribuição do tempo de atendimento
Análise: Gráfico de controle e histograma
Observation In d iv id u a l V a lu e 28 25 22 19 16 13 10 7 4 1 10 8 6 4 2 0 _ X=4.20 UCL=9.65 LCL=-1.25 I Chart of tempo de atendimento
tempo de atendimento P e rc e n t 8 7 6 5 4 3 2 1 30 25 20 15 10 5 0 Mean4.198 StDev1.588 N 30
Histogram of tempo de atendimento Normal
Não há evidência de que o processo não esteja sob controle
O gráfico sugere que a distribuição Normal é
adequada para descrever a distribuição do tempo de atendimento