Uma breve introdução a
probabilidade
Modelo Probabilístico
Espaço amostral (S): conjunto de todos os resultados que podem ocorrer a partir de um experimento aleatório Probabilidade de eventos (P): quantificação da “chance” que cada resultado ocorra Eventos (E): conjunto de resultados que são de interesseÁlgebra de Eventos
Diagrama de eventos S Evento A Evento B Evento C Evento ocorre quando um de seus elementos é o resultado do experimento aleatório Operações de união, interseção e complemento Espaço amostralExclusão Mútua
Dois eventos A e B são disjuntos ou mutuamente exclusivos seA∩B=∅
Exemplos? Evento A: os dois dados são pares Evento B: os dois dados são ímpares conjunto vazioAxiomas de Probabilidade
(A1): para cada evento A, 0 <= P(A) <= 1 (A2): P(S) = 1, onde S é o espaço amostral
(A3): se A e B são mutuamente exclusivos, então P(A U B) = P(A) + P(B)
Caso geral
P( A∪B)=P( A)+P(B)−P( A∩B)
Para o caso geral, a probabilidade da união de dois
eventos A e B, é dada por
Esta regra pode ser estendida para soma de três ou mais termos.
Como calcular as freqüências de
ocorrência?
Contando o número de casos favoráveis para ocorrência de um certo evento, se os eventos são equiprováveis Quando o espaço amostral é grande, temos que usar a análise combinatória P(E) = número de casos favoráveis/número total de casosProbabilidade Condicional
Relacionamento entre a ocorrência de um evento e outros eventos Qual a probabilidade do evento A dado que o evento B ocorreu? Dado que o resultado do experimento aleatório é elemento de B, qual a probabilidade deste ser também elemento de A? Espaço amostral passa a ser o evento B S Evento B Evento AProbabilidade Condicional
Definição:P [ A∣B ]=
P [ A∩B]
P[ B]
Probabilidade de A dado BRegra do produto ou regra da cadeia
Considere um conjunto finito de eventos tais que os eventos condicionais tenham probabilidades positivas. Temos que:A
i/
A
1∩
A
2∩
...∩ A
i−1A
1,A
2,..., A
n Permite o cálculo da distribuição conjunta de n eventos a partir de probabilidades condicionaisRegra do produto ou regra da cadeia
Para demonstrar basta escrever:
E reescrever o lado direito da equação usando a definição de probabilidade condicional:
Eventos Independentes
Sejam A e B dois eventos definidos no mesmo espaço amostral S A e B são independentes seP [ A∩B ]=P [ A]P [B ]
Note que se A e B são independentes, então P [ A∣B ]= P [ A∩B ] P [ B ] = P [ A ] P [ B ] P [ B ] = P [ A ] 2 eventos são independentes se a ocorrência de um não altera a probabilidade do outroEventos: Mutuamente Exclusivos x
Independentes
Experimento Aleatório: Jogar um dado e uma moeda S={(1,Ca),(1,Co),(2,Ca),(2,Co),(3,Ca),(3,Co),
(4,Ca),(4,Co),(5,Ca),(5,Co),(6,Ca),(6,Co)}
Evento A: resultado da moeda é cara P(A) = 1/2 Evento B: resultado da moeda é coroa P(B) = 1/2 Eventos A e B são independentes ou mutuamente exclusivos?
A∩B=∅
A e B são mutuamente exclusivos!Eventos: Mutuamente Exclusivos x
Independentes
Evento A: resultado do dado é maior do que 2 Evento B: resultado da moeda é cara S={(1,Ca),(1,Co),(2,Ca),(2,Co),(3,Ca),(3,Co), (4,Ca),(4,Co),(5,Ca),(5,Co),(6,Ca),(6,Co)} A∩B = { (3,Ca), (4,Ca), (5,Ca), (6,Ca)} P [ A∩B] = 4/12 = 1/3P[ A∩B]=1/3=P[ A] P [B]=1/3
P[A] = 8/12 = 2/3, P[B] = 1/2 A e B são independentes!P [ A/ B]=P[ A∩B]/P [ B]=2 /3
8 resultados em 12 2 resultados em 3Relacionar eventos para calcular
probabilidades
Sejam A e B dois eventos, temos queP[A∩B]P[A∩B]
mutuamente exclusivos Definição de probabilidade condicionalP [ A]=P [ A∩B∪A∩B ]
= = definição de conjuntosP[A∩B]P[A∩B]
P[A∣B]P[B]P[A∣B]P[B]
S Evento B Evento ARosa – 2017
Teorema da Probabilidade Total
Generalização do conceito
Seja Bi (i=1,...,n) uma partição do espaço amostral, onde Bi são eventos mutuamente exclusivos, e a sua união é igual ao espaço amostral B1 B2 B3
A
. . . Bn-1 Bn Considere o evento A. Qual a probabilidade de A ocorrer (em função de Bi)?P[ A]=
∑
i=1 i=nP[ A∣B
i]
P[ B
i]
Teorema da ProbabilidadeLei de Bayes
Permite o cálculo da probabilidade de um evento B condicionado a um evento A, dado que se conhece o inverso Uso do teorema da probabilidade totalP[ B
i/
A]=
P[ A/ B
i]
P[ B
i]
∑
j=1 nP[ A∣B
j]
P[ B
j]
P [ A] P [ Bi∩ A]Exemplo
Técnica (imperfeita) para acusar defeitos em processadores 95% verdadeiro positivo 5% falso positivo 1% dos processadores possuem defeitos P(D) Qual a probabilidade de um processador ser defeituoso dado que o teste foi positivo? P(D/T) Eventos D : processador defeituoso T : resultado do teste é positivo teste acusa defeito quando processador está defeituoso P(T/D) teste acusa defeito quando processador está ok P [T∣D]=0.05Exemplo
D : processador defeituoso T : resultado do teste é positivo Pergunta: P[D|T] ?P [D]=0.01
P [D∣T ]=
P[ D∩T ]
P [T ]
=
P[T∣D] P[ D]
P [T ]
P [T∣D]=0.95
P [T∣D]=0.05
P [T ]=P [T∣D] P [D]P [T∣D] P [D]
Exemplo
Event A: Subject has disease Event B: Test is positive Interpret: Probability patient has disease and positive test (correct!) Probability patient has disease BUT negative test (false negative) Probability patient has no disease BUT positive test (false positive) Probability patient has disease given a positive test Probability patient has disease given a negative test P( A∩B) P( A∩B) P( A∩B) P( A / B) P( A / B)Exemplo
If only data we have is B or not B, what can we say about A being true? Not as simple as positive = disease, negative = healthy Test is not infallible! Probability depends on A and B: Must Examine independence Does P(A) depend on P(B)? Does P(B) depend on P(A)? Events are dependent p (A∣B)= p( A∩B) p(B) p(A∣B)= p( A∩B) p(B) = p(A∩B) 1−p(B) Event A: Subject has disease Event B: Test is positiveExemplo
Bayes’ theorem allows inference on A, given the test result, using knowledge of the test’s accuracy and population qualities P(B|A) is test’s sensitivity P(B|A) is test’s false positive rate P(A) is occurrence of diseaseP(A/B)=
P(A∩B)
P(B)
=
P(B/A)P(A)
P(B)
P( B)=∑ ∀i P (B / Ai)P( Ai)=P (B / A ) P( A )+ P ( B / A) P ( A ) Event A: Subject has disease Event B: Test is positiveVariáveis Aleatórias
Necessidade de expressar eventos de forma precisa Interesse não no resultado aleatório, mas numa função do resultado Idéia: Mapear eventos em números reais A B C D EExemplo: Um dado
Considere um dado Ganha 10 se o resultado é 6, zero se o resultado é 4 ou 5, e perde 5 se o resultado é 1, 2 ou 3 1 2 3 4 5 6 0 10 -5Definição de Variável Aleatória
Uma variável aleatória X é uma função sobre um espaço amostral S que associa um número real a cada elemento de S
Função probabilidade de massa
(pmf)
Associar probabilidade a valores de uma v.a. Seja X uma v.a. (discreta). Qual a probabilidade de X = x? Conjunto de eventos elementares que são mapeados no valor x notação de pmf (probability mass function){
s∣X s=x }
p
X(
x)=P[ X =x]=P [{s∣X (s)=x }]=
∑
X (s)= xP[s]
0≤ pX(x)≤1 ∑ ∀x pX(x)=1 Propriedades:Função probabilidade de massa
(pmf)
Função distribuição cumulativa (cdf)
Dada v.a. X discreta, temos notação da cdf (cumulative distribution function) (i) FX(x) é monotônica, não decrescente em XF
X
x=P [ X x]=P [{s∣X s x }]=
∑
X sxP [ s]
Propriedades: (ii) 0≤FX( x)≤1, −∞≤x≤+∞Variáveis Aleatórias Contínuas
F
X(
x)=P [ X⩽x ]
Para uma v.a. contínua é definida a função distribuição (ii) 0≤FX (x)≤1, −∞≤x≤+∞ Propriedades: (i) FX(x) é monotônica, não decrescente em X (iii) P [ X =c]=P [c≤x≤c]=∫ c c f X(x)dx=0Variáveis Aleatórias Contínuas
f X(x)=d FX(x) dx Para uma v.a. contínua é definida a função densidade (i) f X (x)≥0, ∀ x Propriedades: (ii)∫
−∞ +∞ f X(x)dx=1 P[ X≤a]=∫
−∞ a f X (x)dx P[a≤ X≤b]=∫
a b f X(x)dx=FX (b)−FX(a)Variáveis Aleatórias Conjuntas
- X e Y tem distribuição Normal
Variáveis Aleatórias Conjuntas:
Propriedades
Variáveis Aleatórias Conjuntas:
Propriedades
Função densidade marginal da v.a. X Função densidade marginal da v.a. Y Função distribuição marginal da v.a. XFunção Distribuição Marginal
Variáveis Aleatórias Conjuntas
Suponha duas v.a. contínuas definidas no mesmo espaço de probabilidade Estamos interessados em calcular: P [ X≤x ,Y ≤ y ]=FX ,Y (x , y) FX ,Y (x , y)=∫
−∞ x∫
−∞ y f X ,Y (u , v)dvdu Podemos obter a função distribuição marginal a partir da função distribuição conjunta: FX(x)=∫
−∞ x∫
−∞ +∞ f X ,Y (u , v)dvduFunção Distribuição Condicional:
Motivação
Muitas vezes as variáveis aleatórias possuem dependência A forma de expressar a dependência entre duas variáveis aleatórias é condicionando uma v.a. na outra e depois usar o teorema da probabilidade total e suas variaçõesFunção Distribuição
Condicional
Considere que iremos condicionar a variável Y na variável X Casos a serem estudados: X e Y são duas variáveis aleatórias discretas X e Y são duas variáveis aleatórias contínuasExemplo: X e Y discretas
O número de jobs enviados para o servidor A dado que chegaram n jobs no sistema é uma v.a. Binomial
Variância
Var [ X ]=E[( X−E[ X ])
2]
Var [ X ]=E[ X
2]−(
E[ X ])
2Variância da soma de variáveis
aleatórias
E [ X −E [ X ]Y − E [Y ]2]
Dependência entre variáveis aleatórias
Se Cov(X,Y)=0, não significa que X e Y são independentes
Dependência entre variáveis
aleatórias: exemplo
Seja X v.a. Uniforme (1,1) e Y=X2 , logo Y é dependente
de X. Qual o valor de Cov(X,Y) ?