• Nenhum resultado encontrado

Conceitos Básicos

N/A
N/A
Protected

Academic year: 2023

Share "Conceitos Básicos"

Copied!
17
0
0

Texto

(1)

Reconhecimento de Padrões Revisão de Probabilidade e

Estatística

Luiz Eduardo S. Oliveira, Ph.D.

http://lesoliveira.net Universidade Federal do Paraná

Departamento de Informática

Conceitos Básicos

• Estamos realizando um evento aleatório (pegar um peixe no mar)

• Espaço amostral S

– Conjunto de todas a possibilidades

• Um evento A

– Um subconjunto de S

• Lei da probabilidade

– Regra que atribui uma probabilidade aos eventos de um experimento

S

A

(2)

Axiomas Básicos da Probabilidade

• P(A) >= 0

• P(S) = 1

• P(AUB) = P(A)+P(B) se A e B forem mutuamente exclusivos

– Eventos que não ocorrem simultaneamente, ou seja A∩B = ø

• Caso contrário

– P(AUB) = P(A)+P(B) – P(A∩B)

• P(A) + P(~A)= 1

Probabilidade Condicional

• A probabilidade de ocorrer um evento, na

condição de que outro evento já tenha ocorrido.

• Considere o seguinte exemplo:

– 250 alunos estão matriculados no primeiro ano

• 100 homens e 150 mulheres

• 110 cursam física e 140 química ) (

) ) (

|

( P B

B A B P A

P I

=

Sexo\Discip. Física Quimica Total

H 40 60 100

M 70 80 150

Total 110 140 250

(3)

Probabilidade Condicional

• Um aluno é sorteado ao acaso. Qual a probabilidade de que esteja cursando química dado que seja mulher.

53 . 150 0

80 250 150 150 80 )

( ) ) (

|

( = = = =

M P

M Q M P

Q

P I

Probabilidade Total

• Uma sequência finita de experimentos na qual cada experimento tem um número finito de resultados com uma determinada probabilidade é chamada de processo estocástico finito.

• Árvore Bayesiana é uma boa ferramenta para visualização do problema.

• A probabilidade final é calculada pela lei da probabilidade final.

(4)

Probabilidade Total: Exemplo

• Considere 3 caixas

– Caixa 1 tem 10 lampadas, das quais 4 com defeito – Caixa 2 tem 6 lâmpadas, das quais 1 com defeito – Caixa 3 tem 8 lâmpadas, das quais 3 com defeito.

• O problema consiste em saber a probabilidade de uma lâmpada ser defeituosa P(A), ao selecionar uma caixa aleatoriamente e depois selecionar uma lâmpada aleatoriamente.

1

2

3

Defeito Ok Defeito Ok Defeito Ok 1/3

1/3

1/3

4/10 6/10 1/6 5/6 3/8 5/8

Baseado no conceito de probabilidade total, temos como probabilidade P(A)

31 . 8 0 3 3 1 6 1 3 1 10

4 3 ) 1

( =

×

+

×

+

×

= A P

Eventos Independentes

• Dois eventos são ditos independentes se P(A∩B) = P(A) * P(B)

• Logo, pela regra da probabilidade

condicional, se A e B são independentes,

) ) (

( ) ( ) ) (

|

( P A

B P

B P A B P

A

P × =

=

(5)

Exemplo

• Suponha que uma urna contenha 4 bolas brancas e 6 vermelhas. Vamos sortear duas bolas (sem reposição) em momentos distintos. Qual a probabilidade de sair uma bola branca seguida de uma vermelha

P(B) = 4/10

P(V) = 6/10

P(B) = 3/9

P(V) = 6/9

P(B) = 4/9

P(V) = 5/9

Exemplo (cont)

• Agora considere o exemplo anterior com reposição, ou seja, eventos

independentes.

• P(B,V) = P(B) X P(V) = 4/10 X 6/10 = 0.24

(6)

Teorema de Bayes

• Basicamente o teorema de Bayes mostra como rever as crenças sempre que novas evidências são coletadas.

• Ou seja, atualizar a probabilidade a posteriori utilizando para isso a probabilidade a priori e as verossimilhanças e as evidências.

) (

)

| ( ) ) (

|

( P B

A B A B P

A

P ×

=

priori Verosimilhanças

(likelihood)

Evidências Prob. a

posteriori

×

= ( ) ( | ) )

(B P Ai P B Ai

P

Teorema de Bayes:Exemplo

• Um médico sabe que a meningite causa

torcicolo em 50% dos casos. Porém, o médico sabe que a meningite atinge 1/50000 e também que a probabilidade de se ter torcicolo é de 1/20.

• Usando Bayes pra saber a probabilidade de uma pessoa ter meningite dado que ela está com torcicolo

P(T|M) = 0.5 P(M) = 1/50000 P(T) = 1/20

0002 . 20 0

/ 1

5 . 0 50000 / 1 )

( )

| ( ) ) (

|

( × =

× =

= PT

M T M T P M P

(7)

Teorema de Bayes:Exercício

• Considere o sistema de classificação de peixes visto anteriormente.

Para essa época do ano, sabe-se que a probabilidade de pescar salmão é maior que pescar robalo, P(salmão) = 0.82 e P(robabo) = 0.18.

• Suponha que a única característica que você pode contar é a intensidade do peixe ou seja, se ele é claro ou escuro. Sabe-se que 49.5% dos salmões tem intensidade clara e que 85% dos robalos tem intensidade clara.

• Calcule a probabilidade de ser salmão dado que o peixe amostrado tem intensidade clara.

726 . 85 0 . 0 18 . 0 495 . 0 82 . 0

495 . 0 82 . 0 )

( )

| ( ) ) (

|

( =

× +

×

= ×

= ×

C P

S C S C P S P

Probabilidade total

Variáveis Aleatórias

• Na prática, muitas vezes é mais interessante associarmos um número a um evento aleatório e calcularmos a probabilidade da ocorrência desse número do que a probabilidade do evento.

• Exemplo: Lançam-se três moedas. Seja X o numero de ocorrências da face cara. Determinar a distribuição de probabilidade de X

– S = {ccc,cck,ckc,ckk,kcc,kck,kkc,kkk}

– Se X é o número de caras, X assume os valores 0,1,2, e 3.

(8)

Variáveis Aleatórias

• Podemos associar a esses números eventos que correspondem a ocorrência de nenhuma, uma, duas ou três caras.

• Desta forma temos – P(X=0) = 1/8

– P(X=1) = 3/8 – P(X=2) = 3/8 – P(X=3) = 1/8

Distribuição de Probabilidades

P(Xi)=1

Variáveis Aleatórias

• Portanto, podemos definir que variável aleatória é a função que associa a todo evento pertencente a uma partição do espaço amostral um único número real.

• Variáveis podem ser discretas ou contínuas

(9)

Parâmetros de uma Distribuição

• Existem características numéricas que são muito importantes em uma

distribuição de probabilidades. São os parâmetros da distribuição

– Esperança matemática e variância.

• Esperança matemática

×

= ( )

)

(X Xi P Xi

E

Esperança Matemática: Exemplo

• Uma seguradora paga 30000 em caso de acidente de carro e cobra franquia de 1000.

Sabe-se que a probabilidade de que um carro sofra acidente é de 3%. Quanto espera a seguradora ganhar por carro segurado.

• Variável Aleatória: X

X P(X)

1000 0.97

-29000 0.03

Distribuição de Probabilidade

E(X) = 1K * .97 + -29K *.03 = 100

Esperança (lucro médio) é de 100 por carro. Deve ser interpretada como valor médio

(10)

Variância

• Conhecendo a média (esperança) de uma distribuição de probabilidades, podemos calcular o grau de dispersão em torno da média

(

2 ( )

) [

( )

]

2

)

(X X P X E X

VAR =

i × i

Variáveis Aleatórias Contínuas

• Podemos definir uma variável aleatória contínua como sendo a variável aleatória X em R se existir uma função f(x) tal que:

(11)

Calculando as probabilidades

Caso discreto:

-Probabilidades

- P(peixe ter 2 ou 3 nadadeiras) = - P(2) + P(3) = 0.3+0.4

Use a soma

Caso contínuo:

-Densidadee não probabilidades -Probabilidade do peixe pesar entre 29 e 31 kgs.

-Integrar

Distribuições Teóricas

• As distribuições teóricas associam uma probabilidade a cada resultado numérico de um experimento, ou seja, dá a

probabilidade de cada valor de uma variável aleatória.

• Podem ter uma variedade de formas.

– Simétricas e não simétricas.

• Binomial, Poisson, Exponencial, Normal

(12)

Distribuição Normal (Gaussiana)

• A distribuição normal é a mais importante das distribuições pois muitas variáveis aleatórias de ocorrência natural ou de processos práticos obedecem a esta distribuição.

• Formato de sino

• Simétrica

• Unimodal

Distribuição Normal

• A função densidade para esta distribuição é dada por

• Como podemos perceber, a distribuição normal inclui dois parâmetros

µ – média populacional

σ – desvio padrão populacional.

• Denotamos N(µ, σ) a curva normal com média µ e desvio padrão σ

(13)

Distribuição Normal

• A média refere-se ao centro da distribuição e o desvio padrão ao

espalhamento (ou achatamento) da curva.

Distribuição Normal

68.27%

95.45%

(14)

Exemplo

• O peso de recém-nascidos é uma variável aleatória contínua. A Figura abaixo mostra a distribuição de freqüências relativas 5000 pesos de recém-nascidos.

Exemplo

• Considerando µ = 2800g, σ = 500g, podemos concluir que

– P(2300 <= X <= 3300) = 68.3%

– P(1800 <= X <= 3800) = 95.5%

– P(1300 <= X <= 4300) = 99.7%

• Porém, na prática desejamos calcular probabilidades para diferentes valores de µ e σ.

(15)

Distribuição Normal

• Para isso, a variável X cuja distribuição N(µ, σ) é transformada numa forma padronizada Z, com distribuição N(0,1) (distribuição normal padrão), pois tal distribuição é tabelada.

• A normalização se dá por σ

µ

= X Z

Utilizando a Tábua de Probabilidades

• Primeiro é necessário decompor Z em duas parcelas

• Por exemplo, Z = 1.39 – Primeira parcela = 1.3 – Segunda parcela = 0.09

• No cruzamento das duas parcelas encontra-se a probabilidade

correspondente a área da curva entre 0 e Z.

(16)

Exemplo

• Considere a seguinte distribuição – X -> N(30;4)

– Calcule a probabilidade de X >= 40.

5 . 4 2

30 40 =

= Z

Da tabela, temos 0.4938 Logo,

P(X>=40) = 0.5 – 0.4938

2.5 0

Exercício

• Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média 150 mil km e desvio de 5 mil. Qual a probabilidade de que um carro escolhido ao acaso dure

– a) menos de 170 mil – b) entre 140 e 165 mil

(17)

Exercício

• a) P(X < 170)

– Z = 4. Da tabela temos 0.4999968 – Logo P(X<170) = 0.5 + 0.4999= 0.999

Teorema Central do Limite

• A medida em que o tamanho da amostra X cresce, a distribuição de X se aproxima da distribuição normal

Referências

Documentos relacionados

A mitigação dos impactos socioambientais ficou a cargo de um Plano de Ações Ambientais, composto de 14 programas, específicos para cada segmento natural alterado

Para realização deste trabalho foi feito:  Estudo bibliográfico sobre os princípios do Lean Thinking e sobre métodos de investigação de opiniões;  Participação e

Recursos Didáticos • Aula expositiva, quadro branco, projetor multimídia, aparelho vídeo/áudio/TV. Avaliação • Participação nas atividades em sala

Esta garantia não cobre qualquer Equipamento ESAB ou parte ou componente que tenha sido alterado, sujeito a uso incorreto, sofrido acidente ou dano causado por meio de transporte

Diante dos resultados encontrados é perceptível a confirmação da hipótese de que as escolas da rede municipal de ensino da cidade de Patos-Paraíba disponibilizam

Normalmente identificam o solo pelo “jeitão” com base no que visualizam no campo, buscando apoio na bibliografia e enquadrando a classe no primeiro e segundo nível categórico do

Os dados de execução dos projetos da Fábrica de Software X, no que diz respeito à análise de desempenho aplicada ao atributo de processo “Desvio do Prazo

6.1 AS CONCEPÇÕES DOS DISCENTES: os recursos tecnológicos, o site Flickr e os docentes Para analisar as concepções que os discentes do 2º ano “B” da Escola Estadual de