Probabilidade, Estatística,
Decisões e Segurança em
Engenharia Geotécnica
2
Informações gerais
• Horário das aulas
Quintas-feiras das 8:30 às 11:30
• Livro texto principal:
Benjamin, J.R. e Cornell, C.A.
-Probability, Statistics, and Decision for
Civil Engineers. McGraw-Hill, 1970 (mais
de um exemplar, em Inglês e Espanhol, em
reserva na Biblioteca)
Informações gerais (cont.)
• Avaliação
– Teste de uma hora e meia em 28/10/99 (35%) – Exame final de duas horas em 2/12/99 (65%) – Exercícios praticamente em todas as aulas, em
geral do livro do B&C (não recebem nota, mas são essenciais)
– Projeto depende da dinâmica da classe (15%; se houver, o exame final passa a 50%)
4
Internet
– Waldemar Hachich: whachich@usp.br
– Secretaria de Pós-Graduação: pefpg@edu.usp.br
• Página Web
– sempre que possível, informações das aulas, dos exercícios e do projeto estarão em um “link” em
Primeira aula (30/9/99)
• Relevância da disciplina: alguns exemplos
• Estatística vs. Teoria das Probabilidades
• Inferência estatística
• Análise de Decisões
• Segurança
6
Relevância: exemplos
• Estabelecimento de critérios de segurança • Estabelecimento de probabilidades de ruína
(seguros!)
• Estabelecimento de critérios de amostragem para Planos de Auditoria
• Decisão quanto à cravabilidade de estacas “offshore”
• Comparação de processos de investigação do subsolo
Evolução dos critérios de
segurança
• Minimização de custos – inicial – esperado • Empirismo • Racionalismo • Incrementalismo (“observational method”)8
Probabilidade e Estatística: dois
lados de uma mesma moeda
• Estatística: o lado inferencial • Estimativas dos parâmetros dos modelos, a partir de amostras • Probabilidade: o aspecto dedutivo da aleatoriedade • Modelos probabilistas e seus parâmetros (jamais conhecidos!) • “Propriedades” das
amostras (Lindley, D.V. - Introduction to Probability andStatistics from a Bayesian viewpoint.
Estatística vs. Teoria das
Probabilidades
(Barmett, V. -Comparative Statistical Inference. Wiley, 1973)10
Estatística e Análise de Decisões
• Análise de Decisões: prescritiva
• Sugestão de ação a ser tomada em uma situação prática de incerteza • Estatística: descritiva • Descrição de uma situação prática utilizando um modelo probabilista
Estatística clássica e Bayesiana
• Clássica
– Todas as informações quanto à aleatoriedade estão contidas nos
dados (e só neles)
– “Dados falam por si próprios”
• Bayesiana
– Dados (amostras) são parte das informações disponíveis – Inferências e tomadas de decisões devem processar igualmente as informações anteriores à amostragem
12
Probabilidades
• Interpretações – Clássica – Frequentista – Objetiva – Subjetiva • Definição axiomática (contorna a questão das interpretações): – 1 ≥ P[A] ≥ 0 – P[S] = 1 – P[A∪B] = P[A] + P[B] se A∩B = ∅ – (A e B: eventos) – S: espaço amostralPara a segunda aula (6/10/99)
• Estudar
– Capítulo 1 do B&C
– Capítulo 2 do B&C até a pág. 69
• Resolver
14
Segunda aula (6/10/99)
• Pano de fundo – exercício 1.9 (B&C) – decisão face a incertezas – diferentes conceitos de probabilidades • Estatísticas de amostras • Modelos probabilistas • Variáveis aleatórias discretas e contínuasB&C 1.9 - Decisão frente a incerteza
• Estruturação do processo decisório: árvore de decisão
• Avaliação de conseqüências • Estimação de probabilidades
– Histogramas vs. distribuição de freqüências acumuladas – Com e sem modelo probabilista
• Critério de decisão (por exemplo, minimização do custo esperado)
16
B&C 1.9 - Capacidade e
custo
(
avaliação das conseqüências
)
Altura da
ensecadeira (m)
Capacidade
(m
3/s)
Custo
3
200
$15.600
4,5
550
$18.600
Custo de 3 semanas de atraso
B&C 1.9 - Estruturação da decisão:
árvore de decisão
H2=4,5 m C=550 m3/s Sucesso: D≤ 200 m3/s (1-P[R| H1]) Fracasso: D>200 m3/s P[R| H1] Sucesso: D≤ 550 m3/s (1-P[R| H2]) Fracasso: D>550 m3/s H1=3 m C=200 m3/s Nó do acaso $ 15.600 $ 45.600 $ 18.600 Nó de decisão18
B&C 1.9 - Demanda:
série histórica
Série histórica de vazões
0 500 1000 1500 2000 1910 1920 1930 1940 1950 1960 1970 Ano V a zõ es ( m 3 /s ) Máximas anuais
Estatísticas da amostra
Média: 886,45 m3/sDesvio padrão: 440,89 m3/s
20
B&C 1.9 - Demanda:
Histograma(s)
13 intervalos 10 intervalos 0 2 4 6 8 10 12 150 450 750 1050 1350 1650 1950 0 2 4 6 8 10 12 200 600 1000 1400 1800 Mais n = 44 k = 1 + 3,3 log n (Sturges, 1926) 8 intervalos 7 intervalos 0 2 4 6 8 10 12 300 600 900 1200 1500 1800 2100 Mai s 0 2 4 6 8 10 12 250 500 750 1000 1250 1500 1750 2000 Mais k = 6,4B&C 1.9 - Demanda:
estimação de probabilidades
Freqüências acumuladas 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 500 1000 1500 2000Vazões máximas anuais (m3/s)
Fr e qüê nc ia 550 200
22
B&C 1.9 - Critério de decisão
Custos esperados H2=4,5 m C=550 m3/s 0,045 1-0,045 = 0,955 0,273 1-0,273 = 0,727 H1=3 m C=200 m3/s $44.236 $40.418 MELHOR DECISÃO $ 15.600 $ 45.600 $ 18.600 Nó de decisão $ 48.600
Conveniência de um modelo
Freqüências acumuladas 0,000 0,200 0,400 0,600 0,800 1,000 0 1000 2000 3000Vazões máximas anuais (m3/s)
Fr eqüênc ia Modelo de extremos tipo I Resistência de um solo 0 5 10 15 20 25 30 35 40 0 50 100 150 200 250 s (kPa) t (k P a) Modelo linear Mohr-Coulomb
24
Estimação de probabilidades com
modelo
Freqüências acumuladas 0,000 0,200 0,400 0,600 0,800 1,000 0 500 1000 1500 2000 2500Vazões máximas anuais (m3/s)
Fr e qüê nc ia 550 200
25
B&C 1.9 - Impacto do modelo na
decisão
Custos esperados H2=4,5 m C=550 m3/s 0,016 1-0,016 = 0,984 0,225 1-0,225 = 0,775 H1=3 m C=200 m3/s $45.119 $41.865 MELHOR DECISÃO $ 15.600 $ 45.600 $ 18.600 Nó de decisão26
B&C 1.9 - Influência do tempo?
Série histórica de vazões
R2 = 0,0002 0 500 1000 1500 2000 1910 1920 1930 1940 1950 1960 1970 Ano Vaz õ e s ( m 3 /s ) Máximas anuais
• Tempo de exposição ao perigo
Para a terceira aula (14/10/99)
• Rever
– Capítulo 1 do B&C
• Estudar
– Capítulo 2 do B&C até a pág. 100
• Resolver
– Exercícios 2.4 e 2.9 do B&C
28
Terceira aula (14/10/99)
• Fontes de incerteza
• Eventos aleatórios
• Relações entre eventos
• Axiomas da Teoria das Probabilidades
• Probabilidade condicional
• Independência
Fontes de incerteza
• Variabilidade natural (intrínseca)
• Desconhecimento de todas as causas e
efeitos (de modelo)
– y = f (x1, x2, x3, ..., xi-1, xi, xi+1, xi+2, ..., xn ) função determinista aleatoriedade
30
Espaço amostral
• Espaço amostral: conjunto S de todos os
possíveis resultados de um experimento
• Ponto amostral: ponto associado a um e um
só resultado de um experimento
• Evento: conjunto de pontos amostrais no
espaço amostral S de um experimento
Tipos de espaço amostral
• Definições operacionais (e seu refinamento)
dependem da aplicação específica
• Espaços amostrais discretos (“estado” do
semáforo em um cruzamento)
• Espaços amostrais contínuos (comprimento
de onda da luz emitida por cada uma das
lentes do semáforo)
• Variáveis aleatórias são funções definidas
no espaço amostral do experimento
32
Tipos de eventos
• Simples – SPT = 10 • Compostos – SPT ≤ 5 • Complementares – A: SPT ≤ 5 – AC: SPT > 5 A AC A ∪ AC = S SRelações entre eventos
• Mutuamente exclusivos: A ∩ B = ∅
– A: SPT > 10 – B: SPT < 5• Coletivamente exaustivos: A ∪ B = S
– A: SPT < 10 – B: SPT > 5 A B A B34
Partição de um espaço amostral
• Eventos mutuamente exclusivos e
coletivamente exaustivos:
– Ai ∩ Aj = ∅ para quaisquer i e j – ∪ Ai = S para todos os i A1 An AiAxiomas da Teoria das
Probabilidades
• A e B: eventos • S: espaço amostral • P[E] = probabilidade do evento E • 1 ≥ P[A] ≥ 0 • P[S] = 1 • P[A∪B] = P[A] + P[B] se A∩B = ∅36
Probabilidade da união
• P[A] = P[A ∩ B] + P[Ao] P[B] = P[A ∩ B] + P[Bo]
A
B
A ∩ B
Ao
Bo
• P[A ∪ B] = P[Ao] + P[A ∩ B] + P[Bo]
• P[A ∪ B] = P[A] - P[A ∩ B] + P[A ∩ B] + P[B] - P[A ∩ B]
Probabilidade condicional
• P[A | B] = P[A ∩ B] / P[B] A B A ∩ B Ao Bo • P[A] = 0,4 (= 4/10) • P[B] = 0,5 (= 5/10) • P[A ∩ B] = 0,1 (=1/10) • P[S] = 1 (=10/10) • B ocorreu ∴ P[B] = 1 (B≡S) • P[B] = 5/5 = 1 • P[A | B] = 1/5 = 0,238
Independência
• P[A | B] = P[A] A B A ∩ B Ao Bo • P[A | B] = P[A ∩ B] / P[B] • P[A | B] = P[A] • P[A ∩ B] = P[A] . P[B]Teorema de Bayes
• P[A | B] = P[A ∩ B] / P[B] • P[B | A] = P[B ∩ A] / P[A] – P[A ∩ B] = P[B ∩ A] • P[A | B] . P[B] = P[B | A] . P[A] • P[A | B] = P[A] . P[B | A] / P[B]• P[estado | amostra] = P[estado] . P[amostra | estado] P[amostra]
40
Para a quarta aula (21/10/99)
• Rever
– Capítulo 1 do B&C
– Capítulo 2 do B&C até a pág. 100
• Estudar
– Capítulo 2 do B&C até a pág. 134
• Resolver
Quarta aula (21/10/99)
• Teorema da probabilidade total
• Teorema de Bayes
• Modelos probabilistas
42
Teorema da probabilidade total
• A
j: partição do espaço amostral
• P[B] = Σ P[B ∩ A
j]
• P[B ∩ A
j] = P[B | A
j] . P[A
j]
• P[B] = Σ P[B | A
j] . P[A
j]
A1 An Aj B B ∩ AjB&C pág. 65 - Informações
anteriores
Estado
(resistência)
Probabilidades
anteriores
20
0,3
30
0,6
40
0,1
44
B&C pág. 65 - Qualidade do
ensaio
Estado
Amostras
20
30
40
z
10,7
0,2
0,0
z
20,3
0,6
0,3
z
30,0
0,2
0,7
1,0
1,0
1,0
B&C pág. 65 - Ensaios de
diferentes qualidades
Estado Amostras 20 30 40 z1 0,7 0,2 0,0 z2 0,3 0,6 0,3 z3 0,0 0,2 0,7 1,0 1,0 1,0 Estado Amostras 20 30 40 z1 1,0 0,0 0,0 z2 0,0 1,0 0,0 z3 0,0 0,0 1,0 1,0 1,0 1,0 Ensaio imperfeito Ensaio perfeito46
B&C pág. 65 - Atualização
• P[estado | amostra] = P[estado] . P[amostra | estado]
(Teorema de Bayes) P[amostra]
• P[E
j| z
i] = P[E
j] . P[z
i| E
j] / P[z
i]
• P[z
i] = ?
• P[B] = Σ P[B | A
j] . P[A
j]
para todos os j
(Teorema da probabilidade total)
B&C pág. 65
48
Variáveis aleatórias
• Variável aleatória: função definida no
espaço amostral
• 1 ponto amostral (evento simples) ⇒
⇒ um valor da variável aleatória
• Escolhas “naturais”
• Descrição do comportamento da variável:
lei probabilista
Distribuições de variáveis
aleatórias discretas
• Função probabilidade (variável discreta)
• Função distribuição (discreta)
• Propriedades dessas funções (decorrentes
dos axiomas da Teoria das Probabilidades)
• Histograma vs. Função probabilidade
• Curva de freqüências acumuladas vs.
função distribuição
50
Distribuições de variáveis
aleatórias contínuas
• Função densidade de probabilidade
(variável contínua)
• Função distribuição (contínua)
• Propriedades dessas funções (decorrentes
dos axiomas da Teoria das Probabilidades)
Distribuições conjuntas
0 1 2 3 4 5 0 45 90 135 180 225 270 315 28 15,5 5,5 28 21,5 15,5 10 5,5 1,552
Outras distribuições associadas às
distribuições conjuntas
• Distribuições marginais
Para a quinta aula (28/10/99)
• Rever
– Capítulo 1 do B&C
– Capítulo 2 do B&C até a pág. 134
• Estudar
– Capítulo 2 do B&C até o final
• Resolver
– Exercício 2.40 – Exercício 2.32 – Exercício 2.36c
54
Quinta aula (28/10/99)
• Distribuições de variáveis (discretas e
contínuas)
• Média, variância e coeficiente de variação
das distribuições
• Distribuições derivadas
– Método direto
– Simulação (Monte Carlo, por exemplo) – Método dos momentos
Para a quinta aula (4/11/99)
• Rever
– Capítulo 2 do B&C até a pág. 134
• Estudar
– Capítulo 2 do B&C até o final
• Resolver
– Exercício 2.10 – Exercício 2.32 – Exercício 2.36c
56
Sexta aula (4/11/99)
• Média, variância e coeficiente de variação
das distribuições
• Distribuições derivadas
– Método direto
– Simulação (Monte Carlo, por exemplo) – Método dos momentos
Para a sétima aula (11/11/99)
• Rever e estudar
• Capítulo 2 do B&C até o final
• Resolver
– Exercício 2.43 – Exercício 2.47 – Exercício 2.50
58
Décima aula (2/12/99)
• Amostragem
• Estimação
– Método dos momentos
– Método da máxima verossimilhança
• Estimativas vs. estimadores
• Propriedades dos estimadores
– tendência – eficiência – consistência
Amostragem aleatória
• Amostra simples de magnitude n
– simples ⇒ aleatória, cada observação é independente de todas as outras
– magnitude n ⇒ n observações: x1, x2, x3, ..., xn
60
Momentos da amostra
(
)
n
1
x
x
s
n
1
x
x
2 n 1 i i 2 X n 1 i i⋅
−
=
⋅
=
∑
∑
= = • Média amostral (medida de tendência central) • Variância amostral (medida de dispersão)Momentos da população (modelo)
dx
).
x
(
f.
)
m
x
(
dx
).
x
(
f.
x
m
X 2 X 2 X X X∫
∫
∞ ∞ − ∞ ∞ −−
=
σ
=
• Média (medida de tendência central) • Variância (medida de dispersão)62
Exemplo 1: População Normal (Gauss)
2 2 2 2 ) m x ( 2 1 2 X ) m x ( 2 1 X 2 2 2 X X b ) a x ( 2 1 X e 2 1 ) x ( f e 2 . 1 ) x ( f b m a m e 2 . b 1 ) x ( f σ − ⋅ − σ − − − − ⋅ πσ = ⋅ π σ = σ = = σ = = ⋅ π =
X
~
N
(
a
,
b
)
)
,
m
(
N
~
X
σ
)
,
m
(
N
~
X
σ
2Resistência de um material dúctil =
soma das resistências de cada uma das fibras (Teorema do Limite Central)
• Dois
parâmetros
– a, b ou – m, σ ou – m, σ2
Exemplo 2: População Exponencial
2 2 T T t T1
1
m
e
.
)
t
(
f
λ
=
σ
λ
=
λ
=
λT
~
EX
(
λ
)
Tempo entre carros sucessivos
Passagem de carros segue modelo Poisson (vide item 3.2 do B&C)
• Um único parâmetro
64
Estimação: método dos momentos
.
etc
s
ˆ
x
m
ˆ
2 X 2 X X=
σ
=
• Igualar momentos da amostra aos correspondentes da
população (tantos quantos forem os parâmetros do modelo probabilista)
• Deduzir estimativas dos parâmetros (resolver m equações a m incógnitas; m = número de parâmetros do modelo) ... ˆ ... bˆ ... aˆ = λ = = ... ˆ ... ˆ ... mˆ 2 = λ = σ = ou
Estimação: exemplo 1 (Normal)
• Igualar momentos da amostra aos correspondentes da
população (tantos quantos forem os parâmetros do modelo probabilista)
• Deduzir estimativas dos parâmetros (resolver m equações a m incógnitas; m = número de parâmetros do modelo) 2 X 2 X X
s
ˆ
x
m
ˆ
=
σ
=
2 X X X s ˆ ˆ bˆ x mˆ mˆ aˆ = σ = σ = = = =66
Estimação: exemplo 2 (exponencial)
• Igualar momentos da amostra aos correspondentes da
população (tantos quantos forem os parâmetros do modelo probabilista)
• Deduzir estimativas dos parâmetros (resolver m equações a m incógnitas; m = número de parâmetros do modelo)
t
m
ˆ
T=
t 1 mˆ 1 ˆ T = = λEstimativas vs. estimadores
• Estimativas – valores – constantes – após a amostragem ( x1, x2, x3, ..., xn) • Estimadores – regras – variáveis aleatórias – antes da amostragem propriamente dita (X1, X2, X3, ..., Xn) Xs
x
XS
X
68
Para a décima primeira aula
(9/12/99)
• Continuar folheando o cap. 3 do B&C
• Rever e estudar
• Capítulo 4 do B&C até a página 396
• Resolver
– Exercício 4.18 – Exercício 4.41 – Exercício 4.42
Décima primeira aula (9/12/99)
• Estimação clássica
• Estimação bayesiana
70
Estimação
• Estimação clássica
– Estimação pontual
• Método dos momentos
• Método da máxima verossimilhança
– Estimação por intervalos
• Intervalo de confiança • Teste de hipótese
Estimadores da variância
2 n 1 i 2 i 2 2 2 n 1 i 2 i n 1 i n 1 i 2 n 1 i i 2 i n 1 i 2 i 2 i n 1 i 2 i 2 X X n 1 S X X 2 X n 1 X n 1 X X n 2 X n 1 ) X X X 2 X ( n 1 ) X X ( n 1 S − ⋅ = = + ⋅ − ⋅ = = ⋅ + ⋅ ⋅ − ⋅ = = + − ⋅ = = − ⋅ =∑
∑
∑
∑
∑
∑
∑
= = = = = = = 2 n 2 i 2 * n 1 i 2 i 2 * X X 1 n 1 S ) X X ( 1 n 1 S − ⋅ − = = − ⋅ − =∑
∑
=72
Estimadores tendenciosos
[ ]
[ ]
[ ]
[ ] [ ]
(
)
(
[ ] [ ]
)
(
)
[ ]
2 X 2 2 X 2 X 2 X 2 X 2 X 2 X n 1 i 2 X 2 X 2 n 1 i 2 i i 2 n 1 i 2 i 2 n 1 n S E m n m m n m n 1 X E X Var X E X Var n 1 X E X E n 1 S E σ − = = + σ − + σ = = + σ − + σ ⋅ = = + − + ⋅ = = − ⋅ =∑
∑
∑
= = =[ ]
2 X 2 * n 1 i 2 i 2 * S E ) X X ( 1 n 1 S σ = − ⋅ − =∑
=Distribuições de estimadores
(distribuições amostrais)
• Estimador de m
X: (média
amostral)
– média do estimador: mX
– desvio padrão do estimador: σX/n
– distribuição do estimador: Normal (teorema do limite central) X mˆ X =
)
n
/
,
m
(
N
~
m
ˆ
)
n
/
,
m
(
N
~
X
X X X X Xσ
σ
74
Estimação por intervalos
Intervalo de confiança
• Utilizar distribuição amostral
– escrever desigualdade probabilista
– rearranjar a desigualdade para isolar o parâmetro de interesse
– substituir na desigualdade o valor observado da estatística da amostra
Estimação por intervalos
Teste de hipótese
• Utilizar distribuição amostral
• Construir intervalo de confiança
• Nível do teste é a probabilidade do evento
complementar ao intervalo de confiança
76
Estimadores de máxima
verossimilhança
∑ λ = λ λ = λ λ = σ λ = λ = = λ − λ λ − n 1 i i t n n 2 1 t T 2 2 T T t T e . ) t ,..., t , t | ( L e . ) | t ( f 1 1 m e . ) t ( fPara a décima segunda aula
(16/12/99)
• Prova final de 2 horas, sem consulta
• Rever
– Capítulo 1 do B&C – Capítulo 2 do B&C
– Capítulo 4 do B&C até a página 396
• Folhear
– Capítulo 3 do B&C
• Resolver (ou rever)
– Todos os exercícios propostos