2
2020/2021 Fundamentos de Estatística M1020 130 Neste 2º capítulo iremos afastar-nos da estatística descri-tiva e iremos focar-nos num novo tópico: a teoria das
probabilidades, que, como veremos mais tarde, desem-penha um papel fundamental na estatística inferencial.
Uma vez que esta matéria é lecionada com profundidade no 12º ano, este capítulo consistirá basicamente de uma revisão de conceitos já conhecidos.
Uma probabilidade é um valor numérico entre 0 e 1 (muitas vezes expresso em forma de percentagem) que quantifica a possibilidade de ocorrência de um acontecimento A.
Quanto mais provável A, mais próximo o número P(A) é de um; e quanto mais improvável A, mais próximo P(A) é de zero. Um acontecimento que não pode ocorrer tem uma probabilidade igual a zero, e um acontecimento que
certamente ocorrerá tem uma probabilidade igual a um. Escreve-se P(A) para designar a probabilidade de ocorrên-cia do acontecimento A.
2020/2021 Fundamentos de Estatística M1020
Uma experiência aleatória é uma experiência que produz resultados observáveis e tal que:
1. conhecemos todos os seus possíveis resultados;
2. cada vez que é efetuada não se conhece antecipada-mente qual dos resultados possíveis vai ocorrer;
3. pode ser repetida em condições análogas. Experiência Aleatória
132
Espaço Amostral ou Espaço de Resultados
O espaço amostral ou espaço de resultados é o conjunto formado por todos os resultados possíveis de uma expe-riência aleatória e denota-se pela letra Ω.
Exemplo 1
Experiência aleatória: Lançamento de um dado e registo dos pontos obtidos
Espaço amostral: Ω={1,2,3,4,5,6}
Exemplo 2
Experiência aleatória: Seleção aleatória de um indivíduo e registo do seu grupo sanguíneo
Espaço amostral: Ω={O, A, B, AB}
Exemplo 3
Experiência aleatória: Lançamento de uma moeda até sair cara e registo do número de lançamentos efetuados
2020/2021 Fundamentos de Estatística M1020 Acontecimento
Um acontecimento associado a uma experiência aleatória é um subconjunto do espaço de resultados Ω associado a essa experiência.
Ω acontecimento certo
134
acontecimento impossível ∅
Exemplo Lançamento de um dado e registo de pontos. espaço de resultados Ω={1,2,3,4,5,6}
acontecimento A: “sair número par” A={2,4,6} acontecimento B: “sair número maior que 7” B=∅ acontecimento C: “sair número inferior a 7” C= Ω
Sendo os acontecimentos identificados com conjuntos, as operações entre eles são as operações naturais da teoria de conjuntos.
2020/2021 Fundamentos de Estatística M1020
Teoria de Conjuntos (operações/diagramas de Venn)
136
Leis de De Morgan
A
∪B =A ∩B
Dois acontecimentos A e B dizem-se mutuamente exclusivos ou incompatíveis se não puderem ocorrer simultaneamente. Acontecimentos Incompatíveis
A ∩B = ∅
Exemplo
No lançamento de um dado, os acontecimentos “sair número par” e “sair número ímpar” são incompatíveis.
A = {2,4,6}
2020/2021 Fundamentos de Estatística M1020
Probabilidade (diversas interpretações)
O conceito de probabilidade é um conceito antigo que tem tido ao longo do tempo diversas interpretações
1. Interpretação de Laplace (1749-1827) DEFINIÇÃO CLÁSSICA
2. Interpretação frequencista DEFINIÇÃO FREQUENCISTA
3. Axiomática de Kolmogorov (1903-1987)
1. Interpretação de Laplace (DEFINIÇÃO CLÁSSICA)
Suponha-se que numa experiência aleatória se podem produzir m resultados, igualmente possíveis.
Se exatamente k destes m resultados conduzem à
realização de um determinado acontecimento A, define-se de forma clássica, a probabilidade do acontecimento
A como:
k número de casos favoráveis m número de casos possíveis
(1812)
P(A) = k m
2020/2021 Fundamentos de Estatística M1020 140
Exemplo
Num laboratório são mantidas 85 moscas da fruta
Drosophila melanogaster, sendo 24 delas pretas em
consequência de uma mutação, e as restantes com cor normal cinza. Suponha que uma mosca dessas é esco-lhida aleatoriamente. Qual a probabilidade de que seja preta?
A definição clássica de probabilidade suscitou sempre severas críticas em virtude do seguinte:
Ela assume que os resultados são igualmente possíveis. A designação igualmente possível é análoga à palavra pro-babilidade. Assim a definição tem uma autoreferência, é circular.
Esta definição não se aplica quando os resultados não forem igualmente possíveis. Nem no caso do espaço de resultados ser infinito, ou quando é difícil contar os casos possíveis e favoráveis.
Por exemplo, qual a probabilidade de se pescar um peixe com mais de 1kg num certo lago?
2020/2021 Fundamentos de Estatística M1020
A interpretação frequencista da probabilidade fornece uma ligação entre a probabilidade e o mundo real relacionando a probabilidade de um acontecimento com uma quantida-de mensurável, a saber, a frequência relativa a longo prazo da ocorrência desse acontecimento.
2. Interpretação frequencista (DEFINIÇÃO FREQUENCISTA)
Suponha-se que uma experiência aleatória é repetida n vezes e que um determinado acontecimento A se realizou
mn vezes durante essas n experiências.
mn n
A frequência relativa de ocorrência do acontecimento A é:
Quando n é grande probabilidade de ocorrência do acon-tecimento A é :
P(A) ≈ mn
2020/2021 Fundamentos de Estatística M1020 Experiência de Kerrich ( 1946 )
nº de lançamentos frequência relativa de caras
Na experiência de Kerrich a frequência relativa tende para um valor próximo de 1/2, mas a probabilidade do acontecimento “sair cara” não é conhecida.
O limite das frequências relativas, que é uma probabilida-de, é desconhecido.
O valor da frequência relativa obtido através da realização de n experiências, permite-nos apenas estimar essa proba-bilidade. E a estimativa é tanto melhor quanto maior o nú-mero de experiências.
Só se aplica se a experiência for repetível.
Fornece apenas uma estimativa da probabilidade. Limitações da interpretação frequencista:
2020/2021 Fundamentos de Estatística M1020 Qual a interpretação?
“Bebés nascidos por cesariana têm maior probabilidade de ser obesos.” Sic Notícias, 07.09.2016
“…Ou seja, com 23 pessoas na sala é mais provável que haja pelo menos duas que façam anos no mesmo dia do que todas o façam em dias diferentes.” Jornal Expresso, 11.07.2009
146
“ Quer ganhar o Euromilhões? É mais provável ter gémeos siameses.” Observador, 23.10.2014
3. Axiomática de Kolmogorov (1933)
Uma probabilidade é uma função P(·) tomando valores reais e definida no espaço dos acontecimentos E de uma experiência aleatória, que satisfaz as seguintes condições:
Axioma1 P(A) ≥ 0 ∀A ∈ E Axioma2 P(Ω) = 1
Axioma3
Se A1,A2,... são acontecimentos em número finito ou infinito numerável, tais que Ai ∩ Aj = ∅ para i ≠ j, então
2020/2021 Fundamentos de Estatística M1020
A partir destes axiomas pode-se provar um grande número de propriedades de uma função de probabilidade.
Algumas propriedades P(A) = 1−P(A) 1. P(∅) = 0 2. 0 ≤ P(A) ≤ 1 3.
P(A ∪B) = P(A) +P(B) −P(A ∩B)
4. REGRA DA ADIÇÃO
P(A ∩B) = P(A) −P(A ∩B)
5.
Exemplo
Em certa população, 9.8% das pessoas compram a revista A, 22.9% a revista B e 5.1% adquirem as duas revistas. Esco-lhida ao acaso uma pessoa, qual a probabilidade dela
A (B): acontecimento “adquirir a revista A (B)”
P(A)=0.098 P(B)=0.229 P(A ∩B) = 0.051
a) adquirir pelo menos uma daquelas revistas? b) adquirir somente a revista A ?
c) não adquirir nem A nem B ?
2020/2021 Fundamentos de Estatística M1020
Exemplo (cont.)
a) P(A ∪B) = P(A) +P(B) −P(A ∩B) = 0.276 b) P(A ∩B) = P(A) −P(A ∩B) = 0.047
c) P(A ∩B) = P A ∪B
(
)
=1−P(A ∪B) = 1− 0.276 = 0.724150
Como levar em conta no cálculo de probabilidades o facto de a ocorrência de um acontecimento poder afetar a probabilidade de outros acontecimentos ocorrerem?
Probabilidade Condicional
Sejam A e B dois acontecimentos com P(B) > 0. A proba-bilidade condicional da ocorrência de A dado que B
ocorreu é definida por
P(A |B) = P(A ∩B)
P(B)
2020/2021 Fundamentos de Estatística M1020
Num estudo sobre sobre a distribuição dos grupos san-guíneos numa certa população, foram observados os valores seguintes numa amostra aleatória:
Exemplo
HOMENS MULHERES TOTAL
A 50 50 100
B 93 89 182
AB 14 30 44
O 79 76 155
Selecionada uma destas pessoas ao acaso, qual a probabi-lidade de
a) ter sangue do tipo AB?
b) ter sangue do tipo AB sabendo que se trata de um homem ?
HOMENS MULHERES TOTAL A 50 50 100 B 93 89 182 AB 14 30 44 O 79 76 155 TOTAL 236 245 481
AB: ter sangue do tipo AB H: ser um homem
a) 𝑃 𝐴𝐵 = "#%"" ≈ 0.09 b) 𝑃 𝐴𝐵 𝐻 = !&'%" ≈ 0.06 ou 𝑃 𝐴𝐵 𝐻 = ((*+∩-) ((-) = !" "#! $%& "#! = !&'%" ≈ 0.06
2020/2021 Fundamentos de Estatística M1020 Lei da Multiplicação
Da definição de probabilidade condicional resulta:
P(A ∩B) = P(B)P(A |B)
P(A ∩B) = P(A)P(B | A) ou
desde que P(B)>0 desde que P(A)>0
Acontecimentos Independentes
Dois acontecimentos A e B dizem-se independentes se o conhecimento da ocorrência de um deles não influencia a probabilidade de ocorrência do outro.
P(A ∩B) = P(A) ×P(B). Definição
2020/2021 Fundamentos de Estatística M1020
Se {A1,A2,…,An} é uma partição de Ω com P(Ai ) > 0 para todo i de 1 até n, então qualquer que seja o
acontecimento B tem-se:
P(B) = P(A1)P(B | A1) +P(A2)P(B | A2) +!+P(An)P(B | An)
156
Teorema da Probabilidade Total
Ω A1 A3 A4 A2 B
Ω A1 A3 A4 A2 B
Uma partição de um conjunto Ω é uma subdivisão de Ω em subconjuntos A1,...,An de Ω, tal que:
1) Ai ∩ Aj = ∅, ∀i ≠ j 2) Ai = Ω i=1 n
∪
Nota2020/2021 Fundamentos de Estatística M1020 158 O teorema da probabilidade total é muito importante na resolução de diversos problemas do seguinte tipo:
Um teste médico é 99% eficaz a detetar uma dada doença quando ela está de facto presente. Todavia, o teste também dá “falsos positivos” para 2% das pessoas saudáveis. Se 0.5% da população tem a doença, qual a probabilidade
Exemplo
a) de o teste dar positivo a uma pessoa escolhida ao acaso dessa população?
b) de que uma pessoa para quem o teste deu positivo tenha de facto a doença?
T
acontecimento “o teste dá positivo”D
acontecimento “a pessoa está doente”Feito o teste a uma pessoa escolhida ao acaso entre a po-pulação em causa:
𝑃 𝑇 𝐷 = 0.99 𝑃 𝑇 4𝐷 = 0.02 𝑃(𝐷) = 0.005
𝑃 𝑇 =? a)
Pelo teorema da probabilidade total: 𝑃 𝑇 = 𝑃 𝐷 𝑃 𝑇 𝐷 + 𝑃(4𝐷)𝑃 𝑇 4𝐷
2020/2021 Fundamentos de Estatística M1020 160 Regra da multiplicação: 𝑃 𝐷|𝑇 =? b) 𝑃 𝐷 𝑇 = 𝑃(𝐷 ∩ 𝑇) 𝑃(𝑇) 𝑃 𝐷 ∩ 𝑇 = 𝑃(𝐷) ; 𝑃(𝑇|𝐷) = 0.005 ; 0.99 = 0.00495 Teor.probabilidade total: 𝑃 𝑇 = 0.02485 𝑃 𝐷 𝑇 = 0.00495 0.02485 ≈ 0.20
Árvores de probabilidades
Os diagramas de árvore são um recurso útil no cálculo de probabilidades. Uma árvore de probabilidades fornece uma maneira conveniente de dividir um problema em partes e organizar a informação disponível. Os exemplos a seguir ilustram esta ideia.
2020/2021 Fundamentos de Estatística M1020 162
Exemplo
Qual a probabilidade p de em dois lançamentos de uma moeda equilibrada se obter exatamente uma cara?
cara coroa 0.5 0.5 cara coroa 0.5 0.5 cara coroa 0.5 0.5 p=0.5x0.5+0.5x0.5=0.5
De um modo geral 𝐴 ̅ 𝐴 p 1-p 𝐷 4 𝐷 k 1-k 𝐷 4 𝐷 k=𝑃(𝐷|𝐴) p=𝑃(𝐴)
2020/2021 Fundamentos de Estatística M1020 164 Um teste médico é 99% eficaz a detetar uma dada doença quando ela está de facto presente. Todavia, o teste também dá “falsos positivos” para 2% das pessoas saudáveis. Se 0.5% da população tem a doença, feito o teste a uma pessoa escolhida ao acaso entre a população em causa, qual a probabilidade de o teste dar positivo?
Exemplo 0.005 0.995 0.99 0.01 0.02 0.98 𝐷 4 𝐷 𝑇 B𝑇 𝑇 B𝑇
T
: “o teste dá positivo”D
: “a pessoa está doente”P(
T
)=0.005x0.99+0.995x0.02=0.02485 0.005 0.995 0.99 0.01 0.02 0.98 𝐷 4 𝐷 𝑇 B𝑇 𝑇 B𝑇2020/2021 Fundamentos de Estatística M1020 166 Tabelas de dupla entrada
Podem ser usadas também tabelas de dupla entrada no cálculo de probabilidades. Uma tabela de dupla entrada fornece uma maneira conveniente de organizar a informação disponível. O exemplo a seguir ilustra esta ideia.
Um teste médico é 99% eficaz a detetar uma dada doença quando ela está de facto presente. Todavia, o teste também dá “falsos positivos” para 2% das pessoas saudáveis. Se 0.5% da população tem a doença, feito o teste a uma pessoa escolhida ao acaso entre a população em causa, qual a probabilidade de o teste dar positivo?
Exemplo
T : “o teste dá positivo” D : “a pessoa está doente”
𝐷 (doente) 𝐷" (saudável) 𝑇 (teste positivo) $𝑇 (teste negativo) 0.005 0.995 0.99×0.005 0.01×0.005 0.02×0.995 0.98×0.995 P(