• Nenhum resultado encontrado

Probabilidades e Estatística

N/A
N/A
Protected

Academic year: 2021

Share "Probabilidades e Estatística"

Copied!
238
0
0

Texto

(1)

PROBABILIDADES E ESTAT´ISTICA

ISABEL NAT ´

ARIO

Departmento de Matem´atica, Faculdade de Ciˆencias e Tecnologia, Universidade Nova de Lisboa, 2829-516, Caparica, Portugal

Especial agradecimento `a Profa

F´atima Migu´ens por contribui¸c˜oes v´arias

Notas produzidas no ˆambito da disciplina

de Probabilidades e Estat´ıstica para os cursos de Engenharia

Qualquer gralha ou incorrec¸c˜ao encontrada agradece-se que seja reportada `a autora

[email protected]

(2)
(3)

Conte´

udo

1 Estat´ıstica Descritiva 4

1.1 Introdu¸c˜ao . . . 4

1.2 Distribui¸c˜oes de frequˆencia e representa¸c˜ao gr´afica de dados . . . 5

1.3 Medidas descritivas . . . 8 1.3.1 Medidas de localiza¸c˜ao . . . 8 1.3.2 Medidas de dispers˜ao . . . 10 1.3.3 Medidas de forma . . . 10 1.4 Diagrama de caixa-e-bigodes . . . 12 1.5 Exerc´ıcios Propostos . . . 13

2 Teoria das Probabilidades 16 2.1 Introdu¸c˜ao . . . 16

2.2 Espa¸co amostral . . . 17

2.3 Axiom´atica das probabilidades . . . 18

2.4 T´ecnicas de contagem para espa¸cos amostrais finitos . . . 22

2.5 Probabilidade condicionada e Teorema de Bayes . . . 23

2.6 Independˆencia entre acontecimentos . . . 26

2.7 Exerc´ıcios Propostos . . . 26

3 Vari´aveis aleat´orias 34 3.1 Defini¸c˜ao . . . 34

3.2 Fun¸c˜ao distribui¸c˜ao . . . 35

3.3 Vari´aveis aleat´orias discretas . . . 36

3.4 Vari´aveis aleat´orias cont´ınuas . . . 37

3.5 Exerc´ıcios Propostos . . . 38

4 Momentos e outros parˆametros de uma distribui¸c˜ao de probabilidade 42 4.1 Momentos de uma distribui¸c˜ao . . . 42

4.2 Parˆametros descritivos das distribui¸c˜oes . . . 45

4.3 Exerc´ıcios Propostos . . . 47

5 Vectores aleat´orios 51 5.1 Par aleat´orio discreto . . . 51

5.2 Par aleat´orio cont´ınuo‡ . . . . 55

5.3 Independˆencia entre vari´aveis aleat´orias . . . 56

5.4 Momentos de vectores aleat´orios . . . 58

5.5 Exerc´ıcios Propostos . . . 60

(4)

6 Distribui¸c˜oes especiais 68

6.1 Algumas distribui¸c˜oes discretas . . . 68

6.1.1 Distribui¸c˜ao Uniforme Discreta . . . 68

6.1.2 Distribui¸c˜ao de Bernoulli . . . 69

6.1.3 Distribui¸c˜ao Binomial . . . 70

6.1.4 Distribui¸c˜ao Hipergeom´etrica . . . 73

6.1.5 Distribui¸c˜ao Geom´etrica . . . 74

6.1.6 Distribui¸c˜ao Poisson . . . 76

6.2 Algumas distribui¸c˜oes cont´ınuas . . . 78

6.2.1 Distribui¸c˜ao Uniforme Cont´ınua . . . 78

6.2.2 Distribui¸c˜ao Exponencial . . . 80

6.2.3 Distribui¸c˜ao Normal . . . 82

6.2.4 Distribui¸c˜ao Qui-quadrado . . . 84

6.2.5 Distribui¸c˜ao T de Student . . . 86

6.3 Exerc´ıcios Propostos . . . 87

7 Teorema Limite Central 96 7.1 Teorema Limite Central . . . 96

7.2 Exerc´ıcios Propostos . . . 99

8 Inferˆencia Estat´ıstica. Estima¸c˜ao Pontual. Distribui¸c˜oes por Amostragem. 101 8.1 Popula¸c˜oes, amostras aleat´orias e estat´ısticas . . . 101

8.2 Estima¸c˜ao pontual . . . 103

8.3 M´etodos de Obten¸c˜ao de Estimadores‡ . . . 104

8.3.1 M´etodos dos Momentos . . . 105

8.3.2 M´etodo da M´axima Verosimilhan¸ca . . . 105

8.4 Algumas Propriedades dos Estimadores . . . 107

8.5 Distribui¸c˜oes por amostragem . . . 110

8.5.1 Distribui¸c˜oes por amostragem da m´edia amostral, ¯X . . . 111

8.5.2 Distribui¸c˜ao por amostragem para a diferen¸ca de m´edias amostrais, ¯X1− ¯X2 . 112 8.5.3 Distribui¸c˜ao por amostragem da propor¸c˜ao, P . . . 112

8.5.4 Distribui¸c˜ao por amostragem da variˆancia amostral, S2 . . . 113

8.6 Exerc´ıcios Propostos . . . 113

9 Intervalos de Confian¸ca 117 9.1 Intervalos de Confian¸ca . . . 117

9.2 Intervalos de Confian¸ca para a m´edia populacional, µ . . . 120

9.2.1 Popula¸c˜ao Normal com variˆancia conhecida . . . 120

9.2.2 Popula¸c˜ao Normal com variˆancia desconhecida . . . 121

9.2.3 Popula¸c˜ao Normal com variˆancia desconhecida e n > 30 . . . 121

9.2.4 Popula¸c˜ao desconhecida com variˆancia conhecida e n > 30 . . . 122

9.2.5 Popula¸c˜ao desconhecida com variˆancia desconhecida e n > 30 . . . 123

9.3 Intervalo de Confian¸ca para a diferen¸ca de m´edias populacionais, µ1− µ2 . . . 123

9.4 Intervalo de Confian¸ca para propor¸c˜ao populacional, p . . . 124

9.5 Intervalo de Confian¸ca para a variˆancia populacional, σ2, e para o desvio padr˜ao pop-ulacional, σ . . . 125

(5)

Probabilidades e Estat´ıstica Isabel Nat´ario 3

10Testes de Hip´oteses 131

10.1 Testes de Hip´oteses . . . 131

10.2 Testes de hip´oteses para a m´edia populacional, µ . . . 133

10.2.1 Popula¸c˜ao Normal(µ, σ2), σ2 conhecido . . . 133

10.2.2 Popula¸c˜ao Normal(µ, σ2), σ2 desconhecido . . . 139

10.2.3 Popula¸c˜ao Normal(µ, σ2), σ2 desconhecido, n > 30 . . . 141

10.2.4 Popula¸c˜ao desconhecida com σ2 conhecido e n > 30 . . . 144

10.2.5 Popula¸c˜ao desconhecida com σ2 desconhecido e n > 30 . . . 146

10.3 Teste de hip´oteses para a igualdade entre m´edias populacionais, µ1= µ2, de popula¸c˜oes Normais com variˆancias conhecidas . . . 149

10.4 Testes de hip´oteses para a propor¸c˜ao p de uma popula¸c˜ao . . . 151

10.5 Testes de hip´oteses para a variˆancia σ2de uma popula¸c˜ao Normal com m´edia desconhecida155 10.6 Testes de hip´oteses para o pressuposto da normalidade de uma popula¸c˜ao . . . 159

10.7 Exerc´ıcios Propostos . . . 163

11Regress˜ao Linear Simples 169 11.1 Regress˜ao Linear Simples . . . 169

11.2 Estimadores dos M´ınimos Quadrados dos Parˆametros de Regress˜ao . . . 170

11.3 Qualidade do Ajuste e Estima¸c˜ao de σ2 . . . 171

11.4 Distribui¸c˜ao dos Estimadores ˆβ0 e ˆβ1 . . . 172

11.4.1 Distribui¸c˜ao de ˆβ1 . . . 172

11.4.2 Distribui¸c˜ao de ˆβ0 . . . 173

11.5 Intervalos de Confian¸ca e Testes de Hip´oteses para os Parˆametros de Regress˜ao . . . . 174

11.5.1 Intervalos de Confian¸ca e Testes de Hip´oteses para β1 . . . 175

11.5.2 Intervalos de Confian¸ca e Testes de Hip´oteses para β0 . . . 176

11.6 Intervalos de Confian¸ca e Testes de Hip´oteses para a Recta de Regress˜ao ou Resposta M´edia . . . 177

11.7 Predi¸c˜ao . . . 178

11.8 Um exemplo . . . 178

11.9 Exerc´ıcios Propostos . . . 181

12Exerc´ıcios variados 186

13Solu¸c˜oes dos exerc´ıcios propostos 198

14Formul´ario 231

15Tabelas 233

(6)

Estat´ıstica Descritiva

1.1

Introdu¸c˜

ao

Neste cap´ıtulo come¸camos por rever conceitos de estat´ıstica descritiva. A estat´ıstica descritiva tem por objectivo descrever, resumir e representar a informa¸c˜ao contida num conjunto de dados, atrav´es da constru¸c˜ao de tabelas e gr´aficos ou atrav´es da determina¸c˜ao de medidas num´ericas que adequadamente sintetizem os dados.

A dificuldade do Homem em interpretar grandes conjuntos de dados ´e aqui ultrapassada pela distribui¸c˜ao dos dados em classes e pelo no c´alculo de medidas resumo que os descrevam de forma fiel.

A forma de analisar os dados depende, em primeira instˆancia, da sua natureza. Os dados num´ericos podem ser discretos, quando se referem a contagens ou n´umeros inteiros, ou cont´ınuos, quando podem tomar qualquer valor dentro de um determinado intervalo de n´umeros.

Para al´em disso os dados estat´ısticos s˜ao ainda classificados de acordo com a sua escala de medi¸c˜ao. Assim temos dados qualitativos e quantitativos. Os primeiros dizem respeito a dados cujos atrib-utos de interesse s˜ao categorias e dividem-se em dados nominais e ordinais.

Os dados nominais n˜ao s˜ao na verdade dados num´ericos, mas apenas etiquetas ou valores atribu´ıdos que designam uma classe, n˜ao havendo uma rela¸c˜ao de ordem entre as classes. Por exemplo, a situa¸c˜ao em que os dados se referem `a cor dos olhos de um conjunto de indiv´ıduos (1=preto, 2=castanho, 3=azul, 4=verde, 5=cinzento).

Os dados ordinais referem-se a dados do tipo dos nominais, com a diferen¸ca que para estes se estabelece uma rela¸c˜ao de ordem entre as classes. Por exemplo, as classifica¸c˜oes de cada aluno num determinado teste dadas por ”Mau”, ”Suficiente”e ”Muito Bom”.

Os dados quantitativos s˜ao aqueles em que a sua caracter´ıstica de interesse ´e intrinsecamente num´erica. Dividem-se em dados com escala intervalar ou com escala absoluta, residindo a distin¸c˜ao no facto de estes ´ultimos terem a si associado uma origem definida. Para decidir se determinado tipo de dados est´a em qual das escalas pergunte a si pr´oprio se o dobro do valor do que est´a a estudar corresponde ao dobro de intensidade. Por exemplo, 20oC ´e duas vezes mais quente que 10oC? A resposta ´e n˜ao e, por isso, dados deste tipo s˜ao de escala intervalar. Agora um campo com 4 hectares ´e o dobro de outro com 2 hectares? Sim, por isso temos agora dados de escala absoluta. Notamos que as t´ecnicas estat´ısticas n˜ao fazem distin¸c˜ao entre estes dois tipos de dados.

´

E exclusivamente sobre esta ´ultima classe de dados, os quantitativos, que vamos trabalhar.

(7)

Probabilidades e Estat´ıstica Isabel Nat´ario 5

1.2

Distribui¸c˜

oes de frequˆ

encia e representa¸c˜

ao gr´

afica de dados

Quando lidamos com grandes conjuntos de dados podemos obter uma boa ideia global dos mesmos se os agruparmos em classes ou intervalos disjuntos. Ao procedermos assim perdemos informa¸c˜ao mas esta perda ´e largamente compensada pelo conhecimento que ganhamos acerca da forma dos dados.

Assuma que estamos a tratar com dados cont´ınuos. No caso discreto os valores observados definem eles pr´oprios as classes a considerar.

Para escolher o n´umero de classes k a usar ´e usual aplicar-se a regra de Sturges: k ≈ 1 + log nlog 2,

onde n ´e a dimens˜ao do conjunto de dados.

Sabendo k e a amplitude total do conjunto de dados, L, dada por: L = m´aximo{dados} − m´ınimo{dados}, obt´em-se a amplitude de cada classe, l, como:

l = Lk.

Podemos ent˜ao definir os limites de cada classe e contar o n´umero de observa¸c˜oes que caiem dentro de cada uma delas, obtendo assim as frequˆencias absolutas de cada classe - fi para a classe

i, i = 1, . . . , k. Este procedimento vem facilitado se ordenarmos os dados. Notamos que: Pk

i=1fi= n

O conjunto das frequˆencias absolutas de todas as classes, eventualmente colocadas numa tabela, chama-se distribui¸c˜ao de frequˆencias.

Para o conjunto das frequˆencias absolutas obtˆem-se as chamadas frequˆencias absolutas acu-muladas de cada classe, Fi, como a soma das frequˆencias absolutas dessa classe e de todas as outras

que a precedem:

Fi =Pij=1fj

Repare que Fk = n. Ao conjunto das {Fi, i = 1, . . . , k} chama-se distribui¸c˜ao de frequˆencias

absolutas.

Obervamos que ´e usual identificar cada classe pelo seu ponto m´edio, calculado como a metade da soma dos seus extremos, e denotado aqui como P Mi para a classe i, i = 1, . . . , k.

Definem-se ainda as chamadas frequˆencias relativas de cada classe, aqui designadas por f∗ i,

como:

f∗ i = fni

Observe-se que estas frequˆencias se encontram em [0, 1] e que: Pk

(8)

Associadas a fi∗ encontram-se as correspondentes frequˆencias relativas acumuladas: F∗ i = Pi j=1fj∗ Temos que F∗

k = 1. Ao conjunto das frequˆencias relativas chama-se distribui¸c˜ao de frequˆencias

relativas e ao conjunto das frequˆencias relativas acumuladas chama-se distribui¸c˜ao de frequˆencias relativas acumuladas.

Nota: Se depois de seleccionadas as classes se verificar que, por existirem observa¸c˜oes muito ex-tremas, surgem ”nas pontas”classes com apenas 1 ou 0 observa¸c˜oes, ´e usual agreg´a-las, obtendo as classes abertas ”menor que”e ”maior que”. Essas observa¸c˜oes que se destacam por serem muito ex-tremas, muito distantes das restantes, designam-se por outliers.

Uma vez tendo as distribui¸c˜oes de frequˆencias podemos construir v´arios dispositivos gr´aficos para as representar, j´a que uma imagem vale 1000 palavras... Assim podemos ter histogramas, pol´ıgonos de frequˆencia, pol´ıgonos de frequˆencias acumuladas representando graficamente a distribui¸c˜ao de frequˆencia dos dados, ou ainda diagramas de caixa-e-bigodes, que apresentaremos mais tarde no texto.

O histograma ´e um gr´afico de barras que se constr´oi escolhendo para abcissas os limites de cada uma das classes e para ordenadas, resultando na altura de cada uma das barras que o constitui, a frequˆencia (absoluta ou relativa) dos dados na classe correspondente.

O pol´ıgono de frequˆencias ´e obtido unindo os pontos de ordenada correspondente `a altura de cada barra e abcissa dada pelo respectivo ponto m´edio da classe. Os pol´ıgonos de frequˆencias s˜ao usualmente melhores que os histogramas para comparar a forma de duas ou mais distribui¸c˜oes de frequˆencias.

O pol´ıgono de frequˆencias acumuladas obt´em-se unindo os pontos formados por ordenadas dadas pela altura das barras do histograma e respectivas abcissas que s˜ao um dos limites da classe que lhe corresponde - caso seja o superior fala-se de distribui¸c˜ao acumulada ”acima de”; se for o inferior temos distribui¸c˜ao acumulada ”abaixo de”. A curva aqui resultante toma o nome de ogiva. ´E uma curva importante quando estamos interessados em determinar que percentagem dos dados est´a abaixo de um certo valor.

Exemplo 1.1 Seguem-se as percentagens de gordura de manteiga fornecidas por 120 vacas Ayrshire,

de 3 anos de idade, seleccionadas ao acaso de um livro de registos de gado canadiano: 4.32 4.24 4.29 4.00 3.96 4.48 3.89 4.02 3.74 4.42 4.20 3.87 4.10 4.00 4.33 3.81 4.33 4.16 3.88 4.81 4.23 4.67 3.74 4.25 4.28 4.03 4.42 4.09 4.15 4.29 4.27 4.38 4.49 4.05 3.97 4.32 4.67 4.11 4.24 5.00 4.60 4.38 3.72 3.99 4.00 4.46 4.82 3.91 4.71 3.96 3.66 4.10 4.38 4.16 3.77 4.40 4.06 4.08 3.66 4.70 3.97 3.97 4.20 4.41 4.31 3.70 3.83 4.24 4.30 4.17 3.97 4.20 4.51 3.86 4.36 4.18 4.24 4.05 4.05 3.56 3.94 3.89 4.58 3.99 4.17 3.82 3.70 4.33 4.06 3.89 4.07 3.58 3.93 4.20 3.89 4.60 4.38 4.14 4.66 3.97 4.22 3.47 3.92 4.91 3.95 4.38 4.12 4.52 4.35 3.91 4.10 4.09 4.09 4.34 4.09 4.88 4.28 3.98 3.86 4.58

(9)

Probabilidades e Estat´ıstica Isabel Nat´ario 7

Olhando para este conjunto de 120 n´umeros ´e dif´ıcil retirar algo de ´util daqui, ao contr´ario do que acontece se os dispusermos num gr´afico.

Para tal come¸camos por determinar o n´umero de classes a usar para agrupar os dados, atrav´es da regra de Sturges:

k ≈ 1 + log nlog 2 = 1 + log 120

log 2 ≈ 1 + 6.907 = 7.907 ≈ 8 classes.

Notando agora que o m´aximo do conjunto de dados ´e 5.00 e o m´ınimo ´e 3.47, temos que a amplitude dos dados vale L = 5.00 − 3.47 = 1.53 e, portanto, a amplitude de cada classe deve ser de l = Lk =

1.53

8 = 0.19125 ≈ 0.2. Obtemos ent˜ao as seguintes distribui¸c˜oes de frequˆencias (absoluta, absoluta

acumulada, relativa e relativa acumulada):

Frequˆencia Freq. absoluta Frequˆencia Freq. relativa Classe absoluta, acumulada relativa, acumulada

i i fi Fi fi∗ F ∗ i 1 ]3.4 ; 3.6] 3 3 0.025 0.025 2 ]3.6 ; 3.8] 8 11 0.067 0.092 3 ]3.8 ; 4.0] 30 41 0.250 0.342 4 ]4.0 ; 4.2] 29 70 0.242 0.583 5 ]4.2 ; 4.4] 28 98 0.233 0.817 6 ]4.4 ; 4.6] 12 110 0.100 0.917 7 ]4.6 ; 4.8] 5 115 0.042 0.958 8 ]4.8 ; 5.0] 5 120 0.042 1.000

Usando agora as frequˆencias absolutas, por exemplo, pode construir-se o seu histograma e desenhar o correspondente pol´ıgono de frequˆencias (a vermelho):

Percentagem de manteiga F re qu ˆen ci a ab so lu ta , fi 3.4 3.6 3.8 4.0 4.2 4.4 4.6 4.8 5.0 0 5 10 15 20 25 30

(10)

Daqui facilmente verificamos que a grande maioria destas vacas produz percentagens de manteiga entre 3.8 e 4.4, havendo aproximadamente o mesmo n´umero de vacas melhores e piores produtoras em termos de manteiga - simetria na distribui¸c˜ao das frequˆencias.

Repare ainda nos valores das frequˆencias relativas acumuladas de onde se pode verificar que mais de 50% das observa¸c˜oes correspondem a uma percentagem de manteiga inferior a 4.2%.

2

1.3

Medidas descritivas

Anteriormente vimos como resumir um conjunto de dados num gr´afico. Adicionalmente pode ser ´

util reduzir esses mesmos dados a um ou mais n´umeros que os representem, como por exemplo a uma m´edia. Estes n´umeros v˜ao tomar o nome de medidas descritivas.

As medidas descritivas dividem-se em 3 tipos: medidas de localiza¸c˜ao, medidas de dispers˜ao e medidas de forma. Servem, respectivamente, para responder a quest˜oes do tipo:

1. Onde ´e o ”meio”dos dados? Que dado ocorre mais vezes? Como se posiciona o meu valor comparado com todos os outros?

2. Qu˜ao ”espalhados”se encontram os dados? 3. S˜ao os meus dados sim´etricos?

1.3.1 Medidas de localiza¸c˜ao

As medidas de localiza¸c˜ao servem para determinar o ”meio”dos dados ou o seu valor ”mais t´ıpico”ou ainda para determinar como determinado valor se posiciona em rela¸c˜ao aos restantes. As medidas mais usuais s˜ao a m´edia, a mediana, moda, os quartis e os percentis.

Dado um conjunto de dados D = {x1, . . . , xn} temos as seguintes defini¸c˜oes:

M´edia amostral: ¯ x = n1Pn i=1xi Mediana: Me =      n+1 2 ´esimo

valor do conjunto D ordenado, n ´e ´ımpar

M´edia dos 2 valores centrais do conjunto D ordenado, n ´e par Moda:

Mo= Valor em D que ocorre mais vezes

Percentil de ordem p: qp=n × 100p

´esimo

(11)

Probabilidades e Estat´ıstica Isabel Nat´ario 9

1o

Quartil:

Q1 = d0.25ne´esimo valor do conjunto D ordenado

3o

Quartil:

Q3 = d0.75ne´esimo valor do conjunto D ordenado

Note-se que os quartis n˜ao s˜ao mais do que percentis - o 1o quartil ´e o percentil 25 e o 3o quartil ´e o percentil 75. O 2o quartil n˜ao ´e mais do que o percentil 50, que por sua vez n˜ao ´e mais do que a mediana.

Quando os dados se encontram agrupados, as medidas anteriores n˜ao podem assim ser determi-nadas, tendo de se recorrer a uma interpola¸c˜ao linear. Notamos que a moda dever´a encontrar-se contida na classe com maior frequˆencia absoluta - dita classe modal - e a mediana dever´a estar con-tida na primeira classe cuja correspondente frequˆencia relativa acumulada ultrapasse 0.5 - dita classe mediana.

Denotando Li e Ls os limites inferior e superior, respectivamente, das classes onde se encontram as medidas de localiza¸c˜ao a serem determinadas, P Mi o ponto m´edio da classe i, me o n´umero da

classe mediana, mo o n´umero da classe modal, mq1 o n´umero da classe do 1o quartil, mq3 o n´umero da classe do 3o quartil, mpp o n´umero da classe do percentil p e l a amplitude das classes, temos que:

M´edia amostral: ¯ x = 1nPk i=1fiP Mi Mediana: Me= Li + n+1 2 − Fme−1 Fme+1−Fme−1 × l Moda:

Mo= Li + fmo−1fmo+1+ fmo+1 × l

1o Quartil: Q1 = Li + n+1 4 − Fmq1−1 Fmq1+1−Fmq1−1 × l 3o Quartil: Q3 = Li + 3(n+1) 4 − Fmq3−1 Fmq3+1−Fmq3−1 × l Percentil de ordem p: qp = Li + p(n+1) 100 − Fmpp−1 Fmpp+1−Fmpp−1 × l

(12)

Notas: Quando tratamos com dados suscept´ıveis de conter outliers a mediana verifica-se ser uma medida de localiza¸c˜ao melhor que a m´edia, uma vez que ´e menos sens´ıvel a esse tipo de valores extremos. Notamos ainda que a moda n˜ao tem de ser ´unica.

1.3.2 Medidas de dispers˜ao

A dispers˜ao ´e a tendˆencia dos dados se espalharem em torno da m´edia. As medidas mais habituais s˜ao a amplitude dos dados, a variˆancia, o desvio padr˜ao e o coeficiente de varia¸c˜ao, que se passam a definir, relativamente ao conjunto de dados D = {x1, . . . , xn}.

Amplitude:

L = max D − min D Variˆancia amostral:

s2= n−11 Pn

i=1(xi− ¯x)2 = n−11 Pni=1x2i − n¯x2



Desvio padr˜ao amostral:

s =√s2 =q 1 n−1

Pn

i=1(xi− ¯x)2

Coeficiente de varia¸c˜ao:

cv = xs¯ × 100

Note-se que o coeficiente de varia¸c˜ao representa a percentagem da m´edia amostral a que corres-ponde o desvio padr˜ao amostral.

No caso de dados agrupados devemos reformular as nossas defini¸c˜oes. Sendo P Mi o ponto m´edio

da classe i e fi a correspondente frequˆencia absoluta:

Variˆancia amostral:

s2= 1 n−1

Pk

i=1fi(P Mi− ¯x)2

Desvio padr˜ao amostral:

s =√s2=q 1 n−1

Pk

i=1fi(P Mi− ¯x)2

1.3.3 Medidas de forma

Servem para estudar a simetria dos dados. Vamos aqui apenas considerar o coeficiente de enviesa-mento de Pearson:

Coeficiente de enviesamento de Pearson: Sk = 3(¯x−Me)s

(13)

Probabilidades e Estat´ıstica Isabel Nat´ario 11

Os valores de Sk variam entre −3 e 3. Se os dados forem perfeitamente sim´etricos ent˜ao Sk = 0, j´a que a mediana e a m´edia dos dados coincidem. Se Sk > 0 (respectivamente, Sk < 0) tal significa que a m´edia ´e maior (respectivamente menor) que a mediana, sendo os dados enviesados para a direita (respectivamente, enviesados para a esquerda).

Exemplo 1.2 Retomemos o exemplo 1.1. Uma vez que dispomos dos dados desagregados podemos

calcular:

M´edia amostral: ¯x = n1Pn

i=1xi = 1201 Pni=1xi = 4.166;

Mediana: como n=120 ´e par, M e=M´edia dos 2 valores centrais do conjunto ordenado de dados, {3.47, 3.56, 3.58, 3.66, 3.66, 3.70, 3.70, 3.72, 3.74, 3.74, 3.77, 3.81, 3.82, 3.83, 3.86, 3.86, 3.87, 3.88, 3.89, 3.89, 3.89, 3.89, 3.91, 3.91, 3.92, 3.93, 3.94, 3.95, 3.96, 3.96, 3.97, 3.97, 3.97, 3.97, 3.97, 3.98, 3.99, 3.99, 4.00, 4.00, 4.00, 4.02, 4.03, 4.05, 4.05, 4.05, 4.06, 4.06, 4.07, 4.08, 4.09, 4.09, 4.09, 4.09, 4.10, 4.10, 4.10, 4.11, 4.12, 4.14, 4.15, 4.16, 4.16, 4.17, 4.17, 4.18, 4.20, 4.20, 4.20, 4.20, 4.22, 4.23, 4.24, 4.24, 4.24, 4.24, 4.25, 4.27, 4.28, 4.28, 4.29, 4.29, 4.30, 4.31, 4.32, 4.32, 4.33, 4.33, 4.33, 4.34, 4.35, 4.36, 4.38, 4.38, 4.38, 4.38, 4.38, 4.40, 4.41, 4.42, 4.42, 4.46, 4.48, 4.49, 4.51, 4.52, 4.58, 4.58, 4.60, 4.60, 4.66, 4.67, 4.67, 4.70, 4.71, 4.81, 4.82, 4.88, 4.91, 5.00} Logo, M e = 4.14+4.152 = 4.145.

Moda: Mo = Valor que ocorre mais vezes = 3.97 e 4.38 (aparecem ambos 5 vezes, 2 modas).

1o

Quartil: Q1 = d0.25ne = d0.25 × 120e = 30´esimo valor do conjunto de dados ordenado =3.96

3o

Quartil: Q3 = d0.75ne = d0.75 × 120e = 90´esimo valor do conjunto dados ordenado =4.34

Amplitude: L=5.00-3.47=1.53 Variˆancia amostral: s2= n−11 Pn

i=1(xi− ¯x)2 = 0.091

Desvio padr˜ao amostral: s =qn−11 Pn

i=1(xi− ¯x)2 = 0.302

Coeficiente de varia¸c˜ao: cv = xs¯ × 100 = 7.258%

Coeficiente de enviesamento de Pearson: Sk = 3(¯x−Me)s = 0.209.

Confirma ligeiro enviesamento direito verificado no histograma. A distribui¸c˜ao ´e pois apenas ligeiramente assim´etrica, o que ´e corroborado pelo facto de a m´edia amostral, a mediana e a moda estarem relativamente pr´oximas.

Apesar de neste exemplo concreto termos os dados desagregados, vamos usar as classes definidas no exemplo 1.1 para calcular algumas das medidas atr´as e comparar resultados. Assim:

M´edia amostral: ¯x = n1Pk

(14)

Mediana: A classe 4, ]4.0; 4.2], ´e a primeira cuja frequˆencia relativa acumulada ultrapassa os 50% dos dados, pelo que ´e esta a classe mediana.

Me= Li + n+1 2 − Fme−1 Fme+1−Fme−1 × l = 4.0 + 120+1 2 − 41 98−41 × 0.2 = 4.068

Moda: A classe modal ´e a classe 3, ]3.8; 4.0], j´a que ´e aquela a que corresponde maior frequˆencia absoluta. Assim:

Mo = Li +fmo−1fmo+1+ fmo+1 × l = 3.8 +8 + 2929 × 0.2 = 3.957

1o

Quartil: A classe 3, ]3.8; 4.0], ´e a primeira cuja frequˆencia relativa acumulada ultrapassa os 25% dos dados, pelo que ´e esta a classe do 1o

quartil: Q1 = Li + n+1 4 − Fmq1−1 Fmq1+1−Fmq1−1 × l = 3.8 + 120+1 4 − 11 70−11 × 0.2 = 3.865 3o

Quartil: A classe 5, ]4.2; 4.4], ´e a primeira cuja frequˆencia relativa acumulada ultrapassa os 75% dos dados, pelo que ´e esta a classe do 3o

quartil: Q3 = Li + 3(n+1) 4 − Fmq3−1 Fmq3+1−Fmq3−1 × l = 4.2 + 3(120+1) 4 − 70 110−70 × 0.2 = 4.304

Naturalmente que tanto a mediana, como os quartis e a moda devem estar contidos nas respectivas classes, o que constitui uma forma de confirmarmos se os nossos c´alculos est˜ao correctos.

Variˆancia amostral: s2= 1 n−1

Pk

i=1fi(P Mi− ¯x)2= 3×(3.5−4.153)

2+8×(3.7−4.153)2+...

119 = 0.095

Desvio padr˜ao amostral: s =√s2 = 0.308

Coeficiente de varia¸c˜ao: cv = xs¯ × 100 = 7.406%

Vemos pois que as aproxima¸c˜oes obtidas a partir dos dados agrupados est˜ao pr´oximas dos ver-dadeiros valores. Quanto mais distantes estiverem os verver-dadeiros valores dos obtidos atrav´es dos dados agrupados, maior ´e a perda de informa¸c˜ao devida ao agrupamento.

2

1.4

Diagrama de caixa-e-bigodes

Apresentamos por ´ultimo um outro dispositivo gr´afico bastante ´util, o chamado diagrama de caixa-e-bigodes.

Para construir este diagrama temos de conhecer quanto valem os m´aximo e m´ınimo dos dados, a sua mediana e os 1o e 3o quartis. Com estes desenha-se uma caixa rectangular em que o topo inferior ´e dado pelo 1o quartil e o superior pelo 3o quartil. A caixa ´e dividida em duas partes pelo valor da

mediana dos dados. Acrescentam-se-lhe ent˜ao 2 bigodes que partem, respectivamente, um do extremo inferior da caixa at´e ao m´ınimo dos dados e o outro do extremo superior para o m´aximo - ver exemplo 1.3.

Este diagrama ´e muito ´util para identificar assimetrias nos dados, caso a caixa esteja partida em dois peda¸cos muito diferentes, e para identificar outliers, no caso de os bigodes serem, relativamente `

(15)

Probabilidades e Estat´ıstica Isabel Nat´ario 13

Exemplo 1.3 Construamos o diagrama de caixa-e-bigodes para dos dados do exemplo 1.1, lembrando

que M e = 4.145, Q1 = 3.96, Q3 = 4.34, m´ınimo dos dados ´e 3.47 e m´aximo dos dados ´e 5.00:

3.5 4.0 4.5 5.0

Confirma-se ligeira assimetria direita dos dados.

2

1.5

Exerc´ıcios Propostos

1.1 No ˆambito dos inqu´eritos que s˜ao efectuados por determinado organismo de obten¸c˜ao de dados, ´e importante ter no¸c˜ao dos erros de digita¸c˜ao que os entrevistadores cometem ao anotarem informaticamente as respostas dos seus entrevistados. Assim, para um inqu´erito de 50 quest˜oes registaram-se, para 90 entrevistas, os seguintes n´umeros de erros:

No de erros Frequˆencia 0 5 1 17 2 29 3 23 4 11 5 5

(a) Determine as frequˆencias relativas e as frequˆencias relativas acumuladas. Coloque-as em gr´afico.

(b) Que percentagem de entrevistas tiveram menos de 3 erros? Que n´umero de erros ´e mais comum?

(c) Determine a m´edia do n´umero de erros, o seu desvio padr˜ao e o coeficiente de varia¸c˜ao. 1.2 Suponha que os dados seguintes se referem ao n´umero de palavras que constituem o vocabul´ario

de crian¸cas de 5 anos:

(16)

(a) Estes dados s˜ao de natureza discreta ou cont´ınua? Construa uma sua distribui¸c˜ao de frequˆencias absoluta, absoluta acumulada, relativa e relativa acumulada. Esboce o his-tograma das frequˆencias relativas e o correspondente pol´ıgono de frequˆencias. Construa uma ogiva.

(b) Existe algum outlier presente nos dados?

(c) Determine a m´edia, a mediana, a moda, e os 1oe 3o quartis dos dados. Construa o diagrama de caixa-e-bigodes dos dados.

(d) Determine o desvio padr˜ao e o coeficiente de varia¸c˜ao dos dados. (e) O que pode dizer quanto `a simetria dos dados? Justifique.

1.3 Os chamados movimentos r´apidos dos olhos durante o sono (REM - rapid eye movement) est˜ao associados a per´ıodos de sonho. A dura¸c˜ao da actividade REM foi registada para 18 indiv´ıduos (em segundos):

7.00, 7.75, 9.50, 11.60, 10.55, 7.75, 12.00, 10.75, 12.51, 10.91, 8.30, 9.71, 10.50, 11.60, 6.25, 11.75, 9.75, 10.00

(a) Construa uma distribui¸c˜ao de frequˆencia dos dados usando uma amplitude de classe l de 1 segundo. Represente-a graficamente. Esboce uma ogiva.

(b) Determine a m´edia, a mediana e os 1o e 3o quartis dos dados. (c) Determine o desvio padr˜ao e o coeficiente de varia¸c˜ao dos dados.

1.4 Segue-se a distribui¸c˜ao por faixas et´arias da popula¸c˜ao de uma certa cidade, com idades entre 5 e 40 anos, relativas ao ano de 1987:

Idade N´umero [5 − 10[ 30116 [10 − 15[ 14633 [15 − 20[ 29424 [20 − 25[ 40146 [25 − 30[ 29424 [30 − 35[ 44555 [35 − 40] 40100

(a) Construa um histograma de frequˆencias. O que indica a sua forma?

(b) Se o histograma tivesse sido calculado com base nas frequˆencias relativas a sua forma diferiria do histograma desenhado na al´ınea anterior? Se n˜ao tiver a certeza construa-o para compara¸c˜ao.

(c) Determine duas medidas de localiza¸c˜ao dos dados e duas medidas de dispers˜ao.

1.5 Os dados que se seguem dizem respeito aos sal´arios mensais l´ıquidos (Euro) de um conjunto de 36 pessoas de determinada cidade entrevistadas na rua ao acaso:

1195, 660, 870, 1150, 1225, 2465, 1100, 2480, 1300, 2330, 2020, 1540, 685, 867, 1000, 1470, 1085, 1060, 1790, 2690, 1535, 3995, 1615, 1230, 670, 590, 1100, 1040, 4200, 1030, 1165, 3320, 1260, 1790, 2740, 1490

(17)

Probabilidades e Estat´ıstica Isabel Nat´ario 15

(a) Construa uma distribui¸c˜ao de frequˆencias relativas e ponha-a em gr´afico. Construa ainda uma ogiva.

(b) Qual a percentagem de pessoas que ganha menos que 1100e l´ıquidos?

(c) Determine a m´edia, a mediana, a moda, os 1o e 3o quartis e o desvio padr˜ao dos dados.

(d) Comente a simetria da distribui¸c˜ao com base no coeficiente de enviesamento de Pearson e com base no diagrama de caixa-e-bigodes.

1.6 Inserido num estudo antrop´ologo procura-se determinar algumas caracter´ısticas fisiol´ogicas de uma popula¸c˜ao. Os n´umeros seguintes representam os n´ıveis de colesterol no sangue encontrado em 25 membros de uma tribo Africana, medido em miligramas de colesterol por decilitro de sangue:

200, 241, 232, 177, 207, 181, 195, 182, 181, 233, 176, 170, 217, 164, 188, 164, 211, 204, 160, 172, 212, 186, 160, 203, 191

(a) Construa as distribui¸c˜oes de frequˆencias absolutas e relativas correspondentes.

(b) Construa o histograma e o pol´ıgono de frequˆencias das frequˆencias relativas. Comente. (c) Determine a m´edia, a mediana e a moda dos dados. Comente.

(d) Determine o coeficiente de varia¸c˜ao dos dados.

1.7 Um psic´ologo desenvolveu uma t´ecnica para ajudar as pessoas a melhorarem a sua mem´oria. Certo material ´e dado a 30 pessoas para o memorizarem antes de aprenderem a t´ecnica e semel-hante material ´e dado `as mesmas pessoas para o memorizarem depois de apreendida a referida t´ecnica. A diferen¸ca de tempo que as pessoas demoraram a memorizar os materiais antes e depois de aprendida a t´ecnica seguem-se (minutos):

5, 40, 45, 11, 13, 20, 14, 5, 23, 18, 17, 4, 4, 5, 29, 18, 15, 21, 24, 16, 2, 15, 19, 30, 24, 21, 14, 18, 26, 40

(a) Construa uma distribui¸c˜ao de frequˆencias, o seu histograma e o seu pol´ıgono de frequˆencias. (b) Tome uma classe e escreva por palavras exactamente o que ela lhe diz.

(c) Calcule 3 medidas de localiza¸c˜ao dos dados e discuta a simetria da distribui¸c˜ao dos dados, construindo um diagrama de caixa-e-bigodes.

1.8 ‡Prove que a ´area total dos rectˆangulos de um histograma ´e igual `a ´area limitada pelo pol´ıgono de frequˆencia correspondente e pelo eixo dos XX. Considere, para facilitar, o caso concreto de um histograma constitu´ıdo, por exemplo, por 3 classes da mesma amplitude.

(18)

Teoria das Probabilidades

2.1

Introdu¸c˜

ao

Apesar da estat´ıstica descritiva ser um ramo importante da estat´ıstica, muito frequentemente a in-forma¸c˜ao que dispomos existe apenas para um subgrupo de um grande conjunto de items de interesse (uma amostra), significando a necessidade de generaliza¸c˜oes para al´em dos dados. O objectivo da inferˆencia estat´ıstica prende-se precisamente com estas generaliza¸c˜oes.

Neste processo est˜ao sempre presentes incertezas, quer porque a informa¸c˜ao n˜ao ´e completa ou porque ´e apenas parte de um todo ou ainda porque ´e de natureza indirecta. Estas incertezas s˜ao quantificadas atrav´es da teoria das probabilidades.

A teoria das probabilidades tem assim como objectivo a formula¸c˜ao de modelos de fen´omenos naturais em que interv´em o acaso. As suas origens remontam aos chamados jogos de azar, como sendo a roleta do casino ou os jogos de cartas ou de dados!

Defini¸c˜ao 2.1 Uma experiˆencia aleat´oria ´e uma experiˆencia na qual: - todos os poss´ıveis resultados da experiˆencia s˜ao conhecidos `a partida;

- para qualquer realiza¸c˜ao da experiˆencia n˜ao se sabe, antes desta ocorrer, qual dos seus poss´ıveis resultados vai acontecer;

- a experiˆencia pode sempre ser repetida sob idˆenticas condi¸c˜oes.

V´arios s˜ao os exemplos do nosso dia-a-dia de experiˆencias aleat´orias - lan¸camento de uma moeda ao ar (assumindo que n˜ao ”aterra”de lado!), lan¸camento de um dado, a extrac¸c˜ao do totoloto, o tempo de vida de dura¸c˜ao de uma lˆampada, o tempo que se demora na fila de espera dos correios, o sorteio dos turnos pr´aticos de Probabilidades e Estat´ıstica!...

O nosso objectivo ´e ent˜ao estudar a incerteza associada a estas experiˆencias aleat´orias, se poss´ıvel quantific´a-la. Laplace, em 1812, forneceu a primeira defini¸c˜ao de probabilidade, dita defini¸c˜ao cl´assica de probabilidade ou Lei de Laplace:

Defini¸c˜ao 2.2 Se uma experiˆencia aleat´oria tem a si associado um n´umero finito N de resultados mutuamente exclusivos e igualmente prov´aveis e se, desses resultados, NA tˆem um certo atributo A,

ent˜ao a probabilidade de A, P (A), ´e dada por:

(19)

Probabilidades e Estat´ıstica Isabel Nat´ario 17

P (A) = NA

N =

no

de resultados favor´aveis no

de resultados poss´ıveis

Esta defini¸c˜ao ´e no entanto restritiva e inadequada em muitas situa¸c˜oes, por exemplo se os resul-tados da experiˆencia aleat´oria n˜ao forem equiprov´aveis. Surge ent˜ao o conceito frequencista de probabilidade:

Defini¸c˜ao 2.3 A probabilidade de um acontecimento A ´e avaliada atrav´es de informa¸c˜ao existente sobre A, sendo dada pela propor¸c˜ao de vezes em que se observou o resultado A, nA, num n´umero n

suficientemente grande de realiza¸c˜oes da experiˆencia aleat´oria:

P (A) = lim

n→∞

nA

n

Este ´e o conceito de probabilidade que trataremos neste curso. Notamos que esta interpreta¸c˜ao n˜ao ´e ´unica. No entanto, a matem´atica das probabilidades que vamos aprender de seguida ´e desenvolvida numa base inteiramente axiom´atica, independente da referida interpreta¸c˜ao. Deve-se a Kolmogorov, que a apresentou em 1933.

De acordo com o desenvolvimento de Kolmogorov os acontecimentos aleat´orios s˜ao representados por conjuntos e a probabilidade ´e uma medida normada definida sobre estes conjuntos.

2.2

Espa¸co amostral

Defini¸c˜ao 2.4 O espa¸co amostral de uma experiˆencia aleat´oria ´e um par (Ω, S) onde:

1. Ω ´e o conjunto de todos os poss´ıveis resultados da experiˆencia (espa¸co de resultados ou universo);

2. S ´e uma σ−´algebra, i.e.: (i) ∅ ∈ S;

(ii) Se A ∈ S ent˜ao ¯A ∈ S, onde ¯A ´e o conjunto complementar de A; (iii) Se A1, A2, . . . , An, . . . ∈ S ent˜ao S∞i=1Ai ∈ S.

Observa¸c˜oes:

1. Os pontos em Ω designam-se por pontos amostrais.

2. Muito frequentemente S ´e o conjunto de todos os subconjuntos de Ω, S ≡ P(Ω). Este conjunto ´e sempre uma σ−´algebra.

3. Qualquer conjunto A ∈ S ´e chamado um acontecimento. A ´e um conjunto de pontos amostrais. 4. Qualquer acontecimento A diz-se ter ocorrido se algum ponto de A corresponder ao resultado

de uma experiˆencia aleat´oria.

5. Cada conjunto formado por apenas um ponto amostral ´e dito um acontecimento simples ou elementar.

(20)

6. Ao conjunto Ω chamamos acontecimento certo. 7. Ao conjunto ∅ chamamos acontecimento imposs´ıvel.

8. A ´algebra assim constru´ıda, tamb´em designada por ´algebra de acontecimentos, ´e ”pare-cida” com a ´algebra de conjuntos, ”herdando” propriedades desta. Assim salientamos:

(i) A ´e subacontecimento de B, e escreve-se A ⊂ B, se e s´o se a realiza¸c˜ao de A implica a realiza¸c˜ao de B;

(ii) Dado o acontecimento A, chama-se acontecimento complementar de A e escreve-se A, ao acontecimento constitu´ıdo pelos elementos de Ω que n˜ao est˜ao em A;

(iii) Dados os acontecimentos A e B, d´a-se o nome de uni˜ao de A com B ao acontecimento que consiste na realiza¸c˜ao de pelo menos um deles e representa-se por A ∪ B;

(iv) Intersec¸c˜ao de A com B ´e o acontecimento que se realiza se e s´o se realizam em simultˆaneo os acontecimentos A e B. Representa-se por A ∩ B;

(v) A uni˜ao de acontecimentos disjuntos A e B representa-se por A + B.

(vi) Chama-se diferen¸ca dos acontecimentos A e B ao acontecimento A − B = A ∩ B, ou seja, ao acontecimento que se realiza se e s´o se A se realiza mas n˜ao se realiza B.

9. Dois acontecimentos A e B dizem-se mutuamente exclusivos se n˜ao tˆem elementos em comum, ou seja se A ∩ B = ∅.

10. Se Ω contiver apenas um n´umero finito de elementos dizemos que (Ω, S) ´e um espa¸co amostral finito. Se Ω for no m´aximo um conjunto numer´avel de pontos dizemos que (Ω, S) ´e um espa¸co amostral discreto. Se os pontos em Ω n˜ao forem cont´aveis dizemos que (Ω, S) ´e um espa¸co amostral n˜ao cont´avel. Em particular, se Ω = Rk, dizemos que temos um espa¸co amostral cont´ınuo.

Exemplo 2.1 Considere-se a experiˆencia aleat´oria simples do lan¸camento ao ar de uma moeda

equi-librada. Representando ”Ca” o resultado ”sair cara” e ”Co” o resultado ”sair coroa”, temos que Ω = {Ca, Co}. Escolhemos ent˜ao a seguinte σ−´algebra, S = P(Ω) = {∅, {Ca}, {Co}, {Ca, Co}}, formando o espa¸co amostral (Ω, S).

Consideremos agora a experiˆencia aleat´oria do lan¸camento ao ar de duas moedas equilibradas. Temos que Ω = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)} e podemos escolher S = P(Ω) = {∅, {(Ca, Ca)}, {(Ca, Co)}, {(Co, Ca)}, {(Co, Co)}, {(Ca, Ca), (Ca, Co)}, {(Ca, Ca), (Co, Ca)}, {(Ca, Ca), (Co, Co)}, {(Ca, Co), (Co, Ca)}, {(Ca, Co), (Co, Co)}, {(Co, Ca), (Co, Co)}, {(Ca, Ca), (Ca, Co), (Co, Ca)}, {(Ca, Ca), (Ca, Co), (Co, Co)}, {(Ca, Ca), (Co, Ca), (Co, Co)}, {(Ca, Co), (Co, Ca), (Co, Co)}, Ω}, for-mando o espa¸co amostral (Ω, S).

2

2.3

Axiom´

atica das probabilidades

Defini¸c˜ao 2.5 Seja (Ω, S) um espa¸co amostral. Uma fun¸c˜ao P : S → [0, 1] diz-se uma probabilidade

se satisfaz as seguintes condi¸c˜oes ou axiomas: 1. P (A) ≥ 0, ∀A ∈ S;

(21)

Probabilidades e Estat´ıstica Isabel Nat´ario 19

2. P (Ω) = 1;

3. Sejam {Ai, i = 1, 2, . . .}, Ai ∈ S, uma sucess˜ao de conjuntos disjuntos (Aj∩ Ak = ∅, j 6= k).

Ent˜ao: P ∞ [ i=1 Ai ! = ∞ X i=1

P (Ai) Aditividade cont´avel

Nota: Como caso particular do 3o axioma temos a chamada aditividade finita, para Ω finito:

Sejam A, B ∈ S : A ∩ B = ∅. Ent˜ao P (A ∪ B) = P (A) + P (B).

Defini¸c˜ao 2.6 Chama-se espa¸co de probabilidades ao triplo (Ω, S, P ).

Exemplo 2.2 Relativamente ao exemplo 2.1, onde Ω = {Ca, Co} e S = P(Ω), podemos definir a

fun¸c˜ao P em S como P (∅) = 0, P ({Ca}) = 12, P ({Co}) = 12 e P (Ω) = 1. Facilmente se verifica que esta fun¸c˜ao satisfaz os axiomas acima sendo, por isso, uma probabilidade.

a se Ω = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)} e S = P(Ω), podemos definir a fun¸c˜ao P por: P (∅) = 0

P ({(Ca, Ca)}) = P ({(Ca, Co)}) = P ({(Co, Ca)}) = P ({(Co, Co)} = 14

P ({(Ca, Ca), (Ca, Co)}) = P ({(Ca, Ca), (Co, Ca)}) = P ({(Ca, Ca), (Co, Co)}) = = P ({(Ca, Co), (Co, Ca)}) = P ({(Ca, Co), (Co, Co)}) = P ({(Co, Ca), (Co, Co)}) = 12 P ({(Ca, Ca), (Ca, Co), (Co, Ca)}) = P ({(Ca, Ca), (Ca, Co), (Co, Co)}) =

= P ({(Ca, Ca), (Co, Ca), (Co, Co)}) = P ({(Ca, Co), (Co, Ca), (Co, Co)}) = 34 P (Ω) = 1

Tamb´em esta fun¸c˜ao satisfaz os axiomas acima enunciados sendo, por isso, uma probabilidade. Notemos que em ambas as situa¸c˜oes anteriores, ao definirmos os valores que a fun¸c˜ao P deve tomar para os acontecimentos elementares, estes necessariamente implicam os valores que P deve assumir para os restantes acontecimentos, de forma a que P seja de facto uma probabilidade.

2 Passam-se a enumerar de seguida algumas consequˆencias da axiom´atica das probabilidades acima definida, esbo¸cando as suas demonstra¸c˜oes, sem grande detalhe.

Proposi¸c˜ao 2.1 P (∅) = 0.

Demonstra¸c˜ao: ∅ ∩ Ω = ∅. Logo ∅ e Ω s˜ao conjuntos disjuntos. Ent˜ao, pela aditividade e porque ∅ ∪ Ω = Ω,

P (∅ ∪ Ω) = P (∅) + P (Ω) ⇔ P (Ω) = P (∅) + P (Ω) ⇔ (pelo 2o axioma) 1 = P (∅) + 1 ⇔ P (∅) = 0

(22)

Teorema 2.1 Se A, B ∈ S e A ⊆ B ent˜ao:

- P (A) ≤ P (B)

- P (B − A) = P (B) − P (A).

Demonstra¸c˜ao: Se A ⊆ B, B = (A ∩ B) ∪ (B − A) = A ∪ (B − A). Assim, sendo A e (B − A) disjuntos, temos pelo axioma da aditividade que:

P (B) = P (A + (B − A)) = P (A) + P (B − A) ⇔ (2.3.1)

P (B − A) = P (B) − P (A)

Note-se que de (9.5.1), P (B) ≥ P (A), j´a que P (B − A) ≥ 0, pelo 1o axioma.

Corol´ario 2.1.1 ∀A ∈ S, 0 ≤ P (A) ≤ 1.

Demonstra¸c˜ao: Como ∀A ∈ S, A ⊆ Ω e como, pelo axioma 2, P (Ω) = 1, segue o pretendido como consequˆencia do primeiro ponto do teorema anterior.

Corol´ario 2.1.2 ∀A, B ∈ S, P (A − B) = P (A) − P (A ∩ B).

Demonstra¸c˜ao:

P (A − B) = P (A − (A ∩ B)) = (Pelo 2o ponto do teorema anterior e porque (A ∩ B) ⊆ A) = P (A) − P (A ∩ B)

Teorema 2.2 (Regra da adi¸c˜ao) Para A, B ∈ S, P (A ∪ B) = P (A) + P (B) − P (A ∩ B). Demonstra¸c˜ao:

1. A ∪ B = (A − B) + (B − A) + (A ∩ B);

2. A = (A ∩ B) + (A − B) ⇔ (A − B) = A − (A ∩ B) 3. B = (A ∩ B) + (B − A) ⇔ (B − A) = B − (A ∩ B) Assim, pelo axioma da aditividade:

P (A ∪ B) = P (A − B) + P (B − A) + P (A ∩ B) =

= P (A − (A ∩ B)) + P (B − (A ∩ B)) + P (A ∩ B) = (Pelo corol´ario (2.1.2)) = P (A) − P (A ∩ B) + P (B) − P (A ∩ B)) + P (A ∩ B) =

(23)

Probabilidades e Estat´ıstica Isabel Nat´ario 21

Corol´ario 2.2.1 ∀A ∈ S, P ( ¯A) = 1 − P (A).

Demonstra¸c˜ao: Tome-se na regra da adi¸c˜ao anteriormente enunciada B = ¯A:

P (A ∪ ¯A) = P (A) + P ( ¯A) − P (A ∩ ¯A) ⇔

P (Ω) = P (A) + P ( ¯A) + P (∅) ⇔ (Pelo 2o axioma e prop. (2.1)) 1 = P (A) + P ( ¯A) + 0 ⇔

P ( ¯A) = 1 − P (A)

Corol´ario 2.2.2 Para Ai∈ S, i = 1, . . . , n,

P n [ i=1 Ai ! = n X i=1 P (Ai) − X i6=j P (Ai∩ Aj) + X i6=j6=k P (Ai∩ Aj∩ Ak) − . . . + (−1)n−1P n \ i=1 Ai ! Observa¸c˜oes:

1. Dois acontecimentos A e B dizem-se incompat´ıveis se P (A ∩ B) = 0.

2. Se temos um acontecimento A 6= Ω mas tal que P (A) = 1 dizemos que A ´e um acontecimento quase certo.

3. Se temos um acontecimento B 6= ∅ mas tal que P (B) = 0 dizemos que B ´e um acontecimento quase imposs´ıvel.

Exemplo 2.3 Relativamente ao exemplo 2.1, continuado em 2.2, relativamente `a experiˆencia aleat´oria

do lan¸camento de 2 moedas equilibradas, definamos os seguintes acontecimentos: A-”Sair pelo menos uma cara”

B-”Sair pelo menos uma coroa” Temos que:

A = {(Ca, Co), (Co, Ca), (Ca, Ca)} P (A) = 3 4 B = {(Ca, Co), (Co, Ca), (Co, Co)} P (B) = 3 4 A partir daqui consideremos os seguintes acontecimentos:

Ocorrerem os dois acontecimentos simultaneamente: A ∩ B = {(Ca, Co), (Co, Ca)} P (A ∩ B) = 1

(24)

Ocorrer A mas n˜ao B:

A − B = {(Ca, Ca)} P (A − B) = P (A) − P (A ∩ B) = 34 −12 = 1 4 Ocorrer pelo menos um dos acontecimentos:

A ∪ B = Ω P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 34+3 4 − 1 2 = 1 N˜ao ocorrer B: ¯ B = {(Ca, Ca)} P ( ¯B) = 1 − P (B) = 1 −3 4 = 1 4 2

2.4

ecnicas de contagem para espa¸cos amostrais finitos

Em espa¸cos amostrais finitos ´e frequente termos situa¸c˜oes em que todos os acontecimentos ele-mentares tˆem igual probabilidade. Nestes casos a determina¸c˜ao das probabilidades de acontecimentos reduz-se a problemas de contagem combinat´oria. Enumeramos seguidamente algumas regras de con-tagem necess´arias a essa determina¸c˜ao.

1. Multiplica¸c˜ao de escolhas: O n´umero de formas diferentes em que podemos escolher um elemento de cada um de dois grupos - um com n elementos e outro com m - ´e dado por:

n × m

2. Consideremos um conjunto de n elementos dos quais estamos interessados em extrair p (p ≤ n) elementos, anotando a ordem pela qual eles saem.

(i) Se a extrac¸c˜ao for efectuada sem reposi¸c˜ao, no caso de extrairmos todos os n elementos (p = n), o n´umero de formas diferentes de o fazer ´e permuta¸c˜oes de n,

Pn= n! = n × (n − 1) × . . . × 2 × 1

Recordemos que por conven¸c˜ao 0! = 1.

Caso p < n, o n´umero de conjuntos diferentes de p elementos que podemos formar a partir dos n elementos `a escolha ´e dado por arranjos de n elementos p a p,

An

p = (n−p)!n!

(ii) Se a extrac¸c˜ao for efectuada com reposi¸c˜ao, o n´umero de conjuntos diferentes de p elementos que podemos formar a partir dos n elementos `a escolha ´e np. A este n´umero chama-se arranjos com repeti¸c˜ao e designa-se por:

(25)

Probabilidades e Estat´ıstica Isabel Nat´ario 23

3. Finalmente podemos estar interessados em determinar quantos subconjuntos de p elementos conseguimos formar a partir de um conjunto de n elementos, n˜ao interessando a ordem pela qual eles saem. Tal n´umero ´e dados pelas combina¸c˜oes de n elementos p a p:

Cn

p = (n−p)!p!n!

Repare-se que as combina¸c˜oes s˜ao obtidas a partir dos arranjos descontando-lhes as diferentes ordena¸c˜oes do conjunto formado pelos p elementos. Usamos arranjos quando os elementos que escolhemos s˜ao distingu´ıveis entre si e combina¸c˜oes quando n˜ao s˜ao.

Notamos ainda que as combina¸c˜oes podem tamb´em ser denotadas por (np) = nCp = Cpn e que

Cpn= Cn−pn .

Exemplo 2.4 Consideremos as seguintes situa¸c˜oes:

X O n´umero de toilettes poss´ıveis ao combinar 3 gravatas diferentes com 4 camisas s˜ao 3 × 4 = 12. X Num teste de escolha m´ultipla de 10 quest˜oes com 3 op¸c˜oes cada, o n´umero de diferentes

con-juntos de respostas ´e 310.

X Num parque de estacionamento com 10 lugares o n´umero de formas distintas em que se a´ı podem arrumar 6 carros diferentes ´e de A10

6 = 151.200.

X No totoloto, onde de 49 n´umeros se tenta acertar num conjunto de 6 n´umeros sorteados ao acaso, o n´umero de poss´ıveis chaves ´e dado por C49

6 = 13.983.816!

2

2.5

Probabilidade condicionada e Teorema de Bayes

O c´alculo de probabilidades de acontecimentos associados a uma experiˆencia aleat´oria pode ser alterado quando existe informa¸c˜ao dispon´ıvel para al´em do espa¸co amostral da experiˆencia em quest˜ao. Vejamos o seguinte exemplo:

Exemplo 2.5 Em determinada aldeia apareceu um surto de c´olera, que se pensa estar associado

ao consumo de ´agua de um determinado po¸co. S˜ao conhecidas as seguintes propor¸c˜oes relativas `a quantidade de pessoas que desenvolveram a doen¸ca (representando esse acontecimento pela letra D) e `

as pessoas que beberam ´agua do referido po¸co (representando esse acontecimento pela letra B):

B B Total

D 0.18 0.02 0.20

D 0.01 0.79 0.80

(26)

Qual a probabilidade de uma pessoa escolhida ao acaso na popula¸c˜ao da aldeia ter contra´ıdo c´olera? P (D) = 0.2

De entre as pessoas que beberam ´agua do po¸co, qual a probabilidade de se escolher ao acaso uma pessoa que contraiu c´olera? Agora s´o estamos interessados no universo das pessoas que beberam ´agua do po¸co, B, pelo que a probabilidade pretendida ´e:

0.18

0.19 ' 0.95

Repare-se que por sabermos que a pessoa bebeu ´agua do po¸co tal altera o valor da probabilidade do acontecimento ”contrair c´olera”de 0.2 para 0.95! O espa¸co de resultados foi encolhido de toda a popula¸c˜ao da aldeia, Ω, para apenas os que consumiram ´agua do tal po¸co, B. Isto reflecte-se na forma como o novo acontecimento ”contrair c´olera sabendo (ou condicionado a que) que bebeu ´agua do po¸co” passa a ser designado: D|B. A sua probabilidade ´e dada por:

P (D|B) = P (D ∩ B)P (B)

2

Defini¸c˜ao 2.7 Seja (Ω, S, P) um espa¸co de probabilidades e seja B ∈ S : P (B) > 0. Para ∀A ∈ S

definimos a probabilidade condicionada de A dado B por:

P (A|B) = P (A ∩ B)P (B)

Exerc´ıcio 2.1 Provar que se B ´e um acontecimento tal que P (B) > 0, ent˜ao P (· |B ) ´e uma

proba-bilidade sobre Ω.

Teorema 2.3 (Teorema da probabilidade composta) Seja (Ω, S, P) um espa¸co de probabilidades

e sejam A, B ∈ S : P (A) > 0, P (B) > 0. Ent˜ao, P (A ∩ B) = P (A |B ) P (B) = P (B |A) P (A)

Nota: Este teorema ´e facilmente generaliz´avel a mais de dois acontecimentos.

Teorema 2.4 (Teorema da probabilidade total) Seja (Ω, S, P) um espa¸co de probabilidades e

formem {E1, . . . , En} uma parti¸c˜ao do espa¸co de resultados Ω1, com P (Ei) > 0, ∀i. Dado um

qualquer acontecimento A ∈ S, tem-se

P (A) = P (A |E1) P (E1) + . . . + P (A |En) P (En)

Demonstra¸c˜ao:

Se {E1. . . , En} ´e uma parti¸c˜ao de Ω, ent˜ao E1∪ . . . ∪ En = Ω e Ei∩ Ej = ∅, ∀i 6= j.

Por outro lado, A = (A ∩ E1) ∪ . . . ∪ (A ∩ En).

1Ou seja, E

(27)

Probabilidades e Estat´ıstica Isabel Nat´ario 25

Como os acontecimentos (A ∩ E1) , . . . (A ∩ En) s˜ao disjuntos, pelo axioma da aditividade,

P (A) = P (A ∩ E1) + . . . + P (A ∩ En)

O que se pretende demonstrar sai finalmente notando que, pelo teorema da probabilidade composta, P (A ∩ Ei) = P (A |Ei) P (Ei) , ∀i = 1, 2, . . . , n.

Teorema 2.5 (Teorema de Bayes) Seja (Ω, S, P) um espa¸co de probabilidades e {E1, . . . , En} uma

parti¸c˜ao do espa¸co de resultados Ω, com P (Ei) > 0, ∀i. Dado um qualquer acontecimento A ∈ S,

com P (A) > 0, tem-se P (Ei|A) = P (A |Ei ) P (Ei) Pn i=1P (A |Ei) P (Ei) . Demonstra¸c˜ao:

Pelos teoremas da probabilidade total e da probabilidade composta e pela defini¸c˜ao de probabili-dade condicional, P (Ei|A) = P (Ei∩ A) P (A) = P (A |Ei) P (Ei) Pn i=1P (A |Ei) P (Ei)

Exemplo 2.6 Suponha que existe um teste para diagnosticar uma certa doen¸ca, mas que esse teste ´e

fal´ıvel. Assim sabe-se que, para um indiv´ıduo portador da doen¸ca (D), a probabilidade de o teste dar positivo (T ) ´e de 0.98 e que, para um indiv´ıduo s˜ao (D), a probabilidade de o teste dar negativo (T ) ´e 0.99. Sabe-se ainda que na popula¸c˜ao 10% s˜ao portadores da doen¸ca. Assim:

P (T |D) = 0.98 P (T |D) = 0.99 P (D) = 0.10

A probabilidade de um indiv´ıduo n˜ao ter a doen¸ca sabendo que o teste deu positivo ´e de:

P (D|T ) = P (T |D)P (D)

P (T |D)P (D) + P (T |D)P (D) =

0.01 × 0.90

0.98 × 0.10 + (1 − 0.99) × (1 − 0.10) ' 0.084 e a probabilidade de um indiv´ıduo ter a doen¸ca se o teste deu negativo ´e de:

P (D|T ) = P (T|D)P (D)

P (T |D)P (D) + P (T |D)P (D) =

0.02 × 0.10

(1 − 0.98) × 0.10 + 0.99 × (1 − 0.10) ' 0.002 2

(28)

2.6

Independˆ

encia entre acontecimentos

Defini¸c˜ao 2.8 Dois acontecimentos A e B dizem-se independentes se e s´o se P (A ∩ B) = P (A) P (B)

Teorema 2.6 Se A e B s˜ao acontecimentos independentes, ent˜ao: P (A|B) = P (A) se P (B) > 0

e

P (B|A) = P (B) se P (A) > 0.

Portanto, se dois acontecimentos s˜ao independentes, o conhecimento de um deles em nada influencia a probabilidade de ocorrˆencia do outro.

Teorema 2.7 Se A e B s˜ao acontecimentos independentes, tamb´em o s˜ao A e B, A e B e ainda A e B.

Exemplo 2.7 A probabilidade de um atirador acertar no alvo, em cada tiro, ´e de 0.6,

independente-mente do tiro. Qual a probabilidade de:

a) Serem necess´arios exactamente 10 tiros para acertar uma vez? 0.49× 0.6. b) Em trˆes tiros acertar uma vez? C13× 0.42× 0.6.

c) Acertar pela terceira vez ao quinto tiro? C24× 0.42× 0.63.

d) Necessitar de pelo menos 4 tiros para acertar duas vezes? 1 − 0.62− C13× 0.41× 0.62.

2

2.7

Exerc´ıcios Propostos

2.1 Considere a experiˆencia aleat´oria de lan¸car simultaneamente 2 dados equilibrados de 4 faces cada, variando estas de 1 a 4 pintas.

(a) Descreva o espa¸co de resultados e o espa¸co amostral associados a esta experiˆencia.

(b) Quais s˜ao os elementos de S que descrevem, respectivamente, os acontecimentos ”sair um ´

unico 4”, ”sair pelo menos um 4”, ”sair no m´aximo um 4”?

2.2 Num concurso de escultura participam 15 candidatos. De quantas formas diferentes pode o j´uri atribuir os 1o, 2o e 3o lugares?

2.3 Quatro casais compraram 8 lugares para o teatro na mesma fila de cadeiras. De quantas formas diferentes se podem sentar se:

(a) Os elementos de cada casal se sentarem junto do respectivo par. (b) Todos os homens se sentarem juntos e as mulheres tamb´em.

(29)

Probabilidades e Estat´ıstica Isabel Nat´ario 27

(c) Todos os homens se sentarem juntos.

(d) Os homens e as mulheres se sentarem alternadamente.

2.4 Seis livros de f´ısica, quatro de matem´atica e dois de qu´ımica devem ser arrumados numa prateleira. De quantas formas diferentes se pode fazer tal arruma¸c˜ao se:

(a) Os livros de cada mat´eria ficarem juntos? (b) Apenas os livros de matem´atica ficarem juntos?

2.5 Numa determinada pizzeria o cliente pode escolher para a sua pizza 3 ingredientes de 15 `a escolha, n˜ao sendo poss´ıvel repetir ingredientes. Quantas pizzas diferentes se podem fazer? 2.6 Para preencher 6 vagas de trabalho numa determinada firma concorreram 6 homens e 8 mulheres.

De quantas formas diferentes podem ser preenchidas as vagas se: (a) Qualquer dos candidatos puder ser escolhido?

(b) Tiverem de ser contratados exactamente 3 homens e 3 mulheres, podendo qualquer can-didato ser escolhido?

(c) Tiverem de ser contratadas (quaisquer) 3 mulheres e 3 homens, dos quais um homem em particular deve ser escolhido.

(d) Tiverem se ser contratados 2 homens e 4 mulheres e, destas, 2 em particular n˜ao devem ser escolhidas.

2.7 Demonstre que Cpn= Cn−pn , p ≤ n.

2.8 No lan¸camento de um dado equilibrado determine a probabilidade de sair: (a) A face 6.

(b) Um n´umero par de pontos. (c) A face 2 ou a face 3.

2.9 Extrai-se ao acaso uma carta de um baralho de 40. Determine a probabilidade de essa carta ser: (a) Um ´as.

(b) Um ouro. (c) O ´as de ouros. (d) Um ´as ou um ouro.

2.10 Num jogo de cartas (sueca) distribuem-se 10 cartas por cada jogador. Determine a probabilidade de sair a um determinado jogador:

(a) Quatro ases e quatro manilhas (7). (b) Pelo menos um ´as.

(c) Quatro cartas do naipe trunfo, entre elas o ´as.

(d) Todas as cartas dos mesmo naipe. E do naipe trunfo?

2.11 Num dado n˜ao equilibrado a probabilidade de sair um n´umero par de pintas ´e o dobro de sair um n´umero ´ımpar. Determine essas probabilidades.

(30)

2.12 Por engano misturaram-se 4 pilhas novas com 3 usadas. Escolhendo-se, ao acaso e sem reposi¸c˜ao, 2 destas pilhas determine a probabilidade de:

(a) Ambas serem novas. (b) Nenhuma ser nova.

(c) Pelo menos uma ser nova.

2.13 Para se conseguir entrar na ´area de trabalho do computador do Sr. Speck-Trum tem de se introduzir uma palavra-chave de 4 d´ıgitos. Qual a probabilidade de se conseguir entrar ao acaso se:

(a) Na constitui¸c˜ao da palavra-chave puderem entrar quaisquer das 26 letras do alfabeto; (b) Na constitui¸c˜ao da palavra-chave puderem entrar quaisquer das 26 letras do alfabeto, sem

repeti¸c˜oes de letras;

(c) A palavra-chave ´e constitu´ıda por quaisquer duas letras seguidas de quaisquer dois algaris-mos.

2.14 Trˆes amigos v˜ao ao bar Pentagunus e pedem ao empregado de mesa que lhes sirva trˆes bebidas diferentes. Este, na hora de servir as referidas bebidas, esquece-se de quem pediu o quˆe e decide colocar em frente de cada amigo uma bebida ao acaso. Qual a probabilidade de:

(a) Todos receberem a bebida que efectivamente escolheram; (b) Ningu´em receber a bebida correcta;

(c) Apenas um dos amigos receber a bebida que efectivamente escolheu.

2.15 Sejam A, B e C acontecimentos tais que P (A) = P (B) = P (C) = 14, P (A ∩ B) = P (B ∩ C) = 0 e P (A ∩ C) = 18. Qual a probabilidade de se verificar pelo menos um dos 3 acontecimentos?

2.16 Sabendo que A e B s˜ao acontecimentos tais que P (A) = 23, P (B) = 12 e P (A∩B) = 13, determine P (A − B), P (A ∪ B), P ( ¯A ∪ ¯B), P ( ¯A ∩ B) e P (A ∪ ¯B).

2.17 De 100 agricultores, 50 produzem vinho, 30 produzem milho e 10 produzem vinho e milho. Escolhendo um deste agricultores ao acaso qual a probabilidade de:

(a) Ele produza vinho ou milho? (b) Ele n˜ao produza vinho nem milho?

2.18 A probabilidade de um homem estar vivo daqui a 25 anos ´e 35 e a probabilidade da sua mulher ainda viver na mesma ocasi˜ao ´e de 23. Determine a probabilidade de daqui a 25 anos:

(a) Ambos estarem vivos. (b) Apenas o homem estar vivo.

(c) Apenas a mulher estar viva. (d) Apenas um estar vivo.

2.19 Em determinada gelataria 40% dos clientes escolhem o sabor chocolate, 30% escolhem o sabor lim˜ao e 15% escolhem os dois. Seleccionou-se ao acaso um cliente dessa gelataria.

(31)

Probabilidades e Estat´ıstica Isabel Nat´ario 29

(a) Se escolheu o sabor lim˜ao, qual a probabilidade de ter escolhido tamb´em o sabor chocolate? E vice-versa?

(b) Qual a probabilidade de escolher lim˜ao ou chocolate?

2.20 Suponha que 10% da popula¸c˜ao de certo pa´ıs sofre de problemas card´ıacos e que, de entre estes, 70% s˜ao fumadores. De entre os que n˜ao sofrem de problemas card´ıacos 45% fumam. Seleccionada ao acaso uma pessoa desta popula¸c˜ao:

(a) Qual a probabilidade de ser fumadora?

(b) Se for fumadora, qual a probabilidade de sofrer de problemas card´ıacos?

2.21 Admita que existem 3 tipos de v´ırus diferentes que provocam gripe, sendo as probabilidades de um indiv´ıduo ser atacado por cada um deles de 0.3, 0.5 e 0.2, respectivamente, s´o podendo ser atacado por um ´unico tipo de v´ırus. Existe uma vacina para esta doen¸ca, sendo as probabilidades de imuniza¸c˜ao a cada um dos v´ırus atr´as mencionados de 0.8, 0.9 e 0.95, respectivamente.

(a) Qual a probabilidade de um indiv´ıduo vacinado n˜ao contrair a gripe (estar, por isso, imune)? (b) Se um indiv´ıduo vacinado resistiu ao ataque (um indiv´ıduo imune), qual a probabilidade

de ter sido atacado por um v´ırus do tipo 2?

2.22 Um detector de mentiras tem uma probabilidade de 0.08 de n˜ao detectar um mentiroso e uma probabilidade de 0.01 de acusar uma pessoa inocente (n˜ao mentirosa). Se 2% das pessoas que passam por este detector de mentiras mentem, qual a probabilidade de:

(a) Uma pessoa acusada pelo detector de mentiras ter de facto mentido? (b) Uma pessoa n˜ao acusada pelo detector ser na verdade inocente.

2.23 Dos registos dos correios sabe-se que 60% das cartas enviadas demoram 1 dia a chegar ao seu destino, enquanto que as restantes demoram mais tempo do que isso. Quanto a encomendas, 10% demoram apenas um dia a chegar, 40% dois dias e as restantes mais tempo ainda. O n´umero de cartas enviadas ´e superior ao n´umero de encomendas, estando na propor¸c˜ao de 3 para 2. Calcule a probabilidade de:

(a) Um artigo enviado demore pelo menos dois dias a chegar.

(b) Um artigo enviado, que demorou mais de um dia a chegar, seja uma carta.

2.24 Nas suas desloca¸c˜oes de casa para o emprego a menina Flora pode usar um de trˆes meios de transporte distintos - metro, autocarro ou autom´ovel. Sabe-se que a probabilidade de ela chegar atrasada ao emprego ´e de 0.24 e as probabilidades de chegar atrasada tendo usado, respectivamente, o metro ou o autocarro s˜ao de 0.1 e 0.7. A probabilidade de chegar a horas tendo usado o autom´ovel ´e de 0.8. Sabendo ainda que a probabilidade de ir de metro ou de autocarro ´e a mesma, determine a probabilidade de a menina Flora ir de autom´ovel.

2.25 Sejam A e B acontecimentos independentes. Mostre que A e B s˜ao tamb´em acontecimentos independentes.

2.26 Um aluno conhece bem 60% da mat´eria dada. Num exame com cinco perguntas, sorteadas ao acaso, sobre toda a mat´eria, qual a probabilidade de vir a responder correctamente a duas perguntas?

(32)

2.27 Numa certa rua existem duas caixas Multibanco - A e B. A probabilidade de as m´aquinas avariarem ´e, independentemente uma da outra, de 0.05 para a A e 0.01 para a B. Determine a probabilidade de, num dia qualquer:

(a) Ambas as m´aquinas estarem avariadas. (b) Apenas a m´aquina A estar avariada.

(c) Pelo menos uma das m´aquinas estar avariada.

2.28 Diga, justificando, se a seguinte afirma¸c˜ao ´e verdadeira ou falsa:

Dados 2 acontecimentos A e B pode acontecer que P (A ∪ B) = P (A) + P (B). 2.29 Diga, justificando, se as seguintes afirma¸c˜oes s˜ao verdadeiras ou falsas:

(a) Dados 3 acontecimentos A, B e C tais que P (A) > 0, P (B) > 0, P (C) > 0 , com A ⊆ B ⊆ C, ent˜ao P (A ∪ B ∪ C) = P (C).

(b) Estamos interessados em formar palavras de 5 letras, a partir das 23 constituintes do alfabeto portuguˆes (sem repeti¸c˜ao de letras), por selec¸c˜ao aleat´oria das letras. Nestas condi¸c˜oes, a probabilidade de formarmos a palavra ”PROVA” ´e de 235 .

(c) Suponha que A e B s˜ao acontecimentos tais que P (A) = 0.6, P (B) = 0.3 e P (A ∩ B) = 0.2. Ent˜ao P (B| ¯A) = 0.5.

(d) Um estudante sabe que ter´a 3 exames durante a 1a semana do per´ıodo de exames (2a a 6a

feira, 5 dias). A probabilidade de que os exames sejam em dias consecutivos ´e de 103 . (e) De um conjunto de 25 artigos 8 s˜ao defeituosos, 6 tendo apenas pequenos defeitos e 2 tendo

defeitos de consider´avel gravidade. Ent˜ao a probabilidade de que um artigo escolhido ao acaso tenha um defeito considerado grave, sabendo que tem defeitos, ´e de 14.

(f) Para um determinado exame de PED, 80% dos alunos estudam e os restantes n˜ao. Se um aluno estudar para o exame, a probabilidade de ele passar ´e de 0.85. Se o aluno n˜ao estudar certamente que n˜ao passa. Se determinado aluno n˜ao passou no exame, a probabilidade de ele n˜ao ter estudado para o mesmo ´e de 0.2.

(g) Sendo A e B dois acontecimentos tais que P (A) + P (B) = x e P (A ∩ B) = y ent˜ao a probabilidade de n˜ao se realizar qualquer um dos acontecimentos ´e x − y.

(h) Dois algarismos distintos entre si s˜ao escolhidos aleatoriamente de entre os inteiros de 0 a 5 (inclusivamente). A probabilidade de a sua soma ser menor que 3 ´e de 0.1.

(i) O Sr. Z´e compra um bilhete de lotaria para 20 sorteios distintos, em cada um dos quais tem uma probabilidade de 1001 de ganhar um pr´emio. Consequentemente, na globalidade dos sorteios, a probabilidade de ele ganhar pelo menos um pr´emio ´e de 0.182.

(j) Um comerciante tem 3 lojas - L1, L2 e L3 - sendo o volume de vendas de L1 igual ao de L2 e o volume de vendas de L3 o dobro do volume de vendas de cada uma das outras duas lojas. Sabe-se que a percentagem de d´ıvidas incobr´aveis nestas lojas ´e de 6%, 10% e 12%, respectivamente para as lojas L1, L2 e L3. Ent˜ao, a probabilidade de n˜ao se conseguir cobrar uma qualquer factura ´e de 0.5.

(k) De uma lista de 25 doadores de de sangue, 12 tˆem sangue do tipo A. Escolhidas 5 pessoas ao acaso desta lista a probabilidade de que todas tenham sangue do tipo A ´e de 125 . (l) A probabilidade do Jo˜aozinho passar no exame de condu¸c˜ao de trotinetes ´e de 0.6 se n˜ao

(33)

Probabilidades e Estat´ıstica Isabel Nat´ario 31

cometer ou n˜ao o suborno, a probabilidade de o fazer ´e igual `a de n˜ao o fazer. Ent˜ao, sabendo que o Jo˜aozinho conseguiu tirar a carta de trotinetes, a probabilidade de ele ter subornado o examinador ´e de 0.7.

(m) A joalharia Dourex permite a devolu¸c˜ao de alian¸cas de casamento dentro de um prazo de um mˆes ap´os a compra das mesmas. Sabe-se que 10% dos pares de alian¸cas comprados s˜ao devolvidos. Ent˜ao, a probabilidade de em 10 pares de alian¸cas vendidos no m´aximo 1 par ser devolvido ´e de 0.74.

(n) Em certa casa coabitam 3 periquitos - um amarelo, um verde e um malhado (verde e amarelo) - e ainda um gato. Sempre que a dona destes animais sai de casa, o gato tenta comer os periquitos, atacando indiferentemente qualquer um deles. A probabilidade de o gato comer o periquito amarelo ´e de 0.3, de comer o periquito verde ´e 0.2 e o malhado ´e 0.1. No dia em que a dona chegue a casa e s´o ou¸ca cantar 2 periquitos (por um deles ter sido comido), a probabilidade de que o periquito em falta seja o amarelo ´e de 0.5.

(o) Em determinado pa´ıs sabe-se que 70% dos contribuintes s˜ao profissionais liberais e os restantes s˜ao trabalhadores por conta de outrem. Se um contribuinte ´e profissional lib-eral, a probabilidade de ele pagar impostos voluntariamente ´e de 0.6, enquanto que esta probabilidade aumenta para 0.9 para os trabalhadores por conta de outrem. Se determi-nado contribuinte n˜ao pagou os seus impostos de forma volunt´aria, a probabilidade de ele ser um profissional liberal ´e de 0.85.

(p) Imagine que recebe uma caixa com 50 doces. Esta caixa cont´em 5 caramelos, 5 bombons recheados com cerejas, 5 trufas, 5 chocolates de passas e 30 chocolates de leite. Algu´em selecciona ao acaso 5 doces da caixa para lhe dar e coloca-os num prato. A probabilidade de que o prato contenha pelo menos um caramelo, pelo menos um bombom recheado com cerejas, pelo menos uma trufa e pelo menos um chocolate de passas ´e de 0.3.

(q) Trˆes m´aquinas A, B e C produzem bot˜oes, respectivamente, 15%, 25% e 60% da produ¸c˜ao total. As percentagens de bot˜oes defeituosos fabricados por estas m´aquinas s˜ao respec-tivamente 5%, 7% e 4%. Se ao acaso, da produ¸c˜ao total de bot˜oes, for encontrado um defeituoso, a probabilidade de ele ter sido produzido pela m´aquina B ´e de cerca de 36%. (r) A probabilidade do medicamento XOP provocar efeitos secund´arios numa crian¸ca (i.e.

pessoa com menos de 14 anos) ´e de 0.2, enquanto que para os adultos (restante popula¸c˜ao) ´e de 0.1. Sabemos que percentagem de crian¸cas na popula¸c˜ao ´e de 15%. Uma pessoa queixou-se de ter sofrido de efeitos secund´arios ap´os a ingest˜ao deste medicamento. A probabilidade de que essa pessoa seja um adulto ´e de 0.3.

(s) Se P (A) = 0.5, P (B) = 0.2 e P (A ∩ B) = 0.1 ent˜ao os acontecimentos A e B s˜ao indepen-dentes mas n˜ao incompat´ıveis.

(t) O Jos´e tem de ir buscar um amigo ao aeroporto. A sua experiˆencia diz-lhe que o avi˜ao se atrasa 60% das vezes quando chove, mas apenas 20% das vezes quando n˜ao chove. A previs˜ao do tempo diz que h´a uma probabilidade de 0.4 de chover. Ent˜ao a probabilidade de que o avi˜ao n˜ao se atrase ´e de 0.5.

(u) Num determinado exame, 10 alunos receberam o enunciado A, 15 alunos receberam o enunciado B e 20 alunos receberam o enunciado C. Seleccionando ao acaso 6 do total destes alunos, a probabilidade de um deles ter recebido o enunciado A, dois deles terem recebido o enunciado B e os restantes trˆes terem recebido o enunciado C ´e de aproximadamente 0.98. (v) O exame de PE do Z´e decorre em simultˆaneo com um importante jogo de futebol. N˜ao podendo ver o jogo em directo o Z´e programa os seus dois gravadores de v´ıdeo para o gravar.

Referências

Documentos relacionados

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

A assistência da equipe de enfermagem para a pessoa portadora de Diabetes Mellitus deve ser desenvolvida para um processo de educação em saúde que contribua para que a

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

servidores, software, equipamento de rede, etc, clientes da IaaS essencialmente alugam estes recursos como um serviço terceirizado completo...

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

No prazo de 10 dias contada da deliberação, para os condóminos presentes, ou contada da sua comunicação, para os condómino ausentes, pode ser exigida ao administrador a convocação

O desenvolvimento das interações entre os próprios alunos e entre estes e as professoras, juntamente com o reconhecimento da singularidade dos conhecimentos