Unidade II. Unidade II

(1)

1/08 -||- 1º Revisão: Ana - Corr

eção: Léo 03/12/08 -||-

5 AS MEDIDAS DE POSIÇÃO E VARIABILIDADE NUMA DISTRIBUIÇÃO DE FREQUÊNCIA

Vamos agora usar os conhecimentos obtidos no módulo 4 para aprender a calcular as medidas de posição e variabilidade em uma distribuição de frequência.

Ao longo deste módulo, vamos utilizar o mesmo exemplo que trabalhamos no módulo 4, da distribuição de frequência das idades dos alunos formandos em Gestão de uma Universidade ﬁctícia AB.

Idade de 100 estudantes formandos do curso de Gestão de uma Universidade AB em dez/2006

Idade Número de estudantes

20 a 22 8 22 a 24 10 24 a 26 12 26 a 28 20 28 a 30 17 30 a 32 15 32 a 34 9 34 a 36 5 36 a 38 3 38 a 40 1 Total = 100

Podemos, ao longo deste módulo, aproveitar uma série de informações que construímos a partir dos dados brutos que tínhamos no módulo 4, tal como disposto na tabela abaixo, e,

5

10

(2)

eção: Léo 03/12/08 -||-

partindo destas informações, construir as medidas de posição e variabilidade para uma distribuição de frequência.

Tabela 5.1 Classes

ƒ

i

ƒ

i, A

ƒ

i, R 20 |- 22 8 8 0,08 22 |- 24 10 18 0,10 24 |- 26 12 30 0,12 26 |- 28 20 50 0,20 28 |- 30 17 67 0,17 30 |- 32 15 82 0,15 32 |- 34 9 91 0,09 34 |- 36 5 96 0,05 36 |- 38 3 99 0,03 38 |- 40 1 100 0,01

Σ

100 1 5.1 As medidas de posição 5.1.1 A média

No módulo 2, como trabalhávamos com um conjunto de dados pequeno para calcular a média deste grupo de números, era necessário organizá-los em um rol, identiﬁcar os valores de x_i, fazer o somatório e então calcular a média a partir da fórmula apresentada.

No entanto, quando se tem uma distribuição de frequências, nem sempre dispomos dos valores de todas as observações, ou a amostra é, por vezes, tão grande que não é viável fazer o cálculo da mesma maneira que fazemos quando os dados estão dispostos em um rol. Geralmente, quando estamos diante de uma distribuição de frequência, o que dispomos é do número de observações em cada classe, mas não dispomos dos valores em si de x_i. Portanto, as

5

10

(3)

eção: Léo 03/12/08 -||-

observações em uma dada distribuição de frequência serão representadas pelo ponto médio de cada classe. A fórmula para o cálculo do ponto médio será:

Limite _inferior + Limite _superior P_médio = X_i = 2

Assim, temos que a média numa distribuição de frequências é: x : média aritmética da distribuição de frequência;

ƒ

_i: frequência absoluta simples; X_i : ponto médio de cada classe; n : número de observações.

∑

ƒ

_i X_i

x = --- , onde n

No nosso exemplo de distribuição de frequência das idades, podemos calcular a média a partir da construção de uma nova tabela: Tabela 5.2 Classes

ƒ

i

ƒ

i, A

ƒ

i, R Xi

ƒ

i, Xi 20 |- 22 8 8 0,08 21 168 22 |- 24 10 18 0,10 23 230 24 |- 26 12 30 0,12 25 300 26 |- 28 20 50 0,20 27 540 28 |- 30 17 67 0,17 29 493 30 |- 32 15 82 0,15 31 465 32 |- 34 9 91 0,09 33 297 34 |- 36 5 96 0,05 35 175 36 |- 38 3 99 0,03 37 111 38 |- 40 1 100 0,01 39 39

Σ

100 1 2818

Para o cálculo da média aritmética, usa-se uma fórmula que deriva da fórmula de cálculo da média ponderada para determinar a média de uma distribuição de frequência, substituí-se os pesos pelas frequências de classes e x_i pelo ponto médio, representado por X_i.

5

(4)

eção: Léo 03/12/08 -||-

Calculando a média aritmética para o exemplo, onde n = 100, temos então: x X n x i i = = + + + + + +

∑

ƒ ( . ) ( . ) ( . ) ( . ) ( . ) ( . ) (8 21 10 23 12 25 20 27 17 29 15 31 99 33 5 35 3 37 39 100 168 230 300 540 493 465 297 17 . ) ( . ) ( . )+ + + = + + + + + + + x 55 111 39 100 2818 100 28 18 + + ₌ = x ,

A idade média dos estudantes de Gestão da Universidade AB que se formaram no ano de 2006 seria de 28,18 anos, de acordo com a distribuição de frequência aqui construída.

5.1.2 A mediana

Em uma distribuição de frequências de uma variável contínua, devem-se seguir alguns passos para calcular a mediana.

Da mesma forma que nos dados organizados em um rol, precisamos primeiro identiﬁcar a posição da mediana. O primeiro passo é calcular a ordem n

2, e parte-se para a frequência acumulada para identiﬁcar a classe que contém a mediana. Feito isto, utiliza-se a seguinte fórmula para o cálculo da mediana:



MD: limite inferior da classe da mediana;

n : tamanho da amostra;

∑

ƒ

: soma das frequências anteriores à da mediana; h : amplitude da classe da mediana;

F_MD: frequência da classe da mediana. x n h F MD MD ~ ( ). = + 2−

∑

ƒ onde:

Como vimos também no módulo 2, a mediana é o elemento que ocupa a posição central num determinado conjunto de dados ordenados.

5

10

(5)

eção: Léo 03/12/08 -||-

Para a distribuição de frequência, temos que seguir esses passos para calcular a mediana.

No exemplo anterior, calcular: a) primeiro calculamos n

2 100

2 50

= = ;

b) identiﬁcar a classe da mediana a partir da frequência acumulada, procurando descobrir onde a observação de número 50 está alocada. No nosso exemplo, ela estará na quarta classe, que possui limite inferior de 26 e limite superior de 28;

c) calcular a mediana através de: x n h F MD MD ~ ( ). = + 2−

∑

ƒ , onde __MD= 26 ; n=100; ƒ =

∑

30; F_MD= 20 x x ~ ~ ( ). = + − = + = 26 50 30 2 20 26 2 28 .

A mediana de nossa distribuição de frequência será 28 anos, ou seja, 50% dos alunos que se formaram em Gestão nesta Universidade AB têm, no máximo, 28 anos.

5.1.3 A moda

Depois disso, aplica-se a chamada fórmula de Czuber, descrita abaixo, para o cálculo da moda, que nos dirá qual é a

Para calcular a moda, é preciso identiﬁcar o intervalo de classes de maior frequência, pois é nele que ela se encontra.

5

10

(6)

eção: Léo 03/12/08 -||-

observação mais frequente daquela distribuição. O cálculo da moda será:

M_od: valor da moda;

L₁: limite inferior da classe modal;

D₁: diferença entre a frequência da classe modal e a frequência da classe anterior;

D₂: diferença entre a frequência da classe modal e a frequência da classe posterior; h: amplitude de classe. M L D D D h od = + + 1 1 1 2 ( ). onde:

Calculemos então a moda para a nossa distribuição de frequência das idades dos alunos de Gestão da Universidade AB que se formaram em 2006. A classe modal será a quarta classe, pois é aquela que apresenta a maior frequência. Temos então:

M M od od = +

(

−

)

−

(

)

+

(

−

)

      = + +    = 26 20 12 20 12 20 17 2 26 8 8 3 2 2 . . 66 16 11 27 5 + = ,

A moda seria, portanto, de 27,5 anos, o que signiﬁca que a maior quantidade de alunos formando-se no curso de Gestão desta universidade ﬁctícia teria 27,5 anos.

5.2 As medidas de dispersão numa distribuição de frequência

5.2.1 O desvio médio

No caso de uma distribuição de frequência, esta diferença será calculada da seguinte forma:

D_médio: desvio médio absoluto; X_i: ponto médio de cada classe; x: média da distribuição de frequência;

ƒ

_i: frequência absoluta; n: total de observações. D_médio₌

∑

X −x f n i .i _onde:

Recapitulando o módulo 3, o desvio médio indica a diferença entre cada observação e a média aritmética de um determinado conjunto de dados. 5

10

(7)

eção: Léo 03/12/08 -||-

No nosso exemplo, temos então: Tabela 5.3 Classes

ƒ

_i

ƒ

_i, A

ƒ

i, R Xi

ƒ

i, Xi Xi - x

|

x_i - x

|

.

ƒ

_i 20 |- 22 8 8 0,08 21 168 -7,18 57,44 22 |- 24 10 18 0,10 23 230 -5,18 51,8 24 |- 26 12 30 0,12 25 300 -3,18 38,16 26 |- 28 20 50 0,20 27 540 -1,18 23,6 28 |- 30 17 67 0,17 29 493 0,82 13,94 30 |- 32 15 82 0,15 31 465 2,82 42,3 32 |- 34 9 91 0,09 33 297 4,82 43,38 34 |- 36 5 96 0,05 35 175 6,82 34,1 36 |- 38 3 99 0,03 37 111 8,82 26,46 38 |- 40 1 100 0,01 39 39 10,82 10,82 ��

Σ

100 1 2818 342 D_médio =

∑

X −x n i .ƒi D_médio =342 = 100 3 42,

Logo, o desvio médio de nossa distribuição de frequência será de 3,42. A média, a diferença da idade de cada formando em relação à média aritmética da distribuição das idades será de 3,42.

5.2.2 Variância

Como vimos no módulo 3, a variância também é uma medida de dispersão que tem a média como ponto de referência.

Quando se trata de uma distribuição de frequência de dados populacionais, temos:

σ2: variância populacional; X_i: ponto médio de cada classe; µ: média populacional;

ƒ

_i: frequência absoluta simples; σ2 ₌

∑

(X −µ)2

N

i ƒi _onde:

A variância nos indica o grau de variabilidade de uma determinada distribuição de frequência com relação à sua média aritmética.

5

(8)

eção: Léo 03/12/08 -||-

Para o caso da variância de valores amostrais, devemos usar:

s2_{: variância amostral;}

X_i: ponto médio de cada classe; x: média aritmética amostral;

ƒ

_i: frequência absoluta simples; n: total de observações da amostra. s X x n i i 2 2 1 = − −

∑

( ) ƒ onde:

No caso da distribuição de frequência das idades, é preciso acrescentar mais duas colunas à tabela para calcular, no nosso exemplo, a variância amostral:

s X x n i i 2 2 1 = − −

∑

( ) ƒ Tabela 5.4 Classes

ƒ

_i

ƒ

_i, A

ƒ

_i, R X_i

ƒ

_i, X_i Xi - x

|

x_i - x

|

.

ƒ

_i (Xi - x)2 (Xi - x)2

ƒ

i 20 |- 22 8 8 0,08 21 168 -7,18 57,44 51,5524 412,42 22 |- 24 10 18 0,10 23 230 -5,18 51,8 26,8324 268,32 24 |- 26 12 30 0,12 25 300 -3,18 38,16 10,1124 121,35 26 |- 28 20 50 0,20 27 540 -1,18 23,6 1,3924 27,85 28 |- 30 17 67 0,17 29 493 0,82 13,94 0,6724 11,43 30 |- 32 15 82 0,15 31 465 2,82 42,3 7,9524 119,28 32 |- 34 9 91 0,09 33 297 4,82 43,38 23,2324 209,09 34 |- 36 5 96 0,05 35 175 6,82 34,1 46,5124 232,56 36 |- 38 3 99 0,03 37 111 8,82 26,46 77,7924 233,38 38 |- 40 1 100 0,01 39 39 10,82 10,82 117,0724 117,07 ��

Σ

100 1 2818 342 1752,25 Assim, temos: s2 1752 25 100 1 17 60 = − = , ,

Logo, a variância amostral de nosso exemplo é 17,60.

5

(9)

eção: Léo 03/12/08 -||-

5.2.3 Desvio padrão

Para calcular o desvio padrão, basta extrair a raiz quadrada do valor da variância, seja ela variância populacional ou variância amostral.

σ= σ2

Já o desvio padrão amostral será dado como segue: s= s2

No exemplo acima, o nosso desvio padrão seria então: s= 17 60 4 1952, = ,

Exemplo 1: consideremos a distribuição relativa a 34 famílias de quatro ﬁ lhos, tomando para variável o número de ﬁ lhos do sexo masculino:

Nº de meninos (x_i)

ƒ

i (xi - x) (xi - x)2

ƒ

i(xi - x)2 0 2 (0-2,3)=-2,3 (-2,3)2_{=5,29 2(5,29)=10,58} 1 6 (1-2,3)=-1,3 (-1,3)2_{=1,69 6(1,69)=10,14} 2 10 (2-2,3)=-0,3 (-0,3)2_{=0,09 10(0,09)=0,9} 3 12 (3-2,3)=0,7 (0,7)2_=0,49 _{12(0,49)=5,88} 4 4 (4-2,3)=1,7 (1,7)2_=2,89 _{4(2,89)=11,56}

Σ

ƒ

i = 34

Σ

ƒ

i (xi - x)2 = 39,06

Calcule a amplitude, o desvio padrão (S), a variância (S2_{) e o}

coeﬁ ciente de variação (cv). Solução

Amplitude:

R= 4 – 0 = 4 meninos,

Lembrando que: em estatística, um histograma é uma representação gráﬁ ca da distribuição de frequências de um conjunto de medições, normalmente um gráﬁ co de barras verticais.

Lembrando: em estatística, um histograma é uma representação gráﬁ ca da distribuição de frequências de um conjunto de medições, normalmente um gráﬁ co de barras verticais.

O histograma é um gráﬁ co composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe, e a sua altura, à respectiva frequência. Quando o número de dados aumenta indeﬁ nidamente e o intervalo de classe tende a zero, a distribuição de frequência passa para uma distribuição de densidade de probabilidades. A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Pode indicar se uma distribuição aproxima-se de uma função normal, como pode indicar mistura de populações quando se apresentam bimodais.

Informações técnicas sobre como elaborar um histograma, bem como sua interpretação, são encontradas em literaturas clássicas de estatística.

5

10

(10)

eção: Léo 03/12/08 -||-

ou seja, a maior variação encontrada nesse conjunto de dados é de 4 meninos.

Obs.: sabemos que a média para esse conjunto de dados é x = 2,3 ﬁlhos. Desvio padrão: s x x n x x x x x x n i i i n n n = − − = − + − + + − − = =

∑

ƒ ƒ ƒ ƒ ( ) ( ) ( ) ... ( ) 2 1 1 1 2 2 2 2 2 1 1 = − + − + − + − + − − = 2 0 2 3 6 1 2 3 10 2 2 3 12 3 2 3 4 4 2 3 34 1 2 2 2 2 2 ( , ) ( , ) ( , ) ( , ) ( , ) = 2 2 3− + −6 1 3 +10 0 3− +12 0 7 +4 17 = 33 2 2 2 2 2 ( , ) ( , ) ( , ) ( , ) ( , ) = 2 5 29 6 169 10 0 09 12 0 49 4 2 89+ + + + = 33 ( , ) ( , ) ( , ) ( , ) ( , ) = 10 58 10 14 0 9 5 88 1156+ + + + = 33 , , , , , = 39 06 = ≅ ≅ 33 11836 1 088 1 , , , filho ,

ou seja, o número médio de filhos homens por família de 4 filhos é de 2,3, com uma variabilidade de aproximadamente 1 filho, isto é, a maior parte das famílias com 4 filhos tem entre

2,3 + 1 = (1,3 e 3,3) ≅ (1 e 3) ﬁlhos homens. Variância: S2 = (S)2_{= (1,008)}2_{≅ 1,1837 (ﬁlhos homens)}2_. 5 10 15

(11)

1/08 -||- 1º Revisão: Ana - Corr eção: Léo 03/12/08 -||- Coeﬁciente de variação: cv S x = =1 088≅ 2 3 0 4730 ,

, , , ou seja, existe uma variabilidade de 47,30% dos dados em relação à média (variabilidade alta).

Exemplo 2: considere a seguinte distribuição de frequência referente aos salários de operários de uma determinada fábrica: Custos R$ Classes de fr. Pm (xi)

ƒ

i (xi - x) (xi - x)2

ƒ

i(xi - x)2 450 |- 550 500 8 (500-754,68)=-254,68 (-254,68)2 _{= 64861,90} _{8(64861,90)= 518895,2} 550 |- 650 600 10 (600-754,68)=-154,68 (-154,68)2 _{= 23925,90 10(23925,90)=239259,0} 650 |- 750 700 11 (700-754,68)=-54,68 (-54,68)2 _{= 2989,90} _{11(2989,90)=32888,9} 750 |- 850 800 16 (800-754,68)=45,32 (45,32)2 _{= 2053,90} _{16(2053,90)=32862,4} 850 |- 950 900 13 (900-754,68)=145,32 (145,32)2 _{= 21117,90} _{13(21117,90)=274532,7} 950 |- 1050 1000 5 (1000-754,68)=245,32 (245,32)2 _{= 60181,90} _{5(60181,90)=300909,5} 1050 |- 1150 1100 1 (1100-754,68)=345,32 (345,32)2 _{= 119245,90 1(119245,90)=119245,9} Total 64

Σ

_ƒ

i (xi - x)2 = 1518593,6

Calcule a amplitude, o desvio padrão (S), a variância (S2_{) e o}

coeﬁciente de variação (cv). Solução

Amplitude:

R= 1150 – 450 = 700,

ou seja, a maior diferença existente entre os salários dos operários desta determinada fábrica é de R$ 700,00.

Obs.: sabemos que a média para este conjunto de dados é x =754,68 reais.

5

10

(12)

1/08 -||- 1º Revisão: Ana - Corr eção: Léo 03/12/08 -||- Desvio-padrão: s x x n x x x x x x n i i i n n n = − − = − + − + + − − = =

∑

ƒ ƒ ƒ ƒ ( ) ( ) ( ) ... ( ) 2 1 1 1 2 2 2 2 2 1 1 8 500 754 68( − , )2+10 600 754 68( − , )2+11700 754 68( − , )2+16 800 754( − ,668 13 900 754 68 5 1000 754 68 11100 754 68 64 1 2 2 2 2 ) + ( − , ) + ( − , ) + ( − , ) − = = 8 254 68(− , )2 +10 154 68(− , )2+ −11 54 68( , )2+16 45 32( , )2+13145 32( , ))2 5 245 32( , )2 1345 32( , )2 63 + + ₌ = 8 64861 90 10 23925 90 112989 90 16 2053 90 13 21227( , )+ ( , )+ ( , )+ ( , )+ ( ,, )90 5 60181 90 1119245 90( , ) ( , ) 63 + + ₌ = 518895 2 239259 0 32888 90 32862 40 274532 70 300909 5 11, + , + , + , + , + , + 99245 90 63 1518593 60 63 , _≅ , ₌ = 24104 66 155 26, ≅ , (reais ,)

ou seja, a média dos salários é de R$754,68, com uma variabilidade de aproximadamente R$155,26, ou seja, a maior parte dos operários recebem entre 754,68 + 155,26 = (599,42 e 909,94) reais. Variância: S2_{= (S)}2_{= (155,26)}2_{≅ 24104,66 (reais)}2 Coeﬁciente de variação: cv S x = =155 26 ≅ 754 68 0 2057 ,

, , , ou seja, existe uma variabilidade de 20,57% dos dados em relação à média.

5

10

(13)

eção: Léo 03/12/08 -||-

6 INTRODUÇÃO À PROBABILIDADE

Quando estudamos algum fenômeno através do método estatístico, na maior parte das vezes, é preciso estabelecer uma distinção entre o modelo matemático que construímos para tentar explicar tal fenômeno e o fenômeno em si.

A maioria dos fatos estudados pela estatística apresenta resultados de difícil previsibilidade, dados que variam de uma observação para outra, mesmo em condições normais de experimentação. Para analisar, interpretar e explicar tais fenômenos, é preciso utilizar a probabilidade.

O evento pode ser cara (no caso do lançamento de uma moeda), 6 (no caso do lançamento de um dado), chuva (no caso da observação do tempo), etc. A probabilidade de ocorrer determinado evento será sempre um número entre 0 e 1, indicando aproximadamente a chance de ocorrência deste evento. Quanto mais próxima de 1, maior é a probabilidade de ocorrer este evento; quanto mais próxima de zero, menor a chance de acontecer. Quando a probabilidade de determinado evento é zero, diz-se que este é um evento impossível. Sendo assim, temos:

0 < P (A) < 1.

6.1 Teoria dos conjuntos, espaço amostral e eventos

Um conjunto é deﬁnido como um grupo de objetos ou itens que apresentam características comuns. São exemplos de conjuntos os habitantes de São Paulo, os estudantes de Gestão da UNIP, o número de consoantes do alfabeto, o número de vogais do alfabeto, etc.

Podemos descrever os elementos de um conjunto de duas formas: enumerando cada um deles entre chaves, indicando suas características comuns, também entre chaves.

A palavra probabilidade deriva do latim probare (provar ou testar). Informalmente, “provável” é uma das muitas palavras utilizadas para eventos incertos ou conhecidos, sendo também substituída por algumas palavras como “sorte”, “risco”, “azar”, “incerteza”, “duvidoso”, dependendo do contexto.

Tal como acontece com a teoria da mecânica, que atribui deﬁnições precisas a termos de uso diário, como “trabalho” e “força”, também a “teoria das probabilidades” tenta quantiﬁcar a noção de “provável”.

A probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência de um determinado evento.

O evento é o resultado que se espera de determinado experimento.

A teoria de conjuntos pode ser estudada em detalhes em livros básicos de matemática. 5 10 15 20 25

(14)

eção: Léo 03/12/08 -||-

conjunto A = {a, e, i, o, u}; ou

conjunto A = {conjunto das vogais do alfabeto};

conjunto B = {todos os números inteiros maiores que 23}. Em um conjunto finito, podemos identificar todos os seus subconjuntos. O número de subconjuntos de um conjunto finito será obtido através da seguinte fórmula:

N_subconjuntos= 2n_{, onde n = número de elementos do conjunto.}

Por exemplo, em um conjunto como o dado abaixo, calcule a quantidade de subconjuntos e faça a sua apresentação:

A = {2, 4, 6, 8}.

A quantidade de subconjuntos de A será: N_{subconjuntos A}= 2n_{= 2}4_{= 16.}

Os subconjuntos de A serão, portanto:

A = {{2},{4},{6},{8},{2, 4}, {2, 6}, {2, 8}, {4, 6}, {4, 8}, {6, 8}, {2, 4, 6}, {2, 6, 8}, {2, 4, 8}, {4, 6, 8}, {2, 4, 6, 8}, { }}. Ora, se trazemos estes conceitos para a probabilidade, podemos deﬁnir então o que seria espaço amostral e evento. Na teoria das probabilidades, temos o chamado experimento, uma experiência que poderá ser repetida sob as mesmas condições indeﬁnidamente.

Para cada experimento existe um conjunto S formado por todos os possíveis resultados deste experimento. Este conjunto é denominado de espaço amostral.

Por exemplo, ao lançar um dado e observar o número da face que ﬁca para cima, teríamos o seguinte conjunto de resultados

5

10

15

20

(15)

eção: Léo 03/12/08 -||-

possíveis deste experimento e, portanto, o seguinte espaço amostral:

S = Ω = {1, 2, 3, 4, 5, 6}, onde Ω é o espaço amostral. O espaço amostral poderá ser representado pela letra ômega. Sendo o espaço amostral o conjunto de todos os resultados possíveis de uma dada experiência, a probabilidade do espaço amostral deverá ser igual a 1 ou 100%, pois ao menos um dos resultados deve ocorrer.

P (evento qualquer espaço amostral Ω) = 1,00.

Os eventos são os resultados de um experimento. No caso do exemplo, de lançar um dado, seriam exemplos de eventos:

A: ocorrer face igual a 6; B: ocorrer face igual a 5.

O evento é geralmente simbolizado através de uma letra maiúscula.

Poderíamos simbolizar graﬁcamente o espaço amostral e o evento através do diagrama de Venn, para que possamos visualizar melhor a diferença entre estes dois importantes conceitos da teoria das probabilidades.

Evento

Espaço amostral

O que significa então o gráfico acima? Para entendermos melhor, vamos relembrar algumas relações que se estabelecem entre dois ou mais conjuntos, e que tipo de classificação didática isso gera, para entender que implicações isso pode ter para a teoria das probabilidades.

5

10

15

(16)

eção: Léo 03/12/08 -||-

Dois ou mais conjuntos que não possuam elementos em comum são chamados conjuntos disjuntos. Por exemplo, sejam os conjuntos abaixo:

A = {3, 5, 7} e B = {9, 11} são dois conjuntos que claramente não apresentam nenhum elemento em comum, e podem ser representados pelo diagrama de Venn, como segue:

A _B

3 5

7 9 11

Como A e B não possuem elementos em comum, o resultado da união destes conjuntos irá gerar um novo conjunto, cujo número de elementos será dado pela soma dos elementos de A e dos elementos de B. Temos então:

n(A ∪ B) = n(A) + n(B) n(A ∪ B) = 5

Se dois ou mais conjuntos apresentam elementos em comum, teremos o caso de conjuntos não-disjuntos. Nesse caso, o número de elementos da união dos dois conjuntos será dado pela soma dos elementos de cada conjunto, subtraindo-se os elementos que estes possuem em comum.

A = {2, 4, 6, 8, 10} e B = {8, 10, 12}; n(A ∪ B) = n(A) + n(B) - n(A ∩ B); n(A ∪ B) = 5 + 3 - 2 = 6.

Podemos veriﬁcar este resultado comparando-o ao diagrama de Venn, que irá apresentar claramente os elementos da união dos dois conjuntos A e B.

A B 2 4 6 8 10 12 5 10 15 20

(17)

eção: Léo 03/12/08 -||-

Estes conceitos de conjuntos são importantes porque nos permitem, por exemplo, deﬁnir novos eventos utilizando estas operações de união e interseção. Assim:

a) (A ∪ B) quando A ocorre, ou B ocorre, ou ambos ocorrem, temos este evento;

b) (A ∩ B) evento só ocorre se A e B ocorrerem simultaneamente;

c) A evento quando A não ocorre.

A partir disso, podemos deﬁnir os eventos como complementares, mutuamente exclusivos, não mutuamente exclusivos e coletivamente exaustivos.

Diz-se que dois eventos são complementares quando completam um determinado espaço amostral. É importante ressaltar que os eventos complementares não devem apresentar elementos em comum. A soma das probabilidades de eventos complementares é sempre igual a 1. Podemos representar dois eventos complementares com o diagrama que segue:

Espaço amostral

A

A’

Por exemplo: podemos considerar como eventos complementares ocorrer cara ou coroa no lançamento de uma moeda; atender ou não à porta. O espaço amostral dos dois experimentos, respectivamente, será:

Ω = {cara, coroa}, onde A: ocorrer cara; B: ocorrer coroa. 5 10 15 20 25

(18)

eção: Léo 03/12/08 -||-

Ω₂ = {atender, não atender}, onde,

C: atender à porta; D: não atender à porta.

Em ambos os experimentos, podemos observar que a soma das probabilidades será igual a um, porque os eventos completam o espaço amostral. Assim, no caso dos dois exemplos acima, teremos: P A P B P A P B ( ) ( ) ( ) ( ) = = ⇒ + = 1 2 1 2 1 P C P D P C P D ( ) ( ) ( ) ( ) = = ⇒ + = 1 2 1 2 1

Dois ou mais eventos que não possuem elementos comuns, ou não podem ocorrer simultaneamente, são ditos eventos mutuamente excludentes. Diferente dos eventos complementares, eles não necessariamente completam o espaço amostral. Sendo assim, podemos dizer que todos os eventos complementares são mutuamente exclusivos, mas nem todos os eventos mutuamente exclusivos são complementares. Também é importante ressaltar que na teoria dos conjuntos, os eventos mutuamente exclusivos são os chamados conjuntos disjuntos.

Isso signiﬁca que: (A ∩ B) = φ

Para ilustrar graﬁcamente dois eventos mutuamente exclusivos, podemos, mais uma vez, valermo-nos de um diagrama de Venn.

Ω: Espaço amostral A B 5 10 15 20 25

(19)

eção: Léo 03/12/08 -||-

Por exemplo: no lançamento de um dado, ocorrer as faces 1, 2, 3, 4, 5, 6. São seis eventos mutuamente excludentes, já que dois não podem ocorrer simultaneamente, então a ocorrência de um exclui a ocorrência do outro. Se restringirmos este experimento a apenas duas faces, temos:

Experimento: lançamento de um dado; Ω = {1, 2, 3, 4, 5, 6} (espaço amostral); A: ocorrer a face 2;

B: ocorrer a face 4.

Temos aqui dois eventos mutuamente exclusivos e que não são complementares.

Quando dois eventos apresentam elementos em comum ou podem ocorrer simultaneamente, diz-se que eles são eventos não mutuamente excludentes. Estes eventos podem ser representados através de um diagrama de Venn como segue abaixo:

Ω: Espaço amostral

A _B

Como exemplo, podemos nos valer da distribuição de frequências do módulo 4, para dar exemplo de dois eventos que sejam não mutuamente excludentes. Vejamos então a

5

10

15

(20)

eção: Léo 03/12/08 -||-

distribuição de frequência das idades dos alunos formandos do curso de Gestão de uma Universidade AB:

Distribuição de frequência das idades

Classes _{absoluta simples}Frequência

20 |- 22 8 22 |- 24 10 24 |- 26 12 26 |- 28 20 28 |- 30 17 30 |- 32 15 32 |- 34 9 34 |- 36 5 36 |- 38 3 38 |- 40 1 �

Σ

100

Tomando-se a distribuição de frequência acima, podemos dar exemplo de dois eventos não mutuamente exclusivos:

A: apresentar idade entre 20 e 26 anos no momento da formatura;

B: apresentar idade entre 22 e 30 anos no momento da formatura.

Como entre esses dois eventos existem elementos em comum, ou seja, os intervalos de 22 a 26 anos, eles são não mutuamente excludentes. É importante ressaltar que os eventos não mutuamente exclusivos, na teoria dos conjuntos, são os conjuntos não-disjuntos.

Os eventos podem ser ainda coletivamente exaustivos. Isso acontece quando os eventos em questão ocuparem todo o espaço amostral, tornando impossível qualquer outro resultado além daqueles eventos dados. São

5

10

15

(21)

eção: Léo 03/12/08 -||-

considerados eventos coletivamente exaustivos os eventos complementares, mas nem sempre os eventos coletivamente exaustivos serão complementares. Além disso, os eventos coletivamente exaustivos serão, em alguns casos, mutuamente excludentes.

Podemos então representar graﬁcamente eventos coletivamente exaustivos com o diagrama abaixo:

Ω: Espaço amostral

A B C

Assim, são exemplos de eventos coletivamente exaustivos, no caso de um experimento de lançar uma moeda:

A: ocorrer cara; B: ocorrer coroa.

Um outro exemplo seria ao se fazer a experiência de retirar cartas de um baralho, deﬁnir como eventos:

A: carta de copas; B: carta de paus; C: carta de ouros; D: carta de espadas.

Temos acima dois exemplos de eventos coletivamente exaustivos.

Vamos a alguns exemplos:

Exemplo 1: em um grupo de 100 pessoas, 70 têm sangue com RH positivo e 45 têm sangue tipo O. Escolhendo-se, ao acaso, uma pessoa desse grupo, qual é a probabilidade de o sangue dessa pessoa ser de tipo diferente de O?

Em teoria das probabilidades, o espaço amostral ou espaço amostral universal, geralmente denotado S, Ω ou U (de “universo”), de um experimento ou teste aleatório é o conjunto de todos os resultados possíveis. Por exemplo, se o experimento é lançar uma moeda e veriﬁcar a face voltada para cima, o espaço amostral é o conjunto {cara, coroa}. Para o lançamento de um dado de seis faces, o espaço amostral é {1, 2, 3, 4, 5, 6}. Qualquer subconjunto de um espaço amostral é comumente chamado um evento, enquanto subconjuntos de um espaço amostral contendo apenas um único elemento são chamados eventos elementares.

Para alguns tipos de experimentos, podem existir dois ou mais espaços amostrais possíveis plausíveis. Por exemplo, quando retirada uma carta de um baralho de 52 cartas, uma possibilidade poderia ser o valor dela (Ás até o Rei), enquanto outra poderia ser o naipe (copa, ouro, espada ou paus). Uma descrição completa dos resultados, entretanto, especiﬁca ambas: denominação e naipe; e um espaço amostral descrevendo cada carta individualmente pode ser construído através do produto cartesiano dos dois espaços amostrais citados.

Espaços amostrais aparecem naturalmente em uma introdução elementar à probabilidade, mas são também importantes em espaços de probabilidade. Um espaço de probabilidade (Ω, F, P) incorpora um espaço amostral de resultados, Ω, mas deﬁne um conjunto de eventos de interesse, o σ-algebra F, para o qual a medida de probabilidade P é deﬁnida. 5

10

15

20

(22)

eção: Léo 03/12/08 -||-

Solução

Seja x o número de pessoas que têm sangue RH positivo e têm também sangue tipo O. Representando os conjuntos por meios de diagramas de Venn, tem-se:

70 - x + x + 45 - x = 100. RH+

O 70 - x _x _{45 - x}

Daí vem que 70 + 45 - x = 100. Então, x = 115 - 100 = 15.

Assim, o número de pessoas que têm sangue de o tipo diferente de O é: 70 - 15 = 55.

Logo, num total de 100 pessoas, temos 55 possibilidades (chances) de escolha.

Então, podemos dizer que a probabilidade de o sangue dessa pessoa ser de tipo diferente de O é 55/100 = 55%.

De uma outra maneira, mais rápida: como 45 têm sangue tipo O, então, o número de pessoas que têm sangue do tipo diferente de O é:

100 - 45 = 55.

Logo, a probabilidade é de 55 possibilidades num total de 100, isto é, 55%.

Exemplo 2: Maria vai sair com suas amigas e, para escolher a roupa que usará, separou duas saias e quatro blusas. De quantas maneiras ela pode se arrumar?

5

10

15

(23)

eção: Léo 03/12/08 -||-

Solução

O chamado Princípio Fundamental da Contagem (PFC) diz: se alguma escolha pode ser feita de M diferentes maneiras e alguma escolha subsequente pode ser feita de N diferentes maneiras, há M×N diferentes maneiras pelas quais essas escolhas podem ser feitas sucessivamente. Observe a tabela abaixo:

blusa 1 blusa 2 blusa 3 blusa 4 saia 1 saia 1 e blusa 1 saia 1 e blusa 2 saia 1 e blusa 3 saia 1 e blusa 4

saia 2 saia 2 e blusa 1 saia 2 e blusa 2 saia 2 e blusa 3 saia 2 e blusa 4

Contando as possibilidades, vemos que Maria pode se arrumar de 8 maneiras distintas. De fato, a ação é constituída de duas etapas sucessivas. A primeira (vestir a saia) pode ser realizada de duas maneiras distintas. Para cada uma dessas possibilidades, a segunda (vestir a blusa) pode ser realizada de quatro maneiras distintas. Assim, pelo Princípio Fundamental da Contagem (PFC), o número de efetuar a ação completa é 2 × 4 = 8.

Exemplo 3: há quatro estradas ligando as cidades A e B, e três estradas ligando as cidades B e C. De quantas maneiras distintas pode-se ir de A a C, passando por B?

Solução

A ação é constituída de duas etapas sucessivas. A primeira (ir de A até B) pode ser realizada de três maneiras. Para cada uma dessas possibilidades, a segunda (ir de B até C) pode ser realizada de quatro maneiras. Então, pelo PFC, o número de maneiras de ir de A até C é 3 × 4 = 12.

Exemplo 4: uma prova de matemática consta de 10 questões do tipo V ou F. Se todas as questões forem respondidas ao acaso, qual o número de maneiras de preencher a folha de resposta?

Solução

O PFC é também conhecido como princípio multiplicativo e pode ser generalizado para ações constituídas de mais de duas

5

10

15

20

(24)

eção: Léo 03/12/08 -||-

Resolver uma prova de dez questões do tipo V ou F representa uma ação constituída de dez etapas sucessivas, que correspondem à resolução das dez questões propostas. Para cada questão, há duas possibilidades de escolha de resposta: V ou F. Logo, pelo PFC, o resultado procurado é: 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 = 210_{= 1024.}

Exemplo 5: de quantas maneiras podemos arrumar cinco pessoas em ﬁla indiana?

Solução

Ao escolher uma pessoa para ocupar a primeira posição na ﬁla, temos cinco possibilidades; para o segundo lugar, como uma pessoa já foi escolhida, temos quatro possibilidades; para o terceiro lugar, sobram três pessoas a serem escolhidas; para o quarto lugar, duas pessoas, e para o último lugar na ﬁla sobra apenas a pessoa ainda não escolhida. Então, pelo PFC temos: 5 × 4 × 3 × 2 × 1 = 120. Assim, calculamos o número de modos de ordenar (“embaralhar”) cinco elementos distintos. Em outras palavras, calculamos o número de permutações simples de cinco elementos, ou seja, P₅ = 120.

Exemplo 6: ao lançarmos dois dados, a probabilidade de obtermos resultados cuja soma é sete é:

Solução

Para cada dado lançado ao acaso, temos seis possibilidades de resultado. Então, pelo PFC, o número de casos possíveis é 6×6 = 36. 1+1 1+2 1+3 1+4 1+5 1+6 2+1 2+2 2+3 2+4 2+5 2+6 3+1 3+2 3+3 3+4 3+5 3+6 4+1 4+2 4+3 4+4 4+5 4+6 5+1 5+2 5+3 5+4 5+5 5+6 6+1 6+2 6+3 6+4 6+5 6+6 5 10 15 20 25

(25)

eção: Léo 03/12/08 -||-

O número de casos favoráveis é o número de elementos do conjuntos de pares ordenados {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}, ou seja, é 6. Assim, a probabilidade é P = 6/36 = 1/6.

7 PROBABILIDADE: ORIGEM, MÉTODOS E PRINCIPAIS TEOREMAS

Como vimos, a probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência de um determinado evento.

A forma clássica de calcular a probabilidade é através da relação entre o número de casos favoráveis e o número de casos possíveis. Os casos favoráveis são aqueles resultados que se espera que aconteça; já os casos possíveis são todos os elementos que compõem o espaço amostral.

Sendo assim, dado um determinado espaço amostral Ω, a probabilidade de um dado evento A, P(A), será uma função deﬁnida em Ω, em que cada evento estará associado a um número real, a ﬁm de satisfazer os axiomas abaixo.

Atenção! I) 0 < P < 1 II) P(Ω) = 1

III) Se A e B forem eventos mutuamente exclusivos, (A ∩ B) = φ, então P(A ∪ B) = P(A) + P(B).

7.1 Origens da probabilidade

Na realidade, existem três maneiras diferentes de se calcular ou estimar as probabilidades. São eles os métodos clássico, empírico e subjetivo, sendo que os métodos clássico e empírico são considerados métodos objetivos.

5

10

15

20

(26)

eção: Léo 03/12/08 -||-

7.1.1 Métodos objetivos 7.1.1.1 Método clássico

Quando estamos diante de experimentos que têm resultados igualmente prováveis, aplica-se o chamado método clássico. Neste caso, a probabilidade de ocorrer cada evento (resultado) é uma função do número de resultados possíveis.

P

numero de resultados possiveis

evento =

_´

1

_´

Por exemplo, no experimento em que lançamos um dado, ocorrer qualquer das faces neste lançamento é igualmente provável. Então qual seria a probabilidade de ocorrer qualquer destas faces?

´

P numero de faces P qualquer face qualquer face = = 1 1 6

Aplicando-se o método clássico a experimentos que envolvam dois ou mais resultados associados, com igual probabilidade de ocorrência desses resultados, teremos a deﬁnição clássica de probabilidade que demos no início deste módulo, em que a probabilidade será: P resultados favoraveis resultados possiveis =

´

Por exemplo, a probabilidade de obter quatro ases num baralho de 52 cartas. Nesse caso, temos que identiﬁcar o número de resultados favoráveis, ou seja, aqueles resultados esperados. No caso, são quatro resultados favoráveis, dentro de quatro resultados possíveis, então temos:

P= 4 = = 52 0 0769 7 6, , %

Veriﬁque e compreenda: favoráveis/ possíveis!!!

5

10

15

(27)

eção: Léo 03/12/08 -||-

Isso signiﬁca que, se houver uma repetição signiﬁcativa deste experimento, ou seja, de se retirar quatro ases de um baralho de 52 cartas, um evento como este tem probabilidade de ocorrer em 7,6% das vezes.

Chance

Existe uma maneira diferente de se exprimir as probabilidades; em vez de se comparar o número de casos favoráveis ao número de casos possíveis, compara-se o número de resultados favoráveis ao número de casos desfavoráveis. Isso pode ser expresso das duas formas abaixo:

Chance numero de resultados favoraveis numero de resultados desfa = vvoraveis

´

ou

Por exemplo, numa sala de aula, temos um total de 50 alunos, 22 homens e 28 mulheres. Qual seria, então, a probabilidade, e a chance, a favor de se selecionar, aleatoriamente, desta sala, uma mulher?

Probabilidade:

ε: retirar pessoas de uma sala de aula Ω: 22 homens e 28 mulheres

Evento A: selecionar uma mulher P A

( )

= P A + = ⇒

( )

= = 28 22 28 28 50 0 56 56, %

A probabilidade de se retirar uma mulher é, portanto, de 56%.

Chance:

Evento A: selecionar uma mulher Chance casos favoraveis

casos desfavoraveis ou = =28= 22 14 11 14 11:

´

Novamente: chance = número de resultados favoráveis: número de resultados desfavoráveis. 5 10 15 20 25

(28)

eção: Léo 03/12/08 -||-

As chances de se retirar uma mulher da sala são, portanto, de 14 para 11.

7.1.1.2 Método empírico ou frequencial

Quando tratamos de situações em que os resultados não são igualmente prováveis, podemos tentar estimar as probabilidades, obtendo alguns dados empíricos. Uma estimativa das probabilidades baseada justamente nesses dados empíricos, que serão obtidos por meio de experimentos aleatórios ou através de dados históricos. É importante ressaltar que neste caso a probabilidade será uma estimativa do verdadeiro valor.

Por exemplo, se tivermos um experimento em que lançamos um dado 100 vezes. Se destas 100 vezes, obtivermos a face 4 em 40 vezes, num próximo lançamento do dado seria razoável supor que a probabilidade estimada futura da face 4 como sendo

P 4 40 100 40

( )

= = % , se este experimento se der a condições idênticas.

Da mesma maneira, quando é testada uma vacina em um grupo de 1000 pessoas, por exemplo, e a vacina apresenta sucesso em 700 delas, se o teste é repetido, devemos esperar uma probabilidade estimada de sucesso futuro da vacina

P s

( )

= 700 = = 1000

7

10 70% , sob condições idênticas para a ocorrência deste resultado. Sendo assim, podemos calcular a estimativa da probabilidade de um evento futuro baseado no método empírico através da seguinte fórmula:

P A numero de ocorrencias de A numero total de

( )

= observações

´

^

Se, por outro lado, ao invés de dispormos da possibilidade de obter os dados amostrais através da realização de um experimento dispomos de dados históricos em uma distribuição

5

10

15

20

(29)

eção: Léo 03/12/08 -||-

de frequência, ou na forma de dados publicados, ou como resultado de testes prévios, ou como informações que foram acumuladas em algum arquivo importante, podemos também calcular a probabilidade estimada pelo método frequencial. Mas para isso é preciso que partamos da premissa de que o passado é representativo do futuro.

Por exemplo, suponhamos que uma distribuidora de chocolates acompanha suas vendas durante 90 dias. O objetivo desta distribuidora seria projetar as vendas para o futuro a ﬁm de planejar seus estoques. Deste acompanhamento resultou a distribuição de frequência abaixo:

Número de chocolates vendidos, em kg, no período de 90 dias

Quilos vendidos Número de dias

20 10 30 20 40 20 50 30 60 10 Total 90

Neste caso, também podemos adotar o método empírico, procurando determinar qual o percentual de vezes em que ocorreu tal evento. Por exemplo, o distribuidor de chocolates vendeu 40 quilos do produto em 20 dias dos 90 dias totais de nossa observação. Então, neste caso, a estimativa de probabilidade desta ocorrência é P 40 20

90 2 9

( )

= = . A probabilidade é, portanto, a partir do método empírico, uma proporção da ocorrência de um evento ou a frequência relativa do evento. Assim, para as demais classes, as probabilidades serão dadas como segue na tabela abaixo da distribuição de frequências, seguindo agora a seguinte fórmula:

P (A): probabilidade de ocorrer o evento A; ƒ_A: frequência absoluta do evento A;

∑

ƒ_A: total de observações. P A A A ( )=

∑

ƒƒ , onde 5 10 15 20 25

(30)

eção: Léo 03/12/08 -||-

Número de chocolates vendidos, em Kg, no período de 90 dias

Quilos vendidos Número de dias₍_ƒ

A) Probabilidade ƒ_A

∑

ƒ_A 0 10 1₉ 30 20 2₉ 40 20 2₉ 50 30 1₃ 50 10 1₉ Total 90

Algumas observações são importantes de serem ressaltadas quando utilizamos o método empírico para calcular a probabilidade.

I) Quando se calcula a probabilidade a partir do método empírico, obtemos apenas uma estimativa do verdadeiro valor da probabilidade. Não temos dados suﬁcientes para determinar o valor exato da probabilidade.

II) O tamanho da amostra é fundamental para determinar a estimativa da probabilidade. Quanto maior o número de observações e, portanto, a amostra, melhor a estimativa da probabilidade.

III) A probabilidade só é válida para um conjunto de condições idênticas àquelas geradoras dos dados amostrais.

5

10

(31)

eção: Léo 03/12/08 -||-

7.1.2 Método subjetivo

Nos itens anteriores, propusemo-nos a calcular probabilidades que se originavam de fatos, fosse através do método clássico ou do método empírico. No entanto, ao longo do estudo da estatística, surgiram diversas situações em que os eventos não eram passíveis de um estudo objetivo e muito menos eram igualmente prováveis. Neste caso, então, faz-se necessário atribuir-se subjetivamente uma probabilidade. Por exemplo:

Você encontrará o amor da sua vida amanhã? Quando os operários do metrô farão nova greve?

Uma mulher com câncer de mama se recuperará completamente?

Nestes casos, mesmo que não seja possível efetuar o experimento, pode-se imaginar um grande número de situações idênticas e questionar-se qual será o percentual dessas situações que produzirá o evento desejado.

O método subjetivo é semelhante ao método empírico, a única diferença é que, em geral, os dados não podem ser coletados. A probabilidade subjetiva serve como um esforço não apenas para quantiﬁcar, mas para conﬁrmar nossa crença a respeito de algo.

Probabilidade subjetiva é uma avaliação pessoal do grau de viabilidade de um evento.

Existem, obviamente, algumas desvantagens importantes que este método apresenta:

I) as estimativas subjetivas são, em geral, difíceis de defender quando postas em dúvida;

II) as estimativas subjetivas podem ser tendenciosas.

5

10

15

20

(32)

eção: Léo 03/12/08 -||-

7.2 Principais teoremas de probabilidade

I) Digamos que temos um evento A qualquer, e um conjunto φ que representa o conjunto vazio. Suponhamos ainda que A e φ sejam disjuntos, então temos:

A P A B P A P P A P A P A A P ∩ = ∪

(

)

=

( )

+

( )

=

( )

+

( )

⇒ ∪ = ⇒

( )

= ϕ ϕ ϕ ϕ ϕ ϕ Portanto 0

Sendo assim, temos que o primeiro teorema importante de probabilidade é o seguinte:

Se φ é o conjunto vazio, então P φ

( )

= 0 .

II) Sejam dois eventos A e A, em que A é complemento de A, e o espaço amostral Ω pode ser escrito da seguinte forma: Ω = A ∪ A. Além disso, A e A são mutuamente exclusivos. Sendo assim, temos: A A m exclusivos P A A P A P A P P A P A P P ∩ = ⇒ ∪

( )

=

( )

+

( )

=

( )

+

( )

⇒

( )

= = ϕ . Ω Ω 1 1 AA P A P A P A

( )

+

( )

= −1

( )

Se A é complemento de A, então P A

( )

= −1 P A

( )

.

III) Se, por outro lado, temos o seguinte conjunto B A= ∪ ∩

( )

A B , onde A e A B∩ são mutuamente exclusivos, então: P B P A P A B P A B P B P A P B P A

( )

=

( )

+

( )

∩ ∩

( )

=

( )

−

( )

−

( )

≥0 5 10 15 20 25

(33)

eção: Léo 03/12/08 -||-

IV) Teorema da soma: se A e B são dois eventos quaisquer, então:

P A B

(

∪

)

=P A

( )

+P B

( )

−P A B

(

∩

)

_.

Quando há mais de um resultado possível, então: P(evento A) = nº de elementos do evento A

nº de resultados possíveis Vamos ver alguns exemplos:

Exemplo 1: qual é a probabilidade de se extrair uma das quatro damas de um baralho de 52 cartas?

P(dama) = 4 52.

Exemplo 2: três estudantes A, B e C estão em uma competição de natação. A e B têm as mesmas chances de vencer e, cada um, tem duas vezes mais chances de vencer do que C. Pede-se calcular a probabilidade de A ou C vencer.

Solução

Sejam p(A), p(B) e p(C) as probabilidades individuais de A, B, C vencerem.

Pelos dados do enunciado, temos: p(A) = p(B) = 2.p(C). Seja p(A) = k, então, p(B) = k e p(C) = k/2. Temos: p(A) + p(B) + p(C) = 1.

Veriﬁque, matematicamente, estas propriedades utilizando a teoria dos conjuntos!

5

10

15

(34)

eção: Léo 03/12/08 -||-

Isso é explicado pelo fato de que a probabilidade de A vencer ou B vencer ou C vencer é igual a 1 (evento certo).

Assim, substituindo, temos: k + k + k/2 = 1 \ k = 2/5.

Portanto, p(A) = k = 2/5, p(B) = 2/5 e p(C) = 2/10 = 1/5. A probabilidade de A ou C vencer será a soma dessas probabilidades, ou seja 2/5 + 1/5 = 3/5.

Exemplo 3: um dado é viciado, de modo que cada número par tem duas vezes mais chances de aparecer num lançamento que qualquer número ímpar. Determine a probabilidade de, num lançamento, aparecer um número primo.

Solução

Pelo enunciado, podemos escrever:

p(2) = p(4) = p(6) = 2.p(1) = 2.p(3) = 2.p(5). Seja p(2) = k, poderemos escrever:

p(2) + p(4) + p(6) + p(1) + p(3) + p(5) = 1, ou seja: a soma das probabilidades dos eventos elementares é igual a 1.

Então, substituindo, vem:

k + k + k + k/2 + k/2 + k/2 = 1 \ k = 2/9. Assim, temos: p(2) = p(4) = p(6) = 2/9 p(1) = p(3) = p(5) = 2/18 = 1/9. 5 10 15 20

(35)

eção: Léo 03/12/08 -||-

O evento sair número primo corresponde a sair o 2, ou o 3, ou o 5. Logo,

p(2) + p(3) + p(5) = 2/9 + 1/9 + 1/9 = 4/9.

Exemplo 4: possuo três jarros idênticos e desejo ornamentá-los com dezoito rosas, sendo dez vermelhas e oito amarelas. Desejo que um dos jarros tenha sete rosas, e os outros dois, no mínimo, cinco rosas. Cada um deverá ter, pelo menos, duas rosas vermelhas e uma amarela. Quantos arranjos ﬂorais poderei fazer usando as dezoito rosas?

Solução

Sejam os jarros J₁, J₂ e J₃.

Pelos dados do enunciado, temos:

a) um dos jarros deverá ter sete rosas; seja J₁ este jarro. Poderemos ter as seguintes combinações, lembrando que existe uma outra condição dada no enunciado, de que cada jarro tenha no mínimo duas rosas vermelhas e uma amarela:

1) 5 A + 2 V (cinco rosas amarelas e duas vermelhas); 2) 4 A + 3 V (quatro rosas amarelas e três vermelhas); 3) 3 A + 4 V (três rosas amarelas e quatro vermelhas); 4) 2 A + 5 V (duas rosas amarelas e cinco vermelhas); 5) 1 A + 6 V (uma rosa amarela e seis vermelhas);

b) nos outros dois jarros, J₂ e J₃, deverão ser distribuídas as 18 – 7 = 11 rosas restantes, obedecendo-se ao critério de que em cada jarro tenha no mínimo cinco rosas, sendo pelo menos duas vermelhas e uma amarela.

5

10

15

20

(36)

eção: Léo 03/12/08 -||-

Vamos supor seis rosas no jarro 2 e cinco rosas no jarro 3. Temos então que, partindo das cinco composições possíveis para o jarro J₁ (item (a) acima), dividir convenientemente as rosas restantes, observando-se as regras dadas e as suas quantidades.

Veja a tabela abaixo, em que V = rosa vermelha e A = rosa amarela.

Situação _{7 rosas}Jarro 1 Jarro 2_{6 rosas} Jarro 3_{5 rosas} _{18 rosas}Total

01 5A + 2V 1A + 5V 2A + 3V 18 02 5A + 2V 2A + 4V 1A + 4V 18 03 4A + 3V 1A + 5V 3A + 2V 18 04 4A + 3V 2A + 4V 2A + 3V 18 05 4A + 3V 3A + 3V 1A + 4V 18 06 3A + 4V 2A + 4V 3A + 2V 18 07 3A + 4V 3A + 3V 2A + 3V 18 08 3A + 4V 4A + 2V 1A + 4V 18 09 2A + 5V 4A + 2V 2A + 3V 18 10 2A + 5V 3A + 3V 3A + 2V 18 11 1A + 6V 4A + 2V 3A + 2V 18

Observe que, na tabela, em cada linha, as rosas vermelham somam dez e as rosas amarelas somam oito, conforme enunciado. Além disso, ﬁxamos o jarro 3 como aquele que receberia o número mínimo de rosas (cinco), restando as seis rosas para serem distribuídas convenientemente no jarro 2, já que no jarro 1 deveriam ﬁcar sete rosas, ou seja: 7 + 6 + 5 = 18, que é o número total de rosas. Vemos, na tabela acima, que existem onze possibilidades de solucionar o problema dado.

A melhor maneira, entretanto, de esquematizar a solução deste interessante problema é construir uma árvore de possibilidades conforme indicado a seguir, tendo em mente

5

10

(37)

eção: Léo 03/12/08 -||-

o cumprimento das condições impostas nos itens (a) e (b) supra. O 5A + 2V 4A + 3V 3A + 4V 2A + 5V 1A + 6V 4A + 2V 4A + 2V 2A + 4V 1A + 5V 1A + 5V 2A + 4V 1A + 4V 2A + 3V 2A + 4V 3A + 3V 1A + 4V 2A + 3V 3A + 2V 3A + 3V 4A + 2V 1A + 4V 2A + 3V 3A + 2V 3A + 3V 3A + 2V 2A + 3V 3A + 2V 1 2 3 4 5 6 7 8 9 10 11 Ou seja, são possíveis onze arranjos ﬂorais, obedecendo às condições dadas no enunciado do problema.

8 REVISÃO

Este módulo registra os conceitos mais utilizados em uma análise estatística de dados, para qualquer tipo de área de atuação; portanto, é, como um todo, essencial na veriﬁcação dos conceitos abordados por este curso.

A partir do século XX, os métodos estatísticos foram desenvolvidos como uma mistura de ciência, tecnologia e lógica para a solução e investigação de problemas em várias áreas do conhecimento humano. Ela foi reconhecida como um campo da ciência neste período, mas sua história tem início bem anterior a 1900. A estatística moderna é uma tecnologia quantitativa para a ciência experimental e observacional que permite avaliar e estudar as incertezas e os seus efeitos no planejamento e interpretação de experiências e de observações de fenômenos da natureza e da sociedade.

(38)

eção: Léo 03/12/08 -||-

A estatística não é apenas um ramo da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma determinada população. A estatística também não se limita a um conjunto de elementos numéricos relativos a um fato social, nem a números, tabelas e gráﬁcos usados para o resumo, a organização e apresentação dos dados de uma pesquisa, embora este seja um aspecto da estatística que pode ser facilmente percebido no cotidiano.

Ela é uma ciência multidisciplinar, que permite a análise estatística de dados em qualquer área de interesse: física, economia, agronomia, química, geologia, matemática, biologia, sociologia, psicologia, ciências políticas, administração, etc.

Como deﬁnição atual: estatística é uma ciência que estuda e pesquisa sobre o levantamento de dados com a máxima quantidade de informação possível para um dado custo; sobre o processamento de dados para a quantiﬁcação da quantidade de incerteza existente na resposta para um determinado problema; sobre a tomada de decisões em condições de incerteza, sob o menor risco possível.

De fato, tem sido utilizada na pesquisa cientíﬁca para a otimização de recursos econômicos, para o aumento da qualidade e produtividade, na otimização em análise de decisões, em questões judiciais, previsões e em muitas outras áreas.

Façam um ótimo uso desta poderosa ferramenta cientíﬁca!

Revisão - módulo 1 - Introdução à estatística

• A estatística é uma técnica que engloba os métodos cientíﬁcos para a coleta, organização, apresentação, tratamento e análise de dados.

(39)

eção: Léo 03/12/08 -||-

• O objetivo da estatística é fazer com que dados dispersos se transformem em informação organizada e útil.

• Universo é o conjunto de possíveis elementos a serem observados e de onde obteremos os dados.

• População seria um subconjunto do universo, na medida em que se constitui de um grupo de objetos ou indivíduos com características comuns.

• A amostra é uma parte representativa da população que será examinada quando for impossível ou impraticável observar todo o grupo representado pela população. • Uma fonte estatística é direta quando o dado é obtido

de uma fonte primária, ou seja, toma-se a informação diretamente na fonte e produzem-se as informações a partir disso.

• Fonte indireta é quando o dado é obtido através de uma fonte secundária.

• Estatística descritiva é a parte da estatística que procura organizar, resumir e simpliﬁcar informações complexas, a ﬁm de torná-las de mais fácil entendimento, exposição e discussão.

• Se não há a possibilidade da descrição de fatos pela existência de circunstâncias ou experimentos que envolvam o acaso, usa-se a probabilidade.

• A inferência estatística propõe-se a analisar e a interpretar dados que são obtidos através de uma amostra.

• Dados brutos - dados que ainda não foram numericamente organizados e processados.

• Variável contínua: é a variável que pode assumir qualquer valor num intervalo contínuo.

5

10

15

20

(40)

eção: Léo 03/12/08 -||-

• Variável discreta: origina-se da contagem de itens e só pode assumir valores inteiros.

• Variáveis nominais: são aquelas que existem com o objetivo de deﬁnir categorias.

• Variáveis por posto: quando existe o desejo de dispor os elementos observados segundo uma ordem de preferência ou desempenho.

• Rol: quando organizamos os dados brutos em ordem crescente ou decrescente de grandeza.

• Distribuição de frequência: organizar os dados brutos em classes, a ﬁm de identiﬁcar o número de itens pertencentes a cada classe, denominado frequência de classe.

• Se uma determinada variável y tiver os valores 3, 5, 7, 9 e 11, o

∑

y será:

∑

y = 3+5+7+9+11.

•

∑

_in₌₁x=

∑

x_i =

∑

x= somar as n observações de x_i começando com a primeira.

•

∑

c x c. = .

∑

x= valor da variável x multiplicado ou dividido por uma constante.

• c_i nc

i i n

=

∑

= o somatório de uma constante c será igual ao produto da constante pelo número de vezes que ela se repete. • ( ) ( ) x y x y x y x y i i i i i n i n i n i i i i i n i n i n + = + − = − = = = = = =

∑

1 1 1 1 1 1

= a soma ou a diferença de duas variáveis será igual à soma ou à diferença dos somatórios individuais das duas variáveis.

5

10

15

20

(41)

1/08 -||- 1º Revisão: Ana - Corr eção: Léo 03/12/08 -||- • ( x_i) (x x x ... x ) i n n =

∑

= + + + + 1 2

1 2 3 2= soma dos valores de

x_i elevado ao quadrado.

Revisão - módulo 2 - Medidas de tendência central: média, moda e mediana para dados simples

As medidas de tendência central denotam um valor no centro ou no meio de um conjunto de dados. Essas medidas servem para dar uma ideia acerca dos valores médios da variável em estudo. São utilizadas para sintetizar em um único número o conjunto de dados observados. Enquanto as tabelas de frequência e gráficos revelam a natureza ou a forma da distribuição de um conjunto de dados, as medidas de tendência central focalizam a determinação de valores típicos ou representativos de um conjunto de dados. Há diferentes maneiras de definir o centro e, assim, há diferentes definições de medidas de tendência central, como a média, a mediana, a moda e o ponto médio.

A média

A média aritmética é, de modo geral, a mais importante de todas as mensurações numéricas descritivas. Na ﬁgura abaixo, ilustramos a propriedade da média como centro do conjunto de dados, no sentido de que é um ponto de equilíbrio dos mesmos. Existem vários tipos de média (aritmética, ponderada, geométrica, harmônica, etc.).

5

10

15

(42)

eção: Léo 03/12/08 -||-

Deﬁnição: a média aritmética de um conjunto de valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. Essa deﬁnição pode expressar-se através da fórmula 1 abaixo, em que

∑

x representa a soma de todos os valores e n denota o tamanho da amostra, que é o número de valores em questão.

Fórmula 1: Média = �

∑

x n

A média pode denotar-se por x se o conjunto de valores de que dispomos é uma amostra extraída de uma população maior. Se todos os valores da população foram considerados, denotamos por

µ

a média calculada. As estatísticas amostrais são, em geral, representadas por letras do alfabeto latino, como x, ao passo que os parâmetros populacionais costumam representar-se por letras gregas, como

µ

. A média pode ser interpretada como o centro de gravidade, isto é, o ponto de equilíbrio das discrepâncias positivas e negativas.

Notação:

∑

=> denota somatório de um conjunto de valores;

x => é a variável usada para representar valores individuais dos dados;

n => representa o número de valores em uma amostra; N => representa o número de valores em uma população. • Média aritmética simples: média =

∑

=

x n i i n 1 _;

• Média aritmética para a população:

µ =

∑

= Xi N i i N , onde

µ => Média aritmética da população (parâmetro) N => Total de observações da população (total da população)

X_i=> Cada variável populacional 5

10

15

(43)

eção: Léo 03/12/08 -||-

• Média aritmética para a amostra:

x x n i i n =

∑

=1 _{, onde}

x => Média aritmética da amostra (estimativa) n => Número de dados da amostra

x_i=> Cada variável da amostra

• A soma de uma constante à média: x c x n x x n nc n x x c i i n i i n 2= 1 2 1 2 1 + ⇒ = + ⇒ = + = =

∑

( )

∑

; • Soma algébrica dos desvios em torno da média:

x_i − =x

∑

0 .

• Média aritmética ponderada: x

w x w p i i i n i i n = = =

∑

1 1 .

• Posição da mediana: posmed posmed= +(n 1) 2 .

• Mediana: o elemento que ocupa a posição central num determinado conjunto de dados ordenados.

• No cálculo da média, todos os valores da amostra são levados em conta, ao passo que no caso da mediana, isto não ocorre. Por esta razão, valores muito grandes ou muito pequenos, comparados aos demais valores da amostra, causam grandes variações na média, o que, em geral, não ocorre com a mediana. Por isso, dizemos que a mediana é uma medida robusta, isto é, resistente a valores atípicos. • A mediana de um conjunto de números, organizados em

ordem de grandeza (isto é, em um rol), é o valor central ou a média aritmética dos dois valores centrais.

5

10

(44)

eção: Léo 03/12/08 -||-

• Moda: o valor ou valores que mais se repetem em um conjunto de dados. A moda de um conjunto de dados é o valor que ocorre com maior frequência, ou seja, é o valor mais comum. Quando dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto é multimodal. A moda pode não existir e, mesmo que exista, pode não ser única. Quando nenhum valor é repetido, o conjunto não tem moda. Costuma-se denotar a moda por Mo.

Revisão - módulo 3 – Medidas de dispersão para dados simples

• Amplitude total: Amplitude_total= Valor_máximo~Valor_mínimo

• Desvio médio absoluto: D_médio=

x x n i i n − =

∑

1 _. • Variância populacional: σ2 ₌

∑

(x −µ)2 N i _. • Variância amostral: s x x n i 2 2 1 = − −

∑

( ) .

• Se somar ou subtrair uma constante a cada elemento de um conjunto de dados, o valor da variância não se altera. • Ao multiplicarmos uma constante pela variância, a nova

variância será: σ₂2 2σ

12

= c . .

• Ao dividirmos a variância por uma constante, a nova variância será: σ₂2 σ12

2

= c .

• A variância de uma constante é igual a zero.

5

10

15

(45)

eção: Léo 03/12/08 -||-

• Desvio padrão populacional: σ=

∑

(x −µ) N

i 2 _.

• Desvio padrão amostral: s x x n i = − −

∑

( )2 1 .

Revisão - módulo 4 – Distribuição de frequências

• A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com características semelhantes – as classes ou categorias.

• Amplitude total: A_total= V_máximo- V_mínimo

• A teoria estatística tem se desenvolvido ao longo dos anos e chegou ao consenso de que é aconselhável estabelecer o número de classes entre um mínimo de cinco e um máximo de vinte.

• Para determinar o número de classes: Número_classes= n . • Para determinar a amplitude de classes:

Amplitude Amplitude Numero classes total classes =

´

.

• O intervalo de classes é composto por um limite inferior (número menor) e por um limite superior (número maior). • Após o cálculo do número de classes e da amplitude de

classes, devemos deﬁnir os limites inferior e superior de cada classe.

• Frequência absoluta simples (ƒ_i): número de observações existentes em um dado intervalo.

5

10

15