1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
5 AS MEDIDAS DE POSIÇÃO E VARIABILIDADE NUMA DISTRIBUIÇÃO DE FREQUÊNCIA
Vamos agora usar os conhecimentos obtidos no módulo 4 para aprender a calcular as medidas de posição e variabilidade em uma distribuição de frequência.
Ao longo deste módulo, vamos utilizar o mesmo exemplo que trabalhamos no módulo 4, da distribuição de frequência das idades dos alunos formandos em Gestão de uma Universidade fictícia AB.
Idade de 100 estudantes formandos do curso de Gestão de uma Universidade AB em dez/2006
Idade Número de estudantes
20 a 22 8 22 a 24 10 24 a 26 12 26 a 28 20 28 a 30 17 30 a 32 15 32 a 34 9 34 a 36 5 36 a 38 3 38 a 40 1 Total = 100
Podemos, ao longo deste módulo, aproveitar uma série de informações que construímos a partir dos dados brutos que tínhamos no módulo 4, tal como disposto na tabela abaixo, e,
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
partindo destas informações, construir as medidas de posição e variabilidade para uma distribuição de frequência.
Tabela 5.1 Classes
ƒ
iƒ
i, Aƒ
i, R 20 |- 22 8 8 0,08 22 |- 24 10 18 0,10 24 |- 26 12 30 0,12 26 |- 28 20 50 0,20 28 |- 30 17 67 0,17 30 |- 32 15 82 0,15 32 |- 34 9 91 0,09 34 |- 36 5 96 0,05 36 |- 38 3 99 0,03 38 |- 40 1 100 0,01Σ
100 1 5.1 As medidas de posição 5.1.1 A médiaNo módulo 2, como trabalhávamos com um conjunto de dados pequeno para calcular a média deste grupo de números, era necessário organizá-los em um rol, identificar os valores de xi, fazer o somatório e então calcular a média a partir da fórmula apresentada.
No entanto, quando se tem uma distribuição de frequências, nem sempre dispomos dos valores de todas as observações, ou a amostra é, por vezes, tão grande que não é viável fazer o cálculo da mesma maneira que fazemos quando os dados estão dispostos em um rol. Geralmente, quando estamos diante de uma distribuição de frequência, o que dispomos é do número de observações em cada classe, mas não dispomos dos valores em si de xi. Portanto, as
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
observações em uma dada distribuição de frequência serão representadas pelo ponto médio de cada classe. A fórmula para o cálculo do ponto médio será:
Limite inferior + Limite superior Pmédio = Xi = 2
Assim, temos que a média numa distribuição de frequências é: x : média aritmética da distribuição de frequência;
ƒ
i: frequência absoluta simples; Xi : ponto médio de cada classe; n : número de observações.∑
ƒ
i Xix = --- , onde n
No nosso exemplo de distribuição de frequência das idades, podemos calcular a média a partir da construção de uma nova tabela: Tabela 5.2 Classes
ƒ
iƒ
i, Aƒ
i, R Xiƒ
i, Xi 20 |- 22 8 8 0,08 21 168 22 |- 24 10 18 0,10 23 230 24 |- 26 12 30 0,12 25 300 26 |- 28 20 50 0,20 27 540 28 |- 30 17 67 0,17 29 493 30 |- 32 15 82 0,15 31 465 32 |- 34 9 91 0,09 33 297 34 |- 36 5 96 0,05 35 175 36 |- 38 3 99 0,03 37 111 38 |- 40 1 100 0,01 39 39Σ
100 1 2818Para o cálculo da média aritmética, usa-se uma fórmula que deriva da fórmula de cálculo da média ponderada para determinar a média de uma distribuição de frequência, substituí-se os pesos pelas frequências de classes e xi pelo ponto médio, representado por Xi.
5
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Calculando a média aritmética para o exemplo, onde n = 100, temos então: x X n x i i = = + + + + + +
∑
ƒ ( . ) ( . ) ( . ) ( . ) ( . ) ( . ) (8 21 10 23 12 25 20 27 17 29 15 31 99 33 5 35 3 37 39 100 168 230 300 540 493 465 297 17 . ) ( . ) ( . )+ + + = + + + + + + + x 55 111 39 100 2818 100 28 18 + + = = x ,A idade média dos estudantes de Gestão da Universidade AB que se formaram no ano de 2006 seria de 28,18 anos, de acordo com a distribuição de frequência aqui construída.
5.1.2 A mediana
Em uma distribuição de frequências de uma variável contínua, devem-se seguir alguns passos para calcular a mediana.
Da mesma forma que nos dados organizados em um rol, precisamos primeiro identificar a posição da mediana. O primeiro passo é calcular a ordem n
2, e parte-se para a frequência acumulada para identificar a classe que contém a mediana. Feito isto, utiliza-se a seguinte fórmula para o cálculo da mediana:
MD: limite inferior da classe da mediana;n : tamanho da amostra;
∑
ƒ
: soma das frequências anteriores à da mediana; h : amplitude da classe da mediana;FMD: frequência da classe da mediana. x n h F MD MD ~ ( ). = + 2−
∑
ƒ onde:Como vimos também no módulo 2, a mediana é o elemento que ocupa a posição central num determinado conjunto de dados ordenados.
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Para a distribuição de frequência, temos que seguir esses passos para calcular a mediana.
No exemplo anterior, calcular: a) primeiro calculamos n
2 100
2 50
= = ;
b) identificar a classe da mediana a partir da frequência acumulada, procurando descobrir onde a observação de número 50 está alocada. No nosso exemplo, ela estará na quarta classe, que possui limite inferior de 26 e limite superior de 28;
c) calcular a mediana através de: x n h F MD MD ~ ( ). = + 2−
∑
ƒ , onde MD= 26 ; n=100; ƒ =∑
30; FMD= 20 x x ~ ~ ( ). = + − = + = 26 50 30 2 20 26 2 28 .A mediana de nossa distribuição de frequência será 28 anos, ou seja, 50% dos alunos que se formaram em Gestão nesta Universidade AB têm, no máximo, 28 anos.
5.1.3 A moda
Depois disso, aplica-se a chamada fórmula de Czuber, descrita abaixo, para o cálculo da moda, que nos dirá qual é a
Para calcular a moda, é preciso identificar o intervalo de classes de maior frequência, pois é nele que ela se encontra.
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
observação mais frequente daquela distribuição. O cálculo da moda será:
Mod: valor da moda;
L1: limite inferior da classe modal;
D1: diferença entre a frequência da classe modal e a frequência da classe anterior;
D2: diferença entre a frequência da classe modal e a frequência da classe posterior; h: amplitude de classe. M L D D D h od = + + 1 1 1 2 ( ). onde:
Calculemos então a moda para a nossa distribuição de frequência das idades dos alunos de Gestão da Universidade AB que se formaram em 2006. A classe modal será a quarta classe, pois é aquela que apresenta a maior frequência. Temos então:
M M od od = +
(
−)
−(
)
+(
−)
= + + = 26 20 12 20 12 20 17 2 26 8 8 3 2 2 . . 66 16 11 27 5 + = ,A moda seria, portanto, de 27,5 anos, o que significa que a maior quantidade de alunos formando-se no curso de Gestão desta universidade fictícia teria 27,5 anos.
5.2 As medidas de dispersão numa distribuição de frequência
5.2.1 O desvio médio
No caso de uma distribuição de frequência, esta diferença será calculada da seguinte forma:
Dmédio: desvio médio absoluto; Xi: ponto médio de cada classe; x: média da distribuição de frequência;
ƒ
i: frequência absoluta; n: total de observações. Dmédio=∑
X −x f n i .i onde:Recapitulando o módulo 3, o desvio médio indica a diferença entre cada observação e a média aritmética de um determinado conjunto de dados. 5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
No nosso exemplo, temos então: Tabela 5.3 Classes
ƒ
iƒ
i, Aƒ
i, R Xiƒ
i, Xi Xi - x|
xi - x|
.ƒ
i 20 |- 22 8 8 0,08 21 168 -7,18 57,44 22 |- 24 10 18 0,10 23 230 -5,18 51,8 24 |- 26 12 30 0,12 25 300 -3,18 38,16 26 |- 28 20 50 0,20 27 540 -1,18 23,6 28 |- 30 17 67 0,17 29 493 0,82 13,94 30 |- 32 15 82 0,15 31 465 2,82 42,3 32 |- 34 9 91 0,09 33 297 4,82 43,38 34 |- 36 5 96 0,05 35 175 6,82 34,1 36 |- 38 3 99 0,03 37 111 8,82 26,46 38 |- 40 1 100 0,01 39 39 10,82 10,82 ��Σ
100 1 2818 342 Dmédio =∑
X −x n i .ƒi Dmédio =342 = 100 3 42,Logo, o desvio médio de nossa distribuição de frequência será de 3,42. A média, a diferença da idade de cada formando em relação à média aritmética da distribuição das idades será de 3,42.
5.2.2 Variância
Como vimos no módulo 3, a variância também é uma medida de dispersão que tem a média como ponto de referência.
Quando se trata de uma distribuição de frequência de dados populacionais, temos:
σ2: variância populacional; Xi: ponto médio de cada classe; µ: média populacional;
ƒ
i: frequência absoluta simples; σ2 =∑
(X −µ)2N
i ƒi onde:
A variância nos indica o grau de variabilidade de uma determinada distribuição de frequência com relação à sua média aritmética.
5
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Para o caso da variância de valores amostrais, devemos usar:
s2: variância amostral;
Xi: ponto médio de cada classe; x: média aritmética amostral;
ƒ
i: frequência absoluta simples; n: total de observações da amostra. s X x n i i 2 2 1 = − −∑
( ) ƒ onde:No caso da distribuição de frequência das idades, é preciso acrescentar mais duas colunas à tabela para calcular, no nosso exemplo, a variância amostral:
s X x n i i 2 2 1 = − −
∑
( ) ƒ Tabela 5.4 Classesƒ
iƒ
i, Aƒ
i, R Xiƒ
i, Xi Xi - x|
xi - x|
.ƒ
i (Xi - x)2 (Xi - x)2ƒ
i 20 |- 22 8 8 0,08 21 168 -7,18 57,44 51,5524 412,42 22 |- 24 10 18 0,10 23 230 -5,18 51,8 26,8324 268,32 24 |- 26 12 30 0,12 25 300 -3,18 38,16 10,1124 121,35 26 |- 28 20 50 0,20 27 540 -1,18 23,6 1,3924 27,85 28 |- 30 17 67 0,17 29 493 0,82 13,94 0,6724 11,43 30 |- 32 15 82 0,15 31 465 2,82 42,3 7,9524 119,28 32 |- 34 9 91 0,09 33 297 4,82 43,38 23,2324 209,09 34 |- 36 5 96 0,05 35 175 6,82 34,1 46,5124 232,56 36 |- 38 3 99 0,03 37 111 8,82 26,46 77,7924 233,38 38 |- 40 1 100 0,01 39 39 10,82 10,82 117,0724 117,07 ��Σ
100 1 2818 342 1752,25 Assim, temos: s2 1752 25 100 1 17 60 = − = , ,Logo, a variância amostral de nosso exemplo é 17,60.
5
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
5.2.3 Desvio padrão
Para calcular o desvio padrão, basta extrair a raiz quadrada do valor da variância, seja ela variância populacional ou variância amostral.
σ= σ2
Já o desvio padrão amostral será dado como segue: s= s2
No exemplo acima, o nosso desvio padrão seria então: s= 17 60 4 1952, = ,
Exemplo 1: consideremos a distribuição relativa a 34 famílias de quatro fi lhos, tomando para variável o número de fi lhos do sexo masculino:
Nº de meninos (xi)
ƒ
i (xi - x) (xi - x)2ƒ
i(xi - x)2 0 2 (0-2,3)=-2,3 (-2,3)2=5,29 2(5,29)=10,58 1 6 (1-2,3)=-1,3 (-1,3)2=1,69 6(1,69)=10,14 2 10 (2-2,3)=-0,3 (-0,3)2=0,09 10(0,09)=0,9 3 12 (3-2,3)=0,7 (0,7)2=0,49 12(0,49)=5,88 4 4 (4-2,3)=1,7 (1,7)2=2,89 4(2,89)=11,56Σ
ƒ
i = 34Σ
ƒ
i (xi - x)2 = 39,06Calcule a amplitude, o desvio padrão (S), a variância (S2) e o
coefi ciente de variação (cv). Solução
Amplitude:
R= 4 – 0 = 4 meninos,
Lembrando que: em estatística, um histograma é uma representação gráfi ca da distribuição de frequências de um conjunto de medições, normalmente um gráfi co de barras verticais.
Lembrando: em estatística, um histograma é uma representação gráfi ca da distribuição de frequências de um conjunto de medições, normalmente um gráfi co de barras verticais.
O histograma é um gráfi co composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe, e a sua altura, à respectiva frequência. Quando o número de dados aumenta indefi nidamente e o intervalo de classe tende a zero, a distribuição de frequência passa para uma distribuição de densidade de probabilidades. A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Pode indicar se uma distribuição aproxima-se de uma função normal, como pode indicar mistura de populações quando se apresentam bimodais.
Informações técnicas sobre como elaborar um histograma, bem como sua interpretação, são encontradas em literaturas clássicas de estatística.
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
ou seja, a maior variação encontrada nesse conjunto de dados é de 4 meninos.
Obs.: sabemos que a média para esse conjunto de dados é x = 2,3 filhos. Desvio padrão: s x x n x x x x x x n i i i n n n = − − = − + − + + − − = =
∑
ƒ ƒ ƒ ƒ ( ) ( ) ( ) ... ( ) 2 1 1 1 2 2 2 2 2 1 1 = − + − + − + − + − − = 2 0 2 3 6 1 2 3 10 2 2 3 12 3 2 3 4 4 2 3 34 1 2 2 2 2 2 ( , ) ( , ) ( , ) ( , ) ( , ) = 2 2 3− + −6 1 3 +10 0 3− +12 0 7 +4 17 = 33 2 2 2 2 2 ( , ) ( , ) ( , ) ( , ) ( , ) = 2 5 29 6 169 10 0 09 12 0 49 4 2 89+ + + + = 33 ( , ) ( , ) ( , ) ( , ) ( , ) = 10 58 10 14 0 9 5 88 1156+ + + + = 33 , , , , , = 39 06 = ≅ ≅ 33 11836 1 088 1 , , , filho ,ou seja, o número médio de filhos homens por família de 4 filhos é de 2,3, com uma variabilidade de aproximadamente 1 filho, isto é, a maior parte das famílias com 4 filhos tem entre
2,3 + 1 = (1,3 e 3,3) ≅ (1 e 3) filhos homens. Variância: S2 = (S)2 = (1,008)2 ≅ 1,1837 (filhos homens)2. 5 10 15
1/08 -||- 1º Revisão: Ana - Corr eção: Léo 03/12/08 -||- Coeficiente de variação: cv S x = =1 088≅ 2 3 0 4730 ,
, , , ou seja, existe uma variabilidade de 47,30% dos dados em relação à média (variabilidade alta).
Exemplo 2: considere a seguinte distribuição de frequência referente aos salários de operários de uma determinada fábrica: Custos R$ Classes de fr. Pm (xi)
ƒ
i (xi - x) (xi - x)2ƒ
i(xi - x)2 450 |- 550 500 8 (500-754,68)=-254,68 (-254,68)2 = 64861,90 8(64861,90)= 518895,2 550 |- 650 600 10 (600-754,68)=-154,68 (-154,68)2 = 23925,90 10(23925,90)=239259,0 650 |- 750 700 11 (700-754,68)=-54,68 (-54,68)2 = 2989,90 11(2989,90)=32888,9 750 |- 850 800 16 (800-754,68)=45,32 (45,32)2 = 2053,90 16(2053,90)=32862,4 850 |- 950 900 13 (900-754,68)=145,32 (145,32)2 = 21117,90 13(21117,90)=274532,7 950 |- 1050 1000 5 (1000-754,68)=245,32 (245,32)2 = 60181,90 5(60181,90)=300909,5 1050 |- 1150 1100 1 (1100-754,68)=345,32 (345,32)2 = 119245,90 1(119245,90)=119245,9 Total 64Σ
ƒ
i (xi - x)2 = 1518593,6Calcule a amplitude, o desvio padrão (S), a variância (S2) e o
coeficiente de variação (cv). Solução
Amplitude:
R= 1150 – 450 = 700,
ou seja, a maior diferença existente entre os salários dos operários desta determinada fábrica é de R$ 700,00.
Obs.: sabemos que a média para este conjunto de dados é x =754,68 reais.
5
10
1/08 -||- 1º Revisão: Ana - Corr eção: Léo 03/12/08 -||- Desvio-padrão: s x x n x x x x x x n i i i n n n = − − = − + − + + − − = =
∑
ƒ ƒ ƒ ƒ ( ) ( ) ( ) ... ( ) 2 1 1 1 2 2 2 2 2 1 1 8 500 754 68( − , )2+10 600 754 68( − , )2+11700 754 68( − , )2+16 800 754( − ,668 13 900 754 68 5 1000 754 68 11100 754 68 64 1 2 2 2 2 ) + ( − , ) + ( − , ) + ( − , ) − = = 8 254 68(− , )2 +10 154 68(− , )2+ −11 54 68( , )2+16 45 32( , )2+13145 32( , ))2 5 245 32( , )2 1345 32( , )2 63 + + = = 8 64861 90 10 23925 90 112989 90 16 2053 90 13 21227( , )+ ( , )+ ( , )+ ( , )+ ( ,, )90 5 60181 90 1119245 90( , ) ( , ) 63 + + = = 518895 2 239259 0 32888 90 32862 40 274532 70 300909 5 11, + , + , + , + , + , + 99245 90 63 1518593 60 63 , ≅ , = = 24104 66 155 26, ≅ , (reais ,)ou seja, a média dos salários é de R$754,68, com uma variabilidade de aproximadamente R$155,26, ou seja, a maior parte dos operários recebem entre 754,68 + 155,26 = (599,42 e 909,94) reais. Variância: S2 = (S)2 = (155,26)2 ≅ 24104,66 (reais)2 Coeficiente de variação: cv S x = =155 26 ≅ 754 68 0 2057 ,
, , , ou seja, existe uma variabilidade de 20,57% dos dados em relação à média.
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
6 INTRODUÇÃO À PROBABILIDADE
Quando estudamos algum fenômeno através do método estatístico, na maior parte das vezes, é preciso estabelecer uma distinção entre o modelo matemático que construímos para tentar explicar tal fenômeno e o fenômeno em si.
A maioria dos fatos estudados pela estatística apresenta resultados de difícil previsibilidade, dados que variam de uma observação para outra, mesmo em condições normais de experimentação. Para analisar, interpretar e explicar tais fenômenos, é preciso utilizar a probabilidade.
O evento pode ser cara (no caso do lançamento de uma moeda), 6 (no caso do lançamento de um dado), chuva (no caso da observação do tempo), etc. A probabilidade de ocorrer determinado evento será sempre um número entre 0 e 1, indicando aproximadamente a chance de ocorrência deste evento. Quanto mais próxima de 1, maior é a probabilidade de ocorrer este evento; quanto mais próxima de zero, menor a chance de acontecer. Quando a probabilidade de determinado evento é zero, diz-se que este é um evento impossível. Sendo assim, temos:
0 < P (A) < 1.
6.1 Teoria dos conjuntos, espaço amostral e eventos
Um conjunto é definido como um grupo de objetos ou itens que apresentam características comuns. São exemplos de conjuntos os habitantes de São Paulo, os estudantes de Gestão da UNIP, o número de consoantes do alfabeto, o número de vogais do alfabeto, etc.
Podemos descrever os elementos de um conjunto de duas formas: enumerando cada um deles entre chaves, indicando suas características comuns, também entre chaves.
A palavra probabilidade deriva do latim probare (provar ou testar). Informalmente, “provável” é uma das muitas palavras utilizadas para eventos incertos ou conhecidos, sendo também substituída por algumas palavras como “sorte”, “risco”, “azar”, “incerteza”, “duvidoso”, dependendo do contexto.
Tal como acontece com a teoria da mecânica, que atribui definições precisas a termos de uso diário, como “trabalho” e “força”, também a “teoria das probabilidades” tenta quantificar a noção de “provável”.
A probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência de um determinado evento.
O evento é o resultado que se espera de determinado experimento.
A teoria de conjuntos pode ser estudada em detalhes em livros básicos de matemática. 5 10 15 20 25
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
conjunto A = {a, e, i, o, u}; ou
conjunto A = {conjunto das vogais do alfabeto};
conjunto B = {todos os números inteiros maiores que 23}. Em um conjunto finito, podemos identificar todos os seus subconjuntos. O número de subconjuntos de um conjunto finito será obtido através da seguinte fórmula:
Nsubconjuntos = 2n, onde n = número de elementos do conjunto.
Por exemplo, em um conjunto como o dado abaixo, calcule a quantidade de subconjuntos e faça a sua apresentação:
A = {2, 4, 6, 8}.
A quantidade de subconjuntos de A será: Nsubconjuntos A = 2n = 24 = 16.
Os subconjuntos de A serão, portanto:
A = {{2},{4},{6},{8},{2, 4}, {2, 6}, {2, 8}, {4, 6}, {4, 8}, {6, 8}, {2, 4, 6}, {2, 6, 8}, {2, 4, 8}, {4, 6, 8}, {2, 4, 6, 8}, { }}. Ora, se trazemos estes conceitos para a probabilidade, podemos definir então o que seria espaço amostral e evento. Na teoria das probabilidades, temos o chamado experimento, uma experiência que poderá ser repetida sob as mesmas condições indefinidamente.
Para cada experimento existe um conjunto S formado por todos os possíveis resultados deste experimento. Este conjunto é denominado de espaço amostral.
Por exemplo, ao lançar um dado e observar o número da face que fica para cima, teríamos o seguinte conjunto de resultados
5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
possíveis deste experimento e, portanto, o seguinte espaço amostral:
S = Ω = {1, 2, 3, 4, 5, 6}, onde Ω é o espaço amostral. O espaço amostral poderá ser representado pela letra ômega. Sendo o espaço amostral o conjunto de todos os resultados possíveis de uma dada experiência, a probabilidade do espaço amostral deverá ser igual a 1 ou 100%, pois ao menos um dos resultados deve ocorrer.
P (evento qualquer espaço amostral Ω) = 1,00.
Os eventos são os resultados de um experimento. No caso do exemplo, de lançar um dado, seriam exemplos de eventos:
A: ocorrer face igual a 6; B: ocorrer face igual a 5.
O evento é geralmente simbolizado através de uma letra maiúscula.
Poderíamos simbolizar graficamente o espaço amostral e o evento através do diagrama de Venn, para que possamos visualizar melhor a diferença entre estes dois importantes conceitos da teoria das probabilidades.
Evento
Espaço amostral
O que significa então o gráfico acima? Para entendermos melhor, vamos relembrar algumas relações que se estabelecem entre dois ou mais conjuntos, e que tipo de classificação didática isso gera, para entender que implicações isso pode ter para a teoria das probabilidades.
5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Dois ou mais conjuntos que não possuam elementos em comum são chamados conjuntos disjuntos. Por exemplo, sejam os conjuntos abaixo:
A = {3, 5, 7} e B = {9, 11} são dois conjuntos que claramente não apresentam nenhum elemento em comum, e podem ser representados pelo diagrama de Venn, como segue:
A B
3 5
7 9 11
Como A e B não possuem elementos em comum, o resultado da união destes conjuntos irá gerar um novo conjunto, cujo número de elementos será dado pela soma dos elementos de A e dos elementos de B. Temos então:
n(A ∪ B) = n(A) + n(B) n(A ∪ B) = 5
Se dois ou mais conjuntos apresentam elementos em comum, teremos o caso de conjuntos não-disjuntos. Nesse caso, o número de elementos da união dos dois conjuntos será dado pela soma dos elementos de cada conjunto, subtraindo-se os elementos que estes possuem em comum.
A = {2, 4, 6, 8, 10} e B = {8, 10, 12}; n(A ∪ B) = n(A) + n(B) - n(A ∩ B); n(A ∪ B) = 5 + 3 - 2 = 6.
Podemos verificar este resultado comparando-o ao diagrama de Venn, que irá apresentar claramente os elementos da união dos dois conjuntos A e B.
A B 2 4 6 8 10 12 5 10 15 20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Estes conceitos de conjuntos são importantes porque nos permitem, por exemplo, definir novos eventos utilizando estas operações de união e interseção. Assim:
a) (A ∪ B) quando A ocorre, ou B ocorre, ou ambos ocorrem, temos este evento;
b) (A ∩ B) evento só ocorre se A e B ocorrerem simultaneamente;
c) A evento quando A não ocorre.
A partir disso, podemos definir os eventos como complementares, mutuamente exclusivos, não mutuamente exclusivos e coletivamente exaustivos.
Diz-se que dois eventos são complementares quando completam um determinado espaço amostral. É importante ressaltar que os eventos complementares não devem apresentar elementos em comum. A soma das probabilidades de eventos complementares é sempre igual a 1. Podemos representar dois eventos complementares com o diagrama que segue:
Espaço amostral
A
A’
Por exemplo: podemos considerar como eventos complementares ocorrer cara ou coroa no lançamento de uma moeda; atender ou não à porta. O espaço amostral dos dois experimentos, respectivamente, será:
Ω = {cara, coroa}, onde A: ocorrer cara; B: ocorrer coroa. 5 10 15 20 25
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Ω2 = {atender, não atender}, onde,
C: atender à porta; D: não atender à porta.
Em ambos os experimentos, podemos observar que a soma das probabilidades será igual a um, porque os eventos completam o espaço amostral. Assim, no caso dos dois exemplos acima, teremos: P A P B P A P B ( ) ( ) ( ) ( ) = = ⇒ + = 1 2 1 2 1 P C P D P C P D ( ) ( ) ( ) ( ) = = ⇒ + = 1 2 1 2 1
Dois ou mais eventos que não possuem elementos comuns, ou não podem ocorrer simultaneamente, são ditos eventos mutuamente excludentes. Diferente dos eventos complementares, eles não necessariamente completam o espaço amostral. Sendo assim, podemos dizer que todos os eventos complementares são mutuamente exclusivos, mas nem todos os eventos mutuamente exclusivos são complementares. Também é importante ressaltar que na teoria dos conjuntos, os eventos mutuamente exclusivos são os chamados conjuntos disjuntos.
Isso significa que: (A ∩ B) = φ
Para ilustrar graficamente dois eventos mutuamente exclusivos, podemos, mais uma vez, valermo-nos de um diagrama de Venn.
Ω: Espaço amostral A B 5 10 15 20 25
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Por exemplo: no lançamento de um dado, ocorrer as faces 1, 2, 3, 4, 5, 6. São seis eventos mutuamente excludentes, já que dois não podem ocorrer simultaneamente, então a ocorrência de um exclui a ocorrência do outro. Se restringirmos este experimento a apenas duas faces, temos:
Experimento: lançamento de um dado; Ω = {1, 2, 3, 4, 5, 6} (espaço amostral); A: ocorrer a face 2;
B: ocorrer a face 4.
Temos aqui dois eventos mutuamente exclusivos e que não são complementares.
Quando dois eventos apresentam elementos em comum ou podem ocorrer simultaneamente, diz-se que eles são eventos não mutuamente excludentes. Estes eventos podem ser representados através de um diagrama de Venn como segue abaixo:
Ω: Espaço amostral
A B
Como exemplo, podemos nos valer da distribuição de frequências do módulo 4, para dar exemplo de dois eventos que sejam não mutuamente excludentes. Vejamos então a
5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
distribuição de frequência das idades dos alunos formandos do curso de Gestão de uma Universidade AB:
Distribuição de frequência das idades
Classes absoluta simplesFrequência
20 |- 22 8 22 |- 24 10 24 |- 26 12 26 |- 28 20 28 |- 30 17 30 |- 32 15 32 |- 34 9 34 |- 36 5 36 |- 38 3 38 |- 40 1 �
Σ
100Tomando-se a distribuição de frequência acima, podemos dar exemplo de dois eventos não mutuamente exclusivos:
A: apresentar idade entre 20 e 26 anos no momento da formatura;
B: apresentar idade entre 22 e 30 anos no momento da formatura.
Como entre esses dois eventos existem elementos em comum, ou seja, os intervalos de 22 a 26 anos, eles são não mutuamente excludentes. É importante ressaltar que os eventos não mutuamente exclusivos, na teoria dos conjuntos, são os conjuntos não-disjuntos.
Os eventos podem ser ainda coletivamente exaustivos. Isso acontece quando os eventos em questão ocuparem todo o espaço amostral, tornando impossível qualquer outro resultado além daqueles eventos dados. São
5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
considerados eventos coletivamente exaustivos os eventos complementares, mas nem sempre os eventos coletivamente exaustivos serão complementares. Além disso, os eventos coletivamente exaustivos serão, em alguns casos, mutuamente excludentes.
Podemos então representar graficamente eventos coletivamente exaustivos com o diagrama abaixo:
Ω: Espaço amostral
A B C
Assim, são exemplos de eventos coletivamente exaustivos, no caso de um experimento de lançar uma moeda:
A: ocorrer cara; B: ocorrer coroa.
Um outro exemplo seria ao se fazer a experiência de retirar cartas de um baralho, definir como eventos:
A: carta de copas; B: carta de paus; C: carta de ouros; D: carta de espadas.
Temos acima dois exemplos de eventos coletivamente exaustivos.
Vamos a alguns exemplos:
Exemplo 1: em um grupo de 100 pessoas, 70 têm sangue com RH positivo e 45 têm sangue tipo O. Escolhendo-se, ao acaso, uma pessoa desse grupo, qual é a probabilidade de o sangue dessa pessoa ser de tipo diferente de O?
Em teoria das probabilidades, o espaço amostral ou espaço amostral universal, geralmente denotado S, Ω ou U (de “universo”), de um experimento ou teste aleatório é o conjunto de todos os resultados possíveis. Por exemplo, se o experimento é lançar uma moeda e verificar a face voltada para cima, o espaço amostral é o conjunto {cara, coroa}. Para o lançamento de um dado de seis faces, o espaço amostral é {1, 2, 3, 4, 5, 6}. Qualquer subconjunto de um espaço amostral é comumente chamado um evento, enquanto subconjuntos de um espaço amostral contendo apenas um único elemento são chamados eventos elementares.
Para alguns tipos de experimentos, podem existir dois ou mais espaços amostrais possíveis plausíveis. Por exemplo, quando retirada uma carta de um baralho de 52 cartas, uma possibilidade poderia ser o valor dela (Ás até o Rei), enquanto outra poderia ser o naipe (copa, ouro, espada ou paus). Uma descrição completa dos resultados, entretanto, especifica ambas: denominação e naipe; e um espaço amostral descrevendo cada carta individualmente pode ser construído através do produto cartesiano dos dois espaços amostrais citados.
Espaços amostrais aparecem naturalmente em uma introdução elementar à probabilidade, mas são também importantes em espaços de probabilidade. Um espaço de probabilidade (Ω, F, P) incorpora um espaço amostral de resultados, Ω, mas define um conjunto de eventos de interesse, o σ-algebra F, para o qual a medida de probabilidade P é definida. 5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Solução
Seja x o número de pessoas que têm sangue RH positivo e têm também sangue tipo O. Representando os conjuntos por meios de diagramas de Venn, tem-se:
70 - x + x + 45 - x = 100. RH+
O 70 - x x 45 - x
Daí vem que 70 + 45 - x = 100. Então, x = 115 - 100 = 15.
Assim, o número de pessoas que têm sangue de o tipo diferente de O é: 70 - 15 = 55.
Logo, num total de 100 pessoas, temos 55 possibilidades (chances) de escolha.
Então, podemos dizer que a probabilidade de o sangue dessa pessoa ser de tipo diferente de O é 55/100 = 55%.
De uma outra maneira, mais rápida: como 45 têm sangue tipo O, então, o número de pessoas que têm sangue do tipo diferente de O é:
100 - 45 = 55.
Logo, a probabilidade é de 55 possibilidades num total de 100, isto é, 55%.
Exemplo 2: Maria vai sair com suas amigas e, para escolher a roupa que usará, separou duas saias e quatro blusas. De quantas maneiras ela pode se arrumar?
5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Solução
O chamado Princípio Fundamental da Contagem (PFC) diz: se alguma escolha pode ser feita de M diferentes maneiras e alguma escolha subsequente pode ser feita de N diferentes maneiras, há M×N diferentes maneiras pelas quais essas escolhas podem ser feitas sucessivamente. Observe a tabela abaixo:
blusa 1 blusa 2 blusa 3 blusa 4 saia 1 saia 1 e blusa 1 saia 1 e blusa 2 saia 1 e blusa 3 saia 1 e blusa 4
saia 2 saia 2 e blusa 1 saia 2 e blusa 2 saia 2 e blusa 3 saia 2 e blusa 4
Contando as possibilidades, vemos que Maria pode se arrumar de 8 maneiras distintas. De fato, a ação é constituída de duas etapas sucessivas. A primeira (vestir a saia) pode ser realizada de duas maneiras distintas. Para cada uma dessas possibilidades, a segunda (vestir a blusa) pode ser realizada de quatro maneiras distintas. Assim, pelo Princípio Fundamental da Contagem (PFC), o número de efetuar a ação completa é 2 × 4 = 8.
Exemplo 3: há quatro estradas ligando as cidades A e B, e três estradas ligando as cidades B e C. De quantas maneiras distintas pode-se ir de A a C, passando por B?
Solução
A ação é constituída de duas etapas sucessivas. A primeira (ir de A até B) pode ser realizada de três maneiras. Para cada uma dessas possibilidades, a segunda (ir de B até C) pode ser realizada de quatro maneiras. Então, pelo PFC, o número de maneiras de ir de A até C é 3 × 4 = 12.
Exemplo 4: uma prova de matemática consta de 10 questões do tipo V ou F. Se todas as questões forem respondidas ao acaso, qual o número de maneiras de preencher a folha de resposta?
Solução
O PFC é também conhecido como princípio multiplicativo e pode ser generalizado para ações constituídas de mais de duas
5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Resolver uma prova de dez questões do tipo V ou F representa uma ação constituída de dez etapas sucessivas, que correspondem à resolução das dez questões propostas. Para cada questão, há duas possibilidades de escolha de resposta: V ou F. Logo, pelo PFC, o resultado procurado é: 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 = 210 = 1024.
Exemplo 5: de quantas maneiras podemos arrumar cinco pessoas em fila indiana?
Solução
Ao escolher uma pessoa para ocupar a primeira posição na fila, temos cinco possibilidades; para o segundo lugar, como uma pessoa já foi escolhida, temos quatro possibilidades; para o terceiro lugar, sobram três pessoas a serem escolhidas; para o quarto lugar, duas pessoas, e para o último lugar na fila sobra apenas a pessoa ainda não escolhida. Então, pelo PFC temos: 5 × 4 × 3 × 2 × 1 = 120. Assim, calculamos o número de modos de ordenar (“embaralhar”) cinco elementos distintos. Em outras palavras, calculamos o número de permutações simples de cinco elementos, ou seja, P5 = 120.
Exemplo 6: ao lançarmos dois dados, a probabilidade de obtermos resultados cuja soma é sete é:
Solução
Para cada dado lançado ao acaso, temos seis possibilidades de resultado. Então, pelo PFC, o número de casos possíveis é 6×6 = 36. 1+1 1+2 1+3 1+4 1+5 1+6 2+1 2+2 2+3 2+4 2+5 2+6 3+1 3+2 3+3 3+4 3+5 3+6 4+1 4+2 4+3 4+4 4+5 4+6 5+1 5+2 5+3 5+4 5+5 5+6 6+1 6+2 6+3 6+4 6+5 6+6 5 10 15 20 25
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
O número de casos favoráveis é o número de elementos do conjuntos de pares ordenados {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}, ou seja, é 6. Assim, a probabilidade é P = 6/36 = 1/6.
7 PROBABILIDADE: ORIGEM, MÉTODOS E PRINCIPAIS TEOREMAS
Como vimos, a probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência de um determinado evento.
A forma clássica de calcular a probabilidade é através da relação entre o número de casos favoráveis e o número de casos possíveis. Os casos favoráveis são aqueles resultados que se espera que aconteça; já os casos possíveis são todos os elementos que compõem o espaço amostral.
Sendo assim, dado um determinado espaço amostral Ω, a probabilidade de um dado evento A, P(A), será uma função definida em Ω, em que cada evento estará associado a um número real, a fim de satisfazer os axiomas abaixo.
Atenção! I) 0 < P < 1 II) P(Ω) = 1
III) Se A e B forem eventos mutuamente exclusivos, (A ∩ B) = φ, então P(A ∪ B) = P(A) + P(B).
7.1 Origens da probabilidade
Na realidade, existem três maneiras diferentes de se calcular ou estimar as probabilidades. São eles os métodos clássico, empírico e subjetivo, sendo que os métodos clássico e empírico são considerados métodos objetivos.
5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
7.1.1 Métodos objetivos 7.1.1.1 Método clássico
Quando estamos diante de experimentos que têm resultados igualmente prováveis, aplica-se o chamado método clássico. Neste caso, a probabilidade de ocorrer cada evento (resultado) é uma função do número de resultados possíveis.
P
numero de resultados possiveis
evento =
´
1´
Por exemplo, no experimento em que lançamos um dado, ocorrer qualquer das faces neste lançamento é igualmente provável. Então qual seria a probabilidade de ocorrer qualquer destas faces?
´
P numero de faces P qualquer face qualquer face = = 1 1 6Aplicando-se o método clássico a experimentos que envolvam dois ou mais resultados associados, com igual probabilidade de ocorrência desses resultados, teremos a definição clássica de probabilidade que demos no início deste módulo, em que a probabilidade será: P resultados favoraveis resultados possiveis =
´
´
Por exemplo, a probabilidade de obter quatro ases num baralho de 52 cartas. Nesse caso, temos que identificar o número de resultados favoráveis, ou seja, aqueles resultados esperados. No caso, são quatro resultados favoráveis, dentro de quatro resultados possíveis, então temos:
P= 4 = = 52 0 0769 7 6, , %
Verifique e compreenda: favoráveis/ possíveis!!!
5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Isso significa que, se houver uma repetição significativa deste experimento, ou seja, de se retirar quatro ases de um baralho de 52 cartas, um evento como este tem probabilidade de ocorrer em 7,6% das vezes.
Chance
Existe uma maneira diferente de se exprimir as probabilidades; em vez de se comparar o número de casos favoráveis ao número de casos possíveis, compara-se o número de resultados favoráveis ao número de casos desfavoráveis. Isso pode ser expresso das duas formas abaixo:
Chance numero de resultados favoraveis numero de resultados desfa = vvoraveis
´
´
´
´
ouPor exemplo, numa sala de aula, temos um total de 50 alunos, 22 homens e 28 mulheres. Qual seria, então, a probabilidade, e a chance, a favor de se selecionar, aleatoriamente, desta sala, uma mulher?
Probabilidade:
ε: retirar pessoas de uma sala de aula Ω: 22 homens e 28 mulheres
Evento A: selecionar uma mulher P A
( )
= P A + = ⇒( )
= = 28 22 28 28 50 0 56 56, %A probabilidade de se retirar uma mulher é, portanto, de 56%.
Chance:
Evento A: selecionar uma mulher Chance casos favoraveis
casos desfavoraveis ou = =28= 22 14 11 14 11:
´
´
Novamente: chance = número de resultados favoráveis: número de resultados desfavoráveis. 5 10 15 20 25
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
As chances de se retirar uma mulher da sala são, portanto, de 14 para 11.
7.1.1.2 Método empírico ou frequencial
Quando tratamos de situações em que os resultados não são igualmente prováveis, podemos tentar estimar as probabilidades, obtendo alguns dados empíricos. Uma estimativa das probabilidades baseada justamente nesses dados empíricos, que serão obtidos por meio de experimentos aleatórios ou através de dados históricos. É importante ressaltar que neste caso a probabilidade será uma estimativa do verdadeiro valor.
Por exemplo, se tivermos um experimento em que lançamos um dado 100 vezes. Se destas 100 vezes, obtivermos a face 4 em 40 vezes, num próximo lançamento do dado seria razoável supor que a probabilidade estimada futura da face 4 como sendo
P 4 40 100 40
( )
= = % , se este experimento se der a condições idênticas.Da mesma maneira, quando é testada uma vacina em um grupo de 1000 pessoas, por exemplo, e a vacina apresenta sucesso em 700 delas, se o teste é repetido, devemos esperar uma probabilidade estimada de sucesso futuro da vacina
P s
( )
= 700 = = 10007
10 70% , sob condições idênticas para a ocorrência deste resultado. Sendo assim, podemos calcular a estimativa da probabilidade de um evento futuro baseado no método empírico através da seguinte fórmula:
P A numero de ocorrencias de A numero total de
( )
= observações´
´
^Se, por outro lado, ao invés de dispormos da possibilidade de obter os dados amostrais através da realização de um experimento dispomos de dados históricos em uma distribuição
5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
de frequência, ou na forma de dados publicados, ou como resultado de testes prévios, ou como informações que foram acumuladas em algum arquivo importante, podemos também calcular a probabilidade estimada pelo método frequencial. Mas para isso é preciso que partamos da premissa de que o passado é representativo do futuro.
Por exemplo, suponhamos que uma distribuidora de chocolates acompanha suas vendas durante 90 dias. O objetivo desta distribuidora seria projetar as vendas para o futuro a fim de planejar seus estoques. Deste acompanhamento resultou a distribuição de frequência abaixo:
Número de chocolates vendidos, em kg, no período de 90 dias
Quilos vendidos Número de dias
20 10 30 20 40 20 50 30 60 10 Total 90
Neste caso, também podemos adotar o método empírico, procurando determinar qual o percentual de vezes em que ocorreu tal evento. Por exemplo, o distribuidor de chocolates vendeu 40 quilos do produto em 20 dias dos 90 dias totais de nossa observação. Então, neste caso, a estimativa de probabilidade desta ocorrência é P 40 20
90 2 9
( )
= = . A probabilidade é, portanto, a partir do método empírico, uma proporção da ocorrência de um evento ou a frequência relativa do evento. Assim, para as demais classes, as probabilidades serão dadas como segue na tabela abaixo da distribuição de frequências, seguindo agora a seguinte fórmula:P (A): probabilidade de ocorrer o evento A; ƒA: frequência absoluta do evento A;
∑
ƒA: total de observações. P A A A ( )=∑
ƒƒ , onde 5 10 15 20 251/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Número de chocolates vendidos, em Kg, no período de 90 dias
Quilos vendidos Número de dias(ƒ
A) Probabilidade ƒA
∑
ƒA 0 10 19 30 20 29 40 20 29 50 30 13 50 10 19 Total 90Algumas observações são importantes de serem ressaltadas quando utilizamos o método empírico para calcular a probabilidade.
I) Quando se calcula a probabilidade a partir do método empírico, obtemos apenas uma estimativa do verdadeiro valor da probabilidade. Não temos dados suficientes para determinar o valor exato da probabilidade.
II) O tamanho da amostra é fundamental para determinar a estimativa da probabilidade. Quanto maior o número de observações e, portanto, a amostra, melhor a estimativa da probabilidade.
III) A probabilidade só é válida para um conjunto de condições idênticas àquelas geradoras dos dados amostrais.
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
7.1.2 Método subjetivo
Nos itens anteriores, propusemo-nos a calcular probabilidades que se originavam de fatos, fosse através do método clássico ou do método empírico. No entanto, ao longo do estudo da estatística, surgiram diversas situações em que os eventos não eram passíveis de um estudo objetivo e muito menos eram igualmente prováveis. Neste caso, então, faz-se necessário atribuir-se subjetivamente uma probabilidade. Por exemplo:
Você encontrará o amor da sua vida amanhã? Quando os operários do metrô farão nova greve?
Uma mulher com câncer de mama se recuperará completamente?
Nestes casos, mesmo que não seja possível efetuar o experimento, pode-se imaginar um grande número de situações idênticas e questionar-se qual será o percentual dessas situações que produzirá o evento desejado.
O método subjetivo é semelhante ao método empírico, a única diferença é que, em geral, os dados não podem ser coletados. A probabilidade subjetiva serve como um esforço não apenas para quantificar, mas para confirmar nossa crença a respeito de algo.
Probabilidade subjetiva é uma avaliação pessoal do grau de viabilidade de um evento.
Existem, obviamente, algumas desvantagens importantes que este método apresenta:
I) as estimativas subjetivas são, em geral, difíceis de defender quando postas em dúvida;
II) as estimativas subjetivas podem ser tendenciosas.
5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
7.2 Principais teoremas de probabilidade
I) Digamos que temos um evento A qualquer, e um conjunto φ que representa o conjunto vazio. Suponhamos ainda que A e φ sejam disjuntos, então temos:
A P A B P A P P A P A P A A P ∩ = ∪
(
)
=( )
+( )
( )
=( )
+( )
⇒ ∪ = ⇒( )
= ϕ ϕ ϕ ϕ ϕ ϕ Portanto 0Sendo assim, temos que o primeiro teorema importante de probabilidade é o seguinte:
Se φ é o conjunto vazio, então P φ
( )
= 0 .II) Sejam dois eventos A e A, em que A é complemento de A, e o espaço amostral Ω pode ser escrito da seguinte forma: Ω = A ∪ A. Além disso, A e A são mutuamente exclusivos. Sendo assim, temos: A A m exclusivos P A A P A P A P P A P A P P ∩ = ⇒ ∪
( )
=( )
+( )
( )
=( )
+( )
⇒( )
= = ϕ . Ω Ω 1 1 AA P A P A P A( )
+( )
( )
= −1( )
Se A é complemento de A, então P A( )
= −1 P A( )
.III) Se, por outro lado, temos o seguinte conjunto B A= ∪ ∩
( )
A B , onde A e A B∩ são mutuamente exclusivos, então: P B P A P A B P A B P B P A P B P A( )
=( )
+( )
∩ ∩( )
=( )
−( )
( )
−( )
≥0 5 10 15 20 251/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
IV) Teorema da soma: se A e B são dois eventos quaisquer, então:
P A B
(
∪)
=P A( )
+P B( )
−P A B(
∩)
.Quando há mais de um resultado possível, então: P(evento A) = nº de elementos do evento A
nº de resultados possíveis Vamos ver alguns exemplos:
Exemplo 1: qual é a probabilidade de se extrair uma das quatro damas de um baralho de 52 cartas?
P(dama) = 4 52.
Exemplo 2: três estudantes A, B e C estão em uma competição de natação. A e B têm as mesmas chances de vencer e, cada um, tem duas vezes mais chances de vencer do que C. Pede-se calcular a probabilidade de A ou C vencer.
Solução
Sejam p(A), p(B) e p(C) as probabilidades individuais de A, B, C vencerem.
Pelos dados do enunciado, temos: p(A) = p(B) = 2.p(C). Seja p(A) = k, então, p(B) = k e p(C) = k/2. Temos: p(A) + p(B) + p(C) = 1.
Verifique, matematicamente, estas propriedades utilizando a teoria dos conjuntos!
5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Isso é explicado pelo fato de que a probabilidade de A vencer ou B vencer ou C vencer é igual a 1 (evento certo).
Assim, substituindo, temos: k + k + k/2 = 1 \ k = 2/5.
Portanto, p(A) = k = 2/5, p(B) = 2/5 e p(C) = 2/10 = 1/5. A probabilidade de A ou C vencer será a soma dessas probabilidades, ou seja 2/5 + 1/5 = 3/5.
Exemplo 3: um dado é viciado, de modo que cada número par tem duas vezes mais chances de aparecer num lançamento que qualquer número ímpar. Determine a probabilidade de, num lançamento, aparecer um número primo.
Solução
Pelo enunciado, podemos escrever:
p(2) = p(4) = p(6) = 2.p(1) = 2.p(3) = 2.p(5). Seja p(2) = k, poderemos escrever:
p(2) + p(4) + p(6) + p(1) + p(3) + p(5) = 1, ou seja: a soma das probabilidades dos eventos elementares é igual a 1.
Então, substituindo, vem:
k + k + k + k/2 + k/2 + k/2 = 1 \ k = 2/9. Assim, temos: p(2) = p(4) = p(6) = 2/9 p(1) = p(3) = p(5) = 2/18 = 1/9. 5 10 15 20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
O evento sair número primo corresponde a sair o 2, ou o 3, ou o 5. Logo,
p(2) + p(3) + p(5) = 2/9 + 1/9 + 1/9 = 4/9.
Exemplo 4: possuo três jarros idênticos e desejo ornamentá-los com dezoito rosas, sendo dez vermelhas e oito amarelas. Desejo que um dos jarros tenha sete rosas, e os outros dois, no mínimo, cinco rosas. Cada um deverá ter, pelo menos, duas rosas vermelhas e uma amarela. Quantos arranjos florais poderei fazer usando as dezoito rosas?
Solução
Sejam os jarros J1, J2 e J3.
Pelos dados do enunciado, temos:
a) um dos jarros deverá ter sete rosas; seja J1 este jarro. Poderemos ter as seguintes combinações, lembrando que existe uma outra condição dada no enunciado, de que cada jarro tenha no mínimo duas rosas vermelhas e uma amarela:
1) 5 A + 2 V (cinco rosas amarelas e duas vermelhas); 2) 4 A + 3 V (quatro rosas amarelas e três vermelhas); 3) 3 A + 4 V (três rosas amarelas e quatro vermelhas); 4) 2 A + 5 V (duas rosas amarelas e cinco vermelhas); 5) 1 A + 6 V (uma rosa amarela e seis vermelhas);
b) nos outros dois jarros, J2 e J3, deverão ser distribuídas as 18 – 7 = 11 rosas restantes, obedecendo-se ao critério de que em cada jarro tenha no mínimo cinco rosas, sendo pelo menos duas vermelhas e uma amarela.
5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Vamos supor seis rosas no jarro 2 e cinco rosas no jarro 3. Temos então que, partindo das cinco composições possíveis para o jarro J1 (item (a) acima), dividir convenientemente as rosas restantes, observando-se as regras dadas e as suas quantidades.
Veja a tabela abaixo, em que V = rosa vermelha e A = rosa amarela.
Situação 7 rosasJarro 1 Jarro 26 rosas Jarro 35 rosas 18 rosasTotal
01 5A + 2V 1A + 5V 2A + 3V 18 02 5A + 2V 2A + 4V 1A + 4V 18 03 4A + 3V 1A + 5V 3A + 2V 18 04 4A + 3V 2A + 4V 2A + 3V 18 05 4A + 3V 3A + 3V 1A + 4V 18 06 3A + 4V 2A + 4V 3A + 2V 18 07 3A + 4V 3A + 3V 2A + 3V 18 08 3A + 4V 4A + 2V 1A + 4V 18 09 2A + 5V 4A + 2V 2A + 3V 18 10 2A + 5V 3A + 3V 3A + 2V 18 11 1A + 6V 4A + 2V 3A + 2V 18
Observe que, na tabela, em cada linha, as rosas vermelham somam dez e as rosas amarelas somam oito, conforme enunciado. Além disso, fixamos o jarro 3 como aquele que receberia o número mínimo de rosas (cinco), restando as seis rosas para serem distribuídas convenientemente no jarro 2, já que no jarro 1 deveriam ficar sete rosas, ou seja: 7 + 6 + 5 = 18, que é o número total de rosas. Vemos, na tabela acima, que existem onze possibilidades de solucionar o problema dado.
A melhor maneira, entretanto, de esquematizar a solução deste interessante problema é construir uma árvore de possibilidades conforme indicado a seguir, tendo em mente
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
o cumprimento das condições impostas nos itens (a) e (b) supra. O 5A + 2V 4A + 3V 3A + 4V 2A + 5V 1A + 6V 4A + 2V 4A + 2V 2A + 4V 1A + 5V 1A + 5V 2A + 4V 1A + 4V 2A + 3V 2A + 4V 3A + 3V 1A + 4V 2A + 3V 3A + 2V 3A + 3V 4A + 2V 1A + 4V 2A + 3V 3A + 2V 3A + 3V 3A + 2V 2A + 3V 3A + 2V 1 2 3 4 5 6 7 8 9 10 11 Ou seja, são possíveis onze arranjos florais, obedecendo às condições dadas no enunciado do problema.
8 REVISÃO
Este módulo registra os conceitos mais utilizados em uma análise estatística de dados, para qualquer tipo de área de atuação; portanto, é, como um todo, essencial na verificação dos conceitos abordados por este curso.
A partir do século XX, os métodos estatísticos foram desenvolvidos como uma mistura de ciência, tecnologia e lógica para a solução e investigação de problemas em várias áreas do conhecimento humano. Ela foi reconhecida como um campo da ciência neste período, mas sua história tem início bem anterior a 1900. A estatística moderna é uma tecnologia quantitativa para a ciência experimental e observacional que permite avaliar e estudar as incertezas e os seus efeitos no planejamento e interpretação de experiências e de observações de fenômenos da natureza e da sociedade.
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
A estatística não é apenas um ramo da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma determinada população. A estatística também não se limita a um conjunto de elementos numéricos relativos a um fato social, nem a números, tabelas e gráficos usados para o resumo, a organização e apresentação dos dados de uma pesquisa, embora este seja um aspecto da estatística que pode ser facilmente percebido no cotidiano.
Ela é uma ciência multidisciplinar, que permite a análise estatística de dados em qualquer área de interesse: física, economia, agronomia, química, geologia, matemática, biologia, sociologia, psicologia, ciências políticas, administração, etc.
Como definição atual: estatística é uma ciência que estuda e pesquisa sobre o levantamento de dados com a máxima quantidade de informação possível para um dado custo; sobre o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; sobre a tomada de decisões em condições de incerteza, sob o menor risco possível.
De fato, tem sido utilizada na pesquisa científica para a otimização de recursos econômicos, para o aumento da qualidade e produtividade, na otimização em análise de decisões, em questões judiciais, previsões e em muitas outras áreas.
Façam um ótimo uso desta poderosa ferramenta científica!
Revisão - módulo 1 - Introdução à estatística
• A estatística é uma técnica que engloba os métodos científicos para a coleta, organização, apresentação, tratamento e análise de dados.
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
• O objetivo da estatística é fazer com que dados dispersos se transformem em informação organizada e útil.
• Universo é o conjunto de possíveis elementos a serem observados e de onde obteremos os dados.
• População seria um subconjunto do universo, na medida em que se constitui de um grupo de objetos ou indivíduos com características comuns.
• A amostra é uma parte representativa da população que será examinada quando for impossível ou impraticável observar todo o grupo representado pela população. • Uma fonte estatística é direta quando o dado é obtido
de uma fonte primária, ou seja, toma-se a informação diretamente na fonte e produzem-se as informações a partir disso.
• Fonte indireta é quando o dado é obtido através de uma fonte secundária.
• Estatística descritiva é a parte da estatística que procura organizar, resumir e simplificar informações complexas, a fim de torná-las de mais fácil entendimento, exposição e discussão.
• Se não há a possibilidade da descrição de fatos pela existência de circunstâncias ou experimentos que envolvam o acaso, usa-se a probabilidade.
• A inferência estatística propõe-se a analisar e a interpretar dados que são obtidos através de uma amostra.
• Dados brutos - dados que ainda não foram numericamente organizados e processados.
• Variável contínua: é a variável que pode assumir qualquer valor num intervalo contínuo.
5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
• Variável discreta: origina-se da contagem de itens e só pode assumir valores inteiros.
• Variáveis nominais: são aquelas que existem com o objetivo de definir categorias.
• Variáveis por posto: quando existe o desejo de dispor os elementos observados segundo uma ordem de preferência ou desempenho.
• Rol: quando organizamos os dados brutos em ordem crescente ou decrescente de grandeza.
• Distribuição de frequência: organizar os dados brutos em classes, a fim de identificar o número de itens pertencentes a cada classe, denominado frequência de classe.
• Se uma determinada variável y tiver os valores 3, 5, 7, 9 e 11, o
∑
y será:∑
y = 3+5+7+9+11.•
∑
in=1x=∑
xi =∑
x= somar as n observações de xi começando com a primeira.•
∑
c x c. = .∑
x= valor da variável x multiplicado ou dividido por uma constante.• ci nc
i i n
=
=
∑
= o somatório de uma constante c será igual ao produto da constante pelo número de vezes que ela se repete. • ( ) ( ) x y x y x y x y i i i i i n i n i n i i i i i n i n i n + = + − = − = = = = = =∑
∑
∑
∑
∑
∑
1 1 1 1 1 1= a soma ou a diferença de duas variáveis será igual à soma ou à diferença dos somatórios individuais das duas variáveis.
5
10
15
20
1/08 -||- 1º Revisão: Ana - Corr eção: Léo 03/12/08 -||- • ( xi) (x x x ... x ) i n n =
∑
= + + + + 1 21 2 3 2= soma dos valores de
xi elevado ao quadrado.
Revisão - módulo 2 - Medidas de tendência central: média, moda e mediana para dados simples
As medidas de tendência central denotam um valor no centro ou no meio de um conjunto de dados. Essas medidas servem para dar uma ideia acerca dos valores médios da variável em estudo. São utilizadas para sintetizar em um único número o conjunto de dados observados. Enquanto as tabelas de frequência e gráficos revelam a natureza ou a forma da distribuição de um conjunto de dados, as medidas de tendência central focalizam a determinação de valores típicos ou representativos de um conjunto de dados. Há diferentes maneiras de definir o centro e, assim, há diferentes definições de medidas de tendência central, como a média, a mediana, a moda e o ponto médio.
A média
A média aritmética é, de modo geral, a mais importante de todas as mensurações numéricas descritivas. Na figura abaixo, ilustramos a propriedade da média como centro do conjunto de dados, no sentido de que é um ponto de equilíbrio dos mesmos. Existem vários tipos de média (aritmética, ponderada, geométrica, harmônica, etc.).
5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
Definição: a média aritmética de um conjunto de valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. Essa definição pode expressar-se através da fórmula 1 abaixo, em que
∑
x representa a soma de todos os valores e n denota o tamanho da amostra, que é o número de valores em questão.Fórmula 1: Média = �
∑
x nA média pode denotar-se por x se o conjunto de valores de que dispomos é uma amostra extraída de uma população maior. Se todos os valores da população foram considerados, denotamos por
µ
a média calculada. As estatísticas amostrais são, em geral, representadas por letras do alfabeto latino, como x, ao passo que os parâmetros populacionais costumam representar-se por letras gregas, comoµ
. A média pode ser interpretada como o centro de gravidade, isto é, o ponto de equilíbrio das discrepâncias positivas e negativas.Notação:
∑
=> denota somatório de um conjunto de valores;x => é a variável usada para representar valores individuais dos dados;
n => representa o número de valores em uma amostra; N => representa o número de valores em uma população. • Média aritmética simples: média =
∑
=x n i i n 1 ;
• Média aritmética para a população:
µ =
∑
= Xi N i i N , ondeµ => Média aritmética da população (parâmetro) N => Total de observações da população (total da população)
Xi=> Cada variável populacional 5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
• Média aritmética para a amostra:
x x n i i n =
∑
=1 , ondex => Média aritmética da amostra (estimativa) n => Número de dados da amostra
xi=> Cada variável da amostra
• A soma de uma constante à média: x c x n x x n nc n x x c i i n i i n 2= 1 2 1 2 1 + ⇒ = + ⇒ = + = =
∑
( )∑
; • Soma algébrica dos desvios em torno da média:xi − =x
∑
0 .• Média aritmética ponderada: x
w x w p i i i n i i n = = =
∑
∑
1 1 .• Posição da mediana: posmed posmed= +(n 1) 2 .
• Mediana: o elemento que ocupa a posição central num determinado conjunto de dados ordenados.
• No cálculo da média, todos os valores da amostra são levados em conta, ao passo que no caso da mediana, isto não ocorre. Por esta razão, valores muito grandes ou muito pequenos, comparados aos demais valores da amostra, causam grandes variações na média, o que, em geral, não ocorre com a mediana. Por isso, dizemos que a mediana é uma medida robusta, isto é, resistente a valores atípicos. • A mediana de um conjunto de números, organizados em
ordem de grandeza (isto é, em um rol), é o valor central ou a média aritmética dos dois valores centrais.
5
10
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
• Moda: o valor ou valores que mais se repetem em um conjunto de dados. A moda de um conjunto de dados é o valor que ocorre com maior frequência, ou seja, é o valor mais comum. Quando dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto é multimodal. A moda pode não existir e, mesmo que exista, pode não ser única. Quando nenhum valor é repetido, o conjunto não tem moda. Costuma-se denotar a moda por Mo.
Revisão - módulo 3 – Medidas de dispersão para dados simples
• Amplitude total: Amplitudetotal= Valormáximo~Valormínimo
• Desvio médio absoluto: Dmédio=
x x n i i n − =
∑
1 . • Variância populacional: σ2 =∑
(x −µ)2 N i . • Variância amostral: s x x n i 2 2 1 = − −∑
( ) .• Se somar ou subtrair uma constante a cada elemento de um conjunto de dados, o valor da variância não se altera. • Ao multiplicarmos uma constante pela variância, a nova
variância será: σ22 2σ
12
= c . .
• Ao dividirmos a variância por uma constante, a nova variância será: σ22 σ12
2
= c .
• A variância de uma constante é igual a zero.
5
10
15
1/08 -||- 1º Revisão: Ana - Corr
eção: Léo 03/12/08 -||-
• Desvio padrão populacional: σ=
∑
(x −µ) Ni 2 .
• Desvio padrão amostral: s x x n i = − −
∑
( )2 1 .Revisão - módulo 4 – Distribuição de frequências
• A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com características semelhantes – as classes ou categorias.
• Amplitude total: Atotal= Vmáximo- Vmínimo
• A teoria estatística tem se desenvolvido ao longo dos anos e chegou ao consenso de que é aconselhável estabelecer o número de classes entre um mínimo de cinco e um máximo de vinte.
• Para determinar o número de classes: Númeroclasses= n . • Para determinar a amplitude de classes:
Amplitude Amplitude Numero classes total classes =
´
.• O intervalo de classes é composto por um limite inferior (número menor) e por um limite superior (número maior). • Após o cálculo do número de classes e da amplitude de
classes, devemos definir os limites inferior e superior de cada classe.
• Frequência absoluta simples (ƒi): número de observações existentes em um dado intervalo.
5
10
15