BIOESTATÍSTICA
UNID
ADE 7
DISTRIBUIÇÃO DE PROBABILIDADE
Estudaremos nesta unidade duas importantes distribuições de probabilidade: Distribuição Binomial e Distribuição Normal.
Quando estudamos fenômenos aleatórios, estamos interessados em algum resultado ou alguns resultados relacionados ao experimento. As distribuições de probabilidade permite-nos através de experimentos quantificar os possíveis resultados de uma variável discreta ou contínua.
OBJETIVOS:
Identificar e calcular problemas relacionados à contagem – Distribuição Binomial.
Identificar e calcular problemas relacionados a espaços amostrais contínuos e as variáveis contínuas – Distribuição Normal.
PLANO DA UNIDADE:
• Definição e classificação de variáveis. • Distribuição Binomial.
• Distribuição Normal de Probabilidade.
DEFINIÇÃO E CLASSIFICAÇÃO DE VARIÁVEIS
Quando estudamos estatística uma das primeiras coisas que aprendemos é a definição e classificação de uma Variável. Uma variável pode ser classificada como Variável Qualitativa ou Variável Quantitativa. As variáveis quantitativas são classificadas como: Quantitativa Discreta e Quantitativa Contínua. Vamos relembrar:
1. Variável Qualitativa É aquela que os valores são expressos
por atributos, por exemplo: cor de cabelo, sexo, etc.
2. Variável Quantitativa É a variável quantificável, ou seja,
assume valor numérico.
Discreta – É a variável que assume valor inteiro. Os dados discretos
são resultados de contagem, por exemplo: número de carros que passam na ponte Rio de Janeiro – Niterói; atletas que cruzam a linha de chegada da maratona de São Silvestre, etc.
Contínua – É a variável que assume qualquer valor num intervalo
contínuo, por exemplo: índice da bolsa de valores de New York; pressão sistólica arterial, etc.
Como existem dois tipos de variáveis quantitativas, ao darmos início ao estudo das distribuições de probabilidade, essas distribuições também tratam as variáveis de acordo com a sua classificação. As principais distribuições de probabilidade são: Binomial, Normal, Uniforme, Bernoulli, Poison, Hipergeométrica, Beta, Gama, etc.
Para a variável discreta a principal distribuição de probabilidade é a
Distribuição Binomial.
Para a variável contínua a principal distribuição de probabilidade é a
Distribuição Normal.
Nosso objeto de estudo nesta unidade são as distribuições Binomial e Normal, e por que não trabalharmos com as outras distribuições de probabilidade?
Quando trabalhamos com uma variável aleatória discreta, normalmente temos um problema de contagem. A distribuição Binomial utiliza os parâmetros n e p, onde n é o tamanho da amostra ou o número de vezes que se faz um experimento e p a probabilidade de sucesso de um evento acontecer. Com isso, podemos efetuar experimentos para verificar a probabilidade de sucesso de um evento acontecer (p) e a probabilidade de insucesso de um evento acontecer (1-p), quantas vezes forem necessárias. Quando trabalhamos com uma variável aleatória contínua estamos com uma variável que pode assumir qualquer valor dentro de um intervalo real. Por exemplo, velocidade de um Boeing a determinada altitude no período de 1 hora. O que se observa no emprego de testes estatísticos com este tipo de variável é que as ocorrências de uma variável qualquer estudada ao acaso, ao longo do experimento desta variável, em um dado momento, observa-se um comportamento regular nas ocorrências. E este comportamento regular permitiu que, no estudo de grandes amostras, criasse
um padrão onde o erro de mensuração para estas variáveis poderiam ser agrupados e classificados dentro de um padrão considerado normal.
As variáveis aleatórias contínuas que seguem a um padrão normal possuem uma característica gráfica que se enquadra dentro de uma curva, chamada de curva normal de erros. Esta curva tem a forma de um sino e os erros de mensuração vão de -3ó a +3ó (lê-se: menos 3 desvios a mais 3 desvios). O desvio padrão, aqui representado por ó (sigma) significa quanto para + ou para – estamos afastados da média .
Na distribuição normal os parâmetros são: o desvio padrão ó e a média .
Área sob uma curva normal a 1, 2 e 3 desvios padrões a contar de cada lado da média.
DISTRIBUIÇÃO BINOMIAL
Definição: considere um experimento , e seja A algum evento associado a . Admitamos que P(A) = p e conseqüentemente P( ) = 1-p. Considere n repetições de . O espaço amostral S será formado por todas as seqüências possíveis {a1, a2, ..., na}, onde cada ai é o evento A ou , dependendo do que tenha ocorrido na iésima repetição do experimento (existem 2n dessas
seqüências). Suponha que P(A) = p permaneça a mesma para todas as repetições. Seja a variável aleatória que indica o número de vezes que o evento A tenha ocorrido. Definiremos a variável aleatória discreta X como variável aleatória Binomial de Parâmetro n e p. Os valores de X são evidentemente: 0, 1, 2, ..., n; e X~b(n,p) significa que X tem distribuição binomial de parâmetros n e p.
· Teorema:
Seja X uma variável aleatória binomial, então: Pr{X = k} = Cn,k . pk . (1 – p)n-k k= 0, 1, 2, ..., n.
Lançar um dado 3 vezes
X Número de vezes que aparece a face 2.
Determine a probabilidade de X = 0, ou seja, a probabilidade de não aparecer a face 2 ao lançar o dado 3 vezes.
Temos uma distribuição binomial: X~b(3,1/6) n =3 p=1/6 X~b(3, 1/6) Pr{X = k} = Cn,k . pk . (1 – p)n-k Pr{X = 0} = C3,0 . (1/6)0 . (5/6)3 Pr{X = 0} = 1 . 1 . 125 216 Pr{X = 0} =
216
125
No cálculo efetuado acima, para facilitar as contas, podemos buscar no anexo VII a tabela com combinações previamente calculadas.
C3,0’!n=3 e k=0
O setor de saúde do trabalhador, ao acompanhar por um longo período a aplicação de um produto químico domiciliar, verificou que este produto causa lesões na pele de 40% dos funcionários que trabalham com ele. Ao examinar uma amostra de 15 destes profissionais, pede-se determinar a probabilidade de causar lesões na pele em mais de 3 e no máximo em 6 deles.
Temos uma distribuição binomial: X~(15,0,40) P(3< X <6) = Pr(X=4) + Pr(X=5) + Pr(X=6)
Então: Pr(X=3) + Pr(X=4) + Pr(X=5) + Pr(X=6) = 0,5817 ou 58,17%
EXEMPLIFICANDO
Distribuição Normal de Probabilidade
Vamos apresentar uma distribuição de probabilidade sendo aplicada em inúmeros fenômenos e utilizada para o desenvolvimento técnico da estatística. Esta distribuição de Gauss, Laplace ou Gauss Laplace.
Seja X uma variável aleatória contínua com função de densidade dada por: f(X) =
onde: = média distribuição = desvio padrão de X = 3,71416... e = 2,71.... Sendo o seu gráfico:
Para o cálculo das probabilidades, surgem dois grandes problemas: 1. a integração de f(x), pois seria necessário para o desenvolvimento de séries;
2. a criação de uma tabela, pois f(x) depende de dois parâmetros e isto provocaria um grande trabalho, por causa das diversas combinações que poderiam surgir com .
A maneira de solucionarmos este problema é por meio de uma transformação de variável e pelo uso de uma particular distribuição chamada de DISTRIBUIÇÃO NORMAL PADRÃO ou REDUZIDA.
Distribuição Normal Padrão
Seja Z uma variável aleatória, tal que: , onde X é uma variável aleatória normal com média e variância .
· Média de Z será dada por:
E[Z] =E [Z] significa valor esperado, esperança ou média.
E[Z] =
E[Z] =
E[Z] = 0
· Variância de Z será dada por:
logo, temos uma função de densidade.
Chamamos de função de densidade Normal Padrão, isto é:
Z~N(0; 1), lê-se: Z tem distribuição normal com = 0 e = 1.
Como a média de Z é zero e a variância de Z é 1, as probabilidades sob (Z) são calculadas e tabeladas, obtendo a função de distribuição de Z. A notação de uma variável aleatória contínua normal qualquer, será dada por: X~N( ; ), lê-se: X tem distribuição normal com média µ e variância.
Propriedades da Distribuição Normal
Como foi visto, o gráfico de f(x) de uma V.A.C. (variável aleatória contínua) normal tem a forma de um sino e é simétrica em relação a média µ. Fixando-se a média, verifica-se que o “achatamento” está diretamente ligado ao valor do desvio padrão ó, assim:
(Z) = valores tabelados da distribuição normal padrão.
1a Propriedade:
· f(x) é simétrica em relação a . · (z) é simétrica em relação a 0.
2a Propriedade:
· F(x) tem dois pontos de inflexão cujas abscissas valem + e - . · (z) tem dois pontos de inflexão cujas abscissas valem +1 e -1. Exemplificação de consulta à tabela de (z) através de um exemplo: P(z -2,62) = (-2,62)
Na primeira coluna à direita, tomamos o número com a casa decimal e na primeira linha tomamos o número da casa das centenas (após a vírgula), a interseção desses dois elementos é a probabilidade procurada.
P(z -2,62) = 0,0044 -Propriedades: · P(z1 Z z2) = P(z1 < Z < z2) = (z2) – (z1) · P(Z > z1) = P(Z >z1) = 1 – P(Z z1) = 1 - (z1) 1) P(-2 Z 1) = (1) – (2) P(-2 Z 1) = 0,8413 – 0,0028 = 0,8385 P(-2 Z 1) = 0,8385 2) P(Z > 1) = 1 – p(Z 1) P(Z > 1) = 1 – (1) P(Z > 1) = 1 – 0,8413 P(Z > 1) = 0,1517
Caso X~N( ; ) o cálculo de qualquer probabilidade será feito através da normal padrão e a transformação:
Z = ~ N(0; 1) isto é, z = logo: · P(X x) = P(Z z) z = · P(x1 < X < x2) = P(z1 < Z < z2) z1 =
EXEMPLIFICANDO
z2 =
· P(X > x) = P(Z > z) z =
Nas probabilidades anteriores em nada se altera, caso tivéssemos e” ou d” em vez de > ou <.
Exemplo: X~N(10;25), determine:
X~N(10;25) significa que X tem distribuição normal de média =10 e variância =25, logo =5. a) P(8< x < 11) b) P(X > 6) c) P(X < 9) d) P(X < x) = 0,9918 determine x a) P(8 < X < 11) = P(-0,40 < x < 0,20) P(8 < X < 11) = Ö(0,20) – Ö(-0,40) P(8 < X < 11) = 0,5793 – 0,3446 = 0,2347 b) P(X > 6) = P(Z > z) P(Z > -0,8) = 1 – P(Z -0,8) P(Z > -0,8) = 1 – (-0,8) P(Z > -0,8) = 1 – 0,2119 = 0,7881 c) P(X < 9) = P(Z < z)
P(X < 9) = P(Z – 0,2) P(X < 9) = (-0,2) P(X < 9) = 0,4207 d) P(X < x) = P(Z < z) = 0,9918 P(Z < z) = 0,9918 (z) = 0,9918 z=2,4 12 = x – 10 12 + 10 = x x = 22
Carlos Eduardo e Camélia irão se casar no próximo fim de semana. Eles ganharam muitos presentes, mas infelizmente ficou faltando um eletroeletrônico muito importante. Eles não tinham ainda geladeira. Dirigiram-se até uma loja e lá obDirigiram-servaram que os modelos vinham indicando o consumo de energia. O modelo que eles gostaram possuía as seguintes especificações: o consumo desta geladeira tende a uma distribuição normal com média de consumo de 220v/dia, com desvio padrão 20,02. Com essas informações, como Carlos conhecia um pouquinho de cálculo de distribuição normal, ele ficou curioso em saber qual a probabilidade da geladeira consumir mais do que 250v/dia.
P(X > 250)= P(Z > z)
P(X < 250) = 1 – (1,50
P(X < 250) = 1- 0,9332 = 0,0668 ou 6,68%
É HORA DE SE AVALIAR!
Não esqueça de realizar as atividades desta unidade de estudo, presentes no caderno de exercício! Elas irão ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de ensino-aprendizagem. Caso prefira, redija as respostas no caderno e depois as envie através do nosso ambiente virtual de aprendizagem (AVA). Interaja conosco!
Vimos nesta unidade duas distribuições de probabilidade que são de extrema importância. Para problemas de contagem, a distribuição Binomial e a distribuição Normal. Vocês verão nas próximas unidades como a distribuição Normal é importante no estudo da estatística, pois os testes paramétricos seguem um padrão baseado em uma normalidade que é a curva da distribuição Normal, em que suas probabilidades já são conhecidas e calculadas dentro da curva da normal.