• Nenhum resultado encontrado

Distribui¸ c˜ oes bivariada e multivariada

Fundamentos das distribui¸ c˜ oes e

3.2 Distribui¸ c˜ oes bivariada e multivariada

dbif

O fato ´obvio ´e que duas ou mais vari´aveis aleat´orias podem “conviver” no mesmo experimento aleat´orio. Nosso texto at´e agora apresentou muitos exemplos de tais situa¸c˜oes, inclusive, a da sub-se¸c˜ao anterior. S´o que na maioria dos casos considerados at´e agora, nos analizavamos uma vari´avel aleat´oria por vez. Que tal perguntarmos agora do comportamento simultˆaneo de duas vari´aveis aleat´orias definidas no mesmo experimento aleat´orio.

O s´ımbolo IP [X = x, Y = x], a ser usado, ´e uma abrevia¸c˜ao de IP [{ω tais que X(ω) = x e Y (ω) = y}], cuja interpeta¸c˜ao ´e: a probabilidade do conjunto de todos os resultados nos quais simultenemente X assume valor x e Y assume valor y.

. Note que a virgula entre X = x e Y = y traduziu-se em “simultanemente”. Na nossa lingua do dia-a-dia falamos “e” em vez de “simultanemente”; digamos “X assume x e Y assume y”. O texto acima deixa claro que este “e” equivale `a intersec¸c˜ao. ´E por isso que reservamos a interpeta¸c˜ao de intersec¸c˜ao `a virgula quando falavamos dos eventos (na Se¸c˜ao2.1). Lembre-se aumdos respeito lhe pedi n˜ao colocar virgula na lista de resultados e solicitei que use “;”. Agora sabemos a raz˜ao de porque.

Come¸caremos com o lembrete de que a distribui¸c˜ao de uma vari´avel aleat´oria definida em um experimento aleat´orio ´e a tabela que apresenta todos os valores que a vari´avel aleat´oria pode assumir em conjunto com as respectivas probabailidades. Observareos agora, queQue tal apresentarmos os valores delas em conjunto, em pares. stribui¸c˜ao bivariada ´e o nome para a Exemplo 30. Construiremos a tabela da distribui¸c˜ao bivariada das vari´aveis aleat´orias X e Z

tawa

definidas na Sub-se¸c˜ao sluchai. Esta est´a apresentada na Figura3.10.ota

Existem outras maneiras de apresenta¸c˜ao de distribui¸c˜oes bivariadas. Duas de tais maneiras s˜ao apresentadas abaixo. Mas estas ser˜ao usadas ocasionamente e tambem, n˜ao de imediato. Por isto os leitores podem pular esta apresenta¸c˜ao agora e voltar a lˆe-los s´o quando for ne- cess´ario.

. A apresenta¸c˜ao de distribui¸c˜ao bivariada chamada fun¸c˜ao de probabilidades, est´a exemplificada na Figurafdepduas3.11 para o caso do par X, Z definido na Sub-se¸c˜ao sluchai. No nosso ver, esta figura esclarece plenamente o m´etodo da construi¸c˜ao de fun¸c˜ao de probabilidades, mas, para quem gostar da precis˜ao de express˜ao, poderemos dar a defini¸c˜ao rigorosa: a fun¸c˜ao de probabilidade de

Figura 3.12: O diagrama de disperss˜ao para a distribui¸c˜ao bivariada das vari´aveis aleat´orias Y, V definidas na Sub-se¸c˜ao sluchai.

ddyv

Figura 3.13: Duas maneiras de desenhar diagrama de disperss˜ao para a distribui¸c˜ao bivariada das vari´aveis aleat´orias X, Z definidas na Sub-se¸c˜ao sluchai. A particularidade desta distribui¸c˜ao ´e que seus valores n˜ao ocorrem com probabailidades iguais. Isto obriga a indicar os pesos relativos dos valores por n´umeros. Tradicionalmente, a indica¸c˜ao segue o padr˜ao (a) ou (b) da presnete figura. ddxz

par de vari´aveis aleat´orias denotadas simbolicamente aqu´ı por X, Y , ´e a fun¸c˜ao definida no plano R2com valore em [0, 1], tal que o valor dela em qualquer ponto (x, y) ´e igual a IP [X = x, Y = y]. A fun¸c˜ao de probabilidades defina-se somente para vari´aveis aleat´orias discretas. Lembramos, que vari´avel aleat´oria chama-se discreta, quando o conjunto de valores que ela pode assumir, ´e finito. Portanto, quando ambos X e Y s˜ao discretas, ent˜ao a fun¸c˜ao de probabilidade delas ´e diferente de zero somente em n´umero finito de pontos do plano R2. Este fato faz com que na apresenta¸c˜ao gr´afica de tal fun¸c˜ao, s´o marcam-se os valores dela diferentes de zero: s˜ao os palitos que “emergem” na dire¸c˜ao vertical dos pontos (x, y) onde IP [X = x, Y = y] 6= 0, sendo que o valor desta probabilidad ´e a altura do palito correspondente. A Figura3.11 exemplificafdepduas bem esta forma de apresenta¸c˜ao gr´afica. Notamos que s´o a “cabe¸ca” de cada palito corresponde ao valor da fun¸c˜ao de probabilidades, e por isso que cada palito deve ser apresentado por uma linha dicont´ınua como o lembrete de que esta linha n˜ao faz parte da fun¸c˜ao e s´o est´e presente para facilitar a vizualiza¸c˜ao. E certas situa¸c˜ao, por´em, a vizualiza¸c˜ao melhora se usarmos linhas cheias em vez de pontilhadas ou interrumpidas.

. As apresenta¸c˜oes de distribui¸c˜ao bivariada em foma de tabela ou via sua fun¸c˜ao de probabili- dades s˜ao duas apresnetacoes mais usadas. Entre outras, dispres´ıveis, que vi, h´a uma que, no nosso ver, merece a aten¸c˜ao maior que as demias, pelo fato de ser usada em Estat´ıstcia para apresenta¸c˜ao de amostras. Na Teoria Estat´ıstica, esta se chama diagrama de disperss˜ao. Nos usaremos este mesmo nome aqu´ı. O diagrama de disperss˜ao para a distribui¸c˜ao bivariada das vari´aveis aleat´orias Y, V definidas na Sub-se¸c˜ao sluchai, est´a na Figuraddyv3.12. Cada ponto (y, v) marcado no plano indica que Y, V podem assumir o par de valores y, v simultaneamente. Na apresenta¸c˜ao por diagrama de disperss˜ao, h´a uma regra: cada ponto tem mesmo peso. Isto significa que o diagrama de disperss˜ao na Figura ddyv3.12 nos diz que a probabilidade do par de vari´aveis aleat´orias Y, V asumir valores 1, 1, ou 1, −1 ou −1, 1 ou −1, −1 ´e a mesma e ´e igual a 1/4, j´a que h´a 4 pontos neste diagrama. Esta regra, por´em, cria confus˜ao quando o diagramo de disperss˜ao ´e usada para apresentar uma distribui¸c˜ao bivariada que atribui probabilidades diferentes a diferente valores. Um exemplo de tal distribui¸c˜ao ´e a do par X, Z da Sub-se¸c˜ao sluchai. A Figura3.13 mostra duas maneiras da apresenta¸ddxz c˜ao desta distribui¸c˜ao por diagramas de disperss˜ao. No primeiro caso, o n´umero colocado ao lado de cada ponto indica seu peso na divis˜ao da probabailidade total. No segundo caso, estes n´umeros foram colocados em lugares dos pontos. Podemos ent˜ao concluir que a vantagem da apresneta¸c˜ao de distribui¸c˜ao bivariada por diagrama de disperss˜ao perante a apresenta¸c˜ao por fun¸c˜ao de probabailidades est´a em qua a primeira ´e um desenho no plano, enqunto a segunda ´e um objeto tri-dimensional que exige certo malabarismo para ser apresentado em papel. A desvantagem surge no momento em que

os valores da distribui¸c˜ao apresentada ocorrem com probabilidades desiguais. Notamos que isto ´e comum em distribui¸c˜oes te´oricas, o que faz com que o diagrama de disperss˜ao ´e raramente usada na Teoria de Probabilidades. J´a se formos usar o diagrama de disperss˜ao para apresnetar um conjunto de dados amostrais – seja isto o que for, pois n˜ao explicamos conceitos estat´ısticos no nosso texto – ent˜ao esta desvantagem n˜ao incomoda pois a coincidˆencia de duas observa¸c˜oes ´e muito rara quando o range de valores poss´ıveis das vari´aveis aleat´orias que geraram a amostra for muito grande.

Nosso pr´oximo assunto ´e as distribui¸c˜oes marginais de uma distribui¸c˜ao biva- riada. ´E precisa acrescentar exercicios que pe¸cam a contru¸c˜ao de distribui¸c˜oes mar- ginais a partir de distribui¸c˜oes multivariadas, na maioria, bivari´adas. Os exerc´ıcios devem correr assim: um experimento aleat´orio est´a dado. A partir dele, pede-se contruir a tabela da distribui¸c˜ao bivariada. Depois, pede-se usar esta tabela para deduzir as distribui¸c˜oes marginais. Por fim, pede-se confirmar a corre¸c˜ao das dis- tribui¸c˜oes, fazendo seus valores diretamente da descri¸c˜ao do experimento aleat´orio e da vari´avel aleat´oria apropreada.