• Nenhum resultado encontrado

06 Variáveis Aleatórias Discretas

N/A
N/A
Protected

Academic year: 2019

Share "06 Variáveis Aleatórias Discretas"

Copied!
20
0
0

Texto

(1)

4. VARIÁVEIS ALEATÓRIAS DISCRETAS Capítulo

4

Apresentaremos os conceitos de variável aleatória discreta e de distribuição conjunta de duas variáveis aleatórias discretas.

4.1. CONCEITO DE VARIÁVEL ALEATÓRIA

Seja  o espaço amostral de um experimento. Podemos, em muitas situações, ter interesse em estabelecer uma partição de  obtendo classes de eventos com determinadas características e suas respectivas probabilidades.

Vejamos os experimentos:

1) Lançam-se três moedas e observa-se o número de ocorrências “caras”

O espaço amostral é  = { CoCoCo , CoCoCa , CoCaCo ,CaCoCo , CoCaCa , CaCoCa ,

CaCaCo , CaCaCa}. Sendo X : ocorrências do número de “caras”, então X assume os

valores 0, 1, 2 e 3.

O número de “caras” determina em  uma partição (divisão) em 4 classes. Podemos estabelecer uma função, denotada por X, ao associarmos os elementos das classes de  correspondentes ao número de “caras” com os respectivos valores de X.  X(número de caras) CoCoCo 0

CoCoCa , CoCaCo , CaCoCo 1

CoCaCa , CaCoCa , CaCaCo 2

CaCaCa 3 Fig 4.1

Funções como esta, que associam os elementos de cada uma das classes formadas de  a um único número real de X são chamadas de variáveis aleatórias X.

No exemplo, o conjunto X é finito e a variável aleatória X será chamada de variável

aleatória discreta. Caso X seja infinito enumerável, X={ 0,1,2,3, ...}, também será

chamada de variável aleatória discreta. Se os valores da variável aleatória X puderem assumir qualquer valor do conjunto dos reais, então será chamada de variável aleatória contínua.

Interessa-nos associar aos valores de X as respectivas probabilidades das classes de .

Supondo, no experimento, que as moedas sejam equilibradas e assumindo que p(X=xi) ou, simplesmente, p(xi) seja a probabilidade de xi, i=1,2, 3 e 4 de X, temos:

Para x1 = 0, p( X=0) = p(0) = p({CoCoCo}) = 1/8,

x2 = 1, p( X=1) = p(1) = p({CoCoCa , CoCaCo , CaCoCo}) = 3/8,

x3 = 2, p( X=2) = p(2) = p({CoCaCa , CaCoCa , CaCaCo}) = 3/8 e

(2)

 X p(X) CoCoCo x1= 0 p(0)=1/8

CoCoCa , CoCaCo , CaCoCa x2=1 p(1)=3/8 .

CoCaCa , CaCoCa , CaCaCo x3= 2 p(2)=3/8

Fig 4.2 CaCaCa x4=3 p(3)=1/8

A função que associa a cada valor assumido pela variável aleatória X a probabilidade do evento correspondente chama-se função de probabilidade. Assim, definimos p de X em [ 0 , 1], onde

p( ) 0,xi   xi X e i i =1

x

p( ) 1

n

como uma função de probabilidade.

Ao conjunto {(xi ,p(xi) ) / xiX, i = 1,2, 3 e 4}, chamamos de distribuição de probabilidades da variável aleatória X.

Normalmente uma distribuição de probabilidades é apresentada por uma tabela ou um gráfico:

Fig 4.3

É importante dizer que numa distribuição de probabilidade tem-se i 1

p(x ) 1

n

, ou

seja, a soma das probabilidades da variável aleatória X é igual a 1 (ver tabela acima).

2) Em uma urna existem 2 bolas brancas e 3 bolas verdes. Retiram-se duas bolas, uma de cada vez, sem a reposição da primeira bola e observa-se o número de ocorrência de bolas verdes.

Temos:  = { BB, BV, VB, VV}, onde B é bola branca e V é verde. X : número de bolas verdes, isto é, X = { 0, 1, 2 }.

3/8

1/8

0 1 2 3 x

p( )x xi p(xi)

(3)

Veja:

B : 2/20 1/4

 xi p(xi)

B

BB 0 p(0)= 2/20 2/5 3/4 V : 6/20

BV e VB 1 p(1)=12/20 2/4 B : 6/20

VV 2 p(2)= 6/20 3/5 V

p(

xi

) =

1 2/4

V : 6/20 Fig 4.4

--- EXERCÍCIOS DE APLICAÇÃO 4.1

1) Em uma urna existem 2 bolas brancas e 3 bolas verdes de tamanhos iguais. Retiram-se duas bolas, uma de cada vez, com reposição da primeira bola. Seja X o número de bolas verdes obtidas.

a) determine os valores da variável aleatória discreta X

b) obtenha a distribuição de probabilidade da variável aleatória X c) defina a função de probabilidade da variável aleatória X

2) Suponha que uma moeda perfeita é lançada até que apareça “cara” pela primeira vez. Seja X o número de lançamentos até que isto aconteça. Obtenha a probabilidade de ocorrer k lançamentos.

(Observe que, neste problema, pelo menos teoricamente, X pode assumir um número infinito de valores discretos)

3) Lançam-se dois dados. Seja X a soma dos pontos das faces superiores ocorridas. Determine:

a) a distribuição de probabilidade da variável aleatória X b) P(X ser múltiplo de 4 )

c) P(X 3)

RESPOSTAS

1) a)  = { BB, BV, VB, VV} e X = { 0, 1, 2}

b) X 0 1 2

(4)

c) p : X [0, 1], onde

0 4/25

1 12/25

2 9/25

2) X = { 1,2,3,4,...., n,....} (variável aleatória discreta)

p(X = k) = K 2

1

, k = 1,2,3,4, ...

3) a) X 2 3 4 5 6 7 8 9 10 11 12 p(X) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

b) p(X ser múltiplo de 4) = p(X=4) + p(X=8) + p(X=12) = 3/36 + 5/36 + 1/36 = 9/36

d) p(X 3) = p(X=2) + p(X=3) = 1/36 + 2/36 = 3/36

--- 4.2. VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA

O valor esperado de uma variável aleatória, indicado por E(X), é também chamado de expectância, esperança matemática ou média. A esperança matemática de uma população é obtida pela soma dos produtos dos valores da variável aleatória pela respectiva probabilidade. Trata-se, neste caso, de uma média aritmética ponderada.

E(X) = X =

n

i

i ip x

x

1

) (

Se a variável aleatória X estiver subentendida utiliza-se  em substituição a X.

Para ilustrar a definição acima, consideremos os seguintes exemplos:

1) Num dia chuvoso um vendedor de guarda-chuvas ganha $300,00, mas não sendo chuvoso perde $15,00. Considerando-se que a probabilidade de chover num determinado dia é de 30%, qual é a esperança matemática para este dia?

Temos:

 = {chove, não chove} e X : valores apurados em um dia.  X p(X) chove x1=300 p(x1)=0,3

não chove x2=-15 p(x2)=0,7 Fig 4.5

Assim,

E(X) =  =

 2

1

) (

i

i ip x

x = x1 p(x1) + x2 p(x2) = (300). 0,3 + (-15).0,7 = 79,50

(5)

2) Num jogo de dado equilibrado se ocorrer face maior que 4 pontos, o jogador ganha $ 12,00 e, caso contrário, perde $ 9,00. Qual é a média de ganho para este jogador? Solução:

 xi p(xi) xi p(xi)

Mais de 4 pontos 12 2/6 4,00 Menos de 5 pontos -9 4/6 -6,00

1 E(X) = -2,00

Conclusão: Em média o jogador perde $ 2,00

3) Qual é a média de pontos esperada no lançamento de um dado equilibrado?

Solução:

xi p(xi) xi p(xi)

1 1/6 1/6 2 1/6 2/6 3 1/6 3/6 4 1/6 4/6 5 1/6 5/6 6 1/6 6/6

1 E(X) =  = 3,5

4.2.1. PROPRIEDADES DA ESPERANÇA (MÉDIA) (ver apêndice 1)

1) E(k) = k , sendo k uma constante 2) E(k . X) = k . E(X)

3) E(X ± Y) = E(X) ± E(Y)

4) E(m X ± n ) = m .E(X) ± n , sendo m e n constantes. 5) E(X - x) = 0

(ver apêndice 1)

4.3. VARIÂNCIA

Define-se variância como sendo a média dos quadrados dos desvios dos valores da variável aleatória X em relação a média.

VAR(X) = 2(X) = E[ (X )2] =

2

i i

i=1

x (x )

n

p

(6)

A variância indica o grau de dispersão ou de concentração de probabilidade em torno da média (veja os gráficos correspondentes aos exemplos 3 e 4 abaixo).

Dos exemplos citados no parágrafo anterior, temos:

1) Problema do vendedor de guarda-chuvas

Xi p(xi) xi p(xi) Xi -  (xi - )2 p(xi)

300 0,3 90,00 220,50 14 586,08 -15 0,7 - 10,50 -94,50 6 251,18 Total 1  = 79,50 Var(X) = 20 837,26

2) Jogador de dados

Xi p(xi) xi p(xi) xi -  (xi - )2 p(xi)

12 2/6 4 14 65,33 -9 4/6 -6 -7 32,66 Total 1  = -2 Var(X) = 107,99

3) Lançamento de um dado

xi p(xi) xi p(xi) xi -  (xi - )2 (xi - )2 p(xi)

1 1/6 1/6 -2,5 6,25 1,04 2 1/6 2/6 -1,5 2,25 0,38 3 1/6 3/6 -0,5 0,25 0,04 4 1/6 4/6 0,5 0,25 0,04 5 1/6 5/6 1,5 2,25 0,38 6 1/6 6/6 2,5 6,25 1,04

Total 1 X = 3,5 Var(X) = 2,92

4) Suponha que, no problema anterior, o dado esteja viciado, conforme indicam as probabilidades de ocorrências das faces yi na segunda coluna do quadro abaixo:

yi p(yi) yi p(yi) yi -  (yi - )2 (yi - )2 p(yi)

1 2/6 2/6 -2,5 6,25 2,0833 2 0 0 -1,5 2,25 0 3 1/6 3/6 -0,5 0,25 0,0416 4 1/6 4/6 0,5 0,25 0,0416 5 0 0 1,5 2,25 0 6 2/6 12/6 2,5 6,25 2,0833

Total 1 Y = 3,5 Var(Y) = 4,2498

(7)

Fig 4.6 Fig 4.7

4.3.1. PROPRIEDADES DA VARIÂNCIA (ver apêndice 2)

1) VAR(k) = 0, onde k é uma constante

2) VAR( k X) = k2 . VAR(X), onde k é uma constante

3) VAR(X ± Y) = VAR(X) + VAR(Y) ± 2 cov(X,Y)

A notação cov(X,Y) significa a covariância das variáveis aleatórias XeY. Ela mede o grau de dependência entre as variáveis. Por definição: cov(X,Y)=E{[X-E(X)].[Y-E(Y)]}. De modo prático, cov(X,Y) = E(X.Y) – E(X) . E(Y).

4) VAR( m X ± n ) = m2 . VAR(X), onde m e n são constantes.

5) VAR(X) = E(X2) [E(X)]2

6) Sendo X e Y variáveis aleatórias independentes: a) E(X.Y) = E(X) . E(Y).

b) cov(X,Y) = 0. (obs: cov(X,Y)=0 não implica que X eY sejam independentes) c) VAR(X ± Y) = VAR(X) + VAR(Y).

(Ver apendice 2)

4.4. DESVIO-PADRÃO

Desvio-Padrão da variável aleatória X, indicado por X , é a raiz quadrada da variância de X.

X = VAR(X)

Os desvios-padrões dos exemplos 3 e 4, apresentados no parágrafo 4.3, com a mesma média 3,5, são:

X = 2,92 = 1,71 e Y = 4,2498 = 2,06.

1/6 p(x)

x

1 2 3 4 5 6

X 3,5 e var(X) 2,92

  

1/6

1 2 3 4 5 6

2/6

y p(y)

3,5 e var( ) 4,25

Y Y

(8)

Observa-se que em distribuições normais de probabilidades, o grau de concentração de probabilidades em torno da média é aproximadamente:

-3 -2 - - -2 -3 x

68%

95,44%

99,74%

Fig 4.8

(Ver 6.3.5)

4.5. DISTRIBUIÇÃO CONJUNTA DE DUAS VARIÁVEIS ALEATÓRIAS

Muitas vezes nos interessa estabelecer variáveis aleatórias distintas a partir de um mesmo espaço amostral e estudar a dependência entre elas.

Exemplificando:

a) Observando-se um grupo de alunos, relacione as variáveis: idade cronológica X com a série do colégio que estão cursando Y.

b) Considerando-se um grupo de operários, relacione as variáveis: o tempo de serviço X com os salários recebidos Y.

Vamos desenvolver um exemplo para introduzir o conceito de distribuição conjunta

Suponha que um professor, após apresentar um assunto novo, deseja avaliar a atenção dos alunos. Para isto, faz três perguntas de tópicos independentes, de modo que a probabilidade de acertar ou de errar cada pergunta seja a mesma. Considere as variáveis: X: número de respostas corretas e

Y: 1 se a primeira resposta está correta e 0 se a primeira resposta está errada Temos:

Tabela 1

 Probabilidade xi yj

(9)

a) Distribuição de probabilidades das variáveis aleatórias X e Y. As tabelas 2 e 3 abaixo são construídas com base na tabela 1, adicionando-se as probabilidades de um mesmo valor xi ou yj das variáveis aleatórias.

Tabela 2 Tabela 3

xi p(xi) yi p(yi)

0 1/8 0 1/2 1 3/8 1 1/2 2 3/8

3 1/8

1

1

b) Distribuição de probabilidades dos pares (x,y), onde xX e yY. Veja tabela 4, construída com base na tabela 1. Exemplo: o par (1,0) é encontrado nas linhas 6 e 7 da tabela 1, onde 1 está na coluna xi e o 0 na coluna yj , ambos com a mesma probabilidade

igual a 1/8. Na tabela 4, o par (1,0) tem probabilidade 2/8, que é a soma das probabilidades

de cada par (1,0) das linhas 6 e 7. Os demais pares da tabela 4 são obtidos analogamente.

(xi,yj) p(xi,yj)

Tabela 4 (0,0) 1/8

(1,0) 2/8 (Distribuição conjunta) (1,1) 1/8

(2,0) 1/8 (2,1) 2/8 (3,1) 1/8

1

c) Distribuição conjunta de probabilidades das variáveis X e Y. Com as tabelas 2, 3 e 4 construímos a tabela 5

Tabela 5

X Y 0 1 p(x)

0 1/8 0 1/8 1 2/8 1/8 3/8 2 1/8 2/8 3/8

3 0 1/8 1/8

(10)

Na tabela 5, a primeira coluna e a última são as mesmas da tabela 2 e a primeira linha e a última são da tabela 3. A parte central da tabela 5 (em negrito) é formada pelas probabilidades dos pares da tabela 4, ou seja, pelas probabilidades conjuntas das variáveis X e Y. Assim, ao par (0,0) corresponde p(x=0,y=0) = 1/8, ao par (3,1) corresponde p(x=3,y=1) = 1/8, etc.

Lembramos, no exemplo dado, que o par (2,1) significa que o aluno acerta exatamente duas questões das três formuladas, sendo correta a sua primeira resposta e a probabilidade conjunta de (2,1) ocorrer é p(x=2,y=1) = 2/8.

4.5.1. DISTRIBUIÇÃO MARGINAL E CONDICIONAL DE PROBABILIDADES

Podemos obter da tabela 5, de forma inversa, as distribuições de probabilidades das variáveis X e Y (recuperar as tabelas 2 e 3). As distribuições de X e de Y são chamadas

de distribuições marginais de probabilidades.

Vamos tomar, como exemplo, a terceira coluna da Tabela 5 para entendermos aqui o conceito de distribuição condicional. Nesta coluna vemos que p(y=1) = 1/2, mostrando que a probabilidade de responder as três questões e ter a primeira delas correta é p(y=1) = = 0 + 1/8 + 2/8 + 1/8 = 1/2 .

Outro raciocínio: se tivermos a informação de que a primeira questão foi respondida corretamente, então, o universo das questões a serem formuladas passa a ter dois elementos e, agora, para acertar uma delas a probabilidade é 1/2. Assim, podemos dizer que ter duas respostas corretas (contando com a condição da primeira correta) a probabilidade é 1/2. Usaremos a notação p(x=2/y=1) = 1/2 para indicar este fato. Note que a probabilidade condicional p(x=2/y=1) tem significado diferente da probabilidade conjunta p(x=2, y=1).

O cálculo que permite obter probabilidade condicional é ilustrado no seguinte problema:

 Qual é a probabilidade de um aluno acertar duas questões, sabendo-se que respondeu a primeira corretamente?

Solução:

p(x=2 /y=1) =

) 1 (

) 1 , 2 (

  

y p

y x p

= 2 / 1

8 / 2

= 2 1

Note que, no caso condicional, estamos dividindo o terceiro elemento da terceira coluna da tabela 5 (=2/8) pelo valor correspondente ao total desta coluna (=1/2). Então, as

probabilidades condicionais da variável X em relação aos valores da variável Y são:

(11)

Analogamente podemos determinar as probabilidades condicionais da variável Y em relação aos valores da variável X

Veja: p(y=1 / x=2) =

) 2 (

) 1 , 2 (

  

x p

y x p

= 8 / 3

8 / 2

= 2/3

Deste modo,

p(y=0 / x=0) = 1 p(y=0 / x=1) = 2/3 p(y=0 / x=2) = 1/3 p(y=0 / x=3) = 0 p(y=1 / x=0) = 0 p(y=1 / x=1) = 1/3 p(y=1 / x=2) = 2/3 p(y=1 / x=3) = 1

4.5.2. MÉDIA, VARIÂNCIA E DESVIO PADRÃO DAS VARIÁVEIS X e Y

Utilizando as informações do exemplo dado em 4.5, Tabelas 2 e 3, temos:

1) Calculo da média

X p(X) X. p(X) Y p(Y) Y.p(Y)

0 1/8 0 0 1/2 0 1 3/8 3/8 1 1/2 1/2

2 3/8 6/8

1 E(Y)= 0,5 3 1/8 3/8

1 E(X)= 1,5

2) Calculo da variância e desvio-padrão

X p(X) X. p(X) X2.p(X) Y p(Y) Y.p(Y) Y2.p(Y)

0 1/8 0 0 0 1/2 0 0 1 3/8 3/8 3/8 1 1/2 1/2 1/2 2 3/8 6/8 12/8

1 E(Y)= 0,5 E(Y2)=0,5

3 1/8 3/8 9/8

1 E(X)= 1,5 E(X2)= 3

Temos: VAR(X) = E(X2) [E(X)]2 = 3 (1,5)2 = 0,75 (Ver em 4.3.1. prop.5)

VAR(Y) = E(Y2) [E(Y)]2 = 0,5 (0,5)2 = 0,25

X = VAR(X) = 0,75 = 0,87 Y = VAR(Y) = 0,25 = O,5

(12)

calcular, por exemplo, o número médio de questões corretas e o desvio padrão, sabendo-se que a primeira resposta está certa.

X p( X / Y=1) X . p( X / Y=1) X2. p( X / Y=1)

0 0 0 0 1 1/4 1/4 1/4 2 1/2 1 2 3 1/4 3/4 9/4

1 E( X/ Y=1) = 2 E(X2/Y=1)=4,5

Temos: E( X/ Y=1) = 2

VAR(X/Y=1) = E(X2/Y=1) [E(X/Y=1)]2 = 4,5 (2)2 = 0,5

x y/ 1= VAR(X/Y 1) = 0,71

--- EXERCÍCIOS PROPOSTOS 4.2

1) Os amigos A,B,C,D,E e F estudam numa mesma escola. O quadro abaixo mostra as séries que estão cursando e suas idades respectivas

A B C D E F Idade: X 16 18 17 17 16 17 Série: Y 1 3 2 2 1 2

Obter as distribuições de probabilidades, média, variância, desvio-padrão, p(x=17,y=2) e p(x=17 / y=2).

2) No caso de duas variáveis aleatórias X e Y serem independentes, temos que p(X/Y) = p(Y/X) = p(X) . p(Y). Supondo conhecidas as suas distribuições de probabilidades:

X p(X) Y p(Y)

1 0,4 3 0,2 2 0,6 4 0,8

construir a tabela de distribuição conjunta e obter a média, variância, desvio-padrão p(x=1,y=4) e p(y=4 / x=1).

3) Numa amostra com dez famílias, observou-se X: o número de filhos e Y: o número de veículos que possuem, conforme a tabela

A B C D E F G H I J

(13)

Construir a tabela de distribuição marginal e obter a média, variância e desvio-padrão, p(x=2,y=1) e p(x=2 / y=1).

RESPOSTAS:

1)

X Y 1 2 3 p(X) X.p(X) X2 p(X)

16 2/6 0 0 2/6 32/6 512 /6

17 0 3/6 0 3/6 51/6 867 /6 18 0 0 1/6 1/6 18/6 324 /6

p(Y) 2/6 3/6 1/6 1 E(X)=16,83 E(X2)=283,83

Y p(Y) 2/6 6/6 3/6 E(Y)=1,83 Y2 p(Y) 2/6 12/6 9/6 E(Y2)=3,83

Distribuição marginal em negrito

VAR(X) = E(X2) [E(X)]2 = 283,83 (16,83)2 = 0,58

VAR(Y) = E(Y2) [E(Y)]2 = 3,83 (1,83)2 = 0,48

X = 0,58 = 0,76 e Y = 0,48 = 0,7

p(x=17,y=2)=3/6 e p(x=17 / y=2)=1

2)

X Y 3 4 p(X) X p(X) X2 p(X)

1 0,08 0,32 0,4 0,4 0,4 2 0,12 0,48 0,6 1,2 2,4

p(Y) 0,2 0,8 1 E(X)= 1,6 E(X2)= 2,8

Y p(Y) 0,6 3,2 E(Y) =3,8 Y2p(Y) 1,8 12,8 E(Y2)=14,6

Distribuição conjunta em negrito

VAR(X) = E(X2) [E(X)]2 = 2,8 (1,6)2 = 0,24

VAR(Y) = E(Y2) [E(Y)]2 = 14,6 (3,8)2 = 0,16

(14)

3)

X Y 0 1 2 p(X) X.p(X) X2 p(X)

0 0 1/10 1/10 2/10 0 0

1 0 0 2/10 2/10 2/10 2/10 2 0 1/10 1/10 2/10 4/10 8/10 3 2/10 2/10 0 4/10 12/10 36/10

p(Y) 2/10 4/10 4/10 1 E(X)= 1,8 E(X2)= 4,6

Y p(Y) 0 4/10 8/10 E(Y)= 1,2 Y2 p(Y) 0 4/10 16/10 E(Y2)= 2

Distribuição marginal em negrito

VAR(X) = E(X2) [E(X)]2 = 4,6 - (1,8)2 = 1,36

VAR(Y) = E(Y2) [E(Y)]2 = 2 (1,2)2 = 0,56

X = 1,36 = 1,17 e Y = 0,56 = 0,75

P(x=2,y=)=1/10 e p(x=2 / y=1)=1/4.

--- 4.6. COVARIÂNCIA E COEFICIENTE DE CORRELAÇÃO

Consideremos as variáveis discretas X e Y a partir de um mesmo espaço amostral. Um procedimento conveniente para saber se existe dependência entre elas é construir o

gráfico de dispersão, que nada mais é do que a representação cartesiana dos pares de

valores das variáveis.

Nos problemas citados em 4.5 e exercícios de aplicação 4.2, temos:

1) O caso do professor que deseja testar a atenção dos alunos (em 4.5.)

( parte da Tabela 1)

X 3 2 2 2 1 1 1 0 Y 1 1 1 0 1 0 0 0

Fig 4.9

0 1 2 3

Y

(15)

Os pontos do gráfico estão espalhados e, por isto, não parece existir dependência “forte” entre as variáveis X e Y, mas isto será analisado logo adiante em 4.6.2.

2) O caso dos amigos que estudam numa mesma escola. (ex. aplic. 4.2. ex.1)

A B C D E F Idade: X 16 18 17 17 16 17 Série: Y 1 3 2 2 1 2

Fig 4.10

Os pontos do gráfico estão posicionados de forma a sugerir que possa haver uma reta que os contenha, isto é, uma dependência forte entre as variáveis, onde o jovem de idade maior estuda em série mais adiantada.

Existem muitos tipos de correspondências entre as variáveis, mas apenas nos interessa apresentar aquela em que os pontos do gráfico de dispersão se aproximam de uma reta.

Vamos estudar medidas que possam confirmar ou negar as nossas observações a respeito da dependência das variáveis.

4.6.1. COVARIÂNCIA

A covariância pode ser calculada pela fórmula Cov(X,Y) = E(XY)  E(X)E(Y), comentada em 4.3.1. Ela mede o grau de dependência entre X e Y.

1) No caso do professor que deseja testar a atenção dos alunos (4.5), temos

Tabela 5

Neste exemplo, também vimos X Y 0 1 p(x) que:

E(X) = 1,5 0 1/8 0 1/8 E(Y) = 0,5 1 2/8 1/8 3/8 e

2 1/8 2/8 3/8 X = 0,87 3 0 1/8 1/8 Y = 0,5

p(y) 1/2 1/2 1

0 16

2 3

Y

X 1

(16)

Resta-nos calcular E(XY) para obtermos a Cov(X,Y). Usaremos a variável T, onde T = XY, para facilitar os cálculos. Os valores de T, obtidos pelos produtos das coordenadas dos pares ordenados (X,Y), são: 0, 1, 2 e 3.

Vamos construir a tabela de distribuição de probabilidades da variável T.

Através do exemplo citado mostraremos que a construção é simples.

Tomemos o caso em que T = 0. Certamente, os pares que produzem T=0 são (0,0), (0,1), (1,0), (2,0) e (3,0). A soma das probabilidades conjuntas destes pares (tabela 5) dá o valor da probabilidade de T=0. Assim, p(T=0) = 1/8+0+2/8+1/8+0 = 4/8.

Conseguiremos a distribuição de probabilidade procedendo do mesmo modo com os demais valores de T.

T p(T) T. p(T)

Lembre: E(T) = E(XY) = 1 0 4/8 0

1 1/8 1/8 Cov(X,Y) = E(XY)  E(X)E(Y) = 2 2/8 4/8 = 1  (1,5).(0,5) = 3 1/8 3/8 = 1  0,75 = = 0,25

1 E(T)=1

2) No caso dos amigos que estudam numa mesma escola (ex. aplic. 4.2. ex.1).

Temos:

X Y 1 2 3 p(X) X.p(X)

16 2/6 0 0 2/6 32/6

17 0 3/6 0 3/6 51/6 18 0 0 1/6 1/6 18/6

p(Y) 2/6 3/6 1/6 1 E(X)=16,83

Yp(Y) 2/6 6/6 3/6 E(Y)=1,83

(17)

Assumindo que Z = X.Y, segue que:

Z p(Z) Z. p(Z)

Lembre: E(Z) = E(X.Y) = 31,33 16 2/6 32/6

17 0 0 18 0 0 32 0 0

34 3/6 102/6 Cov(X,Y) = E(X.Y)  E(X).E(Y) = 36 0 0 = 31,33  (16,83).(1,83) = 48 0 0 = 31,33  30,80 =

51 0 0 = 0,53 56 1/6 54/6

1 E(Z) = 188/6 = 31,33

A covariância pode assumir qualquer valor no conjunto dos números reais, isto é, -< Cov(X,Y) < + e, a sua unidade de medida relaciona as unidades das variáveis envolvidas (no caso acima, X: idade dos alunos e Y: série que estudam), tornando-se difícil interpretá-la. Para contornar este problema, definiremos:

4.6.2. COEFICIENTE DE CORRELAÇÃO

=

X Y (X, Y)

.

Cov

 

Fica evidente, pela razão que define , que o coeficiente de correlação é um número que não tem unidades de medida e, ainda, que -1   1.

A dependência entre as variáveis é tanto maior quanto  estiver mais próximo de 1 ou de -1. Nestes extremos, 1 e -1, a correspondência é perfeita, podendo-se estabelecer uma equação do tipo Y = a X + b, com a0 e b reais.

Se as variáveis forem independentes a Cov(X,Y) = 0 e, também, = 0, neste caso, os pontos estarão espalhados não havendo reta que os contenha. Experimente desenvolver o exercício 2, proposto em 4.7, e verá que Cov(X,Y)=0.

Cuidado, a Cov(X,Y)=0 não garante que as variáveis sejam independentes, neste caso, é necessário verificar se todas probabilidades conjuntas são tais que p(X=xi,Y=yj) =

p(xi) . p(yj), fato que ocorre no exercício de aplicação 4.2(2), indicando que X e Y são

independentes.

(18)

1) No caso do professor que deseja testar a atenção dos alunos (4.6.1(1)), temos

= X Y (X, Y) . Cov

  = (0,87).(0,5) 25 , 0 = 44 , 0 25 , 0

= 0,57 (fraca correlação, os pares

de observações estão afastados de uma reta, apenas sugerem que existe uma tendência de declividade positiva, pois  >0 ).

2) No caso dos amigos que estudam numa mesma escola (4.6.1(2)), temos

=

X Y (X, Y)

.

Cov

  =(0,76).(0,7) 53 , 0 = 53 , 0 53 , 0

= 1 Legal!, temos uma “forte”

correlação positiva, indicando que, no gráfico de dispersão, os pares de observações estão alinhados com declividade positiva. Se ocorresse = 1 teríamos uma forte correlação negativa e os pontos estariam próximos aos de uma reta com declividade (coeficiente angular) negativa.

4.7. RETA DE REGRESSÃO: Y= a X + b , com a0 e b reais

Quanto mais próximo o valor de  esteja de 1 ou de –1 maior será a confiabilidade de se escrever a variável Y em função de X . A equação da reta que melhor se adapta ao conjunto dos pares ordenados (X,Y) das variáveis aleatórias é Y= a X + b, onde

a = n. XY2 X. 2Y

n. X ( X)

 

 

e b =

Y a. X

n

sendo n o número de pares ordenados (fundamentação teórica – Apêndice (5)).

A equação da reta de regressão será obtida ao determinarmos os coeficientes a e b. O método acima para obter a equação da reta de regressão é conhecido em matemática como o método dos mínimos quadrados.

Exemplo: Obter a equação da reta de regressão no caso do exemplo 2 em exercícios de aplicação 4.2 (1).

X Y X2 XY

16 1 256 16

17 2 289 34 n = 3 18 3 324 54

51 6 869 104

a = 2

) 51 ( ) 869 .( 3 ) 6 ).( 51 ( ) 104 .( 3   = 2601 2607 306 312   = 6 6

= 1 e b = 3 ) 51 .( 1 ) 6 (  = 3 45 

= 15

Assim, Y = 1 . X  15 é a equação da reta procurada.

(19)

EXERCÍCIOS DE APLICAÇÃO 4.3

1) Uma rede de lojas deseja testar a demanda de um certo produto. Escolhe 10 lojas em região de igual movimento de pessoas e verifica que (em unidades de preço e de produto) tem-se:

LOJAS A B C D E F G H I J X: preços 10 5 10 15 12 8 7 15 12 8 Y: vendas 50 75 50 25 40 60 65 25 40 58 Pede:

a) Distribuição marginal e conjunta de probabilidades b) Médias

c) Variâncias e desvios padrões

d) Covariância e coeficiente de correlação e) Gráfico de dispersão

f) Se possível, a reta de regressão

g) Estime a quantidade demandada quando o preço for $20.

2) Feita uma pesquisa com 5 famílias obteve-se o quadro abaixo, onde X é o número de filhos e Y é a poupança da família.

A B C D E

X 5 2 1 3 4 Y 600 1200 1000 700 300 Pede:

a) Distribuição marginal e conjunta de probabilidades b) Médias

c) Variâncias e desvios padrões

d) Covariância e coeficiente de correlação e) Gráfico de dispersão

f) Se possível, a reta de regressão

g) Estime a poupança para uma família com 0 filhos.

3) A lucratividade de uma empresa tem diminuído a cada ano, sendo X o número de anos de funcionamento e Y o lucro em cada ano, em unidade monetária, verificou-se:

X 2 3 4 5 6 7 Y 7,0 6,5 5,8 3,5 2,3 1,9 Pede:

a) Distribuição marginal e conjunta de probabilidades b) Médias

c) Variâncias e desvios padrões

d) Covariância e coeficiente de correlação e) Gráfico de dispersão

(20)

4) Um gerente de vendas acredita que a venda de seus produtos tem forte relação com as visitas de seus vendedores aos clientes. Embora as vendas também sejam feitas por telefone, um levantamento envolvendo X: número de visitas e Y: número de produtos vendidos mostra, para cada vendedor:

A B C D E F G H I J X 50 70 65 85 50 65 63 60 70 55 Y 140 200 180 250 140 180 170 165 200 150 Pede:

a) Distribuição marginal e conjunta de probabilidades b) Médias

c) Variâncias e desvios padrões

d) Covariância e coeficiente de correlação e) Gráfico de dispersão

f) Se possível, a reta de regressão.

g) O pensamento do gerente esta correto?

Referências

Documentos relacionados

a) Carlos mobilou o consultório com luxo. Indica o tipo de sujeito das seguintes frases.. Classifica as palavras destacadas nas frases quanto ao processo de formação de palavras..

Desta forma, este estudo tem como objetivo relatar a experiência vivenciada, por acadêmicas do 5º período do Curso de Enfermagem da Universidade Federal de

Se a probabilidade de a variável assumir valores num subintervalo for a mesma que para qualquer outro subintervalo de mesmo comprimento teremos então uma distribuição

A acrescentar a este conjunto de entraves à prova por parte do paciente, facilmente se constata que este, não possuindo conhecimentos técnico-científicos na área da

Se o espaço amostral contém um número innito de pontos amostrais igual ao número de pontos em um segmento de linha, isto é, innito e não-contável, então é denominado espaço

Você pode trabalhar para ajudar pessoas no seu lar ou em qualquer lugar.Pode ajudar pessoas como empreendedor (a), como gestor (a) de franquia, empresário(a), lider

O estudo está fundamentado na teoria da aprendizagem significativa de David Ausubel, onde os novos conceitos devem ser ancorados em conhecimentos prévios relevantes na

Quando contratados, conforme valores dispostos no Anexo I, converter dados para uso pelos aplicativos, instalar os aplicativos objeto deste contrato, treinar os servidores