• Nenhum resultado encontrado

Dados Experimentais. Isto é chamado de experimento controlado. Uma das vantagens

N/A
N/A
Protected

Academic year: 2021

Share "Dados Experimentais. Isto é chamado de experimento controlado. Uma das vantagens"

Copied!
34
0
0

Texto

(1)

Dados Experimentais

Para medir a produção de certa variedade de milho, faremos um experimento no qual a variedade de milho (semente) é plantada emp q ( ) p várias parcelas homogêneas com o mesmo fertilizante, pesticida etc. Depois mede-se a produção por m2 ou, número de grãos, número de espigas por pé etc

número de espigas por pé, etc.

Isto é chamado de experimento controlado. Uma das vantagens deste experimento é que ele é possível de ser reproduzido e pode deste experimento é que ele é possível de ser reproduzido e pode ser repetido por diferentes pesquisadores e assim os procedimentos podem ser checados.

Outra vantagem é que ele pode ser repetido para diferentes níveis de variáveis de controle. Por exemplo, diferentes doses de adubo. Assim cada resultado específico para cada efeito da variável pode Assim cada resultado específico para cada efeito da variável pode ser isolado.

(2)

Em economia, um exemplo de experimento controlado é observar o efeito de uma campanha promocional nas vendas em um o efeito de uma campanha promocional nas vendas em um supermercado.

Ex. y representa a quantidade vendida, por semana, de uma certay p q , p , marca de lata de atum.

x1 é o preço da lata de atum na promoção

x2 é o preço da lata de atum de outra marca.

(

)

+

ε

=

f

x

1

, x

2

y

f(.) significa que y é uma função de x1 e x2

é ã l d ã i i l ó i

ε é o componente não controlado e não previsto, ie, o erro aleatório. Apesar de o experimento ser controlado, a relação não é exata.

Neste exemplo, podemos querer saber o que acontece com as vendas se o preço da lata de atum diminuir 10 centavos.

(3)

Dados não experimentais

A i i d d d ô i é ã i l A f

A maioria dos dados econômicos é não-experimental. A fonte principal de dados econômicos provém de observações de resultados do dia a dia:

- Quantidade consumida - PIB - Taxa de juros I fl ã - Inflação - Desemprego

Não podemos controlar o resultado destas variáveis nem reproduzir. Entretanto, um modelo econômico fornece a estrutura necessária para termos um experimento hipotético controlado, pelo qual os dados que observamos poderiam ter sido gerados

qual, os dados que observamos poderiam ter sido gerados.

Se a maioria dos dados econômicos não é gerada por experimentos controlados feitos pelos pesquisadores, mas por experimentos controlados feitos pelos pesquisadores, mas por experimentos conduzidos pela sociedade, como observar as variáveis econômicas?

(4)

O governo coleta os dados (IBGE, DIEESE) Variáveis

- discretas – assume um número finito de valores.

E ú d i d i íli

Ex.: número de crianças no domicílio.

número de vezes que o indivíduo vai ao shopping por semana. Variáveis discretas são comumente utilizadas para classificar dados qualitativos ou não numéricos.

d = 1 se o chefe do domicílio é homem d 1 se o chefe do domicílio é homem

d = 0 se o chefe do domicílio é mulher

Uma variável contínua pode assumir qualquer valor real em ump q q intervalo no eixo dos números reais.

Ex.: PIB

Em 1987 o PIB dos Estados Unidos era de 3853,7 bilhões dólares, Preço

(5)

Dada uma amostra de dados, o que fazer?

- queremos usá-la para estimar constantes econômicas desconhecidas ou parâmetros.

Antes de utilizar inferência queremos examinar a amostra e fazer um resumo ou descrevê-la, i.e., identificar suas características primárias.p Estatística Descritiva x

n x x =

(

)

2 / 1 2

- média dos dados

- coeficiente de variação CV sx 100

(para diminuir o problema de magnitude na comparação de

(

)

2 / 1 2 =

− − n x x sx

- dispersão dos dados

coeficiente de variação = 100 x

CV x magnitude na comparação de

(6)

Variável aleatória – aquela que seu valor é conhecido somente depois

d li d i

de realizado o experimento.

Distribuição de Probabilidade Distribuição de Probabilidade

Podemos fazer afirmações probabilísticas sobre certos valores da variável aleatória especificando uma distribuição de probabilidade

variável aleatória especificando uma distribuição de probabilidade. Imagine que temos uma tabela de dados, p.e., observações de um conjunto de variáveis aleatórias no tempo. Podemos descrever osj p valores utilizando estatísticas descritivas, histogramas, gráficos de dispersão, etc. Entretanto, estes procedimentos não são adequados para se fazer inferência Inferência estatística é baseada na habilidade para se fazer inferência. Inferência estatística é baseada na habilidade de se fazer afirmações probabilísticas sobre as variáveis aleatórias. Para fazer tais afirmações precisamos de informações sobre a distribuição de probabilidade da variável aleatória.

(7)

Quando os valores de uma variável aleatória são listados com suas probabilidades de ocorrência a tabela resultante de valores é probabilidades de ocorrência, a tabela resultante de valores é chamada função densidade de probabilidade.

Considere uma variável aleatória discreta x igual ao número deg caras obtidas em uma única jogada de uma moeda. A função densidade de probabilidade, f(x) é: x f(x) 0 0.5 x f(x) 0 0.5 xx f(x)f(x) 0 0 0.50.5 x x f(x) 0 1 – p 1 x x f(x) 0 1 – p 1 xx x f(x)x f(x) 0 0 1 – p1 – p 1 1

Isto significa que a probabilidade de x ser 1 é 0,5. Isto implica no

1 0.5

1 0.5

1

1 0.50.5 1111 pppp

g q p p

fato de os 2 valores 0 e 1 terem uma chance igual de ocorrência e, se jogarmos a moeda um grande número de vezes, o valor x = 1 ocorreria 50% das vezes Denotamos isto por:

ocorreria 50% das vezes. Denotamos isto por: P(x = 1) = f(1) = 0,5

(8)

F(x) f(x)

0,5

0 1 x

Usando formula f (x) = px

(

1− p

)

1−x para x =0, 1

0 1 x

A f.d.p. para uma variável aleatória contínua Y é uma função f(y), a qual é a equação de uma curva A área total abaixo da função é 1 e a qual é a equação de uma curva. A área total abaixo da função é 1 e a probabilidade de Y tomar valores no intervalo [a, b] ou P(a

Y

b)

é a área sob a f.d.p. entre os valores y = a e y = b.

Em contraste, a f.d.p. de uma variável discreta é uma fórmula para calcular a probabilidade de um valor específico ocorrer.

(9)

= ≤ ≤ b a f y dy b Y a P( ) ( )

Função de densidade de probabilidade conjunta

Freqüentemente precisamos responder perguntas sobre mais de uma variável aleatória. Por ex.:

Q l b bilid d d i fl ã 5% t d

Qual a probabilidade de a inflação ser menor que 5% e a taxa de desemprego menor do que 6% no próximo ano?

(10)

P (P ≤ 5, U ≤ 6) = f(u, p)

Para responder estas perguntas envolvendo 2 ou mais variáveis aleatórias, devemos conhecer a função de densidade de probabilidade conjunta.j

(11)

Exemplo que envolve variáveis aleatórias discretas:

Suponha que temos uma população (não é amostra) de 1000 indivíduos que desejamos classificar por sexo (masculino e feminino) e religião (católica, protestante, outro)

⎩ ⎨ ⎧ f i i 1 masculino 0 S ⎧ e protestant se 1 católica se 0 R ⎩ ⎨ feminino 1 ⎪ ⎩ ⎨ religião outra 2 e protestant se 1 R S 0 1 S 0 1 S S 0 0 11 S 0 1 h(r) 0 0 2 0 27 0 47 S 0 1 h(r) 0 0 2 0 27 0 47 S S 0 0 11 h(r)h(r) 0 0 0 20 2 0 270 27 0 470 47 0 200 270 R 1 300 100 2 60 70 0 200 270 R 1 300 100 2 60 70 0 0 200200 270270 R R 11 300300 100100 2 2 6060 7070 0 0,2 0,27 0,47 R 1 0,3 0,10 0,40 2 0 066 0 07 0 13 0 0,2 0,27 0,47 R 1 0,3 0,10 0,40 2 0 066 0 07 0 13 0 0 0,20,2 0,270,27 0,470,47 R R 11 0,30,3 0,100,10 0,400,40 2 2 0 0660 066 0 070 07 0 130 13 2 60 70 2 60 70 2 2 6060 7070 2 0,066 0,07 0,13 f(s) 0,56 0,44 1 2 0,066 0,07 0,13 f(s) 0,56 0,44 1 2 2 0,0660,066 0,070,07 0,130,13 f(s) f(s) 0,560,56 0,440,44 11

(12)

A tabela mostra a função de probabilidade conjunta f(s r) de S e R A tabela mostra a função de probabilidade conjunta f(s, r) de S e R.

Há 200 homens católicos em 1000. Portanto, a probabilidade de se escolher um homem católico é 200/1000 = 0,2 = f(0,0), ( , )

Funções Densidade de probabilidade marginal

Dada uma função de probabilidade conjunta, podemos obter a distribuição de probabilidade de variáveis aleatórias individuaisç p

Se X e Y são variáveis aleatórias discretas, então

= y y x f x f ( ) ( , )

f f ( ) =

( ) x y x f y f ( ) ( , )

(13)

Exemplo:

A b bilid d d l i l i h é 0 56

A probabilidade de selecionar aleatoriamente um homem é 0,56 e uma mulher 0,44

f( ) distribuição marginal de S

f(s) = distribuição marginal de S.

Funções Densidade de Probabilidade Condicional

Freqüentemente, a chance de ocorrência de um evento está condicionada à ocorrência de outro evento.

Ex.: se a frente fria chegar hoje, a chance de chuva é de 80%.

) ( ) ( ) , ( ] [ f x y y f y x f y Y x X P = = = = ) ( y f

Ex.: Qual a probabilidade de uma mulher selecionada aleatoriamente ser protestante?

227 , 0 ) 1 ( ) 1 , 1 ( 44 , 0 1 , 0 440 100 ] 1 1 [ = = = = = = f f S R P

(14)

Variáveis Aleatórias Independentes

A áli d i d iá l l ó i é i lifi d

A análise de mais de uma variável aleatória é simplificada se as variáveis envolvidas não são relacionadas, ou são estatisticamente independentes.p

Duas variáveis são estatisticamente independentes ou independentemente distribuídas se o conhecimento do valor de uma delas não nos dá qualquer indicação sobre o valor que a outra pode tomar.

Ex.: sair cara na jogada de 2 moedas.

Se sair cara em uma moeda, não sei o que ocorrerá na outra.

d d

X1 = número de caras na moeda 1.

X2 = número de caras na moeda 2.

P X X ã i d d

(15)

Em economia, exemplo de variável aleatória independente é gasto com carne por 2 indivíduos escolhidos aleatoriamente

gasto com carne por 2 indivíduos escolhidos aleatoriamente. Inflação e desemprego seriam dependentes

Se X1 e X2 são independentes então

) ( ) ( ) (X1X2 f X1 f X2 f = No exemplo da moeda 2 2 1 1 (1 )1 (1 )1 ) (X X px p x px p x f 1 − 1 2 − 2 2 1, ) (1 ) (1 ) (X X p p p p f = − − 2 2 1 1

(

1

0

,

5

)

1

0

,

5

(

1

0

,

5

)

1

5

,

0

x

x x

x

=

Então a probabilidade de obter uma cara na 1a. moeda e coroa na 2a. é

(16)

O valor esperado de uma variável aleatória

Uma importante característica da variável aleatória é o seu valor esperado ou média. É o valor médio da variável aleatória em ump número infinito de repetições do experimento (amostras) e denota-se E(X).

Se X é o número de caras ao se lançar uma moeda, e X pode tomar os valores 0,1 então

E(X) = 0,5, que é o valor médio de X. Para a variável discreta

)

(

...

)

(

)

(

)

(

X

X

1

f

X

1

X

2

f

X

2

X

T

f

X

T

E

=

+

+

=

T X f (X ) = i i i f X X 1 ) (

(17)

Para a variável contínua

∞ ∞ − = Yf Y dY Y E( ) ( )

= = = y x P x Y y Y X E( ) . ( ) Esperança na condicional.

x y y) ( ) ( 545 , 0 159 , 0 . 2 227 , 0 . 1 614 , 0 . 0 ) 1 (r S = = + + = E 159 , 0 44 , 0 07 , 0 ) 1 2 (R = S = = = f Propriedades da Esperança 227 , 0 44 , 0 10 , 0 ) 1 1 (R = S = = = f 614 , 0 44 , 0 27 , 0 ) 1 0 (R = S = = = f Propriedades da Esperança (1) E(c) = c c é constante (2) E (cX) = c E(X) (2) E (cX) = c E(X) (3) E (a + cX) = a + c E(X) a e c constantes (4) E (X + Y) = E (X) + E (Y)

(18)

Variância de uma variável aleatória

[

]

2 2 ) ( ) (X E X E X Var( ) =σ =

[

− ( )

]

) ( } )] ( [ ) ( 2 { ) ( )) ( (XE X 2 f X = Σ X 2 − XE X + E X 2 f X Σ =

Lembre-se que E(X) é uma constante 1 Lembre-se que E(X) é uma constante

) ( )] ( [ ) ( ) ( 2 ) ( 2 2 X f X E X Xf X E X f X − Σ + Σ Σ = 2 2 )] ( [ ) ( ) ( 2 ) (X E X E X E X E 1 2 2 )] ( [ ) ( ) ( 2 ) (X E X E X E X E − + = 2 2 )] ( [ ) (X E X E − =

Quanto maior a variância, mais espalhados os valores da população com relação a média.

Propriedades:

0

)

(

)

1

)

V

(

c

)

=

0

1

V

c

=

) ( ) ( ) 2 V cX = c2V X

(19)

Covariância

Para analisar a relação entre variáveis econômicas e responder perguntas do tipo o quão próximas caminham duas variáveis perguntas do tipo, o quão próximas caminham duas variáveis preços? utilizamos a covariância (ou correlação) entre 2 variáveis. Se X1 e X2 são variáveis aleatórias discretas, então

S 1 2 ,

( )

(

)

(

( )

)

[

]

[

( )

]

[

( )

]

( ) ) , cov(X1,X2) = E

[

(

X1E

( )

X1

)

(

X2E

( )

X2

)

]

=

∑∑

[

X1E

( )

X1

]

[

X2E

( )

X2

]

f (X1X2) cov( 1 2 1 1 2 2 1 1 2 2 1 2 1 2 X X f X E X X E X X E X X E X E X X X X

∑∑

O i l d iâ i i di i ã é i i (di )

O sinal da covariância indica se a associação é positiva (direta) ou negativa (inversa). Covariância 0 significa que não há associação entre as variáveis.ç

(20)

A it d d iâ i é difí il d i t t

A magnitude da covariância é difícil de interpretar porque depende da unidade de medida das variáveis aleatórias. Por isso utiliza-se a correlação.

(21)

(

)

cov X1X2 = ρ ) ( ) (X1 Var X2 Var ρ

Mede o grau de associação linear entre as variáveis. A correlação g ç ç está sempre entre 1 e –1 .

Suponha que X11 é uma função perfeitamente linear de X22, ou X11 =

a +cX2 onde a e c são constantes diferentes de 0.

Então Então

(

1, 2

)

[

1

( )

1

]

[

2

( )

2

]

cov X X = E XE X XE X

(

) (

)

[

a cX2 E a cX2

]

[

X2 E

( )

X2

]

E + − + − =

[

(

2

) (

2

)

]

[

2

( )

2

]

( )

[

a a cX2 cE X2

]

[

X2 E

( )

X2

]

E − + − − =

( )

[

( )

]

2

[

]

2 2 2 E X X cE − =

( )

X2 cVar =

(22)

Como a Var (X1) = c2 Var(X 2) , então

( )

) cov(X X cVar

( )

X ⎧1 se c > 0

( )

22 2 1 2 1 ) cov( X cVar X cVar VarX VarX X X = = ρ ⎩ ⎨ ⎧ < − > = 0 se 1 0 se 1 c c

A covariância entre variáveis aleatórias independentes X1 e X2 é zero, indicando que não há uma associação linear entre elas.

Para a amostra:

(

)(

)

1 cov − − − =

T Y Y X X XY

(

)(

)

(

)

(

)

− − − − = 2 2 Y Y X X Y Y X X rXY

(

X Y

)

Var

( )

X Var Y

( )

XY Var + = + ( ) + 2cov

(23)

Funções Densidade de Probabilidade A Distribuição Normal

Se X é uma variável aleatória com distribuição normal, com média

β

e variância σ2 , simbolizamos por:

(

2

)

, ~ N β σ

X

(

)

A função densidade de probabilidade é:

⎤ ⎡ 1

(

)

+∞ < < ∞ − ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = X X X f 2 2 2 2 1 exp 2 1 ) ( σ β πσ

A média

β

e a variância

σ

2 são os parâmetros desta distribuição

⎥⎦ ⎢⎣

(24)

As probabilidades são obtidas integrando a função para obter a área. Entretanto para facilitar utilizam-se tabelas da distribuição normal Entretanto, para facilitar utilizam-se tabelas da distribuição normal padronizada, a qual tem média 0 e variância 1.

(25)

(

)

) 1 , 0 ( ~ N X Z = − β σ

A relação entre X e Z é muito útil, pois qualquer informação a

respeito dep X pode ser reformulada para Z e consultada a tabela.p p

(

)

⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − ≥ = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − ≥ − = ≥ σ β σ β σ β a Z P a X P a X P

(

)

⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − ≤ ≤ − = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − ≤ − ≤ − = ≤ ≤ σ β σ β σ β σ β σ β b Z a P b X a P b X a P ⎠ ⎝ ⎠ ⎝ σ σ σ σ σ Ex: Se X ~ N(3,9) então

(

)

(

0,33 1

)

0,3413 0,1293 0,212 3 3 6 3 3 4 6 4 ⎟ = ≤ ≤ = − = ⎠ ⎞ ⎜ ⎝ ⎛ − ≤ ≤ − = ≤ ≤ X P Z P Z P

(26)

Um fato útil da distribuição normal é que a soma ponderada de variáveis aleatórias com distribuição normal também tem distribuição normal.

) , ( ~ , ), , ( ~ ), , ( ~ Se X1 N

β

1

σ

12 X2 N

β

2

σ

22 L Xn N

β

n

σ

n2 então , constantes são , , , se e c1 c2 L cn

[

(

),

var(

)

]

~

2 2 1 1

X

c

X

c

X

N

E

Z

Z

c

Z

=

+

+

L

n n

(27)

Distribuição de Qui Quadrado Distribuição de Qui-Quadrado

Estas distribuições surgem quando elevamos ao quadrado variáveis Estas distribuições surgem quando elevamos ao quadrado variáveis aleatórias que são normal padronizada.

Se Z1, Z2, ..., Zm são m variáveis aleatórias N(0,1) independentes,

então 2 2 2 2 2 1 Z ... Zm ~ m Z v = + + + χ

m

v

E

(

)

=

m v V( ) = 2

(28)

Distribuição t

Surge dividindo-se uma variável aleatória normal padronizada Z

l i d d d iá l l ó i i d d

pela raiz quadrada de uma variável aleatória qui-quadrado independente v , que foi dividida pelo seu número de graus de

liberdade,, m.

(29)

m t m v Z t ~ / = m v/

A distribuição t é simétrica com média 0 e variância m/(m

2).

Tem a calda mais grossa do que a distribuição normal, mas na medida em que o número de graus de liberdade aumenta, ela tende a distribuição normal padronizada

distribuição normal padronizada. Distribuição F

Forma-se uma variável aleatória F pela razão de duas variáveis

qui-quadrado independentes, divididas pelos respectivos graus de liberdade. / m v tes independen são e se e ~ e ~ Se 1 2 2 2 1 2 2 1 v v v v χm χm

(

1 2

)

2 2 1 1 ~ , / / m m F m v m v F =

(30)

Regras de Somatório Regras de Somatório

1) Se a é uma constante então

1) Se a é uma constante então

n aXi = a

n Xi

= = i i 1 1

(31)

Prova:

= + + + i n i aX aX aX aX 1 2 ...

(

X X Xn

)

a + + + = 1 2 ... n

= = n i i X a 1

2) Se X e Y são duas variáveis, então

(

)

n Xi +Yi = n Xi + n Yi = = = i i i 1 1 1 Prova:

(

) (

1 1

)

( 2 2) ... ( ) 1 n n n i i i Y X Y X Y X Y X + = + + + + + +

= ) ( ) (X + X + + X + Y +Y + + Y = (X1 + X 2 + ...+ Xn ) + (Y1 +Y2 +...+ Yn ) =

+

= Xi Yi

(32)

3) Se X e Y são duas variáveis, e a e b são constantes, então

(

)

n n n

(

)

= = = + = + i i i i i i i bY a X b Y aX 1 1 1 X n

X é a média aritmética de valores da variável 4)Se n X X X n X X =

i = 1 + 2 + ...+ n X n

X é a média aritmética de valores da variável 4)Se então

(

)

0 1 = −

n i i X X n n 1 = i Prova:

(

XiX

) (

= XX

) (

+ XX

)

+ +

(

XnX

)

1 2 ...

(

X + X + + X n

)

(

X + X + + X

)

= 1 2 ... ...

− =

X nX = Xi nX mas

(33)

i i

X

X

n

X

n

=

Σ

=

Σ

Portanto, i

n

5)

(

)

2 2 2 X X X X n

(

)

XiX = XiXi = 0 5)

(

)

=

− = 2 2 1 X n X X X i i i Prova Prova

(

)

(

)

− = − + = 2 2 2 1 2X X X X X X i i n i i

+ = 2 2 2X X nX Xi i 2 2 2XnX nX Xi − + =

Xi 2XnX + nX

− = 2 2 X n Xi

(34)

Somatório Múltiplo

(

)

(

) (

)

(

)

∑∑

= =

+

+

+

+

+

+

=

+

m i n j n j i

Y

X

Y

X

Y

X

Y

X

1 1 1 2 1 1 1

...

(

X

+

Y

) (

+

X

+

Y

)

+

+

(

X

+

Y

n

)

+

2 1 2 2

...

2 i 1 j 1

M

(

X

Y

) (

X

Y

)

(

X

Y

)

(

X

m

+

Y

) (

+

X

m

+

Y

)

+

+

(

X

m

+

Y

n

)

+

1 2

...

Referências

Documentos relacionados

Considera a permanência da televisão na preferência da juventude brasileira e baseia-se em conceitos da Semiótica da Cultura – como texto – e da Teoria das Representações

 Apostila 3: Espelhos esféricos (Tipos de espelhos esféricos, Tipos de feixes de luz, Tipos de imagens, Estudo analítico da imagem); Lentes esféricas. (Elementos

comum, acerca da percentagem da rede rodoviária avaliada pela avaliação global da rede rodoviária nos três anos anteriores, os progressos alcançados no sentido da realização

Com base na informação que consta desta tabela e para um nível de significância de 5%, comente a independência entre o sexo do individuo e a sua inclinação partidária... Error

• Embora se possa definir quantis para qualquer tipo de variável aleatória, só iremos apresentar a definição de quantil para o caso em que a variável aleatória é continua

Para se realizar a técnica das dobras cutâneas existem algumas recomendações pré-teste, na qual se destaca a não realização de atividade física antes da realização das

Esta coarticulação entre ensino da língua Tupi nas escolas indígenas, preparação de material didático pensado dentro da escola a partir dos professores indígenas e aprimoramento do

Assim, o sistema metacognitivo, segundo os autores, funcionaria da seguinte maneira: en- quanto a cognição «salta» para o nível meta ocorre o monitoramento do nível objeto por meio