• Nenhum resultado encontrado

Apostila Econometria 2013

N/A
N/A
Protected

Academic year: 2021

Share "Apostila Econometria 2013"

Copied!
112
0
0

Texto

(1)

(3) Residuos (r

(3) Residuos (rii) calculados com base na função ) calculados com base na função de regressão já obtida.de regressão já obtida.

rr11== y y i i -- yyˆˆ (diferença entre os dados conhecidos e os dados ajustados pela funçãoii (diferença entre os dados conhecidos e os dados ajustados pela função

ii

x x y

yˆˆ==4040,,33++22,,6644

(4) ordenação dos resíduos de forma

(4) ordenação dos resíduos de forma crescente (rcrescente (r22))

(5) enumeração dos resíduos já ordenados na posição em que se encontrava primitivamente (P (5) enumeração dos resíduos já ordenados na posição em que se encontrava primitivamente (Pii).).

Exemplo: o valor

Exemplo: o valor -5,6 estava posicionad-5,6 estava posicionado em 2000, ou seja, na posição 7 ; -4,1 na posiço em 2000, ou seja, na posição 7 ; -4,1 na posição 4 eão 4 e assim

assim sucessivamentesucessivamente..

(6) refere-se ao número de elementos da série com valores superiores a cada P

(6) refere-se ao número de elementos da série com valores superiores a cada Pii. Por exemplo:. Por exemplo:

valores superiores a P

valores superiores a P11=7 encontramos : (11,10,8 e 9=7 encontramos : (11,10,8 e 9), ou seja, 4 ), ou seja, 4 elementos. Etc.... (Pelementos. Etc.... (Pii))

Na sequencia , calculamos o valor

Na sequencia , calculamos o valor de S pela expressão:de S pela expressão:

( (

))

−− −− ⋅⋅ = = 2 2 1 1 2 2 nnnn S S ω ω ii

( (

))

2 2 1 1 1 111 1 111 2 255 2 2⋅⋅ −− −− = = S S 5 5 5 555 5 500−− ==−− = = S S Para amostras s

Para amostras superiores a 10 (n>10), uperiores a 10 (n>10), partimos da hipótepartimos da hipótese de que a se de que a distribuição distribuição dos resíduosdos resíduos

( ( ))

SS é assintóticamente normal com média zero:é assintóticamente normal com média zero: EE

( ( ))

SS ==00 e desvio padrãoe desvio padrão

( ( ))

(

( )

) (

(

))

1 188 5 5 2 2 1 1⋅⋅ ++ − − = = nnnn nn s s σ  σ  ou variânciaou variância

( ( ))

(

( )

) (

(

))

1 188 5 5 2 2 1 1 2 2 == nnnn−− ⋅⋅ nn++ s s σ  σ 

Nesses casos recomenda-se ainda aplicar a correção de continuidade, adicionando-se uma Nesses casos recomenda-se ainda aplicar a correção de continuidade, adicionando-se uma unidade ao resultado de

unidade ao resultado de SS, quando esta for negativa e subtraindo-se 1 quando for positiva. No, quando esta for negativa e subtraindo-se 1 quando for positiva. No exemplo :

exemplo :SS= - 5 + 1= - 4 .= - 5 + 1= - 4 .

A seguir calculamos o desvio padrão

A seguir calculamos o desvio padrão pela expressão acima citadapela expressão acima citada

( ( ))

( (

( (

))

))

1 188 5 5 2 2 )) 1 1 ⋅⋅ ++ − − ⋅⋅ = = nn nn nn S S σ  σ 

(

( )

)

(

(

))

8 844 ,, 1 122 1 188 5 5 1 111 2 2 1 1 1 111 1 111 )) ((SS == ⋅⋅ −− ⋅⋅ ⋅⋅ ++ == σ  σ  Conhecido o valor de

Conhecido o valor de σ σ ((SS), o próximo passo é determinar o valor de), o próximo passo é determinar o valor de t t  calculado (calculado (t t cc)pela)pela

expressão: expressão: 3 399 ,, 0 0 8 844 ,, 1 122 5 5 )) (( ==−− − − = = = = S S S S ttcc σ  σ 

Este valor é comparado com o valor tabelado de

(2)

normal quando o tamanho da amostra n for relativamente grande. Assim, se o valor de

normal quando o tamanho da amostra n for relativamente grande. Assim, se o valor de t t cc estiverestiver

compreendido no intervalo ±1,96, aceitamos a hipótese H

compreendido no intervalo ±1,96, aceitamos a hipótese H00de que a de que a série é estacionária.série é estacionária.

--1,96 ≤1,96 ≤t t cc≤ 1,96 (série é ≤ 1,96 (série é estacionária)estacionária)

No exemplo em estudo, nota-se que

No exemplo em estudo, nota-se que t t cc = - 0,39, portanto menor do que 1,96 estando= - 0,39, portanto menor do que 1,96 estando

compreendido no intervalo citado, o que sugere que

compreendido no intervalo citado, o que sugere que a série é estacionária.a série é estacionária. A formulação das hipóteses no teste de

A formulação das hipóteses no teste de Mann é:Mann é: H

H00: a série de : a série de resíduos é estacionáriaresíduos é estacionária

H

H11: a série de : a série de resíduos apresenta tendêncresíduos apresenta tendênciaia

Pelo resultado acima obtido, concluímos pela aceitação da hipótese nula ,.H Pelo resultado acima obtido, concluímos pela aceitação da hipótese nula ,.H00

P

Para amostras inferiores ou iguais a 10 (4 ≤ n ≤ 1ara amostras inferiores ou iguais a 10 (4 ≤ n ≤ 10), pode0), pode-se recorrer a tabela de Kendall.-se recorrer a tabela de Kendall.

Devido a exiguidade da carga horária, exercícios contendo aplicações dessa tabela não serão aqui Devido a exiguidade da carga horária, exercícios contendo aplicações dessa tabela não serão aqui abordados.

abordados.

Conforme comentado inicialmente, este tópico mostra de forma apenas superficial o problema Conforme comentado inicialmente, este tópico mostra de forma apenas superficial o problema envolvendo séries temporais. A matéria sobre este assunto é muito mais abrangente, razão pela envolvendo séries temporais. A matéria sobre este assunto é muito mais abrangente, razão pela qual, deixaremos de abordar uma série de tópicos inerentes a análise das séries temporais, tais qual, deixaremos de abordar uma série de tópicos inerentes a análise das séries temporais, tais como: Modelos Autorregressivos (AR), Modelos de Média Móvel (MA); Modelo Autorregressivo e como: Modelos Autorregressivos (AR), Modelos de Média Móvel (MA); Modelo Autorregressivo e Média Móvel (ARMA), que é a combinação de Média Móvel e Autorregressivo, Processo de Média Móvel (ARMA), que é a combinação de Média Móvel e Autorregressivo, Processo de Periodicidades Ocultas, etc.

(3)
(4)
(5)
(6)

− dificuldades na classificação de variáveis em endógenas e exógenas o que tornaria tendencioso

o efeito das mesmas;

− dificuldade de incorporar nos modelos os fatores de natureza qualitativa e subjetiva como

opiniões; expectativas; intenções; etc.

− problemas de especificação da teoria e dos erros, etc.

Os problemas citados já vêm sendo analisados há algum tempo por econometristas, entretanto alguns pontos não foram totalmente solucionados como o problema da multicolinearidade (intercorrelação entre variáveis explicativas) e mensuração de variáveis subjetivas.

Para o aprendizado suave da matéria pressupõe-se que o alunado tenha algum conhecimento de estatística básica e de inferência estatística.

Apresentamos abaixo, os assuntos abordados nesta apostila, acompanhados de exercícios ao fim de cada capitulo, procurando, na medida do possível, alinhar-se com o programa de econometria instituído pela Faculdade.

− Conceito de econometria e o seu objetivo;

− Conceito de modelo (classificação, estrutura, pressupostos básicos, etc.);

− Análise da regressão linear simples de duas variáveis (estimação e interpretação dos

parâmetros; o método dos mínimos quadrados ordinários; conceito de regressão; previsão de valores; erro padrão da estimativa; erro máximo de estimação; intervalo de predição; erro padrão dos estimadores; qualidade do ajuste e sua interpretação; teste de hipóteses aplicados à regressão pela distribuição “t ” de Student e pela distribuição “F ” de Fisher/Snedecor com a elaboração do quadro ANOVA (Analysis of Variance);

− Análise da regressão linear múltipla, onde serão abordados todos os itens já comentados na

análise de regressão simples;

− Covariância e correlação (determinação, interpretação e verificação da sua existência);

− Violação dos pressupostos básicos (heteroscedasticidade e homoscedasticidade; natureza,

consequência e detecção da heteroscedasticidade); autocorrelação serial (causas, consequências e diagnóstico da autocorrelação);

− Utilização de variáveis especiais como extensão dos modelos de regressão (variáveis dummy,

binária, artificial ou dicotômica); utilização da variável tempo como variável explicativa numa série temporal de informações numéricas;

(7)
(8)
(9)

=

i

x variável independente  β 2

=

parâmetro angular =

e termo aleatório

 O que são regressores?

O conjunto de variáveis exógenas ou explicativas mais o termo constante ou linear ou intercepto são denominados de regressores. Assim, na equação acima, os regressores seriam:

1

 β  e

 β 

2

.

x

i

Cabe lembrar que o comportamento da economia resulta da interdependência de diversos fatores e ao explicá-lo os economistas evitam a complexidade do mundo real através da construção de modelos que apesar de retratarem de forma aproximada a realidade, destacando apenas os elementos ou variáveis consideradas relevantes, permitem alcançar a essência do fenômeno em questão. Apesar do avançado estágio em que se encontra a teoria econômica, ocorrem situações onde a formulação das hipóteses do modelo e a identificação dos elementos relevantes é um tanto arbitrária, não havendo garantias de que elas sejam realistas, portanto, é preciso verificar se o modelo proposto é capaz de explicar o fenômeno a que se propõe.

Através do confronto do modelo com as observações do mundo real é que se pode concluir ou não a validade do modelo. Um poderoso instrumento neste sentido são os modelos econométricos analisados pela econometria, uma técnica que agrega a estatística, a matemática e a teoria econômica.

Conforme indicado na figura 1 a seguir, um modelo econométrico resulta de um processo que se inicia com uma análise econômica que envolve a consulta da teoria econômica e percepção da realidade para auxiliar na identificação das variáveis dependentes e independentes a serem incluídas no modelo, bem como na especificação da forma funcional que relaciona estas variáveis. Uma característica dos modelos econométricos é a consideração de um termo estocástico, com uma distribuição de probabilidade hipotética, para representar a incerteza inerente ao comportamento da economia e também outras variáveis, omitidas na formulação do modelo, mas que explicam a realidade.

Uma vez especificado o modelo econométrico e estabelecidas às hipóteses pertinentes, são coletadas observações das variáveis dependentes e independentes, para em seguida, através da aplicação da inferência estatística, estimar e testar a validade do modelo econométrico. A validade de um modelo econométrico não será apenas julgada por técnicas de inferência estatística, mas também pela coerência com a teoria econômica. Caso o modelo especificado não seja o aceito deve ser corrigido, seja retirando ou incluindo variáveis independentes ou ainda modificando a forma funcional que relaciona as variáveis.

Quanto à aplicação, os modelos econométricos podem ser utilizados na obtenção de evidências empíricas que modifiquem, refinem ou refutem as conclusões contidas na teoria econômica ou novas proposições teóricas e também na avaliação de políticas econômicas, sendo uma

(10)

parâmetros como elasticidades, multiplicadores, coeficientes técnicos e custos marginais, portanto trata-se de uma valiosa ferramenta em um processo de tomada de decisão.

Figura 1 – sugestão de roteiro para construção de modelos econométricos

Capítulo 3: ANÁLISE DE REGRESSÃO LINEAR SIMPLES DE DUAS VARIÁVEIS

O gerente de vendas de uma empresa varejista do ramo de calçados está interessado em obter uma equação que sintetize a relação existente entre o investimento em propaganda e o volume de vendas da empresa, com a finalidade de realizar projeções do volume de vendas.

(11)

Tabela 3.1 Dados de investimento em propaganda e vendas em milhares de reais da empreza Z. Investimento em Propaganda milhares de

Reais (x)

Venda em milhares de Reais (y) 30 40 20 34 35 52 40 49 38 47 18 21 10 20 15 27 35 41 24 48 0 10 20 30 40 50 60 0 10 20 30 40 50

Investimento em propraganda m ilhares de Reais

   V  e   n    d  a   e   m   m    i    l    h  a   r   e   s    d  e   r   e   a    i  s

Figura 3.1 Dados de investimento em propaganda e vendas em milhares de reais da empreza Z. A figura 3.1 apresenta um gráfico com os valores de uma amostra levantada pelo departamento de vendas da empresa Z. O gráfico revela uma tendência de crescimento entre o volume de vendas e o investimento em propaganda, ou seja, um incremento no investimento em propaganda resulta em um aumento no volume de vendas.

(12)

0 10 20 30 40 50 60 0 10 20 30 40 50

Investimento em propraganda m ilhares de Reais

   V  e   n    d  a   e   m   m    i    l    h  a   r   e   s    d  e   r   e   a    i  s

Figura 3.2 Reta ajustada entre Volume de vendas e investimento com propaganda em milhares de reais.

O exemplo anterior constitui uma aplicação de regressão linear simples, onde a relação existente entre a variável dependente ou endógena (volume de vendas) e a variável independente ou exógena (investimento em propaganda) é modelada através de uma reta ajustada aos dados amostrais, conforme mostra a Figura 3.2

3.1. EXPRESSÃO DO MODELO:

e x

y= β 1+β 2. i + (3)

O modelo é chamado de regressão linear simples porque há apenas uma variável econômica

( )

x , no lado direito da equação. Quando houver mais de uma variável explicativa

( )

x é chamada de regressão múltipla. É chamado de linear porque a expectativa condicional de y é uma função linear de x, ou seja:

(

y x

)

x e E = β 1+ β 2. +

3.2. PRESSUPOSTOS BÁSICOS:

O termo regressão mostra o efeito da variável explicativa x sobre a variável explicada y, através das estimativas dos parâmetros β i.

Num modelo de regressão linear deverão ser considerados alguns pressupostos conforme abaixo: a) O valor de ypara cada valor de x é definido pela expressão acima (3), onde “ e” é o erro ou

(13)

b) A esperança matemática do erro aleatório é igual a zero, pois admite-se que E

( )

y = β 1+ β 2.xi, donde se conclui que: E

( )

e

=

0.

c) A variância do erro aleatório é igual à variância de y, pois y e “e” diferem apenas pelo intercepto, que é um fator constante que não altera a variância, V

( ) ( )

e

=

V y . Portanto, a variância do erro aleatório é finita e constante.

d) A covariância entre qualquer par de erros aleatórios e e1 e é igual à covariância do par2 y1e

2

y que é igual à zero, ou seja: cov

( ) ( )

e1;e2

=

cov y1;y2

=

0. Assim, temos que os termos aleatórios são independentes.

e) O Erro aleatório (e) segue distribuição normal com média igual a zero e variância constante;

 OBS:

Significado do termo erro aleatório ou perturbação estocástica

( )

e : resumidamente podemos conceituar como sendo o substituto ou representante de todas as variáveis omitidas ou desconsideradas que podem afetar a variável dependente y, mas que não estão no modelo de regressão ou que não puderam ser incluídos no citados modelo.

3.3. ESTIMAÇÃO DOS PARÂMETROS

O problema de regressão consiste em, dado o modelo teórico (como o linear, por exemplo), estimar os parâmetros desconhecidos β  e1  β  que são respectivamente os parâmetros intercepto2 e o angular, com base nas informações amostrais de um dado fenômeno como, por exemplo, despesas com alimentação e renda (no caso de uma regressão linear simples).

Apesar de existirem vários métodos para sua obtenção (polinômios ortogonais, máxima verossimilhança, mínimos quadrados ordinários, etc.), o mais recomendado, por ser não tendencioso, consistente, eficiente, de fácil obtenção e de maior confiabilidade, é o método dos mínimos quadrados ordinários, que sugere como princípio que devemos obter uma reta tal que a soma dos quadrados das distancias verticais de cada ponto à reta seja o menor possível ou em outras palavras, que a soma dos quadrados das diferenças entre cada valor conhecido e ajustado pela função

( )

yˆ seja o menor possível, isto é:

(

)

= − n i y y 1 2 ˆ = mínimo (4)

O valor do intercepto

( )

 β  e o valor do parâmetro angular1

( )

 β 2 dessa reta que melhor se ajusta aos dados conhecidos

( )

y , pelo método dos mínimos quadrados ordinários (m.q.o.) são b e1 b2

(14)

3.4. EQUAÇÕES NORMAIS (Equações simultâneas)

Para obtermos os valores de b e1 b2, utilizamos a forma recursiva, denominada de equações normais que são obtidas derivando-se parcialmente a igualdade (4) acima e igualando-a a zero, obtendo-se: - Forma geral     + = + =

2 2 2 . . . . x b x b xy x b n b y i i (5) - Forma reduzida

( ) ( )( )

(

2

) ( )

2 2 . . .

− − = x x n y x xy n b (6) x b y b1

=

2. (7)

As fórmulas (4), (5) e (6) e (7) são denominadas de estimadores de mínimos quadrados e são utilizadas para estimar os parâmetros b e1 b2 da função.

Na sequência daremos um exemplo com várias perguntas. O desenvolvimento, a interpretação e a natureza das mesmas estão explicitados no decurso das resoluções das questões.

 Exemplo 1:

A tabela abaixo mostra a evolução da poupança pessoal

( )

y e renda pessoal

( )

x em unidades monetárias (U.M.) por um período de 12 anos (Colunas (1), (2) e (3)). Pressupõe-se que a trajetória das variáveis assume um comportamento linear.

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Anos Poupança

( )

y Renda

( )

x x.y x2 yˆ

(

y−yˆ

)

2

(

x−x

)

2

(

y−y

)

2

(

yˆ− y

)

2 1 6 8 48 64 6,15 0,023 49 16 14,82 2 7 8 56 64 6,15 0,723 49 9 14,82 3 6 9 54 81 6,70 0,490 36 16 10,89 4 8 11 88 121 7,80 0,040 16 4 4,84 5 9 12 108 144 8,35 0,422 9 1 2,72 6 10 13 130 169 8,90 1,210 4 0 1,21 7 9 14 126 196 9,45 0,202 1 1 0,30 8 9 16 144 256 10,55 2,402 1 1 0,30 9 11 18 198 324 11,65 0,422 9 1 2,72 10 12 20 240 400 12,75 0,002 25 4 7,56 11 15 11 165 121 13,85 1,322 49 25 14,82 12 18 29 522 841 17,70 0,090 196 64 59,29

(15)

Nota: as colunas (1) a (3) são dados informados e as colunas (4) a (10) são colunas auxiliares para desenvolvimento das questões.

Com base nas informações pede-se:

1) Estimar pelo método dos mínimos quadrados ordinários a equação da poupança em função da renda;

2) Calcular e interpretar o resultado dos estimadores obtidos;

3) Estimar a poupança provável, se a renda pessoal num determinado ano for de 35 U.M. 4) Avaliar o erro padrão de estimativa

5) Obter o intervalo de predição para a poupança estimada em (3) 6) Determinar o erro padrão dos estimadores;

7) Obter o intervalo de confiança dos estimadores com α = 0,05 e interpretá-los; 8) Verificar a qualidade do ajuste e interpretá-lo;

9) Determinar o intervalo de predição em função do erro máximo do valor estimado e o intervalo de predição dela decorrente.

10) Testar a hipótese da existência de regressão entre o par x e y (porStudent e porFische

 Desenvolvimento:

1) Equação de regressão do modelo

(

y

=

 β 1

+

β 2.x

)

( ) ( )( )

(

2

) ( )

2 2 . . . ˆ

− − = x x n y x xy n b

( )

2 2 180 3144 12 120 180 2044 12 ˆ − × × − × = b ∴ bˆ2=0,55 15 55 , 0 10 . ˆ ˆ 2 1= y−b x= − × b ∴ bˆ1=1,75

- Equação de regressão da poupança: x

(16)

No contexto econômico, o valor bˆ1=1,75, significa que mesmo que a renda x seja zero, a poupança pessoal y teria um crescimento de 1,75 U.M.

Quanto ao estimadorbˆ2, significa aumento de 0,55 na poupança pessoal

( )

y , quando a renda pessoal

( )

x (parâmetro angular) aumentar de uma unidade monetária.

3) Valor estimado da poupança quando a renda for de 35 U.M.

Com a ajuda da equação obtida na questão (1), ou seja, yˆ=1,75+0,55x, podemos estimar o provável valor da poupança pessoal

( )

y , bastando para tanto substituir a variável explicativa

( )

x

por 35 U.M. que é a renda conhecida, ou seja: x yˆ=1,75+0,55 35 55 , 0 75 , 1 + × = est y ∴ yest =21U.M.

4) Erro padrão de estimativa

O erro padrão da estimativa tem como uma de suas finalidades estabelecer o intervalo de predição (margem de desvio) para mais ou para menos do valor estimado de

( )

y em função de

( )

x . Portanto, nada mais é do que a dispersão em termos absolutos dos valores residuais. Como se sabe, os valores residuais são aqueles valores resultantes da diferença entre os dados conhecidos e os ajustados por uma função qualquer.

O erro padrão da estimativa, geralmente representado por Sˆy:x é calculado pela expressão:

(

)

k n y y Syx − − =

2 : ˆ ˆ (8) Sendo: =

y dados conhecidos (coluna 2 da tabela) =

yˆ dados ajustados pela equação (coluna 6) =

n tamanho da amostra (n=12)

=

k número de parâmetros (intercepto + angular)

(

)

2 12 911 , 7 ˆ ˆ 2 : = − =

k n y y Syx ∴ Sˆy:x=0,89

5) Intervalo de Predição (IP) para o valor estimado da poupança de 21 U.M.

O Intervalo de Predição (IP) nada mais é do que a margem de erro do valor estimado, o que sugere diminuir e posteriormente somar ao valor estimado o erro padrão da estimativa, calculado na questão anterior, ou seja, quanto menor o seu valor, menor é a margem de erro.

(17)

IP = VE ± Sˆy:x

IP = (VE - Sˆy:x; VE + Sˆy:x) (9) IP = 21 + 0,89

IP = (21 - 0,89 ; 21 + 0,89) IP = (20,11 ; 21,89)

6) Erro padrão dos estimadores bˆ1 e bˆ2

No estudo da regressão, a determinação do erro padrão dos estimadores

1

ˆ

b

S tem como uma de suas finalidades básicas auxiliar na obtenção do intervalo de confiança dos estimadores, pois é de fundamental importância que os estimadores sejam não tendenciosos.

No caso da regressão linear simples, vimos que os estimadores são bˆ1e bˆ2, assim, temos:

 Cálculo do erro padrão do estimador bˆ1:

(

)

− = 2 2 : . . ˆ ˆ 1 x x n x S Sb yx (10)

 Cálculo do erro padrão do estimador bˆ2:

(

)

− = 2 : ˆ ˆ 2 x x S Sb yx (11)

 No exemplo em questão temos: 6.1) Erro padrão do estimador b1

1 ˆ b S

(

)

− = 2 2 : . . ˆ ˆ 1 x x n x S Sb yx (12) 444 12 3144 . 89 , 0 ˆ 1 = × b S ∴ ˆ 0,68 1 = b S

6.2) Erro padrão do estimador b2

2 ˆ b S

(

)

− = 2 : ˆ ˆ 2 x x S Sb yx (13) 89 , 0 ˆ = S ∴ Sˆ =0,042

(18)

7) Intervalo de confiança dos estimadores

A construção de um intervalo de confiança (IC) para um estimador tem como finalidade, principalmente em econometria, medir o nível de precisão do citado estimador, ou seja, se há sintomas de tendenciosidade.

Para a construção do IC, o pesquisador deverá levar em consideração algumas informações relevantes como, por exemplo:

− Valor do erro padrão dos estimadores

1

ˆ

b

S , conforme mencionado no item anterior;

− O nível de confiança α  desejado na pesquisa, com base na distribuição t de Student ;

− O número de graus de liberdade

(

g.l.

=

n

k

)

.

=

n tamanho da amostra e k

=

número de parâmetros

Assim, observadas as condições acima, o intervalo de confiança de um dado estimador poderá ser construído com base no modelo genérico a seguir:

(

)

bi i i

(

)

bi i t n k S b t n k S b − α  − .ˆ < β  < + α  − .ˆ (14) 7.1) Intervalo para bˆ1

(

12 2

)

.0,68 1,75

(

12 2

)

.0,68 75 , 1 −t0,05 − < β 1< +t0,05 − 27 , 3 23 , 0

<

 β 1

<

O intervalo acima definido significa que existe a probabilidade 0,95 ou 95% de chance de que o valor de β  esteja entre 0,23 e 3,27.1

7.2) Intervalo para bˆ2 042 , 0 2281 , 2 55 , 0 042 , 0 2281 , 2 55 , 0

×

<

β 2

<

+

×

644 , 0 4564 , 0

<

 β 2

<

O intervalo acima significa que existe a chance de 95% de que  β  esteja entre 0,4564 e 0,644.2 8) Avaliação da qualidade do ajuste

A qualidade do ajuste ou poder explicativo da regressão pode ser avaliado pelo coeficiente de determinação 2

R e tem como finalidade verificar em quantos por centos a variável dependente

( )

y é explicada pela variável independente

( )

x . Quanto mais o valor de 2

R se aproximar de 100%, melhor é a qualidade do ajuste.

(19)

 Expressão para cálculo:

(

)

(

)

2 2 2 ˆ

− − = y y y y R (15)

Substituindo com os resultados encontrados nas colunas (9) e (10) do exemplo,

142 29 , 134 2 = R ∴ R2 =0,946ou 94,6%

O resultado indica que 94,6% da variável y é explicada pela variável X, que sugere uma boa qualidade do ajuste, pois quanto mais se aproximar de 100% ou de 1, melhor é a qualidade do ajuste.

9) Erro máximo do valor estimado

Para obtermos o intervalo de predição com base no erro máximo do valor estimado, devemos inicialmente determinar o valor do erro

( )

E pela expressão:

(

)

( )

− + + = 2 2 2 . . 1 1 ˆ . x x n x x n n S t E α  y (16) Onde: = α 

t distribuição t deStudent com

(

n

k

)

g.l., com α =0,05ou 95% ou outro nível qualquer =

y

Sˆ erro padrão da estimativa

=

n tamanho da amostra e k=nº de parâmetros da função sob análise . As estatísticas acima são conhecidas:

( )

n−k =t0,05

( )

10 =2,228 tα  (tabelado) 89 , 0 ˆ = y S 12

=

n =

x variável explicativa utilizada na época t para estimativa dei y. No exemplo em questão

35

=

x U.M. 15

=

x

2 =3144 x . Daí temos:

(

)

2 15 35 . 12 1 1 . 89 , 0 228 , 2 × + + − = E

(20)

1 b b2 5328 4800 083 , 0 1 . 982 , 1 + + = E 984 , 1 . 982 , 1 = E ∴ E =±2,79

Obtido E, o intervalo de predição será conhecido, somando-se e subtraindo-se ao valor estimado o valor de E, ou seja: E VE IP

=

±

(17)

(

21

2,79;21

+

2,79

)

=

IP

(

18,21;23,79

)

=

IP

Observe que a diferença em relação ao intervalo de predição encontrado na questão 5 anterior é que no 2º procedimento foi introduzido o fator probabilístico (distribuição t de Student ).

10) Teste de hipótese da existência de regressão por t de Student e Fisher 

Um recurso estatístico para se verificar a existência de regressão entre variáveis de uma dada função é a aplicação do teste de hipóteses.

Existem inúmeras formas para efetuar o teste. Serão abordados, neste caso, o de Student e o de Fisher/Snedecor , por serem os mais usuais.

10.1) Teste t de Student 

Por este teste calculamos inicialmente o valor de t pela função:c

i b i i c S b t ˆ  β  − = (18) Onde: = c t t calculado = i

b parâmetros intercepto e angular

=

i

 β  hipótese a ser testada =

i

b

Sˆ erro padrão dos estimadores No exemplo são conhecidos:

- A equação de regressão: y=1,75+0,55x

(21)

Assim: 042 , 0 0 55 , 0 − = c t ∴ tc =13,09

Na sequência, formulamos as hipóteses: 0 2 0 = β  = H (ausência de regressão) 0 2 1

=

β 

H (presença de regressão)

Verificamos na tabela da distribuição t o valor de tα 

( )

n−k =t0,05

( )

12−2 = 2,228. Comparamos t comc tα 

(

n−k

)

.

Se t (calculado) for maior quec tα 

(

n−k

)

(tabelado), ou seja, diferente de zero, significa presença de regressão entre as variáveis x ey.

No teste em questão, as decisões a serem apresentadas são: a) Decisão estatística = rejeita-se a hipótese H ;0

b) Decisão econômica = a população da qual foi extraída a amostra de 12 observações sobre poupança

( )

y e renda

( )

x ) sugere a existência de regressão entre elas com 95% de probabilidade de que a decisão tomada esteja correta.

10.2) Teste F deFisher 

Uma outra forma de verificar a existência de regressão é através do teste F com auxílio do quadro de análise da variância (ANOVA), cujo desenho para determinar o F calculado

( )

Fc é o que se segue: Fonte da variação Soma dos quadrados Graus de Liberdade

( )

g.l. Média Quadrática Fc Devido a regressão

(

)

2 ˆ y y k=1

(

)

1 ˆ 2

yy (a) b a Fc = Devido a resíduos

(

)

2 ˆ y y n

k

1

(

)

1 ˆ 2 − − −

k n y y (b)

No exemplo em questão já foram calculadas as estatísticas necessárias ao cálculo de F (na tabelac do exemplo 1). Encontrado o valor de F , este é comparado aoc Fα 

(

n−k−1

)

(tabelado), na distribuição de Fisher/Snedecor .

Se o valor de F for maior quec Fα 

(

n−k−1

)

, rejeitamos a hipótese nula H , o que sugere0 presença de regressão entre as variáveis x e y, que são respectivamente a renda e a poupança.

(22)

: 0 H ausência de regressão

:

1 H presença de regressão

Finalmente, enunciamos as decisões estatística e econômica. Dessa forma, aplicando-se o teste F ao exemplo 1 temos:

Elaboração do quadro ANOVA com base nas estatísticas conhecidas: Fonte da

variação ∑ dos quadrados

( )

g.l.

Média Quadrática Fc Regressão 134,29 1 134,29 75 , 169 79 , 0 29 , 134 = Resíduos 7,911 12-1-1 = 10 0,79 75 , 169 = c F Fα 

(

n−k−1

)

= F0,05

( )

10 = 4,96

- Formulação das hipóteses: : 0 H ausência de regressão

:

1 H presença de regressão

Nota-se que Fc > F0,05

( )

10 o que sugere rejeitar a hipótese H , o que nos leva as seguintes0 decisões:

a) Decisão estatística = rejeitar H0

b) Decisão econômica = a população da qual foram extraídas as 12 amostras sugere a existência de regressão entre o par de valores x e y, com 95% de probabilidade de que a decisão esteja correta.

(23)

 Exemplo 2:

Com base nos dados de despesas com alimentação (yi) e renda mensal (xi), levantados durante 10

periodos consecutivos (ti), desenvolver as questões 1 a 11. Os valores estão em unidades

monetárias (U.M.) i t yi xi 1 5 10 2 6 15 3 8 17 4 12 20 5 13 25 6 10 20 7 12 22 8 18 30 9 13 25 10 18 26 ∑ 115 210

1) Estimar a equação da reta que exprime a relação entre y e x;

2) Interpretar os resultados obtidos dos estimadores no contexto do modelo econômico em questão;

3) Estimar, com base na equação obtida em (1), a despesa com alimentação

( )

y , sabendo-se que a renda mensal

( )

x é de 30 U.M.;

4) Determinar o erro padrão da estimativa;

5) Determinar o intervalo de predição com base nos resultados encontrados em (3) e (4); 6) Determinar o intervalo de predição com base no erro máximo do valor estimado; 7) Determinar o erro padrão dos estimadores b e1 b2;

8) Determinar o intervalo de confiança dos estimadores b e1 b2;

9) Avaliar a qualidade do ajuste (poder explicativo da regressão), interpretando-o;

10) Testar a hipótese da existência de regressão entre as variáveis x e y pela distribuição t; 11) Idem acima pela distribuição F . Elaborar o quadro ANOVA.

(24)

 Exemplo 3:

O par de valores yi e xi referem-se a índice de quantidade demandada e tarifa real média, respectivamente, de energia elétrica. Os valores da tarifa foram deflacionados por um indicador adequado, tendo como base o ano t6.

Anos yi xi t1 74 145 t2 76 134 t3 81 117 t4 90 111 t5 94 109 t6 100 100 t7 103 137 t8 108 122 t9 113 85 t10 115 90

1) Estimar a equação da demanda;

2) Tendo por base a equação obtida em (1), estimar a demanda esperada em t11 se a tarifa real

em t1 for de 98;

3) Determinar o intervalo de predição do valor estimado da demanda em t11;

4) Determinar o intervalo de predição com base no erro máximo do valor estimado; 5) Determinar o intervalo de confiança dos estimadores b e1 b2;

6) Avaliar a qualidade do ajuste;

7) Testar a hipótese da existência de regressão entre as duas variáveis (por Student e por Fisher );

(25)

 Exemplo 4:

Considere os dados amostrais de um estudo da relação entre o número de anos que os candidatos a empregos em um determinado banco comercial estudaram inglês na faculdade e as notas obtidas em um teste de proficiência nessa língua.

Número de anos ( x ) Nota do teste (y )

3 5,2 4 7,7 4 7,4 2 5,3 5 9,1 3 6,4 4 7,3 5 8,6 3 7,4 2 4,3  Exemplo 5:

Uma empresa, com a finalidade de determinar a relação entre gastos anuais com propaganda (X), em R$1.000,00 e lucro anual (Y), em R$1.000,00, optou por utilizar o modelo linear simples  Yi =α + β X+ε i, em que Y i  é o valor do lucro bruto auferidono ano i , X i  é o valor

gasto com propaganda no ano i  e ε , o erro aleatório com as respectivas hipóteses consideradas para a regessão linear simples (α e β  são parâmetros desconhecidos). Considerou, para o estudo, as seguintes informações referentes às observações nos últimos 10 anos da empresa

= = 10 1 100 i i  Y ;

= = 10 1 60 i i X ;

= = 10 1 650 i i i  Y X ;

= = 10 1 2 400 i i X ;

= = 10 1 2 1080 i i  Y ;

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que,caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais será de:

a) 84 b) 102,5 c) 121 d) 128,4 e) 158

 Exemplo 6:

Utilizou-se um modelo de regressão linear para avaliar a relação entre o preço do litro da gasolina e o do pretróleo Brent, ambos em reais, compreendendo o período de janeiro de 2002 a dezembro de 2006. Os resultados obtidos foram:

(

)

(

)

(26)

Considere o quadro a seguir: ANOVA Soma dos quadrados Graus de liberdade Média dos quadrados F Fsig Modelo (regressão) Residual X Y Total

Os valores de X , Y e Z , no quadro acima, respectivamente são: a) 3,016 ; 0,052 e 2,78E-4;

b)3,016; 0,052 e 288,154; c) 14,98; 3,016 e 288,154; d) 18 ; 0,052 e 2,78E-4; e) 18 ; 0,052 e 288,154

Capítulo 4: REGRESSÃO LINEAR MÚLTIPLA

4.1. INTRODUÇÃO

Já vimos que na regressão linear simples consideramos apenas uma variável econômica, explicativa ou exógena, na parte direita da equação

(

y

=

 β 1

+

β 2.x

+

e

)

.

Na regressão múltipla são consideradas duas ou mais variáveis explicativas

( )

xi , como por exemplo: salário

( )

x , renda de aluguel1

( )

x , renda de investimento2

( )

x3 , etc. que influenciam a variável dependente yi.

Trata-se, portanto, de uma extensão do modelo de regressão linear simples.

Genericamente, em n observações de variáveis amostrais

(

y,x1,x2,...,xn

)

, o modelo assumirá a

forma: e x x x y1= β 1+ β 2. 1+ β 3. 2+...+β n. n−1+ (19) Ou, sob a forma de estimadores:

e x b x b x b b y1= 1+ 2. 1+ 3. 2+...+ n. n−1+ (20)

Se chamarmos a variável endógena y de nível de investimento, ele dependerá de fatores a ela agregados como, por exemplo: taxa de juros, variável de renda, etc. que são respectivamente as variáveis explicativas xi.

(27)

Os estimadores da equação (20) são os bi

(

b1,b2,b3,...,bn

)

e as estimativas desses estimadores são os β i

(

 β 1, β 2, β 3,..., β n

)

da equação (19).

O erro aleatório ou resíduo

( )

e apontado nas duas equações é o resultado da diferença que porventura venha a ocorrer entre os valores conhecidos yi e os valores esperados ou ajustados pelo modelo yˆ .i i i y y e= − ˆ (resíduo) = i

y volume real de venda

=

i

yˆ volume esperado de venda

Alguns outros fatores que poderiam influenciar no valor de

( )

e , no caso da variável venda, são os comportamentos dos concorrentes, fatores meteorológicos, etc. denominadas eventos de natureza qualitativa, que veremos no capítulo 8.

4.2. PRESSUPOSTOS DO MODELO

Alguns pressupostos deverão ser considerados nos modelos de regressão múltipla, assim como foram no modelo de regressão simples, tais como:

a) O valor de y para cada valor de x é definido por yi = β 1+ β 2.x1+ β 3.x2+...+β n.xn1 b) A esperança do erro aleatório E

( )

e é igual a zero

c) A variância do erro aleatório V

( )

e é igual a 2

σ  , o que significa que variância do erro aleatório é constante

d) O erro aleatório e tem distribuição normal cuja média é zero, E

( )

e

=

0,evariância igual a 2

σ  finito e constante.

e) A covariância entre qualquer par de erros aleatórios e e1 e é igual à covariância do par2 y1e

2

y que é igual à zero, ou seja: cov

( ) ( )

e1;e2

=

cov y1;y2

=

0, significando que os termos aleatórios são independentes.

f) O valor esperado ou a esperança matemática da variável dependente y, E

( )

y , depende dos valores das variáveis explicativas xi e dos parâmetros desconhecidos β i, ou seja:

( )

y = 1+ 2.x1+ 3.x2+...+ n.xn−1

E  β   β   β  β 

4.2.1. Teorema de Gauss-Markov

Este teorema nos diz que se os estimadores de mínimos quadrados atenderem as hipóteses acima relacionadas (letras “a” a “f”) serão os melhores estimadores lineares não-tendenciosos dos parâmetros, ou seja, eles são BLUE (best linear unbiesed estimators) em um modelo de regressão múltipla.

(28)

4.3. ESTIMAÇÃO DOS PARÂMETROS

Para a estimação dos parâmetros intercepto e angulares, podemos recorrer a dois caminhos.

a) Pela aplicação do princípio dos mínimos quadrados ordinários (conhecido como equações normais), comentado no capítulo anterior;

b) Pela forma matricial

Geralmente recomendado para modelos com mais de três parâmetros a serem estimados. Conceitualmente, o modelo de n variáveis é uma extensão dos modelos de duas e três variáveis, objeto de abordagem do presente curso. Assim, salvo a notação matricial, poucos conceitos serão acrescentados, razão pela qual abordaremos apenas o primeiro procedimento, ou seja, pelo critério dos mínimos quadrados.

A vantagem da aplicação da álgebra matricial sobre a escalar é que ela se aplica a uma, duas, três ou qualquer número de varáveis, mas exigirá do estudante total intimidade com a álgebra matricial.

 Estimação dos parâmetros pela aplicação dos Mínimos Quadrados Ordinários (M.Q.O.) Procedimentos operacionais:

a) Determinar inicialmente os desvios em relação à média aritmética de cada uma das variáveis amostrais informadas (tanto dependentes quanto as independentes), ou seja: Para valores de Yi ⇒ yi = Yi − Y

Para valores de Xi ⇒ xi = Xi − X

Este procedimento tem como finalidade facilitar os cálculos, pois operamos com valores reduzidos de yi e xi.

b) Aplicar os valores reduzidos de yi e xi nos modelos abaixo: 1º) Cálculo do estimador b2

( )

(

)( )

( )( ) (

)

2 2 1 2 2 2 1 2 2 1 2 2 1 2 . . . . . . .

− − = x x x x y x x x x y x b (21) 2º) Cálculo do estimador b3

(

)(

) (

)(

)

( )( ) (

)

2 2 1 2 2 2 1 1 2 1 2 1 2 3 . . . . . . .

− − = x x x x y x x x x y x b (22)

(29)

3º) Cálculo do estimador b (intercepto)1

Para este cálculo utilizamos os valores já conhecidos de b2 e b3 além da média aritmética dos valores reais de Yi e Xi.

2 3 1 2 1  Y b.X b.X b = − − (23) Representação: n i X X X

 Y; 1; 2;...; (são os dados numéricos conhecidos)

2 1;

;X X

 Yi (são as médias dos mesmos dados)

As variáveis yi e xi em letras minúsculas são os afastamentos ou desvios em relação à média de Yi e Xi, ou seja:

i i i  Y Y

y = − ; x1= X1− X1; x2 = X2− X2; etc.

4.4. ESTIMAÇÃO DA EQUAÇÃO DE REGRESSÃO MÚLTIPLA

Encontrados os estimadores b ,1 b2 e b3 pelas equações (21), (22) e (23) para obter a equação de regressão da variável dependente

( )

yi em função das variáveis explicativas

( )

x e1

( )

x2 , pelo método dos mínimos quadrados ordinários, basta substituir no modelo de regressão múltipla representado em (20) os parâmetros obtidos, ou seja:

2 3 1 2 1 . . ˆ b b x b x y= + + Onde: 1 b obtido em (19) 2 b obtido em (17) 3 b obtido em (18)

4.5. PREVISÃO DE VALORES COM BASE NA EQUAÇÃO DE REGRESSÃO

Definida a equação de regressão acima, poderemos efetuar previsões ou estimação de valores com a ajuda da citada equação.

(30)

Se forem conhecidos os valores de x e de1 x2, poderemos estimar yˆ. Como b (intercepto) é1 constante, basta multiplicar x e1 x2 por b2 e de b3, respectivamente, e adicionar o valor constante de b para termos o1 yˆ estimado.

4.6. ERRO PADRÃO DA ESTIMATIVA

Conforme já visto na regressão simples, o erro padrão da estimativa na regressão múltipla tem a mesma finalidade, ou seja, avaliar a margem de erro (desvio padrão) do valor estimado, podendo ser calculado pela expressão:

(

)

k n y y S i x y − ± =

2 : ˆ ˆ (24) Onde: =

y dados numéricos conhecidos =

yˆ dados ajustados pelo modelo =

n tamanho da amostra

=

k número de parâmetros (intercepto + angulares)

4.7. INTERVALOS DE PREDIÇÃO

( )

IP

Conhecido o valor estimado

( )

VE , para determinarmos a margem de variação do citado valor basta subtrair e adicionar ao mesmo o erro padrão da estimativa

( )

i

x y

: que nada mais é do que o desvio padrão dos resíduos, conforme explicitado em (24).

Assim: i x y S VE IP = ± ˆ: (25)

)

i i yx x y VE S S VE IP = − ˆ: ; + ˆ:

4.8. ERRO PADRÃO DOS ESTIMADORES

Os estimadores b2 e b3 também devem ser analisados quanto a sua variabilidade, pois quanto menor o erro, melhor será a qualidade do ajuste. A qualidade do ajuste, como veremos em 4.10, é também denominada Coeficiente de Determinação.

(31)

(

)

[

]

= 2 2 2 2 1 2 1 : . ˆ ˆ 2 x x x x S Sb yx (26)

Quanto ao estimador b3, a expressão para cálculo é:

(

)

[

]

= 2 1 2 2 1 2 2 : . ˆ ˆ 3 x x x x S Sb yx (27)

4.9. INTERVALO DE CONFIANÇA DOS ESTIMADORES

Assim como calculamos o intervalo de predição do valor estimado, podemos também determinar o intervalo de confiança dos estimadores com base no erro padrão e em função do nível de significância desejado na distribuição tα  de Student e tem como finalidade avaliar o nível de precisão dos estimadores de fundamental importância para análise de regressão.

A expressão para determinar o intervalo de confiança de um dado estimador é:

(

)

bi i i

(

)

bi i t n k S b t n k S b P .ˆ .ˆ 1−α = − α  − ≤ β  ≤ + α  − (28) Onde: = i b estimadores

(

b2;b3;...

)

(

n−k

)

=

tα  valor tabelado na distribuição t =

α  nível de significância

(

0

,

01

;

0

,

05

;...

)

=

n tamanho da amostra

=

k número de parâmetros, inclusive intercepto =

i

b

Sˆ erro padrão do estimador bi

4.10. COEFICIENTE DE DETERMINAÇÃO (poder explicativo da regressão)

Na análise de regressão é importante para o pesquisador verificar a qualidade do ajuste, ou seja, uma medida que indique a proporção da variação de y que a equação de regressão consegue explicar. Essa medida por ser avaliada pelo coeficiente de determinação, também conhecido como poder explicativo da regressão, cuja expressão é:

(

)

(

)

− − = 2 2 2 ˆ y y y y R (29)

(32)

O valor de R2, por ser uma proporção, estará compreendido entre 0 e 1 e quanto mais se

aproximar de 1, mais forte é a associação entre variáveis envolvidas na equação de regressão. Costuma também ser apresentado em termos percentuais e, nesse caso, o campo de definição de

2

R será de 0 a 100%, conforme já comentado no capítulo anterior.

4.11. TESTE DE HIPÓTESES

O teste de hipóteses pode ser aplicado à análise de regressão com o objetivo de verificar a existência de regressão entre variáveis x e y no caso de uma regressão simples, conforme já visto no capítulo anterior. No caso de uma regressão múltipla, o teste pode ser utilizado para verificar a influência das variáveis explicativas x e1 x2 sobre a explicada y.

Os testes que poderão ser utilizados são de Student 

( )

t e o deFisher/Snedecor 

( )

F .

Os procedimentos operacionais para a realização dos testes seguem os mesmos critérios aos já explicitados para a regressão simples, o que torna desnecessária a sua repetição. Os detalhes, se houverem, são mínimos e de fácil entendimento.

 Exemplo 6:

Os dados abaixo se referem ao índice de quantidade demandada de energia elétrica

( )

 Y , da tarifa real média

( )

X e do produto real1

( )

X .2

 Y X1 X2 y 1 x x2 y.x1 y.x2 x1.x2 2 1 x x22 yˆ

(

ˆ

)

2 y y−

(

y− y

)

2

(

yˆ− y

)

2 69 143 84 -26 28 -11 -728 286 -308 784 121 74,46 29,81 676 421,89 76 134 85 -19 19 -10 -361 190 -190 361 100 77,89 3,57 361 292,75 81 117 82 -4 2 -13 -28 182 -26 4 169 78,28 ... ... ... 90 111 86 -5 -4 -9 20 45 36 ... ... 97,22 94 109 93 -1 -6 -2 6 2 12 97,71 100 100 100 5 -15 5 -75 25 -75 104,89 103 137 104 8 22 9 176 72 198 100,89 108 122 104 13 7 9 91 117 63 104,54 113 85 107 18 -30 12 -540 216 -360 117,28 18,32 324 496,40 115 92 105 21 -23 10 -483 210 -230 529 100 113,08 8,53 441 326,89 950 1150 950 0 0 0 -1922 1345 -880 3388 906 - 173,86 2282 1924,13 Desenvolver as questões:

1) Estimar a equação da demanda por energia elétrica pelo MQO;

2) Com base na equação da demanda obtida, estimar a demanda provável quando a tarifa real média

( )

x for de 87 e o produto real1

( )

x2 for de 105;

(33)

5) Testar o efeito conjunto das variáveis explicativas ao nível de 5% pelo teste F , com o auxílio do quadro ANOVA;

6) Testar, com base em Student , o efeito de cada variável explicativa ( x e1 x2) sobre os parâmetro a elas associadas (b e1 b2) a nível de 5%.

 Desenvolvimento:

1) Equação da demanda (forma linear) Inicialmente calculamos os estimadores: 1.1) Estimador β 2

(

)(

) (

)(

)

( )( ) (

)

2 2 1 2 2 2 1 2 2 1 2 2 1 2 2 . . . . . . .

− − = = x x x x y x x x x y x b  β 

(

)

(

)

(

) ( )

2.295.128 732 . 557 880 906 3388 1345 880 906 1922 2 2 − = − − × × − − × − = b 243 , 0 2

=

b 1.2) Estimador β 3

(

)(

) (

)(

)

( )( ) (

)

2 2 1 2 2 2 1 1 2 1 2 1 2 3 3 . . . . . . .

− − = = x x x x y x x x x y x b  β 

(

)

(

)

(

) ( )

2.295.128 500 . 865 . 2 880 906 3388 1922 880 3388 1345 2 3 = − − × × − − × = b 249 , 1 3 = b 1.3) Estimador β 1 2 3 1 2 1 1=b = y−b.x −b.x  β 

(

0,243 115

)

1,249 95 95 1

=

×

×

b

(34)

A equação da demanda será então: 2 1 1,249. . 243 , 0 29 , 4 ˆ x x y

=

+

2) Previsão da demanda quando:

87 1

=

x (tarifa real média)

105

2

=

x (produto real)

Substituindo na equação anterior, encontramos:

( ) 4,29 0,243 87 1,249 105 ˆest = − × + × y ( ) 114,3 ˆest = y 3) Intervalo de predição 3.1) Pelo critério normal

É necessário calcular inicialmente o erro padrão da estimação

(

)

2 10 86 , 170 ˆ ˆ 2 − = − − =

k n y y Sy 66 , 4 ˆ = y S

O intervalo de predição será então

y S VE± ˆ 66 , 4 3 , 114 ± 96 , 118 64 , 109 < IP < 4) Coeficiente de determinação

O coeficiente de determinação (Poder explicativo da regressão), tem por objetivo medir a qualidade do ajuste, podendo ser avaliado pela relação:

(

)

(

)

2282 0,84 13 , 1924 ˆ 2 2 2 = = − − =

y y y y R

(35)

5) EstatísticaF (ou testeF )

Pode ser obtido pelo quadro da análise da variância (ANOVA – Analisys of Variance)

A aplicação da estatísticaF ao problema é verificar se as variáveis explicativas x e1 x2 (tarifa real e produto real), respectivamente, exercem conjuntamente efeito significativo sobre a variável dependente y (demanda de energia elétrica).

Quadro ANOVA Fonte de Variação Soma dos quadrados Graus de liberdade Média quadrática E Regressão

(

yˆ y−

)

2 k

(

)

k y y SR =

− 2 2 ˆ 2 2 E R S S E = Resíduos

(

y− yˆ

)

2 n

k

1

(

)

1 ˆ 2 2 − − − =

k n y y SE = 2 R

S variância explicada ou variância da regressão =

2

E

S variância residual

=

k número de variáveis explicativas

Retirando as estatísticas da tabela auxiliar e substituindo, encontramos: Fonte de

Variação ∑ dos quadrados g.l.

Média quadrática E Regressão 1924,13 2 2 = 962,07 R S 73 , 38 84 , 24 07 , 962 = = E Resíduos 173,86 10

2

1 2 =24,84 E S Logo, 73 , 38 = c F (valor calculado deF )

No caso de regressão múltipla, ou seja, duas ou mais variáveis explicativas, a formulação das hipóteses pode ser feita conforme abaixo:

0 : 2 3 0 b =b = H (ausência de efeito) 0 : 2 3 1 b ≠b ≠ H (presença de efeito) Se Fc >Fα 

(

n−k−1

)

, rejeitamos H0

(

− −1

)

< F n k Fc α  , aceitamos H0 No exemplo em questão, Fc > F0,05

(

10−2−1

)

(36)

( )

7 4,74 05

,

0 =

F (na distribuição F , deve-se observar que o g.l. é igual a 2 no numerador e 7 no denominador.

Como Fc =38,73> F0,05 =4,74, devemos rejeitar a hipótese H0, o que sugere que pelo menos uma das variáveis explicativas x ou1 x2 exerce influência significativa sobre a variável dependente

y, com probabilidade de erro 5%.

6) Estatísticat com relação aos parâmetros β  e2  β 3

Sabe-se que: i b i i c S b t ˆ  β  − = 6.1) Estatísticat para β 2=0

O teste de significância para o efeito da variável explicativa x (tarifa real) pode ser:1 0 : 2 0  β  = H (ausência de efeito) 0 : 2 1 β 

<

H (presença de efeito negativo) Sabemos que: b2

=

0,243; ˆ 0,093 2 = b S 66 , 4 ˆ = y S ; t0,05

(

n−k

)

=2,3646

(

)

(

)

0,093 906 880 3388 66 , 4 . ˆ ˆ 2 2 2 2 2 1 2 1 2 = − − = − =

x x x x S Sb y 62 , 2 093 , 0 0 243 , 0 − = − − = c t 62 , 2 = c t

Como tc >tα 

(

2,62

>

2,3646

)

, rejeitamos H0, o que sugere a presença de efeito negativo da variável x sobre y.

6.2) Estatísticat para β 3

O teste t para o efeito da variável explicativa x2 (produto real) pode ser: 0 : 3 0 β  = H (ausência de efeito) 0 : 3 1 β  >

H (presença de efeito positivo) Sabemos que: b3=1,249; ˆ 0,179

3 =

b

(37)

66 , 4 ˆ = y S ; t0,05

( )

7 = 2,3646

(

)

(

)

0,179 3388 880 906 66 , 4 . ˆ ˆ 2 2 1 2 2 1 2 2 3 = − − = − =

x x x x S Sb y 977 , 6 179 , 0 0 249 , 1 = − = c t

Verifica-se que tc > tα 

(

6,977

>

2,3646

)

, o que sugere rejeitar a hipótese H0, significando a presença de efeito positivo da variável explicativa x2 (produto real) sobre a demanda y.

Pelo teste t , nota-se que os parâmetros  β  e2  β 3 exercem influência sobre y, primeira negativamente e a segunda positivamente.

 Exemplo 7:

Considere o quadro abaixo com informações sobre investimentos

( )

 Y , lucro esperado

( )

X1 e o estoque de capital desejado

( )

X2 durante 15 anos (valores em R$ milhões).

i t  Yi X1 X2 yi x1 x2 x1.y x1.x2 x .2 y 2 1 x x22 yˆ

(

)

2 ˆ y y−

(

yˆ y−

)

2

(

y− y

)

2 1 2 60 3 -3 -9 -3 27 27 9 81 9 2,48 0,23 6,35 9 2 2 62 3 -3 -7 -3 21 21 9 49 9 2,47 0,22 6,40 9 3 4 65 4 -1 -4 -2 4 8 2 16 4 3,32 0,46 2,82 1 4 6 68 5 1 -1 -1 -1 1 -1 1 1 4,16 3,39 ... 1 5 4 65 5 -1 -4 -1 4 4 1 16 1 4,17 0,03 1 6 3 62 4 -2 -7 -2 14 14 4 49 4 3,32 0,10 4 7 5 66 6 0 -3 0 0 0 0 9 0 5,01 0,01 0 8 6 70 7 1 1 1 1 1 1 1 1 5,85 0,02 1 9 5 68 6 0 -1 0 0 0 0 1 0 5,86 0,74 0 10 3 65 4 -2 -4 -2 8 8 4 16 4 3,32 0,10 4 11 4 69 5 -1 0 -1 0 0 1 0 1 4,15 0,02 1 12 5 72 6 0 3 0 0 0 0 9 0 4,99 0,00 0 13 6 78 8 1 9 2 9 18 2 81 4 6,68 0,46 1 14 8 80 10 3 11 4 33 44 12 121 16 8,37 0,14 11,36 9 15 12 85 14 7 16 8 112 128 56 256 64 11,76 0,06 45,70 49 ∑ 75 1035 90 0 0 0 232 274 100 706 118 - 5,98 84,67 90 Pedidos:

1) Obter a função de regressão do investimento;

2) Interpretar os resultados dos parâmetros, pelo MQO;

(38)

4) Obter o intervalo de predição ou previsão do valor estimado em (3), com base no erro padrão da estimativa;

5) Obter o intervalo de confiança dos estimadores β  e2  β 3;

6) Obter e interpretar o resultado da qualidade do ajuste (poder explicativo da regressão);

7) Verificar pelo teste F se as variáveis X e1 X2 exercem conjuntamente efeito significativo sobre Y (dependente);

8) Verificar pelo teste t se as variáveis X e1 X2 exercem separadamente efeito sobre Y.

 Desenvolvimento: 1) Função Investimento

O modelo é: yˆ= β 1+ β 2.x1+β 3.x2 +e, cujos estimadores são b ,1 b2 e b3. As estatísticas calculadas com base no quadro auxiliar são:

5 =  Y X1 = 69 X2 =6 232 . 1 =

x y

x12 = 706 100 . 2 =

x y 2 118 2 =

x 2747 . 2 1 =

x x

(

x1.x2

)

2 = 75076  Y  Y yi = − xi = X1− X1 x2 = X2,i − X2

( )

(

)( )

( )( ) (

)

2 2 1 2 2 2 1 2 2 1 2 2 1 2 . . . . . . .

− − = x x x x y x x x x y x b

(

)

(

)

(

)

8232 0,003 24 75076 118 706 100 274 118 232 2 =− − = − × × − × = b 003 , 0 2

=

b

( )

(

)( )

( )( ) (

)

2 2 1 2 2 2 1 1 2 1 2 1 2 3 . . . . . . .

− − = x x x x y x x x x y x b

(39)

(

)

(

)

(

)

8232 0,85 7032 75076 118 706 232 274 706 100 3 × = = × − × = b ; b3= 0,85 2 3 1 2 1 y b.x b.x b = − −

(

0,003 69

)

0,85 6 5 1

=

×

×

b

(

0,21

)

5,10 5 1

=

b 11 , 0 1

=

b 2 1 0,85. . 003 , 0 11 , 0 ˆ x x y

=

+

2) Interpretação dos parâmetros

2.1) O valor 0,11 do intercepto significa que se o lucro esperado

( )

X1 e o estoque de capital desejado

( )

X2 forem zero, o investimento seria de R$0,11.

2.2) A variável explicativa X (lucro esperado) sendo negativa, um aumento de R$1,00 no lucro1 esperado acarreta um decréscimo de R$0,003 no investimento.

2.3) A variável explicativa X2 (estoque de capital desejado) sendo positiva, significa que um aumento de R$1,00 nessa variável acarreta um aumento de R$0,85 no investimento.

3) Investimento esperado ( ) 0,11 0,003. 1 0,85. 2 ˆ x x yesperado = − + ( ) 0,11 0,27 10,20 ˆesperado = − + y ( ) $10,04 ˆ R yesperado =

4 ) Intervalo de predição do valor estimado

(

)

k n y y Sy − − =

2 ˆ ˆ y S VE IP = ± ˆ

(

ˆ

)

2 = 5,98

y y ; n=15; k=3 98 , 5 ˆ = =

(40)

71 , 0 ˆ = y S y y IP VE S S VE IP = − ˆ < < + ˆ 71 , 0 04 , 10 71 , 0 04 , 10 − < IP < + 75 , 10 33 , 9 < IP <

5) Intervalo de confiança dos estimadores 5.1) Intervalo de β 2

=

b2

Calculamos inicialmente o erro padrão de  β 2

(

)

− = 2 2 2 2 1 2 1 . ˆ ˆ 2 x x x x S S β  y

2 = 706 1 x ;

2 =118 2 x

(

)

0,085 118 274 706 71 , 0 ˆ 2 2 = − =  β  S 085 , 0 ˆ 2 =  β  S O intervalo de confiança de 2 ˆ  β 

S baseia-se na igualdade probabilística.

(

n k

)

S i b t

(

n k

)

S i t b P P i α  β  β i i α β  1− = − − ≤ ≤ + −

(

15 3

)

.0,085 0,003

(

15 3

)

.0,085 003 , 0 1−P= − −t0,05 − ≤ β 2≤ − +t0,05 − 085 , 0 1788 , 2 003 , 0 085 , 0 1788 , 2 003 , 0 1

P

=

×

β 2

+

×

1822 , 0 1882 , 0 95 , 0

=

β 2

O resultado significa que existe uma probabilidade de 0,95 de que o estimador  β  esteja entre2 1882

, 0

− e 0,1822. 5.2) Intervalo de β 3.

(41)

(

)

= 2 1 2 2 1 2 2 . ˆ ˆ 3 x x x x S Sb y Estatísticas:

2 =118 2 x

(

.

)

2 2742 75.076 2 1 = =

x x 71 , 0 ˆ = y S 2 706 1 =

x 66 , 11 71 , 0 706 076 . 75 118 71 , 0 ˆ 3 = − = b S 21 , 0 ˆ 3 = b S

Calculado o erro padrão de

3

ˆ

b

S , o intervalo de confiança baseia-se na igualdade probabilística

(

)

3

)

(

)

3 1−P= Pb3−tα  n−k S β  ≤ β 3≤b3+tα  n−k Sβ  Sabemos que: 85 , 0 3=  β  , 0,21 3 =  β  S e t0,05

( )

12 = 2,1788, então teremos: 1788 , 2 21 , 0 85 , 0 1788 , 2 21 , 0 85 , 0 95 , 0 = − × ≤ β 3 ≤ + × 31 , 1 39 , 0 95 , 0 = ≤β 3

O intervalo encontrado de  β 3 sugere que existe uma probabilidade de 0,95 de que  β 3 esteja entre 0,39e 311, .

6) Qualidade do ajuste

O poder explicativo da regressão ou coeficiente de determinação tem por objetivo avaliar a qualidade do ajuste e é medido pela expressão 2

R .

(

)

(

)

− − = 2 2 2 ˆ y y y y R Onde: 0≤ R2 ≤1 ou 0≤ R2 ≤100%

(42)

(

ˆ−

)

2 =84,67

y y ;

(

y− y

)

2 =90 90 67 , 84 2 = R ∴ 2 =0,94 R ou 94%

O resultado obtido sugere uma boa qualidade de ajuste na função de regressão.

7) Verificação pelo teste F se as variáveis explicativas X e1 X2 exercem influência conjunta sobre a variável dependente Y.

Do quadro auxiliar de cálculos retiramos as estatísticas:

(

ˆ−

)

2 =84,67

y y ; n=15 (amostra)

(

− ˆ

)

2 =5,98

y y ; k=2 (variáveis explicativas)

Utilizando ANOVA para obter F :c Fonte de

Variação ∑ dos quadrados g.l.

Média quadrática Fc Regressão 84,67 2 42,34 48 , 170 25 , 0 34 , 42 = = c F Resíduos 5,98 1521 0,25 Hipóteses: 0 : 2 3 0 b =b = H (ausência de efeito) 0 : 2 3 1 b ≠b ≠ H (presença de efeito) Conclusão: 48 , 170 = c F ; F0,05

( )

13 = 3,89 α  F Fc >

Como Fc > Fα  rejeitamos a hipótese H0, o que sugere que pelo menos uma das variáveis explicativas exerce efeito sobre a variável  Y. Com a probabilidade de 95% de que a assertiva esteja correta.

8) Avaliação da influência pelo teste t (Student ) - Formulação das hipóteses:

(43)

0 : 2 0 b = H (ausência de influência) 0 : 2 1 b

H (presença de influência) i b i i c S b t ˆ  β  − = (Geral)

- Teste para o estimador b2 (estimativa de β  )2

035 , 0 085 , 0 0 003 , 0 ˆ 2 2 2− == = b c S b t β  035 , 0 = c t Tabela (t ) = t0,05

( )

12 = 2,1788

Verifica-se que tc <tα , o que sugere aceitar H0, ou seja, ausência de influência. - Teste para o estimador b3 (estimativa de β 3)

04 , 4 21 , 0 0 85 , 0 − = = c t 04 , 4 = c t

( )

12 2,1788 05 , 0 = t

Verifica-se que tc >tα , o que sugere rejeitar a hipótese H0, ou seja, a variável estoque de capital

( )

X2 exerce influência positiva sobre os investimentos.

(44)

 Exemplo 8:

A tabela abaixo representa as observações semanais sobre receitas

( )

 Yi , em R$1000,00, sobre preço de venda

( )

X , em R$1,00, e gastos com propaganda1

( )

X , em R$1000,00, durante 122 semanas para uma cadeia de lanchonetes.

i t  Yi X1 X2 1 120 2,0 10 2 122 2,0 8 3 90 1,5 23 4 123 2,0 11 5 122 2,0 10 6 108 2,5 6 7 150 2,5 18 8 90 1,8 19 9 140 2,5 21 10 125 1,2 18 11 110 1,8 16 12 116 2,2 20 ∑ 1416 24 180 - Desenvolver:

1) Obter a equação de regressão múltipla estimada da receita

( )

i ; 2) Obter a previsão da receita quando x1

=

2,30 e x2=22, em t13; 3) Obter o intervalo de predição da receita prevista no item anterior; 4) Determinar o erro padrão de estimativa;

5) Calcular o erro padrão dos estimadores β  e2  β 3;

6) Obter o intervalo de confiança dos estimadores β  e2  β 3; 7) Avaliar a qualidade do ajuste;

8) Verificar pelo teste F se as variáveis explicativas x e1 x2 exercem influência conjunta sobre a variável receita

( )

 Yi .

 Exemplo 9:

Dez pessoas sadias entre 20 e 40 anos, do sexo masculino, foram submetidas a um teste de avaliação física, quanto ao peso total

( )

 Yi , peso magro

( )

X1 e as calorias diárias ingeridas

( )

X2 ,

Referências

Documentos relacionados

4 Este processo foi discutido de maneira mais detalhada no subtópico 4.2.2... o desvio estequiométrico de lítio provoca mudanças na intensidade, assim como, um pequeno deslocamento

ABSTRACT: The toxicological effects of crude ethanolic extracts (CEE) of the seed and bark of Persea americana have been analyzed on larvae and pupae of

U Coimbra 3º ciclo e sec 23 -10ºA Indeferido Despacho de 11/11/2006 Doctor of Philosophy/ Hispanic Languages

5 Cs e 1 contexto : uma experiência de ensino de português língua estrangeira conforme os parâmetros de ensino de língua norte-americanos – Standards for Foreign Language Learning

•   O  material  a  seguir  consiste  de  adaptações  e  extensões  dos  originais  gentilmente  cedidos  pelo 

Preliminarmente, alega inépcia da inicial, vez que o requerente deixou de apresentar os requisitos essenciais da ação popular (ilegalidade e dano ao patrimônio público). No

O presente estudo teve como objetivo comparar o TR de goleiros de 10 a 17 anos de idade com diferentes tempos de prática na modalidade de futebol de campo, e analisar se a

(coord.) Introdução ao estudo da administração. Síntese do tema da primeira oficina de trabalho: processo de produção em saúde. In: Seminário de redirecionamento da prática