• Nenhum resultado encontrado

Aula 3 - Premissas do Modelo Linear

N/A
N/A
Protected

Academic year: 2021

Share "Aula 3 - Premissas do Modelo Linear"

Copied!
50
0
0

Texto

(1)

Premissas do Modelo Linear

Análise de Regressão

Prof. MSc. Danilo Scorzoni Ré

FMU – Estatística Aplicada

(2)

Análise de Regressão

Data Tópico Teórico Tópico Prático

04/05/2015 Conceitos Introdutórios Revisão do R, Análises Univariadas, Análises Bivariadas

11/05/2015 Regressão Linear Simples Regressão Linear Simples e Gráficos

18/05/2015 Premissas do Modelo Linear Análise de Resíduos e Transformações nas Variáveis

25/05/2015 Regressão Linear Múltipla Análise de Regressão Linear Múltipla

01/06/2015 Análise de Variância Análise de Variância e Comparações Múltiplas

08/06/2015 Não Haverá Exercícios de Fixação

12/06/2015 ATIVIDADE EXTRA CLASSE

15/06/2015 Modelos Lineares Generalizados Regressão Logística, Regressão de Poisson e Regressão Gama

22/06/2015 Análise Preditiva Análise Preditiva

29/06/2015 AVALIAÇÃO FINAL

(3)

Regressão Linear Simples

Análise de Regressão

Prof. MSc. Danilo Scorzoni Ré

FMU – Estatística Aplicada

(4)

Regressão Linear Simples

Regressão – Conceitos Gerais

• A equação que representa a regressão linear simples é dado por:

𝒀

𝒊

= 𝜷

𝟎

+ 𝜷

𝟏

𝑿

𝒊

+ 𝜺

𝒊

(5)

Regressão Linear Simples

Regressão – Conceitos Gerais

• O objetivo do ajuste do modelo é estimar os parâmetros beta. Em termos práticos, é encontrar a reta que passa bem no meio da nuvem de pontos. • A distância entre cada ponto e a reta, é chamado de erro (𝜀𝑖).

• O algoritmo que minimiza a soma do quadrado dos erros é o mais utilizado para estimar os parâmetros da reta. Este algoritmo é conhecimento como Método dos Mínimos Quadrados.

(6)

Regressão Linear Simples

Regressão – Conceitos Gerais

• O Método de Mínimos Quadrados apresenta os seguintes estimadores para os betas, derivado da correlação:

𝜷

𝟏

= 𝒓

𝑿𝒀

𝑺

𝒀

(7)

Regressão Linear Simples

Regressão – Conceitos Gerais

𝑟𝑥𝑦 = −0,8521 𝑆𝑦 = 6,0269 𝑆𝑥 = 1,7859 𝑌 = 20,09 𝑋 = 6,187

𝜷

𝟏

= −𝟎, 𝟖𝟓𝟐𝟏

𝟔, 𝟎𝟐𝟔𝟗

𝟏, 𝟕𝟖𝟓𝟗

= −𝟐, 𝟖𝟕𝟔

𝜷

𝟎

= 𝟐𝟎, 𝟎𝟗 − −𝟐, 𝟖𝟕𝟔 ∗ 𝟔, 𝟏𝟖𝟖 = 𝟑𝟕, 𝟖𝟖𝟓

Logo, a equação que melhor explica a relação é:

𝒀

𝒊

(8)

Regressão Linear Simples

Regressão – Coeficiente de Determinação

• O coeficiente de determinação é uma medida que mostra o quão bom um modelo explica uma relação. Também conhecido como percentual de

variância explicada.

𝑹

𝟐

= 𝟏 −

𝒚

− 𝒚

𝒊

𝒊

𝟐

(9)

Regressão Linear Simples

Regressão – Coeficiente de Determinação

(10)

Regressão Linear Simples

Regressão – Erro padrão residual

• O erro padrão residual é outra métrica de variação, baseada nos resíduos, que permite obter o percentual de variação em função da variável resposta:

𝒔

𝒚𝒙

=

𝒚

𝒊

− 𝒚

𝒊

𝟐

𝒏 − 𝟏

𝒔

𝒚𝒙

(%) =

𝒔

𝒚𝒙

𝒚

× 𝟏𝟎𝟎

(11)

Regressão Linear Simples

Regressão – Erro padrão residual

(12)

Premissas do Modelo Linear

Análise de Regressão

Prof. MSc. Danilo Scorzoni Ré

FMU – Estatística Aplicada

(13)

Premissas do Modelo Linear

Regressão – Inferências

• Um dos aspectos mais importantes dos modelos lineares é realizar inferências sobre as estimativas dos parâmetros.

• Na prática, isso significa realizar testes de hipóteses para comprovar a existência das relações entre as variáveis estudadas.

• Entretanto, para as inferências serem válidas, é preciso atestar que as

premissas dos modelos lineares são atendidas em uma análise estatística. Caso

contrário, todas as inferências realizadas podem estar equivocadas.

• As premissas são aplicadas devido à definição da distribuição dos dados, que recai sobre o erro do modelo. Em termos práticos, as premissas são testadas em cima dos resíduos.

(14)

Premissas do Modelo Linear

Regressão – Inferências

Os resíduos são calculados com os dados observados e estimados. Em termos estatísticos, quando se fala na teoria e definição do modelo, temos o erro do modelo, em termos práticos, ou seja, quando utilizamos os dados, temos os resíduos:

𝜺

𝒊

= 𝒀

𝒊

− 𝒀

𝒊

𝒓

𝒊

= 𝒀

𝒊

− 𝒀

𝒊

termos teóricos

(15)

Premissas do Modelo Linear

Regressão – Inferências

No fim das contas, em termos práticos, erros e resíduos são a mesma coisa.

(16)

Premissas do Modelo Linear

Regressão – Inferências

A primeira premissa é:

OS RESÍDUOS DEVEM APRESENTAR

DISTRIBUIÇÃO NORMAL.

(17)

Premissas do Modelo Linear

Regressão – Inferências

(18)

Premissas do Modelo Linear

Regressão – Inferências

O teste de Shapiro-Wilk também mostra se existe normalidade dos resíduos: • A hipótese nula (H0) deste teste indica normalidade.

• Se o p-valor for maior que 0,05  resíduos com normalidade • Se o p-valor for menor que 0,05  resíduos sem normalidade

(19)

Premissas do Modelo Linear

(20)

Premissas do Modelo Linear

Regressão – Inferências

(21)

Premissas do Modelo Linear

(22)

Premissas do Modelo Linear

Regressão – Inferências

(23)

Premissas do Modelo Linear

(24)

Premissas do Modelo Linear

Regressão – Inferências

(25)

Premissas do Modelo Linear

Regressão – Inferências

A segunda premissa é:

OS RESÍDUOS DEVEM APRESENTAR

VARIÂNCIA CONSTANTE.

(26)

Premissas do Modelo Linear

Regressão – Inferências

• A premissa da variância constante está relacionada ao estimador da variância dos parâmetros. Pelo método de mínimos quadrados ordinários, a variância deve ser constante.

• Para os casos de variância não constante, dependendo da forma que a variância se apresenta, pode-se utilizar o método de mínimos quadrados ponderados, explicitando a forma funcional da variância.

• Outra alternativa é utilizar uma transformação da variável resposta para garantir uma variância constante.

(27)

Premissas do Modelo Linear

Regressão – Inferências

Gráfico de Dispersão com a Reta da Regressão

Gráfico dos Resíduos em Função dos Valores Estimados

(28)

Premissas do Modelo Linear

Regressão – Inferências

Enfim, o que é uma variância constante?

(29)

Premissas do Modelo Linear

Regressão – Inferências

Enfim, o que é uma variância constante?

(30)

Premissas do Modelo Linear

Regressão – Inferências

A terceira premissa é:

OS RESÍDUOS NÃO DEVEM APRESENTAR

AUTO-CORRELAÇÃO

(31)

Premissas do Modelo Linear

Regressão – Inferências

• A existência de auto-correlação é uma violação grave das premissas do modelo linear, pois interfere diretamente na distribuição dos resíduos.

• Modelos que apresentam auto-correlação nos resíduos são claramente

identificados através da análise de resíduos e demonstram uma falha grave na especificação do modelo para o conjunto de dados.

(32)

Premissas do Modelo Linear

(33)

Premissas do Modelo Linear

Regressão – Inferências

Teste de Shapiro-Wilk:

(34)

Premissas do Modelo Linear

Regressão – Inferências

(35)

Premissas do Modelo Linear

Regressão – Inferências

• Estudar a forma funcional da relação entre Y e X pode nos dizer como podemos especificar o modelo corretamente.

• As tentativas podem ser a adição de mais graus polinomiais ou

transformações como o logaritmo e a raiz quadrada.

(36)

Premissas do Modelo Linear

Regressão – Inferências

𝒀

𝒊

= 𝜷

𝟎

+ 𝜷

𝟏

𝑿

𝒊

+ 𝜷

𝟐

𝑿

𝒊𝟐

+ 𝜺

𝒊

Teste de Shapiro-Wilk  p-valor = 0.2616

𝒀

𝒊

(37)

Premissas do Modelo Linear

Regressão – Inferências

• Após checar as 3 premissas do modelo, podemos fazer as inferências:

𝜷

𝒌

𝝈

𝒌

~𝒕

(𝒏−𝟏)

A quantidade referente a divisão do valor da estimativa do parâmetro por seu desvio padrão tem uma distribuição t de Student,

com n-1 graus de liberdade.

(38)

Premissas do Modelo Linear

Regressão – Inferências

𝑯

𝟎

: 𝜷

= 𝟎

𝒌

𝑯

𝟏

: 𝜷

≠ 𝟎

𝒌

• Na prática, testamos cada uma das estimativas dos parâmetros para verificar se são diferentes de zero.

• Quando diferente de zero, significa que existe efeito significativo daquela variável.

• Novamente, a probabilidade calculada pelo teste deve ser inferior ao nível de significância especificado previamente (5%).

(39)

Premissas do Modelo Linear

Regressão – Inferências

Voltando ao exemplo da aula passada:

• Conjunto de dados mtcars.

(40)

Premissas do Modelo Linear

Regressão – Inferências

Voltando ao exemplo da aula passada:

• Conjunto de dados mtcars.

• Modelo apresentado  mpg ~ drat

(41)

Premissas do Modelo Linear

Regressão – Inferências

Voltando ao exemplo da aula passada:

• Conjunto de dados mtcars.

• Modelo apresentado  mpg ~ drat

(42)

Premissas do Modelo Linear

(43)

Premissas do Modelo Linear

(44)

Premissas do Modelo Linear

(45)

Premissas do Modelo Linear

(46)

Premissas do Modelo Linear

(47)

Premissas do Modelo Linear

Regressão – Inferências

Existe efeito

significativo da

variável drat neste

(48)

Premissas do Modelo Linear

Regressão – Inferências

Existe efeito

significativo da

variável drat neste

modelo?

(49)
(50)

Premissas do Modelo Linear

Regressão – Inferências

Portanto, a sequência lógica da análise de regressão é:

1. Estudar as relações utilizando a estatística descritiva. 2. Ajustar o modelo para estimar os parâmetros.

3. Observar a qualidade do ajuste utilizando o R² e o syx (%).

4. Observar as premissas através dos gráficos de resíduos e do teste de normalidade dos resíduos (Shapiro-Wilk).

Referências

Documentos relacionados

Analysis of relief and toponymy of the landscape based on the interpretation of the military topographic survey: Altimetry, Hypsometry, Hydrography, Slopes, Solar orientation,

homens jovens que realizaram 10 semanas de treinamento, foram realizados exercícios sempre em máxima velocidade e com a série baseada em tempo de execução (30s) em ambos os grupos,

O décimo sexto caminho é a Inteligência Triunfal ou eterna, alem da qual não existe outra glória igual a ela, que também é chamado de Paraíso preparado para os

A estabilidade do corpo docente permanente permite atribuir o conceito muito bom, segundo os parâmetros da área, para o item 2.2 (pelo menos 75% dos docentes permanentes foram

O Evento 1 é uma chuva de maior intensidade (116,67mm/h), em que as maiores precipitações registradas contribuíram, em forma de escoamento, mais para a bacia do Cascavel

Tabela 1 Valores de L 0 *, a 0 * e b 0 * para os padrões: PVC e PEBD 112   Tabela 2 Parâmetros reológicos do modelo Lei da potência, a diferentes temperaturas, para soluções

O segundo Beneficiário será designado pelo Segurado na Proposta de Adesão, podendo ser substituído a qualquer tempo, mediante solicitação formal assinada pelo próprio Segurado, para

as técnicas da escrita; ambiente escolar focado na educação científica, com materiais didáticos e laboratórios voltados para tal objetivo; oportunidades de