• Nenhum resultado encontrado

Jessyka Amorim Padilha Goltara. Analisando a eficiência da Regressão Quantílica em diferentes tipos de dados

N/A
N/A
Protected

Academic year: 2021

Share "Jessyka Amorim Padilha Goltara. Analisando a eficiência da Regressão Quantílica em diferentes tipos de dados"

Copied!
77
0
0

Texto

(1)

Jessyka Amorim Padilha Goltara

Analisando a eficiˆ

encia da Regress˜

ao

Quant´ılica em diferentes tipos de dados

Niter´oi - RJ, Brasil 03 de julho de 2019

(2)

Universidade Federal Fluminense

Jessyka Amorim Padilha Goltara

Analisando a eficiˆ

encia da Regress˜

ao

Quant´ılica em diferentes tipos de

dados

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientadora: Profa. Dra Patr´ıcia Lusi´e Velozo da Costa Co-orientadora: Profa. Dra Mariana Albi de Oliveira Souza

Niter´oi - RJ, Brasil 03 de julho de 2019

(3)
(4)

Ficha catalográfica automática - SDC/BIME Gerada com informações fornecidas pelo autor

Bibliotecário responsável: Ana Nogueira Braga - CRB7/4776

G629a Goltara, Jessyka Amorim Padilha

Analisando a eficiência da Regressão Quantílica em

diferentes tipos de dados / Jessyka Amorim Padilha Goltara ; Patrícia Lusié da Costa Velozo, orientadora ; Mariana Albi de Oliveira Souza, coorientadora. Niterói, 2019.

76 f. : il.

Trabalho de Conclusão de Curso (Graduação em

Estatística)-Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2019.

1. Regressão Quantílica. 2. Regressão Quantílica

Bayesiana. 3. Distribuição Laplace Assimétrica. 4. Modelos Lineares. 5. Produção intelectual. I. Velozo, Patrícia Lusié da Costa, orientadora. II. Souza, Mariana Albi de Oliveira, coorientadora. III. Universidade Federal Fluminense. Instituto de Matemática e Estatística. IV. Título.

(5)

-Resumo

Regress˜ao ´e uma ferramenta que permite explorar e inferir sobre a rela¸c˜ao de uma vari´avel resposta com vari´aveis explicativas. Essa rela¸c˜ao pode ser expressa atrav´es de um modelo matem´atico. Os modelos de regress˜ao linear s˜ao muito utilizados em diversas ´

areas e consistem basicamente em atribuir uma estrutura linear para a m´edia do processo. Apesar de extremamente ´uteis, por atenderem situa¸c˜oes nas quais a m´edia da vari´avel resposta ´e explicada por um conjunto de vari´aveis independentes, estes modelos tornam-se inapropriados quando o interesse n˜ao ´e modelar o comportamento m´edio da popula¸c˜ao. Como uma alternativa a esta classe de modelos, modelos de regress˜ao quant´ılica mostram-se vantajosos quando o interesmostram-se est´a na an´alise de qualquer quantil populacional. Modelos de regress˜ao quant´ılica tamb´em servem para analisar quantis em modelos lineares e n˜ao lineares, tendo ainda o benef´ıcio de serem menos sens´ıveis a outliers por utilizarem medidas mais robustas a tais observa¸c˜oes e, nesse caso, analisar a mediana da distribui¸c˜ao pode ser mais eficiente do que analisar a m´edia tornando a regress˜ao quant´ılica mais apropriada. Sob o ponto de vista bayesiano, para estimar os parˆametros dessa rela¸c˜ao utiliza-se a distribui¸c˜ao de Laplace assim´etrica, onde faz-se necess´ario utilizar os m´etodos de Monte Carlo via Cadeias de Markov para gerar amostras da posteriori. No presente trabalho, ser˜ao abordados a compara¸c˜ao entre o modelo linear e modelos quant´ılicos cl´assico e bayesiano quando alguma suposi¸c˜ao do modelo linear n˜ao for atendida. Dados simulados ser˜ao utilizados para analisar a eficiˆencia na estima¸c˜ao dos parˆametros, tempo computacional necess´ario e para comprar modelos diferentes aplicados a um mesmo conjunto de dados. Em seguida, os modelos ser˜ao aplicados em um conjuntos e dados reais sobre o ´Indice de Desenvolvimento Humando.

Palavras-chave: Estat´ıstica. Regress˜ao Linear. Modelos Lineares. Regress˜ao Quant´ılica. Modelos Quant´ılicos. Regress˜ao Quant´ılica Bayesiana. Distribui¸c˜ao Laplace Assim´etrica.

(6)

Dedicat´

oria

(7)

Agradecimentos

A Deus. Porque sem Ele, nada seria poss´ıvel.

Aos meus pais que sempre fizeram de tudo por mim. Obrigada pelo suporte, apoio e educa¸c˜ao que vocˆes me proporcionam. Sem vocˆes, um grande momento como esse nunca seria poss´ıvel. A minha irm˜` a que mesmo me perturbando diariamente, nunca deixou de me apoiar ou me dar uma palavra amiga quando precisei. Obrigada por sempre me mostrar o lado bom da vida e me fazer sorrir em qualquer momento. Ao meu irm˜ao que sempre me incentivou em qualquer decis˜ao que tomei. `A meu primo Bruno, que mesmo longe sempre se fez presente. Amo vocˆes demais!

`

A todos os amigos que fiz durante o curso. N˜ao sei o que seria de mim sem todos os surtos durante uma mat´eria de trabalho em que o Lat´ex n˜ao compilava ou quando os resultados das provas n˜ao batiam. Mas um obrigada especial `a Nalu, que esteve comigo desde o in´ıcio dessa gradua¸c˜ao e que sempre posso contar; ao Juan, que independente do momento, era o momento certo para implicar; `a D´ebora, que sempre esteve disposta a me ajudar; ao Fl´avio, que esteve junto comigo nesse ´ultimo perrengue e ao L´eo, que sem a paciˆencia dele, o que seria da minha programa¸c˜ao? Obrigada por todo ensinamento compartilhado! E tenho certeza que sem vocˆes a gradua¸c˜ao n˜ao teria sido nem um pouco divertida! hahaha

Agrade¸co tamb´em a todos os professores do Departamento de Estat´ıstica - UFF. Obrigada por todo conhecimento transmitido, todos vocˆes foram uma pe¸ca fundamental no meu aprendizado. Agrade¸co especialmente `as professoras Patr´ıcia e Mariana por terem aceitado me orientar nessa ´ultima fase da gradua¸c˜ao, obrigada por todo aux´ılio e disponibilidade oferecidos durante o desenvolvimento deste trabalho.

(8)

Sum´

ario

Lista de Figuras

Lista de Tabelas

Lista de Abreviaturas e Siglas p. 13

1 Introdu¸c˜ao p. 14 1.1 Objetivos . . . p. 15 1.2 Organiza¸c˜ao . . . p. 15 2 Materiais e M´etodos p. 17 2.1 Regress˜ao Linear . . . p. 17 2.2 Regress˜ao Quant´ılica . . . p. 20

2.2.1 Inferˆencia Cl´assica . . . p. 21

2.2.1.1 Caso com erros i.i.d. . . p. 22

2.2.1.2 Caso com erros i.ni.d.. . . p. 22

2.2.1.3 Caso com erros dependentes . . . p. 22

2.2.2 Inferˆencia Bayesiana . . . p. 23

2.3 M´etodos de Monte Carlo via Cadeias de Markov . . . p. 24

2.3.1 Algoritmo de Metropolis-Hastings . . . p. 24

2.3.2 Amostrador de Gibbs . . . p. 25

3 An´alise dos Resultados p. 27

(9)

3.1.1 Erro Homogˆeneo Independente Sim´etrico . . . p. 29

3.1.2 Erro Homogˆeneo Independente Assim´etrico . . . p. 38

3.1.3 Erro Heterogˆeneo Independente . . . p. 41

3.1.4 Erro Dependente . . . p. 44

3.2 ´Indice de Desenvolvimento Humano Municipal . . . p. 61

4 Conclus˜oes p. 73

(10)

Lista de Figuras

1 Fun¸c˜ao de densidade dos erros εi gerados atrav´es dos PG estabelecidos

nas Equa¸c˜oes (3.1), (3.2), (3.3) e (3.4). . . p. 29

2 Gr´aficos de dispers˜ao dos PG (3.1), (3.2) e (3.3).. . . p. 30

3 Gr´afico dos res´ıduos do modelo ajustado pela Regress˜ao Linear. . . p. 31

4 Estimativas dos coeficientes do PG 3.1 para diferentes valores de τ . . . p. 32

5 Gr´afico com os ajustes da regress˜ao linear simples e da regress˜ao quant´ılica (sob enfoque cl´assico e bayesiano) para diferentes quantil (τ = 0, 10; 0, 25; 0, 50; 0, 75; 0, 90) aplicados nos dados do processos geradores

(PG) 3.1. . . p. 33

6 Gr´afico dos res´ıduos do modelo ajustado pela Regress˜ao Linear. . . p. 34

7 Estimativas dos coeficientes do PG 3.2 para diferentes valores de τ . . . p. 34

8 Gr´afico com os ajustes da regress˜ao linear simples e da regress˜ao quant´ılica (sob enfoque cl´assico e bayesiano) para diferentes quantil

(τ = 0, 10; 0, 25; 0, 50; 0, 75; 0, 90) aplicados nos dados do PG 3.2. . . p. 35

9 Gr´afico dos res´ıduos do ajuste da pela Regress˜ao Linear para os dados

do PG 3.3. . . p. 36

10 Estimativas dos coeficientes do PG 3.3 para diferentes valores de τ . . . p. 37

11 Gr´afico com os ajustes da regress˜ao linear simples e da regress˜ao quant´ılica (sob os enfoques cl´assico e bayesiano) para diferentes quantis

(τ = 0, 10; 0, 25; 0, 50; 0, 75; 0, 90) aplicados nos dados PG 3.3. . . p. 38

12 Gr´afico de dispers˜ao dos dados gerados de acordo com o PG (3.4). . . . p. 39

13 Gr´afico de dispers˜ao dos res´ıduos do modelo ajustado pela Regress˜ao

Linear para o PG 3.4.. . . p. 40

(11)

15 Gr´afico com os ajustes da regress˜ao linear simples e da regress˜ao quant´ılica (sob os enfoques cl´assico e bayesiano) para diferentes quantis

(τ = 0, 10; 0, 25; 0, 50; 0, 75; 0, 90) aplicados nos dados PG 3.4. . . p. 41

16 Gr´afico de dispers˜ao dos dados gerados de acordo com o PG (3.5). . . . p. 42

17 Gr´afico dos res´ıduos do modelo ajustado pela Regress˜ao Linear . . . p. 43

18 Estimativas dos coeficientes do PG 3.5 para diferentes valores de τ . . . p. 43

19 Gr´afico com os ajustes da regress˜ao linear simples e da regress˜ao quant´ılica (sob os enfoques cl´assico e bayesiano) para diferentes quantis

(τ = 0, 10; 0, 25; 0, 50; 0, 75; 0, 90) aplicados nos dados PG 3.5. . . p. 44

20 Gr´aficos de dispers˜ao dos modelos dependentes. . . p. 45

21 Gr´afico dos res´ıduos do modelo ajustado pela Regress˜ao Linear . . . p. 46

22 Estimativas dos coeficientes dos PG 3.6 e 3.7 para diferentes valores de τ . p. 47

23 Gr´afico com os ajustes da regress˜ao linear simples e da regress˜ao quant´ılica (sob os enfoques cl´assico e bayesiano) para diferentes quantis

(τ = 0, 10; 0, 25; 0, 50; 0, 75; 0, 90) aplicados nos dados PG 3.6 e do PG 3.7. p. 48

24 Gr´aficos de dispers˜ao e boxplots dos EQM baseados nos diferentes

m´etodos de estima¸c˜ao: RLS, RQC e RQB do PG 3.1. . . p. 49

25 Gr´aficos de dispers˜ao e boxplots dos EQM baseados nos diferentes

m´etodos de estima¸c˜ao: RLS, RQC e RQB do PG 3.2. . . p. 50

26 Gr´aficos de dispers˜ao e boxplots dos EQM baseados nos diferentes

m´etodos de estima¸c˜ao: RLS, RQC e RQB do PG 3.3. . . p. 50

27 Gr´aficos de dispers˜ao e boxplots dos EQM baseados nos diferentes

m´etodos de estima¸c˜ao: RLS, RQC e RQB do PG 3.4. . . p. 51

28 Gr´aficos de dispers˜ao e boxplots dos EQM baseados nos diferentes

m´etodos de estima¸c˜ao: RLS, RQC e RQB do PG 3.5. . . p. 51

29 Gr´aficos de dispers˜ao e boxplots dos EQM baseados nos diferentes

m´etodos de estima¸c˜ao: RLS, RQC e RQB do PG 3.6. . . p. 52

30 Gr´aficos de dispers˜ao e boxplots dos EQM baseados nos diferentes

(12)

31 Gr´aficos de dispers˜ao e boxplots das estimativas pontuais dos βk do PG

3.1 obtidas via RLS, RQC e RQB.. . . p. 54

32 Gr´aficos de dispers˜ao e boxplots das estimativas pontuais dos βk do PG

3.2 obtidas via RLS, RQC e RQB.. . . p. 55

33 Gr´aficos de dispers˜ao e boxplots das estimativas pontuais dos βk do PG

3.3 obtidas via RLS, RQC e RQB.. . . p. 56

34 Gr´aficos de dispers˜ao e boxplots das estimativas pontuais dos βk do PG

3.4 obtidas via RLS, RQC e RQB.. . . p. 57

35 Gr´aficos de dispers˜ao e boxplots das estimativas pontuais dos βk do PG

3.5 obtidas via RLS, RQC e RQB.. . . p. 58

36 Gr´aficos de dispers˜ao e boxplots das estimativas pontuais dos βk do PG

3.6 obtidas via RLS, RQC e RQB.. . . p. 59

37 Gr´aficos de dispers˜ao e boxplots das estimativas pontuais dos βk do PG

3.7 obtidas via RLS, RQC e RQB.. . . p. 60

38 Histograma da vari´avel modificada do IDHM . . . p. 63

39 Gr´afico de dispers˜ao do modelo 3.8 . . . p. 64

40 Gr´afico com os ajustes dos m´etodos para o modelo 3.8. . . p. 66

41 Gr´afico de dispers˜ao do modelo 3.9 . . . p. 67

42 Gr´afico com os ajustes dos m´etodos para o modelo 3.9. . . p. 69

43 Gr´afico de dispers˜ao do modelo 3.10. . . p. 70

(13)

Lista de Tabelas

1 EQM dos ajustes dos modelos simulados . . . p. 49

2 EQM das estimativas dos coeficientes . . . p. 61

3 Estimativas para os coeficientes do modelo 3.8 . . . p. 65

4 Estimativas para os coeficientes do modelo 3.9.. . . p. 68

5 Estimativas para os coeficientes do modelo 3.10 . . . p. 71

(14)

13

Lista de Abreviaturas e Siglas

EQM Erro Quadr´atico M´edio

IDHM ´Indice de Desenvolvimento Humano Municipal i.i.d. Independentes e identicamente distribu´ıdos i.ni.d. Independente e n˜ao identicamente distribu´ıdos MCMC Monte Carlo via cadeias de Markov

PNUD Programa das Na¸c˜oes Unidas para o Desenvolvimento PG processos geradores

RLS Regress˜ao Linear Simples RQB Regress˜ao Quant´ılica Baysiana RQC Regress˜ao Quant´ılica Cl´assica

(15)

14

1

Introdu¸

ao

Em v´arias ´areas como qu´ımica, medicina, biol´ogica, existem diversas situa¸c˜oes onde ´e interessante investigar se duas ou mais vari´aveis est˜ao relacionadas e equa¸c˜oes matem´aticas podem ser estabelecidas para expressar essa rela¸c˜ao.

A regress˜ao linear ´e utilizada para fazer uma an´alise sobre a rela¸c˜ao linear da vari´avel resposta condicionada a uma ou mais vari´aveis explicativas. Como exemplo, pode ser de interesse do pesquisador saber se a vari´avel sal´ario ´e influenciada pelas vari´aveis sexo e anos de experiˆencia no cargo. Quando h´a apenas uma vari´avel explicativa ´e dito ter um modelo de regress˜ao linear simples. Quando h´a mais de uma vari´avel explicativa, ´e fito ter um modelo de regress˜ao linear m´ultipla.

O modelo de regress˜ao linear faz suposi¸c˜oes sobre a linearidade da combina¸c˜ao das covari´aveis e da vari´avel dependente e sobre a independˆencia, homocedasticidade e normalidade dos res´ıduos. Esse modelo ´e sens´ıvel a presen¸ca de outliers, que s˜ao valores com comportamento diferente da maioria da popula¸c˜ao.

Com o objetivo de tratar uma classe de modelos mais flex´ıvel, para este trabalho, foi proposta a utiliza¸c˜ao da regress˜ao quant´ılica, pelas abordagens cl´assica e bayesiana, para comparar a regress˜ao linear em diferentes casos, especialmente em situa¸c˜oes em que as suposi¸c˜oes sobre os modelos lineares n˜ao s˜ao atendidas.

O modelo de regress˜ao quant´ılica foi originalmente proposto por Koenker e Bassett

(1978), onde os autores apresentam a classe de modelos quant´ılicos no contexto linear, apresentando-a como uma alternativa mais robusta ao m´etodo de estima¸c˜ao de m´ınimos quadrados. E nota-se a utiliza¸c˜ao da regress˜ao quant´ılica em v´arias ´areas nos ´ultimos anos, como, por exemplo: em finan¸cas (Kudryavtsev (2009), Marioni et al. (2016)), zootecnia (Santos et al.(2018)), biologia molecular (Barroso(2018)) e avalia¸c˜ao de pol´ıticas p´ublicas (Coelho, Soares e Veszteg (2008)).

Os dois m´etodos utilizados para estimar os parˆametros desconhecidos s˜ao diferenciados da seguinte maneira: para o caso cl´assico, o m´etodo de estima¸c˜ao ´e feito pela minimiza¸c˜ao

(16)

1.1 Objetivos 15

da soma dos desvios absolutos ponderados. J´a para o modelo bayesiano, a minimiza¸c˜ao da soma dos desvios absolutos ponderados ´e equivalente a maximizar uma fun¸c˜ao de verossimilhan¸ca considerando a distribui¸c˜ao Laplace assim´etrica para o erro (YU; MOYEED, 2001), independente da distribui¸c˜ao dos dados. Ainda, Yu e Moyeed (2001) utilizam os algoritmos Monte Carlo via cadeias de Markov (MCMC), em particular o m´etodo Metropolis-Hastings, para estimar amostras da distribui¸c˜ao a posteriori dos parˆametros desconhecidos, uma vez que essa distribui¸c˜ao n˜ao possui forma anal´ıtica conhecida. MasKozumi e Kobayashi(2011) propuseram um meio para gerar a amostra da distribui¸c˜ao a posteriori dos parˆametros desconhecidos utilizando o amostrador de Gibbs, onde ´e utilizado uma mistura da distribui¸c˜ao normal e da distribui¸c˜ao exponencial para representar a fun¸c˜ao de distribui¸c˜ao Laplace Assim´etrica. A m´edia posteriori, estimador para o parˆametro desconhecido utilizado no m´etodo bayesiano, costuma ser t˜ao eficiente quanto o estimador cl´assico calculado diretamente pela otimiza¸c˜ao num´erica.

Diferente da regress˜ao linear que utiliza a m´edia, a regress˜ao quant´ılica analisa o quantil da vari´avel dependente condicionada a uma ou mais covari´aveis, apresentando algumas vantagens tais como robustez, um conhecimento mais amplo sobre a forma em que as vari´aveis explicativas podem influenciar diferentes quantis da vari´avel dependente e podendo desconsiderar uma especifica¸c˜ao para a distribui¸c˜ao do erro aleat´orio. Li(2015) mostra os principais benef´ıcios dos modelos de regress˜ao quant´ılica.

1.1

Objetivos

O objetivo deste trabalho consiste em comparar modelos de regress˜ao quant´ılica com o de regress˜ao linear. Dados ser˜ao simulados fazendo alguma hip´otese do modelo linear n˜ao ser satisfeita e analisando o comportamento da regress˜ao quant´ılica e regress˜ao linear nesses caos. Em seguida, uma base de dados reais sobre o ´Indice de Desenvolvimento Humano Municipal (IDHM), no ano de 2010, ser´a analisada utilizando a regress˜ao quant´ılica e a regress˜ao linear.

1.2

Organiza¸

ao

No Cap´ıtulo 2, encontra-se uma breve revis˜ao sobre regress˜ao linear, regress˜ao quant´ılica cl´assica, regress˜ao quant´ılica bayesiana e sobre os m´etodos de MCMC que s˜ao utilizados nesse trabalho, sob a inferˆencia bayesiana, para gerar amostra da distribui¸c˜ao

(17)

1.2 Organiza¸c˜ao 16

a posteriori. No Cap´ıtulo3 s˜ao apresentados os modelos utilizados para a simula¸c˜ao dos dados e toda a an´alise feita sobre eles, comparando a regress˜ao quant´ılica e a regress˜ao linear. Neste mesmo cap´ıtulo est´a a an´alise feita sobre os dados do IDHM 2010. No Cap´ıtulo 4, por fim, foram apresentadas as conclus˜oes obtidas com base nos resultados encontrados.

(18)

17

2

Materiais e M´

etodos

O objetivo desse trabalho ´e comparar modelos de regress˜ao linear com os de regress˜ao quant´ılica. Por isso, h´a uma breve revis˜ao sobre modelos de regress˜ao linear na Se¸c˜ao

2.1 e sobre modelos de regress˜ao quant´ılica na Se¸c˜ao 2.2. Os modelos propostos cont´em parˆametros desconhecidos. Esses parˆametros ser˜ao estimados atrav´es de inferˆencia cl´assica e bayesiana. No caso da inferˆencia bayesiana, nesse trabalho, recorre-se aos m´etodos de

MCMCpara amostrar os parˆametros e por isso na Se¸c˜ao2.3.1h´a uma breve revis˜ao sobre esses m´etodos.

2.1

Regress˜

ao Linear

O prop´osito da an´alise da regress˜ao ´e entender o comportamento da vari´avel resposta, tamb´em chamada de dependente, com base nos valores das vari´aveis explicativas, tamb´em chamadas de independentes ou covari´aveis. A regress˜ao linear ´e uma t´ecnica que busca associar uma vari´avel resposta como fun¸c˜ao linear dos coeficientes associados `as vari´aveis explicativas.

Sejam Yi a vari´avel dependente da i-´esima unidade populacional e Xli a vari´avel

independente, onde i = 1, 2, . . . , n e l = 1, . . . , k. O modelo de regress˜ao linear ´e definido da seguinte maneira:

Yi = β0+ β1X1i+ β2X2i+ . . . + βk−1X(k−1)i+ βkXki+ εi, (2.1)

onde admite-se que os erros εi sejam vari´aveis aleat´orias independentes com m´edia

zero e variˆancia constante (σ2) — variˆancia constante tamb´em ´e denominada por homocedasticidade. Costuma-se atribuir a essa vari´avel uma distribui¸c˜ao normal, ou seja, εi ∼ N (0, σ2) e ent˜ao, Yi ∼ N (β0+ β1X1i+ β2X2i+ . . . + βk−1X(k−1)i+ βkXki, σ2).

Quando k = 1, tem-se um modelo de regress˜ao linear simples e quando k > 1, h´a um modelo de regress˜ao linear m´ultipla.

(19)

2.1 Regress˜ao Linear 18

Esse modelo tamb´em pode ser representado matricialmente da seguinte forma:

Y = Xβ + ε, (2.2)

onde X ´e matriz das covari´aveis, caso seja de interesse estimar o intercepto (β0)

acrescenta-se um vetor de um no in´ıcio da matriz. β ´e a matriz coluna de dimens˜ao k + 1 dos parˆametros do modelo, ε ´e o vetor dos erros aleat´orios e Y ´e o vetor contendo os valores da vari´avel dependente.

Y =        y1 y2 .. . yn        , X =        1 X11 X12 · · · X1p 1 X21 X22 · · · X2p .. . ... . .. ... 1 Xn1 Xn2 · · · Xnp        , β =           β0 β1 β2 .. . βp           , ε =        ε1 ε2 .. . εn       

Antes de ajustar o modelo e analis´a-lo, recomenda-se fazer gr´aficos de dispers˜ao da vari´avel resposta versus cada uma das covari´aveis para investigar a hip´otese de linearidade. Para estimar os parˆametros β0, β1, β2, . . . , βk, independente da distribui¸c˜ao dos εi,

pode-se utilizar o m´etodo dos m´ınimos quadrados ordin´arios (MQO). Esse m´etodo ´e baseado na minimiza¸c˜ao da soma dos erros quadr´aticos que ´e dada da seguinte forma:

n X i=1 ε2i = n X i=1 (Yi− β0− β1X1i− β2X2i− . . . − βk−1X(k−1)i − βkXki)2 (2.3)

Para achar os valores de bβk, estimativas dos coeficientes βk do modelo definido,

deriva-se a Equa¸c˜ao (2.3) em rela¸c˜ao a cada parˆametro e iguala-se essas equa¸c˜oes a zero. Depois avalia-se a matriz Hessiana para verificar se os valores que anulam as derivadas representam um ponto de m´ınimo.

Supondo que εi ∼ N (0, σ2), tem-se que os estimadores para βkpelo m´etodo da m´axima

verossimilhan¸ca s˜ao iguais aos obtidos via m´etodo dos m´ınimos quadrados ordin´arios e por tanto, ´e dado por bβ = (X0X)−1X0Y . Os estimadores dos coeficientes da regress˜ao linear simples podem serem reescritos da seguinte forma:

b β0 = ¯Y − bβ1X¯ βb1 = Pn i=1XiYi− n ¯X ¯Y Pn i=1Xi2− n ¯X2 ,

Ap´os ajustar o modelo tem-se:

b

(20)

2.1 Regress˜ao Linear 19

sendo bYi uma estimativa do valor esperado de Yi e costuma ser chamado de valor ajustado

da i-´esima vari´avel resposta.

Com o modelo ajustado, analisam-se os res´ıduos para checar as suposi¸c˜oes de normalidade, homocedasticidade e independˆencia.

Os res´ıduos s˜ao calculados da seguinte maneira:

b

εi = Yi− bYi (2.5)

Pode-se analisar a normalidade dos res´ıduos das seguintes maneiras:

(i) pelo gr´afico qqnorm: esse gr´afico compara os quantis da normal com os quantis dos res´ıduos;

(ii) pelo histograma: fazendo o histograma dos res´ıduos e incluindo a curva da normal; (iii) pelos testes n˜ao param´etricos Shapiro-Wilk e Kolmogorov-Smirnov.

Depois de confirmar se os res´ıduos seguem distribui¸c˜ao normal, deve-se confirmar se s˜ao homoced´asticos e independentes. Para confirmar se os res´ıduos s˜ao homoced´asticos, faz-se o gr´afico de dispers˜ao dos res´ıduos versus os valores ajustados. Como espera-se que o modelo se ajuste bem, acredita-se que os res´ıduos estejam em torno de zero e bem dispersos. Para verificar a independˆencia, analisa-se o gr´afico da correla¸c˜ao dos res´ıduos. Para testar a significˆancia de cada βk, pode-se utilizar o teste t, cujas hip´oteses s˜ao:

(

H0 : βk = 0

H1 : βk 6= 0

A estat´ıstica do teste utilizada ´e:

t∗ = βbk

pC[k + 1, k + 1]MSE (2.6)

onde C ´e a matriz (XTX)−1, ent˜ao C[k + 1, k + 1] ´e o valor dessa matriz na posi¸c˜ao (k + 1, k + 1) e M SE = Pn i=1εb 2 i n−k . Sob H0, t ∗ ∼ t

n−k, levando a seguinte regra de decis˜ao:

Se t∗ > t1−α2,n−k ou t∗ < tα2,n−k rejeita-se H0, onde α ´e o n´ıvel de significˆancia,

normalmente ´e considerado α = 0, 05

Tamb´em pode-se testar H0 : βk 6 0 contra H1 : βk > 0 ou H0 : βk > 0 contra

(21)

2.2 Regress˜ao Quant´ılica 20

Dependendo do n´umero de vari´aveis independentes no modelo, n˜ao ´e vi´avel testar cada parˆametro de uma vez. Dessa forma, usa-se o teste F para testar se um conjunto de coeficientes ´e significativo para o modelo. Esse teste ´e baseado na compara¸c˜ao de dois modelos, o modelo n˜ao restrito (NR), que seria o modelo com todas as vari´aveis explicativas e o modelo restrito (R), modelo sem as vari´aveis que est˜ao sendo testadas. A estat´ıstica do teste ´e: F∗ = (SSE(R) − SSE(N R))/(k − q) M SE (2.7) onde SSE =Pn i=1(yi−ybi) 2. Sob H

0, F∗ ∼ Fk−q,n−k e q ´e o n´umero de coeficientes sendo

testados, portanto a regra de decis˜ao desse teste ´e: Se F∗ > F1−α,k−q,n−k, rejeita-se H0.

Um modo de avaliar o ajuste do modelo linear ´e pelo coeficiente de determina¸c˜ao (R2): R2 = 1 − Pn i=1(yi−byi) 2 Pn i=1(yi− ¯yi)2 (2.8)

Esse coeficiente assume valores reais entre 0 e 1. Quanto mais as vari´aveis independentes explicarem a vari´avel dependente, R2 ser´a mais pr´oximo de 1. O valor

desse coeficiente pode ser interpretado como sendo a propor¸c˜ao da dispers˜ao da vari´avel resposta que ´e explicada pela vari´avel dependente.

Maiores detalhes sobre regress˜ao linear m´ultipla podem ser vistos em Kutner et al.

(2005),Freund, Wilson e Sa (2006) e Montgomery, Peck e Vining (2012).

2.2

Regress˜

ao Quant´ılica

Os modelos de regress˜ao quant´ılica s˜ao utilizados para estruturar modelos onde o interesse n˜ao necessariamente encontra-se no comportamento m´edio dos dados, podendo assim associ´a-los a diversos quantis ou dados nos quais suposi¸c˜oes como normalidade, linearidade, independˆencia ou homocedasticidade s˜ao inv´alidas.

Considerando uma amostra ou popula¸c˜ao, o quantil de ordem τ ´e o valor c que deixa ao menos 100τ % abaixo dele e 100(1 − τ )% acima dele, com 0 < τ < 1. Dessa forma, define-se a fun¸c˜ao quant´ılica da seguinte forma:

(22)

2.2 Regress˜ao Quant´ılica 21

onde FY(y) = P (Y ≤ y), ou seja, FY(y) ´e a fun¸c˜ao de distribui¸c˜ao acumulada da vari´avel

Y.

Considere o seguinte modelo:

Qτ(Y |X) = µ(X) + ε

Para a regress˜ao quant´ılica, a fun¸c˜ao µ(.) pode assumir qualquer fun¸c˜ao para relacionar a vari´avel resposta e os coeficientes associados `as vari´aveis explicativas. Para este trabalho, foi assumido que a rela¸c˜ao entre a vari´avel resposta e os coeficientes associados `as vari´aveis explicativas ´e linear, ou seja,

µ(X) = Xβ(τ )

Sendo assim, o modelo de regress˜ao quant´ılica ´e definido da seguinte maneira:

Yi = β0(τ ) + β1(τ )X1i+ β2(τ )X2i+ . . . + βk−1(τ )X(k−1)i+ βk(τ )Xki+ εi, (2.10)

onde Xli ´e uma covari´avel, βl(τ ) ´e o parˆametro da regress˜ao quant´ılica e εi ´e o erro

aleat´orio. No modelo da regress˜ao quant´ılica assume-se que o quantil de ordem τ do ε ´e igual a zero.

2.2.1

Inferˆ

encia Cl´

assica

Um m´etodo utilizado para a estima¸c˜ao dos parˆametros β0(τ ), β1(τ ), . . . , βk(τ ), onde

k ´e o n´umero de covari´aveis utilizadas no modelo, ´e o m´etodo de minimiza¸c˜ao dos erros absolutos ponderados definido como:

n X i=1 w|εi| = n X i=1 w|Yi− β0− β1X1i− β2X2i− . . . − βk−1X(k−1)i − βkXki| (2.11) onde w =        τ, Yi > β0+ β1X1i+ . . . + βkXki 1 − τ, Yi < β0+ β1X1i+ . . . + βkXki

0, caso contr´ario

Davino, Furno e Vistocco(2013) mostra que a distribui¸c˜ao assint´otica dos estimadores dos parˆametros βk(τ ) depende de algumas suposi¸c˜oes consideradas para o efeito aleat´orio

(23)

2.2 Regress˜ao Quant´ılica 22

2.2.1.1 Caso com erros i.i.d.

No modelo de regress˜ao com erros Independentes e identicamente distribu´ıdos (i.i.d.) tendo uma fun¸c˜ao de densidade f estritamente positiva no quantil dado, ou seja, f (Q(τ )) > 0, os estimadores para os coeficientes do modelo, bβ1(τ ), . . . , bβk(τ ), s˜ao

assintoticamente distribu´ıdos como: √ n[ bβ(τ ) − β(τ )] → N (0, ω2(τ )D−1), (2.12) onde ω2(τ ) = τ (1−τ ) f (Q(τ ))2 e D = limn−→∞n1 P iX T

i Xi ´e uma matriz positiva definida, Xi ´e

um vetor composto pelas covari´aveis da i-´esima unidade resposta e β(τ ) ´e o vetor com as estimativas dos parˆametros.

2.2.1.2 Caso com erros i.ni.d..

Erros com distribui¸c˜ao Independente e n˜ao identicamente distribu´ıdos (i.ni.d.) s˜ao normalmente caracterizados pela heterocedasticidade, ou seja, pela mudan¸ca da variˆancia na amostra. Com isso, o estimador para o coeficiente do modelo, bβk(τ ), ´e assintoticamente

distribu´ıdo como: √

n[ bβ(τ ) − β(τ )] → N (0, τ (1 − τ )D1(τ )−1DD1(τ )−1), (2.13)

onde D1(τ ) = limn−→∞n1Pifi(Q(τ ))XITXi ´e uma matriz positiva definida e β(τ ) ´e o

vetor com as estimativas dos parˆametros.

2.2.1.3 Caso com erros dependentes

Erros dependentes s˜ao comuns em s´eries temporais, onde a dependˆencia ´e dada pela influˆencia que os erros passados tˆem sobre os erros atuais, influenciando o valor da vari´avel dependente.

Suponha, por exemplo, que o erro segue um processo autoregressivo, ou seja, εi ∼

AR(1), e ent˜ao, εi = ρεi−1+ ai, onde ai ´e um erro i.i.d..

Com isso, o estimador para o parˆametro β(τ ) satisfaz: √

(24)

2.2 Regress˜ao Quant´ılica 23

onde A = limn→∞D+n1 Piψ(ε)ψ(εi−1)(XiTXi−1+Xi−1T Xi) ´e uma matriz positiva definida,

P

iψ(εi)XiT =

P

isgn(εi)XiT ´e o gradiente da regress˜ao quant´ılica e ψ(.) ´e a derivada da

fun¸c˜ao objetiva da regress˜ao quant´ılica que ´e igual a fun¸c˜ao sinal (sgn(.)) (WEISS,1990). Maiores detalhes sobre regress˜ao quant´ılica em Koenker (2005) e Davino, Furno e Vistocco (2013).

2.2.2

Inferˆ

encia Bayesiana

Uma outra abordagem para a estima¸c˜ao dos parˆametros dos modelos definidos com regress˜ao quant´ılica ´e utilizando inferˆencia bayesiana.

Seja

Yi = β0(τ ) + β1(τ )X1i+ . . . + βk(τ )Xki+ εi,

onde β(τ ) = β0(τ ), β1(τ ), . . . , βk(τ ) ´e o vetor de parˆametros do modelo estudado

dependente do quantil τ .

Assim como na regress˜ao quant´ılica cl´assica, tem-se um problema de minimiza¸c˜ao, no qual deve-se minimizar a seguinte fun¸c˜ao perda:

min β X i ρτ(Yi− Xi0β), com ρτ(u) = |u| + (2τ − 1)u 2 , u = (Yi− X 0 iβ).

Independente da distribui¸c˜ao dos dados, essa abordagem para regress˜ao quant´ılica ´e feita assumindo a fun¸c˜ao Laplace assim´etrica como a fun¸c˜ao de verossimilhan¸ca e utilizando qualquer distribui¸c˜ao a priori. Yu e Moyeed (2001) mostram que a utiliza¸c˜ao da distribui¸c˜ao uniforme impr´opria para o parˆametro β gera uma posteriori pr´opria.

Para essa modelagem, a distribui¸c˜ao a posteriori possui uma forma anal´ıtica complexa e n˜ao permite c´alculos exatos das quantidades de interesse a posteriori. Logo, ´e considerado a utiliza¸c˜ao dos m´etodos de Monte Carlo via cadeias de Markov para gerar amostras da distribui¸c˜ao a posteriori e permitir assim a inferˆencia sobre os parˆametros do modelo.

(25)

2.3 M´etodos de Monte Carlo via Cadeias de Markov 24

Maiores detalhes sobre regress˜ao quant´ılica bayesiana podem ser visto emYu e Moyeed

(2001) e Kozumi e Kobayashi(2011).

2.3

etodos de Monte Carlo via Cadeias de Markov

No Cap´ıtulo 3, ´e preciso obter uma amostra de uma distribui¸c˜ao. Como esta distribui¸c˜ao n˜ao possui forma anal´ıtica conhecida, recorre-se ao m´etodo de MCMC. Por isso, nas subse¸c˜oes abaixo, ter´a uma breve revis˜ao sobre os algoritmos de Metropolis-Hastings e do amostrador de Gibbs.

Para simular uma amostra de uma distribui¸c˜ao f (.), utilizando algum m´etodoMCMC, ´e necess´ario que o algoritmo produza uma cadeia de Markov homogˆenea, aperi´odica e irredut´ıvel, cuja distribui¸c˜ao estacion´arica seja f (.). A cadeia ´e aperi´odica quando n˜ao atinge o mesmo ponto com regularidade fixa. E uma cadeia ´e irredut´ıvel se, com probabilidade positiva, ela se move de um ponto qualquer a partir de qualquer outro ponto em um n´umero finito de itera¸c˜oes.

Na inferˆencia bayesiana ´e corrente obter uma distribui¸c˜ao a posteriori com forma anal´ıtica desconhecida ou trabalhosa de ser amostrada. Nestes casos, recorre-se aos m´etodos MCMC para obter amostras da distribui¸c˜ao a posteriori e inferir sobre o parˆametro em estudo.

A convergˆencia das cadeias de Markov ´e esperada ap´os um per´ıodo chamado de aquecimento (burn-in), esses primeiros valores s˜ao descartados. Para diminuir a autocorrela¸c˜ao dos parˆametros pode-se usar o que denomina-se espa¸camento. Ent˜ao, sejam c − 1 a quantidade de itera¸c˜oes iniciais necess´arias para o aquecimento e t o espa¸camento, tem-se que as amostras β(c), β(c+t), β(c+2t), . . . s˜ao usadas como sendo a

amostra de β da distribui¸c˜ao de interesse. Um modo para analisar a convergˆencia da cadeia ´e baseado em gr´aficos da trajet´oria da cadeia, para verificar a partir de qual itera¸c˜ao os dados passam a ter o mesmo comportamento. Tamb´em existem pacotes no softwareR Core Team (2019) para checar a convergˆencia das cadeias como, por exemplo, o CODA (PLUMMER et al., 2006). Para maiores detalhes, Gamerman e Lopes (2006).

2.3.1

Algoritmo de Metropolis-Hastings

Este algoritmo foi proposto por Metropolis et al. (1953) e Hastings (1970). Para essa modelagem, a distribui¸c˜ao a posteriori possui uma forma anal´ıtica complexa e n˜ao

(26)

2.3 M´etodos de Monte Carlo via Cadeias de Markov 25

permite c´alculos exatos das quantidades de interesse a posteriori. Logo, ´e considerado a utiliza¸c˜ao dos m´etodos de MCMC para gerar amostras da distribui¸c˜ao a posteriori e permitir assim a inferˆencia sobre os parˆametros desconhecidos do modelo.

O algoritmo de Metropolis-Hastings ´e um m´etodo para gerar amostras de uma distribui¸c˜ao de interesse desconhecida.

A ideia desse algoritmo ´e gerar um valor de uma distribui¸c˜ao auxiliar e aceit´a-lo conforme uma dada probabilidade que depende da distribui¸c˜ao auxiliar q e da distribui¸c˜ao de interesse p. A convergˆencia da cadeia para a distribui¸c˜ao a posteriori ´e garantida por esse mecanismo de corre¸c˜ao.

O algoritmo ´e feito da seguinte maneira:

1. inicialize o contador de itera¸c˜oes j = 1, o contador de pontos aceitos a = 0 e especifique um valor inicial para β(τ )(j−1);

2. gere um novo valor β∗(τ ) da distribui¸c˜ao q(.|β(τ )(0));

3. calcule a probabilidade de aceita¸c˜ao α(β(τ )(j−1), β(τ )) e gere u ∼ U (0, 1)

α(β(τ )(j−1), β∗(τ )) = min  1, p(β(τ ) ∗)q(β(τ )(j−1)(τ )) p(β(τ )(j−1))q(β(τ )|β(τ )(j−1))  ;

4. se u 6 α, fa¸ca β(τ )(j)= β(τ ) e a = a + 1; caso contr´ario, fa¸ca β(τ )(j) = β(τ )(j−1);

5. incremente o contador j = j + 1 e volte ao passo 2, at´e atingir a convergˆencia.

A eficiˆencia do algoritmo est´a diretamente ligada a escolha da distribui¸c˜ao proposta, ou seja, a escolha errada da distribui¸c˜ao proposta pode causar em um n´umero de rejei¸c˜oes muito alto, sendo assim, prejudicando a eficiˆencia do algoritmo.

Roberts e Rosenthal (2009) propˆos que a taxa de aceita¸c˜ao fosse em torno de 44%.

2.3.2

Amostrador de Gibbs

O amostrador de Gibbs foi apresentado a comunidade estat´ıstica porGeman e Geman

(1993), mas foi previamente proposto por Gelfand e Smith (1990). Este algoritmo ´e utilizado quando amostrar de uma distribui¸c˜ao ´e trabalhoso, complicado ou quando n˜ao tem como amostrar diretamente da distribui¸c˜ao. Seja p(β) a distribui¸c˜ao que tem-se o interesse de amostrar onde β = (β1, . . . , βd). Seja β−l composto por todos os elementos

(27)

2.3 M´etodos de Monte Carlo via Cadeias de Markov 26

de β exceto pelo elemento βl, l = 1, . . . , d. Sejam pl(βl) = p(βl|β−l), l = 1, . . . , d as

distribui¸c˜oes condicionais completas. Logo, o amostrador de Gibbs consiste em um esquema de amostragem baseado em sucessivas gera¸c˜oes das distribui¸c˜oes condicionais completas e ´e definido da seguinte forma:

O amostrador de Gibbs ´e uma cadeia de Markov onde as transi¸c˜oes de um estado para outro s˜ao feitas de acordo com as distribui¸c˜oes condicionais completas.

1. Inicialize o contador de itera¸c˜oes da cadeira j=1.

2. Especifique os valores do vetor dos parˆametros. β(0)(τ )

3. Gere um novo valor de β(j)(τ ) a partir de β(j−1)(τ ) atrav´es da gera¸c˜ao sucessiva

dos valores.

4. Incremente o contador j = j + 1. Caso n˜ao ocorra a convergˆencia, retorne ao passo 2.

Para o amostrador de Gibbs n˜ao existe mecanismo de aceita¸c˜ao-rejei¸c˜ao, ou seja, seu valor de aceita¸c˜ao ´e sempre um.

(28)

27

3

An´

alise dos Resultados

Neste trabalho ser´a comparado os modelos de regress˜ao quant´ılica com os de regress˜ao linear. Para isso, na Se¸c˜ao 3.1, foi simulado seis PG, onde eles se diferenciam pelo erro associado. A ideia do erro associado ´e n˜ao atender as suposi¸c˜oes feitas pelo modelo linear e assim analisar o comportamento dos dois modelos – linear e quant´ılico – nestas situa¸c˜oes. J´a na Se¸c˜ao 3.2, analisa-se a base de dados reais doIDHM. Esse ´ındice se encontra entre 0 e 1, ent˜ao ´e feita uma transforma¸c˜ao na vari´avel para se adequar ao modelo linear.

3.1

Dados Simulados

Para comparar modelos de regress˜ao quant´ılica com os modelos de regress˜ao linear, dados artificiais foram gerados assumindo diferentes caracter´ısticas para os efeitos aleat´orios tais como independˆencia ou dependˆencia, normalidade ou n˜ao, homocedasticidade ou heterocedasticidade. Em seguida, ajustou-se os modelos de regress˜ao quant´ılica e de regress˜ao linear para verificar qual modelo melhor se ajustou aos dados gerados. O objetivo ´e comparar os dois m´etodos de estima¸c˜ao da regress˜ao quant´ılica e comparar o ajuste do modelo de regress˜ao quant´ılica com o de regress˜ao linear sob viola¸c˜ao das propriedades necess´arias para o ajuste da regress˜ao linear.

A gera¸c˜ao dos dados simulados e os ajustes dos dados foram feitos com o aux´ılio do software R (R Core Team, 2019). Para a an´alise dos dados foram utilizados pacotes do pr´oprio software. Para ajustar um modelo de regress˜ao quant´ılica cl´assica, foi utilizado o pacote regquant (KOENKER, 2018). J´a para o modelo de regress˜ao quant´ılica bayesiana foi utilizado o pacote bayesQR (BENOIT; Van den Poel, 2017).

A fun¸c˜ao do pacote bayesQR considera a distribui¸c˜ao N (0, 100Ik+1) como a

distribui¸c˜ao a priori para β , onde 0 ´e um vetor k + 1 dimensional com todos os elementos iguais a zero e Ik+1´e uma matriz identidade de ordem k+1 e gera amostras da distribui¸c˜ao

(29)

3.1 Dados Simulados 28

Dados foram simulados considerando uma amostra de tamanho n = 1000, onde a covari´avel foi gerada considerando X ∼ N (µ = 10, σ2 = 1), o efeito aleat´orio foi fixado em β0 = 1 e o efeito da covari´avel em β1 = 3. Para a abordagem bayesiana considerada

a seguinte distribui¸c˜ao para β ∼ N (0, 100Ik), onde 0 ´e um vetor k = 2 dimensional com

todos os elementos iguais a zero e Ik ´e uma matriz identidade de ordem k = 2. Para a

aplica¸c˜ao do amostrador de Gibbs, tanto para a simula¸c˜ao quanto a aplica¸c˜ao de dados reais, foram considerados cadeias de 60 mil itera¸c˜oes, considerando um aquecimento de 10 mil itera¸c˜oes e defasagem de 50 itera¸c˜oes, totalizando mil observa¸c˜oes que comp˜oem a amostra a posteriori.

Os dados foram simulados atrav´es dos seguintes processos geradores (PG):

Yi = β0+ β1Xi+ εi, onde εi iid ∼ N (µ = 0, σ2 = 1) (3.1) Yi = β0+ β1Xi+ εi, onde εi iid ∼ t1 (3.2) Yi = β0+ β1Xi+ εi, onde εi iid ∼ t3 (3.3) Yi = β0+ β1Xi+ εi, onde εi = ui− 1 e (3.4) ui iid ∼ LN (µ = 0, σ2 = 1, 252) Yi = β0+ β1Xi+ (1 + Xi)εi, onde εi iid ∼ N (µ = 0, σ2 = 1) (3.5) Yi = β0+ β1Xi+ εi, onde εi = ρεi−1+ ai e (3.6) ai ∼ N (µ = 0, σ2 = 1) e ρ = 0, 9 Yi = β0+ β1Xi+ εi, onde εi = ρεi−1+ ai e (3.7) ai ∼ N (µ = 0, σ2 = 1) e ρ = 1, 0

Enquanto apenas o primeiro PG satisfaz as propriedades da regress˜ao linear, o segundo, terceiro e quarto PG n˜ao satisfazem a propriedade de normalidade para os res´ıduos, o quinto j´a n˜ao atende a hip´otese de homogeneidade e nos dois ´ultimosPG, os res´ıduos s˜ao dependentes.

Os PG da Equa¸c˜oes (3.1), (3.2) e (3.3) possuem erros independentes e homogˆeneos. Na Figura 1 pode-se visualizar que a cauda dos erros associados aos PG das Equa¸c˜oes (3.2) e (3.3 s˜ao ´e mais pesadas se comparadas ao PG da Equa¸c˜ao 3.1. J´a para o erro associado ao PGda Equa¸c˜ao 3.4 possui assimetria `a direita.

(30)

3.1 Dados Simulados 29

ε

Densidade

−4

−2

0

2

4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

ε ~ N

(

0, 1

)

ε ~ t1 ε ~ t3 ε ~ LN

(

0 ; 1, 252

)

Figura 1: Fun¸c˜ao de densidade dos erros εi gerados atrav´es dos PG estabelecidos nas

Equa¸c˜oes (3.1), (3.2), (3.3) e (3.4).

A seguir, divide-se os PG mencionados acima conforme as caracter´ısticas do erro εi.

3.1.1

Erro Homogˆ

eneo Independente Sim´

etrico

Note que os processos gerados pelas Equa¸c˜oes (3.1), (3.2) e (3.3) possuem erros homogˆeneos, independentes e sim´etricos.

Al´em disso, h´a uma rela¸c˜ao linear entre as vari´aveis dependente e independente e essa rela¸c˜ao ´e ratificada nos gr´aficos de dispers˜ao apresentados na Figura 2.

(31)

3.1 Dados Simulados 30 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● X Y 7 8 9 10 11 12 13 20 25 30 35 40

(a) Gr´afico de dispers˜ao dos dados gerados de acordo com o PG (3.1). ● ● ● ● ●● ●●●● ●●●●● ●●●●●● ● ● ● ● ● ●● ● ● ●● ● ● ●● ●●● ●● ●● ● ● ● ● ●●● ● ●●●●●●●●●●● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ●●●●●● ●●●● ●●● ● ● ● ● ● ● ● ●●●●●●●●●●●●●●●● ●● ●●●●● ● ●● ●●●● ● ● ● ● ● ● ● ●● ●●● ●● ●●●● ● ● ● ● ● ● ● ● ● ●●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●●●● ● ●●●●●●● ●●●●●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●●● ●● ● ●●● ● ●● ●● ●●●●●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ● ● ● ● ● ●●●●●●●●●● ●●● ●● ●●●● ●● ●● ● ●● ●●● ●●●●● ●●●● ●●● ● ●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●● ●● ● ● ● ●● ● ● ● ● ● ● ● ● ● ●●●●●● ●●●●●● ● ●● ● ● ● ●● ● ●● ● ● ●●● ●●●●●●● ●●● ● ●● ● ● ●● ●● ●● ●●●●● ●●● ● ● ● ●●●● ●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●● ● ● ●● ●●●●● ●●●●●● ● ● ● ● ●●●●●●●●●●●●●●●●●●●●●●●● ●●●●● ● ●● ● ●●●●●●●●●●●●●●●●●●●●●●●● ●●●● ●●●● ●●●●● ● ● ●●● ● ● ● ●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●● ●●●●●●●●● ●●●●● ● ●● ● ● ●●●●●●● ● ● ● ● ● ●●● ●● ● ● ●●●● ●● ●●●●●● ●●● ● ●● ● ●●●●● ●●●●●●●●●●● ●● ● ●●● ●● ● ● ● ● ● ● ●●●●●●●●●●●●● ●●● ●●●●●● ●●●●●●●●●●●●●●●●●●●● ● ● ●●●● ●●●●●●● ● ● ● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●● ● ● ● ●● ● ●●●●●●● ●● ●●● ●●● ● ● ●● ● ●● ● ● ● ● ●● ● ●● ● ● ●● ● ● ●●● ●● ● ●● ● ●●●●●●●●●●● ●●●●●●●● ●●●●●●●●●●●● ●● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●● ●●● ● ● X Y 7 8 9 10 11 12 13 −800 −600 −400 −200 0 200

(b) Gr´afico de dispers˜ao dos dados gerados de acordo com o PG (3.2). ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● X Y 7 8 9 10 11 12 13 15 20 25 30 35 40 45

(c) Gr´afico de dispers˜ao dos dados gerados de acordo com o PG (3.3).

Figura 2: Gr´aficos de dispers˜ao dos PG (3.1), (3.2) e (3.3).

Ent˜ao, dado que as informa¸c˜oes para a simula¸c˜ao s˜ao desconhecidas, foi ajustada a equa¸c˜ao Yi = β0+ β1Xi + εi para os trˆes m´etodos apresentados.

Primeiramente, ser´a mostrado os ajustes feitos para os dados da Equa¸c˜ao 3.1. A partir da Figura 3(a), pode-se reparar na aleatoriedade dos res´ıduos em torno do zero, logo a propriedade de homogeneidade dos dados foi satisfeita. Para a propriedade sobre a normalidade dos erros, foi feito o teste de Shapiro - Wilk e o p-valor encontrado foi de 0,567. Sob um n´ıvel de significˆancia (α) de 0,05, n˜ao rejeita-se a hip´otese nula, ou

(32)

3.1 Dados Simulados 31

seja, com base nessa amostra, n˜ao rejeita-se a hip´otese de normalidade para os res´ıduos. Essa afirma¸c˜ao tamb´em ´e confirmada na Figura3(b), onde ´e mostrada que os quantis dos res´ıduos se ajustam aos quantis te´oricos da distribui¸c˜ao normal.

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Valores estimados Resíduos 25 30 35 40 −3 −2 −1 0 1 2 3

(a) Homogeneidade dos dados doPG 3.1.

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ●● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Quantis Teóricos Quantis da Amostr a −3 −2 −1 0 1 2 3 −3 −2 −1 0 1 2 3

(b) QQplot dos res´ıduos doPG 3.1.

Figura 3: Gr´afico dos res´ıduos do modelo ajustado pela Regress˜ao Linear.

Na Figura 4 ´e poss´ıvel comparar as estimativas para os coeficientes da Equa¸c˜ao

3.1 obtidas atrav´es dos diferentes m´etodos: Regress˜ao Linear Simples (RLS), Regress˜ao Quant´ılica Cl´assica (RQC) e Regress˜ao Quant´ılica Baysiana (RQB) para diferentes valores do quantil de ordem τ . Nota-se que, comparando a medida central, os dois coeficientes est˜ao pr´oximos para os trˆes m´etodos.

(33)

3.1 Dados Simulados 32 ● ● ● ● ● τ β0 0.1 0.25 0.5 0.75 0.9 −0.5 0.0 0.5 1.0 1.5 2.0 2.5 ● RLS RQC RQB

(a) Estimativas do coeficiente β0 para diferentes

valores de τ para o PG3.1. ● ● ● ● ● τ β1 0.1 0.25 0.5 0.75 0.9 2.94 2.96 2.98 3.00 3.02 ● RLS RQC RQB

(b) Estimativas do coeficiente β1 para diferentes

valores de τ para o PG3.1.

Figura 4: Estimativas dos coeficientes do PG3.1 para diferentes valores de τ .

Focando primeiramente nas estimativas para os valores centrais, pode-se observar pela Figura4que as estimativas da regress˜ao linear s˜ao pr´oximas das estimativas obtidas pelas regress˜oes quant´ılicas, tanto pelo m´etodo cl´assico quanto pelo m´etodo bayesiano. E que a regress˜ao linear obteve estimativas mais pr´oximas dos valores verdadeiros (β0 = 1 e

β1 = 3). Al´em disso, note que as estimativas obtidas pela regress˜ao quant´ılica cl´assica

est˜ao pr´oximas das obtidas pela regress˜ao quant´ılica bayesiana.

Na Figura 5, as retas s˜ao os ajustes obtidos nos trˆes m´etodos presentes no atual trabalho, onde as retas da regress˜ao quant´ılica cl´assica e da regress˜ao quant´ılica bayesiana s˜ao referentes a estimativa obtida para cada quantil τ = 0, 10; 0, 25; 0, 50; 0, 75; 0, 90. Repara-se que as estimativas dada para a medida central s˜ao pr´oximas nos trˆes m´etodos. J´a que os erros satisfazem as propriedades do modelo de regress˜ao linear, pode-se observar que as estimativas dos outros quantis se assemelham `as da regress˜ao linear se deslocar-se a reta para cima ou para baixo, dependendo do valor do quantil da normal. E como esses dados s˜ao independentes e homogˆeneos, as retas dos outros quantis s˜ao “paralelas”`a reta da mediana.

(34)

3.1 Dados Simulados 33 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

X

Y

7

8

9

10

11

12

13

20

25

30

35

40

RLS RQC RQB

Figura 5: Gr´afico com os ajustes da regress˜ao linear simples e da regress˜ao quant´ılica (sob enfoque cl´assico e bayesiano) para diferentes quantil (τ = 0, 10; 0, 25; 0, 50; 0, 75; 0, 90) aplicados nos dados doPG 3.1.

O PG gerado de acordo com a Equa¸c˜ao 3.2 ´e um PG que infringe a suposi¸c˜ao de normalidade. Como mostra a Figura 2(b), existem muitos outliers na amostra podendo assim, influenciar a m´edia da estimativa da regress˜ao linear.

Pela Figura 6, pode-se confirmar que os res´ıduos n˜ao seguem a distribui¸c˜ao normal e mesmo possuindo outliers no gr´afico valores estimados versus res´ıduos para checar a homogeneidade dos dados, os valores est˜ao em torno de zero, confirmando assim, a hip´otese de homogeneidade.

Referências

Documentos relacionados

De modo similar ao modelo de regress˜ ao linear simples, podemos utilizar o m´ etodo dos m´ınimos quadrados para estimar os coeficientes de regress˜ ao no modelo de regress˜ ao

M´ etodos de regress˜ ao foram usados para analisar dados provenientes de um estudo de investiga¸c˜ ao da rela¸c˜ ao entre a temperatura (x) da superf´ıcie da estrada e de deflex˜

A empresa deseja expandir seus est´ udios para outras cidades semelhantes e deseja investigar se as vendas (Y) podem ser estimadas atrav´ es do n´ umero de pessoas com 16 anos ou

O coeficiente de correla¸c˜ ao linear varia entre −1 e +1: r = −1 corresponde ao caso de correla¸ c˜ ao linear negativa perfeita e r = +1 corresponde ao de correla¸c˜ ao

Os dados mostrados a seguir fornecem o custo m´ edio por unidade (em centenas de reais) para este produto (y) e o tamanho do lote de produ¸ c˜ ao (x). Qual o modelo de regress˜

Demonstrar menor coeficiente de atrito no tribo sistema camisa-anel de pistão que impacta na redução do consumo de combustível específico com a utilização de um filme

O mercado no coração da Baixa está em vias de classifica ção como Imóvel de Interesse Público. Está a