• Nenhum resultado encontrado

INFERÊNCIA BAYESIANA PARA REGRESSÃO LINEAR SIMPLES COM ERRO NAS VARIÁVEIS

N/A
N/A
Protected

Academic year: 2021

Share "INFERÊNCIA BAYESIANA PARA REGRESSÃO LINEAR SIMPLES COM ERRO NAS VARIÁVEIS"

Copied!
95
0
0

Texto

(1)UNIVERSIDADE DE SÃO PAULO Instituto de Ciências Matemáticas de São Carlos. INFERÊNCIA BAYESIANA PARA REGRESSÃO LINEAR SIMPLES COM ERRO NAS VARIÁVEIS. MARTA YUKIE BABA. Orientação: Prof. Dr. Josemar Rodrigues. Dissertação apresentada ao Instituto de Ciências Matemáticas de São Carlos, da Universidade de São Paulo, como parte dos requisitos para obtenção do titulo de mestre em Ciência - Área: Ciências de Computação e Matemática Computacional.. São Carlos 1994.

(2)

(3)

(4) RESUMO. O objetivo deste trabalho é realizar uma Inferência Bayesiana para o coeficiente de inclinação do modelo de regressão linear simples com erros nas variáveis. Em consequência dos erros de mensuração os estimadores não-Bayesianos dos parâmetros envolvidos são viciados. O modelo com erros nas variáveis pode ser classificado de duas formas distintas: Modelo Funcional e Modelo Estrutural. Para o Modelo Funcional estudamos o parâmetro de inclinação sujeito a priori não-informativa e colocamos seu estimador de mínimos quadrados sob o modelo funcional com réplicas. Para o modelo estrutural analisamos o parâmetro de inclinação utilizando primeiramente a priori não-informativa e depois é submetido a uma priori informativa seguindo a estrutura hierárquica que Lindley propôs em um artigo publicado em 1972. Utilizando esta estrutura hierárquica, a influência da priori sobre a média a posteriori é analisada no sentido de Robustez introduzido por Pericchi & Smith (1992). O método de Laplace é usado como uma alternativa para aproximar a densidade a posteriori do parâmetro de interesse quando não conseguimos determinar explicitamente suas soluções analíticas..

(5) ABSTRACT. This work deals with Bayesian Inference for the slope coefficient of the simple linear regression model error in the variables. Due to measurement errors the non-Bayesian parameter estimators are biased. The model with error in the variables can be classified in two distinct ways: as the Functional Model or as the Structural Model. For the first one we study the slope parameter under noninformative prior analyzing its least square estimator via the functional model applied repeatedly. For the structural model we analyze the slope parameter using firstly a noninformative prior and then an informative one according to the hierarchical structure proposed by Lindley in 1972. Using this structure, the effect of the prior on the posterior average is analized via the robustness concept introduced by Pericchi & Smith (1992). The Laplace's method is used as an alternative to approximate the posterior density of the slope parameter when analytic solutions are not explicitly known..

(6) SUMÁRIO. INTRODUÇÃO . 01. 1. FUNDAMENTOS . 04. 1.1 Primeiros Desenvolvimentos . 07. 1.2 Modelo Funcional e Modelo Estrutural . 08. 1.3 Um modelo Particular . 09. 1.4 O Modelo de Regressão Linear Usual . 10. 2. INFERÊNCIA BAYESIANA NO MODELO FUNCIONAL . 11. 2.1 Estimador de Mínimos Quadrados Generalizados . 11. 2.2 Inferência Bayesiana para # . 17. 2.3 Modelo Funcional com Réplicas . 20. 3. INFERÊNCIA BAYESIANA PARA O MODELO ESTRUTURAL 25 3.1 Fator de Atenuação Conhecido . 27. 3.1.1 Intervalo HPD para fl . 30. 3.1.2 Exemplo Numérico . 31. 3.2 Fator de Atenuação Desconhecido 3.2.1 Exemplo Numérico . li'. 35 39.

(7) 4. ESTRUTURA HIERÁRQUICA PARA A PRIORI NO MODELO ESTRUTURAL . 41. 4.1 Introdução . 41. 4.1.1 Função de Verossimilhança . 43. 4.2 Inferência Bayesiana com Priori Normal. 43. 4.3 Inferência Bayesiana com Priori t de Student . 48. 4.4 Exemplo Numérico . 55. 5. Propostas Futuras . 61. Bibliografia . 63. APÊNDICE A Ortogonalidade de Parâmetros APÊNDICE B Método de Laplace para Aproximação de Integrais APÊNDICE C Região Highest Posterior Density APÊNDICE D Programas Utilizados. iv.

(8)

(9)

(10)

(11)

(12) 5. 1. Fundamentos. = a + Oxi 1,2,...,n. Se considerarmos que estas variáveis, yi e xi, são os verdadeiros valores e que os valores observáveis estão sujeitos a erros de mensuração, isto é, =y +. = x, + então, condensando estas considerações acima, podemos definir um modelo, que denominamos modelo de regressão linear simples com erros nas variáveis, da seguinte forma:. = + ui . (1.1). = +13 xi i 1,2,... = ,n onde os valores yi e xi não podem ser observados diretamente, ou seja, eles são os verdadeiros valores das variáveis, e ei e ui é o erro cometido ao observar Yi e Xi , respectivamente. Ao tratarmos com os modelos de regressão algumas hipóteses sobre a regularidade das populações devem ser levadas em consideração: para todo i = 1, 2, . . . ,n; i) Mei ) = O e E(ui )= O; ii) Var(ei ) e = Var(%) = cn2, ;. ( 1.2). til) Cov(ei ,ui )= CrL para todo. , Yi e Yi são independentes e, também, Xi e Xi são independentes.. Definimos E como a matriz de covariâncias dos erros, de tamanho 2x2, da seguinte forma:. cr2 02 1 EJe. (1.3).

(13)

(14)

(15)

(16)

(17)

(18)

(19) 2. Inferência Bayesiana no Modelo Funcional . 12. Não é dificil verificar que a variância residual de (2.1.1) é dada por: Var(v; ) cr= + fl2 a2u — 2p0-2,„ .. (2.1.2). A matriz de covariância amostrai, para as n observações, pode ser escrita da seguinte maneira: b,r( bxy Br = L bxy byy onde bxx = Xi2 b xy =. X. (2.1.3). e byy = r y,2. Levando em conta a suposição em que os erros e; e e são não-correlacionados, e também os erros ti, e uisão não-correlacionados, para todo i # j, um procedimento utilizado para estimar fl é a minimização da soma de quadrados dos resíduos, com pesos inversamente proporcionais às suas variâncias. Isto significa que o estimador j3# de fl é o valor que minimiza U=tn. (Y,-fix,)2 Var(Y, — X,). ou seja, u=. fl2b —2flb + "`" P2Cf2u 2P0-2.. (2.1.4). A equação normal pode ser obtida pela diferenciação de U com respeito a /3 e igualando a derivada a zero. Alternativamente, a minimização pode ser feita diretamente da seguinte forma: para uma constante fixa, podemos escrever U como. 4.+ Q2. onde Q,f = b. (2.1.5). —2fib xy +bn,. e. Q2=0(72. +o. (2.1.6).

(20) 2. Inferência Bayesicma no Modelo Funcional . 13. Resultado 2.1 Sob o modelo funcional temos que: Q (b o"3)(fi — ;61# )2 U == + Q2. (2.1.7). Q2. é mínimo quando (2.1.8) onde =. f(X, Y,e,u) — Ni[f(X,Y,e,u)]2 — 4 El IBI 2 (El. f (X ,Y ,e,u). br( cr +bry o— 2b ,. E. é uma matriz não singular conhecida, dada por (1.3).. Prova: Para algum fixo, temos que: Q2 Q2. (2.1.12). onde as variâncias a,2„ cr2. e cr2. são fixas. Supondo que fl=flo é o valor que minimiza U, é o menor valor consistente que satisfaz a igualdade (Q1 — ;Q2 ) = (br( — Ço-3)(/3—A)2 . Das equações dadas em (2.1.6), temos que:. — CV2 = /62 b — 2 fib xy b yy — a2. — 2)60-2. cr ) = )52 ( b — — 2 ig( b xy — C.72,„ ) +(b yy — ‘0! ) _ 4432 2(b xy — (b —. ) (b) y 4.0! ) (1) r( — Ccr,;). (2.1.13). É desejável para obtermos (2.1.7) que. — ‘Q2 = (br( — (7,2, )(P — flo) para algum e Po-. (2.1.14).

(21)

(22) 2. Inferência Bayesiana no Modelo Funcional f (X ,Y ,e,u) l[f(X,Y ,e,u)]2 — 41EHBI. =. 15. (2.1.21). 21E1. teremos determinado explicitamente, com a devida condição satisfeita para minimizar U.. Portanto, baseado no procedimento acima, o estimador de mínimos quadrados generalizados, proposto por Sprent é dado por: a2e„ b 20( — cs2.. (2.1.22). onde ‘i é dado por (2.1.21) e f (X ,Y ,e,u)=b,,cr cs2, +b. a2„ — 2 bn, o.. Nota: De (2.1.19), como 18 — El = C2IEI — f(X ,Y ,e,u) +MI, uma forma alternativa para determinar Ci seria calculando a menor raiz característica da equação: 16-4"Ei= O. (2.1.23). A seguir, ressaltaremos algumas particularidades do estimador de Sprent quando está sujeito a algumas restrições. Os resultados que podemos verificar são: (i) quando o = O. Dizer que c?„ O, = é equivalente dizer que X, = x,. Portanto, Cov(e,u,) = cr2;„ O= e isto implica que E é singular. Consequentemente, a equação (2.1.8) fica reduzida a: ^ b = h" • -xx Podemos notar que o estimador de mínimos quadrados ordinários f)*do modelo de regressão usual (1.6) e o estimador de mínimos quadrados generalizados de Sprent, dado pelo modelo funcional, coincidem. Intuitivamente é natural esperar que esse fato acontecesse, pois observe que se c?„ = O siginifica que a variável independente x, não contém erro de mensuração, que é a suposição feita no modelo de regressão usual..

(23)

(24)

(25)

(26)

(27)

(28)

(29)

(30) 2. Inferência Bayesiana no Modelo Funcional . flrY. i=1. 2. cr ., Yi2 +2 Q=. i-1. 2. i=1. (52e Cr2 44. 0.21(x0 :i060)2. i=1. oo. 23. (2.3.8). [nfl2 n. Podemos verificar que, de (2.3.8) acima, 10(ft) em (2.3.7) é o valor de xo que minimiza Q. Queremos determinar agora, qual é o valor de 13 que minimiza Q. É fácil notar que em (2.3.8), queremos determinar qual o f3 que minimiza a seguinte expressão:. i=1. c2. i =1. Y2 + Exf (2.3.9). Q = i=1 i=1 Cie2. n1. a124. I_ cf2.. Supondo que xo = io (M, (2.3.8) ou (2.3.9) pode ser escrito da seguinte maneira: 2. 1 Yi2 Xf] cf)[ 49,± Q=. i=1. — [cf:P(iYi ) +°-:(ÊXi)] i=1. na cr2,Áfi2 o 244 (7). Usando o Resultado 2.1, onde 2. Q,. i=1. (2.3.10).

(31) 2. Inferência Bayesiana no Modelo Funcional . =. n 02.(g2 cf2.. 02e). temos, finalmente, que:. (72 02. (±,j(±,,i). 1 i= i= 1. )2 ncr2u [a2,4 (tYi2 )+ ,ty(t)(i2 )— Acsa2,4 1— cr4„(t Yi i=1. e. ±IYi] [±xi]. fr.[ xo = -io (fl). i=1. , i=1. ' . = (72n, cf2 ;61°2 .. 02. 24.

(32) 3. Inferência Bayesiantrna para o Modelo Estrutural . 25. Capitulo 3 INFERÊNCIA BAYESIANA PARA O MODELO ESTRUTURAL. Suponhamos que os dados (Yi ,X; ) sejam provenientes do modelo estrutural, definido anteriormente pelas equações: =. xi. +. = +u. (3.1). = fixi i 1, = 2,...,n onde o verdadeiro valor não-observável xi é considerado uma variável aleatória, ou seja, assumimos que existe uma certa distribuição sobre esta variável. Considere as seguintes suposições adicionais, as suposições (1.2), para este modelo:. i) e; — N(0, cre2 ); ii) u — N(0, cr2.); iii). N(p1 ,o-2z ), com pz conhecido;. iv) e„u; , x; não correlacionados.. Utilizando os resultados conhecidos da teoria de distribuição Normal Multivariada (por exemplo, consulte Seber, 1977) verificamos que o vetor (X; , i ) tem distribuição Normal bivariada com vetor de médias.

(33)

(34) 3. Inferência Bayesiana para o Modelo Estrutural o2 o2 onde K=. x 02x +x c:5, 02x ,. 27. (3.6). que define o grau de atenuação do parâmetro /3 , isto é, explica realmente qual é a parte de fl que estamos estimando, pois, de (3.4) temos que EV1= fi Kx Existe um número significativo de nomes para o quociente Kx , que é chamada de confiabilidade de Xi na literatura de Ciências Sociais, é chamada herdabilidade em genética, etc. Sugerimos consultar Fuller (1987) para exemplos ilustrativos sobre o efeito do fator de atenuação na estimativa de fi . De (3.6), temos a interpretação de Kx como sendo a proporção da variabilidade da variável não observável x (a2x ) correspondente a variabilidade da variável observável X. (02.) A determinação do intervalo Highest Posterior Density (BPD) para fl pode ser bastante simplificada trabalhando-se com uma parametrização ortogonal (definido no apêndice A), onde os parâmetros ortogonais são determinados seguindo a técnica de Cox & Reid (1987). Nas próximas seções analisaremos a inferência para fl quando o fator de atenuação Kx é conhecido e desconhecido, via parâmetros ortogonais.. 3.1 Fator de Atenuação Conhecido Existe um número de situações, particularmente em psicologia, sociologia e estudo de amostragem, onde a informação sobre o fator Kx é acessível, por exemplo, se o interesse está em uma característica particular do indivíduo, tal como a inteligência, lealdade da comunidade, consciência social, espontaneidade para adotar novas práticas, capacidade administrativa, a probabilidade que o indivíduo votará em uma eleição em particular, etc. O teste de Q.I. é, talvez, o melhor exemplo conhecido; de onde é impossível observar o valor.

(35)

(36)

(37)

(38)

(39)

(40)

(41)

(42)

(43)

(44)

(45)

(46)

(47)

(48)

(49)

(50)

(51)

(52)

(53)

(54)

(55)

(56)

(57)

(58)

(59)

(60)

(61)

(62)

(63)

(64)

(65)

(66)

(67)

(68)

(69)

(70)

(71)

(72)

(73)

(74)

(75)

(76)

(77)

(78)

(79)

(80)

(81)

(82)

(83)

(84)

(85)

(86)

(87)

(88)

(89)

(90)

(91)

(92)

(93)

(94)

(95)

(96)

Referências

Documentos relacionados

dados o número total de lâmpadas defeituosas por dia, sendo o número de dias, a frequência de cada dado. CONCLUSÃO: o recurso não procede. DECISÃO: A questão será mantida.. c)

Da análise SWOT realizada destacam-se como forças a existência de diversos instrumentos de ordenamento já em vigor, nomeadamente para áreas incluídas na Rede Nacional de

Uma das grandes diferenças entre os profissionais da edição de vídeo da informação televisiva diária da RTP, segmentada por categorias pro- fissionais, tendo, por um lado, os

Avaliar a lista de materiais solicitados na disciplina de pré-clínica e clínica I que poderá ser aproveitado.. Muitos grampos para dentes permanentes não se adaptam em

Parágrafo primeiro – O direito às bolsas de estudo passa a vigorar ao término do contrato de experiência, cuja duração não pode exceder de 90 (noventa) dias, conforme

BR362 FACULDADES INTEGRADAS FAFIBE BR363 CENTRO UNIVERSITÁRIO ASSUNÇÃO BR364 UNIVERSIDADE FEDERAL DE ALFENAS BR365 FACULDADE ALFREDO NASSER LTDA BR366 UNIVERSIDADE FEDERAL

UNIVERSIDAD CAMILO JOSÉ CELA UNIVERSIDAD DE CANTABRIA UNIVERSIDAD CARDENAL HERRERA UNIVERSIDAD CARLOS III DE MADRID UNIVERSIDAD CASTILLA LA MANCHA UNIVERSIDAD CATÓLICA

Nelson é uma das poucas figuras que desempenham papel relevante em pelo menos três vertentes historiográficas no Brasil: a História do Teatro Brasileiro