Efeito da polui¸
c˜
ao atmosf´
erica no Pico de
Fluxo Expirat´
orio de escolares: uma
aplica¸
c˜
ao com dados de painel
Niter´oi - RJ, Brasil 19 de Janeiro de 2017
Deyvid Toledo Santiago de Almeida
Efeito da polui¸
c˜
ao atmosf´
erica no
Pico de Fluxo Expirat´
orio de
escolares: uma aplica¸
c˜
ao com dados
de painel
Trabalho de Conclus˜ao de Curso
Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.
Orientador: Prof. Ludmilla da Silva Viana Jacobson
Niter´oi - RJ, Brasil 19 de Janeiro de 2017
Deyvid Toledo Santiago de Almeida
Efeito da polui¸
c˜
ao atmosf´
erica no Pico de
Fluxo Expirat´
orio de escolares: uma
aplica¸
c˜
ao com dados de painel
Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo “Efeito da polui¸c˜ao atmosf´erica no Pico de Fluxo Expirat´orio de escola-res: uma aplica¸c˜ao com dados de painel”, defendida por Deyvid Toledo Santiago de Almeida e aprovada em 19 de Janeiro de 2017, na cidade de Niter´oi, no Estado do Rio de Janeiro, pela banca examinadora constitu´ıda pelos professores:
Profa. Dra. Ludmilla da Silva Viana Jacobson Departamento de Estat´ıstica – UFF
Prof. Dra. Jessica Quintanilha Kubrusly Departamento de Estat´ıstica – UFF
Prof. Dr. Wilson Calmon Almeida dos Santos Departamento de Estat´ıstica – UFF
Diversos estudos mostram efeitos adversos da exposi¸c˜ao a poluentes atmosf´ericos na sa´ude humana. O objetivo deste trabalho ´e avaliar os efeitos da polui¸c˜ao atmosf´erica, medida pelo material particulado inal´avel (PM10), no pico de fluxo expirat´orio (PFE) de
crian¸cas e adolescentes residentes no munic´ıpio de Rio Branco. Trata-se de um estudo de painel com medidas repetidas do PFE de 260 escolares com idades entre 6 e 15 anos, acompanhadas entre os meses de Agosto e Outubro de 2009. Na an´alise dos dados fo-ram estimados Modelos Lineares Hier´arquicos e Modelos de Regress˜ao Linear. O ajuste do efeito da polui¸c˜ao foi a partir da metodologia Single Lag e do Modelo polinomial de defasagem distribu´ıda. O modelo b´asico inclui as vari´aveis Sexo, Asma, Fumo domiciliar, Idade, Peso, Altura, medidas repetidas da Temperatura e Umidade Relativa. No modelo hier´arquico, o ajuste da polui¸c˜ao pelo m´etodo Single Lag mostrou impacto no PFE do aumento de 10 unidades da polui¸c˜ao, este impacto com respectivos intervalos de con-fian¸cas de 95% foi de: −0, 110l/min (−0, 419; 0, 198), −0, 610l/min (−0, 940; −0, 280), −0, 587l/min (−0, 909; −0, 265), −0, 193l/min (−0, 599; 0, 213), −0, 571l/min (−1, 014; − 0, 129), para as defasagens de 1, 2, 3, 4 e 5 dias da polui¸c˜ao, respectivamente. O ajuste da polui¸c˜ao pelo m´etodo do Modelo polinomial de defasagem distribu´ıda mostrou impacto no PFE do aumento de 10 unidades da polui¸c˜ao, este impacto com respectivos intervalos de confian¸cas de 95% foi de: −0, 191l/min (−0, 369; −0, 012), −0, 394l/min (−0, 622; −0, 167), −0, 446l/min (−0, 650; −0, 241), −0, 345l/min (−0, 540; −0, 150), −0, 092l/min (−0, 575; 0, 389), −1, 306l/min(−2, 006; −0, 606), para as defasagens de 1, 2, 3, 4, 5 dias da po-lui¸c˜ao e efeito global, respectivamente. No modelo de Regress˜ao Linear o ajuste da polui¸c˜ao pelo m´etodo Single Lag mostrou impacto no PFE do aumento de 10 unida-des da polui¸c˜ao, este impacto com respectivos intervalos de confian¸cas de 95% foi de: −1, 628l/min (−11, 324; 8.067), −6, 415l/min (−17.248; 4, 417), −5, 634l/min (−19, 220; 7, 951), −5, 081l/min (−18, 655; 8, 492), 5, 421l/min (−6, 019; 16, 862), para as defasagens de 1, 2, 3, 4 e 5 dias da polui¸c˜ao, respectivamente. Os resultados deste trabalho corro-boram com a literatura e sugerem a exposi¸c˜ao a polui¸c˜ao atmosf´erica como fator de risco para a sa´ude respirat´oria dos escolares.
Palavras-chaves: Pico de Fluxo Expirat´orio, Estudo de Painel, Modelos Hier´arquicos, Modelo Polinomial de defasagem distribu´ıda, Amazˆonia.
Gostaria de agradecer, em primeiro lugar, aos meu pais e ao meu irm˜ao por terem me dado condi¸c˜oes de cursar uma universidade, e sempre estarem ao meu lado nessa caminhada, me apoiando nas minhas decis˜oes.
Agrade¸co aos meus irm˜aos que fiz durante a gradua¸c˜ao: Gabriel Agostini, por sempre me dar um lar ap´os as festas. Jorge Rachid, por sua amizade sincera na qual sei que posso contar sempre. Renato Panaro, por sua lealdade e por ter me ensinado seno e cosseno. As pr´es com vocˆes sempre foram as melhores.
Agrade¸co tamb´em a Bernardo Nobrega, Bruno Gomes e Ivan Marreiros por terem formado junto comigo o melhor quarteto de ataque da hist´oria do DCE.
Agrade¸co aos professores do departamento de Estat´ıstica. Em especial, a minha orientadora Ludmilla Jacobson por ter acreditado no meu potencial durante esse projeto e tamb´em por toda a aprendizagem. A Wilson Calmon por ter me dado conselhos quando eu precisava. E aos demais que me ensinaram tudo que eu aprendi durante a gradua¸c˜ao, tenho uma profunda gratid˜ao por todos vocˆes.
Agrade¸co a Paola Martins por ser minha fonte de inspira¸c˜ao e pelo de companhei-rismo durante esse per´ıodo dif´ıcil que ´e o final do curso, muito obrigado mesmo.
Agrade¸co todos os amigos da gradua¸c˜ao que n˜ao citei, pelo tempo que passamos juntos e por serem pessoas incr´ıveis comigo.
Lista de Figuras
Lista de Tabelas
1 Introdu¸c˜ao p. 10
1.1 Epidemiologia dos efeitos da polui¸c˜ao atmosf´erica sobre o Pico de Fluxo
Expirat´orio . . . p. 11 2 Objetivos p. 13 2.1 Objetivo Geral . . . p. 13 2.2 Objetivos Espec´ıficos . . . p. 13 3 Materiais e M´etodos p. 14 3.1 Area de estudo . . . .´ p. 14 3.2 Banco de dados . . . p. 14 3.3 Modelo de Regress˜ao Linear . . . p. 15 3.3.1 Hip´oteses do MRL . . . p. 16 3.3.2 Estima¸c˜ao do Modelo . . . p. 17 3.3.3 Intervalo de Confian¸ca e Teste de Hip´oteses para β . . . p. 17 3.3.4 An´alise de Res´ıduos . . . p. 19 3.4 Modelo Linear Hier´arquico . . . p. 20 3.4.1 Modelos lineares hier´arquicos de dois n´ıveis . . . p. 21 3.4.2 Hip´oteses do Modelo Linear Hier´arquico . . . p. 24 3.4.3 Estima¸c˜ao do Modelo . . . p. 25
3.5 Modelo Polinomial de Defasagem Distribu´ıda . . . p. 28 3.6 Fun¸c˜ao de Variˆancia . . . p. 30 3.7 Autocorrela¸c˜ao dos Res´ıduos . . . p. 30
4 An´alise dos Resultados p. 32
4.1 An´alise descritiva . . . p. 32 4.1.1 Vari´aveis Relacionadas ao Dia . . . p. 32 4.1.2 Vari´aveis Relacionadas as Crian¸cas . . . p. 35 4.2 Ajuste do Modelo B´asico . . . p. 37 4.2.1 Fun¸c˜ao de Variˆancia . . . p. 39 4.2.2 An´alise de Res´ıduos . . . p. 41 4.3 Efeitos Ajustados da Polui¸c˜ao . . . p. 42 4.3.1 Single Lag . . . p. 42 4.3.2 Modelo Polinomial de Defasagem Distribu´ıda . . . p. 45 4.4 Modelo de Regress˜ao Linear . . . p. 47
5 Conclus˜ao p. 51
Referˆencias p. 52
Anexo A -- T´ıtulo do primeiro anexo p. 54
Anexo B -- T´ıtulo do segundo anexo p. 57
1 Modelo Te´orico . . . p. 24 2 Boxplot das vari´aveis Temperatura, Umidade Relativa e Polui¸c˜ao . . . p. 32 3 S´eries Temporais vari´aveis das Temperatura e Polui¸c˜ao . . . p. 33 4 S´eries Temporais vari´aveis das Umidade Relativa e Polui¸c˜ao . . . p. 33 5 Boxplot Pico de Fluxo Expirat´orio segundo algumas caracter´ısticas . . p. 34 6 Pico de Fluxo Expirat´orio ajustado pelo Tempo . . . p. 35 7 Boxplot das vari´aveis Idade, Altura e Peso . . . p. 36 8 Boxplot dos res´ıduos por Faixa Et´aria, Sexo e Asma . . . p. 39 9 Normalidade Multivariada dos Efeitos Aleat´orios . . . p. 41 10 Normalidade Univariada dos Efeitos Aleat´orios Padronizados . . . p. 41 11 Normalidade dos Res´ıduos Padronizados . . . p. 42 12 PDLM: Intervalo de Confian¸ca para 10 unidades de Polui¸c˜ao . . . p. 46 13 S´erie do PFE ajustado pelo Tempo Centrado na M´edia por Crian¸ca . . p. 57 14 Diagrama de Dispers˜ao dos Efeitos Aleat´orios do Sexo Feminino . . . . p. 60 15 Diagrama de Dispers˜ao dos Efeitos Aleat´orios do Sexo Masculino . . . p. 60 16 Diagrama de Dispers˜ao dos Efeitos Aleat´orios dos N˜ao Asm´aticos . . . p. 61 17 Diagrama de Dispers˜ao dos Efeitos Aleat´orios dos Asm´aticos . . . p. 61
1 Distribui¸c˜ao da amostra segundo Idade e Sexo . . . p. 15 2 Exemplo de Dados Balanceados . . . p. 20 3 Exemplo de Dados Desbalanceados . . . p. 20 4 Resumo das vari´aveis relacionadas ao Dia . . . p. 32 5 Resumo das vari´aveis Quantitativas relacionadas as Crian¸cas . . . p. 35 6 Resumo das vari´aveis Qualitativas relacionadas as Crian¸cas . . . p. 36 7 Tabela de Dupla entrada e Teste de Independˆencia . . . p. 37 8 Efeitos Fixos do Modelo B´asico . . . p. 38 9 Efeitos Aleat´orios do Modelo B´asico . . . p. 38 10 Raz˜oes de Variˆancia . . . p. 40 11 Desvio Padr˜ao dos Efeitos Aleat´orios . . . p. 43 12 Desvio Padr˜ao dos Efeitos Aleat´orios . . . p. 43 13 Desvio Padr˜ao dos Efeitos Aleat´orios . . . p. 44 14 Desvio Padr˜ao dos Efeitos Aleat´orios . . . p. 44 15 Desvio Padr˜ao dos Efeitos Aleat´orios . . . p. 44 16 Efeitos da Polui¸c˜ao Single Lag para 10 Unidades . . . p. 45 17 Desvio Padr˜ao dos Efeitos Aleat´orios . . . p. 46 18 Efeitos da Polui¸c˜ao PDLM para 10 Unidades . . . p. 46 19 Coeficientes do Modelo B´asico de Regress˜ao Linear . . . p. 47 20 Efeitos da Polui¸c˜ao Single Lag para o aumento de 10 unidades . . . p. 49 21 Compara¸c˜ao dos Intervalos de Confian¸ca do MRL e Modelo Linear Hier´arquico p. 49 22 Exames realizados por dia . . . p. 54
1
Introdu¸
c˜
ao
A polui¸c˜ao atmosf´erica pode ser definida como a presen¸ca de substˆancias no ar que s˜ao nocivas a sa´ude e ao bem estar dos seres vivos [1]. No mundo atual a polui¸c˜ao atmosf´erica ´e um problema de sa´ude p´ublica. Diversos estudos mostram efeitos adversos da exposi¸c˜ao a poluentes atmosf´ericos na sa´ude humana [2]. Estes efeitos foram medidos atrav´es dos indicadores de mortalidade, interna¸c˜ao, atendimentos de emergˆencia, ocorrˆencia de sin-tomas respirat´orios, decr´escimos no pico de fluxo expirat´orio 1, dentre outros [3],[4]. Os grupos mais cr´ıticos a exposi¸c˜ao da polui¸c˜ao do ar s˜ao as crian¸cas, os idosos e os indiv´ıduos com problemas no aparelho respirat´orio[5].
Nas cidades, os ve´ıculos s˜ao uma fonte preocupante de poluentes, pois s˜ao respons´aveis por 14% dos di´oxidos de carbono(CO2) e 54% dos mon´oxidos de carbono (CO),
encon-trados na atmosfera, al´em de outros poluentes[6]. N˜ao apenas em grandes cidades, mas tamb´em em cidades de menor porte a polui¸c˜ao do ar reflete no aumento de interna¸c˜oes por doen¸cas respirat´orias e cardiovasculares [7].
Na Amazˆonia Legal concentra-se cerca de 85% das queimadas, a partir destas ocorre a alta emiss˜ao, na atmosfera, de poluentes danosos a sa´ude humana como PM102 e PM2,53
que s˜ao fatores de risco para enfermidades nos aparelhos respirat´orio e cardiovascular[5]. Na literatura encontram-se diferentes t´ecnicas estat´ısticas utilizadas para explicar o efeito da polui¸c˜ao no pico de fluxo respirat´orio, como a Modelagem Hier´arquica Linear com 2 n´ıveis [4],[8], e Autorregressivo de primeira ordem [9],[8]. Al´em disso, h´a estudos em que foram utilizados teste-t, Mann-Whitney, Qui-quadrado, Fisher e Anova[10].
Muitos tipos de dados, incluindo dados observacionais coletados nas ciˆencias biol´ogicas e humanas possuem uma estrutura hier´arquica, como, alunos dentro de escolas e estas dentro de munic´ıpios[11].
1E o fluxo expirat´´ orio m´aximo alcan¸cado com um esfor¸co m´aximo ap´os a inspira¸c˜ao m´axima. 2Material particulado com diˆametro inferior a 10 micrˆometros
Os modelos hier´arquicos lineares, tamb´em chamados de modelos Multin´ıveis, s˜ao uma generaliza¸c˜ao dos m´etodos de regress˜ao cl´assicos, portanto podem ser usados para in´umeros prop´ositos, incluindo predi¸c˜ao, redu¸c˜ao dos dados e inferˆencias. Tanto para vari´aveis em estudos transversais ou ao longo do tempo.
Uma revis˜ao de estudos anteriores ´e apresentada na pr´oxima se¸c˜ao e busca conhecer a rela¸c˜ao do efeito da polui¸c˜ao atmosf´erica no pico de fluxo expirat´orio.
1.1
Epidemiologia dos efeitos da polui¸
c˜
ao atmosf´
erica
sobre o Pico de Fluxo Expirat´
orio
Nesta se¸c˜ao ser˜ao descritos 5 estudos realizados no Brasil, publicados no per´ıodo de 2009 a 2014 sobre os efeitos da exposi¸c˜ao a poluentes atmosf´ericos sobre o pico de fluxo expirat´orio.
Um estudo com 118 alunos com idades entre 6 e 15 da rede p´ublica do estado do Rio de Janeiro utilizou as seguintes vari´aveis na modelagem dos dados: PM10, SO2, O3, NO2
e CO, temperatura, umidade, exposi¸c˜ao domiciliar ao fumo, ser asm´atico, altura, sexo, peso, idade das crian¸cas e medidas repetidas do pico de fluxo expirat´orio. Aplicou-se a modelagem multin´ıvel, onde o primeiro e o segundo n´ıveis s˜ao respectivamente os dias da avalia¸c˜ao pulmonar e as crian¸cas. Concluiu-se que os poluentes PM10 e NO2 , estavam
associados `a diminui¸c˜ao da fun¸c˜ao respirat´oria das crian¸cas.[4]
Um estudo transversal com 1.076 escolares com idades de 10 a 14 anos em Monte Apraz´ıvel, S˜ao Paulo, incluiu as seguintes vari´aveis na an´alise dos dados: antecedentes familiares e pessoais para problemas respirat´orio, pico de fluxo expirat´orio, PM2,5, Black
Carbon, temperatura e umidade. Aplicou-se testes de hip´oteses, como teste-t, Mann-Whitney e Anova. Concluiu-se que a prevalˆencia di´aria do pico de fluxo expirat´orio abaixo de 20% da mediana das medidas na crian¸ca foi maior em dias com maior concentra¸c˜ao de PM2,5.[10]
Em outro estudo realizado em S˜ao Paulo com uma amostra de 96 crian¸cas entre 7 a 11 anos, acompanhas por alguns meses, foram utilizadas as vari´aveis: peso, altura, volume expirat´orio for¸cado, pico de fluxo expirat´orio, umidade, temperatura, IgE, e indicadores de polui¸c˜ao (como PM10, NO2, NO, CO, SO2 e O3). Na an´alise dos dados utilizou-se a
Analise de Regress˜ao baseada em equa¸c˜oes de estima¸c˜ao generalizadas e concluiu-se que a diminui¸c˜ao do pico de fluxo expirat´orio est´a associada a polui¸c˜ao do ar.[9]
escola do munic´ıpio de Alta Floresta, MT, observou-se as seguintes vari´aveis: tempera-tura, umidade, PM2,5, pico de fluxo expirat´orio, peso, altura, idade, condi¸c˜ao asm´atica.
Aplicou-se Modelagem Hier´arquica Linear e conclui-se que a exposi¸c˜ao aos n´ıveis de PM2,5
estava associada com a redu¸c˜ao da fun¸c˜ao pulmonar das crian¸cas.[12]
Em outro estudo de painel com uma amostra de 234 escolares de 6 a 15 anos de idade, residentes do munic´ıpio de Tangar´a da Serra, MT, as seguintes vari´aveis foram pesquisadas: temperatura, umidade, PM10, PM2,5, Black Carbon, pico de fluxo, idade,
peso, altura, sexo, condi¸c˜ao asm´atica, fumo passivo e IMC. Aplicou-se modelo hier´arquico e modelo autorregressivo de ordem 1 para cada crian¸ca. Verificou-se que houve redu¸c˜ao do pico de fluxo expirat´orio para PM10 e PM2,5 [8]
Diante da revis˜ao da literatura verifica-se a importˆancia de mais estudos sobre efeitos subcl´ınicos da polui¸c˜ao atmosf´erica devido a queimadas em grupos vulner´aveis, como crian¸cas e adolescentes.
Este trabalho est´a organizado em cap´ıtulos. No cap´ıtulo 2 s˜ao descritos os objetivos geral e espec´ıficos. O cap´ıtulo 3 apresenta o banco de dados e os m´etodos estat´ısticos para a an´alise dos dados. O cap´ıtulo 4 ´e reservado para os resultados das an´alises dos dados. O ´ultimo cap´ıtulo apresenta as conclus˜oes e limita¸c˜oes do estudo.
4Desenho particular de estudo longitudinal em que cada unidade do corte transversal ´e observada em
2
Objetivos
2.1
Objetivo Geral
Avaliar o efeito da polui¸c˜ao atmosf´erica no pico de fluxo expirat´orio (PFE) de crian¸cas e adolescentes residentes no munic´ıpio de Rio Branco.
2.2
Objetivos Espec´ıficos
• Estimar o efeito da polui¸c˜ao sobre o PFE a partir de modelos de regress˜ao linear, considerando os dados de corte transversal por crian¸ca;
• Estimar o efeito da polui¸c˜ao sobre o PFE a partir de modelos hier´arquicos, consi-derando os dados em painel;
• Comparar as estimativas pontuais e intervalares dos efeitos da polui¸c˜ao obtidas segundo os diferentes m´etodos estat´ısticos.
3
Materiais e M´
etodos
As pr´oximas se¸c˜oes descrevem a ´area de estudo, o banco de dados e os m´etodos utilizados na an´alise dos dados.
3.1
Area de estudo
´
Segundo o IBGE, em 2015 o munic´ıpio de Rio Branco, no estado do Acre, teve po-pula¸c˜ao estimada de 370.550 pessoas. Sua ´area territorial ´e de 8.835,520 km2 e as princi-pais atividades econˆomicas s˜ao: com´ercio, pesca, extrativismo e servi¸cos. Quanto `as fontes de polui¸c˜ao atmosf´erica, no ano de 2015, a frota de ve´ıculos era composta por 158.053 au-tom´oveis[13], enquanto que os focos de incˆendio florestais identificados no estado do Acre foram de 5.512, que representa 3,33% das queimadas registradas na Amazˆonia Legal[14]. Em Rio Branco, no ano de 2014 ocorreram 161 ´obitos devido a problemas no aparelho respirat´orio.
3.2
Banco de dados
O estudo de painel de Rio Branco aconteceu na Escola Estadual Raimundo Herm´ınio de Melo, no per´ıodo de 18 de Agosto de 2009 a 22 de Novembro de 2009. Das crian¸cas e adolescentes selecionados aleatoriamente, 279 iniciaram o seguimento. No entanto, apenas 260 crian¸cas preencheram um question´ario com caracter´ısticas individuais e do domic´ılio. Para este estudo, o banco de dados foi reduzido, ou seja, foram utilizados os dados at´e 31 de outubro e apenas os 260 estudantes que responderam o question´ario. A tabela 1 apresenta a distribui¸c˜ao da amostra segundo idade e sexo.
Foram coletados diariamente medidas do pico de fluxo expirat´orio (PFE), dados sobre os n´ıveis de poluentes atmosf´ericos e informa¸c˜oes meteorol´ogicas. Al´em disso, foram coletadas a partir de question´ario informa¸c˜oes sobre as caracter´ısticas individuais dos
Tabela 1: Distribui¸c˜ao da amostra segundo Idade e Sexo
Sexo Idade Total
6 7 8 9 10 11 12 13 14 15
Feminino 8 8 16 16 16 15 19 23 14 2 137
Masculino 8 8 11 14 17 14 22 13 14 2 123
estudantes.
No monitoramento do PFE foi usado o aparelho manual port´atil Mini-Wright Peak Flow Meter, com escala variando de 60 l/min a 800 l/min, que mede o fluxo expirat´orio for¸cado m´aximo alcan¸cado com um esfor¸co m´aximo ap´os a inspira¸c˜ao m´axima, medido em litros por minuto. Cada crian¸ca tinha o seu aparelho e diariamente, excluindo os finais de semana, feriados e recessos escolares, eram coletadas trˆes medidas consecutivas do PFE. Na an´alise dos dados foi utilizada como vari´avel resposta o valor m´aximo das 3 medi¸c˜oes. Quando o estudante faltava a escola no dia, seu exame n˜ao era realizado. A tabela 22 ,no Anexo A, mostra a frequˆencia de estudantes com exame realizado por dia.
Do question´ario respondido pelos pais, neste trabalho foram usados os m´odulos sobre asma e sobre exposi¸c˜ao ao fumo no domic´ılio. Na avalia¸c˜ao da asma foi usado o ques-tion´ario padronizado referente a fase I do International Study of Asthma and Allergies in Childhood (ISAAC). Este instrumento possui 8 perguntas referentes ao sintoma da asma [15] e ´e usado para classificar as crian¸cas como asm´aticas e n˜ao asm´aticas.
Quanto aos dados meteorol´ogicos foram inclu´ıdas nas an´alises as vari´aveis referentes `
a temperatura e umidade. E para a exposi¸c˜ao `a polui¸c˜ao atmosf´erica foi utilizada a informa¸c˜ao dos n´ıveis de PM10.
3.3
Modelo de Regress˜
ao Linear
O Modelo de Regress˜ao Linear (MRL), consiste na realiza¸c˜ao de uma an´alise es-tat´ıstica com a finalidade de estabelecer a rela¸c˜ao entre uma vari´avel dependente e um conjunto de vari´aveis explicativas. Quando essa rela¸c˜ao ´e feita com apenas uma vari´avel explicativa o MRL tamb´em ´e chamado de Modelo de Regress˜ao Linear Simples (MRLS), e quando essa rela¸c˜ao ´e feita com duas ou mais vari´aveis explicativas ´e chamado tamb´em de Modelo de Regress˜ao Linear M´ultiplo (MRLM). Como mostrado a seguir [16],
yi = β0+ β1x1i+ ei (3.1)
yi = β0+ β1x1i+ β2x2i+ . . . + βkxki+ ei (3.2)
Onde a equa¸c˜ao 3.1 representa o MRLS e a equa¸c˜ao 3.2 representa o MRLM e ei ´e
um erro aleat´orio.
Uma forma alternativa, e mais geral, de representar o MRL tanto simples quanto o m´ultiplo ´e utilizar a forma matricial. Como mostrado a seguir,
y = Xβ + e (3.3) Onde, y = y1 y2 .. . yn n×1 ; X = 1 x11 x21 . . . xk1 1 x12 x22 . . . xk2 .. . ... ... . .. ... 1 x1n x2n . . . xkn n×k+1 ; β = β0 β1 .. . βk k+1×1 ; e = e1 e2 .. . en n×1
Note que a matriz X ´e composta pela primeira coluna apenas de 10s e nas demais colunas pelas vari´aveis x1, x2, . . . , xk.
3.3.1
Hip´
oteses do MRL
Assim como muitas t´ecnicas estat´ısticas, o MRL tamb´em necessita de algumas hip´oteses para que seja corretamente aplicado, s˜ao elas:
• E[ei] = 0 ou E[ei|x1i, x2i, . . . , xki] = 0 , i = 1, 2, . . . , n
• V ar[ei] = σ2 , i = 1, 2, . . . , n (Homocedasticidade)
• Cov[ei, ej] = 0 , ∀i 6= j (Independˆencia)
• O termo al´eat´orio ei possui distribui¸c˜ao Normal.
Neste conjunto de hip´oteses do MRL, a primeira hip´otese garante estimativas n˜ao viesadas para β. A segunda e a terceira hip´otese garantem que os erros padr˜oes das estimativas estejam corretas. A inclus˜ao da quarta hip´otese garante tamb´em que cada
componente do estimador de β possui distribui¸c˜ao Normal, neste caso o MRL recebe um nome especial, passa a ser denominado Modelo de Regress˜ao Linear Cl´assico.
3.3.2
Estima¸
c˜
ao do Modelo
Sob as hip´oteses do MRL podemos encontrar boas estimativas para β, utilizando dife-rentes m´etodos de estima¸c˜ao, como por exemplo M´ınimos Quadrados Ordin´arios (MQO) ou M´axima Verossimilhan¸ca (MV). Estes m´etodos resultam no mesmo estimador, que pos-sui ´otimas propriedades e ´e chamado de Melhor Estimador Linear N˜ao Viesado (MELNV), ou seja, dentre os estimadores lineares e n˜ao viesados para β ´e o que possui a menor variˆancia. O estimador ´e dado a seguir:
ˆ
β = (X0X)−1X0y (3.4)
Note que, na estima¸c˜ao por MQO ´e necess´ario apenas as trˆes primeiras hip´oteses do MRL para que o estimador seja n˜ao viesado, j´a pela estima¸c˜ao por MV ´e necess´ario incluir a hip´otese de Normalidade dos termos de erro.
Al´em disso, a variˆancia do estimador ˆβ ´e dada por:
V ar( ˆβ) = σ2(X0X)−1 (3.5)
A partir da estima¸c˜ao do vetor β, pode-se estimar valores para a vari´avel dependente, apenas substituindo as estimativas encontradas no modelo. Como mostrado abaixo:
ˆ
y = X ˆβ (3.6)
Dessa forma, pode-se fazer previs˜ao de um novo indiv´ıduo incluido na amostra.
3.3.3
Intervalo de Confian¸
ca e Teste de Hip´
oteses para β
T´ecnicas bastante aplicadas em v´arias an´alises estat´ısticas, tanto o Intervalo de Con-fian¸ca quanto o Teste de Hip´oteses, tamb´em s˜ao utilizadas no MRL para analisar o com-portamento de β.
seja, ˆ βj ∼ N βj, σ2(X0X)−1(j+1)(j+1) (3.7)
Onde σ2(X0X)−1(j+1)(j+1)´e o elemento j+1 da diagonal principal da matriz de variˆancias e covariˆancias de ˆβ.
Na pr´atica, a matriz de variˆancias e covariˆancias de ˆβ n˜ao ´e conhecida, portanto ´e preciso estim´a-la.
Estima-se a matriz de variˆancias e covariˆancias de ˆβ por:
d V ar( ˆβ) = S2(X0X)−1 (3.8) Onde, S2 = n X i=1 (ˆyi− yi)2 n − k − 1 (3.9)
Para construir Intervalos de Confian¸ca e Testes de Hip´oteses para βj usa-se a seguinte
quantidade: ˆ βj − βj q S2(XtX)−1 (j+1)(j+1) ∼ tn−k−1 (3.10)
Dessa maneira, o Intervalo de Confian¸ca ´e dado por:
IC(1−α)%(βj) =h ˆβj− t(n−k−1),α2 q S2(X0X)−1 (j+1)(j+1); ˆβj + t(n−k−1),α2 q S2(X0X)−1 (j+1)(j+1) i (3.11) Al´em disso, Testes de Hip´oteses da seguinte forma H0 : βj = βj∗ contra H1 : βj 6= βj∗
s˜ao bastante utilizados. E sua regra de decis˜ao ´e dada abaixo,
• Se |t∗| ≥ t
• Se |t∗| < t (n−k−1),α 2 n˜ao rejeita-se H0 Onde, t∗ = ˆ βj − βj∗ q S2(X0X)−1 (j+1)(j+1) (3.12)
Um caso particular e muito usado no contexto de MRL, ´e quando se quer testar H0 : βj = 0 contra H1 : βj 6= 0, desta maneira o objetivo ´e testar a significˆancia das
vari´aveis e intercepto do modelo.
3.3.4
An´
alise de Res´ıduos
A An´alise de Res´ıduos ´e um procedimento fundamental em um MRL, pois a partir dessa an´alise pode-se verificar se algumas hip´oteses do modelo realmente s˜ao satisfeitas, como Normalidade e Homocedasticidade dos termos de erro. Assim ´e poss´ıvel afirmar se o modelo estimado ´e v´alido ou n˜ao.
Os Res´ıduos de um MRL s˜ao obtidos pela diferen¸ca entre a vari´avel dependente esti-mada e observada. Assim, os Res´ıduos s˜ao definidos como:
ˆ
ei = ˆyi− yi (3.13)
Para verificar a hip´otese de normalidade do termo de erros, utiliza-se gr´aficos, como Histrograma dos Res´ıduos e Quantil-Quantil, al´em de Testes de Aderˆencia, como Shapiro ou Kolmogorov-Smirnov. Caso essa hip´otese n˜ao seja satisfeita, n˜ao se pode afirmar que os ˆβj0s sigam distribui¸c˜ao Normal, o que invalidaria os Intervalos de Confian¸ca e os Testes de Hip´oteses apresentados em 3.11 e 3.12.
Para verificar a hip´otese de homocedasticidade dos termos de erro (σ12 = σ22 = . . . = σ2
n), utiliza-se gr´aficos, como Res´ıduos contra Valor Estimado e espera-se que n˜ao haja
ne-nhum padr˜ao nesse gr´afico. Tamb´em ´e utilizado Teste de Hip´oteses, como Breusch-Pagan para verificar a hip´otese de homocedasticidade. Caso essa hip´otese n˜ao seja satisfeita, a matriz de variˆancias e covariˆancias do vetor β n˜ao ser´a, simplesmente, σ2(XtX)−1 e ter´a uma forma mais complexa, o que invalidaria os Intervalos de Confian¸ca e os Testes de Hip´oteses apresentados em 3.11 e 3.12.
Neste projeto de final de curso ser˜ao estimados modelos hier´arquicos lineares com dois n´ıveis, onde o primeiro n´ıvel est´a relacionado aos dias de acompanhamento e o segundo n´ıvel tem rela¸c˜ao com as crian¸cas, e a vari´avel dependente do estudo ser´a o pico de fluxo expirat´orio.
Na modelagem hier´arquica linear, cada um dos n´ıveis de estrutura dos dados ´e re-presentado por um submodelo e apresentam uma ideia de que os sujeitos dentro de um mesmo grupo tendem a ser homogˆeneos. Uma vantagem dessa t´ecnica ´e que n˜ao requer que a estrutura dos dados seja balanceada, ou seja, pode haver n´umero de observa¸c˜oes diferentes em cada unidade de n´ıvel superior.
As estruturas hier´arquicas mais simples que existem s˜ao aquelas com 2 n´ıveis, por exemplo alunos de uma escola sendo acompanhado durante alguns dias. Dessa maneira ´e poss´ıvel tra¸car dois tipos de desenhos: Balanceados, onde todas as unidades de n´ıvel 2 possuem a mesma quantidade de unidades de n´ıvel 1; e Desbalanceados, onde as unidades de n´ıvel 2 possuem diferentes quantidades de unidades de n´ıvel 1, como mostrado a seguir nas Tabelas 2 e 3 [17].
Tabela 2: Exemplo de Dados Balanceados
Aluno1 Aluno2 ... AlunoJ
Dia1 Dia2 ... DiaN Dia1 Dia2 ... DiaN ... Dia1 Dia2 ... DiaN
Tabela 3: Exemplo de Dados Desbalanceados
Aluno1 Aluno2 ... AlunoJ
Dia1 Dia2 ... DiaN1 Dia1 Dia2 ... DiaN2 ... Dia1 Dia2 ... DiaNJ
Modelos hier´arquicos lineares s˜ao muito utilizados para an´alise de medidas repetidas ou dados longitudinais, sendo bastante utilizados em estudos biol´ogicos e ciˆencias medici-nais. Uma das vantagens de trabalhar com este tipo de modelo ´e a flexibilidade a dados com estrutura desbalanceada, muito comum em estudos longitudinais [18].
Neste trabalho, o conjunto de dados possui estrutura de dados desbalanceada e n´ıveis de hierarquia da seguinte forma:
Aluno1 Aluno2 ... AlunoJ
3.4.1
Modelos lineares hier´
arquicos de dois n´ıveis
Esses Modelos disp˜oem de uma estrutura de an´alise que permite serem reconhecidos os diferentes n´ıveis em que se articulam os dados, onde cada subn´ıvel possui seu pr´oprio modelo. Cada um dos submodelos mostra a rela¸c˜ao entre as vari´aveis dentro de algum n´ıvel e especifica como as vari´aveis deste n´ıvel influenciam as rela¸c˜oes que se estabelecem em outros n´ıveis. Em compara¸c˜ao ao modelo de regress˜ao cl´assico, aqui n˜ao ´e necess´ario estimar um modelo para cada unidade de n´ıvel 2, o que n˜ao ´e nada pr´atico dependendo da quantidade de unidades de n´ıvel 2.
Para o problema deste trabalho, as unidades de primeiro n´ıvel s˜ao as medidas repetidas diariamente e as unidades de segundo n´ıvel s˜ao as crian¸cas e adolescentes.
Assim, um modo de formalizar o Modelo Linear Hier´arquico de dois n´ıveis, partindo de uma forma mais simples com apenas o intercepto e a inclin¸c˜ao ´e:
yij = β0j + β1jX1tj+ etj, etj ∼ N (0, σ2) (3.14)
onde,
t refere-se as unidades de n´ıvel 1 (Dias) t = 1, . . . , nj e j refere-se as unidades de n´ıvel
2 (Crian¸cas) j = 1, . . . , 260
β0j e β1j s˜ao coeficientes aleat´orios da forma:
β0j = γ0+ u0j β1j = γ1+ u1j (3.15)
Em que γ0 e γ1 s˜ao os coeficientes de n´ıvel 2 e u0j e u1j s˜ao os termos aleat´orios, tais
que urj ∼ N (0, σr2). Al´em disso,
E(urj) = 0
V ar(u0j) = σ02
V ar(u1j) = σ12
Cov(u0j, u1j) = σ01
Ent˜ao yij pode ser expresso como uma soma de partes fixas e aleat´orias.
quatro parˆametros (σ0, σ1, σ01, σ ). Estes ´ultimos chamados de parˆametros aleat´orios.
Tomando-se o exemplo com os dias de observa¸c˜ao no n´ıvel 1 e os alunos no n´ıvel 2, e considerando apenas σ2
0 e σ2 como parˆametros aleat´orios, desta forma a correla¸c˜ao entre
dois dias de um mesmo aluno ´e dada por:
ρI = σ2 0 σ2 0 + σ2 (3.17) Onde ρI ´e chamado de correla¸c˜ao intraclasse do n´ıvel 2, que mede a propor¸c˜ao da
variˆancia total que ´e devida ao n´ıvel 1 e ao n´ıvel 2. Se essa correla¸c˜ao for diferente de zero, devido a presen¸ca de mais de um termo residual, o procedimento de estima¸c˜ao por M´ınimos Quadrados Ordin´arios (MQO) n˜ao ´e aplic´avel.
A matriz de variˆancias e covariˆancias de y para n dias para uma crian¸ca ´e dada por:
σ2 0 + σ2 σ02 . . . σ20 σ02 σ02+ σ2 . . . σ20 .. . ... . .. ... σ2 0 σ02 . . . σ02+ σ2 n×n
A matriz de variˆancias e covariˆancias de y dos dias de duas crian¸cas diferentes, sendo que a primeira possui n dias e a segunda possui m dias:
"
A 0
0 B
#
(m+n)×(m+n)
Onde A ´e a matriz de variˆancias e covariˆancias dos erros da primeira crian¸ca e B ´e a matriz de variˆancias e covariˆancias dos erros da segunda crian¸ca. Essa matriz bloco diagonal se d´a pelo fato de que os dias para diferentes crian¸cas possuem covariˆancia nula. Uma maneira mais compacta de representar a matriz acima seria da seguinte forma,
V = " σu02 Jn×n+ σ2In×n 0 0 σ2 0Jm×m+ σ2Im×m # (m+n)×(m+n)
Formalmente o modelo ´e expressado como: ytj = β0+ Q P q=1 βqxqtj+ u0j + R P r=1 urjxrtj + etj ytj = β0j+ R P r=1 βrjxrtj+ Q P q=1 βqxqtj+ etj y = Xβ + Zu + σ2I | {z } V Onde:
• βrj(r = 0, 1, . . . , R) s˜ao coeficientes aleat´orios da forma βrj = βr+ urj;
• βq(q = 1, 2, . . . , Q) s˜ao coeficientes fixos.
• xqtj ´e a vari´avel preditora q do dia t para a crian¸ca j;
• etj ´e o efeito aleat´orio do n´ıvel 1 (Dias);
• σ2 ´e a variˆancia de e tj
• urj ´e o efeito aleat´orio do n´ıvel 2 (Crian¸cas);
• σ2
r ´e a variˆancia de urj
Neste trabalho ser˜ao utilizadas medidas repetidas, ou seja, vari´aveis que variam no tempo e tamb´em vari´aveis que s˜ao invariantes no tempo. As vari´aveis de variam no tempo ser˜ao consideradas efeitos aleat´orios, desta forma tendo coeficientes distintos para cada crian¸ca, as vari´aveis que n˜ao variam no tempo ser˜ao consideradas efeitos fixos, assim haver´a um ´unico coeficiente para todas as crian¸cas.
O banco de dados com as informa¸c˜oes dos alunos de Rio Branco possui estrutura hier´arquica com 2 n´ıveis. No n´ıvel 1 est˜ao os dias, as vari´aveis que pertencem a este n´ıvel, e ser˜ao usadas neste estudo foram as seguintes medidas: Pico de Fluxo Expirat´orio, Temperatura, Umidade e Polui¸c˜ao (PM10). No n´ıvel 2 est˜ao as 260 crian¸cas, as vari´aveis
Figura 1: Modelo Te´orico
Modelo Te´orico Modelo n´ıvel 1
P F Eij =β0j + β1jT emperaturai+ β2jU midadei+ β3jP olui¸c˜aoi+ β4Asmaj
+ β5F umoj + β6P esoj+ β7Alturaj+ β8Idadej+ β9Sexoj + ρei−1j+ aij
Modelo n´ıvel 2
βrj = βr+ urj
3.4.2
Hip´
oteses do Modelo Linear Hier´
arquico
• Cov(urj, eij) = 0, j = 1, . . . , 260, i = 1, . . . , nj, r = 0, . . . , R;
• E(eij|x1ij, . . . , xQij) = 0, j = 1, . . . , 260, i = 1, . . . , nj;
• E(urj|x1ij, . . . , xQij) = 0, r = 0, . . . , R;
• eij possui distribui¸c˜ao normal com variˆancia constante;
• O vetor (u0j, . . . , uRj)tpossui distribui¸c˜ao normal multivariada com matriz de variˆancias
3.4.3
Estima¸
c˜
ao do Modelo
A Estima¸c˜ao do Modelo Linear Hier´arquico pode se tornar bastante trabalhosa de-pendendo de algumas circunstˆancias. Se a matriz V =
R
P
r=0
ZrZtrσr2 + σ2I ´e conhecida
ent˜ao a estima¸c˜ao por M´axima Verossimilhan¸ca ´e obtida da seguinte maneira: Supondo y normalmente distribu´ıdo.
y ∼ N (Xβ, V ) (3.18)
Desta forma o log da fun¸c˜ao de verossimilhan¸ca ´e dado por:
l = −1 2(y − µ) t V−1(y − µ) − 1 2log|V | − N 2 log(2π) (3.19) Seja µ = Xβ e β = θ. ∂l ∂θ = ∂µt ∂θ V −1(y − µ) (3.20)
Igualando a equa¸c˜ao 3.20 a 0, com β = ˆβ tem-se:
XtV−1X ˆβ = XtV−1y ⇒ ˆβ = (XtV−1X)−1XtV−1y (3.21) Assim V ar( ˆβ) = (XtV−1X)−1XtV−1V ar(y)V−1X[(XtV−1X)−1]t (3.22) V ar( ˆβ) = (XtV−1X)−1XtV−1V V−1X[(XtV−1X)−1]t (3.23) V ar( ˆβ) = (XtV−1X)−1XtV−1X[(XtV−1X)−1]t (3.24) V ar( ˆβ) = (XtV−1X)−1 (3.25)
Por´em, na pr´atica a matriz V raramente ´e conhecida, dessa maneira n˜ao ´e poss´ıvel calcular estimativas para β diretamente, neste caso a fun¸c˜ao de verossimilhan¸ca deve
de 3.21 substituindo V por ˆV , assim independentemente de ˆV , o estimador de m´axima verossimilhan¸ca para β ser´a:
ˆ
β = (XtVˆ−1X)−1XtVˆ−1y (3.26)
Seja µ = Xβ e V = V (σ2)
As equa¸c˜oes de m´axima verossimilhan¸ca de V s˜ao encontradas igualando a seguinte express˜ao a 0. ∂l ∂σ2 r = −1 2 tr V−1∂V ∂σ2 r − (y − Xβ)tV−1∂V ∂σ2 r V−1(y − Xβ) (3.27) ent˜ao ∂V ∂σ2 r = ∂ R P r=0 ZrZtrσr2 ∂σ2 r = ZrZtr e fazendo ∂l ∂σ2 r = 0 para r = 0, 1, . . . , R . tr V−1ZrZtr = (y − Xβ) tV−1 ZrZtrV −1 (y − Xβ) (3.28)
O lado direito da equa¸c˜ao 3.28 envolve Xβ e V , de alguma forma as equa¸c˜oes devem ser resolvidas numericamente. Uma das sa´ıdas para solucionar este problema ´e a utiliza¸c˜ao de um algoritmo iterativo chamado de ”Expected Maximization” que tem por objetivo calcular estimadores de m´axima verossimilhan¸ca ou m´axima verossimilhan¸ca restrita. A ideia deste m´etodo ´e alternar entre o c´alculo de valores esperados condicionais e maximizar verossimilhan¸cas simplificadas.
O algoritmo para m´axima verossimilhan¸ca restrita ´e dado a seguir, Seja ˆP = ˆV−1− ˆV−1X(XtVˆ−1X)−1XtVˆ−1 e q
r igual a dimens˜ao de ur
Passo 1. Inicie m = 0 e dˆe valores iniciais para β(0) e σ2(0)
r para r = 0, 1, . . . , R. Passo 2. Calcule Xβ(m+1) = Xβ(m)+ σ2(m)X(XtX)−1XtV−1(m)(y − Xβ(m)) (3.29) σr2(m+1)= σ2(m)+ σ 4(m) qr h ytPˆ(m)ZrZtrPˆ (m)y − tr(Zt rPˆ (m)Z r) i (3.30)
Passo 3. Se a convergˆencia ´e obtida, defina X ˆβ = Xβ(m+1) e ˆσi2 = σi2(m+1). Caso contr´ario incremente m em uma unidade e volte para o passo 2.
3.4.4
An´
alise de Res´ıduos
Assim como os Modelos de Regress˜ao Linear, os modelos Modelos Lineares Hier´arquicos possuem um conjunto de suposi¸c˜oes. Caso essas suposi¸c˜oes n˜ao sejam satisfeitas, os pro-cedimentos para estimar e testar os coeficientes da regress˜ao podem ser inv´alidos.
Para checar as suposi¸c˜oes, as seguintes quest˜oes devem ser avaliadas[18]:
1. A parte fixa cont´em as vari´aveis corretas? 2. A parte aleat´oria cont´em as vari´aveis corretas? 3. Termo de Erro Normalmente distribu´ıdos? 4. Termos de Erro Homoced´asticos?
5. Efeitos Aleat´orios Normalmente Distribu´ıdos?
6. Efeitos Aleat´orios possuem matriz de covariˆancia constante?
As quest˜oes 1 e 2 est˜ao relacionadas a especifica¸c˜ao do modelo, e trata-se da sele¸c˜ao de vari´aveis explicativas que ir˜ao compor as parcelas fixas e aleat´orias do modelo. A especifica¸c˜ao do modelo ´e umas das partes mais dif´ıceis da inferˆencia estat´ıstica. No contexto do MRL esta tarefa n˜ao ´e f´acil, no caso dos Modelos Lineares Hier´arquicos a dificuldade ´e ainda maior devido a parte aleat´oria do modelo, a especifica¸c˜ao errada em algum dos n´ıveis pode afetar as estimativas dos coeficientes e desvios padr˜oes do outro n´ıvel. A natureza complicada dos Modelos Lineares Hier´arquicos implica que n˜ao h´a regras claras ou fixas para a especifica¸c˜ao do modelo. Desta maneira ´e necess´ario algum conhecimento pr´evio do problema e da teoria existente. Em muitos casos n˜ao h´a apenas uma especifica¸c˜ao correta, e diferentes pontos de vista podem chegar a representa¸c˜oes v´alidas. Estas duas suposi¸c˜oes podem ser avaliadas por meio de gr´aficos dos dados e res´ıduos.
As quest˜oes 3 e 4 s˜ao relacionadas ao primeiro n´ıvel do modelo linear hier´arquico, a Hip´otese de Normalidade pode ser verificada, graficamente, por meio de qqnorm onde quanto mais pr´oximo os valores observados est˜ao da reta maior a evidˆencia de Norma-lidade. A Heterocedasticidade pode ser investigada atrav´es de boxplots dos res´ıduos por
ser necess´aria a modelagem da mesma, por meio de fun¸c˜oes de variˆancia. Em ambos os casos testes de hip´oteses podem ser usados para verificar as suposi¸c˜oes, por´em gr´aficos de diagn´osticos s˜ao suficiente para concluir a an´alise.
As quest˜oes 5 e 6 s˜ao referentes ao segundo n´ıvel do modelo linear hier´arquico, a Hip´otese de Normalidade marginal dos efeitos aleat´orios, assim como no primeiro n´ıvel, pode ser verificada por meio do qqnorm. A Heterocedasticidade da matriz de variˆancias e covariˆancias do efeito aleat´orio pode ser verificada a partir de gr´aficos de dispers˜ao dos efeitos alet´orios por n´ıveis dos fatores.
3.5
Modelo Polinomial de Defasagem Distribu´ıda
´
E coerente supor que o efeito causado pela polui¸c˜ao no Pico de Fluxo Expirat´orio n˜ao ocorre devido apenas a exposi¸c˜ao do poluente em um ´unico dia, e sim a exposi¸c˜ao ao longo de v´arios dias. Por´em incluir defasagens da polui¸c˜ao diretamente no modelo resultaria em problemas na estima¸c˜ao, pois ´e esperado as defasagens sejam altamente correlacionadas. Uma maneira de contornar esta adversidade ´e a utiliza¸c˜ao do Modelo Polinomial de Defasagem Distribu´ıda, onde ´e poss´ıvel estimar o efeito acumulado da polui¸c˜ao.
O Modelo Polinomial de Defasagem Distribu´ıda possui o seguinte aspecto:
Yt = α + covariaveis + β0Xt+ β1Xt−1+ . . . + βqXt−q+ et, (3.31)
onde q ´e o n´umero de defasagens. Seja wi = βi q P j=0 βj
, i = 1, . . . , q, o peso de cada defasagem da polui¸c˜ao e
q
P
i=0
wi = 1.
Desta forma a equa¸c˜ao 3.32 pode ser reescrita como,
Yt = α + covariaveis + βg(w0Xt+ w1Xt−1+ . . . + wqXt−q) + et, (3.32) onde βg = q P j=0 βj.
βg ´e o efeito global da polui¸c˜ao para q defasagens da polui¸c˜ao, e pode ser interpretado
ponderada (w0Xt+ w1Xt−1+ . . . + wqXt−q) de q + 1 dias.
Para evitar o problema da colinearidade das defasagens da polui¸c˜ao, reescreve-se os coeficientes βi da seguinte maneira:
βi = d
X
k=0
ηkik, (3.33)
onde d ´e o grau do polinˆomio.
Considerando um exemplo com 3 defasagens (q=3) e uma fun¸c˜ao polinomial de grau 2 (d =2) ent˜ao,
β0 = η0
β1 = η0+ η1+ η2
β2 = η0+ 2η1+ 4η2
β3 = η0+ 3η1+ 9η2
Ap´os a reparametriza¸c˜ao e alterando a nota¸c˜ao de forma conveniente tal que Z0 =
Xt, Z1 = Xt−1, . . . , Zq= Xt−q tem-se Yt= α+covariaveis+η0Z0+ d X k=0 ηk ! Z1+ d X k=0 ηk2k ! Z2+. . .+ d X k=0 ηkqk ! Zq, (3.34) ou ainda Yt = α + covariaveis + η0 q X k=0 Zk+ η1 q X k=0 kZk+ . . . + ηd q X k=0 kdZk, (3.35)
Considerando o modelo (3.35) define-se novas vari´aveis a por meio da seguinte trans-forma¸c˜ao: W0 = q P k=0 Zk, W1 = q P k=0 kZk, . . . , Wd= q P k=0 kdZ k
Desta maneira o seguinte modelo estime-se o modelo:
Yt = α + covariaveis + η0W0+ η1W1+ . . . + ηdWd (3.36)
e a partir deste modelo encontra-se os βiestimados assim como seus respectivos desvios
No contexto de Modelos Lineares Hier´arquicos a hip´otese de variˆancia constante do termo de erro eij pode ser relaxada, substituindo por uma hip´otese mais fraca de modo
que essa variˆancia possa depender de forma linear ou quadr´atica de vari´aveis explicativas [18]. A fun¸c˜ao de variˆancia ´e utilizada para modelar a heterocestaticidade dentro dos grupos, neste trabalho crian¸cas, usando covari´aveis.
A fun¸c˜ao de variˆancia para os erros dentro dos grupos ´e definida por[19]:
V ar(ij|b e i) = σ2g(µij, v e ij, δ e ), i = 1, . . . , N, j = 1, . . . , ni, (3.37) onde µij = E[yij|b e i], v e
ij ´e o vetor de variˆancia de covariaveis, δ
e ´
e o vetor de parˆametros de variˆancia e g ´e uma fun¸c˜ao cont´ınua em δ
e .
Existem diversos tipos de fun¸c˜oes de variˆancia, neste trabalho ser´a usada a fun¸c˜ao de variˆancia estratificada. Esta classe representa um modelo com diferentes variˆancias para cada n´ıvel da vari´avel de estratifica¸c˜ao.
Suponha que S seja a vari´avel de estratifica¸c˜ao podendo assumir valores no conjunto {1, 2, . . . , s}, neste caso o modelo possui a seguinte forma:
V ar(ij) = σ2δSij, (3.38)
sendo a fun¸c˜ao de variˆancia g(Sij, δ
e
) = δSij.
O modelo da variˆancia (3.38) possui s + 1 parˆametros para representar s variˆancias. Para evitar problemas com identificabilidade do modelo ´e feita uma restri¸c˜ao definindo o primeiro estrato como sendo a referˆencia de modo que δ1 = 1, ent˜ao δl para l = 2, 3, . . . , s
representa a raz˜ao entre os desvios padr˜oes dos erros do l-´esimo estrato para o primeiro estrato. Por constru¸c˜ao δl> 0, l = 2, 3, . . . s.
3.7
Autocorrela¸
c˜
ao dos Res´ıduos
Em um estudo longitudinal, a suposi¸c˜ao de que os erros eij s˜ao independentes
pela autocorrela¸c˜ao de primeira ordem[18],
ei+1j = ρeij + ai+1j i ≥ 1, (3.39)
onde as var´ıaveis aij s˜ao independentes e identicamente distribu´ıdas e E(aij) = 0.
O parˆametro ρ ´e chamado de coeficiente de autocorrela¸c˜ao. Este modelo apresenta a dependˆencia entre observa¸c˜oes adjacentes, esta dependˆencia ´e fun¸c˜ao apenas da distˆancia entre as observa¸c˜oes e reduz a medida que as observa¸c˜oes se afastam. A correla¸c˜ao entre os res´ıduos ´e dado por:
ρ(eij, ei0j) = ρ|i−i 0|
(3.40) O AR(1), como ´e denotado o modelo autoregressivo de ordem 1, ´e modelo mais simples e um dos mais usados[19].
4
An´
alise dos Resultados
4.1
An´
alise descritiva
Nesta sess˜ao ser˜ao apresentadas estat´ısticas e gr´aficos das vari´aveis medidas diari-amente e das caracter´ısticas individuais das crian¸cas, com o objetivo de explora-las e verificar poss´ıveis padr˜oes.
4.1.1
Vari´
aveis Relacionadas ao Dia
Tabela 4: Resumo das vari´aveis relacionadas ao Dia
Vari´avel M´edia Mediana Desvio Padr˜ao M´ınimo M´aximo Q3 - Q1
Temperatura 28,41 28,50 2,01 21,70 31,70 2,70
Umidade Relativa 68,94 68,90 8,39 48,40 86,00 12,6
Polui¸c˜ao 39,72 36,25 16,75 17,18 97,00 18,04
PFE 274,60 260,00 92,91 50,00 650,00 150,00
A Tabela 4 e a Figura 2 apresentam, de forma resumida, as distribui¸c˜oes das vari´aveis medidas diariamente. A vari´avel Temperatura possui m´edia igual 28,41oC e desvio padr˜ao igual a 2,01oC a sua distribui¸c˜ao apresentou mediana na ordem de 28,50oC, primeiro e
terceiro quartis iguais a 27,40oC e 30,10oC, respectivamente. A vari´avel Umidade Relativa
possui m´edia igual a 68,98% e desvio padr˜ao igual a 8,39% a sua distribui¸c˜ao apresentou mediana na ordem de 68,90%, primeiro e terceiro quartis iguais a 28,07% e 46,11%, respectivamente. A vari´avel Umidade Relativa possui m´edia igual a 68,98% e desvio padr˜ao igual a 8,39% a sua distribui¸c˜ao apresentou mediana na ordem de 68,90%, e primeiro e terceiro quartis iguais a 62,10% e 74,70%, respectivamente. A vari´avel Polui¸c˜ao apresentou n´ıvel m´edio igual a 39,72 e desvio padr˜ao igual a 16,75 a sua distribui¸c˜ao possui mediana na ordem de 36,25, primeiro e terceiro quartis iguais a 28,07 e 46,11, respectivamente. O PFE apresentou m´edia igual a 274,60l/min e desvio padr˜ao igual a 92,91l/min a sua distribui¸c˜ao possui mediana na ordem de 260,00l/min, e primeiro e terceiro quartis iguais a 200,00l/min e 350,00l/min, respectivamente.
Figura 3: S´eries Temporais vari´aveis das Temperatura e Polui¸c˜ao
dade relativa com a polui¸c˜ao. Graficamente, as s´eries da temperatura e polui¸c˜ao n˜ao aparentam ter alguma rela¸c˜ao, pois n˜ao ´e observado nenhum tipo de padr˜ao que indique este fato. As s´eries da umidade relativa e polui¸c˜ao parecem estar relacionadas de modo que a medida em que s˜ao observado valores mais altos da umidade relativa s˜ao observados valores mais baixos de n´ıveis de polui¸c˜ao, e vice-versa.
Figura 5: Boxplot Pico de Fluxo Expirat´orio segundo algumas caracter´ısticas
Na Figura 4.1.1 s˜ao apresentados o PFE segundo algumas caracter´ısticas das crian¸cas. Na primeira compara¸c˜ao entre os boxplot parece haver maior variabilidade nos PFE no grupo dos N˜ao Asm´aticos se comparado aos Asm´aticos, os N˜ao Asm´aticos apresenta-ram mediana igual a 270 l/min e quanto os Asm´aticos apresentaram mediana igual a 250 l/min. Na segunda as crian¸cas que N˜ao s˜ao Fumantes Passivas apresentaram uma mediana menor do que o grupo que s˜ao Fumantes Passivos, 250 l/min e 290 l/min res-pectivamente. Na terceira percebe-se uma grande diferen¸ca entre todas as faixas de idade, crian¸cas com idade entre 6 e 9 anos apresentaram mediana igual a 190 l/min, j´a a que est˜ao na faixa entre 10 a 12 anos apresentaram uma mediana de 280 l/min e a ultima faixa et´aria que vai de 13 a 15 anos apresentou uma mediana na ordem de 350 l/min.
Graficamente, na ultima compara¸c˜ao n˜ao h´a muita diferen¸ca no PFE segundo o Sexo, as crian¸cas do sexo Feminino apresentaram uma mediana de 270 l/min enquanto as do sexo Masculino foi igual a 260 l/min.
Figura 6: Pico de Fluxo Expirat´orio ajustado pelo Tempo
A Figura 8 apresenta a s´erie do PFE de cada crian¸ca ajustada por uma spline c´ubica, observa-se que algumas crian¸cas apresentaram valores de PFE muito acima das demais e algumas crian¸cas tamb´em apresentaram PFE abaixo da maioria das crian¸cas. No Anexo A foi ilustrado a s´erie do PFE de cada crian¸ca ajustado por uma tendˆencia linear.
4.1.2
Vari´
aveis Relacionadas as Crian¸
cas
Tabela 5: Resumo das vari´aveis Quantitativas relacionadas as Crian¸cas Vari´avel M´edia Mediana Desvio Pard˜ao M´ınimo M´aximo Q3-Q1
Idade 10,06 11,00 2,42 6,00 15,00 4,00
Altura 141,80 141,00 15,50 106,00 180,00 23,00
Figura 7: Boxplot das vari´aveis Idade, Altura e Peso
A Tabela 5 e a Figura 7 apresentam, de forma resumida, as distribui¸c˜oes das vari´aveis relacionadas as caracter´ısticas das crian¸cas. A m´edia de Idade das crian¸cas foi de 10,06 anos com desvio de 2,42 anos a distribui¸c˜ao da idade apresentou mediana na ordem de 11,00 anos, primeiro e terceiro quartis, respectivamente, iguais a 9,00 anos e 13 anos. A m´edia de Altura das crian¸cas foi de 141,80cm anos com desvio padr˜ao de 15,50cm a distribui¸c˜ao da idade apresentou mediana na ordem de 141,00cm, primeiro e terceiro quartis, respectivamente, iguais a 130,00cm e 153,00cm. A m´edia de Peso das crian¸cas foi de 35,26kg com desvio padr˜ao de 11,41kg a distribui¸c˜ao da idade apresentou mediana na ordem de 33,00kg, primeiro e terceiro quartis, respectivamente, iguais a 26,00kg e 43,00kg.
Tabela 6: Resumo das vari´aveis Qualitativas relacionadas as Crian¸cas
Sexo Fumo Domiciliar Ser Asm´atica
Masculino Feminino Omitiu Sim N˜ao Omitiu Sim N˜ao Omitiu
48,7% 49,8% 1,5% 33,7% 57,3% 9,0% 21,9% 70,3% 7,8%
A Tabela 6 mostra as propor¸c˜oes de algumas caracter´ısticas das crian¸cas na amostra. Em rela¸c˜ao ao sexo das crian¸cas, 48,7% (127) s˜ao do sexo masculino, 49,8% (129) s˜ao do sexo feminino e 1,5% (4) omitiram essa informa¸c˜ao. Sobre fumantes no domicilio,
33,7% (88) possuem fumantes no seu domicilio, 57,3% (149) n˜ao possuem fumantes em seu domic´ılio, 9,0% (23) omitiram a informa¸c˜ao. Em rela¸c˜ao a condi¸c˜ao de sa´ude, 21,9% (57) possuem asma, 70,3% (183) n˜ao possuem asma e 7,8% (20) omitiram a informa¸c˜ao.
Tabela 7: Tabela de Dupla entrada e Teste de Independˆencia Fumo Domiciliar
P-valor Sexo P-valor
Sim N˜ao Masculino Feminino
Ser Asm´atica Sim 75,6% 77,7% 0,8293 77,3% 75,2% 0,8075
N˜ao 24,4% 22,3% 22,7% 24,8%
Pela Tabela 7 observa-se que a propor¸c˜ao de Asm´aticos que possuem algum fu-mante em seu domic´ılio (75,6%) e os que n˜ao possuem indiv´ıduos que fumam (77,6%) s˜ao pr´oximos, o mesmo ocorre nos N˜ao Asm´aticos (24,4% e 22,3% respectivamente), o P-valor do teste Qui-Quadrado de Independˆencia (0,8293) indica que n˜ao h´a associa¸c˜ao entre a crian¸ca possuir Asma e haver indiv´ıduos que fumam em seu domic´ılio. Nesta mesma Tabela observa-se tamb´em que a propor¸c˜ao de Asm´aticos dos sexos Masculino (77,3%) e Feminino (75,2%) s˜ao pr´oximos, o que ocorre tamb´em entre os N˜ao Asm´aticos (22,7% e 24,8% respectivamente), o P-valor do teste Qui-Quadrado de Independˆencia (0,8075) indica que n˜ao h´a associa¸c˜ao entre a crian¸ca possuir Asma e o Sexo do indiv´ıduo.
4.2
Ajuste do Modelo B´
asico
Nesta sess˜ao ser˜ao apresentados o ajuste do modelo b´asico, ou seja, sem o ajuste da polui¸c˜ao, o ajuste da fun¸c˜ao de variˆancia e a verifica¸c˜ao das suposi¸c˜oes do modelo linear hier´arquico.
Inicialmente, ajustando o modelo nulo, foi observado um coeficiente de correla¸c˜ao intraclasse na ordem de 0, 8894, ou seja, 88, 94% da varia¸c˜ao do PFE ocorre devido a diferen¸ca entre as crian¸cas.
ˆ
β Erro Padr˜ao P-valor
(Intercepto) 265,3639 4,4217 <0,0001 (Tempo) 0,1411 0,0679 0,0378 (Tempo)2 0,0089 0,0060 0,1443 (Tempo a Direita)3 -0,0001 0,0001 0,6519 (Tempo a Esquerda)3 0,0004 0,0001 0,0113 (Temperatura) 0,3055 0,1319 0,0206 (Idade) 11,6332 2,5751 <0,0001 (Peso) 1,3860 0,4970 0,0057 (Altura) 2,1278 0,5242 0,001 (Fumo Domiciliar) 2,5993 5,5560 0,6403 (Sexo Masculino) 10,8403 5,3321 0,0431 (Asm´atico) -0,0353 6,2413 0,9955
A Tabela 8 apresenta os valores estimados e os respectivos desvios padr˜oes das esti-mativas al´em do P-valor do teste t-Student. Observa-se na coluna referente ao P-valor que alguns coeficientes estimados n˜ao s˜ao significativos ao n´ıvel de significˆancia de 5% ((Tempo)2, (Tempo a Direita)3, Fumo Domiciliar, Asm´atico), por´em segundo o teste de
Raz˜ao de Verossimilhan¸ca e o Crit´erio de Informa¸c˜ao de Akaike estas vari´aveis ajudam a melhorar o ajuste do modelo. Foi utilizado modelo autoregressivo de primeira ordem AR(1) para a corre¸c˜ao da autocorrela¸c˜ao serial dos termos de erro, o coeficiente de auto-correla¸c˜ao foi de 0, 2124.
Tabela 9: Efeitos Aleat´orios do Modelo B´asico
Desvio Padr˜ao M´ınimo M´aximo
(Intercepto) 45,2646 -109,2247 206,0061 (Tempo) 0,8874 -2,3036 2,9278 (Tempo)2 0,0645 -0,1555 0,1925 (Tempo a Direita)3 0,0018 -0,0047 0,0040 (Tempo a Esquerda)3 0,0019 -0,0045 0,0047 (Temperatura) 0,4059 -0,4330 0,2733 Res´ıduos 30,1637 -201,0648 164,3039
Na Tabela 19 s˜ao apresentados os desvios padr˜oes dos efeitos aleat´orios e os maiores e menores desvios dos coeficientes de cada crian¸cas em rela¸c˜ao ao coeficiente global estimado
pelo modelo , por exemplo o menor ˆβ0j observado foi de 265, 3639 − 109, 2247 = 159, 1392
e o maior foi na ordem de 265, 3639 + 206, 0061 = 471, 3700, e assim sucessivamente.
4.2.1
Fun¸
c˜
ao de Variˆ
ancia
Figura 8: Boxplot dos res´ıduos por Faixa Et´aria, Sexo e Asma
Legenda
1 6 a 9 anos, Sexo Feminino, N˜ao Asm´atico 7 6 a 9 anos, Sexo Feminino, Asm´atico 2 10 a 12 anos, Sexo Feminino, N˜ao Asm´atico 8 10 a 12 anos, Sexo Feminino, Asm´atico 3 13 a 15 anos, Sexo Feminino, N˜ao Asm´atico 9 13 a 15 anos, Sexo Feminino, Asm´atico 4 6 a 9 anos, Sexo Masculino, N˜ao Asm´atico 10 6 a 9 anos, Sexo Masculino, Asm´atico 5 10 a 12 anos, Sexo Masculino, N˜ao Asm´atico 11 10 a 12 anos, Sexo Masculino, Asm´atico 6 13 a 15 anos, Sexo Masculino, N˜ao Asm´atico 12 13 a 15 anos, Sexo Masculino, Asm´atico
Estrato ˆδ 6 a 9 anos, Sexo Feminino, N˜ao Asm´atico 0,76 10 a 12 anos, Sexo Feminino, N˜ao Asm´atico 0,88 13 a 15 anos, Sexo Feminino, N˜ao Asm´atico 1,11 6 a 9 anos, Sexo Masculino, N˜ao Asm´atico 0,72 10 a 12 anos, Sexo Masculino, N˜ao Asm´atico 0,90 13 a 15 anos, Sexo Masculino, N˜ao Asm´atico 1 1,00
6 a 9 anos, Sexo Feminino, Asm´atico 0,82
10 a 12 anos, Sexo Feminino, Asm´atico 1,12 13 a 15 anos, Sexo Feminino, Asm´atico 0,99 6 a 9 anos, Sexo Masculino, Asm´atico 0,73 10 a 12 anos, Sexo Masculino, Asm´atico 0,98 13 a 15 anos, Sexo Masculino, Asm´atico 1,05
Pela Figura 8 e pela Tabela 10 observa-se que existem diferentes variabilidades de res´ıduos segundo algumas caracter´ısticas das crian¸cas, isto justificaria o uso da Fun¸c˜ao de Variˆancia. Para o modelo b´asico a fun¸c˜ao de variˆancia estimada ´e dada por:
\
V ar(eij) =909, 62 × [0, 76 × I(Estrato 1) + 0, 88 × I(Estrato 2) + 1, 11 × I(Estrato 3)
+ 0, 72 × I(Estrato 4) + 0, 90 × I(Estrato 5) + 1, 00 × I(Estrato 6) + 0, 82 × I(Estrato 7) + 1, 12 × I(Estrato 8) + 0, 99 × I(Estrato 9) + 0, 73 × I(Estrato 10) + 0, 98 × I(Estrato 11) + 1, 05 × I(Estrato 12)]
onde I(.) ´e fun¸c˜ao indicadora, que toma valor 1 se j-´esima crian¸ca pertence ao es-trato e 0 caso o contr´ario. Desta maneira, uma crian¸ca que possui entre 6 a 9 anos, do sexo feminino e n˜ao possui asma apresenta variˆancia residual igual a 691,31, e assim sucessivamente.
4.2.2
An´
alise de Res´ıduos
Figura 9: Normalidade Multivariada dos Efeitos Aleat´orios
Figura 11: Normalidade dos Res´ıduos Padronizados
Na Figura 9 a suposi¸c˜ao de normalidade multivariada dos efeitos aleat´orios n˜ao parece satisfeita , na Figura 10 h´a evidˆencias de normalidade univariada dos efeitos aleat´orios em alguns casos, a ausˆencia de normalidade dos termos de erro tamb´em ´e observada a partir da Figura 11. Este fato pode comprometer algumas inferˆencias, por´em este problema j´a era previsto devido a complexidade do modelo.
A suposi¸c˜ao de Homocedasticidade dos efeitos aleat´orios parece ser satisfeita devido a semelhan¸ca no padr˜ao dos diagramas de dispers˜ao dos efeitos aleat´orios para os diferentes n´ıveis das vari´aveis sexo e asma, os diagramas encontram-se no Anexo C.
4.3
Efeitos Ajustados da Polui¸
c˜
ao
Nesta sess˜ao ser˜ao apresentados os efeitos do ajuste da polui¸c˜ao para o modelo linear hier´arquico pelos m´etodos Single Lag e PDLM.
4.3.1
Single Lag
\
P F Eij =266, 193087 + 0, 159050 × T empoi+ 0, 06888 × T empo2i − 0, 000044 × T empo 3 Di
+ 0, 000309 × T empo3Ei+ 0, 295918 × T emperaturai+ 12, 361712 × Idadej
+ 1, 355478 × P esoj+ 2, 107694 × Alturaj + 2, 286406 × I(F umoj)
+ 9, 868533 × I(SexoM ascj) − 0, 440937 × I(Asmaj) − 0, 011049 × P oluicao1i
Tabela 11: Desvio Padr˜ao dos Efeitos Aleat´orios
Intercepto T empo T empo2 T empo3
D T empo3E T emperatura Residuos
45, 308563 0, 926282 0, 068338 0, 001892 0, 001990 0, 150749 30, 075582
Defasado 2 dias
\
P F Eij =267, 657956 + 0, 171848 × T empoi+ 0, 001198 × T empo2i + 0, 000098 × T empo 3 Di
+ 0, 000145 × T empo3Ei+ 0, 459435 × T emperaturai+ 11, 994521 × Idadej
+ 1, 220199 × P esoj + 2, 249382 × Alturaj + 2, 601166 × I(F umoj)
+ 8, 485739 × I(SexoM ascj) − 2, 071406 × I(Asmaj) − 0, 061024 × P oluicao2i
Tabela 12: Desvio Padr˜ao dos Efeitos Aleat´orios
Intercepto T empo T empo2 T empo3
D T empo3E T emperatura Residuos
45, 17562 0, 934840 0, 065985 0, 001809 0, 001980 0, 604388 30, 296779
Defasado 3 dias
\
P F Eij =267, 847050 + 0, 144800 × T empoi+ 0, 004476 × T empo2i + 0, 000056 × T empo 3 Di
+ 0, 000311 × T empo3Ei+ 0, 457405 × T emperaturai+ 11, 879546 × Idadej
+ 1, 122759 × P esoj + 2, 334106 × Alturaj + 2, 779267 × I(F umoj)
Intercepto T empo T empo T empoD T empoE T emperatura Residuos 46, 080377 0, 831966 0, 079749 0, 002056 0, 002430 0, 433208 30, 450128
Defasado 4 dias
\
P F Eij =268, 080865 + 0, 104006 × T empoi+ 0, 009271 × T empo2i − 0, 000027 × T empo 3 Di
+ 0, 000547 × T empo3Ei+ 0, 520475 × T emperaturai+ 11, 798207 × Idadej
+ 1, 071733 × P esoj + 2, 388059 × Alturaj + 2, 751395 × I(F umoj)
+ 7, 008787 × I(SexoM ascj) − 3, 195813 × I(Asmaj) − 0, 019329 × P oluicao4i
Tabela 14: Desvio Padr˜ao dos Efeitos Aleat´orios
Intercepto T empo T empo2 T empo3
D T empo3E T emperatura Residuos
46, 080747 0, 940859 0, 091553 0, 002314 0, 003153 0, 548622 30, 287104
Defasado 5 dias
\
P F Eij =268, 298453 + 0, 107811 × T empoi+ 0, 010569 × T empo2i − 0, 000112 × T empo 3 Di
+ 0, 000624 × T empo3Ei+ 0, 605669 × T emperaturai+ 11, 848700 × Idadej
+ 1, 060778 × P esoj + 2, 397880 × Alturaj + 2, 514129 × I(F umoj)
+ 6, 934860 × I(SexoM ascj) − 3, 058092 × I(Asmaj) − 0, 057187 × P oluicao5i
Tabela 15: Desvio Padr˜ao dos Efeitos Aleat´orios
Intercepto T empo T empo2 T empo3
D T empo3E T emperatura Residuos
Tabela 16: Efeitos da Polui¸c˜ao Single Lag para 10 Unidades Single Lag βˆ Intervalo de Confian¸ca (95%)
Lag1 -0,110 (-0,419 ; 0,198)
Lag2 -0,610 (-0,940 ; -0,280)
Lag3 -0,587 (-0,909 ; -0,265)
Lag4 -0,193 (-0,599 ; 0,213)
Lag5 -0,571 (-1,014 ; -0,129)
Observa-se na Tabela 16 os efeitos da Polui¸c˜ao ajustado pelo Single Lag, neste m´etodo as defasagens da polui¸c˜ao s˜ao ajustadas uma de cada vez, defasagens 2, 3 e 5 se mos-traram significativas ao n´ıvel de significˆancia de 5%. O impacto no PFE do aumento de 10 unidades da polui¸c˜ao com respectivos intervalos de confian¸cas de 95% foi de: −0, 110l/min (−0, 419; 0, 198), −0, 610l/min (−0, 940; −0, 280), −0, 587l/min (−0, 909; − 0, 265), −0, 193l/min (−0, 599; 0, 213), −0, 571l/min (−1, 014; −0, 129), para as defa-sagens de 1, 2, 3, 4 e 5 dias da polui¸c˜ao, respectivamente.
4.3.2
Modelo Polinomial de Defasagem Distribu´ıda
As contas para o PDLM com q = 5 e d = 2 podem ser encontradas em [20] Modelo Representado na forma 3.31.
\
P F Eij =268, 615953 + 0, 097581 × T empoi+ 0, 007019 × T empo2i − 0, 000112 × T empo 3 Di
+ 0, 000581 × T empo3Ei+ 0, 698693 × T emperaturai+ 12, 003789 × Idadej
+ 1, 183203 × P esoj + 2, 268480 × Alturaj + 3, 115800 × I(F umoj)
+ 6, 508266 × I(SexoM ascj) − 2, 530911 × I(Asmaj) + 0, 016404 × P oluicao0i
− 0, 019136 × P oluicao1i− 0, 039474 × P oluicao2i− 0, 044609 × P oluicao3i
− 0, 034542 × P oluicao4i− 0, 009273 × P oluicao5i
\
P F Eij =268, 615953 + 0, 097581 × T empoi+ 0, 007019 × T empo2i − 0, 000112 × T empo 3 Di
+ 0, 000581 × T empo3Ei+ 0, 698693 × T emperaturai+ 12, 003789 × Idadej
+ 1, 183203 × P esoj + 2, 268480 × Alturaj + 3, 115800 × I(F umoj)
+ 6, 508266 × I(SexoM ascj) − 2, 530911 × I(Asmaj) − 0, 1306304×
[−0, 125574 × P oluicao0i+ 0, 146492 × P oluicao1i+ 0, 302180 × P oluicao2i
+ 0, 341492 × P oluicao3i+ 0, 264426 × P oluicao4i+ 0, 07098281 × P oluicao5i]
Tabela 17: Desvio Padr˜ao dos Efeitos Aleat´orios
Intercepto T empo T empo2 T empo3
D T empo3E T emperatura Residuos
45, 698278 1, 028018 0, 089854 0, 002280 0, 003136 0, 378137 30, 643892
Tabela 18: Efeitos da Polui¸c˜ao PDLM para 10 Unidades
PDLM βˆ Intervalo de Confian¸ca (95%) Lag0 0,164 (-0,157 ; 0,486) Lag1 -0,191 (-0,369 ; -0,012) Lag2 -0,394 (-0,622 ; -0,167) Lag3 -0,446 (-0,650 ; -0,241) Lag4 -0,345 (-0,540 ; -0,150) Lag5 -0,092 (-0,575 ; 0,389) Efeito Global -1,306 (-2,006 ; -0,606)
Na Tabela 18 e Figura 12 observa-se os efeitos da Polui¸c˜ao, que foram ajustados pelo PDLM utilizando um polinˆomio de grau 2 (d =2) e 5 dias defasados (q=5), onde cada uma das defasagens da polui¸c˜ao ´e ajustada pelas outras defasagens, desta forma pode-se avaliar tamb´em o efeito global da polui¸c˜ao, as defasagens 1, 2, 3, 4 e o efeito global se mostraram significativos ao n´ıvel de significˆancia de 5%. O impacto no PFE do au-mento de 10 unidades da polui¸c˜ao com respectivos intervalos de confian¸cas de 95% foi de: −0, 191l/min (−0, 369; −0, 012), −0, 394l/min (−0, 622; −0, 167), −0, 446l/min (−0, 650; − 0, 241), −0, 345l/min (−0, 540; −0, 150), −0, 092l/min (−0, 575; 0, 389), −1, 306l/min (−2, 006; −0, 606), para as defasagens de 1, 2, 3, 4, 5 dias da polui¸c˜ao e efeito global, respectivamente.
4.4
Modelo de Regress˜
ao Linear
Nesta sess˜ao ser˜ao apresentados os efeitos do ajuste da polui¸c˜ao encontrados utilizando o MRL, e tamb´em ser´a feita uma compara¸c˜ao dos intervalos de confian¸cas encontrados pelo MRL e modelo hier´arquico linear.
Para a utiliza¸c˜ao das vari´aveis temperatura, umidade relativa e polui¸c˜ao no Modelo de Regress˜ao Linear foi necess´ario agrega-las. Foi calculado a mediana do PFE de cada crian¸ca, sendo essa a vari´avel resposta no MRL; para as outras vari´aveis relacionadas aos dias foram criados indicadores da seguinte maneira: foi calculada a m´edia das vari´aveis Temperatura, Umidade Relativa e Polui¸c˜ao dos dias em que o PFE observado de uma determinada crian¸ca estava abaixo da sua pr´opria mediana, desta forma cada crian¸ca ter´a um indicador para cada uma dessas vari´aveis.
Tabela 19: Coeficientes do Modelo B´asico de Regress˜ao Linear ˆ
β Erro Padr˜ao P-valor
(Intercepto) 249,9957 7,2496 <0,0001 (Temperatura) -1,3965 5,1075 0,7848 (Idade) 12,2934 2,7961 <0,0001 (Peso) 0,9609 0,5725 0,0951 (Altura) 2,0716 0,5970 0,0006 (Fumo Domiciliar) 3,4869 6,2254 0,5761 (Sexo Masculino) 10,9230 6,0270 0,0717 (Asm´atico) -5,5437 6,6144 0,4031
mantidas as mesmas vari´aveis nos dois modelos, sendo que no MRL n˜ao h´a vari´aveis relacionadas ao tempo.
Defasado 1 dia
\
P F Ej =245, 252102 − 0, 490323 × T emperaturaj + 12, 700229 × Idadej
+ 0, 871789 × P esoj + 2, 019472 × Alturaj + 5, 608448 × I(F umoj)
+ 9, 868533 × I(SexoM ascj) − 4, 875436 × I(Asmaj) − 0, 189393 × P oluicao1j
Defasado 2 dias
\
P F Ej =240, 958756 − 0, 476972 × T emperaturaj + 12, 464480 × Idadej
+ 0, 919848 × P esoj+ 2, 062186 × Alturaj + 3, 895709 × I(F umoj)
+ 10, 528367 × I(SexoM ascj) − 4, 817874 × I(Asmaj) − 0, 641554 × P oluicao2j
Defasado 3 dias
\
P F Ej =240, 996764 − 0, 723864 × T emperaturaj + 12, 334140 × Idadej
+ 0, 934142 × P esoj+ 2, 096404 × Alturaj + 3, 495717 × I(F umoj)
+ 10, 766612 × I(SexoM ascj) − 4, 805124 × I(Asmaj) − 0, 563434 × P oluicao3j
Defasado 4 dias
\
P F Ej =240, 950710 − 0, 552787 × T emperaturaj + 12, 253379 × Idadej
+ 0, 919808 × P esoj+ 2, 086380 × Alturaj + 3, 508818 × I(F umoj)
+ 11, 143555 × I(SexoM ascj) − 5, 299450 × I(Asmaj) − 0, 508159 × P oluicao4j
\
P F Ej =241, 015746 − 1, 578378 × T emperaturaj+ 11, 928000 × Idadej
0, 900185 × P esoj+ 2, 158596 × Alturaj + 3, 860170 × I(F umoj)
+ 10, 705549 × I(SexoM ascj) − 5, 278727 × I(Asmaj)0, 542124 × P oluicao5j
Tabela 20: Efeitos da Polui¸c˜ao Single Lag para o aumento de 10 unidades Single Lag βˆ Intervalo de Confian¸ca (95%)
Lag1 -1,628 (-11,324 ; 8,067)
Lag2 -6,415 (-17,248 ; 4,417)
Lag3 -5,634 (-19,220 ; 7,951)
Lag4 -5,081 (-18,655 ; 8,492)
Lag5 5,421 (-6,019 ; 16,862)
Na Tabela 20 observa-se que nenhum dos efeitos da polui¸c˜ao do PFE foi significativo ao n´ıvel de significˆancia de 5%. O impacto no PFE do aumento de 10 unidades da polui¸c˜ao com respectivos intervalos de confian¸cas de 95% foi de: −1, 628l/min (−11, 324; 8.067), −6, 415l/min (−17.248; 4, 417), −5, 634l/min (−19, 220; 7, 951), −5, 081l/min (−18, 655; 8, 492), 5, 421l/min (−6, 019; 16, 862), para as defasagens de 1, 2, 3, 4 e 5 dias da polui¸c˜ao, respectivamente.
Tabela 21: Compara¸c˜ao dos Intervalos de Confian¸ca do MRL e Modelo Linear Hier´arquico Modelo de Regress˜ao CV ( ˆ\β) Modelo Hier´arquico CV ( ˆ\β)
(Intercepto) (231,698 ; 250,560) 0,020 (256,696 ; 274,031) 0,017 (Idade) (6,773 ; 17,813) 0,227 (6,561 ; 16,705) 0,221 (Peso) (-0,169 ; 2,091) 0,596 (0,407 ; 2,365) 0,359 (Altura) (0,892 ; 3,250) 0,288 (1,095 ; 3,160) 0,246 (Fumo Domiciliar) (-8,803 ; 15,777) 1,785 (-8,343 ; 13,542) 2,137 (Sexo Masculino) (-0,975 ; 22,821) 0,552 (0,337 ; 21,342) 0,492 (Asm´atico) (-18,602 ; 7,514) -1,193 (-12,328 , 12,257) -177,035
A Tabela 21 apresenta os intervalos de confian¸ca para os coeficientes da regress˜ao obtidos pelo MRL e pelo Modelo linear hier´arquico e seus respectivos coeficientes de varia¸c˜ao estimados \CV ( ˆβ). As vari´aveis que foram significativas segundo a Tabela 8, ao n´ıvel de significˆancia de 5%, apresentaram coeficientes de varia¸c˜ao menores no modelo
a Tabela 8, o MRL apresentou coeficientes de varia¸c˜ao menores se comparado ao modelo linear hier´arquico.
5
Conclus˜
ao
Este trabalho avaliou os efeitos da polui¸c˜ao atmosf´erica, medida pelo material par-ticulado inal´avel (PM10), no PFE de crian¸cas e adolescentes residentes no munic´ıpio de
Rio Branco. Foram usadas trˆes abordagens metodol´ogicas para avaliar estes efeitos. Na primeira foram estimados modelos lineares hier´arquicos para as medidas defasadas de 1 a 5 dias da polui¸c˜ao, com ajuste do efeito Single Lag, ou seja, cada defasagem foi in-clu´ıda no modelo separadamente. Na segunda tamb´em foram estimados modelos lineares hier´arquicos, por´em o ajuste da polui¸c˜ao foi feito atrav´es do PDLM, com at´e cinco dias de defasagem e grau polinomial de ordem dois. Nesta abordagem foi poss´ıvel estimar o efeito global de 5 dias de exposi¸c˜ao ao PM10. A ´ultima abordagem foi o ajuste de modelos
de regress˜ao linear, com a agrega¸c˜ao dos dados por indiv´ıduo e ajuste da polui¸c˜ao pelo Single Lag. Nos modelos lineares hier´arquicos foram observados efeitos significativos da exposi¸c˜ao ao PM10 sobre o PFE. Para cada aumento de 10 unidades do PM10, os efeitos
no PFE segundo a abordagem Single lag variaram de −0, 110l/min a −0, 610l/min; en-quanto que para o PDLM a varia¸c˜ao foi de −0, 092l/min a −0, 450l/min. O efeito global da polui¸c˜ao foi de −1, 306l/min no PFE. Nos modelos de regress˜ao linear n˜ao houveram efeitos significativos da polui¸c˜ao no PFE. Em conclus˜ao, os resultados corroboram com a literatura sugerindo a exposi¸c˜ao a polui¸c˜ao como fator de risco para a sa´ude respirat´oria dos escolares.
Quanto as limita¸c˜oes deste resultado, algumas suposi¸c˜oes como normalidade do termo de erro normalidade multivariada dos efeitos aleat´orios n˜ao foram satisfeitas. Devido a problemas computacionais n˜ao foi poss´ıvel testar outros ajustes para a dependˆencia dos dados alem do AR(1). N˜ao foi poss´ıvel estimar a precis˜ao dos efeitos da polui¸c˜ao para cada crian¸ca. A biblioteca nlme ajusta o efeito aleat´orio da polui¸c˜ao, por exemplo, por´em n˜ao calcula a variˆancia do efeito para cada crian¸ca.
Para trabalhos futuros seria importante fazer an´alises de sensibilidade, como exclus˜ao de outliers, estratifica¸c˜oes ou inclus˜ao de termos de intera¸c˜ao nos modelos, segundo as vari´aveis asma, faixas de idade, fumo no domic´ılio.