Estudo longitudinal sobre a relação entre a prestação de cuidados informais corresidenciais e o número de visitas ao médico: Modelos Lineares Generalizados Mistos para dados de contagem

(1)

Estudo longitudinal sobre a relação entre a

prestação de cuidados informais corresidenciais e o número de visitas ao médico :

Modelos Lineares Generalizados Mistos para dados de contagem.

FÁTIMA CRISTINA SENRA BARBOSA Doutorada em Sociologia

MESTRADO EM ESTATÍSTICA PARA A SAÚDE Universidade NOVA de Lisboa

julho, 2022

DEPARTAMENTO DE MATEMÁTICA

(2)

(3)

Orientadora: Sara Alexandra da Fonseca Marques Simões Dias,

Professora Adjunta da Escola Superior de Saúde do Instituto Politécnico de Leiria

Coorientadora: Maria do Rosário Oliveira Martins,

Professora Catedrática, Instituto de Higiene e Medicina Tropical da Universidade NOVA de Lisboa

Júri:

Presidente: Professora Doutora Isabel Cristina Maciel Natário

Professora Associada, FCT-NOVA

Arguentes: Professora Doutora Sofia Mucharreira de Azeredo Lopes,

Professora Auxiliar Convidada, Nova Medical School

Orientador: Professora Doutora Sara Alexandra da Fonseca Mar- ques Simões Dias

Professora Adjunta da Escola Superior de Saúde do Instituto Politécnico de Leiria

DEPARTAMENTO DE MATEMÁTICA

Estudo longitudinal sobre a relação entre a

prestação de cuidados informais corresidenciais e o número de visitas ao médico :

Modelos Lineares Generalizados Mistos para dados de contagem.

FÁTIMA CRISTINA SENRA BARBOSA

Doutorada em Sociologia

MESTRADO EM ESTATÍSTICA PARA A SAÚDE Universidade NOVA de Lisboa

julho, 2022

(4)

(5)

iii

Estudo longitudinal sobre a relação entre a prestação de cuidados informais corresidenciais e o nú- mero de visitas ao médico: Modelos Lineares Generalizados Mistos para dados de contagem

Copyright © Fátima Cristina Senra Barbosa, Faculdade de Ciências e Tecnologia, Universidade NOVA de Lisboa. A Faculdade de Ciências e Tecnologia e a Universidade NOVA de Lisboa têm o direito, perpétuo e sem limites geográficos, de arquivar e publicar esta dissertação através de exempla- res impressos reproduzidos em papel ou de forma digital, ou por qualquer outro meio conhecido ou que venha a ser inventado, e de a divulgar através de repositórios científicos e de admitir a sua cópia e distribuição com objetivos educacionais ou de investigação, não comerciais, desde que seja dado cré- dito ao autor e editor.

Este documento foi criado com o processador de texto Microsoft Word e o template NOVAthesis Word [11].

(6)

(7)

v

Este trabalho é dedicado ao meu filho Tiago e todos aqueles que acreditam em mim…

(8)

(9)

vii

A GRADECIMENTOS

Queria agradecer a todos os professores do Mestrado em Estatística para a Saúde, pois foram dois anos de muita aprendizagem e muito trabalho, durante os quais sempre me senti apoiada e reconhecida.

Em especial, agradeço à Professora Doutora Sara Simões Dias e à Professora Doutora Maria do Rosário Martins pelo acompanhamento nas Unidades Curriculares de Seminário e Dissertação e pelos conhecimentos partilhados ao longo destes meses. À Professora Sara Si- mões Dias agradeço ainda a sua imensa disponibilidade e compreensão.

Agradeço também a total disponibilidade e apoio, ao longo destes dois anos, da Pro- fessora Doutora Isabel Natário. Com o seu apoio tudo foi mais fácil!

Por fim, queria agradecer ao meu marido e ao meu filho, assim como a todos os meus familiares e amigos, que me apoiam incondicionalmente na minha vontade de nunca parar de aprender.

(10)

(11)

ix

“Aprender é alimentar a alma de saber" (Içami Tiba).

(12)

(13)

xi

R ^ESUMO

Os Modelos de Regressão Lineares Generalizados Mistos para dados de contagem permitem a análise de dados longitudinais, tendo em conta a independência das observações.

Estes modelos são bastante utilizados, tanto nas ciências médicas, como nas ciências sociais. O Modelo Poisson é modelo base para a análise de dados de contagem e baseia-se na premissa rigorosa de que a variância é igual à média (equidispersão). Contudo, com dados de contagem reais verificamos frequentemente a existência de subdispersão ou sobredispersão, o que significa que a variância é menor ou maior do que a média, respetivamente.

O objetivo deste estudo é comparar os resultados do ajustamento de dois modelos esta- tísticos (Modelo Linear Generalizado Misto com resposta Poisson e Modelo Linear Generali- zado Misto com resposta Binomial Negativa) que modelam o Número de visitas ao médico nos últimos 12 meses (NVM) nos indivíduos Portugueses com 50 e mais anos que participaram nas vagas 4 e 6 do estudo Survey of Health, Ageing and Retirement in Europe (SHARE).

O Modelo Linear Generalizado Misto com resposta Binomial Negativa apresentou melhor ajuste (ausência de dispersão, menor Akaike Information Criterion (AIC) e menores valores dos resíduos). Os resultados mostraram que os cuidadores conjugais, comparativamente com o grupo dos não cuidadores, têm maior número de visitas ao médico (NVM) (IRR:1.34, 95%CI: 1.00–1.80; P 0.047). A interação cuidador(a) conjugal e tempo mostrou que entre a vaga 4 e a vaga 6, o grupo dos cuidadores conjugais, comparativamente com o grupo dos não cuidadores, teve um maior aumento no NVM.

Os resultados deste estudo têm importantes implicações para as políticas sociais e de saúde, evidenciando a necessidade de um maior apoio para a promoção da saúde dos cuidadores conjugais.

Palavas chave: Modelos Lineares Generalizados Mistos, Distribuição Poisson, Distribui- ção Binomial Negativa, Análise Longitudinal, Cuidadores corresidenciais, Número de visitas ao médico, SHARE, Portugal

(14)

(15)

xiii

A ^BSTRACT

Generalized Linear Mixed Regression Models for count data are used to analyze longitudinal data, taking into account the independence of observations. These models are widely used in both medical and social sciences. The Poisson model is the central model for the analysis of count data and is based on the strict premise that the variance is equal to the mean (equidispersion). However, with real count data, we often find underdispersion or overdis- persion, which means that the variance is smaller or larger than the mean, respectively.

This study aims to compare the adjustment results of two statistical models (Generalized Linear Mixed Model with Poisson response and Generalized Linear Mixed Model with Nega- tive Binomial response) modelling the Number of visits to a doctor in the last 12 months in Portu- guese individuals aged 50 and over who participated in waves 4 and 6 of the Survey of Health, Ageing and Retirement in Europe (SHARE). The Mixed Generalized Linear Model with Neg- ative Binomial response showed the best fit (no dispersion, lower Akaike Information Crite- rion (AIC) and lower residual values). The results showed spousal caregivers had a higher number of visits to the doctor (IRR:1.34, 95%CI: 1.00-1.80; P 0.047). The Interaction term spouse caregivers*time showed that, between wave 4 and wave 6, the spousal caregiver's group, com- pared to the non-caregivers group, had a higher increase in the number of visits to the doctor, in the last 12 months.

The results of this study have important implications for health and social policies, high- lighting the need for greater support to promote the health of conjugal caregivers.

Keywords: Generalized Linear Mixed Regression Models, Poisson distribution, Nega- tive Binomial Distribution, Longitudinal Analysis, Co-residential caregivers, Number of Visits to the doctor, SHARE, Portugal

(16)

(17)

xv

Í ^NDICE

1 INTRODUÇÃO ... 1

1.1 Problema de investigação ... 1

1.2 Utilização de cuidados de saúde ... 2

1.3 Objetivo, hipótese e estrutura do estudo ... 4

2 MODELOS ESTATÍSTICOS PARA ANALISAR DADOS DE CONTAGEM ... 7

2.1 Modelo de Regressão Poisson ... 7

2.2 Modelo de Regressão Binomial Negativo ... 10

2.3 Qualidade de ajustamento dos modelos ... 12

Critério de Informação dos modelos ... 12

Teste de dispersão ... 12

Análise dos resíduos ... 13

3 DADOS ... 15

3.1 População estudada ... 15

3.2 Variáveis ... 17

3.3 Modelos lineares generalizados mistos: o caso de estudo ... 19

3.4 Análise estatística ... 20

4 RESULTADOS ... 23

4.1 Análise descritiva dos dados ... 23

Variável dependente ... 23

Características dos participantes no estudo de acordo com a vaga ... 25

4.2 Modelo Linear Generalizado Misto com resposta Poisson ... 26

(18)

xvi

4.3 Modelo linear Generalizado Misto com resposta Binomial Negativa ... 30

5 DISCUSSÃO... 37

6 CONCLUSÕES ... 41

REFERÊNCIAS BIBLIOGRÁFICAS ... 43

APÊNDICE ... 1

(19)

xvii

Í ^{NDICE DE} F ^IGURAS

Figura 4.1 - Fluxograma com a descrição da população elegível no estudo ... 16 Figura 5.1-Histograma e Caixa de Bigodes da variável número de visitas ao médico nos últimos 12 meses ... 23 Figura 5.2- Caixa de Bigodes da variável Nº de visitas ao médico nos últimos 12 meses, de acordo com o grupo de interesse e vaga ... 24 Figura 5.3 - Nº de visitas ao médico ao longo do tempo, de acordo com os grupos de interesse.

... 25 Figura 5.4 - Apresentação dos resíduos de Pearson versus os valores ajustados no Modelo 3 (Modelo Linear Generalizado Misto com resposta Poisson). ... 28 Figura 5.5 - Apresentação dos resíduos do Desvio (Deviance) e resíduos quantílicos aleatorizados do Modelo 3 (Modelo Linear Generalizado Misto com resposta Poisson). ... 29 Figura 5.6 - Apresentação dos resíduos de Pearson versus os valores ajustados no modelo Modelo 7 (Modelo Linear Generalizado Misto com resposta Binomial Negativa). ... 31 Figura 5.7 - Apresentação dos resíduos do Desvio (Deviance) e resíduos quantílicos aleatorizados do Modelo 7 (Modelo Linear Generalizado Misto com resposta Binomial Negativa). ... 32 Figura 5.8 - Interação cuidador(a) conjugal * tempo (vaga), do Modelo 7 (Modelo Linear Generalizado Misto com resposta Binomial Negativa). ... 35

(20)

(21)

xix

Í ^{NDICE DE} T ^ABELAS

Tabela 5.1- Estatísticas descritivas da variável dependente, de acordo com a vaga. ... 24 Tabela 5.2 - Características dos participantes no estudo de acordo com a vaga ... 26 Tabela 5.3 - Resultados dos modelos de Regressão Linear Generalizado Misto com resposta Poisson ... 27 Tabela 5.4 - Resultados dos modelos de Regressão Linear Generalizado Misto com resposta Binomial Negativa ... 30 Tabela 5.5 - Valores de VIF dos modelos de Regressão Linear Generalizada Mista com resposta Binomial Negativa ... 31 Tabela 5.6 - Resultados dos modelos de Regressão Linear Generalizada Mista com resposta Poisson ( Modelo 3) e com resposta Binomial Negativa (Modelo 7)... 33

(22)

(23)

xxi

S ^IGLAS

AIC CAPI CATI IRR ISCED 97 MLG MLGM NVM SHARE

Akaike Information Criterion.

Computer-Assisted Personal Interviews.

Computer Assisted Telephone Interviewing.

Incidence Rate Racio

International Standard Classification of Education Modelos Lineares Generalizados.

Modelos Lineares Generalizados Mistos.

Número de visitas ao médico nos últimos 12 meses . Survey of Health, Ageing and Retirement in Europe.

(24)

(25)

1

I ^NTRODUÇÃO

1.1 Problema de investigação

O envelhecimento da população tem levado a um aumento da procura de cuidados de saúde [1], [2]. Para enfrentar este desafio, os governos ocidentais têm vindo a promover a pres- tação de cuidados informais, com os idosos a serem cada vez mais encorajados a permanece- rem mais tempo nas suas próprias casas, a receberem serviços de apoio ao domicílio e a en- volverem cada vez mais a sua família, amigos e vizinhos na prestação de cuidados informais [2], [3]. Mais ainda, vários estudos evidenciam que os idosos preferem viver e serem tratados nas suas próprias casas [4]–[7].

Na Europa, o cuidado informal é a primeira fonte de Cuidados de Longa Duração, permitindo que pessoas doentes ou com dependência possam permanecer na sua casa [8].

Contudo, a literatura tem evidenciado que os cuidadores informais experienciam uma grande sobrecarga [2] e que a prestação de cuidados informais tem um efeito negativo na saúde física [9]–[11], mental [9]–[12] e social [13], [14]. Além disso, vários autores [15], [16] têm defendido que os cuidadores informais deveriam ser vistos como pacientes secundários e que a sua saúde é vital para assegurar a continuidade da prestação de cuidados informais [17].

Os cuidadores conjugais são a principal fonte de cuidados em idades avançadas [18].

Eles prestam mais horas de cuidados e têm menos tempo para descansar do seu papel de cuidador do que outros cuidadores [19]. Comparativamente com os cuidadores que prestam cuidados aos pais, os cuidadores conjugais prestam mais cuidados, usam menos apoio informal e reportam mais sintomas depressivos [20].

(26)

2

Portugal é o país da Europa com maior percentagem de cuidadores corresidenciais em idades avançadas [12] e um dos países com menor percentagem de pessoas com 65 anos ou mais anos a receberem Cuidados de Longa Duração [21]. Apesar da relevância social, de saúde e económica deste tema, segundo quanto sabemos, a associação longitudinal entre a prestação de cuidados corresidenciais e a utilização de cuidados de saúde na população com 65 e mais anos de Portugal ainda não foi analisada.

Considerando que o número de cuidadores conjugais irá aumentar nas próximas dé- cadas [22] e que a população com 50 e mais anos irá assumir cada vez mais a prestação de cuidados informais [23], torna-se importante analisar o impacto da prestação de cuidados corresidenciais na utilização de cuidados de saúde dos indivíduos com 50 e mais anos que vivem em Portugal. Ou seja, analisar se a prestação de cuidados limita ou potencia a utilização de cuidados de saúde.

1.2 Utilização de cuidados de saúde

A variável número de visitas ao médico nos últimos 12 meses (NVM) é uma medida amplamente utilizada para avaliar a utilização dos cuidados de saúde [24]–[26]. A literatura tem evidenciado que os indivíduos mais velhos e as mulheres utilizam mais frequentemente os cuidados de saúde [24], [27]. De acordo com vários autores [24], [28] também os indivíduos reformados têm maiores probabilidades de irem ao médico. No que confere ao estado civil, as investigações têm mostrado resultados opostos. Enquanto Pandey et al. [29] concluíram que, em comparação com os respondentes não casados, os respondentes casados tinham maiores probabilidades de terem tido uma visita de rotina ao médico recentemente, Ahn et al. [28]

constataram que o estado civil não se encontrava associado à utilização de cuidados de saúde, ou seja, ao número de visitas ao médico, visitas a especialistas e a dentistas.

No que confere ao nível de educação, vários estudos [26], [27] evidenciaram que os indivíduos com maior nível de educação utilizam mais frequentemente os cuidados de saúde.

De acordo com Grossman [30] e Lugo-Palacios & Gannon [26] a procura de cuidados de saúde também se encontra positivamente correlacionada com o rendimento dos indiví- duos. Contudo, de acordo com um estudo realizado nos Estados Unidos da América [31], os indivíduos que experienciam stress financeiro tendem a adotar menos cuidados preventivos

(27)

3

do que aqueles que não reportam stress financeiro e a utilizarem mais os cuidados de saúde não preventivos, representando custos de saúde mais elevados.

Relativamente aos internamentos hospitalares, Tammes et al. [32] mostraram que o aumento de internamentos hospitalares não planeados entre os pacientes com 65 ou mais anos se deve em parte à descontinuidade nos cuidados de saúde primários. Inversamente, Cowling et al. [33] concluíram que, em Inglaterra, havia uma associação positiva entre a admissão nos serviços hospitalares de emergência e as visitas regulares ao médico de clínica geral.

Um maior número de doenças crónicas [27] e o experienciar depressão [34], [35] en- contram-se associados a uma maior utilização dos cuidados de saúde. A inatividade física encontra-se associada a um maior uso de serviços médicos e de enfermagem, assim como a um aumento da permanência no hospital [36]. Por outro lado, Kang & Xiang [37] concluíram que os indivíduos ativos fisicamente usavam mais frequentemente os serviços de saúde preventivos, utilizavam menos os cuidados hospitalares, de emergência e cuidados domiciliários.

Os indivíduos com maior número de atividades sociais (participação social) encon- tram-se associados a um menor número de visitas ao médico [38]. A participação social é um importante determinante suscetível de modificar a saúde dos indivíduos [39] e de promover um envelhecimento ativo e saudável [40]–[43], o que podem influenciar o número de visitas ao médico.

No que diz respeito à utilização de cuidados de saúde por parte dos cuidadores informais, a literatura tem evidenciado resultados contraditórios. Chan et al. [11] mostraram que os cuidadores informais tiveram mais consultas externas (no último mês) do que os não cuidadores. Também Zwart et al. [19] concluíram que as cuidadoras conjugais reportaram mais visitas ao médico nos últimos 12 meses do que os cuidadores conjugais. Contrariamente, She- arkhani [44] constatou que os cuidadores informais utilizavam menos serviços de saúde do que os não cuidadores, sugerindo que os cuidadores informais podem não ser capazes de sa- tisfazer as suas próprias necessidades de saúde. Na mesma linha, Berglund et al. [45] mostrou que os cuidadores informais estão em maior risco de não procurarem cuidados médicos e de não tomarem a medicação prescrita. Complementarmente, Shafter and Nightingale [46] mostraram que os cuidadores informais e os não cuidadores não diferem ao nível das consultas de saúde, rotinas de controlo e check-ups de rotina.

(28)

4

A variável dependente NVM tem sido amplamente utlizada em vários estudos, com os vários autores a modelarem esta variável de contagem de formas distintas.

Com o objetivo de analisar se o grupo dos cuidadores informais reportava uma maior utilização dos cuidados de saúde, comparativamente com o grupo dos não cuidadores, Shaffer

& Nightingale [46] codificaram a variável NVM em 4 categorias (0 visitas; 1-2 visitas; 3-9 visitas e 10 ou mais visitas). Recorrendo a uma Regressão Logística Multinomial, os mesmos autores [46] concluíram que não havia diferenças entre cuidadores e não cuidadores relativamente ao NVM.

Usando dados da primeira vaga do estudo Europeu SHARE, Aıda Solé-Auró et al [25]

analisaram as diferenças entre os imigrantes e os nativos em relação ao número de consultas médicas, visitas a médicos de clínica geral e internamentos hospitalares nos indivíduos Europeus com 50 e mais anos. Devido à sobredispersão dos dados, o modelo Binomial Negativo foi usado para modelar o número de consultas médicas e o número visitas a médicos de clínica geral.

Quanto ao número de internamentos hospitalares, os autores utilizaram o modelo Poisson com excesso de zeros (Zero Inflated Poisson Model). Os resultados deste estudo mostraram que os imigrantes utilizavam mais os serviços de saúde do que os indivíduos nativos com as mesmas características.

Por fim, Lucifora & Vigani [24] analisaram se utilização dos cuidados de saúde, medida pelo número de consultas médicas e pela probabilidade de visitar um médico mais de quatro vezes por ano, mudava após a reforma. Usando dados longitudinais de seis vagas (vagas 1-6) do Estudo europeu SHARE, os autores utilizaram o Modelo Linear Generalizado Misto com resposta Binomial Negativa para a variável de contagem NVM (média do NVM 3.97 e variância 14.74) e para a variável categórica NVM (0= 3 ou menos visitas e 1= 4 ou mais visitas) utilizaram o Modelo Logístico Condicional com efeitos fixos (Conditional FE logit Model). Os autores [24] concluíram que tanto o NVM como a probabilidade de visitar o médico 4 ou mais vezes nos últimos 12 meses aumentavam depois da reforma.

1.3 Objetivo, hipótese e estrutura do estudo

O objetivo principal do presente estudo é comparar os resultados do ajustamento de dois modelos estatísticos (Modelo Linear Generalizado Misto com resposta Poisson e Modelo Li- near Generalizado Misto com resposta Binomial Negativa) que modelam o Número de visitas

(29)

5

ao médico nos últimos 12 meses (NVM) nos indivíduos Portugueses com 50 e mais anos que par- ticiparam nas vagas 4 e 6 do estudo Survey of Health, Ageing and Retirement in Europe (SHARE).

O presente estudo tem a seguinte hipótese de investigação :

 como a prestação de cuidados conjugais encontra-se associada à realização de tarefas mais intensivas, a mais horas de cuidados e a maior sobrecarga, o grupo dos cuidadores corresidenciais conjugais Portugueses com 50 e mais anos experienciam um maior aumento ao longo do tempo no número de visitas ao médico nos últimos 12 meses, comparativamente com o grupo dos não cuidadores.

A presente dissertação estrutura-se da seguinte forma:

 o capítulo 2 aborda dois tipos de Modelos Estatísticos para dados de contagens transversais e longitudinais (Modelo de Regressão Poisson e Modelo de Regressão Binomial Negativo) e os meios para avaliar a qualidade de ajustamento desses modelos;

 o capítulo 4 apresenta os dados da investigação;

 o capítulo 5 mostra os resultados da investigação;

 o capítulo 6 apresenta a discussão dos resultados;

 o capítulo 7 expõe as principais conclusões da investigação.

(30)

(31)

7

2

M ODELOS ESTATÍSTICOS PARA ANALISAR DADOS DE CONTAGEM

2.1 Modelo de Regressão Poisson

O modelo de regressão Poisson ou Modelo Log-Linear de Poisson é o modelo estatístico mais usado para dados de contagem ou taxas [47]–[49]. Este modelo é usado tanto nas ciências sociais, como nas ciências naturais e saúde [50], [51]. O modelo Poisson é baseado na distri- buição de probabilidade de Poisson, que assume que as observações a modelar são independentes e não estão correlacionados.

O modelo de regressão Poisson insere-se nos Modelos Lineares Generalizados (MLG) para dados na família exponencial [49], [52], [53]. Este modelo assume que a variável resposta 𝑌 tem uma distribuição de Poisson, que descreve a probabilidade de um determinado número de eventos acontecerem num determinado período de tempo [54]. O modelo estatístico Pois- son é usualmente utilizado para modelar a variável resposta observada para 𝑛 indivíduos 𝑦₁, … , 𝑦_𝑛 e caracteriza-se por assumir apenas valores inteiros não negativos [51], [55]. Cada 𝑦_𝑖 é modelado como uma variável aleatória independente Poisson (𝜆_𝑖), Poisson (𝜆_𝑖), onde o parâmetro (𝜆_𝑖) controla a taxa de ocorrência do que se está a contabilizar para o i-ésimo indivíduo. No modelo de regressão Poisson a taxa do parâmetro (𝜆_𝑖) [51] é dada por:

𝑙𝑛𝜆𝑖= 𝛽0+ 𝛽1𝑥𝑖1+ ⋯ + 𝛽𝑝𝑥𝑖𝑝= 𝛽0+ ∑ 𝛽𝑗 𝑝

𝑗=1

𝑥𝑖𝑗 (1)

(32)

8

onde 𝑥_𝑖1, … , 𝑥_𝑖𝑝 são um conjunto de 𝑝 variáveis explicativas e 𝛽 = (𝛽₀, … , 𝛽_𝑝) são os coeficientes de regressão. A função massa de probabilidade da variável aleatória Poisson com parâmetro 𝜆_𝑖 é dada por [51]

𝑓(𝑦𝑖; 𝜆𝑖) =𝑒^−𝜆^𝑖𝜆_𝑖^𝑦𝑖

𝑦𝑖! , 𝑦𝑖= 0, 1, 2 … (2) A função de ligação entre a média da variável resposta e o preditor linear que se emprega neste modelo é usualmente logarítmica [49], [52], [53] 𝑔(𝜇) = 𝑙𝑛(𝜇).

Este modelo baseia-se na premissa rigorosa que a variância é igual à média (equidis- persão)

𝐸(𝑌|𝑥) = 𝑉𝑎𝑟(𝑌|𝑥). (3) Assim, se as variáveis 𝑌_𝑖 forem independentes e seguirem uma distribuição Poisson de valor médio 𝜇_𝑖 no qual 𝑙𝑛(𝜇_𝑖) = 𝑋_𝑖^𝑇𝛽 com i=1,..,n, o modelo de regressão Poisson vai ser dado por:

𝑓(𝑦𝑖|𝑋_𝑖) = 𝑒^−𝜇^𝑖^𝜇^𝑖^𝑦𝑖

𝑦_𝑖! = 𝑒𝑥𝑝 {−𝑒^𝑋^𝑖^𝑇^𝛽+ 𝑦𝑖𝑋_𝑖^𝑇𝛽 − 𝑙𝑛𝑦𝑖!} , 𝑦𝑖 = 0, 1, … , … (4) No modelo de regressão Poisson utiliza-se o método da máxima verosimilhança para estimar os coeficientes de regressão. O logaritmo da verosimilhança do modelo de regressão Poisson é dado por:

𝑙(𝛽) = ∑_𝑖=1^𝑛 [𝑦𝑖𝛽1+ 𝑦𝑖𝛽2𝑥𝑖2+ 𝑦𝑖𝛽3𝑥𝑖3+ ⋯ + 𝑦𝑖𝛽𝑝𝑥𝑖𝑝− 𝑒^𝛽¹^+𝛽²^𝑥^𝑖2^+𝛽³^𝑥^𝑖3^+⋯+𝛽^𝑝^𝑥^𝑖𝑝⁻ln (𝑦𝑖!)]. (5)

No modelo Poisson a estimação dos parâmetros recorre a métodos iterativos. Contudo, os Modelos Lineares Generalizados não consideram a dependência das observações repetidas ao longo do tempo, sendo necessário recorrer aos Modelos Lineares Generalizados Mistos (MLGM) para a realização de análises longitudinais. Ou seja, como as contagens são repetidas no mesmo indivíduo ao longo do tempo, a independência das observações fica comprometida, havendo assim uma correlação entre observações. Para ultrapassar esta situação, recorre-se aos Modelos Lineares Generalizados Mistos que incluem um efeito aleatório no preditor linear para modelar a independência das observações [51].

Nos Modelos Lineares Generalizados Mistos, 𝑌_𝑖𝑗 são os valores inteiros não-negativos de uma variável de contagem para o sujeito i no momento j. Com a contagem a ser modelada por uma distribuição Poisson, o modelo Linear Generalizado Misto Poisson ser dado por:

𝑙𝑛(𝜇_𝑖𝑗) = 𝓍_𝑖𝑗^′𝛽 + 𝓏_𝑖𝑗^′𝑏_𝑖+ 𝜀_𝑖𝑗, (6)

(33)

9

onde 𝓍_𝑖𝑗^′ é a variável de interesse, 𝛽 é o vetor dos efeitos fixos (efeitos ao nível da população), 𝑏_𝑖 é o vetor dos efeitos aleatórios (efeitos ao nível do sujeito) para as variáveis 𝓏_𝑖𝑗^′ e os 𝜀_𝑖𝑗 são os erros aleatórios, ℰ_𝑖𝑗~𝑁(0, 𝜎_𝜀²) [51]. Neste sentido, tendo em atenção o processo de contagem de Poisson 𝑌_𝑖𝑗, a probabilidade de 𝑌_𝑖𝑗 = 𝑦_𝑖𝑗 condicionada pelos efeitos aleatórios 𝑏_𝑖 é dada por:

𝑃(𝑌_𝑖𝑗= 𝑌|𝑏_𝑖, 𝓍_𝑖𝑗, 𝓏_𝑖𝑗) =𝑒^−𝜇^𝑖𝑗𝜇_𝑖𝑗^𝑌 𝑌! = 1

𝑌!𝑒^{− 𝑒𝑥𝑝(𝓍}^𝑖𝑗^′^𝛽+𝓏^𝑖𝑗^′^𝑏^𝑖⁾𝑒𝑥𝑝(𝓍_𝑖𝑗^′ 𝛽 + 𝓏_𝑖𝑗^′ 𝑏_𝑖)^𝑌 (7)

= 1

𝑌!𝑒𝑥𝑝 [(𝓍_𝑖𝑗^′ 𝛽 + 𝓏_𝑖𝑗^′ 𝑏_𝑖)^𝑌− 𝑒𝑥𝑝 (𝓍_𝑖𝑗^′ 𝛽 + 𝓏_𝑖𝑗^′ 𝑏_𝑖)] , 𝑌 = 0, 1, 2, …

Em dados de contagem reais verificamos frequentemente a existência de subdispersão ou sobredispersão, o que significa que a variância é menor ou maior do que a média, respetivamente [56]. A sobredispersão poderá resultar do efeito aleatório de cada indivíduo, ou da exis- tência de uma tendência para que as observações pertençam a grupos [57], ou de uma corre- lação temporal [58]. Complementarmente, Hilbe [59] evidenciou que a sobredispersão pode ser aparente ou real. O mesmo autor refere que a sobredispersão é aparente quando:

 o modelo omite variáveis explicativas preditoras;

 os dados incluem outliers;

 o modelo não inclui os termos de interação necessários;

 a variável preditora necessita de ser transformada;

 a relação linear entre a variável resposta e o link de ligação está errada.

A sobredispersão é real quando não conseguimos identificar nenhumas das causas anteri- ores, ou seja, ou porque realmente a variância é maior do que a média ou porque os dados apresentam muitos zeros, ou existe correlação entre observações, ou ainda os dados encon- tram-se agrupados (clusters) [59].

De acordo com Saputro et al. [52], se o pressuposto da equidispersão (média igual à vari- ância) não for cumprido, a regressão Poisson já não é adequada para modelar os dados. A utilização da Regressão de Poisson sem cumprimento do pressuposto de equidispersão pode levar a uma estimativa tendenciosa dos parâmetros e a erros-padrão subestimados, levando a conclusões erradas [52], [59], [60]. Atkins et al. [61] refere mesmo que, quando a variância ex- cede a média, o modelo Poisson produz testes estatísticos excessivamente liberais levando a p values com valores significativos, quando na realidade não são.

(34)

10

Neste sentido, quando a equidispersão não é cumprida, vários autores defendem o uso da regressão Binomial Negativa [51], [53], [60], [62]–[64].

2.2 Modelo de Regressão Binomial Negativo

O modelo Binomal Negativo é o modelo mais utilizado para estimar os parâmetros dos dados Poisson com sobredispersão [51], [60], [63]. Este modelo insere-se nos Modelos Lineares Generalizados (MLG) e a distribuição Binominal Negativa caracteriza-se por ser uma mistura das distribuições Poisson e Gamma [51], [53], [65].

O modelo de regressão Binomial Negativo é uma generalização do modelo Poisson, que permite uma variação extra do resultado de contagem através da inclusão de um efeito alea- tório que segue uma distribuição Gamma com média 1 e variância 𝛼.

Se 𝑌 assume valores discretos com a distribuição condicional de Poisson: 𝑃_𝑟(𝑌 = 𝑘|𝜆) =

𝑒^−𝜆𝜆^𝑘

𝑘! , onde 𝜆 > 0, 𝜆 ∼ 𝐺𝑎𝑚𝑚𝑎 (𝛼, 𝜃) com a função densidade de probabilidade de dois parâ- metros 𝛼 𝑒 𝜃 da distribuição Gamma dada por [51]

𝑓(𝜆; 𝛼; 𝜃) =^𝜆^𝛼−1^𝑒^−𝜆/𝜃

𝜃^𝛼Γ(𝛼) , 𝜆 > 0, 𝛼 > 0, 𝜃 > 0. (8) Segundo Zeileis et al. [53] outra possível parametrização da função densidade de probabilidade da distribuição Binomial Negativa é

𝑓(𝑦; 𝜇, 𝜃) =Γ(𝑦 + 𝜃)

Γ(𝜃). 𝑦! . 𝜇^𝑦. 𝜃^𝜃

(𝜇 + 𝜃)^𝑦+𝜃 , (9) com média 𝜇, parâmetro de forma 𝜃 e função Gamma Γ(. ).

Assim o modelo Binomial Negativo (Poisson-Gamma) pode ser definido como [51]:

𝑓(𝑦|𝜆) =𝑒^−𝜆𝜆^𝑘 𝑘!

𝜆^𝛼−1𝑒^−𝜆/𝜃

𝜃^𝛼Γ(𝛼) . (10)

Uma parametrização para a função de variância do modelo Binomial Negativo é

𝑉𝑎𝑟(𝑌) = 𝜇 + 𝛼𝜇². (11)

(35)

11

Esta variação extra sobre a média resulta do produto de 𝛼 e da forma quadrática da média (𝜇²). De acordo com Hilbe [65] 𝛼 é um parâmetro de heterogeneidade que indica quanta heterogeneidade foi contabilizada pela componente Gamma. Neste sentido, no modelo Binomial Negativo existem dois parâmetros que influenciam a variância sobre a média: o parâmetro de dispersão 𝛼 e o quadrado da média 𝜇² [63]. Assim, o modelo Binomial Negativo permite modelar maior variância do que o modelo Poisson [63].

De acordo com Atkins et al. [61], o modelo Binomial Negativo é uma extensão do modelo Poisson, permitindo que a média e a variância sejam diferentes. No modelo Binomial Negativo, a variância adicional inserida no resultado produz erros padrões maiores do que os do modelo Poisson, gerando resultados mais fiáveis.

Tal como no modelo Linear Generalizado Poisson, também o Modelo Linear Generali- zado Binomial Negativo não considera a dependência das observações repetidas ao longo do tempo [51]. Para ultrapassar esta situação utilizam-se Modelo Linear Generalizado Misto Bi- nomial Negativo. Neste modelo 𝓍_𝑖𝑗 e 𝑧_𝑖𝑗 são vetores conhecidos das covariáveis associadas aos dados de contagem 𝑌_𝑖𝑗, 𝑖 = 1, … , 𝑛 e 𝑗 = 1, … , 𝑛_𝑖, condicionado pelo vetor aleatório de efeitos aleatórios específicos ao nível do indivíduo 𝑏𝑖, as contagens 𝑌𝑖𝑗, com o pressuposto de erros Gamma, tem uma distribuição Binomial Negativa 𝑌_𝑖𝑗|𝑏_𝑖~𝑁𝐵 (𝜇_𝑖𝑗, 𝜇_𝑖𝑗+ 𝜃𝜇_𝑖𝑗²), com 𝜇_𝑖𝑗 = 𝐸(𝑌_𝑖𝑗|𝑏𝑖) = 𝑒𝑥𝑝{𝓍_𝑖𝑗^′ 𝛽 + 𝓏_𝑖𝑗^′ 𝑏_𝑖}[51]. Ou seja, a média dos parâmetros 𝜇_𝑖𝑗 do modelo Binomial Negativo de Modelos Lineares Generalizados Mistos está relacionada com as variáveis preditoras 𝓍_𝑖𝑗 e as variáveis da amostra 𝑧_𝑖𝑗 através da mesma função de ligação logarítmica dos Modelos Lineares de Efeitos Mistos Generalizados Poisson [51] 𝑙𝑛(𝜇_𝑖𝑗) = 𝓍_𝑖𝑗^′ 𝛽 + 𝓏_𝑖𝑗^′ 𝑏_𝑖+ 𝜀_𝑖𝑗.

Contudo, a variância condicional de 𝑌_𝑖𝑗 para o modelo Binomial Negativo Linear Ge- neralizado Misto 𝑉𝑎𝑟(𝑌_𝑖𝑗|𝑏_𝑖) = 𝜇_𝑖𝑗+ 𝜃𝜇_𝑖𝑗² é maior do que a variância condicional do Modelo Linear Generalizado de Efeitos Mistos Poisson, pois a distribuição Gamma para os erros ex- ponenciados (𝑒𝑥𝑝 (𝜀_𝑖𝑗)), assume média 1 e variância 𝜃 [51].

(36)

12

2.3 Qualidade de ajustamento dos modelos

De acordo com Turkman e Silva [49] o melhor modelo resulta do equilíbrio entre três fatores: bom ajustamento, parcimónia e interpretação. Para tal existem vários meios para avaliar a qualidade de ajustamento dos modelos.

Critério de Informação dos modelos

O Critério de Informação de Akaike (Akaike Information Criterion AIC) foi proposto por Hirotugu Akaike [66] com o objetivo de comparar diferentes modelos e determinar o modelo que melhor se ajusta aos dados. Esta estatística baseia-se no logaritmo da verosimilhança e define-se da seguinte forma:

𝐴𝐼𝐶 = −2.^ℓ

𝑛+ 2.^𝑘

𝑛 (12) onde 𝑛 é o número de observações, 𝑘 é o número estimado de parâmetros (regressores + inter- cept) e ℓ a função log de verossimilhança [67] . De acordo com Pho et al. [68] o modelo com menor valor de AIC é o melhor modelo. Ou seja, o valor do AIC revela a informação perdida por ajuste de um determinado modelo, onde menores valores significam menor informação perdida. Inversamente, o modelo adequado é o que explica a maior quantidade de variação, utilizando o menor número de variáveis independentes. Esta estatística permite comparar modelos aninhados ou modelos não aninhados.

Teste de dispersão

O Teste de Dispersao é usado para avaliar a qualidade de ajustamento do modelo. A sub- dispersão ou sobredispersão pode ser detetada através do desvio reduzido, 𝐷(𝑦, 𝜇̂). De acordo com Zuur et al. [64] o cálculo baseia-se na aproximação 𝒳² do desvio reduzido. Assim, existe sobredispersão [64] se 𝐷/∅ segue uma distribuição Qui-quadrado com 𝑛 − 𝑝 graus de liber- dade, o que leva ao seguinte estimador para 𝜙 (parâmetro de dispersão):

ϕ̂ = ^𝐷

𝑛−𝑝. (13)

(37)

13

Se o rácio for próximo de 1, podemos assumir equidispersão, contudo se o rácio for maior do que 1 verifica-se a existência de sobredispersão e se for menor do que 1 verifica-se subdisper- são [69]. Hilbe [65], [70] refere ainda que modelos com um grande número de observações podem apresentar sobredispersão mesmo com um valor de dispersão de 1.05. O mesmo autor refere ainda que para modelos com tamanho moderado, um resultado de 1.25 exige correção [65].

Análise dos resíduos

A análise dos resíduos constitui uma etapa muito importante na análise estatística, pois permite identificar as discrepâncias entre os modelos e os dados [71]. Esta análise permite avaliar a qualidade do ajuste global do modelo e a adequação do modelo [71]. Tal como nos Modelos Lineares Generalizados, também nos Modelos Lineares Generalizados Mistos a aná- lise dos resíduos constitui uma etapa fundamental para a validação do modelo [72].

O resíduo (𝑟𝑖) é uma medida de afastamento de uma observação (𝑦𝑖) para o seu valor ajustado pelo modelo (𝜇̂𝑖):

𝑟_𝑖= 𝑞_𝑖(𝑦_𝑖, 𝜇̂_𝑖), (14)

onde 𝑞𝑖 é uma medida de diferença que estabiliza a variância na distribuição amostral de 𝑟𝑖, com o objetivo comparar e detetar resíduos discrepantes e ainda e observações que não são acomodadas pelos modelos (outliers).

O resíduo ordinário é a diferença entre o valor observado e o valor ajustado para uma dada observação:

𝑅_𝑖 = 𝑦_𝑖− 𝜇̂_𝑖. (15)

O resíduo de Pearson é definido como a diferença entre o valor observado e o valor ajustado com desvio padrão para uma dada observação:

𝑟_𝑖^𝑃 =^(𝑦^𝑖−^𝜇^̂^𝑖⁾

√𝑉(𝜇̂_𝑖) , (16)

onde 𝑉(𝜇̂𝑖) é a função de variância do modelo.

Para dados de contagem, o resíduo de Pearson para o modelo de regressão Poisson é definido como [71]:

(38)

14 𝑟_𝑖^𝑃=^(𝑦^𝑖−^𝜆^̂^𝑖⁾

√𝑉(𝜆̂

𝑖)

, (17)

Para o modelo de regressão Binomial Negativa o resíduo de Pearson é definido como [71]:

𝑟_𝑖^𝑃= ^(𝑦^𝑖−^𝜆^̂^𝑖⁾

√𝑉(𝜆̂

𝑖2/Κ)

. (18)

Os resíduos Deviance ou resíduos do Desvio avaliam a distância de 𝑦_𝑖 em relação a 𝜇̂_𝑖 na escala do logarítmico da verosimilhança. Ou seja, o resíduo Deviance para a 𝑖-ésima ob- servação assume-se como a contribuição dessa observação para o desvio do modelo.

O resíduo Deviance é definido como:

𝑅_𝑖^𝐷= 𝑠𝑖𝑛𝑎𝑙(𝑦_𝑖−𝜇̂_𝑖)√𝑑_𝑖, (19) onde 𝑑𝑖 é a contribuição de cada observação 𝑖 para a função de deviance e o sinal (𝓍)= -1 se 𝓍 < 1 e o sinal (𝓍)= +1 se 𝓍 > 0.

Para dados de contagem, o resíduo Deviance para o modelo de regressão Poisson é definido como [71]:

𝑅_𝑖^𝐷= 𝑠𝑖𝑛𝑎𝑙(𝑦_𝑖−𝜆̂_𝑖) {2 [𝑦_𝑖𝑙𝑜𝑔^𝑦^𝑖

𝜆̂_𝑖− (𝑦_𝑖− 𝜆̂_𝑖)]}. (20)

Para o modelo de regressão Binomial Negativa o resíduo Deviance é definido como [71]:

𝑅_𝑖^𝐷= 𝑠𝑖𝑛𝑎𝑙(𝑦_𝑖−𝜆̂_𝑖) {2 [𝑦_𝑖𝑙𝑜𝑔^𝑦^𝑖

𝜆̂_𝑖− (𝑦_𝑖− 𝐾)𝑙𝑜𝑔^𝑦^𝑖^+𝑘

𝜆̂_𝑖+𝑘]}. (21)

Os resíduos Quantílicos Aleatorizados foram propostos por Dunn e Smith [73] para as variáveis resposta que não seguem uma distribuição normal. Estes resíduos, independen- temente da distribuição da variável resposta apresentam uma distribuição normal. Estes resí- duos baseiam-se no teorema da inversa da função de distribuição acumulada. O resíduo Quantílico Aleatorizado é definido como:

𝑅_𝑖^𝑞 = ф⁻¹{𝐹(𝑦_𝑖; 𝜇̂ , ∅)}, _𝑖 (22) onde ф(.) é a função de distribuição acumulada da distribuição Normal Padrão.

(39)

15

3

D ^ADOS

3.1 População estudada

Este estudo longitudinal usa dados das vagas 4 e 6 do estudo Europeu SHARE (Survey of Health, Ageing and Retirement in Europe), versão 7.1.0 (DOI: 10.6103/SHARE.w4.710; DOI:

10.6103/SHARE.w6.710). O SHARE é um estudo multidisciplinar e multi-nacional que inclui amostras representativas de respondentes com 50 e mais anos e dos seus parceiros, indepen- dentemente da idade, de 27 países europeus e de Israel. Desde 2004, o SHARE tem recolhido dados de dois em dois anos, facultando microdados longitudinais comparáveis a nível inter- nacional que permitem uma perspetiva da saúde pública e das condições de vida socioeconó- micas dos indivíduos europeus (http://www.share-project.org/). Nas vagas 4 e 6, os entrevis- tadores recolheram os dados presencialmente, utilizando a entrevista pessoal assistida por computador (Computer-Assisted Personal Interviews CAPI). Para mais detalhes metodológicos do projeto SHARE, por favor ver Börsch-Supan et al. [74].

O estudo SHARE está sujeito a uma revisão ética continua. As atividades do SHARE- ERIC relacionadas com a investigação sobre pessoas são guiadas por princípios éticos interna- cionais de investigação, tais como o Respect Code of Practice for Socio-Economic Research e a De- claração de Helsínquia. Nas vagas 1 a 4, o estudo SHARE foi revisto e aprovado pelo Comité de Ética da Universidade de Mannheim. A vaga 4 SHARE e as seguintes vagas foram revistas

(40)

16

e aprovadas pelo Conselho de Ética do Max Planck Society e pelos Conselhos de Ética dos países participantes.

Neste estudo a população de interesse são os indivíduos Portugueses com 50 e mais anos, que participaram nas vagas 4 e 6 e que responderam à pergunta sobre a prestação de cuidados corresidenciais (Há alguém a viver consigo a quem tenha prestado assistência com regula- ridade, durante os últimos doze meses, ajudando nos cuidados pessoais, tais como lavar-se, levantar-se da cama ou vestir-se? (Por "com regularidade" queremos dizer todos os dias ou quase todos os dias durante pelo menos três meses. Não queremos registar a assistência dada por motivos de doença passa- geira de familiares.)). Importa referir que a pergunta sobre cuidados corresidenciais é apenas realizada a indivíduos quem não vivem sós.

Portugal apenas entrou para o estudo SHARE na vaga 4 (2011) e realizou até à presente data a vaga 4 (2011), vaga 6 (2015) e vaga 7 (2017-2018 – Vaga sobre Histórias de Vida). Estas três vagas foram realizadas face-a-face (Computer-Assisted Personal Interviews CAPI). Durante a pandemia Covid-19 foram ainda realizadas duas vagas com entrevistas telefónicas simplifi- cadas (Computer Assisted Telephone Interviewing CATI), em junho/julho 2020 e junho/julho 2021. Neste estudo apenas analisamos as vagas 4 e 6, pois são as únicas vagas onde as variáveis de interesse estão disponíveis.

A Figura 4.1 mostra o fluxograma que ilustra a população do nosso estudo nas duas vagas analisadas.

Figura 3.1 - Fluxograma com a descrição da população elegível no estudo

(41)

17

O fluxograma mostra que 1243 indivíduos participaram nas duas vagas analisadas.

3.2 Variáveis

A variável dependente é número de visitas ao médico nos últimos 12 meses (NVM). Na vaga 4 os participantes do SHARE foram questionados: Agora tenho algumas perguntas sobre os seus cuidados de saúde. Pense nos cuidados que teve nos últimos doze meses. Durante os últimos doze meses, aproximadamente quantas vezes foi ao médico ou falou com um médico sobre a sua saúde? Exclua consultas no dentista e internamentos, mas inclua consultas de urgência ou externas. Na vaga 6 esta pergunta mudou ligeiramente para: Agora, pense nos últimos doze meses. Quantas vezes, no total, esteve ou falou com um médico ou enfermeiro qualificado sobre a sua saúde? Exclua consultas no den- tista e internamentos, mas inclua consultas de urgência e consultas externas. Em ambas as variáveis os valores variam entre 0 visitas ao médico e 98 visitas ao médico nos últimos 12 meses.

Providenciar cuidado corresidencial é a variável independente de interesse. Apenas os respondentes que referiram não viver sós responderam à seguinte questão: Há alguém a viver consigo a quem tenha prestado assistência com regularidade, durante os últimos doze meses, ajudando nos cuidados pessoais, tais como lavar-se, levantar-se da cama ou vestir-se? (Por "com regularidade"

queremos dizer todos os dias ou quase todos os dias durante pelo menos três meses. Não queremos regis- tar a assistência dada por motivos de doença passageira de familiares.). Se a resposta dada tiver sido afirmativa, os respondentes são ainda questionados sobre a quem prestam esses cuidados.

Esta variável foi categorizada como 0 se o(a) respondente respondeu não à primeira pergunta (não cuidador(a)), como 1 se o(a) respondente respondeu sim à primeira pergunta e referiu na segunda pergunta cuidar do cônjuge que vive consigo (cuidador(a) conjugal) e como 2 se o(a) respondente respondeu sim à primeira pergunta e referiu na segunda pergunta cuidar de outras pessoas que vivem consigo, mas não do cônjuge (cuidador(a) de outros).

Baseados na literatura, consideramos as seguintes covariáveis no modelo:

-Idade na altura da realização da entrevista (variável continua);

- Sexo (feminino codificado como 0 e masculino como 1);

(42)

18

-Estado civil (ser casado(a) ou ter um companheiro(a) a viver na mesma habitação foi codificado como 1 e as outras categorias (casado(a) a viver separado(a), solteiro(a), divorciado(a) e viúvo(a)) como 0);

-Estatuto perante o emprego (reformado(a) codificado como 1 e as outras categorias (empre- gado(a), desempregado(a), permanentemente doente ou incapacitado, dono(a) de casa ou outra situação)) como 0)

- O nível de Educação foi avaliado através do International Standard Classification of Educa- tion (ISCED 97) e foi agregado em três níveis: Nível de Educação Baixo (indivíduos que não frequentaram a escola, ou apenas concluíram o ensino primário ou concluíram o terceiro ciclo);

Nível de Educação Médio (indivíduos que concluíram o ensino secundário); Nível de Educa- ção Elevado (Ensino pós-secundário, mas não ensino superior ou ensino superior)

-Stress financeiro foi analisado através da seguinte questão: Pensando no seu rendimento mensal total e das pessoas que vivem consigo, diria que o dinheiro chega até ao fim do mês: 1. Com grande dificuldade; 2. Com alguma dificuldade; 3. Com alguma facilidade;4. Facilmente. Esta questão foi ava- liada através de uma variável dicotómica, com as opções 1 e 2 a representarem representar a presença de stress financeiro (1) e as opções 3 e 4 a representar a ausência de stress financeiro (0);

- Internamento hospitalar nos últimos 12 meses foi avaliado através da pergunta: Durante os últimos doze meses, alguma vez ficou internado(a) no hospital? Considere internamentos médicos, ci- rúrgicos, psiquiátricos ou em qualquer outra especialidade. Os respondentes que responderam sim a esta pergunta foram codificados com 1 e os que respondentes que referiram que não com 0.

-Número de doenças crónicas foi medido pela pergunta: Alguma vez o médico lhe disse que ti- nha/teve/Atualmente tem algum dos problemas de saúde referidos neste cartão? Com isto queremos dizer se algum médico lhe disse que tem este problema de saúde, e se atualmente está a ser tratado ou a se está limitado por este problema. Indique o número ou os números desses problemas de saúde.

-Depressão foi avaliada através da escala EURO-D com 12 items [75] que inclui 12 questões sobre sentimentos de depressão, pessimismo, desejo de morte, culpa, irritabilidade, choro, fadiga, problemas de sono, perda de interesse, perda de apetite, redução da concentração, e perda de prazer de viver durante o último mês. Esta variável varia de 0 a 12, com o zero a significar não estar deprimido e o 12 muito deprimido. Seguindo os procedimentos de Dewey

(43)

19

and Prince [76] estabelecemos que uma pontuação no EURO-D maior do que três significava depressão clinica. Assim neste estudo, os respondentes com mais de 3 sintomas foram codificados como 1 (depressão clinica) e os respondentes com três ou menos sintomas como 0 (não depressão clinica).

-Inatividade física foi avaliada através de duas perguntas. Primeiro os respondentes SHARE foram questionados com que frequência, na sua vida diária, se dedicavam a uma atividade vigorosa (isto é, desporto, trabalhos domésticos pesados, ou um trabalho que requer trabalho físico) e depois com que frequência se dedicavam a uma atividade moderada (isto é, atividades que requerem um nível de energia baixo ou moderado, tais como jardinagem, limpeza do carro, ou caminhar), com quatro opções de resposta: 1. mais de uma vez por semana; 2. uma vez por semana; 3. uma a três vezes por mês; 4. quase nunca, ou nunca. Com base na definição de inatividade física de Gomes et al. [77] os indivíduos que responderam "uma a três vezes por mês" e "quase nunca, ou nunca" a ambas as perguntas foram considerados fisicamente inativos (fisicamente ativo = 0 e fisicamente inativo = 1).

-Número de atividades realizadas nos últimos 12 meses. Esta variável inclui a soma das atividades realizadas pelos respondentes nos últimos 12 meses. Na vaga 4 as atividades consideradas foram: 1. Fez trabalho voluntário ou de caridade; 2. Frequentou uma ação de formação;

3. Frequentou uma associação desportiva, social ou de outro tipo; 4. Participou nas atividades de uma organização religiosa (igreja, sinagoga, mesquita, etc.); 5. Participou numa organização política ou relacionada com a comunidade; 6. Leu livros, revistas ou jornais; 7. Jogou jogos de palavras ou números, como palavras cruzadas e Sudoku; 8. Jogou às cartas ou outros jogos como xadrez; 96. Nenhuma destas.

Na vaga 6, a pergunta manteve-se igual, contudo a opção 4 (Participou nas atividades de uma organização religiosa (igreja, sinagoga, mesquita, etc.) não foi considerada.

3.3 Modelos lineares generalizados mistos: o caso de estudo

O Modelo Linear Generalizado Misto é uma extensão do Modelo Linear Generalizado permitindo analisar a correlação entre as observações, através da inserção de efeitos aleatórios.

No presente estudo a variável dependente (número de visitas ao médico nos últimos 12 meses) segue uma distribuição Poisson da família exponencial e é condicionada a um efeito aleatório 𝛼 (indivíduo):

𝑌_𝑖𝑗|𝛼_𝑖~𝑃(𝜇_𝑖𝑗) (23)

(44)

20

onde 𝑌_𝑖𝑗 é o valor da variável resposta, avaliado no i-ésimo indivíduo (𝛼_𝑖) e no j-ésimo momento.

Neste modelo, o valor médio e a variância condicional são:

𝐸[𝑌_𝑖𝑗|𝛼_𝑖] = 𝜇_𝑖𝑗 (24) e

𝑉𝑎𝑟[𝑌_𝑖𝑗|𝛼_𝑖] = 𝜇_𝑖𝑗 . (25)

A componente sistemática integra os efeitos fixos e os efeitos aleatórios, o que permite analisar dados com observações correlacionadas, ou seja, dados repetidos ao longo do tempo para o mesmo indivíduo. No presente estudo iremos considerar um efeito específico para cada indivíduo:

𝜂_𝑖𝑗 = 𝛽₀+ 𝛽₁× 𝑋_1𝑖𝑗+ 𝛽₂× 𝑋_2𝑖𝑗+ ⋯ + 𝛽_𝑝× 𝑋_𝑝𝑖𝑗+ 𝛼_𝑖, (26) 𝑖 = 1, … , 𝑛 𝑗 = 1 𝑒 2

onde 𝛼_𝑖 ∼ 𝑁(0, 𝜎_𝛼²) é o efeito aleatório.

A função de ligação, no caso da distribuição Poisson, é logarítmica:

𝑙𝑛(𝜇_𝑖𝑗) = 𝜂_𝑖𝑗 (27) 𝜇_𝑖𝑗= 𝑒^𝜂^𝑖𝑗

Neste estudo utiliza-se ainda o método da máxima verosimilhança, aproximação de La- place. Assim propomo-nos analisar o seguinte Modelo Linear Generalizado Misto com resposta Poisson:

𝜂_𝑖𝑗 = 𝛽₀+ 𝛽₁∗ 𝑐𝑢𝑖𝑑𝑎𝑑𝑜𝑟 𝑐𝑜𝑛𝑗𝑢𝑔𝑎𝑙_𝑖𝑗+ 𝛽₂∗ 𝑐𝑢𝑖𝑑𝑎𝑑𝑜𝑟 𝑑𝑒 𝑜𝑢𝑡𝑟𝑜𝑠_𝑖𝑗+ 𝛽₃∗ 𝑚𝑎𝑠𝑐𝑢𝑙𝑖𝑛𝑜_𝑖𝑗+ 𝛽₄

∗ 𝑖𝑑𝑎𝑑𝑒_𝑖𝑗+ 𝛽₅∗ 𝑐𝑎𝑠𝑎𝑑𝑜(𝑎)_𝑖𝑗+ 𝛽₆∗ 𝑟𝑒𝑓𝑜𝑟𝑚𝑎𝑑𝑜(𝑎)_𝑖𝑗+ 𝛽₇

∗ 𝑛𝑖𝑣𝑒𝑙 𝑒𝑑𝑢𝑐𝑎çã𝑜 𝑚é𝑑𝑖𝑜_𝑖𝑗+ 𝛽₈∗ 𝑛𝑖𝑣𝑒𝑙 𝑒𝑑𝑢𝑐𝑎çã𝑜 𝑎𝑙𝑡𝑜_𝑖𝑗+ 𝛽₉

∗ 𝑠𝑡𝑟𝑒𝑠𝑠 𝑓𝑖𝑛𝑎𝑛𝑐𝑒𝑖𝑟𝑜_𝑖𝑗+ 𝛽₁₀∗ 𝑑𝑜𝑒𝑛ç𝑎𝑠 𝑐𝑟ó𝑛𝑖𝑐𝑎𝑠_𝑖𝑗+ 𝛽₁₁∗ 𝑑𝑒𝑝𝑟𝑒𝑠𝑠ã𝑜_𝑖𝑗+ 𝛽₁₂

∗ ℎ𝑜𝑠𝑝𝑖𝑡𝑎𝑙_𝑖𝑗+ 𝛽₁₃∗ 𝑖𝑛𝑎𝑡𝑖𝑣𝑖𝑑𝑎𝑑𝑒 𝑓í𝑠𝑖𝑐𝑎_𝑖𝑗+ 𝛽₁₄∗ 𝑎𝑡𝑖𝑣𝑖𝑑𝑎𝑑𝑒𝑠 𝑠𝑜𝑐𝑖𝑎𝑖𝑠_𝑖𝑗+ 𝛽₁₆

∗ 𝑡𝑒𝑚𝑝𝑜_𝑖𝑗+ 𝛽₁₅∗ 𝑐𝑢𝑖𝑑𝑎𝑑𝑜𝑟 𝑐𝑜𝑛𝑗𝑢𝑔𝑎𝑙_𝑖𝑗∗ 𝑡𝑒𝑚𝑝𝑜 + 𝛽₁₆∗ 𝑐𝑢𝑖𝑑𝑎𝑑𝑜𝑟 𝑑𝑒 𝑜𝑢𝑡𝑟𝑜𝑠_𝑖𝑗

∗ 𝑡𝑒𝑚𝑝𝑜 + 𝑎_𝑖 onde, 𝑖 = 1, … , 𝑛.

3.4 Análise estatística

Em primeiro lugar, realizámos uma análise dos dados em falta (missing data). A análise mostrou que nas variáveis de saúde e na variável Stress Financeiro os valores em falta eram

(45)

21

superiores a 5%. De acordo com os procedimentos de Jakobsen et al. [78], para otimizar o nú- mero de observações foram aplicadas as imputações disponibilizadas pelo estudo SHARE [79]

nas variáveis de saúde e na variável Stress Financeiro.

Em segundo lugar, procedemos a um conjunto de análises descritivas. Para a análise da variável dependente número de visitas ao médico nos últimos 12 meses recorremos ao histograma e a diagramas de extremos e quartis (análise da variável dependente de acordo com a vaga, os grupos de interesse (não cuidadores (0), cuidadores conjugais (1) e cuidadores de outros (2)).

O número médio de visitas ao médico ao longo do tempo, de acordo com os grupos de interesse (não cuidadores, cuidadores conjugais e cuidadores de outros) foi também analisado. Ainda nesta fase realizamos uma análise descritiva e analisámos a percentagem de respostas com valor zero na variável dependente nas duas vagas analisadas.

Em terceiro lugar, foram realizadas estatísticas descritivas univariadas das variáveis sóciodemográficas, económicas e de saúde das duas vagas analisadas. As variáveis categóricas foram expressas em percentagens e as variáveis contínuas em valores médios e respetivo desvio padrão.

Em quarto lugar, utilizando o package lme4 [80] e a função glmer no R, testámos quatro modelos Modelos Lineares Generalizados Mistos (GLMM) com a distribuição de Poisson.

O Modelo (nulo) ou Modelo 0 considerou apenas um único parâmetro: número de visitas ao médico nos últimos 12 meses (variável dependente).

O Modelo 1 considerou, para além da variável do Modelo 0, a variável de interesse providenciar cuidados corresidenciais.

No Modelo 2 considerou, para além das variáveis do Modelo 1, as variáveis: idade, sexo, estado civil, situação perante o emprego, nível de educação, stress financeiro, internamentos hospitalares, número de doenças crónicas, depressão, inatividade física, atividades sociais e tempo (vaga).

Por fim, no Modelo 3 considerou, para além das variáveis do Modelo 2, a interação providenciar cuidado corresidencial e tempo.

A interação providenciar cuidado corresidencial e sexo e providenciar cuidado corresidencial e idade foram testadas, contudo as mesmas não foram significativas.

(46)

22

Posteriormente, os valores da estatística Variance Inflation Factor (VIF) para as covariáveis do estudo foram analisados. De seguida, realizámos um teste para avaliarmos a dispersão dos dados [81]. Como os modelos Poisson apresentavam sobredispersão testámos novamente os quatro modelos acima apresentados utilizando os Modelos Lineares Generalizados Mistos (GLMM) com a distribuição de Binomial Negativa. Para análise destes modelos utilizámos o package lme4 [80] e a função glmer.nb no R.

Por fim, analisámos a qualidade de ajustamento dos modelos Lineares Generalizados Mistos Poisson e Binomial Negativo através da análise do Critério de Informação AIC, teste de dispersão e ainda análise de resíduos.

As análises escritivas foram realizadas com recurso ao software R 4.0.2. e ao IBM SPSS 25. As regressões lineares generalizadas mistas, o teste de dispersão e a análise dos resíduos foram realizadas no software R 4.0.2. Os packages do R lme4 [82], nlme [83], performance [81], HH [84], joineR [85], car [86], glmmTMB [87], sjPlot [88], ggplot2 [89] e DHARMa [90] foram utilizados nas análises.

(47)

23

4

R ^ESULTADOS

4.1 Análise descritiva dos dados

As análises descritivas são apresentadas nesta secção.

Variável dependente

A Figura 5.1 apresenta o Histograma e o diagrama de extremos e quartis da variável dependente NVM. O histograma mostra a distribuição das frequências da variável depen- dente, revelando uma distribuição com assimetria positiva. Ou seja, as distribuições concen- tram-se principalmente nos valores mais reduzidos da variável NVM (lado esquerdo), com uma grande extensão de observações marginais para a direita.

O diagrama de extremos e quartis comprova a assimetria dos dados e mostra-nos ainda a existência de outliers (valores atípicos).

Figura 4.1-Histograma e Caixa de Bigodes da variável número de visitas ao médico nos últimos 12 meses Fonte: SHARE, Versão 7.0.1., Vagas 4 e 6, N= 3184

A Tabela 5.1 apresenta as estatísticas descritivas da variável dependente NVM, de acordo com a vaga.

(48)

24

Tabela 4.1- Estatísticas descritivas da variável dependente, de acordo com a vaga.

Fonte: SHARE, Versão 7.0.1., Vagas 4 e 6

A Figura 5.2 (lado esquerdo) mostra que os cuidadores(as) corresidenciais (1- cuidadores(as) conjugais e 2- cuidadores(as) de outros) têm medianas ligeiramente mais elevadas do que o grupo dos não cuidadores, relativamente à variável NVM (caixa do lado esquerdo). A segunda caixa (lado direito) mostra que na vaga 6 o intervalo interquartil é menor, mos- trando menor dispersão da variável NVM na vaga 6.

Figura 4.2- Caixa de Bigodes da variável Nº de visitas ao médico nos últimos 12 meses, de acordo com o grupo de interesse e vaga

Fonte: SHARE, Versão 7.0.1., Vagas 4 e 6, N= 3184

A Figura 5.3 mostra o NVM ao longo do tempo, de acordo com os grupos de interesse.

Os dados mostram que os(as) cuidadores(as) conjugais são o grupo com maior NVM, tanto na vaga 4 como na vaga 6. Enquanto o grupo dos(as) cuidadores(as) de outros é o grupo com menor número de visitas ao médico, em ambas as vagas analisadas. Nesta análise apenas são consideradas as variáveis: Número de visitas ao médico, cuidado corresidencial e vaga.

Variável dependente Vaga Observações 1º Quartil Mediana Média 3º Quartil Desvio Padrão Mínimo Máximo

1724 1 3 4.95 5 8.99 0 98

1460 2 4 5.78 6 7.98 0 98

Número de zeros Percentagem de zeros Número de visitas ao

médico nos últimos 12 meses

Número de zeros Percentagem de zeros

97 6.6%

180 10.4%

4

6

Estudo longitudinal sobre a relação entre a prestação de cuidados informais corresidenciais e o número de visitas ao médico: Modelos Lineares Generalizados Mistos para dados de contagem

Estudo longitudinal sobre a relação entre a

prestação de cuidados informais corresidenciais e o número de visitas ao médico :

Modelos Lineares Generalizados Mistos para dados de contagem.

FÁTIMA CRISTINA SENRA BARBOSA Doutorada em Sociologia

MESTRADO EM ESTATÍSTICA PARA A SAÚDE Universidade NOVA de Lisboa

julho, 2022

DEPARTAMENTO DE MATEMÁTICA

DEPARTAMENTO DE MATEMÁTICA

Estudo longitudinal sobre a relação entre a

prestação de cuidados informais corresidenciais e o número de visitas ao médico :

Modelos Lineares Generalizados Mistos para dados de contagem.

Doutorada em Sociologia

A GRADECIMENTOS

R ESUMO

A BSTRACT

Í NDICE

Í NDICE DE F IGURAS

Í NDICE DE T ABELAS

S IGLAS

1

I NTRODUÇÃO

1.1 Problema de investigação

1.2 Utilização de cuidados de saúde

1.3 Objetivo, hipótese e estrutura do estudo

2

M ODELOS ESTATÍSTICOS PARA ANALISAR DADOS DE CONTAGEM

2.1 Modelo de Regressão Poisson

2.2 Modelo de Regressão Binomial Negativo

2.3 Qualidade de ajustamento dos modelos

Critério de Informação dos modelos

Teste de dispersão

Análise dos resíduos

3

D ADOS

3.1 População estudada

3.2 Variáveis

3.3 Modelos lineares generalizados mistos: o caso de estudo

3.4 Análise estatística

4

R ESULTADOS

4.1 Análise descritiva dos dados

Variável dependente

R ^ESUMO

A ^BSTRACT

Í ^NDICE

Í ^{NDICE DE} F ^IGURAS

Í ^{NDICE DE} T ^ABELAS

S ^IGLAS

I ^NTRODUÇÃO

D ^ADOS

R ^ESULTADOS