2nd Workshop on Data Science and Statistical Learning, Vitória-ES, junho de 2021

(1)

Propensity score matching - uma aplicação em dados maternos de COVID-19 do ES Aluna: Fernanda de Freitas Borém1_{, Orientadora: Nataly Adriana Jimenez Monroy}2 1 2_{Universidade Federal do Espírito Santo}

Resumo: O Propensity Score - também chamado de escore de pareamento - é uma técnica de correspondência estatística usada para diminuir o viés de seleção de delineamentos não aleatórios. O objetivo central do trabalho é abordar e analisar os impactos causados pela gestação nos desfechos de mulheres com diagnóstico confirmado de COVID-19. Propõe-se assim, apresentar métodos de cálculo do Propensitu Score Matching para comparar dois grupos, de gestantes e não gestante. .

Palavras-chave: Estudos observacionais, Propensity Score, COVID-19, Saúde Materno-Infantil 1. INTRODUÇÃO

A saúde materno infantil trata-se de um modelo de atenção que garante às mulheres e às crianças uma assistência humanizada e de qualidade, considerando sua importancia, torna-se relevante estudar e entender os impactos de eventos de saúde pública nas gestantes, puérperas e recém nascidos. Desde o ano 2019, a humanidade está passando por uma tranformação inesperada no modo de viver devido à pandemia do novo coronavirus, COVID-19. O primeiro caso de infecção pelo vírus no Brasil foi notificado em fevereiro de 2020.No Estado do Espírito Santo o primeiro caso foi notificado também nesse mesmo mês. Porém, foi somente em março de 2020 que a Organização Mundial da Saúde (OMS), elevou o estado da contaminação à pandemia de COVID-19; neste mês, o número de infectados pelo novo coronavírus ultrapassava os 200.000 casos em quase 200 países. De acordo com [7], até o dia 25 de abril de 2021, houve 146.054.107 casos confirmados de COVID-19, incluindo 3.092.410 mortes.

De acordo com [6], das 27 milhões de pessoas infectadas pela Covid-19 em todo mundo até junho de 2020, a hospitalização ocorreu em 31,5% das mulheres grávidas, em comparação com 5,8% das mulheres não grávidas. Segundo [9], em matéria publicada no dia 14 de Abril de 2021, as mortes de grávidas causadas pela COVID-19 passaram de 449 mortes em 43 semanas de pandemia de 2020, para para 289 mortes nas primeiras semanas de 2021. Nesse contexto, torna-se relevante conduzir es-tudos que avaliem o perfil das gestantes que contraíram tal doença para tentar determinar os impactos causados e verificar a real influência do novo coronavirus neste grupo da população.

O objetivo principal deste estudo consiste em determinar a influência da gestação no desfecho de mu-lheres com COVID-19 confirmada. Para esse fim serão usados dados do painel COVID-ES, disponíveis em https://coronavirus.es.gov.br/painel-covid-19-es.Sabe-se que o cenário ideal para deter-minação da relação de causalidade da condição de gestação com o desfecho óbito/cura consiste na realização de um delineamento aleatorizado, o que não é viável do ponto de vista prático e ético. En-tretanto, contamos apenas com dados observacionais de casos confirmados de COVID-19, o que pode induzir viés de seleção.

Uma alternativa para contornar essa limitação é o ouso do Propensity Score (PS), introduzido pela primeira vez na literatura por [12], em um artigo intitulado “The central role of the propensity score in observational studies for causal effects”. De acordo com [1], o método atribui uma probabilidade condicional de exposição considerando um grupo de variáveis. Uma vez obtido o PS, cada unidade de cada grupo é pareada com as unidades que possuem propensity score similiar. Posteriormente, as comparações entre os pares podem ser conduzidas. Sob a suposição de existência de viés de seleção por algumas variáveis observáveis de desenhos não aleatórios, utilizou-se o estimador de propensity score matching (PSM), descrito em [13].

2. METODOLOGIA

[8] sugerem que, ao conduzir uma análise de pontuação de propensão, sejam executadas as etapas a seguir:

1. Análise preliminar;

2. Estimativa dos escores de propensão;

3. Correspondência de pontuação de propensão; 4. Análise de resultados;

(2)

5. Análise de sensibilidade.

Para verificar se os grupos estão equilibrados podem ser usados testes estatísticos. Segundo [5], as estatísticas tradicionais calculam a diferença entre os grupos para cada variável incluída no modelo. [3] cita um códido gerado no software R que estima a diferença padronizada normalizada e o teste Qui-quadrado usando o pacote estatístico tXBalance. Escores absolutos superiores a 25% são con-siderados suspeitos e podem indicar um desequilíbrio para aquela variável específica [14]. Um valor da estatística qui-quadrado estatisticamente significativo indicará que pelo menos uma das variáveis incluídas no modelo está criando um desequilíbrio entre os dois grupos.

Para a etapa da análise preliminar, os efeitos do tratamentopodem ser avaliados na variável de resul-tado, isso pode ser feito usando um teste t ou usando um modelo de regressão.

Para a estimativa dos escores de propensão, a regressão logística é amplamente utilizada na determi-nação do ajuste do modelo. Dessa forma, pode-se avaliar a similaridade da distribuição entre os grupos através de gráficos. Um dos gráficos utilizados é o histograma consecutivo, implementado no pacote Hmisc [4].

Após calculado o escore de propensão no passo 2, é possível encontrar algumas divergências. Com isso, é importante verificar se a correspondência foi adequada. Uma das formas de conduzir essa revisão consiste em calcular o PS e depois retornar às técnicas do passo 1 (abordagens gráficas que podem ser usadas para determinar o grau de desequilíbrio) para verificar se todas as variáveis críticas foram balanceadas.

O item 4 consiste na análise de resultados. A simplicidade da análise torna os resultados fáceis de interpretar e suas implicações geralmente são fáceis de entender. Na combinação ideal e completa, é possível ter o mesmo indivíduo emparelhado com mais de um indivíduo do outro grupo. O uso da correspondência com substituição permite que as instâncias do grupo de controle que são similares a muitas instâncias do grupo de tratamento possam ser correspondidas mais do que uma vez. Porém, é necessário monitorar a quantidade, pois pode ocorrer que somente uma pequena quantidade dessas instâncias seja selecionada [2].

O quinto e último passo, análise de sensibilidade, foi proposto por [10]. Ele desenvolveu métodos para determinar o viés por meio de vários testes não paramétricos, como o teste de classificação sinalizada de McNemar e Wilcoxon (análise de sensibilidade usando o teste de sinais de classificação de Wilcoxon). [11] por sua vez, desenvolveu o pacote rbounds do software R, que estima a sensibilidade dos resultados a vieses ocultos.

3. RESULTADOS

A população estudada é formada por mulheres em idade fértil com diagnóstico confirmado de COVID-19 no Estado do Espírito Santo (ES), no período de 01/04/2020 a 02/05/2021. O banco de dados foi extraído do Painel Covid-19, que foi desenvolvido em parceria com o Instituto de Tecnologia da Infor-mação e Comunicação do Espírito Santo (Prodest), a Secretaria de Controle e Transparência (Secont), a Superintendência Estadual de Comunicação Social (Secom) e o Instituto Jones dos Santos Neves (IJSN), dispoinível emhttps://coronavirus.es.gov.br/painel-covid-19-es.

Os dados públicos disponibilizados no Painel Covid-19 consistem em todos os casos notificados com suspeita de Covid-19 no ES desde o início da pandemia. A distribuição dos casos considerando o resultado dos testes é apresentada na Tabela 1.

Confirmados Descartados Suspeito

159940 261827 98116

Tabela 1: Classificação dos casos

Neste estudo serão descardados os casos classificados como descartados ou suspeito, visto que não acrescentam em nada na nossa análise.

A Tabela 2 apresenta a distribuição de casos confirmados entre mulheres em idade fértil, isto é, com idades entre 10 e 49 anos, considerando a condição de gestante ou não. Verifica-se que há 10 casos inconsistentes em que a opção indicada é “Não se aplica", condição reservada apenas aos casos em que a notificação corresponde a homens ou crianças.

Nas análises subsequentes não serão considerados os casos com classificação Ignorado e Não se Aplica, dado que não apresentam informação relevante para o estudo. A Tabela 2 mostra que 1.322% das mulheres em idade fértil com diagnóstico confirmado de Covid-19 são gestantes. Isso corresponde a 2116 casos. Das gestantes, a maioria está no segundo ou terceiro trimestre da gravidez. Em 0.089%

(3)

Gestante Casos Frequência Sim 2116 Não 156562 Não se aplica 94 Ignorado 1168 Total 159940

Tabela 2: Casos confirmados

dos casos se ignora a idade gestacional. A Tabela 3 mostra o cruzamento entre a condição de gestação e a evolução do caso, classificada como Cura, Óbito ou Ignorada. Há 4406 casos em que não há informação. Esses casos, assim como os classificados Ignorados, serão desconsiderados nas análises posteriores. Observa-se que há 11 (0.519%) casos de óbitos em gestantes e 491 (0.324%) em não gestantes.

Gestante

Evolução

- Cura Ignorado Óbito pelo_COVID-19 _{outras causas}Óbito por Total

Sim 73 2019 13 11 0 2116

Ignorado 37 1130 0 1 0 1168

Não 4292 150600 1165 491 14 156562

Não se aplica 2 92 0 0 0 94

Tabela 3: Gestante por Evolução

O Gráfico 1 apresenta a distribuição por faixa etária, considerando a condição e gestação. Percebe-se que entre as gestantes, a maioria tem idade entre 20 e 29 anos, já no grupo das não gestantes, a faixa etária que prevalece é de 30 a 39 anos.

Figura 1: Faixa Etária

Sobre a raça das mulheres, em ambos os grupos vemos que a maioria é de cor Parda, representando 45.65% e 33.96% respectivamente, no segundo grupo a cor Branca também fica em alta, representando 33.36%. É interessante perceber que o campo ignorado teve bastante observação, ficando em terceiro lugar tanto no grupo das grávidas quanto no das não grávidas. Um fato interessante é que a maior parte das grávidas tem o ensino médio completo, com 31% deste grupo. Já as não grávidas, a maioria, foram dados Ignorados ou que não de aplicam, representando 38.17%

Focando agora nos sintomas da doença, temos: Febre, Diarreia, Coriza, Dificuldade Respiratoria, Dor de Garganta, Tosse e Cefaleia. A Tabela 4 contigencia Gestantes e não estantes pela quantidade de sintomas que tiveram. Em ambos os grupos, a maioria teve 4 sintomas, representando 27.588% e 27.592%.

Na mesma lógica, vamos analisar as comorbidades,que são: Cardio, Diabetes, Obesidade, Pulmão, Renal, Tabagismo. Na 5 podemos perceber que a 88,267% das gestantes tiveram apenas uma comor-bidade, da mesma forma, o das não gestantes tiveram 15528 (81,559%) casos. Interessante ver que as grávidas, não tinham mais de 3 comorbidades ao mesmo tempo.

(4)

Quantidade Gestante Sim(%) Não (%) 1 Sintoma 241(13.709%) 17495 (13.378%) 2 Sintomas 476(27.076%) 33452(25.58%) 3 Sintomas 485 (27.588%) 36083(27.592%) 4 Sintomas 320 (18.202%) 25913(19.815%) 5 Sintomas 165(9.385%) 13033(9.966%) 6 Sintomas 59 (3.356%) 48343.695(%) 7 Sintomas 12(0.682%) 961(0.735%) Total 1758 (100%) 130771(100%) Tabela 4: Sintomas Comorbidade Gestante Sim (%) Não (%) 1 Comorbidade 203 (88.260%) 15528 (81.560%) 2 Comorbidades 24 (10.434%) 2984 (15.674%) 3 Comorbidades 3 (1.304%) 491 (2.580%) 4 Comorbidades 0 (0%) 30 (0.158%) 5 Comorbidades 0 (0%) 6 (0.032%) Total 230 (100%) 19039 (100%) Tabela 5: Comorbidade

Para o resultado do exame, optamos por analisar somente o resultdo do PCR, que foi avaliado como melhor teste para o início da infecção, considerado o padrão-ouro para o diagnóstico. Vemos que em ambos os grupos prevaleceram com o reultado positivo no PCR, representando 69.14% e 59.78% respectivamente.

> chisq.test(tabela)

Pearson’s Chi-squared test with Yates’ continuity correction data: tabela

X-squared = 2.2584, df = 1, p-value = 0.1329

O resultado apresenta a estatística de teste calculada, os graus de liberdade e o p-valor do teste. Ao nível de 5% de significância, há fortíssimas evidências para não rejeitarmos a hipótese nula (p-value = 0.1329), concluindo que não existe associação de ser gestante ou não para o óbito pelo COVID-19. 4. CONCLUSÕES

Após feito a análise exploratória, vamos iniciar o cálculo do PSM para atingir os objetivos faltantes.Com esse estudo descritivo vimos que o grupo das gestantes e não gestantes são diferentes em alguns aspecos e que pelo teste qui quadrado indicou não ter associação entre os dois grupos. Maiores investigações serão conduzidas para verificar nossas suspeitas iniciais.

REFERÊNCIAS

[1] P. C. Austin. A critical appraisal of propensity-score matching in the medical literature between 1996 and 2003. Statistics in medicine, 27(12):2037–2049, 2008.

[2] R. H. Dehejia and S. Wahba. Causal effects in nonexperimental studies: Reevaluating the eva-luation of training programs. Journal of the American statistical Association, 94(448):1053–1062, 1999.

[3] B. B. Hansen, M. Fredrickson, M. M. M. Fredrickson, L. Rcpp, and I. Rcpp. Package ‘optmatch’. Available on https://cran. r-project. org/web/packages/optmatch/optmatch. pdf (last accessed on 10 October 2015), 2019.

(5)

[4] F. E. Harrell Jr and M. C. Dupont. The hmisc package. R package version, 3(0-12):3, 2006. [5] G. W. Imbens and J. M. Wooldridge. Recent developments in the econometrics of program

evalu-ation. Journal of economic literature, 47(1):5–86, 2009.

[6] Juliana Olivieri. Mulheres infectadas: grávidas fazem parte do grupo de risco da covid-19? Portal PebMed. Rio de Janeiro (RJ/BR), 2020. Acessado em Abril 25, 2020.

[7] K. Lee. The World Health Organization (WHO). Routledge, 2008.

[8] A. Olmos and P. Govindasamy. Propensity scores: a practical introduction using r. Journal of MultiDisciplinary Evaluation, 11(25):68–88, 2015.

[9] Redação Folha de São Paulo. Média semanal de mortes maternas por covid em 2021 já é mais do que dobro de 2020. Jornal Folha de São Paulo. São Paulo (SP/BR), 2021. Acessado em Abril 25, 2021.

[10] P. R. Rosenbaum. Overt bias in observational studies. In Observational studies, pages 71–104. Springer, 2002.

[11] P. R. Rosenbaum. Two r packages for sensitivity analysis in observational studies. Observational Studies, 1(1):1–17, 2015.

[12] P. R. Rosenbaum and D. B. Rubin. The central role of the propensity score in observational studies for causal effects. Biometrika, 70(1):41–55, 1983.

[13] W. S. d. Silva Junior and F. d. O. Gonçalves. Evidências da relação entre a frequência no ensino infantil e o desempenho dos alunos do ensino fundamental público no brasil. Revista Brasileira de Estudos de População, 33(2):283–301, 2016.

[14] E. A. Stuart and D. B. Rubin. Best practices in quasi-experimental designs. Best practices in quantitative methods, pages 155–176, 2008.