CICLO DE ESTUDOS
MESTRADO EM INFORMÁTICA MÉDICA
Data mining na deteção de outliers na
codificação clínica: estudo em
internamentos com pneumonia
Diana Pereira Pimenta
M
2019Agradecimentos
Ao Professor Doutor Alberto Freitas e Doutor Júlio Botelho por terem aceite a orientação deste trabalho, pela disponibilidade, ajuda e profissionalismo durante a elaboração do mesmo, e por todos os conhecimentos transmitidos.
Um genuíno obrigada ao Doutor Júlio Botelho por todo o acompanhamento e dedicação infindável na realização deste projeto. Agradeço especialmente por todas as reuniões, paciência demonstrada e ajuda incondicional, mesmo quando a disponibilidade se tornava reduzida.
Não posso deixar de agradecer à minha família, em particular, aos meus pais que me dão força em todos os momentos, sempre acreditaram e acreditam em mim e têm permitido a minha formação. Por me incentivarem a dar sempre o melhor de mim, mesmo que signifique estar mais distante. Á minha avó, irmã e cunhado pelo incentivo, compreensão e encorajamento, que me acompanhou ao longo de todo o meu percurso académico. Ao meu avô que lá de cima acompanha o meu percurso.
Por fim, agradeço ao meu namorado por todo apoio incondicional nesta reta final. Obrigada por me ensinares que objetivos definidos são objetivos a ser alcançados.
Abstract
Introduction: The Diagnosis Related Groups (DRG) classification system aggregates clinically
and economically similar episodes according to coded clinical data, maintained in administrative databases. Currently, the version of the DRG used in Portugal is the All-Patient Diagnosis-Related Groups (APR-DRGs), which classifies cases on a DRG base and a severity level (SOI), ultimately determining the final hospitalization price. Having in consideration that the increase of the health care costs is an emergent issue, assessing and improving the quality of coded clinical data is a way to ensure that it can be reused to the best of its ability, contributing to improved clinical management and practice. To do so, the use of data mining techniques is a fast and efficient way to understand and evaluate clinical data.
Objectives: With this study, the main objective was to define outliers and / or possible
coding problems that may impact the correct grouping of hospitalizations with pneumonias in DRGs and, therefore, the correct hospital financing, using data mining techniques. This study includes the identification of clinical coding discrepancies between similar hospitals, identifying whether these discrepancies affect clustering, and verifying if data mining techniques help in the detection of coding anomalies. In addition, as a secondary objective there is the intention to compare data between 2015 and 2017 to analyze the impact of the change on the encoding type on anomaly detection and the application of data mining techniques in both versions of the International Classification of Diseases (ICD).
Methods: Three years of clinical data (2015, 2016 and 2017) referring to episodes of
hospitalization in Portuguese public hospitals (version 31 APR-DRG) and models based on support vector machine (SVM) were used. Six hospitals were compared in terms of frequency on DRGs base, severity levels, pneumonia-related diagnostic codes and Charlson comorbidities. Discrepant cases are determined by analysis of statistical proportions. SVM models were used to simulate the APR-DRG classification. Changes in the APR-DRG classification were evaluated, as well as the financial impact of the different pneumonia and comorbidity-related codes that were found to be discrepant based on the official APR-DRG prices, derived from the price and weight table defined for public hospitals of the National Health System (NHS) in Portugal in 2017.
Results: The DRGs 137, 138 and 139 were statistically significant and analyzed in more
detail over the three years. All severity levels, a total of eight primary pneumonia-related
diagnostic codes, and all Charlson comorbidities, revealed abnormal frequencies in, at least, one hospital. Using the APR-DRG rating, SVM models correctly rated 88.4% of episodes. The presence of the codes 481, 485 and 486 have a different influence when assigned to the primary or secondary diagnosis, and the use of these codes as a secondary diagnosis tends to result in a DRG of higher weight. The omission of secondary pneumonia-related diagnoses had a potential financial impact of -167 933e, DRGs 137, 138 and 139. The comorbidity associated with any malignancy is the comorbidity that most influences the episode to have heavier DRG base (20% of episodes) in episodes with pneumonia. Congestive heart failure and kidney disease are the disparate comorbidities responsible for the increase in complexity, but both frequencies have been decreasing over the years. Nevertheless, kidney disease modifies 68% of episodes with a potential financial impact of 4,918,578e on DRGs 137, 138 and 139. Over a total of three years, there was a potential financial impact of 5,748,661e on the presence of discrepant comorbidities, changing 15% of the episodes. The potential financial impact of comorbidities increased by 2% and by 18% between 2015 and 2017.
Discussion: There were significant coding discrepancies between hospitals and some
suspec-ted coding errors. The use of data mining, namely analysis of proportions and SVM models, has allowed to discover and identify situations where diagnoses affects the APR-DRG classification, the form of coding diagnoses related to pneumonia as secondary diagnosis, results in a greater potential financial compensation for hospitals, in situations where Charlson’s comorbidities influence severity level assignment and helps to identify significant coding variability across hospitals. However, the overall levels of clinical data credibility of all evaluated hospitals were high, and a small proportion of coding errors associated with possible cases of upcoding and undercoding were marked by the applied methodology. The change in coding (ICD-09 e ICD-10), after 2016, had a minimal impact in the identification of anomalies.
Conclusion: The use of data mining, including statistical analysis, along with SVM models,
enables the detection and identification of anomalous situations in each hospital when compared to equivalent ones, identifying potential clinical coding issues with potential impacts on funding. These findings may not only be relevant to the planning of future audit processes, making it easier to identify errors that may affect the APR-DRG classification, but also to enable the discussion on the quality of coded clinical data, bearing in mind their impact on hospital funding. A reproducible method is presented that can be used to monitor coded clinical data and to promote the management of coding quality and administrative databases, motivating the use of data mining techniques in the field of health, mainly in outlier’s detection.
Key words: DRG; data mining; support vector machine; inpatient data, clinical coding;
coding errors
Resumo
Introdução: O sistema de classificação de Grupos de Diagnósticos Homogéneos (GDH) agrupa
episódios clinicamente e economicamente semelhantes em função de dados clínicos codificados, mantidos em bases de dados administrativas. A versão do GDH em vigor em Portugal é o
All-Patient Diagnosis-Related Groups (APR-DRG), que classifica os casos num GDH base e num
nível de severidade (SOI), que determina o preço final do internamento. Tendo em vista que o aumento dos custos de saúde são uma questão iminente, avaliar e melhorar a qualidade dos dados clínicos codificados é uma forma de garantir que os mesmo poderão ser reutilizados da melhor maneira possível, contribuindo para melhorar a gestão e práticas clínicas. Para tal, a utilização de técnicas de data mining é uma forma rápida e eficiente para entender e avaliar os dados clínicos.
Objetivos: O objetivo principal deste estudo foi determinar outliers e/ou possíveis problemas
de codificação que podem impactar no correto agrupamento de internamentos com pneumonias em GDH e, portanto, no correto financiamento hospitalar, utilizando técnicas de data mining. Inclui-se neste estudo a identificação de discrepâncias de codificação clínica entre hospitais semelhantes, identificar se as discrepâncias encontradas afetam o agrupamento e verificar se as técnicas de data mining ajudam na deteção de anomalias de codificação. Complementando, com um objetivo secundário, comparar dados entre 2015 e 2017 para analisar o impacto na mudança do tipo de codificação na deteção de anomalias e a aplicação de técnicas de data mining nas duas versões da classificação internacional de doenças (ICD).
Métodos: Foram utilizados três anos de dados clínicos (2015, 2016 e 2017) referentes
aos episódios de internamentos nos hospitais públicos portugueses (versão 31 APR-DRG) e modelos baseados em support vector machine (SVM). Seis hospitais foram comparados quanto à frequência de GDH base, níveis de severidade, códigos diagnósticos relacionados com pneumonia e comorbilidades de Charlson. Determina-se casos discrepantes através de análise de proporções estatísticas. Os modelos SVM foram utilizados para simular a classificação APR-DRG. Além de avaliar mudanças na classificação do APR-DRG, também se estudou o impacto financeiro dos diferentes códigos relacionados com pneumonias e comorbilidades que foram detetadas como discrepantes, com base nos preços oficiais do APR-DRG, derivados da tabela de preços e pesos definida para os hospitais públicos do Sistema Nacional de Saúde (SNS) em Portugal em 2017.
Resultados: Os GDH 137, 138 e 139 foram estatisticamente significativos e analisados
com maior pormenor nos três anos. Todos os níveis de severidade, um total de oito códigos de diagnóstico principal relacionado com pneumonias e todas as comorbilidades de Charlson apresentaram frequências anormais em pelo menos um hospital. Utilizando a classificação APR-DRG, os modelos SVM classificaram corretamente 88,4% dos episódios. A presença dos códigos 481, 485 e 486 têm uma influência diferente quando atribuídos ao diagnóstico principal ou diagnóstico secundário, sendo que o uso destes códigos como diagnóstico secundário tende a atribuir um GDH de maior peso. A omissão de diagnósticos secundários, relacionados com pneumonias teve um potencial impacto financeiro de -167 933e nos GDH 137, 138 e 139. A comorbilidade referente a qualquer malignidade é a comorbilidade que mais influencia o episódio a ter GDH base de maior peso (20% dos episódios) em episódios com pneumonia. Insuficiência cardíaca congestiva e doença renal são as comorbilidades discrepantes responsáveis pelo aumento da complexidade, mas ambas as frequências têm vindo a diminuir ao longo dos anos. Mesmo assim, a doença renal altera 68% dos episódios com um potencial impacto financeiro de 4 918 578 e nos GDH 137, 138 e 139. Num total dos três anos, houve um potencial impacto financeiro de 5 748 661e com a presença das comorbilidades discrepantes, alterando 15% dos episódios. O impacto financeiro das comorbilidades aumentou 2% e nos discrepantes 18%, entre 2015 e 2017.
Discussão: Verificaram-se discrepâncias significativas de codificação entre hospitais e alguns
casos suspeitos de erros de codificação. A utilização de data mining, nomeadamente análise de proporções e modelos SVM, permitiu descobrir e identificar situações onde diagnósticos afetam a classificação APR-DRG, a forma de codificação de diagnósticos relacionados com pneumonias como diagnóstico secundário resulta numa potencial compensação financeira maior para os hospitais, situações onde as comorbilidades de Charlson influenciam a atribuição do nível de severidade e identificar variabilidades significativas na codificação entre hospitais. Os níveis gerais de credibilidade dos dados clínicos de todos os hospitais avaliados foram, entretanto, altos, e uma pequena proporção de erros de codificação associados a possíveis casos de upcoding e de undercoding foi sinalizada pela metodologia aplicada. A identificação de anomalias teve um impacto mínimo com a mudança de codificação (ICD-09-CM e ICD-10-CM/PCS), ocorrida a partir de 2016.
Conclusão: A utilização de data mining, nomeadamente análises estatísticas, juntamente
com modelos SVM, permite a deteção e identificação de situações anómalas de um determinado hospital em comparação com hospitais equivalentes, identificando potenciais problemas referentes à codificação clínica com potencial impacto no financiamento. Estas descobertas podem não só ser relevantes para o planeamento de futuros processos de auditoria, facilitando a identificação de erros que podem afetar a classificação do APR-DRG, mas também para discutir a qualidade dos dados clínicos codificados, tendo em mente o impacto deles no financiamento hospitalar. Apresenta-se um método reprodutível que pode ser utilizado para monitorizar dados clínicos codificados e para promover a gestão da qualidade da codificação e das bases de dados administrativas, promovendo a utilização de técnicas de data mining no ramo da saúde, em particular, na deteção de outliers.
Palavras-Chave: GDH; data mining; support vector machine; dados de internamento;
codificação clínica; erros de codificação;
Resultados Científicos
• Pimenta D, Souza, J, Caballero I, Freitas A. (2019). Toward the measure of credibility of hospital administrative datasets in the context of DRG classification. Cidade Real, Espanha. The International Conference on the Quality of Information and Communications Technology (QUATIC): Springer CCIS (submetido, aceite e publicado em Setembro de 2019)
Conteúdo
Agradecimentos i
Abstract iii
Resumo v
Resultados Científicos vii
Conteúdo xiii
Lista de Tabelas xvi
Lista de Figuras xviii
Acrónimos xix
1 Introdução 1
1.1 Organização . . . 3
2 Objetivos 5 3 Enquadramento teórico 7 3.1 Doenças e distúrbios do sistema respiratório . . . 7
3.1.1 Pneumonias . . . 8
3.2 Codificação clínica hospitalar em Portugal . . . 10
3.2.1 Classificação de diagnósticos e procedimentos . . . 13
3.2.2 Codificação clínica - Transição para ICD-10 . . . 14
3.2.3 Qualidade dos dados codificados . . . 17
3.2.4 Avaliação da qualidade de codificação . . . 17
3.2.5 Faturação hospitalar . . . 18
3.2.6 Erros de codificação em bases de dados de cuidados de saúde . . . 18
3.3 Data Mining . . . 20
3.3.1 Machine learning . . . 21
3.3.2 Data mining na área da saúde . . . 23
3.3.3 Métodos e técnicas de Data Mining . . . 23
3.3.4 Data Mining e deteção de outliers em dados administrativos hospitalares 26 4 Data mining e problemas de codificação em dados hospitalares com impacto no financiamento 29 4.1 Objetivo da revisão . . . 30 4.2 Metodologia da revisão. . . 30 4.3 Resultados da revisão . . . 31 4.4 Considerações finais . . . 37 5 Materiais e Métodos 39 5.1 Fontes de informação . . . 39
5.2 População em estudo, critérios de inclusão e exclusão . . . 39
5.2.1 Seleção da amostra . . . 40
5.2.2 Definição das variáveis . . . 41
5.2.3 Análise e tratamento de dados . . . 42
6 Resultados 47 6.1 Descrição da amostra. . . 47
6.1.1 Caracterização da amostra por hospital . . . 53
6.2 Discrepâncias na Classificação do GDH. . . 54
6.3 Variáveis que influenciam o agrupamento . . . 65
6.3.1 Influência de códigos de diagnóstico . . . 66 6.3.2 Influência de comorbilidades. . . 69 7 Discussão 73 8 Conclusões 83 Referências 87 Apêndices 99
A Data mining e problemas de codificação em dados hospitalares com impacto
no financiamento 101
A.1 Síntese de características dos estudos analisados. . . 101
B Diagnósticos Principais correspondentes a pneumonias 105
B.1 ICD-09-CM entre 480 e 488: Influenza (gripe) e pneumonia . . . 105
B.2 ICD-10-CM entre J09 e J18: Influenza (gripe) e pneumonia . . . 107
C APR-DRG Versão 31 109
C.1 Tabela Nacional Grupos de Diagnóstico Homogéneos . . . 109
D Distribuição de GDH por hospital em 2015 111
D.1 Proporção de APR-DRG de internamentos com pneumonias por hospital em 2015 111
D.2 Proporção de níveis de severidade (SOI) dentro de cada APR-DRG relacionado com internamentos com pneumonias, por hospital em 2015. . . 113
D.3 Proporção de presença de códigos de diagnóstico com frequências anormais em pelo menos um hospital, por APR-DRG e hospital em 2015 . . . 115
D.4 Proporção de presença de comorbilidades de Charlson com frequências anormais em pelo menos um hospital, por APR-DRG e hospital em 2015 . . . 117
E Distribuição de GDH por hospital em 2016 121
E.1 Proporção de APR-DRG de internamentos com pneumonias por hospital em 2016 121
E.2 Proporção de níveis de severidade (SOI) dentro de cada APR-DRG relacionado com internamentos com pneumonias, por hospital em 2016. . . 123
E.3 Proporção de presença de códigos de diagnóstico com frequências anormais em pelo menos um hospital, por APR-DRG e hospital em 2016 . . . 125
E.4 Proporção de presença de comorbilidades de Charlson com frequências anormais em pelo menos um hospital, por APR-DRG e hospital em 2016 . . . 127
F Distribuição de GDH por hospital em 2017 131
F.1 Proporção de APR-DRG de internamentos com pneumonias por hospital em 2017 131
F.2 Proporção de níveis de severidade (SOI) dentro de cada APR-DRG relacionado com internamentos com pneumonias, por hospital em 2017. . . 133
F.3 Proporção de presença de códigos de diagnóstico com frequências anormais em pelo menos um hospital, por APR-DRG e hospital em 2017 . . . 135
F.4 Proporção de presença de comorbilidades de Charlson com frequências anormais em pelo menos um hospital, por APR-DRG e hospital em 2017 . . . 137
G Alterações no Agrupamento de GDH 139
G.1 Frequências de cada código de diagnóstico principal relacionado com pneumonia na classificação APR-DRG base e frequência de cada GDH por hospital ao longo dos anos (2015, 2016 e 2017) . . . 139
G.2 Frequências gerais de cada código de diagnóstico secundário relacionado com pneumonia na classificação APR-DRG base e frequência de cada GDH por hospital ao longo dos anos (2015, 2016 e 2017) . . . 144
G.3 Impacto dos códigos relacionados com pneumonia, como diagnóstico principal ou secundário, no agrupamento e financiamento longo dos anos (2015, 2016 e 2017) nos GDH 137, 138 e 139 . . . 154
G.4 Impacto dos códigos de diagnósticos secundários relacionados com pneumonia no agrupamento e financiamento nos GDH 137, 138 e 139 . . . 160
G.4.1 Alterações no agrupamento com a remoção de códigos, relacionados com pneumonias, como diagnóstico secundário em 2015 . . . 160
G.4.2 Alterações no agrupamento com a remoção de códigos, relacionados com pneumonias, como diagnóstico secundário ao longo dos anos em 2016. . . 163
G.4.3 Alterações no agrupamento com a remoção de códigos, relacionados com pneumonias, como diagnóstico secundário ao longo dos anos em 2017. . . 166
G.5 Frequência de episódios de internamento com pneumonias onde a presença de uma comorbilidade aumenta a complexidade do agrupamento do GDH ao longo dos anos169 G.5.1 Proporção de casos onde presença de comorbilidades altera o agrupamento,
aumentando a complexidade do APR-DRG em internamentos com pneu-monias ao longo dos anos . . . 170
G.6 Potencial impacto das comorbilidades no agrupamento e financiamento nos GDH 137, 138 e 139 . . . 172
G.6.1 Alterações no agrupamento com a remoção de comorbilidades discrepantes ao longo dos anos por hospital . . . 172
G.6.2 Alterações no agrupamento com a remoção de comorbilidades discrepantes em 2015 . . . 173
G.6.3 Alterações no agrupamento com a remoção de comorbilidades discrepantes em 2016 . . . 178
G.6.4 Alterações no agrupamento com a remoção de comorbilidades discrepantes em 2017 . . . 183
Lista de Tabelas
4.1 Representação do modelo PICO definido. . . 31
4.2 Representação de domínios com base no modelo PICO definido. . . 31
4.3 Lista de técnicas de data mining para deteção de outliers . . . 33
4.4 Erros de codificação estudados associados ao impacto no financiamento. . . 34
6.1 Caracterização geral dos dados de estudo, internamentos com pneumonia de 2015, 2016, 2017 e total dos três anos.. . . 48
6.2 Descrição dos GDH presentes na população de estudo, internamentos com pneu-monia, segundo a APR-DRG versão 31 e a sua frequência nos anos de estudo. . . 50
6.3 Caracterização de valores de mediana do tempo de internamento (dias), idade, nível de severidade, número de diagnósticos secundários e número de comorbilidades por internamento, por GDH base do internamento e seu percentual na amostra, ordenados de forma descendente. . . 51
6.4 Comparação de proporções percentuais da presença de comorbilidades de Charlson em internamentos com pneumonia em 2015, 2016 e 2017.. . . 52
6.5 Mediana da idade do paciente por GDH e por hospital em internamentos com pneumonia. . . 54
6.6 Proporções de GDH com frequências discrepantes, estatisticamente significativas, por hospital ao longo do tempo (2015, 2016 e 2017). . . 57
6.7 Proporções de GDH 137, 138 e 139 e nível de severidade (SOI) com frequências discrepantes, estatisticamente significativas, por hospital ao longo do tempo (2015, 2016 e 2017). . . 58
6.8 Proporções de GDH e diagnóstico principal com frequências discrepantes, estatis-ticamente significativas, por hospital ao longo do tempo (2015, 2016 e 2017) . . . 60
6.9 Proporções de GDH e comorbilidades de Charlson com frequências discrepantes, estatisticamente significativas, por hospital ao longo do tempo (2015, 2016 e 2017). 61
6.10 Efeitos gerais de cada código de diagnóstico principal relacionado com pneumonia na classificação APR-DRG ao longo dos anos. . . 67
6.11 Efeitos gerais de cada código de diagnóstico secundário relacionado com pneumonia na classificação APR-DRG ao longo dos anos. . . 67
6.12 Códigos relacionados com pneumonia, como diagnósticos secundário, com potencial impacto financeiro em episódios de internamento com pneumonia. . . 68
6.13 Potencial impacto financeiro (em euros) entre a atribuição do GDH inicial e o alterado, com a remoção de diagnóstico secundário relacionado com pneumonias em episódios de internamento com pneumonia. . . 68
6.14 Potencial impacto financeiro das comorbilidades no GDH em episódios de interna-mento com pneumonia por hospital ao longo dos anos. . . 69
6.15 Potencial impacto financeiro (em euros) entre a atribuição do GDH inicial e o alterado, com a remoção de comorbilidades discrepantes em episódios de internamento com pneumonia.. . . 70
Lista de Figuras
3.1 Taxa de mortalidade padronizada por 100 000 habitantes por algumas causas respiratórias de morte (ICD-10). Comparação entre Europa e Portugal em função
do sexo, 2015 . . . 8
3.2 Média de mortalidade de pneumonias por 100 000 habitantes de três anos (2013-15) 10 3.3 Formação do GDH segundo a APR-DRG. . . 12
3.4 Relação da presença de comorbilidades com outras variáveis . . . 28
4.1 Diagrama PRISMA de fluxo da estratégia de pesquisa e resultados obtidos. . . . 32
4.2 Distribuição de publicação ao longo dos anos. . . 33
6.1 Distribuição do tempo de internamento com pneumonia em 2015, 2016 e 2017 . . 49
6.2 Distribuição de internamentos com pneumonia em função da idade do paciente em 2015, 2016 e 2017 . . . 49
6.3 Distribuição de GDH em 2015, 2016 e 2017 por internamentos com pneumonia. . 50
6.4 Comparação da distribuição do número de comorbilidades e de diagnósticos secundários por internamento com pneumonia . . . 52
6.5 Distribuição de internamentos por hospital em 2015, 2016 e 1017 . . . 53
6.6 Distribuição do GDH base em cada hospital ao longo do tempo.. . . 55
6.7 Distribuição de GDH base em cada hospital ao longo do tempo. . . 56
6.8 Distribuição dos níveis de severidade no GDH 137 - Infeções e/ou inflamações respiratórias major em cada hospital ao longo do tempo . . . 63
6.9 Distribuição dos níveis de severidade no GDH 138 - Broquiolite e pneumonia por vírus sincicial respiratório em cada hospital ao longo do tempo . . . 64
6.10 Distribuição dos níveis de severidade no GDH 139 - Outras pneumonias em cada hospital ao longo do tempo . . . 65
Acrónimos
ACSS Administração Central do sistema de
Sáude
APR-DRG All Patient Refined
Diagnosis-Related Groups
CART Classification and Regression Tree
CID-10 Classificação Internacional de
Doenças 10a Revisão
DRG Diagnosis-Related Groups
EUA Estados Unidos da América
GCD Grande Categoria Diagnóstico
GDH Grupo de Diagnóstico Homogéneos
ICD-9 International Classification of
Diseases, 9th Revision
ICD-9-CM International Classification of
Diseases, 9th Revision, Clinical Modification
ICD-10-CM International Classification of
Diseases 10th Revision, Clinical Modification
ICD-10-PCS International Classification of
Diseases 10th Revision, Procedure Coding System
ICM Índice de case-mix
kNN K Nearest Neighbours
MDC Major Diagnostic Categories
MeSH Medical Subject Headings
ML Machine Learning
OCDE Organização para a Cooperação e
Desenvolvimento Económico
OMS Organização Mundial da Saúde
PICO P-População/problema;
I-intervenção/sistema; C-comparador; O-outcome
ROC Receiver Operating Characteristics
ROM Risk of Mortality
SNS Serviço Nacional de Saúde
SOI Severity of Illness
SVM Support Vector Machines
Capítulo 1
Introdução
O sistema de classificação de Grupos de Diagnósticos Homogéneos (GDH) foi desenvolvido para agrupar casos hospitalares em agrupamentos específicos de pacientes com semelhantes causas de admissão, uso de recursos e custos hospitalares (Aiello and Roddy,2017).
Os GDH são uma classificação esquemática de pacientes que fornece um meio de relacionar o tipo de pacientes que um hospital trata com os custos incorridos pelo hospital. A motivação inicial para o desenvolvimento dos GDH foi criar uma estrutura eficaz para monitorizar a qualidade do atendimento e a utilização de serviços nos hospitais. Os GDH são utilizados para a codificação clínica hospitalar, traduzindo na codificação os procedimentos, diagnósticos e atos que caracterizam o contacto do utente com o hospital (seja em internamento de longa ou curta duração, consultas externas ou urgências), mediante nomenclaturas e sistemas de codificação adequados. Taxas de pagamento prospetivas baseadas em GDH foram estabelecidas como base do sistema de reembolso hospitalar do Medicare (Busse et al.,2011).
Os GDH dependem da qualidade dos dados clínicos mantidos em bases de dados administrati-vos de saúde, principalmente diagnósticos e procedimentos (ACSS, 2018; Busse et al., 2011). No entanto, certas anomalias encontradas nas bases de dados podem ser dispendiosas para sistemas de financiamento hospitalar baseados em GDH, nos quais a codificação precisa e completa de diagnósticos e procedimentos é crucial para a atribuição adequada de GDH (Busse et al.,2011; Luo and Gallagher, 2010). Além disso, como os dados clínicos codificados são usados em diversas áreas (financiamento de serviços de saúde, pesquisa em ciências da saúde, etc.) os erros de codificação têm consequências de longo alcance (Cheng et al.,2009). Estes erros podem surgir por diversas causas e devem ser analisados em auditoria (Januleviciute et al.,2016)
Após a implementação deste agrupamento de episódios hospitalares em 1983 (Busse et al., 2011), vários países em todo o mundo incorporaram GDH como sistema de financiamento hospitalar (Mathauer and Wittenbecher,2013), classificando internamentos para pagar/reem-bolsar serviços hospitalares. O algoritmo de agrupamento GDH foca-se nas informações sobre diagnósticos e procedimentos do internamento (Cheng et al., 2009). O sistema de financiamento hospitalar de Portugal atualmente usa uma versão mais refinada do sistema GDH: All Patient
2 Capítulo 1. Introdução
Refined Diagnosis-Related Groups (APR-DRG).
Os dados codificados para a classificação em GDH são gerados subjetivamente a partir da interpretação de registos clinicos e notas de alta por médicos codificadores especializados, podendo levar a problemas de qualidade de dados, na forma de perda de objetividade e credibilidade dos mesmos. Isso geralmente acontece quando ocorre miscoding. Miscoding (undercoding ou upcoding) na codificação de doenças tem um impacto económico nas finanças hospitalares. No caso de
undercoding, relatórios incompletos ou imprecisos, com efeito em códigos relevantes, podem
resultar em perdas de reembolsos para hospitais sob sistemas de pagamento baseados em GDH (Reid et al., 2000). Por falta de informação, um episódios de internamento podem ser atribuídos a um GDH de menor intensidade de recursos do que realmente é. No caso de upcoding, a unidade hospitalar receberá reembolsos mais altos pelos serviços prestados, transferindo pacientes de GDH com valores mais baixos para GDH com valores mais altos (Dafny,2005). Em ambos os casos, pode haver interesse oculto em introduzir um código que não corresponda à realidade. Um codificador hospitalar pode tentar explorar o resumo da alta de modo a selecionar os melhores códigos possíveis (incluindo mudanças entre o diagnóstico principal e secundário), pode procurar condições reembolsáveis nos registos médicos e/ou a escolha dos códigos hospitalares pode ser feita com exagero (como a adição de diagnósticos secundários para que a condição do paciente pareça mais complicada) (Pongpirul and Robinson, 2013). Consequentemente, pode dizer-se que, para não prejudicar a classificação adequada do GDH e monitorizar de perto o financiamento hospitalar correspondente, é fundamental observar os níveis de qualidade dos dados do APR-DRG.
O aumento dos custos de saúde são uma questão iminente em muitos países desenvolvidos. E, de forma a controlar os custos da melhor maneira, tende a usar-se técnicas de prospeção de dados (data mining) para entender melhor e de forma mais rápida os sistemas de saúde, surgindo soluções a serem aplicadas para diminuir custos (Luo and Gallagher, 2010). Os registos médicos do paciente contêm muitas informações relacionadas com as condições do paciente, tratamentos e resultados de laboratório. Geralmente envolvem vários tipos de dados e produzem uma grande quantidade de informações, que poderão ser importantes para a decisão clínica e gestão hospitalar. Neste contexto, técnicas de data mining podem ser usadas para detetar padrões anormais em registos de saúde (por exemplo, problemas na qualidade dos dados) (Gaspar et al.,2011), contribuindo para melhorias nos dados e no conhecimento no processo de decisão. Técnicas de data mining, destacando Machine Learning, podem ser usadas para identificar possíveis casos de erros de codificação e suportar processos de auditoria. Quanto à deteção de erros de codificação em bases de dados de saúde, a maioria dos investigadores descreve métodos estatísticos ou supervisionados de Machine Learning para detetar upcoding (Bauder et al., 2017). Estes algoritmos supervisionados são, normalmente, suportados por regressão linear, mista, redes neuronais, árvores de decisão e técnicas bayesianas (Bauder and Khoshgoftaar,2016). Poucos são os estudos que empregam Machine Learning não supervisionado para deteção de erros de codificação. Os investigadores Luo e Suresh (Luo and Gallagher,2010;Suresh et al.,2014) são das poucas referências desta técnica e focam-se em casos de upcoding relacionados com os GDH do agrupador APR-DRG. Além dessa análise, também comparam a distribuição de consumos de
1.1. Organização 3
recursos dentro de subgrupos homogéneos de pacientes designados para o mesmo GDH, com o objetivo de detetar hospitais com perfis anormais.
Motivada, pelas possíveis falhas de codificação e potenciais consequências, juntamente com a evolução da prática de data mining em dados hospitalares, nesta dissertação é apresentado um estudo de utilização de técnicas de data mining para deteção de anomalias em dados de internamento com pneumonias, com o principal objetivo de determinar outliers e/ou possíveis problemas de codificação, como upcoding ou undercoding, que podem impactar no correto agrupamento do GDH e, portanto, no financiamento hospitalar, utilizando técnicas de data
mining e de forma a reunir condições que melhorem a qualidade dos GDH, auxiliando as
auditorias e melhorando a prática de codificação. A metodologia utilizada é baseada em técnicas estatísticas, análise de proporções e utilização de machine learning, nomeadamente modelos de
Support Vector Machines. Ao longo do estudo ter-se-á o foco nos internamentos por doenças
respiratórias, especialmente, internamentos com pneumonias. Esta escolha deve-se ao facto de que, em Portugal, os internamentos codificados de Doenças e Distúrbios do Sistema Respiratório (MDC 4) correspondem à maioria dos internamentos hospitalares (Souza et al., 2018), sendo que as doenças do sistema respiratório são uma das principais causas de morte na União Europeia. Destacando a pneumonia por apresentar uma taxa de mortalidade de 28.1% na União Europeia e 57.7% em Portugal, em 2015, na totalidade de mortes por doença respiratória (Database,2018).
1.1
Organização
A dissertação encontra-se organizada em oito capítulos, sendo eles:
• 1 Introdução - Destina-se a explicitar os motivos para a realização desta dissertação,
destacando a problemática inerente a este tema;
• 2 Objetivos - Foca-se na descrição dos objetivos que se pretende alcançar;
• 3Enquadramento teórico - Este capítulo encontra-se sub-dividido em três subcapítulos,
referentes à contextualização da problemática sobre o tema da dissertação, doenças e distúrbios do sistema respiratório, salientando pneumonias, codificação clínica hospitalar em Portugal e data mining;
• 4Data mining e outliers em dados hospitalares com impacto no financiamento
- Apresenta, através de um método rigoroso e transparente, o levantamento de informação sobre o panorama internacional e nacional quanto à utilização de técnicas de data mining para deteção de anomalias em dados de internamento com impacto no financiamento;
• 5 Materiais e métodos - Descreve o processo de captura dos dados, período de análise,
informação relevante sobre a amostra e informações analisadas;
• 6 Resultados - Apresenta resultados obtidos, divindo-os por descrição da amostra,
4 Capítulo 1. Introdução
descrição da amostra apresenta algumas informações que a caracterizam, comparando-as entre os três anos de estudo e por hospital. As discrepâncias obtidas são apresentadas por métodos estatísticos, uma análise categórica da amostra e uma comparação de proporções de possíveis erros de codificação entre os hospitais presentes no grupo hospitalar selecionado. São também expostos os diagnósticos relacionados com pneumonia (principais e secundários) e comorbilidades que influenciaram o agrupamento de GDH, efetuada por machine learning supervisionada, com base em modelos SVM, e o seu potencial impacto financeiro;
• 7 Discussão - São feitas algumas considerações de forma individual sobre os dados
recolhidos e analisados, espaço onde é dada uma opinião própria e científica sobre os dados que foram recolhidos. São retiradas as respetivas ilações baseadas unicamente nos valores obtidos na secção de resultado. São também apontadas algumas falhas e limitações que foram verificadas durante a realização do estudo;
• 8 Conclusão - Neste capítulo será sintetizado todo o estudo, salientado as suas principais
Capítulo 2
Objetivos
O objetivo principal, do presente trabalho, é determinar outliers e/ou problemas de codificação em base de dados administrativos de internamentos, em hospitais portugueses, em episódios com um diagnóstico de pneumonia, utilizando técnicas de data mining.
Deste objetivo resultam questões de investigação. As questões de investigação são os guias que orientam o tipo de informação necessária, como a recolha de informação deve ser feita e define a abrangência do corpus de dados para a resolução de um problema. Levando a que a questão de investigação seja um dos primeiros passos e um passo vital para o processo de investigação.
Posto isto, definiu-se as seguintes principais questões de investigação:
• Haverá discrepâncias de codificação clínica entre hospitais?
• As discrepâncias encontradas são possíveis problemas de codificação, como upcoding ou undercoding, que podem impactar no correto agrupamento de internamentos com pneumonias em GDH e, portanto, no financiamento hospitalar?
• As técnicas de data mining utilizadas facilitam a deteção de anomalias de codificação em casos de Doenças e Distúrbios do Sistema Respiratório, especialmente, pneumonias?
De forma complementar, definiu-se um objetivo secundário, comparar dados de internamento por pneumonias de 2015, 2016 e 2017 e analisar o impacto na mudança de tipo de codificação (ICD-9 para ICD-10) na deteção de anomalias e eficácia das técnicas de data mining utilizadas
nas duas terminologias.
Capítulo 3
Enquadramento teórico
3.1
Doenças e distúrbios do sistema respiratório
As doenças do sistema respiratório são uma das principais causas de morte na União Europeia e incluem casos clínicos como a doença pulmonar obstrutiva crónica, asma, pneumonia e cancro do pulmão, como é possível observar na figura 3.1. Em 2015, houve 442 mil mortes na União Europeia, resultantes de doenças do sistema respiratório, o equivalente a 8.5% de todas as mortes (Eurostat, 2016). Segundo a Eurostat, as doenças respiratórias representam pelo menos 1 em 10 mortes em Portugal, Irlanda, Espanha, Grécia, Dinamarca, Bélgica e Malta. Além disso, o aumento da esperança de vida tem um impacto importante na morbilidade e mortalidade das doenças respiratórias crónicas, sendo expectável o seu aumento nos próximos anos (OECD and União Europeia,2016;OECD,2015). Desde 1990, Portugal e a Irlanda são os países da União Europeia que apresentaram mais ganhos na esperança de vida, com média de 65 anos (mais de 4,5 anos que a União Europeia) (OECD and União Europeia,2016). Todavia, Portugal ainda se encontra abaixo do valor médio de anos de vida saudável em comparação à União Europeia (Portugal: 56,6 anos; União Europeia: 62,95 anos) (Alves et al.,2017). Os portugueses em relação a outros povos da Europa, convivem longos anos em situação de doença, suscetibilizando-os para outras doenças, retirando-lhes qualidade de vida, provocando enormes custos individuais e sociais, e pressão sobre os serviços de saúde. Em Portugal, os indivíduos com mais de 65 anos representam cerca de 20% de toda a população, o que tem óbvias implicações na saúde respiratória (Alves et al., 2017). Esta realidade constitui um desafio para o Serviço Nacional de Saúde, que deverá ser capaz de fazer face a estas alterações demográficas e epidemiológicas, mediante uma redução da mortalidade prematura (abaixo dos 70 anos de idade) e um aumento dos anos de vida saudáveis ou livres de incapacidade (Bárbara et al.,2017).
8 Capítulo 3. Enquadramento teórico
Figura 3.1: Taxa de mortalidade padronizada por 100 000 habitantes por algumas causas respiratórias de morte (ICD-10). Comparação entre Europa e Portugal em função do sexo, 2015. (Fonte: Eurostat (2016))
A análise das taxas de mortalidade por doença respiratória (excluindo o cancro do pulmão e a tuberculose) evidencia uma redução da mortalidade prematura, tendo um aumento no número absoluto de mortes decorrente acima dos 65 anos (Bárbara et al.,2017). Contudo, as doenças do sistema respiratório são uma das principais causas de morte tanto na União Europeia como nos Estados Unidos da América (Eurostat,2016). Segundo um relatório da Organização para a Cooperação e Desenvolvimento Económico (OCDE), verificou-se que em Portugal, entre 2006 e 2015, houve um aumento progressivo de internamentos, com um número total de internamentos por doenças respiratórias, de 35%, e os episódios de doentes submetidos a ventilação mecânica cresceu 167% (Alves et al., 2017). Contribuindo para este aumento os internamentos por pneumonias, fibroses pulmonares, neoplasias, patologia pleural e insuficiência respiratória. Os episódios de internamento com insuficiência respiratória têm aumentado todos os anos, avaliados quer em doentes do sexo masculino, quer do sexo feminino, com o valor de 76% entre 2006 e 2015. Os internamentos por pneumonias como diagnóstico principal apresentam valores com aumento progressivo em doentes do sexo feminino, com aumento de 20.4%, e predominância em doentes do sexo masculino. A mortalidade nos internamentos por pneumonias é elevada, ronda os 20% e nas situações com necessidade de prescrição de ventilação mecânica este valor é superior a 36%. Piorando este cenário em situações de doentes com pneumonia com comorbilidades ou complicações, que ultrapassa os 40% e nos doentes com mais de 79 anos é superior a 50%.
3.1.1 Pneumonias
A pneumonia é uma forma de infeção respiratória aguda que afeta os pulmões. Os pulmões são compostos de pequenos sacos chamados alvéolos, que se enchem de ar quando uma pessoa saudável respira. Quando um indivíduo tem pneumonia, os alvéolos ficam cheios de abcessos e líquido, o que torna a respiração dolorosa e limita a inalação de oxigénio (Schraufnagel,2010;
3.1. Doenças e distúrbios do sistema respiratório 9
World Health Organization, 2016). Os pulmões são particularmente suscetíveis à infeção porque interagem com o ambiente externo. Eles estão expostos a cerca de 10.000 litros de ar por dia, que podem conter agentes infeciosos ou tóxicos(Schraufnagel, 2010). A pneumonia pode afetar pessoas de todas as idades, especialmente os mais jovens e os mais velhos, e é causada por vários agentes infeciosos, incluindo vírus, bactérias e fungos (Associação Respira, 2015). Pneumonia ocorre geralmente em indivíduos que vivem em comunidade ("pneumonia adquirida na comunidade"), bem como indivíduos que são hospitalizados por outro motivos ("pneumonia adquirida em hospital") (Schraufnagel,2010). Embora a pneumonia possa ocorrer em qualquer pessoa, ocorre com maior frequência em indivíduos cujo sistema imunológico se encontra frágil (Mizgerd,2008).
Desde 1901, Dr William Osler, fundador da medicina moderna, estudou a pneumonia ao longo da sua carreira e designou-a como "captain of the men of death" devido ao seu grande efeito na humanidade (Schraufnagel, 2010). A pneumonia é das doenças respiratórias com maior relevância devido ao número de casos anuais e da mortalidade que acarreta - Figura3.1. Infelizmente, em Portugal não estamos a conseguir diminui nem a sua mortalidade nem a sua morbilidade (Alves et al., 2017). No entanto, este problema não é exclusivo de Portugal. Além da faixa etária idosa que atinge, a Organização Mundial da Saúde (OMS) alerta que, a pneumonia é responsável por 16% de todas as mortes de crianças menores de 5 anos, matando 920 136 crianças em 2015 (World Health Organization,2016). Desde do século XIX que se considerava a pneumonia uma doença respiratória grave e bastante presente na sociedade. Após 150 anos o mesmo ainda persiste. Nos países mais desenvolvidos, a pneumonia adquirida na comunidade representa a primeira causa de morte por doença infecciosa (Niederman et al.,1998) e, na última década, estudos em diferentes países (Fry et al., 2005; Trotter et al., 2008) documentam um aumento do número de internamentos hospitalares por pneumonia adquirida na comunidade. A pneumonia é, excluindo o cancro do pulmão, de longe a maior causa de letalidade respiratória. Em Portugal, em média, no período de 2000 e 2009, foram internados diariamente 81 adultos com pneumonia na comunidade, dos quais 16 faleceram no decurso desse internamento (Froes,2013).
Segundo o relatório Observatório Nacional das doenças respiratórias em Portugal, em 20 anos, os internamentos por pneumonia aumentaram 171% (principal causa de internamento e atualmente representa 8% do total de internamentos médicos) e a mortalidade registou um aumento de 53% em 16 anos (Alves et al., 2017). Levando a que em 2015, a taxa de mortalidade de pneumonias, em toda a mortalidade por doença respiratória, na União Europeia seja de 28.1% e em Portugal de 57.7% - Figura3.2. Estes dados são de extrema preocupação, visto que Portugal não é um país com piores condições atmosféricas, nem com os piores hábitos tabágicos. Doentes com pneumonia, quase 70% tem mais de 64 anos, havendo predomínio no sexo masculino e maior mortalidade no sexo feminino, nesta faixa etária (Bárbara et al., 2017). Embora já estudado por diversos autores, a incidência de pneumonia depende de inúmeros fatores das características da população: envelhecimento, existência de comorbilidades significativas, doenças crónicas, falências orgânicas, condições climáticas e socioeconómicas, entre outras. Um fator que se mostra relevante é o tempo gasto desde o início da doença até ao internamento e a acessibilidade relacionada. Segundo a Federação Portuguesa do Pulmão, doentes com internamentos até 3 dias e com óbito
10 Capítulo 3. Enquadramento teórico
estavam mais afastados do hospital onde foram internados (Alves et al., 2017). Deste modo, é possível verificar uma diferença da taxa de internamentos e óbitos em função de regiões de Portugal. As maiores incidências de internamentos por pneunomia são em distritos do interior (Bragança, Castelo Branco, Vila Real e Portalegre), com maior mortalidade distritos de Beja (25% de óbitos), Setúbal (24%), Portalegre (22%) e Santarém e Faro (21% de óbitos e maior número de readmissões). É na região de Lisboa e Vale do Tejo, que se regista a maior taxa percentual de internamentos por pneumonia, seguindo-se as regiões do Centro e Norte do país (Alves et al.,2017). Na análise de comorbilidades há diferenças no género. No sexo feminino é mais prevalente a doença cardíaca crónica e no sexo masculino a doença respiratória crónica. Por outro lado, embora seja no Outono e Inverno que há um maior número de internamentos por pneumonia, é nos meses de verão que a taxa de mortalidade á maior.
Figura 3.2: Média de mortalidade de pneumonias por 100 000 habitantes de três anos (2013-15). (Database,2018))
3.2
Codificação clínica hospitalar em Portugal
A codificação clínica é o processo de categorizar informações de registos clínicos através de códigos, mediante nomenclaturas e sistemas de codificação adequados (Haliasos et al.,2010). As informações codificadas podem ser referentes a episódios de internamento de longa ou curta duração, ambulatório, consultas externas ou urgências. A codificação era, originalmente, aplicada a dados relativos à mortalidade mas, atualmente, é usada para classificar todos os episódios e procedimentos hospitalares com a finalidade de os reportar, fazer uma gestão da qualidade, reembolsar o hospital e permitir a sua utilização em investigação (Burns et al.,2011;Watzlaf et al.,2015;Chute et al.,2012).
3.2. Codificação clínica hospitalar em Portugal 11
de aumento de eficiência com menores custos e maior qualidade. A criação do Serviço Nacional de Saúde (SNS), após a grande revolução de 1974, onde se colocou fim a um período de ditadura em que as pessoas não tinham o direito à saúde, fez com que o Estado se tornasse responsável pelo fornecimento de cuidados de saúde, o que levou a um aumento significativo da despesa pública. De tal forma, que entre 1981 e 1990, houve uma transição para um sistema de financiamento prospetivo, que inicialmente era efetuado através da implementação de orçamentos hospitalares baseados no custo médio por especialidade e serviços individuais (Dismuke and Sena,1999). O sistema retrospetivo tem na base do pagamento a despesa histórica decorrente do tratamento dos doentes nos anos anteriores (Ma, 1994). Enquanto um modelo prospetivo, na base do pagamento encontra-se o nível de produção, ou seja, a atividade desenvolvida, é baseado nos serviços, atos e atividades realizadas, segundo uma tabela de preços definida, previamente negociados segundo um contrato-programa (Costa et al.,2008). Com esta estratégia, é possível uma utilização mais eficiente dos recursos nos hospitais públicos para obter uma maior produtividade e um controlo mais apertado da despesa pública no sector da saúde, pois são-lhe reconhecidas as capacidades, de promover eficiência técnica e conter custos (Costa et al.,2008;Saltman et al.,1997).
Em 1984 iniciou-se um projeto no Ministério da Saúde, destinado a estudar a viabilidade da implementação de um sistema de codificação clínica hospitalar em Portugal. O projeto resultou de um contrato entre o Ministério da Saúde Português e a U.S. Agency for Internantional
Development. Para os estudos de adaptação do modelo americano à realidade portuguesa, este
projeto contou com a consultadoria do Health Systems Manegement Group (ACSS,2018).
Em 1990 foi definitivamente introduzida a unidade de medida "Grupo de Diagnóstico Homogéneo"(GDH), estudada desde 1987 para o nosso país. Na sua versão atual cada doente é classificado num GDH, a partir do sistema orgânico afetado, a realização ou não de intervenção cirúrgica e o tipo de intervenção, o diagnóstico principal, os diagnóstico secundários, a idade e o destino após a alta” (Instituto de Gestão Informática e Financeira de Saúde,2005). Os grupos de diagnósticos homogéneos inserem-se num sistema de informação hospitalar. Informação esta que é utilizada por médicos, gestores e investigadores, por exemplo, em processos de tomada de decisões, com o foco na melhoria da quantidade e qualidade da prestação de cuidados de saúde (Freitas,1998). Em Portugal, toda a informação relativa a diagnósticos, causas externas e procedimentos contida na nota de alta, nos registos clínicos dos diários médicos, registo do episódio de urgência que deu origem ao episódio a codificar, registo operatório e relatórios de anatomia patológica são traduzidos para códigos alfanuméricos por codificadores (ACSS,2014). A tarefa de codificação implica analisar e selecionar informação relevante contida nos registos clínicos (Bajaj et al.,2007).
O agrupador atualmente em vigor em Portual é o All Patient Refined Diagnosis-Related
Groups (APR-DRG) versão 31 (Ministério da Saúde,2017). O APR-DRG tem uma estrutura hierárquica, onde no primeiro nível é possível encontrar a grande categoria diagnóstica (GCD), definida com base no diagnóstico principal, isto é, a principal razão para a admissão no hospital. A GCD normalmente representa uma área exclusiva de diagnóstico de acordo com um sistema de órgãos específico. Num segundo nível (o mais baixo), o código de diagnósticos e de procedimentos
12 Capítulo 3. Enquadramento teórico
médicos ou cirúrgicos também é capturado usando o valor de referência correspondente proposto pelo International Classification of Diseases, 9th Revision, Clinical Modification (ICD-09-CM) e convenientemente armazenado num APR-DRG. Estes procedimentos foram organizados hierarquicamente desde o maior até ao menor consumidor de recursos hospitalares. Cada APR-DRG cirúrgico ou médico representa a causa de hospitalização do paciente.
Na classificação APR-DRG, os episódios dentro de uma determinada categoria de diagnóstico principal serão atribuídos a uma GDH base que representa uma doença especifica e/ou procedi-mento relacionado a uma GCD (Averill et al.,2013) - Figura 3.3. Os episódios médicos serão agrupados num GDH base principalmente de acordo com o diagnóstico principal, enquanto que os episódios cirúrgicos serão agrupados de acordo com um procedimento cirúrgico. O agrupador APR-DRG versão 31 ainda acrescenta um nível de severidade (Severity of Illness - SOI) e um nível de risco de mortalidade (Risk of Mortality - ROM), considerando combinações de GDH base, diagnóstico principal, categorias de diagnósticos secundários, idade e procedimentos cirúrgicos e não cirúrgicos.
3.2. Codificação clínica hospitalar em Portugal 13
A severidade da doença é entendida como o grau de descompensação fisiológica ou da perda de funções de um órgão ou sistema de órgãos e o risco de mortalidade é entendido como a probabilidade de ocorrer a morte do doente em decorrência da doença ou tratamento (ACSS, 2014). A severidade está relacionada com o consumo de recursos e determina o financiamento hospitalar, enquanto a mortalidade está relacionada com o risco de falecer e é geralmente utilizada para ajuste de risco de mortalidade intra-hospitalar. A determinação dos níveis de SOI e ROM é caracterizada por uma escala variando de 1 a 4 (1 - menor; 2 - moderado; 3 - maior; 4 - extremo). Apesar deste tipo de agrupador considerar níveis de severidade e de risco de mortalidade, o peso relativo de cada GDH considera apenas a severidade, sendo tanto maior quanto maior for o nível de severidade. Por outro lado, apesar da influência de quase todas as características do paciente, são os diagnósticos secundários, que representam comorbilidades e complicações, o que normalmente conduz aos níveis de SOI e ROM (Aiello and Roddy,2017). O cálculo correto dos níveis de SOI e ROM é relevante no sentido de que ambos foram aplicados e validados (Iezzoni et al., 1996; Baram et al., 2008; Goldfield and Averill, 2000; McCormick et al., 2018), como ferramentas para pagamento hospitalar (SOI) e ajuste de risco de mortalidade hospitalar (ROM). Portanto, a falha em relatar corretamente todos os diagnósticos relevantes pode ter um impacto substancial na designação do SOI e afetar diretamente o valor total a ser recebido ou alocado aos hospitais. Particularmente, na lógica de agrupamento GDH, os diagnósticos secundários que representam comorbilidades geralmente conduzem a determinação de SOI (Mathauer and Wittenbecher,2013).
O agrupador de tipo APR-DRG, além de possibilitar a subdivisão em níveis de severidade e risco mortalidade, caracteriza-se por subdividir os episódios em 26 Grupos de Diagnósticos Homogéneos (GCD), exclusivas entre si, e que correspondem a um sistema orgânico associadas a uma especialidade médica em particular (ACSS,2014). Considera ainda, para alguns GDH, 3 níveis de complexidade: i) sem Complicações ou Comorbilidades, ii) com Complicações ou Comorbilidades e iii) com Complicações ou Comorbilidades major (ACSS,2014;Ministério da Saúde,2017).
3.2.1 Classificação de diagnósticos e procedimentos
Desde 1989 que se utiliza a ICD-09-CM (International Classification of Diseases, 9th Revision,
Clinical Modification), classificação de diagnósticos e procedimentos que resulta da adaptação
efetuada nos Estados Unidos da América (EUA) a partir do sistema de classificação proposto para a Organização Mundial da Saúde (OMS), para codificação de diagnósticos e procedimentos realizados em internamento, ambulatório médico ou ambulatório cirúrgico (ACSS, 2018). Apesar de inicialmente a codificação apenas ser utilizada para facultar o acesso a registos médicos para investigação, educação e administração, atualmente são utilizados para (Freitas,1998):
• Facilitar o pagamento de serviços de saúde;
14 Capítulo 3. Enquadramento teórico
• Estudar os custos dos cuidados de saúde;
• Investigar a qualidade dos cuidados de saúde;
• Prever as tendências dos cuidados de saúde;
• Planear as necessidades futuras dos cuidados de saúde;
Esta classificação - ICD-09-CM - é utilizada para efeitos de codificação das altas hospitalares, possibilitando o agrupamento de episódios de internamento e de ambulatório em GDH. Portugal optou sempre pela adoção do agrupador existente nos EUA.
No entanto, tendo em conta as limitações da ICD-09-CM, a OMS autorizou o governo dos EUA a proceder à adaptação da décima revisão para efeitos de classificação de diagnósticos e procedimentos. As razões da mudança da codificação clínica, além da atualização na caracterização da morbilidade hospitalar e todas as áreas relacionada, têm como fundamento a limitação para retratar convenientemente a diversidade dos diagnósticos e procedimentos acrescentado que, a décima revisão, é uma metodologia mais exaustiva e mais adequada para retratar as inovações nosológicas (ACSS, 2016). A ICD-10-CM permite uma maior exaustividade, especificidade e precisão na caracterização da morbilidade, proporcionando condições para se estabelecerem modelos de financiamento mais equitativos e promotores das boas práticas e da inovação clínica.
A ICD-10-CM/PCS (International Classification of Diseases 10th Revision, Clinical
Modifi-cation / Procedure Coding System) foi criada nos EUA para substituir a ICD-09-CM (volume 1
e 2) na codificação de diagnósticos, sendo a ICD-10-PCS criada para substituir a ICD-09-CM (volume 3) para a classificação de procedimentos (Centers for Disease Control and Prevention,
2017). O sistema entrou em vigor em Portugal a 1 de janeiro de 2017, ICD-10 (Ministério da Saúde,2017) para diagnósticos e procedimentos, onde os episódios, independentemente da data de alta do episódio, admitam a data da primeira codificação igual ou superior a 1 de janeiro 2017. O processo de transição ainda se encontra ativo para a maioria dos hospitais Portugueses. No que se refere ao agrupador de GDH, com a adoção da ICD-10-CM/ICD-10-PCS mantém-se em vigor o APR-DRG versão 31 (ACSS,2016).
3.2.2 Codificação clínica - Transição para ICD-10
A principal diferença entre a ICD-09 e a ICD-10 é o nível de especificidade que os profissionais de saúde devem usar para descrever sinais, sintomas e doenças. A ICD-10-CM tem mais de 69 000 códigos, mais de 55 000 códigos de diagnósticos do que a ICD-09-CM (Watzlaf et al., 2015). Pelo que reflete avanços na medicina e tecnologia médica, sendo flexível o suficiente para adicionar novos códigos quando necessário. ICD-10-CM representa uma revisão importante, projetada para oferecer melhor suporte no papel da codificação no reembolso, medição da qualidade e monitorização (Bowman,2008).
Assim, a conversão para o novo sistema ICD-10-CM permite obter melhores dados para (1) medir a qualidade, segurança e eficácia, (2) investigar e (3) obter mais eficiência nos sistema
3.2. Codificação clínica hospitalar em Portugal 15
de saúde. Há uma redução antecipada nos erros de codificação (Cartwright, 2013) devido à maior especificidade dos códigos e uma redução geral dos custos e melhoria da eficiência no sistema de saúde. O aumento da granularidade na codificação do diagnóstico permitirá uma melhor justificação da necessidade médica, reembolso preciso e monitorização mais fácil dos dados de qualidade para os resultados. A especificidade dos novos códigos permitirá que os pesquisadores tenham acesso a dados mais específicos para fins de pesquisa. No entanto, o seu potencial proporciona uma rotura do funcionamento dos sistemas clínicos atuais (Boyd et al., 2015; Khera et al.,2018), resultando em vários atrasos na sua adoção final. Levou a que um número elevado de hospitais invista na conversão dos sistemas de codificação, no redesenho dos programas de computador e no treino administrativo. Sendo mudanças que despendem tempo e dinheiro, alguns hospitais, especialmente os mais pequenos, não se prepararam o suficiente para que o novo sistema de classificação entrasse em vigor na data prevista (Chute et al.,2012). Por exemplo, nos EUA, era previsto que a implementação da ICD-10-CM/PCS entrasse em vigor em 2013 e só foi concretizado a 1 de outubro de 2015.
O aumento de especificidade exigido com ICD-10-CM/PCS implica que os codificadores e os médicos alterem a forma de codificar e documentar no registo clínico, sendo a representação mais específica de comorbilidades e complicações. Melhorando a descrição da severidade da doença permite uma gestão mais efetiva e inteligente da doença. Estas alterações afetam a transição e a qualidade dos sistemas de classificação, é mais fácil a deteção de casos de fraudes, porque se torna mais fácil comparar os dados codificados com a informação documentada no registo clínico e discriminar a lateralidade.
ICD-10-CM foi desenhada para capturar doenças de saúde pública mais efetivamente, de forma mais completa e clara do que a ICD-09-CM (Watzlaf et al., 2007). No entanto, a melhoria na qualidade dos dados e a redução dos custos com os cuidados de saúde serão, somente a longo prazo, vantagens do novo sistemas de classificação (Manchikanti et al., 2014;Rousse,2013). Uma mudança abrupta no mapeamento de codificação ou terminologia acarreta diversos custos, como por exemplo com as mudanças nos sistemas de informação, e, intrinsecamente, a fase de transição é uma barreira para a qualidade dos dados codificados (Andrews,2015), é necessário compreender e aprender o uso do novo sistema. Custos de implementação, complexidade e granularidade do sistema de classificação, necessidade de aumentar a especificidade dos registos clínicos, aumento do treino para os codificadores, impacto no tempo e na produtividade, são potenciais problemas decorrentes no processo de transição. Porém, é mais problemático para atividades dependentes de uma relação longitudinal estável entre códigos diagnósticos e realidade clínica (Stewart et al.,2019; Butz et al.,2016). Essa estabilidade é essencial para a vigilância da saúde pública, métricas de qualidade da assistência médica e avaliação do impacto das intervenções de melhoria do cuidado. Rotinas das instituições de saúde foram afetadas desde a documentação dos médicos nos registos clínicos, ao processo de codificação propriamente dito e ao processo de faturação e reembolso para os hospitais (Chute et al., 2012; Cohrs, 2014). Verificou-se um aumento dos erros de codificação (Johns et al., 2013;Sanders et al.,2012). Para combater estas situações, decorrentes da transição, várias técnicas tem sido utilizadas: uso de codificação assistida por computadores; modelos de documentação apropriados nos registos clínicos eletrónico, que auxiliem de forma efetiva a seleção
16 Capítulo 3. Enquadramento teórico
dos diagnósticos e procedimentos; certificação de profissionais; e profissionais certificados que assistem médicos com a documentação dos registos eletrónico (Butz et al.,2016).
Quando analisado o impacto da transição da ICD-09-CM para ICD-10-CM muitos tem sido os estudos que comprovam um impacto mínimo nos dados. A validade dos dados administrativos da ICD-09-CM e ICD-10-CM a nível de registos das condições clínicas foi geralmente semelhante, embora a validade tenha diferido entre as versões de codificação para algumas condições (Stewart et al., 2019; Heslin and Barrett, 2018; Quan et al., 2008). Anderson e Robenberg (2003) (Anderson and Rosenberg,2003) analisaram a causa da morte antes e depois da implementação da ICD-10 nos Estados Unidos e verificaram que a classificação das principais causas de morte foi substancialmente alterada devido a mudanças no sistema de classificação. Janssen e Kunst (2004) (Janssen and Kunst, 2004) analisaram a mortalidade por causas específicas a longo prazo em seis países europeus e notaram descontinuidades nas tendências de mortalidade por causa específica devido a mudanças no sistema de codificação. Kokotailo e Hill (2005) revisaram os gráficos dos registos de admissão da ICD-09-CM e ICD-10-CM e verificaram que os fatores de risco de Acidente Vascular Cerebral (AVC) foram codificados igualmente bem em ambas as versões. Além disso, os fatores de fibrilação arterial, cardiopatia isquêmica, diabetes mellitus e hipertensão foram registados significativamente melhor que os fatores de história de doença cerebrovascular, hiperlipidemia, insuficiência renal e tabagismo tanto em ICD-09-CM como em ICD-10-CM. Henderson, Shepheard e Sundararajan (2006) (Henderson et al., 2006) compararam dados codificados em ICD-10 com dados de auditoria de hospitais públicos na Austrália e demonstraram que a transição da codificação não afetou perceptivelmente a qualidade dos dados administrativos.
A implementação da codificação ICD-10-CM não melhorou significativamente a qualidade dos dados administrativos relativos à versão anterior. A má codificação de certas condições, como perda de peso, obesidade e certas anemias, pode estar relacionada ao fato de que os codificadores não codificam essas condições, mesmo que estejam documentados em gráficos, porque podem não ser explicitamente mencionados por enfermeiros ou médicos em anotações clínicas (Quan et al., 2008). Além disso, os codificadores podem intencionalmente não codificar essas condições devido ao tempo limitado dado para codificar cada gráfico. No entanto, repetidas e constantes avaliações são necessárias porque a validade dos dados da ICD-10 pode melhorar, à medida que os codificadores ganham experiência com o novo sistema de codificação.
Porém, é de salientar que ocorrem constantemente problemas associados ao processo de codificação que nada tem a ver com o processo de transição. Os erros na documentação, as variações nas descrições dos diagnósticos, falta de documentos do registo clínico, precisão do diagnóstico, abreviaturas e variações nas descrições dos diagnósticos, falta de legibilidade, formato, estrutura e organização dos documentos, etc (Pires,2018). Confirmando no estudo de Lau D. T. (Lau et al.,2018), mostrou que 89% dos registos da visita tinham códigos compatíveis com 09-CM e 10-CM, sendo que as razões para as incompatibilidades nas atribuições ICD-10-CM incluíram erro de codificador (5%), problemas de documentação como diagnósticos não codificáveis (3%) e diferenças entre ICD-09-CM e ICD-10-CM (2%).
3.2. Codificação clínica hospitalar em Portugal 17
3.2.3 Qualidade dos dados codificados
A qualidade dos dados de codificação aparece inicialmente com a finalidade de permitir o financiamento hospitalar, o que significa que podem ter qualidade para cumprir este propósito mas não ter qualquer qualidade para serem usados, por exemplo, em investigação (Batini and Scannapieco,2006;Freitas et al.,2014). Ter qualidade significa que cumpre com propósito da sua utilização. Apesar da qualidade dos dados ser adaptada ao contexto existem dimensões fixas de qualidade (Pires, 2018): exatidão (dados exatos, precisos, sem erros); plenitude (presença de valores em atributos necessários); coerência (ausência de contradições entre os dados de acordo com um conjunto de restrições); oportunidade (grau de atualização dos dados para o propósito); flexibilidade (adaptação dos dados às novas realidades); relevância (úteis para o fim a que se destinam); compreensão (claros e sem levantarem dúvidas sobre o seu valor); credibilidade (plausibilidade dos dados); confiança (quem usa os dados tem de ter confiança neles). Para
atingir essas dimensões são necessários processos de avaliação.
3.2.4 Avaliação da qualidade de codificação
De acordo com o estabelecido no Decreto-Lei no219/2007 (Ministério da Saúde,2007), alínea u) do no2 do artigo 3o, é da responsabilidade da Administração Central do Sistema de Saúde (ACSS) a realização periódica de auditorias externas à codificação clínica e faturação das instituições. A auditoria à codificação clínica é realizada à produção de internamento e do ambulatório, das instituições hospitalares do SNS, medida em GDH, com um conjunto de informação codificada: diagnósticos, procedimentos, causas externas e morfologia tumoral, e informação administrativa de data de nascimento, sexo, natureza de admissão, destino após a alta, motivo de transferência, data de admissão, data de alta e data da primeira intervenção cirúrgica (ACSS,2010). A auditoria externa tem como objetivo verificar a conformidade da codificação clínica, de acordo com as regras da classificação internacional de doentes e assegurar a qualidade no registo de informação clínica e administrativa (ACSS,2010).
Segundo a ACSS, a verificação da codificação clínica é efetuada através da análise detalhada dos processos clínicos, respetivas folhas de codificação, relatórios de anatomia patológica (se aplicável) e outros documentos disponibilizados no processo clínico. Considera um episódio “não conforme” quando existe um erro ao nível da codificação de diagnósticos, procedimentos,
causas externas, morfologia tumoral, ou em relação aos dados administrativos referidos acima. Em termos de codificação considera um episódio “conforme” quando este respeita as regras da codificação definidas pela classificação em rigor (ICD-09-CM e/ou ICD-10-CM), códigos clínicos e pelos consensos – decisões acordadas pela equipa de médicos codificadores e auditores da unidade operacional de financiamento e contratualização (ACSS,2010).
A classificação em episódio “conforme” ou “não conforme” com as regras da ICD-09-CM é mutuamente exclusiva, bem como a classificação em “Não Conformidades Críticas”, referente a episódios com erros de codificação relevantes no contexto clínico, e “Não Conformidades Não