• Nenhum resultado encontrado

Plataforma de apoio à decisão nos cuidados de ginecologia e obstetrícia

N/A
N/A
Protected

Academic year: 2020

Share "Plataforma de apoio à decisão nos cuidados de ginecologia e obstetrícia"

Copied!
177
0
0

Texto

(1)

outubro de 2015

Universidade do Minho

Escola de Engenharia

Sónia Patrícia Pinto Pereira

Plataforma de Apoio à Decisão

nos Cuidados de Ginecologia e Obstetrícia

UMinho|20 15 Sónia P atrícia Pint o P er eir a Plataforma de

(2)

Dissertação de Mestrado

Mestrado Integrado em Engenharia Biomédica

Ramo de Informática Médica

Trabalho efectuado sob a orientação do

Professor Doutor António Carlos da Silva Abelha

e coorientação do

Doutor Carlos Filipe Portela

outubro de 2015

Universidade do Minho

Escola de Engenharia

Sónia Patrícia Pinto Pereira

Plataforma de Apoio à Decisão

(3)
(4)

Agradecimentos

O desenvolvimento deste projeto, assim como a conceção deste docu-mento, deve-se à cooperação e dedicação de várias pessoas, ao longo de mais de um ano de trabalho. Em primeiro lugar, quero agradecer ao meu co-orientador, o Doutor Filipe Portela, pela ajuda e disponibilidade que sempre me concedeu nas diversas fases deste projeto, e pelas recomendações que vão car para a vida.

Um grande obrigado ao meu orientador, Professor Doutor António Abe-lha, por toda a atenção concebida e apoio prestado ao longo desta dissertação. Da mesma forma, agradeço ao Professor Doutor José Machado, pela ajuda e prontidão que sempre me mostrou quando enfrentava novos desaos, e pelas oportunidades que sempre partilhou com os seus alunos.

Agradeço ainda aos prossionais de saúde e aos prossionais dos servi-ços de informação do Centro Hospitalar do Porto pela enorme colaboração facultada.

Aos meus amigos, que sempre estiveram presentes nos momentos altos e baixos do desenvolvimento desta dissertação, e ao longo destes 5 anos, a partir de Braga ou até do Estrangeiro, agradeço a paciência, as palavras de motivação, as gargalhadas e a ajuda prática e emocional que sempre me ofereceram.

Deixo um agradecimento muito especial aos meus pais, com que pude, e posso, contar sempre em todos os momentos da minha vida. À minha irmã, agradeço a partilha de ideias e sabedoria com que sempre me dotou e me zeram crescer.

Termino com um agradecimento muito sentido ao Gabriel, que esteve sempre ao meu lado, com quem partilhei as minhas vitórias e as minhas

(5)

iv

derrotas, a minha felicidade e os meus problemas. Obrigada pela paciência, pela ajuda e pela harmonia transmitida. Sem o seu apoio este percurso não seria o mesmo.

(6)

Resumo

A grande quantidade de dados gerada todos os dias na indústria, e no-meadamente, na área da saúde, impulsiona a utilização de Tecnologias de Informação (TIs) para o seu registo, tratamento e exploração, com o intuito de adquirir conhecimento com valor assim como instrumentos para o apoio na tomada decisões.

Na unidade de cuidados materno-infantis do Centro Hospitalar do Porto (CHP), oCentro Materno Infantil do Norte (CMIN), os prossionais de saúde lidam com utentes em condições delicadas e situações que requerem a tomada de medidas rápida e eciente. Um vasto conhecimento dos processos de Gi-necologia e Obstetrícia (GO)pode ser crucial para promover as boas práticas médicas e evitar eventos adversos na mãe e no recém-nascido. A aplicação bem sucedida de Sistema de Apoio à Decisão Clínica (SADC) em ambiente clínico e a recetibilidade dos prossionais de saúde e deTI doCMINà intro-dução de novos conceitos e tecnologias, motivam o desenvolvimento de novos artefactos.

Neste sentido, este projeto aplica os conceitos de Business Intelligence (BI) e Descoberta de Conhecimento sobre informação disponível nos Siste-mas de Informação (SIs) da instituição, através de uma grande variedade de metodologias, métodos e tecnologias para construir soluções e apoiar os serviços prestados na unidade de cuidados materno-infantis.

Um dos artefactos criados é o desenvolvimento de indicadores clínicos e de desempenho a partir da tecnologia de BI Pentaho Community Edition (CE). Este processo inicia-se com a extração, transformação e carregamento da informação numa estrutura multidimensional, o Data Warehouse (DW), permitindo a posterior representação da informação através da aplicação de

(7)

vi

BI. Esta plataforma integra indicadores dos módulos deGO, de triagem e da admissão hospitalar do CMIN.

Na componente da descoberta de conhecimento, vários estudos são efe-tuados, tendo em conta as preocupações dos prossionais de saúde e as ne-cessidades da instituição, provando a viabilidade de utilizar técnicas deData Mining (DM) na construção de modelos de previsão no sector da saúde. Os nascimentos pré-termo, a seleção do tipo de parto mais adequado, a cate-gorização das utentes e o seu percurso pela unidade de GO e os tempos de espera de pré e pós-triagem são alguns dos problemas analisados. Os estu-dos alcançam resultaestu-dos promissores e clinicamente relevantes, permitindo a identicação de fatores de risco clínico. A título de exemplo, adquiriam-se modelos de previsão para os nascimentos pré-termo com valores de sensibili-dade e especicisensibili-dade de 89% e 93%.

De forma a presentear os prossionais de saúde com as soluções desen-volvidas, foi criada uma plataforma de alto-nível que integra os produtos de BI e os modelos de previsão de DM, culminando o objetivo do projeto num artefacto nal, que visa o apoio às práticas clínicas, a qualidade dos cuidados prestados e a consequente satisfação dos utentes.

(8)

Abstract

In industry, particularly in the health sector, there has been an explo-sive growth in the number of data produced every day. The information technologies arise to extract, process and explore these large quantities of information, aiming to get real knowledge and assist the decision making process.

In Centro Materno Infantil do Norte (CMIN), the maternal and perina-tal care unit of Centro Hospitalar do Porto (CHP), the physicians handle patients in dicult conditions and situations that require fast and ecient measures. A vast knowledge on the gynecology and obstetrics (GO) processes can be crucial to promote decent medical practices and avoid adverse events im mother and child. The successful application of decision support sys-tems (DSSs) in a clinical environment and the physician's acceptance on the introduction of new technologies encourage the development of new artifacts. Accordingly, the current project applies Business Intelligence (BI) and Knowledge Discovery concepts in data available from CMIN, building solu-tions to support health services and provide the maternity unit with quality care.

One of the artifacts consists of clinical and performance indicators de-veloped with Pentaho Community Edition (CE). By means of the Extract, Transform and Load (ETL) process, a multidimensional strucuture called Data Warehouse (DW)is built, allowing the later data representation by ap-plying BI. The plataform compose GO indicators on the child delivery, the triage process and the hospital admission, in CMIN.

In the knowledge discovery component, many studies are conducted, re-garding the physicans' concerns and the healthcare needs, showing the

(9)

viii

sability of usingData Mining (DM) methods to create prediction models, in the health sector. Some of the considered business problems are the pre-term birth, the most appropriate type of delivery, the categorization of the ma-ternity patients and their route through the GO services and the pre-triage and triage waiting time in the emergency unit of CMIN. The studies attain promissing and clinically relevant results, allowing the identication of risk factors in clinical environment. For instance, in the prediction of preterm births, DM models presenting sensitivity and specicity of 89% and 93% were aquired.

In order to provide physitions with the developed solutions, a high-level plataform is nally built, deploying the BI products and theDM predicting models, culminating the project goal in a nal artifact, which supports cli-nical practices, improves the quality of services and, ultimatly, increases the patients' satisfaction.

(10)

Conteúdo

Acrónimos xxi 1 Introdução 1 1.1 Enquadramento . . . 1 1.2 Motivação . . . 4 1.3 Objetivos . . . 5 1.4 Descrição do Estudo . . . 6 1.5 Estrutura do Documento . . . 7 2 Revisão da Literatura 9 2.1 Introdução . . . 9

2.2 Sistemas de Apoio à Decisão Clínica . . . 11

2.3 Business Intelligence e a Informação Médica . . . 13

2.3.1 Extração, Transformação e Carregamento (ETL) . . . . 14

2.3.2 Data Warehousing . . . 15

2.3.3 Visualização da Informação . . . 16

2.4 Descoberta do Conhecimento e Data Mining em Contexto Hospitalar . . . 18

2.5 Apoio à Decisão em Obstetrícia e Ginecologia . . . 20

2.6 Conclusão . . . 21

3 Caso de Estudo 23 3.1 Introdução . . . 23

3.2 Sistemas de Informação do CMIN e a sua Interoperabilidade . 24 3.3 Apoio à Decisão nos Cuidados de GO . . . 26

(11)

x CONTEÚDO

3.3.1 Sistema de Pré-triagem de GO. . . 26

3.3.2 Plataforma de Busines Intelligence . . . 27

3.4 Conclusão . . . 28

4 Tecnologias e Metodologias de Investigação 29 4.1 Introdução . . . 29

4.2 Metodologia de Investigação: DSR . . . 30

4.3 Transformação e Carregamento dos Dados . . . 33

4.3.1 Metodologia de Kimball . . . 33

4.3.2 Tecnologia Oracle SQL Developer . . . 35

4.4 Descoberta do Conhecimento . . . 35

4.4.1 Metodologia CRISP-DM . . . 35

4.4.2 Métodos de Data Mining . . . 37

4.4.3 Tecnologias de Data Mining . . . 40

4.5 Disseminação da Informação . . . 42

4.5.1 Tecnologia de BI: Pentaho Community Edition . . . . 42

4.5.2 Framework Web: Django . . . 44

4.6 Conclusão . . . 46

5 Transformação e Carregamento dos Dados 49 5.1 Introdução . . . 49

5.2 Denição do Problema . . . 51

5.3 Denição dos Requisitos da Organização . . . 51

5.4 ETL e Data Warehousing . . . 52

5.4.1 Arquitetura Técnica . . . 52

5.4.2 Modelação Dimensional e Design Físico . . . 53

5.4.3 Desenvolvimento dos processos de ETL . . . 57

5.5 Discussão dos Resultados . . . 58

5.6 Conclusão . . . 59

6 Previsão de Nascimento Pré-termo 61 6.1 Introdução . . . 61

6.2 Contexto e Trabalho Relacionado . . . 62

(12)

CONTEÚDO xi

6.4 Processo de Data Mining . . . 63

6.4.1 Compreensão do Negócio . . . 64

6.4.2 Compreensão dos Dados . . . 64

6.4.3 Preparação dos Dados . . . 66

6.4.4 Modelação . . . 67

6.4.5 Avaliação . . . 68

6.5 Discussão dos Resultados . . . 70

6.6 Conclusão . . . 71

7 Previsão do Tipo de Parto 73 7.1 Introdução . . . 73

7.2 Contexto e Trabalho Relacionado . . . 74

7.3 Descrição do Estudo . . . 75

7.4 Processo de Data Mining . . . 75

7.4.1 Compreensão do Negócio . . . 75

7.4.2 Compreensão dos Dados . . . 76

7.4.3 Preparação dos Dados . . . 78

7.4.4 Modelação . . . 79

7.4.5 Avaliação . . . 80

7.5 Discussão dos Resultados . . . 81

7.6 Conclusão . . . 82

8 Clustering na Caracterização de Utentes 83 8.1 Introdução . . . 83

8.2 Contexto e Trabalho Relacionado . . . 84

8.3 Descrição do Estudo . . . 85

8.4 Processo de Data Mining . . . 85

8.4.1 Compreensão do Negócio . . . 86

8.4.2 Compreensão dos Dados . . . 86

8.4.3 Preparação dos Dados . . . 88

8.4.4 Modelação . . . 88

8.4.5 Avaliação . . . 90

(13)

xii CONTEÚDO

8.6 Conclusão . . . 92

9 Previsão de Tempos de Pré e Pós-Triagem 93 9.1 Introdução . . . 93

9.2 Contexto e Trabalho Relacionado . . . 95

9.3 Descrição do Estudo . . . 96

9.4 Processo de Data Mining . . . 96

9.4.1 Compreensão do Negócio . . . 96

9.4.2 Compreensão dos Dados . . . 97

9.4.3 Preparação dos Dados . . . 101

9.4.4 Modelação . . . 102

9.4.5 Avaliação . . . 104

9.5 Discussão dos Resultados . . . 106

9.6 Conclusão . . . 108

10 Disseminação da Informação 109 10.1 Introdução . . . 109

10.2 Representação dos Indicadores de BI . . . 110

10.2.1 Módulo de Obstetrícia . . . 112

10.2.2 Módulo de Triagem . . . 115

10.2.3 Módulo da Admissão . . . 116

10.3 Representação dos Modelos de DM . . . 118

10.4 Plataforma de Alto Nível: GO BI&DB . . . 119

10.5 Discussão dos Resultados . . . 122

10.6 Conclusão . . . 123

11 Conclusão e Trabalho Futuro 125 11.1 Considerações Finais e Principais Contribuições . . . 125

11.2 Trabalho Futuro. . . 128

Bibliograa 144

Apêndices 144

(14)

CONTEÚDO xiii

B Publicações 147

B.1 Predicting Triage Waiting Time in Maternity Emergency Care by means of Data Mining. . . 147 B.2 Predicting Pre-triage Waiting Time in a Maternity Emergency

Room through Data Mining . . . 149 B.3 Predicting Preterm Birth in Maternity Care by means of Data

Mining . . . 150 B.4 Predicting Type of Delivery by Identication of Obstetric Risk

Factors through Data Mining . . . 151 B.5 Clustering-based Approach for Categorizing Pregnant Women

in Obstetrics and Maternity Care . . . 152 B.6 Monitoring time consumption in complementary diagnostic

and therapeutic procedure requests . . . 153 B.7 An Articial Neuronal Network Approach to Diagnosis of

(15)
(16)

Lista de Figuras

2.1 Arquitetura genérica do processo de BI . . . 14

2.2 Estrutura genérica do processo de ETL . . . 15

2.3 Representação de uma estrutura OLAP . . . 17

2.4 Representação do processo da Descoberta do Conhecimento. . 19

3.1 Módulos da AIDA . . . 25

4.1 Abordagem em ciclos da metodologia DSR . . . 31

4.2 Abordagem em etapas da metodologia DSR . . . 32

4.3 Diagrama cíclico da metodologia de Kimball . . . 33

4.4 Representação da metodologia CRISP-DM . . . 36

4.5 Arquitetura da tecnologia Pentaho BI Suite . . . 43

5.1 Arquitetura do sistema para a criação do DW . . . 53

5.2 Modelo multidimensional do data mart da componente obste-trícia do DW . . . 54

5.3 Modelo multidimensional do data mart da componente de tri-agem do DW . . . 55

5.4 Modelo multidimensional do data mart da componente de ad-missão do DW . . . 56

6.1 Distribuição da variável alvo Grupo de Risco . . . 65

6.2 ROC do melhor modelo a prever o nascimento pré-termo . . . 71

7.1 Distribuição da variável alvo Tipo de Parto . . . 78

8.1 Melhores clusters para a técnica k-means . . . 90 xv

(17)

xvi LISTA DE FIGURAS 8.2 Melhores clusters para as técnicas FF e EM . . . 91 10.1 Indicadores obstétricos sobre o número de nascimentos e partos112 10.2 Número de nados por semanas de gestação . . . 112 10.3 Número de partos por prossional de saúde e especialidade . . 113 10.4 Número de nascimentos por grupo de risco de idade . . . 113 10.5 Número de nascimentos por classe de idades e ano . . . 114 10.6 Número de nascimentos grande pré-termo, pré-termo e termo . 114 10.7 Número de nascimentos por área e localidade da mãe . . . 115 10.8 Distribuição das utentes por resultado de triagem . . . 116 10.9 Número de utentes por resultado de triagem e classe de idades 116 10.10Indicadores para a caracterização das utentes. . . 117 10.11Indicadores para a caracterização dos episódios. . . 117 10.12Aplicação para Previsão dos Tempos de Pré-triagem . . . 119 10.13Representação dos Indicadores de BI na plataforma GO BI&DC120 10.14Representação dos Modelos de DM na plataforma GO BI&DC 120 10.15Área do utilizador da plataforma GO BI&DC . . . 121

(18)

Lista de Tabelas

6.1 Representação da variável alvo Grupo de Risco . . . 65

6.2 Medidas estatísticas das variáveis numéricas . . . 66

6.3 Percentagem de ocorrências das variáveis . . . 66

6.4 Congurações dos Algoritmos de DM no ODM . . . 68

6.5 Melhores resultados alcançados para prever Partos Pré-termo . 70 6.6 Modelo de DM para a previsão de nascimentos pré-termo . . . 70

7.1 Medidas estatísticas das variáveis numéricas . . . 76

7.2 Percentagem de ocorrências das classes das variáveis . . . 77

7.3 Distribuições da variável alvo Tipo de Parto . . . 79

7.4 Resultados iniciais alcançados para prever o Tipo de Parto . . 80

7.5 Melhores resultados para prever o Tipo de Parto . . . 81

8.1 Análise estatística às variáveis ginecológicas . . . 86

8.2 Medidas estatísticas das variáveis numéricas . . . 87

8.3 Percentagem de ocorrências das variáveis . . . 87

8.4 Congurações dos algoritmos de clustering em WEKA . . . . 89

8.5 Resultados do índice de Silhouette para o método k-means. . . 89

8.6 Melhores resultados dos modelos de clustering . . . 90

8.7 Clusters globais para a categorização das utentes na maternidade 91 9.1 Ocorrência dos atributos na previsão do tempo pré-triagem . . 98

9.2 Medidas estatísticas na previsão do tempo pré-triagem . . . . 98

9.3 Distribuição da variável alvo Tempo Pré-triagem . . . 99

9.4 Ocorrência dos atributos na previsão do tempo pós-triagem . . 100 xvii

(19)

xviii LISTA DE TABELAS 9.5 Medidas estatísticas na previsão do tempo pós-triagem . . . . 100 9.6 Distribuição da variável alvo Tempo Pós-triagem . . . 101 9.7 Congurações dos algoritmos de DM induzidos no R Studio . 103 9.8 Melhores resultados estatísticos na previsão do tempo de

pré-triagem . . . 104 9.9 Melhor acuidade na previsão do tempo de pré-triagem . . . 105 9.10 Melhores resultados de acuidade na previsão do tempo de

pós-triagem . . . 106 9.11 Melhores modelos de DM para a previsão do Tempo de

Pré-triagem . . . 106 9.12 Melhores modelos de DM para a previsão do Tempo de

Pós-triagem . . . 106 10.1 Análise SWOT à plataforma GO BI&DC. . . 122 11.1 Trabalho desenvolvido nas diferentes etapas da metodologia

(20)

Acrónimos

AD Árvores de Decisão. 7, 38, 47, 63, 67, 69, 71, 75, 79, 80, 82, 96, 102, 105, 108, 127, 128

AIDA Agência para a Integração, Difusão e Arquivo de Informação Médica e Clínica. 24, 51,52, 57, 62

BI Business Intelligence. vviii, 29, 13, 14, 16, 20, 21, 27, 28, 30, 3335, 42, 44, 46, 47, 4951, 59, 82, 84, 92, 109, 110, 115, 118120, 122, 123, 125, 126, 128

CDE Community Dashboard Editor. 43

CE Community Edition. v, vii, 7,4244, 46,47, 110

CHP Centro Hospitalar do Porto. v, vii, 36, 2224, 2628, 35, 44, 62, 74, 94, 95,101,107,108,115, 128

CMIN Centro Materno Infantil do Norte. vviii, 38, 2228,46, 47, 5053, 57,62,63,71,7476,8286,92,9497,105,107111,114117,119,121,122, 125, 128

CoC Convention over Conguration. 45

CRISP-DM CRoss-Industry Standard Process for Data Mining. 35,47,61, 63, 73,75, 85, 96

DCBD Descoberta de Conhecimento em Bases de Dados. 1820, 37,42,59, 63, 66,73, 80, 83, 85,96, 125

DGS Direção Geral de Saúde. 4, 6, 27,95, 108, 128 DIS Department Information System. 24

DM Data Mart. 15

DM Data Mining. vi, viii, 3, 59, 1821, 26, 28, 3538, 4042, 46, 47, 59, xix

(21)

xx Acrónimos 6164, 6669, 7176, 7884, 86, 88, 89, 9194, 96, 97, 99102, 105, 106, 108110, 118120,122,123,127,128

DRY Don't Repeat Yourself . 45

DSR Design Science Research. 2932, 46, 122, 126

DW Data Warehouse. v, vii,3, 58,1316, 18, 29, 3335,42, 4953, 5759, 109, 110, 115, 122, 126

EM Expectation-Maximization. 40, 85, 88 ESI Emergency Severity Index. 26

ETL Extract, Transform and Load. vii, 13, 14, 3335, 42, 46, 49, 50, 52, 5759, 110, 122

FF Farthest First. 40, 85, 88, 89 FN Falso Negativo. 68

FP Falso Positivo. 68

GO Ginecologia e Obstetrícia. v,vi, 17,9, 12, 18,2022, 2628,32,5053, 5659, 8386, 92,9497, 101, 107111,115,117,121123, 125128

IVG Interrupção Voluntária da Gravidez. 26, 28 LIS Laboratory Information System. 24

MC Matriz de Confusão. 68

MLG Modelos Lineares Generalizados. 7,38, 47, 63, 67,75, 79, 80, 96,102 MTS Manchester Triage System. 26, 27,101

MVC Model-View-Controller. 45

NB Naïve Bayes. 7,38, 47, 63,67, 69, 71, 75,79, 96, 102, 127 nsc Nearest Centroid Sorting. 85

ODM Oracle Data Miner. 41, 47, 63,68, 75, 79,80, 119 OLAP On-line Analytical Processing. 13, 1517, 4244 OLTP On-line Transaction Processing. 14, 35, 52 ORM Object-Relational Mapping. 45

(22)

Acrónimos xxi PCE Processo Clínico Eletrónico. 24, 51,52, 57

RIS Radiology Information System. 24

RNA Redes Neuronais Articiais. 7, 19,39, 47, 96, 102,108,118 ROC Receiver Operating Characteristic. 71

RSE Registo de Saúde Eletrónico. 9, 25, 52, 57, 62, 64, 71, 76, 82, 84, 86, 96, 97,108,127

SAD Sistema de Apoio à Decisão. 2, 11,12

SADC Sistema de Apoio à Decisão Clínica. v, 2, 8,9,11,12,19, 2123,26, 27, 82,94, 108

SAM Sistema de Apoio Médico. 24

SAPE Sistema de Apoio à Prática de Enfermagem. 24, 25, 52, 62, 64, 71, 76, 82,84, 86, 96, 97,108,127

SGBD Sistemas de Gestão de Bases de Dados. 17, 34,35, 51, 57

SI Sistema de Informação. v,2,5,6,10, 13,18,21, 23,24,27,28,33,4952, 62, 74,76, 82, 84, 94,96, 97, 108, 126, 127

SONHO Sistema de Gestão de Doentes Hospitalares. 24 SOS Software Open-source. 45

ST Sistema de Triagem. 2, 6,94, 95, 101, 128

SU Serviço de Urgência. 52,53, 57, 9397, 102, 105, 107, 108, 115, 128 SVM Support Vector Machines. 7, 19,39, 47, 63,67, 69, 75, 79,96, 102 TI Tecnologia de Informação. v,24, 713,21,23, 2830, 49, 51,58,62,84, 94, 110, 121, 125, 126

VN Verdadeiro Negativo. 69 VP Verdadeiro Positivo. 69

WEKA Waikato Environment for Knowledge Analysis. 7, 41, 85,88, 89 XML eXtensible Markup Language. 58

(23)
(24)

Capítulo 1

Introdução

O presente capítulo introduz o desenvolvimento desta dissertação, come-çando com uma breve contextualização do tema. De seguida, é descrita a principal motivação que levou à realização deste projeto, assim como os seus principais objetivos. O trabalho realizado é descrito sucintamente na secção 1.4 e, por m, a estrutura do documento é apresentada, de forma a facilitar a sua leitura.

1.1 Enquadramento

Com o evidente desenvolvimento tecnológico, assiste-se, nas últimas dé-cadas, a uma grande progressão na quantidade de dados que advêm do proce-dimento digital. Se até então este grande número de informação era conside-rado inútil, atualmente o valor destes dados, independentemente do contexto em que se enquadram, é claro, uma vez que quando tratados corretamente, podem devolver valor imensurável para a organização [1,2].

Na área daGinecologia e Obstetrícia (GO), os cuidados de saúde materno-infantis prestados pelos prossionais de saúde devem proporcionar um acom-panhamento adequado aos seus utentes de forma a primar por serviços de qualidade. Um vasto conhecimento e compreensão dos processos deGO po-dem ser cruciais para prevenir perturbações e melhorar as práticas clínicas, evitandoeventos adversos como perturbações na gestação e complicações no

(25)

2 CAPÍTULO 1. INTRODUÇÃO parto [3].

Com vista a melhorar a qualidade destes serviços, é feita uma análise e monitorização dos dados clínicos pelos prossionais de saúde, permitindo obter informações estratégicas que ajudam a tomar decisões vantajosas a ní-vel clínico e administrativo. Hoje em dia, o processo que permite registar e interpretar esta informação pode ser automatizado através do uso das Tecno-logias de Informação (TIs), de forma simples e rápida. Uma utilização ecaz deTIsno sector da saúde pode levar à redução de custos e reestruturação de serviços que proporcionam aos utentes cuidados médicos de qualidade [4].

A grande quantidade de dados hospitalares produzidos diariamente im-plica a utilização deSistemas de Informação (SIs). OsSIsna saúde represen-tam um conjunto de ferramentas de registos médicos, completos e organiza-dos, e uma mais valia na gestão de informação e apoio à decisão hospitalar [5]. Por sua vez, os Sistemas de Apoio à Decisão (SADs) são cruciais para a tomada de decisão, oferecendo conhecimento e informação especíca, ltrada e apropriada, para melhorar os serviços de saúde prestados [6]. Os Sistemas de Apoio à Decisão Clínica (SADCs) conseguem explorar e reconhecer pa-drões na informação, auxiliando os prossionais de saúde em todo o processo clínico, desde cuidados de prevenção até ao tratamento e monitorização do indivíduo. Nos cuidados de GO, os SADCs podem conter indicações e in-formação de bases de dados externas relevantes assim como recomendações e alertas para situações potencialmente perigosas, respondendo às exigências especícas dos utilizadores desta unidade [7,8].

Um Sistema de Triagem (ST)pode ser visto como umSADCque auxilia os prossionais de saúde na priorização ou encaminhamento dos utentes nos serviços de urgência de uma unidade hospitalar, que avalia as condições dos utentes a partir de um conjunto de questões [9].

Uma vasta gama de aplicações no domínio do apoio à decisão tem vindo a surgir nos últimos anos, desde Sistemas de Informação executiva até fer-ramentas de análise e previsão de informação. O conceito de Business In-telligence (BI) surge neste sentido, e tem sido extensamente utilizado para descrever instrumentos analíticos.

(26)

representa-1.1. ENQUADRAMENTO 3 ção de forma percetível e palpável. Numa primeira fase, as ferramentas de BI são capazes de reduzir os custos das infraestruturas de TIs e eliminar dados redundantes dos processos de extração de dados, alcançando, numa segunda fase, informação eciente, melhorias no processo de negócio e apoio no processo de tomada de decisões [10].

Este processo começa pela necessidade de tratar informação estruturada e normalizada. Um Data Warehouse (DW) responde a esta imposição, for-necendo acesso a informação proveniente de diferentes fontes, de uma forma centralizada e compreensível, permitindo lidar com a dinâmica de organiza-ções extensas e com a segurança no acesso e na circulação dos dados [11]. O Data Warehousing aborda a formulação de queries, a pesquisa e a análise da informação de uma forma integrada [5,12].

Numa instituição de saúde, a implementação bem sucedida de uma pla-taforma de BI pode perspetivar os custos dos cuidados prestados, agilizar relatórios, fornecer medidas clínicas de qualidade, aumentar a eciência ope-racional e até reduzir a negligência médica [13]. A unidade hospitalar bene-cia com esta aquisição de informação eciente que apoia a tomada de decisão clínica e administrativa dos seus serviços.

NoCentro Materno Infantil do Norte (CMIN), a unidade de cuidados pré-natais do Centro Hospitalar do Porto (CHP), tem vindo a ser desenvolvida uma plataforma de BI na área de GO, que integra estes conceitos desde 2014, provando a utilidade e qualidade da informação, que torna imperativa a continuidade do desenvolvimento desta plataforma.

No mesmo sentido, a grande quantidade de dados produzidos em contexto hospitalar motiva a extração de conhecimento e valor. A utilização de meto-dologias de Descoberta de Conhecimento e de métodos deData Mining (DM) sobre a informação adquirida impulsiona estes resultados e pode ser aliado às tecnologias de BI para facilitar a tomada decisões estratégicas e estabelecer metas para o sucesso dos serviços de saúde prestados [14], nomeadamente, melhorias no processo de triagem implementado no CMIN.

(27)

4 CAPÍTULO 1. INTRODUÇÃO

1.2 Motivação

A saúde é uma das condições básicas para atingir a qualidade de vida tão desejada pelos seres humanos. Mais que o acesso a serviços médicos de qualidade, as instituições de saúde devem garantir a aplicação das novas tec-nologias, implementadas com sucesso nas mais diversas áreas, para auxiliar as suas práticas.

OCMIN é responsável pelos cuidados de pediatria, neonatologia, gineco-logia e obstetrícia doCHP, cobrindo assim as necessidades de uma população bastante especíca e vulnerável. Para promover uma melhoria na tomada de decisões por parte dos prossionais de GO, assim como evitar eventos ad-versos nos cuidados de saúde materno-infantis, a análise e representação do conhecimento acessível nesta área torna-se um objetivo notável.

A motivação para o contínuo desenvolvimento deste projeto parte deste princípio, e da possibilidade de contribuir para a inserção dasTecnologias de Informação como recurso das funções exercidas tanto pelos prossionais de saúde como pelos administradores da unidade hospitalar.

O desenvolvimento de uma plataforma de Business Intelligence na uni-dade de cuidados materno-infantis do CMIN de fácil acesso e interpretação, bem como a integração de modelos de previsão de procedimentos efetuados na mesma, permite obter indicadores automáticos e conhecimento profícuo para apoiar a decisão médica em GO. O projeto oferece ainda utilidade a um grande número de dados, armazenados nas bases de dados do centro hospitalar, que estariam perdidos sem a utilização destas metodologias.

Por outro lado, a realização deste projeto permite estudar os dados re-lativos ao sistema de pré-triagem implementado no CMIN, tirar conclusões em relação ao uxo dos doentes na unidade de emergência de GO, e ainda avaliar a implementação de um sistema de triagem de prioridades que obe-dece às especicações clínicas apontadas pelaDireção Geral de Saúde (DGS), constituindo também um motivo signicativo.

Além disso, o contributo destas soluções na melhoria dos serviços médicos, apontada por parte dos prossionais de saúde, e o apoio dos serviços de infor-mação doCentro Hospitalar do Porto representam incitadores fundamentais

(28)

1.3. OBJETIVOS 5 para o progresso do projeto.

1.3 Objetivos

Todo o trabalho desenvolvido neste projeto tem como objetivo nal o apoio à decisão nos cuidados materno-infantis dos serviços de Ginecologia e Obstetríciado CMIN. Em primeiro lugar, e dando continuidade ao trabalho desenvolvido anteriormente [15,16], pretende-se desenvolver a plataforma de BI na unidade de GO, que disponibilize novos indicadores clínicos e apre-sente os modelos de previsão desenvolvidos na área para auxiliar os seus utilizadores. Neste sentido, as questões de investigação que se colocam são:

• De que forma vai a plataforma de BI ajudar os prossionais de saúde deGO a tomar decisões?

• Que informações podem ser alcançadas através de modelos de previsão capazes de auxiliar os cuidados materno-infantis prestados no CMIN? Para responder a estas questões, destacam-se os seguintes objetivos: • Complementar e otimizar o DW que contempla a informação de GO,

obtida pelos Sistema de Informação do CHP, adicionando novos con-teúdos (p.ex., notas de admissão e de alta);

• Desenvolver a plataforma de BI que, tendo por base a informação do DW, permita representar os indicadores deGO;

• Investigar e construir modelos de previsão de Data Mining para a ex-ploração de problemáticas de GO, através da identicação de fatores de risco (p.ex., previsão de nascimentos pré-termo);

• Desenhar e implementar uma solução de alto-nível que proporciona aos prossionais de saúde acesso universal à plataforma deBIdesenvolvida e aos modelos deDM construídos, de forma a facilitar a análise destas soluções.

(29)

6 CAPÍTULO 1. INTRODUÇÃO Numa segunda fase, o projeto focou-se na validação do sistema de pré-triagem implementado no Centro Materno Infantil do Nortee no sistema de prioridades proposto recentemente para responder às especicações clínicas sugeridas pela DGS. Neste caso, as questões que se colocam são:

• Qual é a viabilidade e eciência do Sistema de Triagemde prioridades deGO desenvolvido?

• Que melhorias poderá o novo sistema trazer ao processo de triagem no CMIN?

Para tal, colocam-se os seguintes objetivos:

• Estudar a qualidade do sistema de pré-triagem implementado presente-mente, através dos indicadores deBIda triagem obstétrica e da análise da informação;

• Construir modelos deData Mining para a análise do processo de tria-gem face ao sistema de prioridades proposto.

Após a concretização destes aspetos, foi avaliado o contributo na melhoria dos serviços deGinecologia e Obstetríciae o auxílio no trabalho dos médicos e enfermeiros que exercem funções nos cuidados do CMIN.

1.4 Descrição do Estudo

Para alcançar os objetivos traçados na secção 1.3 foram aplicadas várias metodologias e tecnologias nos dados em bruto. Dessa forma, a presente secção apresenta sucintamente o trabalho desenvolvido no âmbito do apoio à decisão emGO.

A nível da transformação da informação obtida através dos SI integra-dos no CHP, o Data Warehouse foi construído seguindo a metodologia de Kimball. Os dados foram limpos e processados tendo em conta a sua nali-dade especíca, tanto para serem inseridos na plataforma de BI, como para serem aplicados nos modelos de DM, decorrendo à ferramenta Oracle SQL

(30)

1.5. ESTRUTURA DO DOCUMENTO 7 Developer. Foram ainda criados procedimentos para auxiliar o processo de atualização do DW.

Os estudos deData Mining aplicaram vários softwares para a descoberta de conhecimento, como o Oracle Miner, o Waikato Environment for Kno-wledge Analysis (WEKA) e o R Studio. Os modelos de DM desenvolvidos alcançaram resultados úteis nas mais diversas questões de GO, como a pre-visão de nascimentos pré-termo e a prepre-visão de tempos de pré e pós-triagem na unidade de emergência doCMIN. Quanto aos métodos de DMutilizados, abordaram-se técnicas de Clustering e Classicação, através dos algoritmos Árvores de Decisão (AD), Naïve Bayes (NB), Redes Neuronais Articiais (RNA), Modelos Lineares Generalizados (MLG) e Support Vector Machines (SVM). O processo de descoberta de conhecimento de cada um dos modelos investigados está descrito nos capítulos6 a9.

Na plataforma de BI, vários indicadores de GO e triagem obstétrica fo-ram desenvolvidos, através das funcionalidades disponibilizadas pelo software Pentaho Community Edition (CE), caracterizados particularmente no capí-tulo10. Estes indicadores e os modelos deDMsão posteriormente implemen-tados numa camada de visualização de alto-nível desenvolvida em Django.

Os elementos descritos contribuem para o apoio à decisão clínica nos cuidados materno-infantis prestados na unidade de GO do CMIN e podem ser seguidos por outras instituições de saúde através dos artigos cientícos publicados ao longo do ano.

1.5 Estrutura do Documento

O presente documento está estruturado em onze capítulos.

• Capítulo 1: o presente capítulo enquadra o projeto no contexto das Tecnologias de Informação como potenciadores dos cuidados de saúde na área de GO, destacando a motivação e os objetivos para a concre-tização do mesmo, encerrando com uma breve descrição do trabalho desenvolvido;

(31)

8 CAPÍTULO 1. INTRODUÇÃO desenvolvido, como os SADC, a temática de Business Intelligence e a Descoberta de Conhecimento em contexto clínico;

• Capítulo 3: é apresentada a instituição de saúde em que se insere o projeto: o CMIN, e a sua posição na utilização de TIs para auxiliar as práticas clínicas, desde os sistemas de informação até aos objetos de apoio à decisão, já implementados na instituição;

• Capítulo 4: primeiramente, é exposta a metodologia de investigação que orienta a concretização deste projeto, seguida das tecnologias, me-todologias e métodos técnicos utilizados nas diferentes fases do projeto, devidamente identicadas;

• Capítulo5: é neste capítulo que começa a ser descrito o trabalho desen-volvido na forma de resultados. É descrito o processo de transformação e carregamento dos dados no Data Warehouse e apresentada a sua es-trutura e procedimentos associados;

• Capítulos6,7,8,9: descrevem os estudos elaborados no âmbito da desco-berta de conhecimento a partir de técnicas deDM que visam a previsão de partos pré-termo, tipos de parto, tempos de espera no processo de triagem, e a categorização de utentes, respetivamente;

• Capítulo 10: são apresentados os procedimentos e os produtos de BI para a representação da informação, obtidos no acesso ao DW cons-truído anteriormente, seguidos da descrição da camada de visualização de informação (site) que agrega os produtos deBIe os modelos deDM produzidos até então, e da sua avaliação através de uma análise swot; • Capítulo11: resumo das contribuições do presente projeto, face às

ques-tões formuladas e às soluções já existentes, e apresentada um conjunto de problemas que podem constituir o trabalho futuro deste trabalho; • Apêndice A: reúne o glossário de termos e denições úteis;

• ApêndiceB: são destacados os contributos cientícos (publicações) ela-borados ao longo deste projeto.

(32)

Capítulo 2

Revisão da Literatura

Este capítulo descreve os conceitos teóricos e cientícos associados ao desenvolvimento desta dissertação, bem como o estado da arte e a revisão da literatura dos mesmos.

Após uma breve introdução ao estado dasTecnologia de Informação (TI) na área da saúde, são abordados os Sistema de Apoio à Decisão Clínica (SADC) na secção 2.2. Na seguinte (2.3) secção são descritos os conceitos associados com as tecnologias de Business Intelligence (BI), seguidos dos processos relacionados com a Descoberta de Conhecimento e Data Mining (DM)em contexto hospitalar na secção2.4. A secção2.5revê os estudos de-senvolvidos e ferramentas utilizadas para o apoio à decisão clínica no âmbito de Ginecologia e Obstetrícia (GO), em termos de BI e descoberta de co-nhecimento. O capítulo encerra com uma breve conclusão a respeito destes conceitos.

2.1 Introdução

Desde que os computadores existem, que se tenta propagar a sua utiliza-ção em ambientes clínicos. No entanto, ao contrário do fenómeno explosivo da era da Internet, a adoção das TIs e o uso de Registo de Saúde Eletró-nico (RSE) na área da saúde teve uma lenta expansão no início do novo século [17]. Esta dilação deveu-se à complexidade do processo de integração

(33)

10 CAPÍTULO 2. REVISÃO DA LITERATURA destes sistemas na rotina de uma instituição de saúde, desde a sua instalação até à sua utilização [18]. Não obstante, a natureza fragmentada das unidades de cuidados médicos bem como o vasto volume de transações e a complexa gestão de informação tornam intuitiva a necessidade de implementarTIsnas instituições de saúde [19].

A utilização de ferramentas deTIsque melhoram a comunicação, tornam a informação mais acessível e assistem os prossionais de saúde na monitori-zação dos utentes, sendo capazes de prevenir a ocorrência de erros eEventos adversos[20,21]. Outras vantagens registadas são a redução de custos e a me-lhoria dos cuidados prestados, nomeadamente em unidades de tratamento de cancro, através do auxílio dos Sistemas de Informação (SIs) na coordenação dos doentes [22].

As práticas clínicas requerem o registo e sistematização de informação acerca dos seus utentes, o seu estado de saúde e os motivos para a sua ad-missão hospitalar. Esta informação deve estar estruturada e organizada, mantendo o processo clínico eciente e automatizado. Tanto as TIs como os SIs são capazes de suportar este processo complementando a troca de informação entre os prossionais de saúde de forma segura e ecaz [23]. O conceito de interoperabilidade está inteiramente ligado a este processo, capaz de partilhar informação médica, de forma segura e condencial, tornando-a portátil e disponível para os prossionais de saúde do utente em questão [24]. A interoperabilidade entre SIs permite a redução de testes redundantes e de atrasos na passagem de informação. O acesso à informação torna-se longitudinal, otimizando a procura de padrões relevantes, uma vez que agrega dados de diferentes fontes [25].

A informação assim registada e partilhada vai facilitar a investigação médica e a aplicação de outras ferramentas computacionais, destacadas nas próximas secções, de forma a otimizar os serviços prestados nas instituições de saúde.

(34)

2.2. SISTEMAS DE APOIO À DECISÃO CLÍNICA 11

2.2 Sistemas de Apoio à Decisão Clínica

Desde o início da integração das TIs nas unidades de saúde, a possibi-lidade de um computador desempenhar uma função ativa na resolução de problemas e na tomada de decisões apelava tanto em termos de investigação e desenvolvimento como ao público geral.

Um vasto número de Sistemas de Apoio à Decisão Clínica tem sido de-senvolvido com sucesso nos últimos 40 anos, como ferramentas para reconhe-cimento de valores de risco e aviso de incompatibilidade entre medicamentos. Apesar do sucesso destes instrumentos de apoio à decisão, a disponibilidade e disseminação destas abordagens continuou limitada até ao início do novo século [26]. Atualmente, com o reconhecimento da gestão de informação como uma infraestrutura necessária, a adoção de SADCs em instituições de saúde começa a ser vista como uma componente benéca para a melhoria dos processos clínicos [27].

Conceptualmente, um SADC pode ser descrito como um programa com-putacional que fornece alertas, recomendações e interpretações para um pro-blema especíco, para um determinado utente e situação, em tempo útil, tendo em conta a informação disponibilizada por parte do prossional de saúde, do sistema e/ou do utente em si [28,29].

Os SADCs disponibilizam suporte nas várias etapas do processo clínico, desde os cuidados preventivos e o diagnóstico até ao tratamento e posterior monitorização [6]. A aplicação mais comum de um SADC é no tratamento de necessidades clínicas, garantindo diagnósticos precisos, rastreio de doen-ças antecipado e prevenção de eventos adversos, por exemplo, no consumo de medicação. Em relação à tomada de decisões, o objetivo de um SADC é assistir (e não substituir) o prossional de saúde, constituindo uma ferra-menta de auxílio na reconstrução de cada caso clínico. Do ponto de vista da gestão hospitalar, osSADCstêm o potencial de reduzir os custos e aumentar a eciência dos serviços, nomeadamente através de alertas para a replicação de exames ou administração inapropriada de prescrições [6,30,31].

Wright e Robicsek [32] destacam os dez fundamentos adaptados por Ba-tes, et al [33], para o sucesso dos Sistemas de Apoio à Decisão (SADs) na

(35)

12 CAPÍTULO 2. REVISÃO DA LITERATURA área da saúde. Ser simples, rápido e completo são as características reco-nhecidas; uma manutenção e avaliação frequente, identicação de requisitos adjacentes, ajuste ao uxo do processo e compreensão da expressividade do programa por parte dos prossionais de saúde são os processos fundamentais denidos.

Recentemente, várias aplicações deSADstêm sido exploradas, adequadas aos mais diversos procedimentos clínicos. O software ADDIS é um SADC que implementa processos de apoio para a medicina baseada em factos e permite a construção de meta-análises e modelos de decisão de risco base-ados em ensaios clínicos para uma avaliação ecaz e segura de tratamentos médicos [34].

Um dos maiores hospitais de Espanha implementou ainda este ano um SADC para o agendamento de cirurgias que suporta um conjunto de proce-dimentos para otimizar as decisões relacionadas com a atribuição de datas e salas de operação para as intervenções dos utentes em lista de espera [35].

Regras de decisão complexas e dinâmicas para o agendamento de am-bulâncias de emergência, a integração de SADCs baseados em diretrizes e evidência para o diagnóstico, triagem e tratamento de sintomas de depressão e o desenvolvimento de novas estruturas baseadas em algoritmos genéricos, agentes e redes neuronais para remodelar os serviços prestados e diminuir o seu tempo de resposta, constituem outras aplicações de apoio à decisão prosseguidas atualmente [3639].

A implementação de SADCs em países em desenvolvimento depende so-bretudo da forma como os prossionais de saúde consideram o impacto da partilha de conhecimento e a ameaça à autonomia médica [40]. Apesar desta resistência, a introdução deSADCscomputacionais em meios rurais tem sido explorada. Um exemplo é a introdução de diretrizes de GO em instituições de saúde remotas, em Gana e Tanzânia, através de umSADC para os cuida-dos materno-infantis para facilitar a aderência à Tecnologia de Informação e identicar os fatores técnicos e organizacionais para apropriar a carga de trabalho e a eciência dos serviços [41,42].

(36)

2.3. BUSINESS INTELLIGENCE E A INFORMAÇÃO MÉDICA 13

2.3 Business Intelligence e a Informação

Mé-dica

O conjunto de tecnologias de apoio à decisão dedicado a aplicações ana-líticas que permitem a administradores e analistas adquirir conhecimento a partir do processamento, representação e análise da informação descreve o conceito deBusiness Intelligence [10,43,44].

Nas últimas décadas, o número de serviços e produtos de BItem crescido exponencialmente, assim como o seu uso por parte da classe industrial. Este crescimento é alimentado pelo decréscimo no custo de aquisição e manutenção deTIseSIspara armazenar e processar grandes quantidades de informação, como transações bancárias, etiquetas de RFID, registos de pesquisa, emails, controlo de inventários e muito mais [43]. O BI é agora usado globalmente para a obtenção de conhecimento de forma intuitiva e em tempo real, ele-vando o domínio do apoio à decisão nas mais diversas áreas cientícas [10].

No sector da saúde, o conceito deBItem vindo a ter visibilidade por parte dos prossionais de saúde pela sua aplicabilidade na informação estruturada e não estruturada dos Sistema de Informação [45,46]. As ferramentas de BI vêm dar um aproveitamento benéco aos registos médicos e organizacionais e contribuir para o melhoramento operacional e eciência clínica [47].

As tecnologias de BI incluem várias aplicações de software responsáveis pela extração, transformação e carregamento de informação (processo de Extract, Transform and Load (ETL)), criação de Data Warehouse (DW) e visualização e análise dos dados, através de On-line Analytical Processing (OLAP) [48]. Todos estes métodos permitem desenvolver uma compreensão da dinâmica organizacional baseada na evidência [49].

A arquitetura representativa do processo de BI está presente na gura 2.1 [43]. A informação utilizada pode derivar de várias fontes de dados heterogéneas, de várias unidades hospitalares. Os procedimentos de ETL encarregam-se de limpar e normalizar estes dados, para a sua integração nas tarefas de BI. O DW vai estruturar a informação, para facilitar a sua aná-lise. O acesso e interpretação destes dados utiliza ferramentas de visualização como dashboards eOLAP, que pretendem ajudar na tomada de decisões.

(37)

14 CAPÍTULO 2. REVISÃO DA LITERATURA

Figura 2.1: Arquitetura genérica do processo de BI (adaptado de [43]).

2.3.1 Extração, Transformação e Carregamento (ETL)

O aumento explosivo da informação tornou clara a necessidade de gestão de conteúdos integrados. Uma vez que os conteúdos são registados de dife-rentes formas, são necessárias soluções para integrar e unicar a informação, através da interoperabilidade de sistemas heterogéneos [50].

A dinâmica ETL representa o fundamento para o processo de Data Wa-rehousing, que soluciona esta questão. O sistema ETL extraí os dados dos sistemas On-line Transaction Processing (OLTP), impõe padrões de quali-dade e consistência, normaliza a informação para que dados de diferentes fontes possam ser utilizados em conjunto e, por m, transmite essa informa-ção para o DW, permitindo a posterior criação de aplicações de BI[51,52].

A primeira fase de qualquer cenário de ETLé a extração da informação, responsável por extrair os dados das diferentes fontes de informação. Cada base de dados tem uma série de características distintas, como a gestão da base de dados, o sistema operativo e diferentes protocolos de comunicação, que precisam de ser controladas e resolvidas para que o processo de extração seja ecaz. A segunda fase é a transformação da informação, onde é efetuada a limpeza e conciliação dos dados recebidos, de forma a evitar inconsistências e denir as dimensões e tabelas de factos. Por último, o carregamento trata

(38)

2.3. BUSINESS INTELLIGENCE E A INFORMAÇÃO MÉDICA 15 de transportar os dados para a estrutura alvo multidimensional, acedida pelos utilizadores nais e aplicações do sistema [53,54]. A estrutura genérica deste procedimento está presente na gura2.2.

Figura 2.2: Estrutura genérica do processo de ETL (adaptado de [53]). O desempenho e qualidade destas fases são fundamentais para a confor-midade, precisão e usabilidade do Data Warehouse resultante para posterior representação do conhecimento e tomada de decisões [55].

2.3.2 Data Warehousing

Nos anos 90 o conceito de Data Warehousing foi proposto para solucionar de forma genérica o problema da gestão organizacional da informação vinda de várias fontes de dados, como bases de dados. Hoje em dia, o DW faz parte do processo para a obtenção de conhecimento abrangente e suporte à decisão empresarial em tempo real [5658]. Utilizações bem sucedidas da integração de DW permitem o ajuste e a revisão dos processos de negócio sobre informações de toda a organização e a elaboração de alterações, assim que necessário [59].

Um DW pode estar ligado a um conjunto de Data Marts (DMs), cria-dos para fornecer informações especícas para um grupo de utilizadores ou tarefas de decisão. Os utilizadores nais podem fazer análises e consultas à informação guardada nestas estruturas através da formulação de queries ou ferramentas de visualização como aplicaçõesOLAP [56].

A arquitetura de um DW deve obedecer a um conjunto de característi-cas como a interdependência entre unidades organizacionais, a acessibilidade

(39)

16 CAPÍTULO 2. REVISÃO DA LITERATURA para os utilizadores nais, a aplicação de restrições de acesso e a compatibi-lidade com os sistemas de informação e representação adotados pela institui-ção [58].

Na área da saúde, o processo de Data Warehousing permite partilhar a informação clínica ecientemente e integrar os registos eletrónicos produzidos na instituição hospitalar a nível institucional, regional ou até nacional. Esta estratégia, quando bem implementada, é capaz de responder aos desaos do sector clínico: velocidade, variedade, volume e validade [60].

Um vasto número de metodologias para Data Warehousing está presente-mente disponível. Tendo em conta o foco do modelo de negócio e a estrutura dimensional da informação, este projeto adota uma metodologia bottom-up sugerida por Ralph Kimball, descrita posteriormente na secção 4.3 [61].

2.3.3 Visualização da Informação

As ferramentas para a representação e análise da informação dependem do utilizador nal, e podem aceder diretamente à informação do DW ou através de um browser [43,62].

A formulação de queries permitem representar informação relevante a partir de consultas ao DW na forma de dashboards ou outras ferramentas grácas, transformando-a num contexto apropriado e legível. A análise mul-tidimensional tem-se tornado um conceito popular no contexto de BI, e pro-porciona a extensão das capacidades da comunicação por queries. A visu-alização multidimensional capacita os utilizadores com um maior nível de pormenor, determinado dinamicamente. As relações complexas da informa-ção são analisadas através de um processo iterativo que permite uma pesquisa detalhada, e ao mesmo tempo sintetizada e agregada, facilitando o processo de tomada de decisões face a um problema de negócio [62].

On-line Analytical Processing (OLAP)

A tecnologia On-line Analytical Processing surge para responder à ne-cessidade de obtenção de informações que apoiem o processo de tomada de decisões de forma transparente e percetível. OLAP suporta operações de

(40)

2.3. BUSINESS INTELLIGENCE E A INFORMAÇÃO MÉDICA 17 ltragem, agregação e rotação, permitindo visualizar a informação multidi-mensional com o detalhe requisitado [63].

Os servidores OLAP são implementados através de Sistemas de Gestão de Bases de Dados (SGBD)relacionais ou dimensionais capazes de computar cubos de dados de forma a aumentar o processamento de queries. A vantagem desta abordagem manifesta-se na indexação de propriedades e rapidez na resposta das queries, proporcionando ao utilizador nal uma visão analítica e global dos dados [43].

As bases de dados OLAP integram as medidas, dados numéricos, e as dimensões, classes para organizar as medidas. Os cubos caracterizam as medidas por nível dimensional e hierarquia que uma dada decisão deve ter em conta [63]. Estes conceitos encontra-se representados na gura 2.3.

Figura 2.3: Representação de uma estrutura OLAP (adaptado de [63]). Cada cubo tem várias medidas (os valores representados nas faces da gura2.3), que dependem das dimensões que se escolhe analisar (neste caso, as dimensões x e y).

As operações comOLAP permitem aumentar e diminuir o nível de agre-gação dos dados, através de tecnologias de roll up e drill down, ao longo de uma ou mais hierarquias dimensionais. As capacidades de slice e dice, permitem selecionar e projetar informação especíca, e o pivot proporciona

(41)

18 CAPÍTULO 2. REVISÃO DA LITERATURA a rotação do eixo de dados, para alterar a perceção da informação.

Há várias ferramentas open-source capazes de suportar este tipo de re-presentação multidimensional de dados estruturados em DWs. Na secção 4.5 é descrita a tecnologia Pentaho, utilizada na construção da camada de visualização da informação de GO [63].

2.4 Descoberta do Conhecimento e Data

Mi-ning em Contexto Hospitalar

Em sistemas clínicos, o vasto número de dados gerado por SIs e dispo-sitivos médicos com que as organizações se deparam tornam impraticável a utilização de métodos manuais de análise para explorar a informação e prever eventos. Este fenómeno motiva o desenvolvimento de técnicas para tratar, analisar e compreender a informação, de forma a descobrir novo conhecimento para aprimorar o apoio à decisão [6466].

A descoberta do conhecimento constitui uma metodologia extremamente importante na concretização deste objetivo, e refere-se ao processo de identi-car padrões úteis em informação devidamente tratada, através da utilização de técnicas analíticas computacionais e machine learning [67,68].

A Descoberta de Conhecimento em Bases de Dados (DCBD) é um pro-cesso automático, de análise exploratória e modelação, que trata grandes repositórios de informação e extraí informação implícita e potencialmente útil, através da aplicação de algoritmos de Data Mining, tendo em conta o objeto do estudo e a magnitude dos dados [69,70]. Segundo Fayyad, et al [71], o processo de DCBD é a concretização de um conjunto de cinco etapas descritas na gura 2.4.

Primeiramente seleciona-se os dados relevantes tendo em conta o objetivo do estudo/negócio e cria-se o dataset. A segunda etapa incluí a limpeza e pro-cessamento dos dados, de forma a manter a sua consistência. De seguida, os dados são transformados de acordo com a nalidade pretendida. Quando os dados estão prontos, a quarta etapa induz as técnicas de DM para encontrar padrões na informação e dar resposta ao problema colocado. A quinta etapa

(42)

2.4. DESCOBERTA DO CONHECIMENTO E DATA MINING EM CONTEXTO HOSPITALAR19 do processo trata da interpretação e avaliação destes padrões, alcançando a

potencial descoberta de conhecimento.

Figura 2.4: Representação do processo da Descoberta do Conheci-mento(adaptado de [71]).

Embora a aplicação doData Mining seja um passo crucial no processo de DCBD, os dois conceitos não são sinónimos. O processo deDCBDrefere-se à sequência de selecionar, transformar e descobrir nova informação, enquanto o DM consiste na aplicação de algoritmos para a extração de modelos de informação [72].

O conceito de DM unica várias ferramentas desde métodos estatísticos e analíticos, tecnologias de bases de dados, machine learning e reconheci-mento de padrões, constituindo um instrureconheci-mento complexo para a análise de informação [73].

Nos últimos anos, este processo tem sido aplicado em informação médica, tanto no domínio clínico como cientíco [74]. Colak, et al [75], aplicaram o processo deDCBDe as técnicas deDM Redes Neuronais Articiais (RNA) e Support Vector Machines (SVM)para prever o enfarte, com dados do depar-tamento de emergência correspondentes a 297 registos individuais, atingido modelos de previsão com valores de acuidade de 82%, aproximadamente. Pombo, et al [76] destacam a aplicação de algoritmos de DM nos SADC hospitalares para a gestão e monitorização da dor dos utentes. Outros es-tudos aplicam esta metodologia com o intuito de contribuir para a redução do número de diversos eventos adversos, para antecipar o comportamento dos utentes e encontrar soluções atempadamente, de forma a aumentar a

(43)

20 CAPÍTULO 2. REVISÃO DA LITERATURA qualidade dos serviços e decisões clínicas e reduzir os custos na gestão da instituição [77,78].

Ambos os conceitos de BI e DCBD destacados nas secções anteriores constituem elementos apropriados para ajudar na tomada de decisões em organizações de saúde, suscetíveis de trabalhar em conjunto. Enquanto as ferramentas de BI tencionam tornar a informação mais legível e útil para os utilizadores, o processo de DCBD procura relacionar os dados computacio-nalmente através da análise e aprendizagem automática [79].

2.5 Apoio à Decisão em Obstetrícia e

Gineco-logia

Na área daGinecologia e Obstetrícia, vários estudos têm sido exploradas para auxiliar a tomada de decisão dos prossionais de saúde, assim como identicar soluções para as limitações dos serviços materno-infantis, que de-correm nomeadamente à aplicação de Data Mining [80].

Lee, K. e Gay, C. [81] testam a hipótese que fatores como a fatiga e perturbações no sono na última fase da gravidez estão associados com o tipo de parto e a sua duração, concluindo que as mulheres com depravação de sono são mais suscetíveis de requerer um parto por cesariana. Kenny, et al [80] utilizam técnicas deDMpara prever antecipadamente a pré-eclampsia, um síndrome especíco da gravidez que pode ser mortal para a mãe e o feto. Taylor, et al [82] induzem um algoritmo de clustering para identicar a disparidade das características da grávida e implicação das intervenções efetuadas em utentes que não recebem cuidados pré-natais. Exemplos mais recentes da utilização de técnicas deDM e processamento da informação na área de GO incluem um sistema de classicação para mapear documentação de enfermagem baseado nas listas de diagnósticos e intervenções, a exploração de fatores de risco para a previsão de nascimentos pré-termo e a classicação do choro do recém-nascido como indicador do estado de saúde do bebé [83 85].

(44)

cui-2.6. CONCLUSÃO 21 dados de GO das maternidades e a satisfação dos seus utentes, através do estudo das suas características. Carter, et al [86], apresenta uma framework de princípios e atributos para o desenvolvimento de um sistema para cuidados materno-infantis com alta eciência a longo termo. Por outro lado, Wiegers aponta uma abordagem baseada na informação da experiência das utentes, para caracterizar o sistema de cuidados materno-infantis, na Holanda [87].

Assim, apesar de se registarem alguns estudos na área, a utilização das TIs nos cuidados de GO não regista uma evolução acentuada nos últimos anos, nomeadamente na utilização de tecnologias de Business Intelligence, fazendo assim do presente projeto uma solução inovadora e relevante na área.

2.6 Conclusão

A aplicação das Tecnologias de Informação no sector da saúde vem me-lhorar a comunicação e o acesso à informação médica, reduzir os custos e, de uma forma geral, contribuir para a melhoria dos serviços, uma vez que lida com o vasto volume e complexidade das transações médicas e com a fragmentação e falta de coordenação entre unidades clínicas.

A implementação dos SADCs é o passo que segue a adoção das TIs, proporcionando uma função ativa no processo clínico e na tomada de decisões. Mais recentemente, ferramentas deBusiness Intelligence e Descoberta de Conhecimento têm tido um impacto notável no apoio à decisão hospitalar. OBIapresenta-se como sendo uma solução prociente para o processamento dos dados dos vários SIs e representação intuitiva e dinâmica da informa-ção, contribuindo para a melhoria operacional e eciência clínica de qualquer instituição de saúde. O processo da Descoberta de Conhecimento, e por con-sequente, a utilização de técnicas deData Mining proporcionam, por sua vez, uma mais-valia na compreensão da informação e previsão de eventos, através da exploração e modelação de padrões na informação clínica.

Na área deGO, a maior parte dos estudos encontrados na literatura apli-cam metodologias deDM para obter conhecimento, mostrando a viabilidade da sua utilização. A utilização de BI destaca-se como uma abordagem ino-vadora na área.

(45)

22 CAPÍTULO 2. REVISÃO DA LITERATURA No próximo capítulo introduz-se o caso de estudo deste projeto, o Centro Materno Infantil do Norte (CMIN), a unidade de cuidados materno-infantis do Centro Hospitalar do Porto (CHP). No CMIN, estão implementadas al-gumas soluções para o apoio na tomada de decisões, como um SADC que integra um sistema de pré-triagem deGO. Estas soluções, bem como alguns estudos que têm vindo a ser desenvolvidos pela equipa, serão apresentados de seguida.

(46)

Capítulo 3

Caso de Estudo

Este capítulo começa por introduzir a instituição de saúde que suporta este projeto e os serviços de saúde prestados pela mesma. Na segunda secção estão descritos os Sistemas de Informação (SIs) utilizados pela instituição para o registo das práticas e dos procedimentos realizados, seguindo-se de uma breve apresentação à plataforma que garante a interoperabilidade des-tes sistemas. Na secção 3.3, é apresentado o trabalho relacionado onde se destacam os estudos anteriormente elaborados no sentido de apoiar a to-mada de decisão médica e os Sistema de Apoio à Decisão Clínica (SADC) hoje implementados no hospital. O capítulo termina com uma breve conclu-são à posição atual da instituição de saúde no universo das Tecnologia de Informação (TI).

3.1 Introdução

O presente projeto foi desenvolvido em parceria com o Centro Materno Infantil do Norte (CMIN), a unidade de cuidados materno-infantis do Cen-tro Hospitalar do Porto (CHP). Desde 2014, esta unidade hospitalar presta cuidados de ginecologia, obstetrícia e neonatologia aos utentes do CHP, dis-pondo ainda de um serviço de internamento de Pediatria [88].

As utentes encaminhadas para o CMIN procuram cuidados na especi-alidade de ginecologia, que trata de condições relacionadas com o sistema

(47)

24 CAPÍTULO 3. CASO DE ESTUDO reprodutor feminino, de obstetrícia, dedicada aos aspetos patológicos e sio-lógicos da gravidez, parto e período pós-parto da utente, e de neonatologia, responsável pela saúde do recém-nascido até aos 28 dias de idade [89]. Este tipo de instituição trata problemas de natureza sensível que podem inuen-ciar mais do que a saúde física da utente, sendo necessário oferecer cuidados seguros e qualicados. A atitude dos prossionais de saúde também constitui um aspeto importante para elevar a satisfação dos utentes [90].

No CHP, a informação clínica gerada nas diferentes unidades hospitala-res, incluindo o CMIN, é registada através deSIs e a sua interoperabilidade permite explorar ferramentas para apoiar a decisão médica e melhorar os serviços.

3.2 Sistemas de Informação do CMIN e a sua

Interoperabilidade

O registo da informação clínica no CHP é assegurada por diferentes Sis-temas de Informação como o Sistema de Apoio à Prática de Enfermagem (SAPE), o Sistema de Gestão de Doentes Hospitalares (SONHO) e o Sis-tema de Apoio Médico (SAM). Para superar a heterogeneidade e distribui-ção destas fontes de informadistribui-ção é necessária a integradistribui-ção de uma plataforma dinâmica que permite a partilha de informação entre sistemas.

A Agência para a Integração, Difusão e Arquivo de Informação Médica e Clínica (AIDA) surge neste contexto, capaz de conectar os SIs e tornar possível a extração e processamento da informação e posterior aplicação na exploração de conhecimento. AAIDAé baseada no uso de agentes pró-ativos e assegura a interoperabilidade entre os mencionadosSistemas de Informação doCHP, os sistemas complementares, como oLaboratory Information System (LIS), o Department Information System (DIS) e o Radiology Information System (RIS), e os serviços web, presentes na gura3.1), permitindo o registo de toda a informação num banco de dados, o Processo Clínico Eletrónico (PCE). Esta plataforma multi-agente possibilita a padronização dos sistemas clínicos distribuídos e ultrapassa a complexidade médica e administrativa das

(48)

3.2. SISTEMAS DE INFORMAÇÃO DO CMIN E A SUA INTEROPERABILIDADE25 diferentes fontes de informação [23,91,92].

Figura 3.1: Os módulos da AIDA (adaptado de [93]).

No CMIN, o registo da informação depende maioritariamente do SAPE e dos Registo de Saúde Eletrónico (RSE). O SAPE resulta dos sistemas de informação de enfermagem como uma alternativa ao registo tradicional da informação em papel, e é utilizado para apoiar as práticas de enfermagem. Este sistema regista os episódios clínicos associados a cada utente, como o registo de intervenções [94]. Atualmente, este sistema está inserido no soft-ware SClínico que reúne várias aplicações hospitalares e permite gerir várias funcionalidades a partir de um único perl. Por sua vez, osRSE constituem um sistema para recuperar e armazenar informação individual e detalhada acerca do utente, como a nota de admissão, e ajuda na monitorização dos cuidados prestados, através da disponibilidade de informação conveniente em momentos cruciais do processo clínico [95]. O objetivo principal deste sis-tema é fornecer uma forma segura, conável e eciente de registar e agrupar toda a informação pessoal de um utente, desde condições genéticas a diag-nósticos [96].

(49)

26 CAPÍTULO 3. CASO DE ESTUDO

3.3 Apoio à Decisão nos Cuidados de GO

Inspirado no SADC implementado na unidade de cuidados intensivos do CHP(projeto INTCare), utilizado para prever a falência de órgãos [95,97,98], o CMIN criou um SADC que induz modelos através de técnicas de Data Mining (DM) e um conjunto de agentes que executam tarefas automatica-mente. Este sistema oferece uma compreensão superior das condições reais dos utentes por parte dos prossionais de saúde, tornando os cuidados mais apropriados, ao nível do tempo e da qualidade [89].

EM 2014 foram desenvolvidos alguns estudos que contribuem para o apoio à decisão nos cuidados deGinecologia e Obstetrícia (GO) doCMIN, a serem incluídos noSADC. Brandão, et al [99], aplica técnicas deDMpara identicar o risco de grupo no processo da Interrupção Voluntária da Gravidez (IVG), obtendo bons resultados, com valores de sensibilidade de aproximadamente 93%. No mesmo tópico, os autores induziram modelos de DM para prever o local mais apropriado (CMIN ou Casa) para ser processada a segunda administração de medicação do processo deIVG, obtendo modelos com uma acuidade superior a 89% [100].

3.3.1 Sistema de Pré-triagem de Ginecologia e

Obste-trícia

No serviço de emergência, o CMIN apresenta um sistema de pré-triagem de GO que tem por base a melhoria da qualidade dos cuidados e a redução dos riscos associados com o tempo de espera.

Geralmente, o departamento de emergência de um hospital utiliza um dos sistemas de triagem de prioridades mais comuns, como o Manchester Triage System (MTS) e o Emergency Severity Index (ESI). A generalidade das regras destes sistemas não se adequam aos cuidados deGOe às condições especícas dos utentes que procuram este serviço. Neste contexto, foi cons-truído um sistema especíco de pré-triagem que classica os utentes em dois grupos: urgência (URG) e consulta (ARGO), preparado para lidar com sin-tomas de gravidez e parto, avaliação de fatores de risco fetal e características

(50)

3.3. APOIO À DECISÃO NOS CUIDADOS DE GO 27 obstétricas e ginecológicas [101].

Este sistema está implementado no CMIN desde 2010 e é baseado num conjunto de questões pré-denidas na forma de regras de uma árvore de decisão. O sistema de pré-triagem está inserido no SADC implementado na unidade hospital, suportando este processo de forma automática, de forma a indicar o resultado da triagem (URG ou ARGO). O SADC utiliza técnicas de inteligência articial e modelos de decisão para fornecer o resultado da triagem. Este procedimento é processado de forma iterativa e adaptável, e proporciona ao prossional de saúde responsável pelo processo de triagem uma melhor compreensão do estado real do utente [89,102].

O sistema de pré-triagem ajuda a aumentar a segurança dos utentes em necessidade de cuidados urgentes e reduz a prestação de cuidados de alto risco em utentes sem risco, maximizando o uso dos recursos hospitalares. No entanto, a especicidade que este sistema oferece para utentes de GO não é suciente para cumprir todos os requisitos clínicos sugeridos pela Direção Geral de Saúde (DGS). ADGS, no âmbito do Plano Nacional da Saúde, pro-põem a integração de um sistema de triagem com cinco níveis de prioridade. Para responder a este requisito, o CHP propôs, em 2014, um sistema de prioridades especíco paraGO, baseado em três sistemas de triagem: oMTS, o Obstetric Triage Acuity Scale (OTAS) e o sistema de pré-triagem imple-mentado presentemente. Um algoritmo de simulação foi desenvolvido para avaliar a aplicabilidade do sistema de prioridades, através do histórico clínico relativo ao sistema de pré-triagem, disponível através dosSIsdoCMIN. Esta simulação obteve resultados promissores que incentivam a implementação do novo sistema, contudo este encontra-se ainda em fase de validação por parte da administração do CHP[103].

3.3.2 Plataforma de Busines Intelligence

A quantidade crescente da informação nos SIs doCMIN e a necessidade de representar esta informação de uma forma clara e prociente levou à intro-dução das tecnologias de Business Intelligence (BI) para auxiliar a tomada de decisão médica.

Imagem

Figura 2.4: Representação do processo da Descoberta do Conheci- Conheci-mento(adaptado de [71]).
Figura 4.1: Abordagem em ciclos da metodologia Design Science Research (adaptado de [109]).
Figura 4.2: Abordagem em etapas da metodologia Design Science Research (adaptado de [111]).
Figura 4.5: Arquitetura da tecnologia Pentaho BI Suite(adaptado de [139]).
+7

Referências

Documentos relacionados

Num centro de saúde existem dois médicos de clínica geral para atender os doentes. A chegada destes ao posto segue uma distribuição Poisson de média 10 por hora. Um dos

Apesar da longa distância dos grandes centros urbanos do país, Bonito destaca- se, regionalmente, como uma área promissora dentro do Estado de Mato Grosso do Sul. Bonito,

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

Consequentemente, baseando-se nas posições dos ranks resultantes das combinações das diferenças de acurácia com os testes estatísticos aplicados nos gráficos ilustrados, quando

 Exercícios Não Específicos Representativos (NER) – tarefas de treino que não contemplam princípios de jogo específicos do modelo de jogo, independentemente do nível

Segundo Cheng (2007) a casa da qualidade (planejamento do produto) é utilizada para traduzir a qualidade demandada pelos clientes em requisitos técnicos do produto

Diante dos discursos levantados por tais instituições, sejam elas, os Museus, os Institutos, ou as Faculdades, a obra de Schwarz 1993, fornece amplo conhecimento sobre a formação