• Nenhum resultado encontrado

Previsão de tempos cirúrgicos num hospital

N/A
N/A
Protected

Academic year: 2021

Share "Previsão de tempos cirúrgicos num hospital"

Copied!
79
0
0

Texto

(1)

PREVISÃO DA DURAÇÃO DE PROCEDIMENTOS CIRÚRGICOS

NUM HOSPITAL

por

Sílvia Susana de Moura Carvalho

Mestrado em Modelação, Análise de Dados e Sistemas de Apoio à Decisão

Orientada por:

Professor Doutor João Gama, FEP

Professora Doutora Adelaide Figueiredo, FEP Professor Doutor António Carvalho Brito, SCMP

(2)
(3)

NOTA BIOGRÁFICA

Sílvia Carvalho (1987- )

Sílvia Carvalho nasceu em Celorico de Basto, mas vive e trabalha no Porto. Iniciou a sua formação em Vila Real (na Universidade de Trás-os Montes e Alto Douro) em Genética e Biotecnologia, em Guimarães (pela Universidade do Minho) o Mestrado em Micro e Nano Tecnologias tendo frequentado o programa ERASMUS para complemento da tese de mestrado em Self-Cleaning Materials based on fibers que finalizou no CeNTI – Centre for Nanotechnology and Smart Materials. Dedicou os primeiros três anos do seu percurso profissional à transformação de um projeto numa plataforma internacional para desenvolvimento e comercialização de projetos inovadores. Em 2015, inicia novo desafio profissional na Santa Casa da Misericórdia do Porto a desempenhar funções no departamento de Sistemas de Informação como Responsável pela Área de Gestão de Alterações e Soluções Aplicacionais que suportam as várias áreas de negócio, o seu trabalho tem especial enfoque nas áreas da Saúde e Social. Paralelamente à sua formação profissional está a frequentar o mestrado (pela Faculdade de Economia do Porto) em Modelação e Análise de Dados e Sistemas de Apoio à Decisão.

(4)
(5)

AGRADECIMENTOS

Gostaria de agradecer a todas as “pessoas bonitas” que fizeram parte deste trabalho. À Santa Casa da Misericórdia do Porto por me permitir realizar este trabalho, em especial ao Engenheiro João Figueiredo, ao Professor António Brito, ao Dr. Luís Matos e à fantástica equipa que compõe o DSI do qual me orgulho de pertencer.

À FEP, Professora Adelaide Figueiredo e Professor João Gama pela orientação e ajuda que prestaram durante este último ano.

À minha família, ao Paulo e aos amigos MADSAD que se transformaram nesta pequena jornada.

(6)
(7)

RESUMO

O hospital conta com 19 anos de histórico de informação clínica nos sistemas de informação hospitalar e à semelhança do que acontece a nível nacional não é formado conhecimento a partir desse tesouro de informação. Assim, urge a necessidade de investigar mais e melhores métodos em análise de dados que permitam a automatização dos processos e gerem a criação de conhecimento em vários setores. Este estudo pretende contribuir e incentivar à prática de procedimentos preditivos no hospital com vista à melhoria dos serviços e à satisfação do utente. Partimos de uma base de dados com 65536 intervenções em 34377 utentes realizadas entre 2010 e 2016 em 5 especialidades distintas: urologia, cirurgia geral, cirurgia plástica, oftalmologia e ortopedia. Foram estudadas as variáveis individualmente e de forma condicionada de modo a conhecer as suas caraterísticas bem como, quando condicionadas com a variável alvo. A metodologia selecionada para elaboração do estudo foi a CRISP-DM com 6 fases distintas. Durante a fase de modelação foi escolhido o modelo de regressão Naive Bayes que revelou ser o mais fácil de implementar e com melhores resultados. A previsão foi dividida por especialidade obtendo-se taxas de erro médias inferiores a 9,087% que corresponde à especialidade de urologia e a especialidade com menor erro de previsão foi cirurgia plástica com uma taxa de erro média de 4,759%. Embora a variância da taxa de erro esteja compreendida entre 0,251 e 5,903 (ortopedia e urologia, respetivamente). O objetivo inicialmente estabelecido de obter previsão com taxa inferior a 20% foi superado e acreditamos estar em condições para implementar um modelo preditivo no hospital que possa contribuir para mais e melhor prestação de cuidados ao utente.

Palavras-chave: Cirurgias, Conhecimento de dados, CRISP-DM, Knime, Métodos preditivos, Naive Bayes.

(8)
(9)

ABSTRACT

The hospital has 19 years of clinical information history at information systems and similar to what happens at the national level any knowledge is formed from this information treasure. Thus, there is a need to investigate more and better methods in data analysis that allow the automation of processes and generate the creation of knowledge in several sectors. This study aims to contribute and encourage the practice of predictive procedures in the hospital with a view to improving services and patient satisfaction. We started from a database with 65 536 interventions in 34 337 patients performed between 2010 and 2016 in 5 different specialties: urology, general surgery, plastic surgery, ophthalmology and orthopedy. The variables were studied individually and in a conditioned way so as to know their characteristics as well as when conditioned with the target variable. The methodology selected for the elaboration of the study was CRISP-DM with 6 distinct phases. During the modeling phase, the Naive Bayes regression model was chosen, which proved to be the easiest to implement and with the best results. The prediction was divided by specialty, obtaining mean error rates lower than 9.087% corresponding to the specialty of urology and the specialty with the lowest prediction error was plastic surgery with an average error rate of 4.759%. Although the variance of the error rate is between 0.251 and 5.903 (orthopedics and urology, respectively). The initial objective of obtaining prediction with a rate lower than 20% was surpassed and we believe we are able to implement a predictive model in the hospital that can contribute to more and better care of the patient.

Key-words: CRISP-DM, Data Mining, Knime, Predictive Methods, Naive Bayes, Surgeries

(10)
(11)

ÍNDICE

NOTA BIOGRÁFICA ... III AGRADECIMENTOS ... V RESUMO ... VII ABSTRACT ... IX ÍNDICE ... XI ÍNDICE DE FIGURAS ... XIII ÍNDICE DE TABELAS ... XVII

CAPÍTULO 1 – INTRODUÇÃO ... 1

1.1INTRODUÇÃO E MOTIVAÇÃO ... 1

1.2DESCRIÇÃO DO PROBLEMA ... 4

CAPÍTULO 2 – ESTADO DA ARTE ... 7

2.1REVISÃO DA LITERATURA: PRINCIPAIS LINHAS DE ORIENTAÇÃO ... 7

2.2ANÁLISE CRÍTICA DA LITERATURA REVISTA ... 11

CAPÍTULO 3 – METODOLOGIA APLICADA ... 13

3.1FORMULAÇÃO E METODOLOGIA APLICADA ... 13

3.1.1 Compreensão do negócio ... 14

3.1.2 Compreensão dos dados ... 17

3.1.3 Preparação dos dados ... 36

3.1.4 Modelação ... 38 3.1.5 Avaliação ... 41 3.1.6 Implementação ... 48 CAPÍTULO 4 – CONCLUSÕES ... 51 REFERÊNCIAS ... 55 ANEXOS ... 57

ANEXOA-RESUMO DA CARATERIZAÇÃO DAS VARIÁVEIS ALVO DE ESTUDO. ... 57

ANEXO B – DESIGNAÇÃO DOS CÓDIGOS DE INTERVENÇÃO CIRÚRGICOS, COM AS ICD9. ... 59

(12)
(13)

ÍNDICE DE FIGURAS

Figura 1. Especialidades cirúrgicas do HP. ... 2

Figura 2. Grupo de variáveis que estão diretamente relacionadas com a duração da cirurgia e podem ter influência na previsão. ... 5

Figura 3. Evolução do número de artigos publicados de 2004 a 2014 relacionados com a otimização do bloco operatório, adaptado de (Samudra et al., 2016). ... 7

Figura 4. Ilustração da metodologia CRISP-DM. ... 14

Figura 5. Circuito de um utente inscrito para cirurgia. ... 15

Figura 6. Circuito do utente no bloco operatório num episódio cirúrgico. ... 16

Figura 7. Distribuição do número de intervenções por especialidade de 2010 a 2016, obtido via MS Excel. ... 18

Figura 8. Diagrama de barras relativo à distribuição das cirurgias por código de especialidade, obtido via Knime. ... 19

Figura 9. Diagrama de barras relativo ao tipo de cirurgia, via Knime. ... 20

Figura 10. Diagrama de barras representativo da atividade de cada cirurgião principal, obtido via Knime. ... 20

Figura 11. Diagrama de barras relativo ao género dos utentes submetidos a cirurgia, obtido via Knime. ... 21

Figura 12. Diagrama de barras com a distribuição do tipo de anestesia, obtido via Knime. ... 22

Figura 13. Diagrama de barras relativo ao tipo de produção das cirurgias (programada ou urgente), obtido via Knime. ... 22

Figura 14. Boxplot referente ao atributo numérico idade, retirado do software Knime. . 23

(14)

Figura 16. Boxplot referente ao atributo numérico duração da cirurgia, obtido via Knime. ... 25 Figura 17. Boxplot relativo à duração cirúrgica condicionada aos tipos de cirurgia: cirurgia e cirurgia de ambulatório, obtido via Knime. ... 26 Figura 18. Boxplot relativo à duração cirúrgica por interveniente, obtido via Knime. .... 26 Figura 19. Boxplot relativo à duração cirúrgica por interveniente, obtido via Knime (cont.). ... 27 Figura 20. Boxplot da duração cirúrgica condicionado ao código de especialidade respetivo (50, 51, 57, 58, 65 e 85), obtido via Knime. ... 28 Figura 21. Boxplot da duração cirúrgica condicionada ao mês em que foi realizada, obtido via Knime. ... 29 Figura 22. Boxplot da duração cirúrgica condicionada ao dia da semana (1- domingo, 2- segunda-feira, 3- terça-feira, 4 – quarta-feira, 5 – quinta-feira, 6 – sexta-feira e 7 – sábado), obtido via Knime. ... 29 Figura 23. Boxplot da duração da cirurgia condicionado ao tipo de anestesia, obtido via Knime. ... 30 Figura 24. Boxplot ilustrativo da duração cirúrgica por género feminino (F) e masculino (M), obtido via Knime. ... 31 Figura 25. Boxplot da duração cirúrgica condicionado à variável idade convertida em faixa etária, obtido via Knime. ... 32 Figura 26. Boxplot da duração cirúrgica condicionado à variável “localidade” representada pelas 7 localidades principais, obtido via Knime. ... 33 Figura 27. Boxplot ilustrativo da duração da cirurgia para a intervenção 1341 da especialidade de oftalmologia por interveniente que a realiza, obtido via Knime. . 34 Figura 28. Teste Kruskal-Wallis para as categorias cirurgião principal, idade, mês, dia da semana e género, obtido via SPSS (cont.). ... 35 Figura 29. Informação proveniente do modelo de aprendizagem Naive Bayes na especialidade 51, obtido via Knime. ... 42 Figura 30. Informação proveniente do modelo de aprendizagem Naive Bayes relativa à classificação mediante código de intervenção na especialidade 51, obtido via Knime. ... 42 Figura 31. Informação proveniente do modelo de aprendizagem Naive Bayes relativa à classificação mediante interveniente na especialidade 51, obtido via Knime. ... 43 Figura 32. Informação proveniente do modelo de aprendizagem Naive Bayes relativa à classificação mediante faixa-etária do utente na especialidade 51, obtido via Knime. ... 43

(15)

Figura 34. Estatística de exatidão da previsão na especialidade 51, obtido via Knime. .. 44 Figura 35. Informação proveniente do modelo de aprendizagem Naive Bayes na especialidade 85, obtido via Knime. ... 45 Figura 36. Informação proveniente do modelo de aprendizagem Naive Bayes relativa à classificação mediante código de intervenção na especialidade 85, obtido via Knime. ... 46 Figura 37. Informação proveniente do modelo de aprendizagem Naive Bayes relativa à classificação mediante interveniente na especialidade 85, obtido via Knime. ... 46 Figura 38. Informação proveniente do modelo de aprendizagem Naive Bayes relativa à classificação mediante faixa-etária do utente na especialidade 85, obtido via Knime. ... 46 Figura 39. Matriz de confusão para a previsão na especialidade 85, obtido via Knime. . 47 Figura 40. Estatística de exatidão da previsão na especialidade 51, obtido via Knime. .. 47 Figura 41. Proposta de modelo Naive Bayes a implementar no Hospital, software Knime. ... 48

(16)
(17)

ÍNDICE DE TABELAS

Tabela 1. Resumo de estudos similares. ... 12

Tabela 2. Atributos eliminados com respetivo motivo de exclusão. ... 37

Tabela 3. Códigos de intervenção mais frequentes por especialidade. ... 40

Tabela 4. Resultados provenientes do modelo Naive Bayes, obtidos via Knime. ... 40

Tabela 5. Resultados provenientes do modelo Naive Bayes após otimização, obtido via Knime. ... 41

Tabela 6: Resumo da percentagem de erros do modelo de previsão com validação cruzada, obtido via Knime. ... 41

(18)
(19)

CAPÍTULO 1 – INTRODUÇÃO

1.1 Introdução e Motivação

A economia da saúde é considerada uma área autónoma na Economia, não só porque o setor é suficientemente vasto e complexo nas relações entre os agentes económicos que nele intervêm, mas também porque a sua importância quantitativa é grande quer em despesa quem em recursos humanos e, ainda, porque a análise que é usada em outros setores não é diretamente aplicável (Barros, 2013).

O hospital é um ator fundamental no setor da saúde onde é possível a aplicação de ideias de eficiência e substituibilidade de fatores, entre muitos outros. Tal como sugere o autor Pedro Pita Barros, é necessário definir muito bem o conceito de hospital, assim “um hospital é uma instituição onde as pessoas doentes recebem tratamento médico”. No que se refere ao foco económico esta definição pode ser muito pouco pertinente. O que realmente identifica um hospital é o facto de existir internamento. Embora possa ter outros tipos de produção o tratamento em internamento é o que realmente o distingue das restantes instituições (Barros, 2013).

À semelhança do que acontece em outros países, também em Portugal os hospitais sem fins lucrativos têm um lugar importante. Grande parte dos hospitais são referentes ao Serviço Nacional de Saúde (SNS) e, aproximadamente, metade dos que não pertencem ao SNS não têm fins lucrativos. O declínio dos hospitais das Misericórdias associado ao crescimento dos hospitais do setor público levou, de modo significativo, à inclusão no SNS das unidades hospitalares sob gestão pelas Misericórdias (Barros 2013).

(20)

O Hospital da Prelada (HP) pertence à Santa Casa da Misericórdia do Porto (SCMP) e conta com 28 anos de história. Neste hospital são tratados tanto doentes privados, como beneficiários de subsistemas com os quais o Hospital tem acordo como também utentes do SNS referenciados por Médico de Família / Hospital Público. Os serviços que o Hospital disponibiliza ao cidadão prendem-se com consultas, Meios Complementares de Diagnóstico e Terapêuticos (MCDTs) e Cirurgia. No que concerne à Cirurgia as especialidades são as indicadas na Figura 1.

Figura 1. Especialidades cirúrgicas do HP.

As listas de espera são um fator crítico para a saúde em Portugal, segundo Barros (2013) em maio de 1999 estimava-se que houvesse cerca de 81 mil utentes SNS fora do tempo considerado clinicamente aceitável. E este número subiu nos anos subsequentes. Mesmo após o Programa de Promoção de Acesso criado pela Lei 27/99, em 2000 as cirurgias realizadas foram 18 872, cerca de 70% do total programado.

A procura de procedimentos cirúrgicos está a aumentar ao longo do tempo uma vez que a esperança média de vida é maior nos dias de hoje. Com este aumento de procura existem duas possibilidades para combater este problema:

1. Aumentamos o número de blocos operatórios, formamos mais cirurgiões, enfermeiros, anestesistas e outros intervenientes que atuam em ambiente de bloco, ou; Especialidades do Hospital Cirurgia Geral Cirurgia Plás5ca, Reconstru5va e Esté5ca O<almologia Ortopedia Urologia

(21)

2. Aumentamos a eficiência e a eficácia da gestão do bloco operatório perante a capacidade instalada (Abedini et al., 2016).

Geralmente a segunda opção é mais viável para os hospitais pelos custos a vários níveis que a primeira acarreta.

O Hospital da Prelada encerra um histórico de cerca de 16 anos de histórico que representa um volume colossal de dados quer de registo administrativo quer de registo clínico. Contudo, este volume de dados não tem sido potenciado ao longo do tempo para fazer uma análise mais abrangente ao negócio e potenciar assim decisões mais assertivas com base na informação que resulta da análise de um grande volume de dados.

Os sistemas de informação são utilizados para substituir os registos tradicionais em papel, potenciando melhorias a vários níveis incluindo, a comunicação, a redução de tempo de resposta, simplificação de processos, redução de burocracia e aumento de qualidade dos cuidados e segurança dos utentes.

Com o passar do tempo e à medida que se foram criando condições para registar e armazenar toda a atividade que é realizada começou a surgir a necessidade de serem utilizadas técnicas apropriadas para a sua análise e assim surgem técnicas de exploração de dados. Data mining surge como uma área onde é possível a extração de conhecimento proveniente do grande volume de dados. Tendo suporte nos sistemas de informação, o uso de técnicas de Data mining permitem o desenvolvimento de modelos de apoio à decisão em inúmeras setores de atuação, incluindo gestão e rentabilização dos serviços de internamento, tornando-se um fator crítico de sucesso (Caetano, 2013). Muitos autores têm atribuído aos casos cirúrgicos as salas do bloco operatório de modo a otimizar a sua eficiência sobre várias perspetivas. Contudo, há ainda um trabalho a percorrer no que diz respeito ao efeito que a prioridade da cirurgia bem como no tipo de cirurgia têm na performance das salas do bloco operatório. Na maioria dos trabalhos desenvolvidos sobre este tema o tipo de cirurgia não é levado em conta na fase de planeamento e vários tipos de cirurgia são agendados para a mesma sala de bloco. Esta combinação aumenta não só o número de procedimentos para cada sala como também os tempos de ócio/desaproveitamento. Em muitos estudos, na fase de planeamento as

(22)

cirurgias são sequenciadas pelo tempo máximo de procedimento da duração cirúrgica (Abedini et al., 2016).

Assim, tendo por base todos os pressupostos apresentados e motivada pela problemática das filas de espera esta tese terá como foco a previsão da duração de intervenções cirúrgicas de modo a contribuir para melhores resultados e um melhor serviço ao utente com menos custos para o Hospital.

1.2 Descrição do Problema

Normalmente a tarefa de previsão da duração dos procedimentos cirúrgicos está associada à definição das agendas do bloco operatório e é feita de modo muito rudimentar: ou pelo cálculo estatístico da média dos tempos dos procedimentos cirúrgicos (ShahabiKargar et al., 2014) (Kayış et al., 2015) ou pela experiência da pessoa que faz o agendamento dos atos (Schult et al., 2011) .

No caso do HP são os diretores de cada serviço que com base na sua experiência definem as durações e a respetiva agenda.

A previsão da duração cirúrgica pela média aritmética numa análise que foi efetuada por Schult e os seus colaboradores num período de três anos (2007 a 2009) levou a concluir que através desse procedimento verificou-se um desvio de 1 279 567 minutos (Schult et al., 2011).

A duração das intervenções cirúrgicas são difíceis de prever porque, para algumas cirurgias, a magnitude do procedimento só se torna evidente quando a cirurgia já está em execução. Adicionalmente, as durações dependem frequentemente de vários fatores complexos, por exemplo, as caraterísticas do doente, do cirurgião e da equipa cirúrgica. Como as durações individuais da cirurgia são incertas, também a sua soma é incerta. Apenas 44% leva em conta a incerteza de duração, enquanto 28% consideram a incerteza dos atrasos na chegada (Samudra et al., 2016).

A previsão dos tempos de procedimento cirúrgico é uma tarefa delicada que envolve a análise de múltiplos fatores quer do paciente quer externos que tenham influência direta

(23)

ou indireta. A Figura 2 ilustra as variáveis que podem ter influência direta na previsão da cirurgia do conjunto de variáveis que são registadas aquando do episódio de cirurgia.

Figura 2. Grupo de variáveis que estão diretamente relacionadas com a duração da cirurgia e podem ter influência na previsão.

Cada grupo de variáveis contém várias dimensões que são importantes analisar, tais como:

• Utente: idade, localidade, sexo e faixa etária; • Staff clínico: Função do interveniente; • Especialidade: código de serviço; • Diagnóstico: código de diagnóstico; • Codificação: código ICD;

• Codificação ASA: código ASA;

• Tipos de Anestesia: código tipo anestesia • Intervenção: código da intervenção;

• Tempo: inicio/fim de anestesia; início/fim bloco; início/fim cirurgia; início/fim recobro; início/fim sala.

A pormenorização de cada uma destas variáveis pode encontrar-se no

Duração da cirurgia Utente Staff Clínico Especialidades Diagnós5co Codificação Codificação ASA Tipos de Anestesia Intervenção Tempo

(24)
(25)

CAPÍTULO 2 – ESTADO DA ARTE

2.1 Revisão da literatura: principais linhas de orientação

Nos últimos anos tem havido uma crescente publicação de artigos relacionados com a temática de otimização do Bloco operatório, como podemos observar na Figura 3 (Samudra et al., 2016). Este tema é importante não só pela melhoria da eficiência dos Hospitais, mas também pela necessidade de prestação de melhores cuidados de saúde e consequente redução das filas de espera.

Figura 3. Evolução do número de artigos publicados de 2004 a 2014 relacionados com a otimização do bloco operatório, adaptado de (Samudra et al., 2016).

(26)

Tal como está descrito na revisão feita por Samudra e os seus colaboradores, há muitos estudos baseados na análise do histórico de dados que servem como input para a criação de modelos. Contudo, é dada pouca atenção à redução de variabilidade nos processos em estudo. Um dos exemplos mencionados prende-se com a previsão das durações cirúrgicas para as quais os autores referem que em vez de se prever imediatamente a duração da cirurgia deveria ser analisada a distribuição das intervenções cirúrgicas de modo a perceber se é realmente homogénea. Os autores entendem que não é estudada devidamente a população de pacientes para os quais as durações extrapolam a duração média (Samudra et al., 2016).

Esta premissa é igualmente apoiada por Combes et al. (2008), que defende que a dificuldade está em determinar / deduzir conjuntamente: a classificação (ou categorias) de pacientes associados a diferentes intervenções cirúrgicas e respetiva duração (que podem depender, por exemplo, da experiência do médico executante ou do desenvolvimento da condição do paciente.

Vários autores referem que há muitos fatores que representam variabilidade, afetam a previsão da duração do ato cirúrgico e devem ser levados em linha de conta: caraterísticas dos utentes (idade, género, diagnóstico, entre outros), tipo de cirurgia, cirurgiões principais, anestesistas (ShahabiKargar et al. 2014).

Durante as últimas duas décadas têm sido utilizadas técnicas de machine learning para prever a duração cirúrgica tais como: Regressão linear (Wright et al., 1996) (Combes et al., 2008), ANOVA (Stepaniak et al., 2010), abordagens bayesianas (Dexter and Ledolter 2005), Redes neuronais (Combes et al., 2008) (Devi et al., 2012), e Random Forest (RF) (Carlos Gomes et al., 2012) (ShahabiKargar et al., 2014).

No estudo de ShahabiKargar foi analisada uma amostra de um hospital australiano para a previsão da duração cirúrgica tendo em conta variáveis relacionadas com: o paciente, a operação e staff clínico. Esta escolha teve por base uma revisão exaustiva e a colaboração de clínicos e administradores do hospital na seleção de variáveis com possível influência na duração cirúrgica. A amostra teve por base 4 anos de histórico com cerca de 60 000 procedimentos cirúrgicos. Foram aplicadas técnicas de regressão: regressão linear, MARS (Multivariate Adaptative Regression Splines) e RF. Embora o

(27)

previsão, concluíram que o modelo RF teve um melhor desempenho comparativamente com os restantes (ShahabiKargar et al., 2014).

Uma outra alternativa de previsão da duração cirúrgica foi realizada através do estudo de protocolos de anestesia provenientes de um hospital alemão, tal como foi demonstrado no estudo de Schult. Recorreram a técnicas de seleção de caraterísticas (Feature selection) dos protocolos de anestesia, discretização da variável alvo (através de rough estimation) e subsequente classificação. Na fase de discretização foram utilizadas três técnicas: TUBE (Tree based Unsupervised Bin Estimator), EWIB (Equal Width Interval Binning). O melhor resultado foi obtido pelo algoritmo ID3 discretizado pelo algoritmo K-Means. O erro absoluto foi de 882 513 minutos que representa uma redução de 31,03% quanto comparado com a média aritmética. O método K-Means revelou-se a melhor solução para todos os algoritmos de aprendizagem e melhor para o J48 sobre o conjunto teste (Schult et al., 2011). Este estudo tem aplicação para hospitais que não possuam salas de recobro uma vez que a duração utilizada teve em conta o momento em que o utente recebe a anestesia até que acorda.

Com o intuito de estudar fatores que afetem diretamente a duração dos procedimentos cirúrgicos Strum e os seus colaboradores realizaram um estudo com uma amostra de 46322 casos cirúrgicos. Através de técnicas de data mining conseguiram concluir que o que mais influencia a variabilidade da duração dos atos é o cirurgião. Além dessa variável, o tipo de anestesia, a idade, o género, a classe de risco ASA (American Society of Anesthesiologists) são fatores que tem uma influencia direta na duração cirúrgica (Strum et al., 2000).

Combes e os seus colaboradores apresentam, igualmente, um artigo sobre a previsão da duração de atos cirúrgicos da especialidade de endoscopia tendo por base técnicas de data mining. Neste estudo foram utilizados dados de dois hospitais de origens francesa (14 646 cirurgias) e belga (20 525 cirurgias) tendo em conta os dados administrativos, histórico clínico do utente e dados clínicos relacionados com a cirurgia (cirurgião principal, tipo de anestesia, entre outros). Para tal foram usados métodos de redes neuronais e rough sets. Os autores afirmam que os resultados não foram satisfatórios uma vez que houve a dificuldade no agrupamento de variáveis que tenham efeito na previsão. Embora, a análise de dados no decorrer do estudo tenha permitido perceber

(28)

que a duração da intervenção cirúrgica depende essencialmente: do cirurgião, da experiência do cirurgião na intervenção a executar, no tipo de procedimento e no número de passos que o procedimento implica. Os autores sugerem para trabalhos futuros a criação de grupos com base em procedimentos cirúrgicos e não em diagnósticos, uma vez que, um paciente pode ter o mesmo diagnóstico que outro e não receber o mesmo tratamento. Bem como, aplicação de novas técnicas de data mining (unsupervised machine learning) com o intuito de encontrar outras classes de utentes (Combes et al., 2008).

Um método híbrido de previsão foi proposto por Hosseini e os seus colaboradores que defendem que a previsão da duração de atos cirúrgicos é importante para prevenir situações quer de sobre utilização quer de desaproveitamento do espaços, equipamentos e recursos humanos. O estudo foi realizado com dados de uma clinica no Arizona (Mayo Clinic) num total de 63 254 procedimentos cirúrgicos levados a cabo por 234 cirurgiões num período de 39 meses em 60 salas do bloco operatório. Os investigadores incluíram as seguintes variáveis no estudo: especialidade cirúrgica, prioridade, código ASA, idade, código do procedimento, duração dos procedimentos. O conjunto de dados revelou uma classificação de 2000 procedimentos diferentes no período em análise para os quais a duração de determinados procedimentos era muito similar apesar de terem códigos diferentes. Assim, métodos de classificação permitiram agrupar os 2000 procedimentos em 49 grupos distintos. Na classificação foram utilizadas árvores de decisão, alguns dos algoritmos foram ID3 e CART (Classification and Regression Trees). O modelo híbrido proposto envolveu dois passos:

1. criação de uma nova variável para categorizar todos os procedimentos transversal a todas as especialidades;

2. desenvolvimento de modelos de regressão para prever a duração de procedimentos cirúrgicos.

A avaliação mostrou que os dois modelos de regressão LIN e STEP tiveram uma boa performance. O método híbrido com a regressão STEP apresenta melhores resultados para especialidades como ortopedia, cirurgia geral e cirurgias oncológicas. Os autores sugerem a inclusão de mais dados clínicos para uma melhoria de resultados do estudo

(29)

Gomes, em 2014, quer no seu trabalho de tese quer num artigo publicado sobre o mesmo tema apresenta o seu estudo sobre a previsão da duração de procedimentos cirúrgicos. O autor aplica uma série de técnicas de data mining, incluindo CRISP-DM, REP tree, M5- Rules & M5P, Decision Stump, C4.5 & C5.0, RF, SVM, kNN, MARS. Há a referência relativamente à qualidade dos dados que são registados nos sistemas de informação que podem ser alterados por conveniência dos intervenientes e alteram os resultados do estudo. Contudo, o autor refere que para um período de um ano e meio foram perdidos mais de meio milhão de minutos tanto em cirurgias que foram previstas com tempo superior ao que realmente foi necessário (40%) como cirurgias previstas com tempo inferior ao real (60%), equivalendo a 9000 horas de sala de operação que não foram aproveitadas como tal (Gomes, 2014, Gomes et al., 2012).

2.2 Análise crítica da literatura revista

De uma maneira geral a análise do estado da arte sobre a temática de previsão da duração de intervenções cirúrgicas permitiu concluir que há variáveis comuns em estudos de diferentes autores como o cirurgião/equipa cirúrgica, o tipo de anestesia e as caraterísticas dos utentes (idade, género, entre outros). Relativamente às técnicas mais utilizadas prendem-se com métodos de classificação e regressão linear. Um resumo sobre os artigos estudados encontra-se na Tabela 1.

(30)

Tabela 1. Resumo de estudos similares.

Autores Ano País Tamanho da

amostra

Metodologia Principais conclusões

Combes, C. et al 2008 França e Bélgica 14 646 (França) e 20 525 (Bélgica) Neural Networks; Decision Trees; Genetic Algorithms

Os pacientes devem ser categorizados. Apenas 42% das cirurgias estão relacionadas com a estimativa média dos procedimentos cirúrgicos.

Hosseini, N. et al

2015 Arizona 63 254 Stepwise regression &

Least Square Regression

Necessário adicionar ao modelos mais fatores clínicos, agrupar intervenções. Não revela as variáveis que mais influenciam.

Stepaniak, P.

2009 Holanda 85 312 Normal e 2-3 parameter

lognormal models

Variáveis relacionadas com o cirurgião afetam a duração do procedimento cirúrgico Schult, R,

et al

2015 Alemanha 33 862 TUBE, EWIB,

K-Means

O método K-Means é aquele que tem melhor performance para os dados estudados Gomes, C.

et al

2014 Portugal 70 531 CRISP-DM; REP tree,;

M5- Rules & M5P; Decision Stump; C4.5 & C5.0; RF; SVM; kNN; MARS

A qualidade dos dados é um fator crítico na previsão aproximada do procedimento cirúrgico. Foram desperdiçados mais de meio milhão de minutos em tempo cirúrgico no período analisado.

Stepaniak, P. et al

2010 Holanda 100 000 ANOVA Os fatores que mais afetam são a equipa

cirúrgica, a sua experiência, e a hora do dia em que a cirurgia é realizada

Strum 2000 Canadá 46 322 ANOVA O cirurgião, o tipo de anestesia, a idade, o

género e a classe de risco ASA são os fatores que mais afetam a duração da intervenção. Shahabikar gar 2014 (Australia no) 60 000 Linear Regression, MARS, RF

A técnica com melhor performance foi RF.

Verifica-se que é necessário ter especial atenção ao número de intervenções e não ao diagnóstico uma vez que um mesmo diagnóstico pode ter várias intervenções diferentes. E, estas devem ser devidamente agrupadas já que embora possam ser de especialidades completamente diferentes podem ter a mesma duração e evita-se a redundância da informação.

(31)

CAPÍTULO 3 – METODOLOGIA APLICADA

3.1 Formulação e metodologia aplicada

A previsão da duração da cirurgia é uma tarefa realizada pouco tempo antes da chegada do utente ao hospital na grande maioria das unidades de saúde conhecidas. No caso do Hospital que estamos a analisar a duração da cirurgia é definida pelo responsável da especialidade mediante a lista de cirurgias agendadas semanalmente. Neste contexto, o que estamos a analisar é um problema modelado por técnicas que permitam prever a duração de uma determinada cirurgia. Assim, pode ser dividido em três fases principais: preparação de dados, modelação dos dados e avaliação dos modelos analisados.

A metodologia mais aceite pelos profissionais de data mining é a metodologia CRISP-DM, Figura 4.

(32)

Figura 4. Ilustração da metodologia CRISP-DM.

Esta metodologia foi selecionada em detrimento de outras por ser referida por alguns autores como a mais completa.

Da observação da Figura 4 depreende-se que esta metodologia envolve 6 fases distintas das quais aplicaremos 5 e, a última, caberá ao hospital decidir se deve ou não implementar os resultados do presente estudo.

3.1.1 Compreensão do negócio

No Hospital da Prelada são tratados tanto doentes privados, como beneficiários de subsistemas com os quais o Hospital tem acordo como também utentes do SNS referenciados por Médico de Família / Hospital Público. No caso da referenciação por médico de família/hospital público a mesma deve obedecer ao contrato programa que esteja em vigor no momento da referenciação. O contrato programa é celebrado entre o Ministério da Saúde e a Santa Casa da Misericórdia do Porto e dá ao Hospital da Prelada a autorização para integrar a rede nacional de prestação de cuidados de saúde sujeitas a uma definição de quantidade das atividades a realizar pelo hospital segundo

Dados

Compreensão do negócio Compreensão dos dados Preparação dos dados Modelação Avaliação Implementação

(33)

devem ser criteriosamente seguidas. Os objetivos de produção a assegurar pelo Hospital referem-se à monitorização do volume das seguintes linhas de produção:

• Episódios de internamento – GDH médicos; • Episódios de internamento – GDH cirúrgicos; • Dias de internamento de doentes crónicos em MFR; • Episódios de cirurgia de ambulatório;

• Episódios de consulta externa.

Assim, um dos pontos fundamentais para cumprimento do contrato programa é garantir eficácia e eficiência no bloco operatório com vista à otimização da utilização do mesmo.

Um episódio cirúrgico é sempre antecedido de uma consulta pelo médico especialista na área em que o utente vai ser operado para o qual é necessário a preparação de uma proposta que inclui o preenchimento dos seguintes dados: número do doente, serviço, diagnóstico, procedimento, tipo de cirurgia, prioridade, data de registo, data de proposta, lateralidade, médico requisitante e data de consentimento do doente. O episódio cirúrgico gera um número de internamento do utente que vai dar entrada no hospital, embora o episódio cirúrgico possa ser de ambulatório ou de internamento. É considerado ambulatório um episódio com um tempo de permanência do utente no hospital inferior a 24h e internamento superior a 24h. A cada utente do hospital é gerado um número sequencial o qual é designado por número do utente e, igualmente, quando se gera um novo internamento é atribuído um número novo de internamento. O processo para cirurgia está representado na Figura 5.

Figura 5. Circuito de um utente inscrito para cirurgia.

A programação de doentes a agendar para cirurgia é feita pelo serviço cirúrgico, tal como ilustrado na Figura 5, em que os diretores de cada serviço juntamente com o responsável do serviço de internamento fazem o agendamento de modo manual

Consulta externa • Avaliação e proposta cirúrgica Serviço cirúrgico • Agendamento Bloco operatório • Cirurgia Internamento • Alta

(34)

identificando o número do doente e o dia em que será feita a intervenção cirúrgica. A seleção dos doentes tem em consideração a antiguidade do doente na lista de espera e a prioridade clínica da patologia de cada doente. A análise não segue nenhum método específico.

Posteriormente, o doente é notificado para uma consulta de medicina interna que tem como objetivo a preparação para a cirurgia na qual, caso necessário, são feitos exames e o utente é preparado para a cirurgia e informado da data e hora da mesma.

Diariamente, é feita a exportação das listas dos utentes que serão submetidos a cirurgia no dia seguinte nas 6 salas que constituem o bloco operatório do hospital. Durante a tarde, a enfermeira chefe ou a enfermeira responsável prepara o plano de trabalho para o dia seguinte, isto é, regista informaticamente o material necessário bem como, os recursos que serão necessários alocar a cada sala.

A definição do tempo que será alocado a cada cirurgia é definida pelos diretores de cada um dos serviços (ortopedia, urologia, cirurgia plástica e reconstrutiva, cirurgia geral e oftalmologia) e para cada um dos serviços o procedimento praticado é diferente. À exceção de ortopedia que faz o planeamento dos tempos com aproximadamente 3 dias de antecedência os restantes serviços fazem-no na véspera ou na manhã do dia em que a pessoa será operada.

No dia da cirurgia a passagem do utente pelo bloco operatório inclui a sala de anestesia, a sala onde decorre a cirurgia e a sala de recobro onde o utente é vigiado e a equipa cirúrgica garante que tudo decorreu dentro do previsto, o processo encontra-se ilustrado na Figura 6.

Figura 6. Circuito do utente no bloco operatório num episódio cirúrgico.

Bloco operatório

(35)

A equipa de enfermagem regista toda a informação da cirurgia, nomeadamente o registo de entrada no bloco, identificação do utente, serviço no qual está internado, data da cirurgia, tipo de anestesia, identificação do bloco e da sala, ato cirúrgico, tipo de cirurgia, prioridade cirúrgica, intervenção, diagnóstico, constituição da equipa cirúrgica e tempos cirúrgicos (início/fim: anestesia, cirurgia e recobro). A passagem do utente pelo bloco implica o registo de inicio e fim quer da entrada em bloco, quer o inicio da anestesia, o inicio da cirurgia, o fim da cirurgia, o inicio do recobro, o fim da anestesia e, o fim do recobro.

Tendo em conta a informação que é registada foram selecionados atributos para a realização do estudo de previsão da duração cirúrgica tendo em conta a bibliografia já consultada e referida no Capítulo 2 conforme é possível disponível, no Anexo A.

Atualmente, não existe no Hospital nenhum recurso tecnológico nos sistemas de informação que garanta a otimização para estes ou outros procedimentos de saúde. Todavia, existe uma base de dados criada desde 1998 que permite o acesso a um enorme volume de dados que podem ser utilizados. Serão testados vários modelos que permitam obter uma solução que passe por prever tempos de intervenção cirúrgica na sala operatória e, desta forma, evitar tempos mal programados na sala cirúrgica.

Com este trabalho pretende-se atingir os seguintes objetivos:

i. entender a relação entre as variáveis que influenciam o teatro cirúrgico; ii. apurar o modelo que seja capaz de fazer previsões com margens de erro

inferiores a 20%;

iii. analisar a viabilidade de aplicar o modelo no hospital mantendo a realidade atual.

3.1.2 Compreensão dos dados

O presente estudo pretende analisar todas as cirurgias que aconteceram no hospital entre 2010 e 2016 para criar um modelo capaz de prever, com margem de erro muito reduzida, o tempo de uma intervenção cirúrgica tendo em conta as caraterísticas do utente e as variáveis que interferem diretamente no episódio em causa tendo em conta a

(36)

bibliografia já consultada e referida no Capítulo 2, constante deste documento. Esta previsão torna-se não só importante para o Hospital permitindo que seja mais eficiente, mas também para os clínicos que necessitam de mais tempo para se dedicar ao utente e não a processos administrativos como o caso de elaboração de escalas.

Figura 7. Distribuição do número de intervenções por especialidade de 2010 a 2016, obtido via MS Excel.

Verifica-se, através da Figura 7, que as especialidade de cirurgia plástica e ortopedia têm um peso maior no hospital. Oftalmologia apresenta um comportamento interessante, uma vez que ao longo dos anos tem vindo a aumentar o número de cirurgias. Este comportamento de oftalmologia pode estar relacionado com o facto da esperança média de vida estar a aumentar e, ser necessário intervenção aos olhos devido a doenças de idade como é o caso das cataratas. Estas situações serão analisadas nos capítulos seguintes.

A base de dados selecionada inclui 65 536 intervenções em 34 377 utentes distintos. Este número deve-se ao facto de algumas intervenções incluírem lateralidade como, por exemplo, mão direita e mão esquerda. Além disso, em 6 anos existem doentes que realizam nova intervenção cirúrgica podendo ou não ser a mesma patologia.

Das variáveis selecionadas verifica-se que a sua maioria são categóricas havendo apenas duas numéricas: idade e duração da cirurgia (variável a prever).

1181 4490 882 5267 665 1232 3809 1315 4851 532 1461 3850 1544 4730 435 1278 3837 1682 4264 333 1069 3696 1967 3940 367 1081 3457 2206 4245 506 1064 3437 2444 4122 477 57 51 85 58 50

Cirurgia Geral Cirurgia Plas5ca O<almologia Ortopedia Urologia 2010 2011 2012 2013 2014 2015 2016

(37)

De modo a melhor compreender os dados provenientes da base de dados será feita uma análise estatística das variáveis em estudo.

Analisando a variável especialidade que na base de dados se encontra codificada pelo código interno e, por isso, representa-se por “Cod_Espec”, Figura 8.

Figura 8. Diagrama de barras relativo à distribuição das cirurgias por código de especialidade, obtido via Knime.

Verifica-se através da Figura 8 que existem 6 especialidades diferentes para as quais se deve retirar a especialidade 65 por se dever a um erro de registo. A descrição de cada código é a seguinte: • 50 – Urologia; • 51 – Cirurgia plástica; • 57 – Cirurgia geral; • 58 – Ortopedia; • 85 – Oftalmologia.

Tal como descrito, anteriormente, na Figura 7, ortopedia e cirurgia plástica são as especialidades com mais episódios, seguindo-se oftalmologia, cirurgia geral e, por fim, urologia.

A variável “Tipo_Cirurgia” representa a classificação da cirurgia realizada em 25 tipos, Figura 9.

(38)

Figura 9. Diagrama de barras relativo ao tipo de cirurgia, via Knime.

Dos 25 tipos de cirurgia representados no diagrama de barras verificamos que apenas dois são os mais frequentes na amostra em estudo. Verificam-se 30 107 registos para “C” cirurgia e 28 541 para “CA” cirurgia de ambulatório (como explicado anteriormente são cirurgias que não exigem o internamento do utente devido ao seu menor risco e, por isso, ausência da necessidade do internamento). Existe uma semelhança entre o número de episódios cirúrgicos e cirúrgicos de ambulatório na amostra em estudo.

O cirurgião principal é representado pelo seu número mecanográfico na base de dados para este estudo e tem a denominação “N_mec”. Verificamos que existem 53 cirurgiões principais com atividade cirúrgica muito dispare. Tal como é possível observar Figura 10.

(39)

Como foi observado anteriormente há especialidades que têm mais expressão que outras o que justifica que haja cirurgiões que tenham muito mais cirurgias que outros. É necessário agrupar os dados por especialidade para perceber a distribuição da atividade dos cirurgiões para a mesma especialidade.

Relativamente ao género é possível observar uma distribuição desigual entre homens e mulheres, Figura 11.

Figura 11. Diagrama de barras relativo ao género dos utentes submetidos a cirurgia, obtido via Knime.

Os dados revelam que 72% das cirurgias foram realizadas a mulheres.

O tipo de anestesia que é aplicado ao utente depende das suas condições físicas e psicológicas. Segundo a classificação ASA pode variar entre:

1. Utente saudável;

2. Utente com doença sistémica leve ou moderada, sem limitação funcional; 3. Utente com doença sistémica severa, com limitação funcional;

4. Utente com doença sistémica severa representa risco de vida constante; 5. Utente moribundo com perspetiva de óbito em 24h, com ou sem cirurgia.

(40)

Figura 12. Diagrama de barras com a distribuição do tipo de anestesia, obtido via Knime.

Pela análise da Figura 12 verifica-se que à maioria dos pacientes é aplicada anestesia tipo II que diz respeito a doenças sistémicas leves ou moderadas sem limitação funcional. Seguindo-se, a anestesia tipo I, isto é, pacientes saudáveis; a anestesia tipo III – pacientes com doença sistémica severa e limitação funcional; doentes aos quais não foi aplicada qualquer anestesia e, com uma expressão muito pouco significativa, tipo IV. Os valores atribuídos a 9, 11, 16 e 17 foram excluídos da análise por se tratarem de erros de registo.

Caraterística da cirurgia poderá ser o seu carácter de urgência ou se se trata de uma cirurgia urgente, Figura 13.

(41)

Uma vez que, o hospital não tem serviço de urgência é de esperar que o valor de cirurgias urgentes seja muito residual tal como é possível observar na Figura 13. Os casos considerados urgentes deverão ser relativos à Unidade de Queimados que o Hospital tem que pela natureza do incidente leva a uma entrada direta para a cirurgia, levando ao registo de episódio cirúrgico urgente.

Pela análise da Figura 14, pode inferir-se que as idades variam entre 10 e 117 anos, a amplitude é 107 verificando-se 2 outliers: 10 e 117 anos. A mediana do atributo idade é 61 anos enquanto que a média é de 59,7 anos. E a amplitude interquartis é de 24. Embora os dados sejam aproximadamente simétricos, apresentam uma assimetria negativa.

Figura 14. Boxplot referente ao atributo numérico idade, retirado do software Knime.

Outra forma de visualização é através de gráficos de barras onde poderemos analisar a frequência por intervalo de idades, Figura 15.

(42)

Figura 15. Diagrama de barras da idade em intervalos de 12 anos, obtido via Knime.

É possível verificar que a distribuição das idades da amostra que estamos a analisar se concentra entre os 48 e os 72 anos. Uma vez que, o hospital não recebe pessoas com idade inferior a 18 anos não devem ser consideradas essas idades pois não terão interesse para a análise em estudo no que diz respeito à sua aplicabilidade.

O coeficiente de variação, obtido pela divisão entre o desvio padrão e a média, mede a variabilidade dos dados em relação à média e, para a variável é de 0,27, ou seja, os desvios relativamente à média atingem 27% do valor.

O coeficiente de assimetria é de -0,19 o que significa que a distribuição é assimétrica negativa, ou seja, predominam os valores elevados.

A curtose é uma medida de forma que carateriza o achatamento da curva de distribuição de probabilidades. Para a variável idade o valor é -0,67 o que implica que a distribuição seja mais achatada que a distribuição normal. A sua distribuição é platicúrtica.

Uma das variáveis com mais importância para o estudo, a variável alvo, é a duração cirúrgica. A duração apresenta-se na unidade minutos e a sua distribuição pode ser analisada na Figura 16.

(43)

Figura 16. Boxplot referente ao atributo numérico duração da cirurgia, obtido via Knime.

Através do boxplot representado na Figura 16 verifica-se que a amplitude interquartil é 48 minutos, sendo a mediana 24. Verifica-se assim que a duração cirúrgica tem uma assimetria positiva. O mínimo é 1 minuto e o valor adjacente superior é 99 minutos. Os valores posteriores a 99 minutos representam outliers.

O coeficiente de variação que mede a dispersão relativamente à média, para a variável “Duração da cirurgia”, é 85%, ou seja, o desvio-padrão é 85% do valor da média.

O coeficiente de assimetria é de 1,93 o que significa que a distribuição é assimétrica positiva, ou seja predominam os valores baixos.

Para a variável idade o valor da curtose é 6,08 o que implica que a distribuição seja mais afunilada que a distribuição normal. A distribuição é leptocúrtica.

Como a duração da cirurgia é a variável alvo torna-se importante analisar o comportamento da mesma quando condicionada a outras variáveis.

Como se verificou, anteriormente, na Figura 9 os tipos de cirurgia mais relevantes dizem respeito a “C” (cirurgia) e “CA” (cirurgia de ambulatório), por isso, a duração cirúrgica será condicionada a esses dois tipos de cirurgia representada na Figura 17.

(44)

Figura 17. Boxplot relativo à duração cirúrgica condicionada aos tipos de cirurgia: cirurgia e cirurgia de ambulatório, obtido via Knime.

Como se pode verificar existem diferenças na duração da cirurgia quando se trata de uma cirurgia em âmbito de ambulatório ou de internamento. Os valores medianos da cirurgia de ambulatório são de 14 minutos, ao passo que, para a cirurgia no âmbito de internamento é de 42 minutos. Para a cirurgia de ambulatório a amplitude interquartil é de 10 minutos e o valor mínimo observado é de 1 minuto, ao passo que, o valor máximo é de 35 minutos. A cirurgia em âmbito de internamento tem amplitude interquartil de 40 minutos sendo, o valor mínimo observado 1 e o valor máximo de 125 minutos. Ambas apresentam assimetria positiva.

Foram selecionados os 25 intervenientes com mais atividade para perceber a distribuição da duração cirúrgica:

(45)
(46)

Verifica-se de um modo transversal aos intervenientes selecionados que a duração da cirurgia é diferente mediante o cirurgião em análise. Contudo, esta análise deverá ter em conta não só o cirurgião como, também, a especialidade e a intervenção em causa. Uma vez que, cada intervenção é única e obedece a inúmeras especificidades.

Na Figura 20, é possível analisar a duração cirúrgica tendo em conta a especialidade.

Figura 20. Boxplot da duração cirúrgica condicionado ao código de especialidade respetivo (50, 51, 57, 58, 65 e 85), obtido via Knime.

Para cada especialidade é possível verificar que os valores medianos da duração cirúrgica variam entre 13 minutos (valor mais baixo relativo à especialidade de oftalmologia – 85) e 34 minutos (valor de mediana mais alto para a especialidade de cirurgia plástica – 51). Todas as especialidades apresentam assimetria positiva, sendo que ortopedia (58) e cirurgia geral (57) apresentam valores próximos da simetria. A que apresenta valor máximo é cirurgia plástica (51), com 126 minutos, seguindo-se ortopedia, com 112 minutos, urologia (50) com 91 minutos e, oftalmologia com 27 minutos. Para a especialidade de oftalmologia (85) não existem cirurgias em âmbito de internamento o que justifica que as cirurgias na sua globalidade sejam intervenções rápidas sem risco de grandes complicações.

Uma variável que na literatura revista, para preparação do trabalho em estudo, não foi abordada prende-se com o mês em que a cirurgia se realiza. A análise da duração da cirurgia mediante o mês em que é realizada está ilustrada na Figura 21.

(47)

Figura 21. Boxplot da duração cirúrgica condicionada ao mês em que foi realizada, obtido via Knime.

Não se verifica uma variação relevante nos valores da mediana ao longo dos meses nem na amplitude interquartil, como é possível observar na Figura 21. De um modo transversal todos os meses mostram assimetria positiva. Verifica-se uma ligeira diferença para o mês de dezembro tanto no valor mediana como na amplitude interquartil.

A mesma análise foi realizada para o dia da semana em que a cirurgia é realizada, Figura 22.

Figura 22. Boxplot da duração cirúrgica condicionada ao dia da semana (1- domingo, 2- segunda-feira, 3- terça-feira, 4 – quarta-feira, 5 – quinta-feira, 6 – sexta-feira e 7 – sábado), obtido via Knime.

Relativamente ao dia da semana no hospital não são realizadas cirurgias nem ao domingo (1) nem ao sábado (7) pelo que os valores serão ignorados por não se

(48)

enquadrarem nos objetivos do negócio. Verifica-se que de segunda a quinta-feira não há grande variação da duração tanto nos valores da mediana como na amplitude interquartis, ao passo que, se analisarmos a sexta-feira verificamos que os valores são inferiores aos restantes dias tanto na mediana, na amplitude interquartil e no valor máximo observado. As intervenções que são agendadas para a sexta-feira envolvem menos complexidade devido à possibilidade de haver complicações e elas poderem ser devidamente acompanhadas. Em todos os dias da semana, os valores apresentam assimetria positiva.

Tal como abordado anteriormente na exploração das variáveis, no que diz respeito à frequência, o doente pode ou não ser submetido a anestesia e no caso de ter esta pode variar em quatro tipos principais. Na Figura 23, é possível analisar a distribuição da duração cirúrgica pelo tipo de anestesia do respetivo episódio cirúrgico. As intervenções para as quais é aplicada anestesia do tipo I têm duração média superior e valores máximos observados igualmente superiores às restantes. Verifica-se também que para anestesias do tipo III e IV que a intervenção tem uma duração mediana próxima dos 13 minutos. Como referido anteriormente anestesias de maior grau são aplicadas a doentes com doenças mais avançadas o que pode justificar a observação de durações inferiores às intervenções realizadas a esses utentes.

(49)

As caraterísticas do utente são outro fator com foco neste estudo, uma vez que se pretende analisar se as suas caraterísticas têm influência na duração da cirurgia. Assim, na Figura 24, pode analisar-se a duração cirúrgica condicionada ao género.

Figura 24. Boxplot ilustrativo da duração cirúrgica por género feminino (F) e masculino (M), obtido via Knime.

Verifica-se que o género não condiciona a duração da cirurgia já que os valores para ambos são relativamente próximos, notando-se apenas uma menor variabilidade no intervalo mínimo, Q3.

Além do género analisou-se a idade (faixa-etária) do utente no momento da realização da intervenção cirúrgica, Figura 25.

(50)

Figura 25. Boxplot da duração cirúrgica condicionado à variável idade convertida em faixa etária, obtido via Knime.

De um modo geral verifica-se que para idades superiores a 50 anos tanto a amplitude interquartil como a mediana e os valores máximos observados tendem a diminuir, podendo estar relacionado com o tipo de intervenção a que as pessoas são sujeitas bem como a complexidade das mesmas.

Uma vez que, o hospital é um hospital de referenciação que obedece a um perímetro específico definido pela ACSS, analisando os distritos verificou-se que a grande maioria das localidades de origem dos utentes dividem-se em sete principais: Porto, Maia, Vila Nova de Gaia, Rio Tinto, Ermesinde, Gondomar e Valbom. A distribuição da duração cirúrgica pela localidade pode analisar-se na Figura 26.

(51)

Figura 26. Boxplot da duração cirúrgica condicionado à variável “localidade” representada pelas 7 localidades principais, obtido via Knime.

Pela observação da Figura 26 conclui-se, excluindo os outliers, que a localidade “Porto” apresenta durações cirúrgicas inferiores às restantes localidades bem como, intervenções com durações máximas inferiores.

Verificam-se 733 intervenções diferentes registadas na análise que estamos a realizar o que dificulta a análise já que há intervenções com muito pouca frequência. Deste modo, selecionaram-se 47 intervenções através da exclusão das intervenções com frequência inferior a 100 observações. Verificou-se, adicionalmente, que as intervenções superiores a 1000 observações distribuem-se por apenas duas das 5 especialidades, isto é, ortopedia e oftalmologia. As duas intervenções mais frequentes são “1341” e “1371” que dizem respeito à especialidade de oftalmologia e estão relacionadas com a doença de cataratas, em que a realização de uma implica a realização da outra.

É referido em vários trabalhos bibliográficos que o interveniente tem influência na duração da cirurgia. Contudo, e embora existam intervenções que são transversais às várias especialidades foi selecionada a especialidade de ortopedia e a intervenção “8151” de modo a verificar se para os dados em análise o cirurgião principal tem ou não influência na duração da cirurgia.

(52)

Figura 27. Boxplot ilustrativo da duração da cirurgia para a intervenção 1341 da especialidade de oftalmologia por interveniente que a realiza, obtido via Knime.

Efetivamente, e através da Figura 27, é possível verificar que para a mesma intervenção a duração da cirurgia pode variar se tivermos em linha de conta o cirurgião principal que a realiza.

Para perceber se as diferenças na distribuição da duração da cirurgia são significativas, ou seja, se a duração mediana da cirurgia difere significativamente para as categorias cirurgião principal, idade, mês, dia da semana e género foi realizado o teste Kruskal-Wallis. Os resultados do teste estão visíveis na Figura 28.

Figura 28. Teste Kruskal-Wallis para as categorias cirurgião principal, idade, mês, dia da semana e género, obtido via SPSS.

(53)

Figura 28. Teste Kruskal-Wallis para as categorias cirurgião principal, idade, mês, dia da semana e género, obtido via SPSS (cont.).

A hipótese nula afirma que as medianas da duração cirúrgica são iguais para as categorias cirurgião principal, idade, mês, dia da semana e género. Como os valores-p são inferiores ao nível de significância de 0,05 rejeita-se a hipótese nula e conclui-se que as medianas não são todas iguais.

(54)

3.1.3 Preparação dos dados

Após a compreensão do negócio e dos respetivos dados segue-se a preparação dos mesmos. Esta fase, é considerada uma das mais delicadas de todo o processo uma vez que, interfere diretamente no desempenho da previsão que se pretende efetuar.

Após a extração dos dados da base de dados procedeu-se à eliminação de variáveis que não tinham interesse para a análise (código do doente, código de intervenção) de modo a selecionar os atributos com maior relevância. Posteriormente, foram eliminadas as linhas com valores em falta uma vez que se tratavam de uma percentagem de casos muito baixa (inferior a 1%) não justificando, por isso, recorrer a técnicas de substituição ou outras semelhantes.

Via Excel, foi feito o cálculo da duração cirúrgica (1).

𝐷𝑢𝑟𝑎çã𝑜 𝑑𝑎 𝑐𝑖𝑟𝑢𝑟𝑔𝑖𝑎 = ℎ𝑜𝑟𝑎 𝑑𝑒 𝑓𝑖𝑚 𝑑𝑎 𝑐𝑖𝑟𝑢𝑟𝑔𝑖𝑎 − ℎ𝑜𝑟𝑎 𝑑𝑒 𝑖𝑛í𝑐𝑖𝑜 𝑑𝑎 𝑐𝑖𝑟𝑢𝑟𝑔𝑖𝑎 (1)

A duração no ficheiro de extração da base de dados apresentava o formato “hh-mm-ss” e foi convertida, via excel, em minutos.

A idade foi, igualmente, calculada através do campo “data de nascimento” do utente. A data de realização foi convertida para mês devido aos inúmeros valores que o formato dd-mm-aaaa apresenta, obtendo 12 níveis possíveis, através do node “string manipulation” do Knime. E, ainda, foi considerado o dia da semana em que se realiza a cirurgia.

Nesta fase foram excluídos 20 atributos como podemos verificar na Tabela 2 na qual estão igualmente incluídos os motivos pelos quais não foram considerados. Embora, o motivo principal se deva à redundância dos dados de modo a evitar um eventual mau desempenho dos algoritmos na previsão que se pretende levar a cabo.

(55)

Tabela 2. Atributos eliminados com respetivo motivo de exclusão.

Grupo Atributo Motivo de exclusão

Duração Média Anestesia Atributo para análise da duração já existente

Bloco Atributo para análise da duração já existente

Cirurgia Atributo para análise da duração já existente

Recobro Atributo para análise da duração já existente

Sala Atributo para análise da duração já existente

Duração Anestesia A análise que se pretende fazer é relativa à duração da cirurgia

Bloco A análise que se pretende fazer é relativa ao tempo da cirurgia

Recobro A análise que se pretende fazer é relativa ao tempo da cirurgia

Sala A análise que se pretende fazer é relativa ao tempo da cirurgia

Tempo Início cirurgia Utilizado para o cálculo da duração da cirurgia

Fim de cirurgia Utilizado para o cálculo da duração da cirurgia

Início Anestesia Atributo para análise da duração já existente

Fim de Anestesia Atributo para análise da duração já existente

Entrada Bloco Atributo para análise da duração já existente

Saída Bloco Atributo para análise da duração já existente

Entrada Sala Atributo para análise da duração já existente

Saída Sala Atributo para análise da duração já existente

Diagnóstico Código Diagnóstico Atributo relacionado com “Intervenção”

Intervenção Codificação Atributo relacionado com “código de intervenção”

Tipo Assepsia Código Tipo Assepsia

Sem relevância para o estudo

Tendo, por base, a análise efetuada no capítulo “Compreensão de dados” para as variáveis selecionadas a incluir no modelo serão excluídos dados que tenham sido detetados e os quais possam influenciar negativamente o desempenho do modelo a selecionar.

Tendo por base a análise efetuada as variáveis selecionadas para inclusão no modelo são:

• Código de intervenção cirúrgica; • Cirurgião principal;

• Mês de realização da cirurgia;

(56)

• Faixa etária do utente (10 em 10 anos).

Na fase de modelação apenas se incluem códigos de intervenção com valores superiores a 100 episódios.

3.1.4 Modelação

Uma vez que existem inúmeras técnicas disponíveis para aplicar, a escolha do método depende do objetivo que se tem relativamente ao que se pretende obter a partir da fonte de dados selecionada. O presente estudo tem por base a previsão da duração da cirurgia tendo em conta outras variáveis dependentes. Em machine learning os classificadores “Naive Bayes” pertencem à família de classificadores probabilísticos simples baseados na aplicação do teorema de Bayes tendo como pressuposto uma forte independência entre as variáveis. Daí o termo “naive” que vem da hipótese de que os valores dos atributos de uma amostra são independentes (Gama et al., 2012). As suposições deste modelo são consideradas inocentes por assentar em dois importantes pressupostos (Buntine, 1994):

i. os atributos preditivos são condicionalmente independentes dada a classe; ii. nenhum atributo oculto ou subentendido influencia o processo de previsão. O classificador Naive Bayes permite uma abordagem simples para representação, uso e aprendizagem de conhecimento probabilístico. É utilizado em contextos de aprendizagem supervisionada.

Para o mesmo procedimento cirúrgico há muita variabilidade nas durações apresentadas. Por isso, torna-se importante a análise em termos de probabilidades (Macario, 2009). Pode analisar-se esta relação através de um processo para o qual se deve definir as variáveis de entrada e a variável de saída. Embora a regressão possa ter vários objetivos como, selecionar variáveis, estimar parâmetros, estudar inferência, o objetivo deste estudo é a previsão da duração cirúrgica tendo em conta os vários fatores que a influenciam. O melhor modelo será aquele que apresentar melhores valores de accuracy. Para além dessa medida será avaliada a taxa de erro e o índice de Kohens

(57)

Para a definição de uma agenda são selecionados blocos com tempos definidos, assim não há especial interesse em prever a duração cirúrgica como variável continua. Como a base de dados contém variáveis continuas e nominais, as variáveis contínuas foram transformadas em variáveis nominais através de patamares. No caso da variável alvo (duração da cirurgia) foi utilizado o node numeric binner para criar patamares de 15 minutos, tendo sido criados 10 patamares, em que cirurgias com mais de 135 minutos são incluídas no último patamar.

A idade dividida em faixas etárias de 10 anos tendo ignorado faixas inferiores a 18 anos uma vez que o hospital não trata menores de idade.

Os dados foram divididos da mesma fonte de dados em treino e teste com percentagens de (20 e 80%, respetivamente) de modo a não introduzir/induzir erros no modelo. Os dados disponibilizados para treino permitem ao modelo calcular as probabilidades necessárias para a obtenção do classificador “Naive Bayes”.

Foram selecionadas apenas as variáveis validadas nas fases anteriores: cirurgião principal, intervenção, especialidade, idade e duração.

Cada especialidade cirúrgica é organizada individualmente pelos seus responsáveis e não há médicos cirurgiões em comum. Assim, optou-se por criar o modelo tendo em conta cada uma das especialidades de modo isolado através de um filtro pelo código de especialidade.

Apesar do modelo ter boa performance foram selecionadas as intervenções com valores de ocorrência superiores a 500 para otimizar a sua performance e melhor conhecer as relações entre os atributos, Tabela 3.

Referências

Documentos relacionados

Para preparar a pimenta branca, as espigas são colhidas quando os frutos apresentam a coloração amarelada ou vermelha. As espigas são colocadas em sacos de plástico trançado sem

In this work, improved curves are the head versus flow curves predicted based on the correlations presented in Table 2 and improved by a shut-off head prediction

Segundo o mesmo autor, a animação sociocultural, na faixa etária dos adultos, apresenta linhas de intervenção que não se esgotam no tempo livre, devendo-se estender,

nesta nossa modesta obra O sonho e os sonhos analisa- mos o sono e sua importância para o corpo e sobretudo para a alma que, nas horas de repouso da matéria, liberta-se parcialmente

Os interessados em adquirir quaisquer dos animais inscritos nos páreos de claiming deverão comparecer à sala da Diretoria Geral de Turfe, localizada no 4º andar da Arquibancada

3.3 o Município tem caminhão da coleta seletiva, sendo orientado a providenciar a contratação direta da associação para o recolhimento dos resíduos recicláveis,

2 - OBJETIVOS O objetivo geral deste trabalho é avaliar o tratamento biológico anaeróbio de substrato sintético contendo feno!, sob condições mesofilicas, em um Reator