Este capítulo está dividido em quatro partes, a primeira aborda os dados, a segunda parte descreve os dados na área da saúde, as suas ontologias e semânticas e a terceira os trabalhos realizados.
2.1 DADOS
Num processo de recolha cada vez maior de dados existe um grande desafio no atual contexto das tecnologias de informação, garantir o máximo aproveitamento do seu valor.
Com os avanços tecnológicos provenientes de diversas áreas da ciência e com novos conceitos, a produção de dados é cada vez mais rápida e em grandes quantidades (Alves, 2016).
Para isso é preciso mudar processo e até modelos de negócios, Segundo a Mckinsey (“Jornal Económico - Suplemento 3 Mar.2017,” 2017), 90% de todos os dados do planeta foram gerados nos últimos 24 meses, partilha Tiago Catarino, head of sales da Olisipo Portugal. E a percentagem analisada é ínfima. Segundo a MIT Technology Review (“Jornal Económico - Suplemento 3 Mar.2017,” 2017) apenas 0,5% dos dados existentes eram analisados em 2013. Com taxas de crescimento superiores a 50% anuais, vamos ter 43 vezes mais dados em 2020, estima a IBM (“Jornal Económico - Suplemento 3 Mar.2017,” 2017). “E estamos apenas a falar de volume e não de diversidade, complexidade, formatos ou origens”, assinala Tiago Catarino. Para gerir e tirar valor desta imensidão de dados é necessário encontrar soluções que passam não apenas pela tecnologia, mas por mudanças de mentalidade, de processos e até mesmo de modelos de negócio. Segundo a consultora Deloitte (“Jornal Económico - Suplemento 3 Mar.2017,” 2017), as grandes tendências para o corrente ano serão o self-service analytics, a Insight Driven Organization e a analítica cognitiva. Esta “consiste em aumentar e amplificar a inteligência humana através de ferramentas que automatizam processos de aprendizagem, detetam padrões e geram insights que, por processos tradicionais de BI, não estaríamos em condições de obter”, clarifica Hugo Cláudio,
manager da Deloitte Portugal. Diariamente surgem novos desenvolvimentos e casos de estudo de
big data & analytics, assevera Nuno Pacheco, diretor da área de BI da Noesis. No entanto, alerta
do valor que estas soluções oferecem, principalmente no apoio à decisão”. É ainda importante olhar para a forma como se pode monetizar os dados, frisa Nuno Pacheco (“Jornal Económico - Suplemento 3 Mar.2017,” 2017).
Com o crescente desenvolvimento tecnológico, passando de uma era analógica para uma era digital, através do crescimento dos dispositivos móveis e da internet, teve como consequência a digitalização e o acesso a um numero de utilizadores desses dispositivos, permitindo uma comunicação digital (Hay, George, Moyes, & Brownstein, 2013). Esse facto leva a que o tempo de resposta e espera na obtenção de informação sobre esses dados seja cada vez mais curto e em real time.
Ao imaginarmos um cenário na área da saúde, como exemplo as unidades de prestação de cuidados de saúde, onde com monitorização remota e em tempo real dos dados de saúde dos pacientes, antecipando possíveis patologias ou eventos críticos, permitindo atuar de forma preventiva e atempada. Este cenário será possível através de Internet of Things (IoT) (Monteiro, 2016).
As soluções já existentes de dispositivos que estão ligados entre si e que trocam dados já é uma realidade na área da saúde, o que permite olhar para os cuidados de saúde não de uma forma fechada, arquivos de dados guardados nas gavetas de um hospital, mas sim arquivos de dados digitais que poderão ser utilizados para gerar informação e esta gerar conhecimento.
A cada vez mais utilização da chamada medicina de proximidade, onde o paciente dispõe de dispositivos de saúde capazes de monitorizar ao segundo o seu estado de saúde, quer através de equipamentos e sistemas no interior dos edifícios de saúde, quer em soluções MHealth, Wearables, implantes e mesmo o próprio dispositivo móvel pessoal.
São cada vez mais as ferramentas de monotorização que poderemos no limite falar de comunicações machine-to-machine, comunicações sem intervenção humana.
Como já verificamos, existem soluções tecnológicas que permitem a recolha dos dados e do seu armazenamento de uma forma global, mas que difere de instituição, de sistema, de sintaxe e de padrão.
Contudo, surge o problema e a necessidade do tratamento e da apresentação do valor desses dados para permitir o resultado final, o seu valor.
A empresa Baint & Company fez um estudo (Bain Brief, 2013) a 400 empresa em todo o mundo, todas com receitas de mais de 1 milhão de Dólares, perguntando-lhes sobre o que os seus dados e as suas capacidades analíticas os influenciavam sobre a sua velocidade de tomada de decisão e eficácia.
Esse resultado foi surpreendente já que apenas 4% dessas empresas faziam um bom aproveitamento dos seus dados através de análises para o melhoramento dos seus serviços e produtos. O que concluíram, foi que essas empresas têm o dobro da probabilidade ter um maior
desempenho financeiro dentro de suas áreas, são três vezes eficazes em executar decisões como pretendido e cinco vezes a tomar decisões mais rápidas.
Segundo ainda esse estudo, são quatro os elementos para o desenvolvimento das capacidades analíticas avançadas, as pessoas (“People”), as ferramentas (“Tools”), os dados (“Data”) e os objetivos (“Intent”).
As Pessoas, partindo de uma boa estrutura numa empresa faz com que a mistura de várias funções seja mais eficiente na capacidade de compreender e fazer uma análise mais seletiva dos seus dados.
As Ferramentas, porque vão ajudar à exploração dos dados com uma velocidade muito maior utilizando ferramentas e plataformas em Hadoop, ou em NoSQL, ferramentas essas que surgiam no mercado como ferramentas de apoio à evolução numa melhor abordagem de análise, visualização e gestão de dados. Hoje, essas ferramentas estão disponíveis a partir de uma ampla gama de fornecedores e uma comunidade ainda maior de desenvolvedores de código aberto (open source).
Os Dados, as empresas cada vez mais precisam de um plano estratégico para a recolha, organização e exploração dos seus dados. Esse plano estratégico tem de ser baseado numa estratégia de negócio em que têm de utilizar os dados como valor. Os dados não podem ser vistos apenas como algo que se armazena numa base de dados algures num servidor da empresa, mas sim abrangendo um conjunto mais lato, incluído todos os dados que são partilhados por exemplo nas redes sociais, nos fóruns ou em sites que são estruturados, não estruturado e semiestruturados. Por fim o último elemento, os objetivos, os valores dos dados estarão sempre dependentes dos objetivos para que foram propostos, esse valor é medido e tem de ser apresentado sob forma de uma solução final, normalmente no apoio a uma tomada de decisão.
2.1.1 CONCEITO DE DADOS
Mas o que são dados?
O dado é base para uma futura informação (Oliveira, 2005): “é qualquer elemento identificado em
sua forma bruta que, por si só, não conduz a uma compreensão de determinado fato ou situação”.
São os dados trabalhados que permitem a tomada de decisões, segundo o definir informação Oliveira no mesmo livro: “É o produto da análise dos dados existentes na empresa, devidamente registrados, classificados, organizados, relacionados e interpretados em um determinado contexto, para transmitir conhecimento e permitir a tomada de decisão de forma otimizada”.
Fig. 3 - Fontes de Dados (IoT) (Cynthia Harvey, 2016)
Mas se temos estas definições já conhecidas, estudos que comprovam que a análise de dados e a sua utilizam como meio de alcançar um maior valor para uma entidade seja ela uma empresa ou organismo público, qual o motivo das empresas não se apoiarem na estratégia da leitura de dados para fins futuros?
A evolução da análise dos dados (Fig. 4) tem vindo a sofrer modificações, começando numa fase 1.0, analítica tradicional, onde temos análises primárias em modelos fechados nas, passando depois para uma fase 2.0, onde o Big Data como necessidade de análise de grande volume de dados, de diferentes tipos, com sistemas com novas capacidades analíticas computacionais, onde aparecem
os Data Scientists e onde é possível análises em tempo real, por ultimo a fase 3. 0 onde a análise
se torna num instrumento de previsão e tem fortes impactos nas estratégias e nas decisões das instituições.
Com o novo paradigma do IoT (Fig. 3), Internet das Coisas, a produção de dados e o seu aproveitamento mudou o conceito de base de dados normal como armazenamento para um conceito de armazenamento em base de dados, estruturas dinâmicas, escaláveis e interoperativas, fazendo com que esses dados estejam permanentemente disponibilizados e prontos a serem utilizados para o fim que lhe foi atribuído.
2.1.2 CONCEITO DE BIG DATA
Definindo o conceito de Big Data encontramos no autor Doug Laney, (Laney, 2001) que explica numa perspetiva tridimensional os três fatores, velocity, volume e variety, os 3´s V.
Fig. 5 - Conceito 3 V´s (“Big data | Big Data Blogs | Learn Big Data | Big Data Technology,” n.d.)
• Volume é a quantidade produzida, não em gigabytes, mas em terabytes6 ou zetabytes7; O crescimento exponencial do volume de dados globais, na saúde o caminho segue a mesma trajetória, 130 exabytes8 em 2005 para 7.910 exabytes em 2015. Até 2020, haverá 35 zetabytes
6 Terabytes múltiplodobyte,desímboloTB,queequivalea1024gigabytes(tambémseusacomovalorde1000 gigaby-tes).
7Zetabytes unidadedemedidadeinformação,desímboloPB, equivalentea1024terabytes(estevaloré frequente-mentearredondado para1000terabytes).
(1021 bytes) de dados digitais — uma pilha de DVD que iria chegar até a metade da Terra para Marte.
• Variedade representa o tipo de dados, estruturados, semiestruturados e não estruturados; Apenas 20% dos dados do mundo está estruturada (adequado para processamento por computador) em oposto com dados não-estruturados (por exemplo, notas manuscritas, sem marcas de formatação de texto, arquivos de áudio e vídeo) que estão a crescer a 15 vezes a percentagem de data estruturados. O volume de dados na saúde tem aumentado com o crescente de registos médicos, imagens de Radiologia, registos clínicos, etc.
Com fontes de dados de grande complexidade e variedade de dados, estruturados, não estruturados e semiestruturados faz com que seja um grande desafio a sua manipulação. Historicamente, o tipo de dados por exemplo na área da saúde são dados não-estruturados: registros médicos, notas manuscritas, registos de internamentos e registros de receitas, filmes de radiografia e outras fontes de papel por outro lado temos os dados estruturados em registros médicos eletrônicos (EMRs) e registros eletrônicos de saúde (EHRs) que incluem campos de registro de entrada como dados do utente, dados dos médicos, da instituição clínica, códigos de reembolso de tratamento, e outras informações que são facilmente codificados e armazenados pelas bases de dados.
• Velocidade dados a apresentar em qualquer altura, em tempo real de processamento e em streaming9;
A maioria dos dados são até pouco tempo atrás, estáticos, arquivos, filmes de raio x, receitas em papel, etc. Mas recorrendo num sistema cada vez complementado por máquinas em algumas situações como exemplo as médicas, o tratamento de dados em tempo real (trauma, monitoramento de pressão arterial, na sala de cirurgia monitores para anestesia, monitores cardíacos, etc.) tornar-se uma questão de vida ou morte onde ainda estão os dados de média velocidade nomeadamente como exemplo as várias medições diárias de glicose diabética (ou controle mais contínuo por bombas de insulina), pressão arterial, etc.
O fluxo constante de novos dados torna imperativo a resposta a estes novos desafios, assim como o volume e a variedade de dados que são recolhidos e armazenados mudou, também a velocidade em que ele eles são gerados e armazenados bem como a velocidade necessária para os recuperar, os analisar, os comparar e tomar decisões tem de ser diferente.
Em recentes definições aparecem já os conceitos, 4V´s (Fig. 6) e 5V´s (Fig. 7), para além dos atributos mencionados, Volume, Variedade, Velocidade, surge também o Valor e a Veracidade dos dados.
Fig. 6 – Conceito 4 V´s de Big Data (Louise Spiteri, 2015)
• Veracidade equivale à qualidade, à relevância e ao significado dos dados;
Veracidade nos dados de saúde enfrenta muitos dos mesmos problemas como outros tipos de dados, especialmente na cadeia gerada no panorama da saúde, a relação paciente, médicos e instituições. Outros problemas de veracidade são exclusivos aos cuidados de saúde, como diagnósticos, tratamentos, prescrições, procedimentos que resultam de correta recolha e tratamento.
Melhorar a coordenação dos cuidados, evitando erros e reduzir os custos dependem de dados de alta qualidade, como os avanços na segurança dos medicamentos a sua eficácia, os corretos diagnósticos e o direcionamento mais preciso dos processos clínicos nos tratamentos das doenças. No entanto, alta variedade e velocidade diminuem a capacidade de purificar os dados antes de analisá-lo e tomar decisões, podendo levantar questões de dados "confiança" e de segurança (Feldman et al., 2012).
Fig. 7 – Conceito 5 V´s de Big Data (Christoph Salzig, 2016)
• Valor, produto final da extração do conhecimento dos dados;
A utilização dos dados como valor criado numa perspetiva de apoio à decisão é segundo este novo conceito de Big Data, o aspeto no topo de qualquer sistema que de armazenamento, processamento, transformação e análise de dados.
Durante muitos anos a acumulação de dados da saúde em repositórios reservados e fechados fizeram com que muito do seu valor ficasse num plano desconhecido e sem uma avaliação do seu potencial.
2.2 DADOS NA SAÚDE
No caso da Saúde, existem dois grandes obstáculos para não existir uma análise global dos dados.
• A diversidade de sistemas de informação;
• A segurança dos dados a explorar pelos sistemas.
Segundo um estudo efetuado pela IBM Global Business Services (IBM Institute for Business Value, 2012), as organizações de saúde em todo o mundo são desafiadas pelas pressões para reduzir custos, melhorar a coordenação de resultados, fornecer mais com menos e ser mais centrada ao paciente. No entanto, ao mesmo tempo, há evidências de o desafio ser cada vez mais por contornar
Através do aproveitamento dos sistemas e tecnologias de informação, pode-se ajudar essas organizações a aproveitar ao máximo, nomeadamente utilizando o conceito de Big Data que permite criar fluxos de análises definindo a sua visão de futuro, melhorar os resultados e reduzir o tempo de valorização.
Esse aproveitamento não só irá assegurar um melhor desempenho nas organizações de saúde, mas também irá beneficiar o serviço prestado aos utentes na contribuição da sua responsabilidade perante os seus cuidados de saúde.
Após o estudo concluíram que encontrar um padrão adequado para a representação de dados clínicos é um aspeto fundamental para ter um sistema de suporte à decisão, o que iremos ver mais à frente.
2.2.1 OS DESAFIOS DA ANÁLISE DOS DADOS NA SAÚDE
A exploração de dados na área da saúde, sempre enfrentou grandes desafios.
Fig. 8 – Registo de dados na saúde
O primeiro desafio é a complexidade de sistemas onde são registados e armazenados os dados, organizações, modelos e padrões (Fig. 8). Por esse facto permite desde que exista uma diversidade de interesses corporativos, fazendo uma oposição ao acesso à informação privilegiada por parte dos analistas, pondo a exploração e a análise dos dados em causa.
Um segundo desafio é a politica de cada entidade guardar para si os seus dados e não permitir uma partilha dos mesmos por outras entidades justificando-se que estão em causa a partilha e proteção de dados pessoais, fazendo com utilize o interesse na salvaguarda da informação e privacidade dos
mesmos um entrave à sua partilha e é na separação das entidades, por públicas e privadas e a não uniformização dos dados que prevalece e põe em causa a utilização dos mesmos para a extração do seu valor tendo se tornado uma discussão permanente na sociedade e nos meios políticos sobre se a troca e a partilha de dados entre o público e o privado não irão expor os dados aos interesses económicos e assim aproveitados para alinhar os seus produtos e serviços de forma a satisfazer o mercado.
Por último, o maior desafio é a oposição de duas realidades, por um lado temos a privacidade dos dados, por outro lado pretendemos a interoperabilidade desses mesmos dados. A relação entre estas duas realidades leva a que todo o planeamento, desenho e desenvolvimento de uma solução seja feita de modo a permitir que os dados utilizados, armazenados e por fim expostos estejam de acordo com as regras fundamentais de acreditação dos organismos que tutelam a proteção de dados.
Para isso, com o propósito de alcançar os objetivos que todos os autores enumeram nos seus artigos, a conceção de um modelo que consiga fazer a integração de todos os sistemas aliada a uma nova tecnologia e a um novo conceito tecnológico permitirá abranger os novos conceitos de Business Intelligence, Business Analytics, Data Mining e Big Data.
A certificação na área da saúde e nos cuidados de saúde têm por si só uma importância cada vez maior devido sensibilidade de uma área que lida com o bem-estar e saúde das pessoas.
A lei criada nos Estados Unidos da América denominada por Health Information Technology for
Economic and Clinical Health (HITECH) veio promover a Health and Human Services (HHS) com
vista a estabelecer um conjunto de programas para melhorar a qualidade, segurança, eficiência e através da promoção do uso dos Sistemas de Informação.
Para isso foram estabelecidos objetivos e incentivos através de pagamentos para a utilização de tecnologia certificada no registo adequado por parte dos profissionais de saúde de todos os procedimentos e informações a fim de uma posterior análise dos dados inseridos.
Com este objetivo traçado, foi adotado as boas praticas do Meaningful Use, onde estão definidos os objetivos que devem ser atingidos pelos profissionais e prestadores na área da saúde.
Tendo como entidade responsável, a Health Information Technology10, estas boas práticas definem uma série de condições e objetivos que devem ser atingidos pelos prestadores e profissionais de saúde, a utilização de sistemas de incentivos financeiros com o objetivo dos cumprimentos dos prazos estabelecidos em três etapas.
A definição e os objetivos da utilização de Meaningful Use como certificação dos registos eletrónicos da saúde (EHR) servem para criar parâmetros de qualidade, segurança, eficiência e redução de disparidades.
Para isso a envolvência entre pacientes e familiares, coordenado com a melhoria dos cuidados da população e da saúde pública, obriga a manter a privacidade e segurança das informações da saúde dos pacientes.
O resultado da utilização deste método de certificação faz com que haja uma melhoria nos resultados clínicos, nos resultados de saúde da população e uma maior transparência e eficiência, resultando uma maior fiabilidade nos dados dos sistemas de saúde para investigação.
A metodologia utilizada pelo Meaningful Use prevê três etapas que vão requerer uma série de condições para ser atingido os parâmetros da certificação dos registos eletrónicos da saúde: Essas etapas estão escalonadas por anos sendo divididas por:
• Etapa 1 - 2011-2012 – Recolha de dados e partilha de informação;
• Etapa 2 - 2014 – Processos clínicos avançados
• Etapa 3 - 2016 – Melhoria de resultados
Na primeira etapa que decorreu entre 2011 e 2012, foram definidos os requisitos base de recolha de dados clínicos e a partilha de informações, que serão a base das fases seguintes.
Pretendeu-se promover e adotar sistemas que permitissem facilitar a gestão da doença e dos fármacos.
Na segunda etapa que foi até ao final de 2013, visou o melhoramento da fase 1. Nesta fase foi necessário promover a melhoria contínua da qualidade e a partilha de informações, recorrendo ao registo dos dados no formato eletrónico.
Na última etapa que teve como termo o final de 2016 e teve como objetivo sobretudo as melhorias ao nível da qualidade, segurança e eficiência.
Nesta fase defendeu-se a adoção de um sistema totalmente informatizado que através da partilha de informações sob um formato estruturado permitia suportar a decisão clínica e, consequentemente, contribuir para a melhoria dos cuidados prestados.
2.2.2 CUIDADOS DE SAÚDE PRIMÁRIOS
De acordo com o quadro de orientação do Grupo Técnico para o Desenvolvimento dos Cuidados de Saúde Primários de Setembro 2012 (Nunes, Correia, Ribeiro, & Santos, 2012), grupo criado para a restruturação dos Cuidados de Saúde Primários em Portugal, um dos requisitos é a implementação de arquiteturas e tecnologias suportados por sistemas de informação para colmatar um dos maiores constrangimentos e fatores na perturbação e insatisfação dos profissionais de saúde e pacientes. Com a reforma do conceito de Cuidados de Saúde Primários no Plano estratégico do Ministério da Saúde (2007-2011) e a reorganização do mapa estrutural nomeadamente a conversão de Centros de Saúde para Unidades de Saúde Familiares (USF) e para Unidades de Cuidados de Saúde