De acordo com a figura 3, a camada de acesso à informação é aquela na qual o usuário final interage com DW. Envolve o hardware e software utilizados pelos usuários para obtenção de relatórios, planilhas, gráficos e outros.
Figura – 03: Arquitetura genérica em Data Warehouse.
Fonte: adaptado de Inmon,1997
A camada de acesso a dados é responsável pela ligação entre as ferramentas de acesso à informação e aos bancos de dados operacionais. Pode se comunicar com diversos e
diferentes sistemas Gerenciadores de Banco de Dados (SGDB) e também com outras formas de sistemas de arquivos. A Structured Query Language (SQL) é a principal e mais utilizada linguagem de comunicação entre as diversas formas de dados.
A camada de metadados comporta os metadados, que são as informações sobre os dados mantidos pela organização, essas informações indicam onde residem esses dados ou a forma como estão armazenados.
A camada de gerenciamento de processos está intimamente ligada ao controle dos diversos processos realizados para construir e manter as informações do dicionário de dados do DW. A camada de processos gerencia esses processos a fim de manter o DW atualizado e consistente, priorizando e sequenciando as cargas de dados que mantém o DW.
A camada de transporte ou Middleware é responsável por gerenciar o transporte de informações como a coleta de mensagens e os dados gerados pelas transações.
A camada de dados operacionais e externos comporta os dados dos aplicativos da organização e por outra fonte qualquer externa, e ambas estão interligadas ao DW.
A camada de Data Warehouse é o local onde estão armazenados os dados utilizados para obter informações, é o próprio DW. A camada de dados intermediários, ou Data Staging, é responsável pelos processos de seleção, edição, resumo, combinação e carga no DW. Tais processos são executados sobre informações de bases operacionais e/ou fontes externas. Esta camada envolve também programas de análise da qualidade dos dados e filtros identificadores de padrões nos dados operacionais.
A utilização de um modelo baseado em técnicas de mineração de dados e a utilização de ferramenta de Business Intelligence (BI) para a identificação automática de beneficiários com propensão a doenças crônicas usando banco de dados. Na Figura 1 apresentada, percebe-se que existem várias etapas neste processo, as etapas Seleção, Processamento, e Transformação ocorrem através de ETL, com o processamento das informações. As últimas duas etapas que são mineração e avaliação/interpretação fazem parte das saídas, as quais fazem uso de ferramentas de Business Intelligence (BI) para que, finalmente seja alcançado o conhecimento.
27
PROCESSAMENTO
Nesta fase demostramos como os dados foram consolidados para gerar conhecimento, nesta etapa a ferramenta de BI utilizada foi o QlikView que é um software que utiliza uma tecnologia patenteada de associação em memória. Esta tecnologia associativa permite criar uma interface única simplificando radicalmente a implantação, o uso e a manutenção das consultas e análises.
Figura – 04: Processamento Operadora.
Os dados vindos do ERP da Operadora foram carregados no DW através o processo de ETL, no QlikView usando a tecnologia AQL™ (Associative Query Logic) que é uma tecnologia patenteada usada no software QlikView para associar dados, enquanto as queries são feitas na estrutura de dados QlikView. A tecnologia AQL promove análises não hierárquicas de dados, ao contrário das tecnologias OLAP predominantes usadas na maioria dos softwares de B.I. A tecnologia não hierárquica do AQL garante análises onde as queries não foram construídas em uma ordem específica (como ano/trimestre/mês). Usando AQL, qualquer valor da estrutura de dados pode ser o ponto de partida para a análise, a partir o uso desta ferramenta e da tecnologia AQL foi possível construir o conhecimento.
RESULTADOS
As ferramentas de Business Intelligence (BI - Inteligência de Negócio) é própria para ajudar a ter clareza sobre as ações a tomar. O termo Inteligência de Negócios significa, resumidamente, coletar dados de diversas fontes, organizá-los, analisá-los e compartilhá-los com os executivos mais importantes da empresa. Estes então transformam essas informações relevantes em decisões importantes para o futuro da empresa.
Dentre as principais características do conceito BI, pode-se destacar: extrair e integrar dados de múltiplas fontes; fazer uso da experiência, trabalhar com hipóteses e simulações, procurar relações de causa e efeito e transformar os registros obtidos em informação útil para o conhecimento empresarial. Segundo Howard Dresner, (apud BARBIERI, 2001), constata que “Business Intelligence é um termo “guarda-chuva” que descreve um conjunto de conceitos, ferramentas e tecnologias para aperfeiçoar o processo de tomada de decisão em negócios, ou seja, é um processo de conseguir informação certa, no momento oportuno”, após todas as fases finalizadas para construção de dados em conhecimento chegamos aos seguintes resultados apresentados na ferramenta de Business Intelligence (BI - Inteligência de Negócio):
Classificação Beneficiarios Despesa Assistencial % Beneficiarios % Despesa Assistencial % Consultas % SADT % Hospitalar
DOENÇA RENAL 29 R$ 104.754,47 0,02% 0,10% 0,05% 0,05% 0,20%
DOENÇA PULMONAR CRONICA 718 R$ 974.362,82 0,58% 0,93% 1,15% 0,86% 1,02%
EVENTO 224 R$ 998.936,52 0,18% 0,96% 0,35% 0,39% 2,84%
DOENÇA CARDIOVASCULAR 1645 R$ 2.205.651,50 1,33% 2,11% 2,38% 2,62% 1,83%
DOENÇA METABÓLICA 2229 R$ 2.629.471,43 1,80% 2,52% 3,04% 4,71% 1,73%
LEITO DE ALTA COMPLEXIDADE 106 R$ 2.861.423,21 0,09% 2,74% 0,25% 0,65% 2,05%
SAUDE MENTAL 2345 R$ 3.106.046,37 1,89% 2,97% 5,09% 2,46% 3,16%
NEOPLASIA 109 R$ 5.851.323,17 0,09% 5,60% 0,35% 1,00% 1,74%
ATENÇAO EM OBSTETRICIA 2603 R$ 10.468.689,08 2,10% 10,02% 6,35% 7,86% 16,24%
DOENÇA OSTEOMUSCULAR 5037 R$ 11.284.458,90 4,07% 10,80% 8,33% 11,33% 12,57%
COMPLEXO 2419 R$ 15.730.913,98 1,95% 15,06% 6,99% 28,96% 12,75%
GERAL 106425 R$ 48.244.089,89 85,90% 46,18% 65,68% 39,10% 43,87%
Total 123889 R$ 104.460.121,33 100,00% 100,00% 100,00% 100,00% 100,00%
10168 R$ 43.335.385,13 8,21% 41,49% 22,02% 49,15% 43,30%
Tabela – 05: Resultado do processamento na ferramenta BI
29
Uma regra simples estabelecida a mais de cem anos por meio de observação e análise empírica de dados, ainda é válida hoje, o princípio 80/20, também conhecido como regra de Pareto, o gráfico de Pareto deve seu nome a Vilfredo Pareto, economista italiano do século 19. Ele mostra a importância relativa de diferentes aspectos de um problema, facilitando a identificação dos aspectos a serem enfocados e solucionado primeiro. Essa ferramenta baseia-se no princípio de Pareto, que sugere que um grande número de problemas é resultado de um número relativamente pequeno de causas. O princípio de Pareto, também conhecido como regra de 80/20, indica que 80% dos problemas provêm de 20% das causas.
Tendo como base o princípio de Pareto nas análises extraídas e apresentadas na tabela acima mostram que apenas 8,21% dos Beneficiários utilizam 41,49% do total das despesas assistências ou seja uma pequena parcela da massa total de beneficiários utiliza quase metade do total das despesas assistenciais.
Pirâmide populacional:
Figura – 05: Pirâmide População Analisada.
Acima a pirâmide populacional da população analisada 123.889 beneficiários.
Abaixo apenas a pirâmide populacional dos 10.168 beneficiários que representam 8.21% e utilizam 41.49% dos gastos com assistência médica.
Figura – 06: Pirâmide População Classificada nos Programas.
Faixa Idade Masculino Feminino Total
0 a 18 anos 5,22% 3,85% 9,07%
19 a 23 anos 5,79% 8,88% 14,67%
24 a 28 anos 10,83% 16,39% 27,22%
29 a 33 anos 13,66% 18,18% 31,84%
34 a 38 anos 13,87% 14,40% 28,27%
39 a 43 anos 13,87% 11,47% 25,34%
44 a 48 anos 12,30% 8,98% 21,28%
49 a 53 anos 10,75% 7,20% 17,95%
54 a 58 anos 5,99% 5,26% 11,25%
59 anos ou mais 7,72% 5,39% 13,11%
Tabela – 06: População Classificada por Faixa e Sexo.
A tabela mostra a concentração de beneficiários por faixa, destaque para as faixas entre 24 e 33 anos para o sexo feminino e as faixas entre 34 e 43 anos para o sexo masculino, a concentração de beneficiários nestas faixas tem relação direta com a utilização assistencial, na próxima tabela podemos analisar onde incidem os maiores utilizadores por faixa, nesta analise ainda encontramos outra faixa acima de 59 anos que utiliza 13,15% da assistência.
31
Faixa Idade Beneficiarios Despesa Assistencial % Beneficiarios % Despesa Assistencial % Consultas % SADT % Hospitalar
0 a 18 a nos 445 R$ 2.477.508,49 4,38% 5,94% 3,66% 4,58% 4,96%
19 a 23 a nos 782 R$ 2.311.297,87 7,69% 5,54% 6,46% 5,46% 8,34%
24 a 28 a nos 1451 R$ 4.508.055,69 14,27% 10,81% 13,85% 11,43% 15,67%
29 a 33 a nos 1671 R$ 5.798.975,66 16,43% 13,90% 16,64% 15,03% 17,02%
34 a 38 a nos 1443 R$ 5.090.454,01 14,19% 12,20% 13,75% 13,09% 14,41%
39 a 43 a nos 1261 R$ 4.814.703,20 12,40% 11,54% 12,67% 12,09% 11,03%
44 a 48 a nos 1043 R$ 4.150.137,34 10,26% 9,95% 10,68% 10,94% 8,78%
49 a 53 a nos 869 R$ 4.083.569,13 8,55% 9,79% 8,93% 9,77% 7,08%
54 a 58 a nos 564 R$ 3.000.122,62 5,55% 7,19% 6,28% 6,49% 4,69%
59 a nos ou ma i s 639 R$ 5.485.994,39 6,28% 13,15% 7,08% 11,12% 8,03%
Total 10168 R$ 41.720.818,40 100,00% 100,00% 100,00% 100,00% 100,00%
Tabela – 07: Concentração das Despesas Assistenciais por Faixa.
A tabela acima mostra uma grande concentração de gastos nas faixas intermediarias entre 24 e 43 anos, temos que destacar a faixa acima de 59 anos que com apenas 6,28% dos beneficiários utiliza 13,15% das despesas assistenciais.
Sexo Faixa Idade Beneficiarios Despesa Assistencial % Beneficiarios % Despesa Assistencial % Consultas % SADT % Hospitalar
Femi ni no 0 a 18 a nos 242 R$ 1.610.036,69 2,38% 3,86% 2,09% 2,80% 2,78%
Femi ni no 19 a 23 a nos 558 R$ 1.862.358,37 5,49% 4,46% 5,28% 4,38% 6,84%
Femi ni no 24 a 28 a nos 1031 R$ 3.367.565,59 10,14% 8,07% 10,96% 8,97% 11,92%
Femi ni no 29 a 33 a nos 1141 R$ 4.258.703,26 11,22% 10,21% 12,92% 11,46% 13,27%
Femi ni no 34 a 38 a nos 905 R$ 3.429.642,97 8,90% 8,22% 10,21% 9,46% 10,74%
10168 R$ 41.720.818,40 100,00% 100,00% 100,00% 100,00% 100,00%
Feminino 4703 R$ 18.662.656,98 46,25% 44,73% 53,73% 50,05% 50,63%
Masculino 718 R$ 5.407.328,63 7,06% 12,96% 6,17% 10,00% 8,03%
Total 5421 R$ 24.069.985,61 53,31% 57,69% 59,90% 60,05% 58,66%
Total
Tabela – 08: Despesas Assistenciais por Faixa e Sexo.
Quando abrimos os valores por faixa e sexo identificamos que 6 faixas femininas são responsáveis por 44,73% das despesas assistenciais, a quantidade de beneficiários destas
faixas 4.703 representa 46,25% dos beneficiários, nas faixas masculinas apenas duas faixas têm utilização elevada representando 12,96% das despesas assistenciais, sendo 718 beneficiários, 7,06% do total. A análise em conjunto das faixas e sexos dos maiores utilizadores chegamos a conclusão que 5.421 beneficiários, apenas 4,38% da massa de 123.889 beneficiários é responsável por 23,04% das despesas assistenciais, uma pequena população que pode ser assistida via programas de promoção de saúde e ou HomeCare visando diminuir despesas assistenciais e sinistralidade, tentando assim atingir o objetivo de controlar os custos com a evolução da doença.
Tipo Associado Beneficiarios Despesa Assistencial % Beneficiarios % Despesa Assistencial % Consultas % SADT % Hospitalar
Dependente 4049 R$ 16.368.115,18 39,82% 39,23% 40,46% 40,84% 42,24%
Ti tul ar 6119 R$ 25.352.703,22 60,18% 60,77% 59,54% 59,16% 57,76%
Total 10168 R$ 41.720.818,40 100,00% 100,00% 100,00% 100,00% 100,00%
Tabela – 09: Despesa Assistenciais por Tipo de Beneficiário
A tabela acima mostra que a maior utilização é dos titulares bem acima dos dependentes.
Na análise do índice de despesas assistenciais, ou despesas médicas ou sinistralidade que mostra a relação entre despesas assistenciais e o total das receitas com operação de planos de saúde (contraprestações efetivas). Calculado pela fórmula:
Tipo Beneficiários Sinistralidade
Sinistralidade dos Beneficiários identificados nos programas 10.168 303,08%
Sinistralidade sem os maiores utilizadores 113.721 53,29%
Sinistralidade agrupada 123.889 80,98%
Tabela – 10: Analise Sinistralidade
O gráfico abaixo publicado periodicamente pela ANS mostra a relação entre as receitas e despesas assistenciais se dá através da taxa de sinistralidade das operadoras, este gráfico é importante para efeito de comparação com os resultados analisados.
33
Figura - 07: Sinistralidade ANS
A sinistralidade apurada de 303,08% do grupo de beneficiários com maior utilização apresenta uma sinistralidade muito acima da média de Sinistralidade das Operadoras conforme figura 6, valores acima de 85% de Sinistralidade já podem representar resultado negativo nos fluxos de caixa, quando analisamos a Sinistralidade desconsiderando o grupo de maiores utilizadores temos um índice de 53,29% bem abaixo da realidade de mercado conforme figura 6, conseguimos mostrar com este estudo aderência a análise de Pareto onde uma pequena massa de beneficiários se identificado precocemente e tratada adequadamente poderá trazer uma qualidade de vida melhor ao indivíduo e melhores resultados financeiros para a Operadora.
CONCLUSÃO
Este estudo visou demonstrar a utilização um modelo baseado no processo KDD a partir da utilização de ferramentas BI (Business Intelligence) e de técnicas de mineração de dados (data mining) de modo que a partir da execução de procedimentos médicos foi possível identificar, agrupar e quantificar os pacientes crônicos que impactam diretamente nos resultados financeiros da Operadora de Saúde.
Todas as análises foram realizadas com base e tão somente na execução dos procedimentos médicos já realizados, apesar de conseguir demonstrar e quantificar os principais ofensores do sistema ainda assim temos que ressaltar que estas visões são como administrar olhando pelo retrovisor uma vez que todas as análises olham para o passado desta forma não é possível identificar precocemente as doenças e tomar decisões antes dos eventos acontecerem, do ponto de vista das regras as análises demonstraram ser efetivas na identificação dos ofensores ainda assim poderiam ser mais aprofundadas e assertivas se ampliássemos as regras para contemplar os códigos CID´s (Classificação Internacional de Doenças ) identificados a partir da utilização de ferramenta de prontuário eletrônico e resultados de Exames Anatomopatológico.
Apesar das análises terem como base o passado ainda assim a partir destas informações será possível a criação de programas de prevenções e acompanhamento destes pacientes de forma a melhorar a qualidade de vida do indivíduo e a diminuição das despesas medicas futuras.
Este estudo tem uma visão altamente financeira nas análises, sendo num primeiro momento muito efetiva para tomada de decisão, a logo prazo e com a adoção de novos critérios de analise como CID e resultados de exames anatomopatológico este estudo deve evoluir naturalmente para um novo estudo baseado em analises preditivas que é o uso de dados, algoritmos estatísticos e técnicas de machine learning(Aprendizado de Maquina) para identificar a probabilidade de resultados futuros com base em dados históricos.
O objetivo será de ir além da estatística descritiva e dos relatórios sobre o que aconteceu para fornecer uma melhor avaliação sobre o que vai acontecer no futuro. O
35
resultado final será a simplificação da tomada de decisão e a geração de novos insights que levem a melhores ações.