• Nenhum resultado encontrado

O Data Warehouse ´e o projeto criado a partir de bases de dados convencionais que visam compor uma solu¸c˜ao de Business Intelligence. O projeto de Data Ware- house que ser´a utilizado como base para a implementa¸c˜ao das ferramentas propostas no software Pentaho ser´a o mesmo desenvolvido por (BETTONI, 2010).

Para modelar o Data Warehouse foram realizados alguns questionamentos: • Quais os fatos que merecem destaque nos indicadores do RIPSA?

• Quais as informa¸c˜oes mais importantes para contextualizar os fatos?

Para a defini¸c˜ao da modelagem de dados de um Data Warehouse s˜ao necess´arios os seguintes elementos: tabelas fatos, tabelas dimens˜oes e cubos. As tabelas fatos comp˜oem as medidas sobre os fatos. Nessas tabelas s˜ao definidas uma ou mais m´etricas. As m´etricas s˜ao informa¸c˜oes que realizam algum c´alculo resolvendo al- guma opera¸c˜ao, por exemplo, a quantidade de ´obitos. As tabelas dimens˜oes contex- tualizam os dados, s˜ao informa¸c˜oes complementares sobre as tabelas fatos. Os cubos representam a base da solu¸c˜ao de Business Intelligence sendo o elemento b´asico da base OLAP (PEREIRA, 2010).

Na integra¸c˜ao ser˜ao implementadas algumas consultas aos indicadores do RIPSA presentes no Observat´orio OTICSSS de mortalidade. Para realizar o c´alculo destes

indicadores ´e necess´ario obter-se os dados dos sistemas SIM e SINASC como pode- mos observar nos anexos A.1 e B.1.

A seguir os indicadores do RIPSA que foram trabalhados por (BETTONI, 2010): • Taxa de mortalidade infantil - C.1

• Taxa de mortalidade neonatal precoce - C.1.1 • Taxa de mortalidade neonatal tardia - C.1.2 • Taxa de mortalidade p´os-neonatal - C.1.3

• Taxa de mortalidade em menores de 5 anos - C.16 • Mortalidade proporcional por causas mal definidas - C.5

• Mortalidade proporcional por doen¸ca diarr´eica aguda em menores de 5 anos - C.6

• Mortalidade proporcional por infec¸c˜ao respirat´oria aguda em menores de 5 anos - C.7

• Taxa de mortalidade espec´ıfica por doen¸cas do aparelho circulat´orio - C.8 • Taxa de mortalidade espec´ıfica por causas externas - C.9

• Taxa de mortalidade espec´ıfica por neoplasias malignas - C.10 • Taxa de mortalidade espec´ıfica por diabete melito - C.12 • Taxa de mortalidade espec´ıfica por aids - C.14

• Taxa de mortalidade espec´ıfica por afec¸c˜oes originadas no per´ıodo perinatal - C.15

• Taxa de mortalidade espec´ıfica por doen¸cas transmiss´ıveis - C.17

Para cada um destes indicadores foram criados cen´arios representados atrav´es de cubos. Para o indicador C7, por exemplo, temos a representa¸c˜ao do cubo na Figura 5.2. Nesta ilustra¸c˜ao temos a organiza¸c˜ao dos dados no formato tabela, onde o usu´ario pode aprofundar sua consulta navegando pelos n´ıveis. Neste cubo temos duas dimens˜oes (tempo e local) e trˆes m´etricas (n´umero de ´obitos, n´umero de causas, e o resultado do indicador C7). Apesar de serem fornecidos recursos gr´aficos para gerar diferentes formas de visualiza¸c˜oes, n˜ao se tem ainda uma organiza¸c˜ao eficiente dos dados.

A Figura 5.3 temos outro cubo onde temos o resultado obtido da quantidade de ´

obitos, no ano de 1996, no Estado do RS, no munic´ıpio de Agudo, pelo grupo de Causa Aterosclerose e CerebroVasculares, com suas respectivas causas.

Figura 5.2: Ferramenta Analysis View - Cubo do indicador C7 RIPSA (BETTONI, 2010).

Para a cria¸c˜ao dos cubos no Pentaho ´e necess´ario realizar o processo de ETL. O processo de ETL recupera dados de diferentes fontes e trata a qualidade dos dados produzindo um banco intermedi´ario para a carga OLAP. Este banco em geral ´e chamado de ODS ou Staging. A partir do banco Staging, os dados alimentam um banco OLAP, formando o Data Warehouse (com seus data marts) da institui¸c˜ao.

Os data marts s˜ao os reposit´orios de dados que formam subconjuntos de dados compondo o Data Warehouse. Em geral, estes reposit´orios s˜ao separados por esco- pos diferentes que podem dar ˆenfase em alguma unidade organizacional. Os dados de um data mart s˜ao obtidos atrav´es do Data Warehouse onde s˜ao desnormaliza- dos e indexados para suportar intensa pesquisa. Ap´os realizar estas defini¸c˜oes, os data marts possuem a capacidade de extra¸c˜ao e ajuste de propor¸c˜oes aos requisitos espec´ıficos de classifica¸c˜ao de dados.

Na Figura 5.4 temos a representa¸c˜ao do cubo Mortalidade com trˆes dimens˜oes: Tempo, Local e Causa b´asica. Este cubo foi criado a partir das bases de dados da sa´ude utilizadas no Observat´orio OTICSSS. Nas dimens˜oes ´e poss´ıvel visualizar os n´ıveis da quantidade de ´obitos. Por exemplo, na dimens˜ao Local foram criados dois n´ıveis um para Estado e outro para Munic´ıpio. Neste caso, a exibi¸c˜ao da quantidade de ´obitos pode ser por Estado e por Munic´ıpio.

Figura 5.3: Ferramenta Analysis View - Cubo das causas b´asicas base CID10 (BETTONI, 2010).

Al´em dos indicadores de mortalidade, temos a representa¸c˜ao da base de dados CID10 (Classifica¸c˜ao Estat´ıstica Internacional de Doen¸cas e Problemas relacionados `

a Sa´ude) que representam as causas b´asicas das doen¸cas do aparelho circulat´orio de c´odigo I (CID10, 2010).

Para cada pessoa que falece ´e realizado o cadastro da causa do falecimento que pertecem `as seguintes categorias:

• I00-I02 Febre reum´atica aguda; • I05-109 Doen¸cas reum´aticas crˆonicas; • I10-I15 Doen¸cas hipertensivas;

• I20-I25 Doen¸cas isquˆemicas do cora¸c˜ao;

• I26-I28 Doen¸cas card´ıaca pulmonar e da circula¸c˜ao pulmonar; • I30-I52 Outras formas de doen¸ca do cora¸c˜ao;

• I60-I69 Doen¸cas cerebrovasculares;

• I70-I79 Doen¸cas das art´erias, das arter´ıolas e dos capilares;

• I80-I89 Doen¸cas das veias, dos vasos linf´aticos e dos gˆanglios linf´aticos, n˜ao classificadas em outra;

Figura 5.4: Cubo Mortalidade desenvolvido na ferramenta ETL(Pentaho) (BETTONI, 2010).

• I95-I99 Outros transtornos, e os n˜ao especificados do aparelho circulat´orio.