2.3 Considera¸c˜ oes Finais
3.1.1 Casos de leptospirose baseados em dados cl´ınicos e epidemiol´ ogicos
O uso de um modelo de predi¸c˜ao baseado em dados cl´ınicos somados a dados epide- miol´ogicos pode sugerir que um indiv´ıduo ´e suspeito para a doen¸ca, restando realizar exames laboratoriais espec´ıficos para a confirma¸c˜ao. Essa predi¸c˜ao pode auxiliar no tra- tamento eficaz, favorecer o progn´ostico da doen¸ca para casos graves e/ou at´e mesmo a redu¸c˜ao dos ´obitos (NERY; CLARO; LINDOW, 2016; JUNIOR; CLARO; LINDOW, 2017).
Assim, o objetivo desta etapa foi analisar os modelos de classifica¸c˜ao que apresentem o melhor ajuste para a identifica¸c˜ao dos casos da leptospirose aplicados a base de dados cl´ınicos e epidemiol´ogicos do IGM/FIOCRUZ-BA. A identifica¸c˜ao precoce de casos de leptospirose auxiliar´a os profissionais de sa´ude no tratamento dos pacientes, minimizando o risco ou evolu¸c˜ao para a forma grave da doen¸ca (NERY; CLARO; LINDOW, 2016; JUNIOR; CLARO; LINDOW, 2017).
Objetivos espec´ıficos
Conhecer os fatores cl´ınicos e epidemiol´ogicos da leptospirose com o intuito de melhor gerir os dados a serem minerados.
Aplicar t´ecnicas de pr´e-processamento para a base de dados do estudo. Avaliar os algoritmos de classifica¸c˜ao na identifica¸c˜ao dos casos da doen¸ca.
Avaliar a sensibilidade dos melhores modelos de predi¸c˜ao em um conjunto de dados contendo apenas casos confirmados laboratorialmente por leptospirose.
Avaliar a especificidade dos melhores modelos de predi¸c˜ao em um conjunto de dados contendo apenas casos confirmados laboratorialmente por dengue.
3.1.2 Agrupamento de indiv´ıduos doentes baseados nos desfechos cl´ınicos
Nesta etapa do trabalho, foram realizados experimentos para avaliar a viabilidade de ana- lisar o perfil de express˜ao gˆenica dos indiv´ıduos doentes por meio de t´ecnicas de minera¸c˜ao de dados em um conjunto de dados reduzido (389 transcritos). A tarefa de minera¸c˜ao de dados escolhida foi a de agrupamento (HAN; KAMBER; PEI, 2011; FACELI et al.,
3.1 METODOLOGIA 23
2011), pois o intuito inicial era de avaliar de forma autom´atica se o uso de algoritmos poderiam identificar os grupos de amostras avaliadas, pela t´ecnica de microarranjos, de acordo com o valor de express˜ao e seus respectivos desfechos cl´ınicos.
Objetivos espec´ıficos. O foco da pesquisa ´e a aplica¸c˜ao de algoritmos utilizando as t´ecnicas de agrupamento na an´alise de genes da leptospirose a fim de auxiliar na identi- fica¸c˜ao da similaridade entre perfis de amostras avaliadas. Deste modo, especificamente esta etapa pretendia:
Compreender as t´ecnicas de an´alise dos genes com o intuito de verificar quais os tipos de dados a serem minerados.
Avaliar os m´etodos e algoritmos de agrupamento mais indicado para a identifica¸c˜ao dos grupos de amostras avaliadas.
Avaliar os resultados obtidos com o intuito de melhor ajustar os algoritmos utiliza- dos.
Avaliar a hip´otese dos profissionais da sa´ude de que h´a diferen¸cas no perfil de express˜ao entre indiv´ıduos que sobrevivem e os que morrem.
3.1.3 Predi¸c˜ao do desfecho cl´ınico na an´alise gˆenica
O objetivo desta etapa foi predizer o desfecho cl´ınico de pacientes hospitalizados por leptospirose, baseado em dados completos de express˜ao gˆenica resultante da t´ecnica de microarranjos. Avaliar um conjunto de dados de express˜ao gˆenica ´e uma tarefa que requer metodologias e ferramentas que auxiliem o trabalho. Assim, nesta hip´otese foram avaliados dois m´etodos de an´alise completa de express˜ao gˆenica: por transcritos e por genes.
3.1.3.1 M´etodo por Transcritos. Neste m´etodo, foi utilizado o conjunto completo de transcritos obtido da an´alise de express˜ao gˆenica dos 20 indiv´ıduos participantes dos estudos do IGM/FIOCRUZ-BA. Devido `a alta dimensionalidade dos dados, t´ecnicas de redu¸c˜ao e identifica¸c˜ao dos genes relevantes foram experimentadas com o uso de algoritmo de classifica¸c˜ao, avaliando a acur´acia em identificar os genes diferentemente expressos entre os grupos de sobreviventes e ´obitos.
3.1.3.2 M´etodo por Genes. Neste m´etodo foi utilizado o conjunto completo de genes, convertido da base de dados por transcritos. Neste m´etodo, foi avaliada a convers˜ao do conjunto de dados, com o proposito de melhorar o desempenho das t´ecnicas de redu¸c˜ao da dimensionalidade, bem como na predi¸c˜ao dos casos de ´obito e sobreviventes.
Objetivos espec´ıficos. Nesta etapa do trabalho aplicou-se algoritmos utilizando as t´ecnicas de classifica¸c˜ao na an´alise de genes da leptospirose a fim de auxiliar nas predi¸c˜oes cl´ınicas dos casos da doen¸ca. Especificamente:
24 PREDIC¸ ˜AO DO DESFECHO CLINICO
Identificar e avaliar t´ecnicas de redu¸c˜ao da dimensionalidade para a aplica¸c˜ao em dados gen´eticos.
Aplicar o algoritmo SVM na an´alise dos dados de express˜ao gˆenica resultantes dos experimentos de redu¸c˜ao da dimensionalidade, comparando a acur´acia do experi- mento de predi¸c˜ao.
Avaliar os resultados obtidos com o intuito de melhor ajustar o algoritmo utilizado. Identificar os genes e sua respectiva fun¸c˜ao biol´ogica contido no conjunto de dado
com maior taxa de acur´acia.
Avaliar a importˆancia cl´ınica dos genes identificados. 3.2 CONSIDERAC¸ ˜OES FINAIS
Neste cap´ıtulo foi apresentado o problema da pesquisa acometido pela doen¸ca, bem como a proposta de identificar os genes associados `a morte ou sobrevivˆencia de indiv´ıduos doentes por leptospirose atrav´es do uso de algoritmos de minera¸c˜ao de dados. Foi descrita a metodologia do trabalho com as 3 etapas detalhadas para alcan¸car o objetivo proposto.
Cap´ıtulo
4
Este cap´ıtulo descreve os conjuntos de dados utilizados neste trabalho.