• Nenhum resultado encontrado

2.7 MODELOS DE PREDIÇÃO CLÍNICA

2.7.1 Visão geral

No contexto biomédico geralmente usa-se a denominação modelo de predição clínica. Distinguem-se dois tipos: modelos de predição diagnóstica, quando objetiva-se verificar se um paciente possui ou não determinada condição, e modelos de predição prognóstica, quando se sabe que o paciente possui a condição e deseja-se predizer o seu desfecho clínico (REILLY; EVANS, 2006). Ambos os estudos podem incluir uma simples

variável preditora, ou mais comumente, várias variáveis preditoras, buscando identificar aquelas que mais contribuem em explicar a variável resposta. Além disso, reconhece-se a importância de acessar alguns aspectos do modelo obtido, como: população alvo ao qual se aplica, definição objetiva da variável resposta, considerações a respeito do tamanho amostral, validação do modelo e, de importância prática, como o modelo se comporta em relação às medidas de desempenho (discutidas mais adiante).

Bouwmeester et al. (2012) Fizeram uma revisão de literatura sobre os estudos que envolvem predição clínica multivariada, publicados ainda no ano de 2008. De 1204 possíveis artigos identificados na pesquisa de bancos de dados biomédicos, 71 foram selecionados para a revisão. Os autores observaram que estes artigos se encaixavam em basicamente cinco tipos de estudos:

 Pesquisa de preditores: objetivam encontrar algumas, dentre várias variáveis preditoras, que melhor predizem, ou que melhor se associam à variável resposta;  Desenvolvimento de modelo sem validação externa: objetivam desenvolver um

modelo multivariado de predição, com identificação de importantes preditores, podendo incluir algum tipo de validação interna, mas sem validação externa;

 Desenvolvimento de modelo com validação externa: objetivam também desenvolver um modelo multivariado de predição, porém acessam o desempenho do modelo usando um banco de dados externo, independente, o qual não foi utilizado no processo inicial de obtenção do modelo. Por exemplo, dados de outro local (validação geográfica), ou de outro período (validação temporal);

 Estudos de validação externa: objetivam acessar o desempenho de um modelo já proposto, usando um banco de dados externo ao usado no processo de modelagem inicial. Podem eventualmente ajustar ou atualizar um modelo anteriormente estabelecido;

 Estudos de impacto do modelo: objetivam avaliar o impacto ou o efeito de um modelo de predição já definido e em vigor. Podem avaliar o comportamento médico, o desfecho clínico dos pacientes ou o custo-efetividade relacionados ao uso do modelo na prática, comparando-o ao seu não uso.

Algumas recomendações têm sido publicadas sobre o processo de desenvolvimento e avaliação de um modelo preditivo clínico. Steyerberg e Vergouwe (2014) resumiram os procedimentos em sete passos básicos, usando como exemplo ilustrativo a aplicação da

regressão logística binária sobre dados relativos ao desfecho mortalidade dentro de 30 dias após infarto agudo do miocárdio (logo, aqui o desfecho é binário - morte/não-morte):

1. Definição do problema e inspeção dos dados. Requer algum tratamento dos dados antes da elaboração do modelo: correta escolha dos potenciais preditores a serem verificados quanto à associação com a variável resposta, com base na revisão de literatura e/ou orientações de especialistas; definição dos critérios de inclusão dos pacientes no estudo; se alguns preditores possuem poucos dados perdidos, considerar métodos de múltipla imputação, em que estes dados ausentes são estimados. Isto é preferível a usar análise de casos completos, quando todos os pacientes com alguns dados perdidos são excluídos da pesquisa; e definir de forma objetiva a variável resposta de interesse.

2. Codificação dos preditores. Dependendo da natureza dos preditores (se categóricos ou contínuos), várias formas de codificação são possíveis. Por exemplo, variáveis categóricas podem ser codificadas como variáveis dummy. Opcionalmente pode-se fundir uma categoria rara (com poucas observações) com outras categorias, por exemplo se há as categorias anterior, posterior e as demais posições possuem uma frequência reduzida, pode-se reunir estas últimas numa categoria denominada “outros”. É desencorajado dicotomizar preditores contínuos, devido à perda de informações no processo (ROYSTON; ALTMAN; SAUERBREI, 2006). Apesar de que há perda de informações ao categorizar uma variável contínua em mais de duas categorias, isso pode resultar em um modelo mais “amigável” ao usuário, desde que não haja muita perda da capacidade preditiva.

3. Especificação do modelo. Aqui, há o processo de seleção dos preditores mais apropriados ao modelo e os testes relacionados aos pressupostos do método de modelagem. A modelagem stepwise é muito usada na regressão binária clássica, no entanto, se o número de eventos da variável resposta é muito reduzido em relação ao número de coeficientes sendo estimados, as estimativas podem ser instáveis ou pode ocorrer sobre-ajuste do modelo aos dados. Um modelo robusto pode não se ajustar bem aos dados, mas é preferível a um modelo muito ajustado aos dados, mas que possui desempenho reduzido quando aplicado sobre dados externos.

4. Estimação do modelo. É necessário estimar os coeficientes das variáveis preditoras, após estas serem escolhidas. O método mais usado no caso da Regressão Logística Binária é o método de máxima verossimilhança, mas métodos mais recentes, como

os baseados em contração de coeficientes, possuem características importantes, como redução do sobre-ajuste.

5. Desempenho do modelo. Faz-se necessário acessar a qualidade do modelo, com medidas de desempenho frequentemente utilizadas em estudos de predição clínica. 6. Validação do modelo. Aqui, distinguem-se duas formas distintas: validação interna e

validação externa. No primeiro caso, acessa-se a estabilidade do modelo em relação à população de onde os dados iniciais foram obtidos. No segundo, avalia-se como o modelo se comporta em populações suficientemente independentes. É considerada uma validação mais “forte” porque permite avaliar como os resultados obtidos no banco de dados de treino são transponíveis para dados externos.

7. Apresentação do Modelo. O formato como o modelo é apresentado ao usuário pode facilitar o seu uso. É possível disponibilizá-lo como uma fórmula, como gráfico em forma de diagrama, ou como calculadoras informatizadas, disponibilizadas on line. No futuro, quando os modelos de predição clínica estiverem mais amplamente em uso, seu emprego associado aos registros eletrônicos dos pacientes pode facilitar a tomada de decisões no contexto clínico.

Documentos relacionados