• Nenhum resultado encontrado

5. Classificação Sensível ao Custo

5.1 Diferentes tipos de custos

Turney (2000) apresenta uma panorâmica geral dos diversos tipos de custos que podem ocorrer em problemas de classificação. Segundo Turney, a maioria da literatura na área de aprendizagem automática ignora todos os tipos de custos, e só alguns artigos investigaram os custos de má classificação. Além disso, muito poucos investigaram os muitos outros tipos de custos.

No mesmo artigo, Turney (2000) apresenta uma taxonomia para os diferentes tipos de custo que poderão estar envolvidos na aprendizagem (por exemplo na classificação, onde se inclui a indução de árvores de decisão), pretendendo com esta taxonomia ajudar na organização da literatura relativa a cost-sensitive learning. Assim, divide os custos em custos com os erros de má classificação, custos dos testes, custos dos peritos (para classificação de casos com classe desconhecida, antes ou durante a aprendizagem), custos de intervenção (custos necessários para alterar um determinado processo que poderá levar a alterações no custo do atributo), custos de resultados indesejados (resultantes de alterações a um determinado processo), custos de computação (com vários custos de complexidade computacional), custos dos casos (casos adquiridos para treino), custos da interacção homem-computador (na preparação dos casos para treino, selecção de atributos, definição de parâmetros ideais para optimizar a performance do algoritmo de aprendizagem, compreensão dos resultados) e custos da instabilidade (do algoritmo de aprendizagem.

Nesta enumeração os custos mais comuns, e porventura os mais importantes, são os custos relacionados com os erros de má classificação e os custos dos testes. Os custos podem ser medidos em várias unidades distintas, como por exemplo monetárias (euros, dólares), temporais (segundos, minutos) ou noutros tipos de medidas como por exemplo, na medicina, a qualidade de vida de um doente.

Custo dos erros de má classificação

Para n classes está em geral associada uma matriz n x n, onde o elemento na linha i e coluna j representa o custo de classificar um caso na classe i quando ele de facto pertence à classe j. Normalmente o custo é zero quando i = j.

Tipicamente os valores existentes na matriz de custos são constantes, ou seja, o custo é o mesmo para qualquer instância classificada na classe i mas pertencente à classe j. No caso em que o custo é zero quando i = j e é um para as restantes células, está-se perante a tradicional medida de taxa de erro.

Noutras situações, o custo dos erros de má classificação poderá ser condicional, ou seja, poderá ser dependente de determinadas características da instância ou do momento.

Existem vários exemplos na literatura de situações em que os custos de má classificação são dependentes da instância a classificar, isto é, estão relacionados com as características da instância. Na banca, o custo associado à não detecção de fraude está claramente associado ao montante envolvido em cada caso (Elkan, 2001). O mesmo se passa nas fraudes nas telecomunicações (Hollmén et al., 2000). Na medicina, o custo de prescrever um determinado medicamento a um doente alérgico pode ser diferente quando comparado com a sua prescrição a um doente não alérgico. Um diagnóstico errado pode ter consequências (custos) diferentes para cada doente, como por exemplo nos doentes mais idosos, ou que tenham determinadas comorbilidades.

Por outro lado, existem situações onde o custo de má classificação está associado ao momento em que ocorre. Um aparelho médico que monitorize um doente poderá emitir sinais de alarme perante um determinado problema. Os custos de classificação neste exemplo dependem não só do facto de a classificação estar ou não correcta, mas também da altura no tempo em que o alarme foi accionado, isto é, o sinal de alarme só será útil se houver tempo para uma resposta adequada ao problema existente (Fawcett e Provost, 1997 e 1999). Os custos de má classificação podem também estar condicionados à classificação obtida com outros casos. No exemplo anterior, se um sinal de alarme é accionado duas vezes consecutivas para o mesmo problema, e partindo do pressuposto de que ambos os sinais de alarmes são correctamente accionados, então

o benefício do primeiro sinal deverá ser superior ao do segundo (Fawcett e Provost, 1999).

Custo dos testes

A cada teste (atributo) pode estar associado um determinado custo. Na medicina, a maioria dos testes de diagnóstico tem um custo associado (ex.: uma ecografia ou um exame ao sangue). Estes custos podem variar muito entre diferentes testes. Por exemplo, em termos monetários, de acordo certas fontes [(Ministério da Saúde, 2006), Anexo III], uma tomografia de emissão (SPECT) tem o preço de 107,4 € enquanto que uma tomografia por emissão de positrões tem o preço de 1.392,8 €.

Os custos dos testes podem ser constantes para todos os doentes, mas podem também mudar conforme as características dos doentes. Por exemplo, de acordo com as mesmas fontes referidas em cima, uma prova de broncodilatação tem o preço de 36,1 €, mas se for para crianças com menos de 6 anos já custa 95,3 €, ou seja, a característica idade tem influência no custo do teste.

Por outro lado, os testes médicos podem ser muito díspares em termos de influência na qualidade de vida dos doentes. Se alguns testes são praticamente inócuos para os doentes (por exemplo a ecografia obstétrica), existem outros que podem colocar a sua vida em risco (por exemplo o cateterismo cardíaco), ou podem porventura ser muito desconfortáveis (por exemplo a endoscopia digestiva). Estas características dos testes podem ser combinadas com os custos monetários.

Podem também existir determinadas características comuns entre testes que possibilitem a sua realização em grupo. Assim, poderão existir testes que, feitos em grupo, sejam menos dispendiosos (e menos demorados) do que feitos individualmente (por exemplo (a) os três testes: ecografia renal, digestiva e ginecológica ou (b) os testes sanguíneos). Alguns testes podem também ter custos em comum e, por isso, poderão ser conjugados de forma a diminuir o custo total. Nestas circunstâncias estarão por exemplo os testes sanguíneos, onde existe um custo comum, a colheita de sangue, que pode ser único para

todos os testes, ou seja, o sangue é recolhido um única vez para a realização do primeiro teste não havendo necessidade de o fazer novamente para posteriores testes sanguíneos (se a colheita for suficiente). Neste exemplo, para além da poupança na recolha do sangue (poupança monetária e de incómodo para o doente), podem existir outras poupanças no caso de os testes serem feitos em grupo: poupança por o preço de grupo ser mais baixo e poupança no tempo (resultados poderão estar disponíveis mais rapidamente).

Os custos de alguns testes dependerão também dos resultados de outros testes (por exemplo o teste “idade” condiciona o custo do teste “prova de broncodilatação”). Outros testes podem ter efeitos secundários e fazer por isso aumentar o seu custo. Poderão existir ainda testes com custos que sejam específicos para cada doente ou que tenham custos diferenciados consoante o momento ou a urgência com que são realizados. Uma estratégia de aprendizagem sensível aos custos deve também considerar e combinar estes tipos de custos.

Conhecendo de antemão os custos associados aos erros de má classificação, só fará sentido realizar determinados testes se os seus custos não forem superiores aos custos dos erros. Assim, qualquer teste que tenha custo superior aos custos de má classificação não faz sentido que se realize. Por outro lado, se os custos de todos os testes forem inferiores aos custos de má classificação fará sentido que se realizem todos os testes, a menos que existam testes claramente irrelevantes. Estes aspectos devem similarmente ser considerados num estratégia de aprendizagem sensível aos custos.

Na secção seguinte é feita uma revisão ao trabalho feito nesta área da aprendizagem sensível ao custo.