• Nenhum resultado encontrado

Aprendizagem autom ´atica

Estado da arte

2.5 Aprendizagem autom ´atica

A aprendizagem autom ´atica, como um ramo da intelig ˆencia artificial, tem vindo a desempenhar um papel cada vez mais importante na investigac¸ ˜ao cient´ıfica nos ´ultimos anos. Foi descrita por Arthur Samuel, como o campo de estudo que d ´a aos computadores a capacidade de aprender sem ser expli-citamente programados [51].

Os algoritmos de aprendizagem podem ser divididos em v ´arios tipos de modelos de acordo com as caracter´ısticas do problema em quest ˜ao.

A aprendizagem supervisionada consiste num algoritmo que gera uma func¸ ˜ao para relacionar deter-minadas caracter´ısticas de um conjunto de dados com uma sa´ıda desejada. ´E constru´ıdo um modelo a partir de conjuntos de dados com o objetivo de fazer previs ˜oes em novos dados. Os algoritmos su-pervisionados podem ser subdivididos em problemas de classificac¸ ˜ao e regress ˜ao. Por um lado, nos

problemas de classificac¸ ˜ao o objetivo ´e atribuir um resultado de entre um conjunto de categorias, como por exemplo stressou calmo. Por outro lado, a regress ˜ao tem como sa´ıda final um valor num ´erico e n ˜ao uma categoria.

Em contrapartida, na aprendizagem n ˜ao supervisionada, o modelo a utilizar n ˜ao tem resultados pre-definidos como refer ˆencia para aprender. Por consequ ˆencia, a aprendizagem ´e focada em encontrar semelhanc¸as nos dados em an ´alise e agrup ´a-los com base nas mesmas. Os algoritmos n ˜ao super-visionados podem ser subdivididos em problemas declustering e de associac¸ ˜ao. Relativamente aos primeiros, estes s ˜ao utilizados quando se pretende conjuntos distintos de dados. Nos algoritmos de associac¸ ˜ao, conforme o nome indica, pretende-se revelar associac¸ ˜oes em grandes conjuntos de dados, um exemplo comum deste sistema ´e a an ´alise das vendas para encontrar a melhor forma de colocar artigos numa loja.

Atrav ´es de uma combinac¸ ˜ao de ambas surge a semi-supervisionada, onde apenas alguns dos da-dos t ˆem os seus dada-dos de sa´ıda identificada-dos. Esta combinac¸ ˜ao tem, por norma, a quantidade de dados identificados bastante reduzida comparativamente aos n ˜ao identificados. Esta forma de aprendi-zagem pode ser ´util na medida em que o processamento de grandes quantidades de dados, no caso da aprendizagem supervisionada, pode ser bastante dispendioso ao n´ıvel de recursos de processamento e de tempo. Desta forma, atrav ´es da aprendizagem semi-supervisionada, poupa-se recursos e, para al ´em disso, est ´a menos sujeito aooverfiting[52].

2.5.1 Interpretabilidade

A gest ˜ao da sociedade era feita unicamente por seres humanos, no entanto isso pode vir a mudar.

Quando nos candidat ´avamos a um emprego ou empr ´estimo, o resultado final dessa candidatura era dado por uma pessoa. Se fossemos para um hospital, um m ´edico tentaria categorizar a nossa doenc¸a e recomendar o tratamento mais adequado. Para decis ˜oes como estas, h ´a uma explicac¸ ˜ao para a decis ˜ao tomada.

Se um pedido de empr ´estimo for recusado, por exemplo, ´e poss´ıvel compreender o racioc´ınio de quem tomou essa decis ˜ao para que numa pr ´oxima candidatura se possa preencher os requisitos ne-cess ´arios. Para al ´em disso, se a decis ˜ao for mal tomada, pode ser contestada podendo levar `a anulac¸ ˜ao da mesma. No hospital, a explicac¸ ˜ao de um m ´edico elucida-nos sobre a nossa condic¸ ˜ao.

Em contextos sociais, as raz ˜oes para uma decis ˜ao muitas vezes interessam. Por exemplo, causar intencionalmente a morte, comparativamente a involuntariamente, s ˜ao crimes distintos. No entanto, muitos dos modelos preditivos atuais n ˜ao s ˜ao interpret ´aveis, tornando imposs´ıvel explicar a tomada de decis ˜ao final [53].

Os modelos de aprendizagem autom ´atica t ˆem sido utilizados como uma ferramenta de soluc¸ ˜ao de problemas num grande espetro de ´areas cient´ıficas e da sociedade. No ramo da sa ´ude, surge o

conceito de interpretabilidade a par destes modelos.

Apesar desta ferramenta j ´a ter provado ser ´util na ´area da sa ´ude, a interpretabilidade dos modelos, por vezes, pode ser um impedimento para uma maior adoc¸ ˜ao da aprendizagem autom ´atica em ambi-entes reais. Nesta ´area, apenas um alto desempenho das m ´etricas de validac¸ ˜ao dos modelos n ˜ao ´e o suficiente para que haja confianc¸a numa decis ˜ao que ´e feita por uma m ´aquina, visto que esta pode ter implicac¸ ˜oes diretas na sa ´ude de uma pessoa. Posto isto, h ´a que ser balanceada a interpretabilidade com o desempenho dos modelos de forma a obter o melhor desempenho, cumprindo os requisitos m´ınimos de interpretabilidade. Esta tarefa torna-se dif´ıcil devido `a relac¸ ˜ao entre este dois objetivos que, tal como se pode observar na figura2.4, quanto maior a exatid ˜ao, menor ´e a interpretabilidade [54].

Figura 2.4:Relac¸ ˜ao entre interpretabilidade e exatid ˜ao [54].

2.5.2 Selec¸ ˜ao de caracter´ısticas

A selec¸ ˜ao de caracter´ısticas, como uma estrat ´egia de pr ´e-processamento de dados, ´e uma forma eficaz e eficiente na preparac¸ ˜ao de dados (especialmente, dados de grande dimens ˜ao) para diversos conjuntos de dados e problemas de aprendizagem autom ´atica. O objetivo da selec¸ ˜ao de caracter´ısticas s ˜ao a construc¸ ˜ao de modelos mais simples e compreens´ıveis, bem como, tornar os dados mais limpos, melhorando o desempenho dos modelos de aprendizagem [55].

A selec¸ ˜ao das caracter´ısticas deve ser distinguida da extrac¸ ˜ao de caracter´ısticas. Embora ambas as t ´ecnicas sejam utilizadas para reduzir o n ´umero de caracter´ısticas de um conjunto de dados, a extrac¸ ˜ao de caracter´ısticas ´e uma t ´ecnica de reduc¸ ˜ao na dimensionalidade que cria novas combinac¸ ˜oes de atributos, enquanto a selec¸ ˜ao de caracter´ısticas inclui e exclui os atributos que est ˜ao presentes nos dados sem os alterar [56]. As t ´ecnicas de selec¸ ˜ao de caracter´ısticas s ˜ao utilizadas principalmente quando a interpretabilidade do modelo ´e um requisito fundamental.

Documentos relacionados