• Nenhum resultado encontrado

5.2 Avalia¸c˜ ao dos Algoritmos de Aprendizado

5.2.1 Modelos de Aprendizado N˜ ao Supervisionado

Na an´alise dos modelos n˜ao supervisionados, s˜ao selecionados os trˆes resultados de maior desempenho para cada algoritmo, dos quais o melhor ´e selecionado e comparado com os

36 demais algoritmos n˜ao supervisionados, a fim de identificar o que gera resultado superior.

K-m´edias

O modelo K-m´edias aloca iterativamente os dados em k agrupamentos `a medida que os centr´oides s˜ao atualizados. Uma vez estabelecidos trˆes n´ıveis de classifica¸c˜ao para os dados, k ´e definido com esse valor. O algortimo k-m´edias, por sua vez, pode ser variado entre “Elkan” e “EM” (maximiza¸c˜ao de expectativas) [24], com inicializa¸c˜ao “k- means ++” ou “aleat´oria”. O algortimo Elkan utiliza a desigualdade do triˆangulo para acelerar o modelo K-m´edias, em compara¸c˜ao com seu formato original, semelhante ao de maximiza¸c˜ao de expectativas. A sua inicializa¸c˜ao se distingue quanto `a forma de sele¸c˜ao inicial dos k agrupamentos, de forma a acelerar, ou n˜ao, a convergˆencia do modelo.

As Figuras 5.2(a), 5.2(b) e 5.2(c) identificam os trˆes melhores resultados do modelo K-m´edias, para os quais a representa¸c˜ao vetorial foi do tipo feature hashing. O resultado Pareto-´otimo ´e aquele que apresenta dominˆancia sobre os demais resultados em rela¸c˜ao `

as m´etricas utilizadas. O resultado mediano indica o que obteve segundo lugar quanto ao desempenho, e o resultado inferior ´e aquele que, dentre os trˆes apresentados, demonstrou pior desempenho.

(a) Resultado Pareto-´otimo. (b) Resultado Mediano. (c) Resultado Inferior.

Figura 5.2: Os trˆes resultados que apresentaram melhor desempenho para o modelo K- m´edias utilizaram a representa¸c˜ao vetorial feature hashing, algoritmo EM com inicializa¸c˜ao k-means ++ e aleat´oria.

Por meio dos gr´aficos, verifica-se que o modelo apresentou baixo desempenho, sendo a maior das m´etricas a de Completude, que mensura a porcentagem dos dados de uma mesma classe, ou n´ıvel de classifica¸c˜ao, que s˜ao designados ao mesmo agrupamento. Se-

guindo a Completude, a V-Measure foi a segunda maior para os trˆes resultados, o que ´e consistente com o fato de que o c´alculo desta m´etrica considera tanto a Completude quanto a Homogeneidade. A Informa¸c˜ao M´utua Ajustada, por sua vez, quantifica o qu˜ao semelhante ´e a informa¸c˜ao presente nos agrupamentos `a informa¸c˜ao presente nas classes verdadeiras e demonstra que apenas aproximadamente 12.5% da informa¸c˜ao ´e semelhante. Por fim, o ´Indice Rand Ajustado verifica que apenas 2.3%, aproximadamente, das clas- sifica¸c˜oes conferidas pelo modelo est˜ao em concordˆancia com as classifica¸c˜oes originais, o que indica baixo desempenho.

Clusteriza¸c˜ao Hier´arquica

O modelo de clusteriza¸c˜ao hier´arquica, que trata os dados como agrupamentos individuais e, ent˜ao, passa a fundi-los iterativamente, possui trˆes parˆametros principais que podem ser variados, assim como o modelo k-m´edias. S˜ao estes: o n´umero final de clusters desejados, o crit´erio de agrupamento e a m´etrica de similaridade usada para isso.

Assim como feito no modelo K-m´edias, o n´umero de clusters tamb´em ´e estabelecido como trˆes em fun¸c˜ao da quantidade de n´ıveis de classifica¸c˜ao previamente determinados. O crit´erio de agrupamento, por sua vez, pode ser do tipo ward, que minimiza a variˆancia dos clusters que est˜ao sendo unidos; do tipo average, que verifica a m´edia das distˆancias para cada uma das observa¸c˜oes de cada dupla de agrupamentos; complete, que utiliza a distˆancia m´axima entre todas as observa¸c˜oes de ambos agrupamentos; e, por fim, single, que verifica a distˆancia m´ınima entre todas as observa¸c˜oes dos clusters em quest˜ao. Uma vez estabelecido o crit´erio de agrupamento, a m´etrica de similaridade pode variar entre euclidiana e cosseno.

As Figuras 5.3(a), 5.3(b) e 5.3(c) mostram os trˆes melhores resultados para este modelo, considerando as poss´ıveis combina¸c˜oes das vari´aveis. Assim como no modelo K- m´edias, a m´etrica mais expressiva foi a de Completude, e a menos expressiva a do ´Indice Rand Ajustado. Esse modelo apresenta desempenho superior ao K-m´edias, por´em, ainda significativamente baixo.

38

(a) Resultado Pareto-´otimo. (b) Resultado Mediano. (c) Resultado Inferior.

Figura 5.3: Os trˆes resultados que apresentaram melhor desempenho para o modelo de Clusteriza¸c˜ao Hier´arquica utilizaram a representa¸c˜ao vetorial feature hashing.

Clusteriza¸c˜ao Espacial Baseada em Densidade de Aplica¸c˜oes com Ru´ıdo O algoritmo DBSCAN identifica regi˜oes de alta densidade para um determinado raio, considerando m´etricas espec´ıficas de distˆancia ou similaridade, e n´umero m´ınimo de pontos para que as regi˜oes sejam consideradas densas (n - samples).

Em vista das poss´ıveis combina¸c˜oes dessas vari´aveis e o custo computacional exi- gido, foram calculados os resultados para os parˆametros dentro dos seguintes limites: 0.1 ≤ Raio ≤ 1.0, 3 ≤ n − samples ≤ 150 e m´etricas de distˆancia: euclidiana, cosseno e manhattan. Diferentemente dos demais modelos n˜ao supervisionados citados, o DBSCAN n˜ao possui parˆametro para identifica¸c˜ao do n´umero de agrupamentos desejado. Assim, o pr´oprio modelo estabelece quantos clusters ser˜ao formados `a medida que ´e treinado, verificando tamb´em poss´ıveis outliers, isto ´e, pontos que n˜ao se encaixam em nenhum dos agrupamentos.

Para essas varia¸c˜oes, os trˆes melhores resultados s˜ao apresentados nas figuras 5.4(a), 5.4(b) e 5.4(c), em que verifica-se que o modelo apresentou baixo desempenho, sendo a maior das m´etricas a de Homogeneidade, que mensura a porcentagem dos dados em um agrupamento que fazem parte das mesmas classes, sendo seu valor aproximadamente de 30%. A Medida-V, em seguida, foi a segunda maior para os trˆes resultados, o que ´e consistente com o fato de que o c´alculo desta m´etrica considera tanto a Homogeneidade quanto a Completude. A Informa¸c˜ao M´utua Ajustada demonstra que apenas aproxima- damente 21% da informa¸c˜ao ´e semelhante. O ´Indice Rand Ajustado, sendo o de menor valor, revela que as classifica¸c˜oes atribu´ıdas pelo modelo apresentam concordˆancia com os

r´otulos originais em torno de apenas 16%.

(a) Resultado Pareto-´otimo. (b) Resultado Mediano. (c) Resultado Inferior.

Figura 5.4: Os trˆes resultados de melhor desempenho para o modelo DBSCAN aplicaram representa¸c˜ao vetorial feature hashing, m´etrica de similaridade do cosseno, o m´ınimo de trˆes amostras para que uma regi˜ao fosse considerada densa e raios de 4.0, 0.3 e 6.0, respectivamente. Al´em disso, o modelo identificou a existˆencia de 48 agrupamentos, no total.

Compara¸c˜ao dos modelos n˜ao supervisionados

Ap´os a an´alise individual dos modelos, ´e poss´ıvel selecionar os melhores resultados de cada um e compar´a-los entre si, a fim de identificar aquele que obteve melhor desempenho.

Observando os gr´aficos 5.2(a), 5.3(a) e 5.4(a) verifica-se que o desempenho de todos os modelos de aprendizado n˜ao supervisionado foi baixo, segundo as m´etricas de avalia¸c˜ao utilizadas, sendo o de melhor desempenho obtido pelo modelo DBSCAN.

Os resultados obtidos para o ´Indice Rand Ajustado em todos os trˆes modelos revela que n˜ao foi poss´ıvel identificar a rela¸c˜ao entre os documentos e os n´ıveis de classifica¸c˜ao. Esta constata¸c˜ao ´e consistente ao considerar que, ao n˜ao incluir as classes no treino dos modelos, existem in´umeras rela¸c˜oes que podem ser identificadas e utilizadas como parˆa- metro de agrupamento, tal qual a extens˜ao dos arquivos, as palavras mais frequentes, os idiomas presentes, entre outros.

5.2.2

Modelos de aprendizado supervisionado

Na an´alise dos modelos supervisionados foi utilizada a fun¸c˜ao GridSearch() da biblioteca Scikit-Learn, que identifica a melhor combina¸c˜ao dos parˆametros para o estimador de

40 forma autom´atica. Assim, para cada t´ecnica de representa¸c˜ao vetorial ´e aplicada a fun- ¸c˜ao GridSearch(), de maneira que os trˆes melhores resultados identificados correspondem `

aqueles gerados para os m´etodos de vetoriza¸c˜ao. Com a sele¸c˜ao da t´ecnica de represen- ta¸c˜ao que favorece o melhor desempenho, os resultados s˜ao comparados com os demais modelos.

Na¨ıve Bayes

O modelo Na¨ıve Bayes se baseia no teorema de Bayes e considera a distribui¸c˜ao de pro- babilidades dos termos. Existem diferentes op¸c˜oes de algoritmos a se considerar, segundo a distribui¸c˜ao de probabilidades. Na¨ıve Bayes Gaussiano, Multinomial, Complementar, Bernoulli e Categ´orico. Uma vez que esta distribui¸c˜ao de probabilidades n˜ao ´e conhecida e devido `a possibilidade de o conjunto de treino e de teste apresentarem valores negativos em fun¸c˜ao da padroniza¸c˜ao realizada previamente, o algoritmo selecionado foi o Na¨ıve Bayes Gaussiano, que aceita eventuais valores menores do que zero, e para o qual n˜ao h´a vari´aveis relevantes a serem iteradas. Observa-se o desempenho do modelo para os diferentes tipos de vetoriza¸c˜ao conforme indicado pelas Figuras 5.5(a), 5.5(b) e 5.5(c).

(a) Bag-of-Words. (b) Tf-idf. (c) Feature Hashing.

Figura 5.5: Os resultados do modelo Na¨ıve Bayes considerando os m´etodos de repre- senta¸c˜ao vetorial distintos. Observa-se que os valores das m´etricas para a vetoriza¸c˜ao Bag-of-Words e Feature Hashing s˜ao bastante pr´oximos.

A partir da an´alise dos gr´aficos verifica-se que para a representa¸c˜ao vetorial tf- idf, os valores das m´etricas de avalia¸c˜ao foram consideravelmente mais baixos do que os das demais representa¸c˜oes. As t´ecnicas bag-of-words e feature hashing apresentaram resultados muito pr´oximos, com o feature hashing sendo levemente superior `a vetoriza¸c˜ao

bag-of-words, para o qual apenas a m´etrica de Jaccard obteve resultado aproximado de 60%, sendo as restantes pr´oximas de 80%.

´

E poss´ıvel ainda examinar a curva ROC gerada para este modelo, com represen- ta¸c˜ao vetorial feature hashing, a fim de verificar a rela¸c˜ao entre as taxas de verdadeiros positivos e falsos positivos. Os n´ıveis de classifica¸c˜ao “P´ublico”, “Uso Interno” e “Confi- dencial” s˜ao representados pelos n´umeros 0, 1 e 2 em todas as curvas ROC presentes nesta se¸c˜ao. Por meio da Figura 5.6 observa-se que o desempenho obtido para os trˆes n´ıveis de classifica¸c˜ao foi muito pr´oximo, e notavelmente alto, evidenciando que este modelo de aprendizado supervisionado entregou resultados excelentes, especialmente considerando que a distribui¸c˜ao de probabilidades ´e desconhecida.

Figura 5.6: Curva ROC do modelo Na¨ıve Bayes considerando a vetoriza¸c˜ao feature hashing. O gr´afico indica as probabilidades dos documentos serem classificados corre- tamente.

Floresta Aleat´oria

Diferentemente do algoritmo Na¨ıve Bayes Gaussiano, este modelo permite a verifica¸c˜ao de alguns parˆametros. As vari´aveis que foram consideradas neste trabalho s˜ao: o n´umero de estimadores, isto ´e, de ´arvores de decis˜ao, o crit´erio de qualidade de uma divis˜ao e o n´umero m´aximo de termos, ou caracter´ısticas, a se considerar para cada divis˜ao.

Para a floresta aleat´oria, o n´umero de estimadores selecionado foi o padr˜ao de 100 ´

arvores. O crit´erio de qualidade da divis˜ao pode ser estabelecido a partir da impureza Gini ou a partir do ganho de informa¸c˜ao. O n´umero m´aximo de caracter´ısticas analisadas

42 varia entre a quantidade original de termos, a raiz quadrada da quantidade de termos ou ainda o logar´ıtmo na base dois do n´umero de caracter´ısticas.

Os gr´aficos das Figuras 5.7(a), 5.7(b) e 5.7(c) mostram o desempenho do mo- delo para os diferentes m´etodos de representa¸c˜ao vetorial, e verifica-se que o algoritmo apresenta um bom desempenho e valores pr´oximos das m´etricas em cada t´ecnica de ve- toriza¸c˜ao. Apesar disso, os resultados para o bag-of-words foram ligeiramente superiores aos demais.

(a) Bag-of-Words. (b) Tf-idf. (c) Feature Hashing.

Figura 5.7: Os resultados do modelo Floresta Aleat´oria considerando os m´etodos de re- presenta¸c˜ao vetorial distintos. O conjunto de parˆametros selecionado teve como crit´erio de qualidade o ganho de informa¸c˜ao e n´umero m´aximo de termos igual `a quantidade origi- nal. Os valores obtidos para representa¸c˜ao tf-idf s˜ao consideravelmente pr´oximos daqueles apresentados pela representa¸c˜ao bag-of-words, sendo, entretanto, ligeiramente inferiores.

Investigando mais profundamente as m´etricas de avalia¸c˜ao para este modelo, o gr´afico 5.7(a) revela que este modelo obteve resultado superior ao Na¨ıve Bayes, com a maioria das m´etricas de avalia¸c˜ao flutuando em torno de 85%, e apenas a m´etrica de Jaccard pr´oxima a 80%.

´

E poss´ıvel ainda analisar a curva ROC para este modelo, verificando a rela¸c˜ao entre as taxas de verdadeiros positivos e falsos negativos, conforme apresentado na Figura 5.8, em que observa-se que, para todos os n´ıveis de classifica¸c˜ao, a probabilidade de um documento aleat´orio ser classificado corretamente ´e superior `a 86%, o que ´e comprovado pela ´area abaixo da curva (AUC). A compara¸c˜ao das curvas na Figura 5.8 com as presentes na Figura 5.6 evidencia que o modelo Floresta Aleat´oria possui maior assertividade do que o anterior.

Figura 5.8: Curva ROC do modelo Floresta Aleat´oria para vetoriza¸c˜ao bag-of-words. Os valores de ´area abaixo da curva (AUC) revelam a assertividade do modelo em suas predi¸c˜oes.

Em ambos os modelos, os melhores resultados s˜ao gerados a partir de m´etodos de representa¸c˜ao vetorial distintos, os quais n˜ao consideram a rela¸c˜ao de importˆancia dos termos para cada documento e para o conjunto, de forma geral, como faz o tf-idf, que seria considerado um tratamento mais refinado ao conjunto de dados e, potencialmente, levaria `a melhores resultados. Por´em, os resultados anteriores n˜ao validam essa suposi¸c˜ao.

k-Vizinhos mais pr´oximos

O modelo de aprendizado K-vizinhos mais pr´oximos trabalha a partir da defini¸c˜ao de um n´umero k de pontos, considerados vizinhos devido `a proximidade, para cada nova observa¸c˜ao, de forma que sua classe ´e definida de acordo com os n´ıveis de classifica¸c˜ao de seus vizinhos.

A instˆancia deste modelo permite varia¸c˜ao quanto aos seguintes parˆametros: n´u- mero k de vizinhos, o peso atribu´ıdo a eles no momento da predi¸c˜ao, o algoritmo, e a m´etrica de distˆancia para escolha dos vizinhos.

Para sele¸c˜ao do n´umero k foi verificado o intervalo de 1 a 35, pois valores muito altos poderiam, porventura, prejudicar a escolha da classe correta para o documento, por incluir maior variedade de classifica¸c˜oes. O peso atribu´ıdo aos vizinhos poderia ser feito de maneira uniforme, isto ´e, todos os vizinhos teriam a mesma influˆencia quanto `a predi¸c˜ao da classe da observa¸c˜ao em quest˜ao, ou o peso poderia ser considerado inverso

44 `

a distˆancia. Assim, vizinhos mais pr´oximos teriam maior influˆencia na predi¸c˜ao do que os mais afastados. Os algoritmos, por sua vez, poderiam variar entre: Ball Tree, KD Tree, brute-force, e auto, que decidiria o melhor algoritmo conforme o treinamento da instˆancia. As m´etricas de distˆancia consideradas, por fim, foram Euclidiana, Manhattan e Minkowski.

As Figuras 5.9(a), 5.9(b) e 5.9(c) mostram os resultados deste modelo para as diferentes formas de representa¸c˜ao vetorial, os quais apresentam melhor desempenho para o algoritmo auto, e m´etrica Manhattan, divergindo apenas quanto ao n´umero de vizinhos e seus pesos.

(a) Bag-of-Words. (b) Tf-idf. (c) Feature Hashing.

Figura 5.9: Os resultados do modelo k-Vizinhos mais pr´oximos considerando os m´etodos de vetoriza¸c˜ao distintos. Para a representa¸c˜ao bag-of-words e tf-idf, o n´umero de vizinhos selecionado pela fun¸c˜ao GridSearch() ´e igual a um, e de peso uniforme. Para a vetoriza¸c˜ao feature hashing, contudo, s˜ao considerados 34 vizinhos, cujos pesos s˜ao inversos `a distˆancia. A verifica¸c˜ao dos gr´aficos na Figura 5.9 indica que os valores das m´etricas para os trˆes resultados s˜ao muito pr´oximos, sendo o melhor deles o modelo de representa¸c˜ao bag-of-words, que supera os demais por uma diferen¸ca da ordem de grandeza de 10−2.

A curva ROC apresentada na Figura 5.10 considera a vetoriza¸c˜ao bag-of-words e revela que os resultados obtidos s˜ao inferiores aos dos modelos anteriores, Na¨ıve Bayes e Floresta Aleat´oria.

Figura 5.10: Curva ROC do modelo K-vizinhos mais pr´oximos para vetoriza¸c˜ao bag-of- words. Os valores observados para a ´area abaixo da curva (AUC) de cada classe indicam menor probabilidade de os documento serem classificados corretamente do que os modelos anteriores.

M´aquinas de Vetor Suporte

O modelo de m´aquinas de vetor suporte opera por meio da defini¸c˜ao de hiperplanos que segregam as diferentes classes observadas, buscando maximizar a distˆancia entre elas. Este modelo ´e normalmente utilizado para casos de classes bin´arias, por´em, pode ser adaptado para acomodar um n´umero maior de classes, como ´e o caso.

As vari´aveis consideradas para as combina¸c˜oes s˜ao o parˆametro de regulariza¸c˜ao C, a fun¸c˜ao de perda e a estrat´egia para m´ultiplas classes. O parˆametro C poderia assumir os seguintes valores: [0.1, 1.0, 10.0, 100.0, 1000.0], cujo valor padr˜ao ´e 1.0. A fun¸c˜ao de perda pode ser do tipo Perda Hinge, ou perda de articula¸c˜ao, ou Perda Squared Hinge. A estrat´egia para m´ultiplas classes pode ser One-vs-Rest, onde s˜ao treinados n classificadores, em que n ´e o n´umero de r´otulos; ou pode ser Crammer Singer, nomeada conforme seus autores, que reduz o custo de mem´oria e tempo de treinamento.

As Figuras 5.11(a), 5.11(b) e 5.11(c) apresentam os resultados deste modelo de acordo com a representa¸c˜ao vetorial aplicada, em que ´e facilmente verificado que o melhor resultado ´e obtido para a t´ecnica de representa¸c˜ao vetorial feature hashing, cuja maioria das m´etricas apresenta valores em torno de 80%. A curva ROC para este m´etodo de vetoriza¸c˜ao, mostrada na Figura 5.12, indica como menor probabilidade de classifica¸c˜ao

46 correta aquela referente `a classe de “Uso Interno”, pr´oxima de 84%. Todavia, comparando- a com a figura 5.8, comprova-se que seu resultado ainda ´e superior ao do modelo SVM que, contudo, apresentou desempenho consideravelmente alto.

(a) Bag-of-Words. (b) Tf-idf. (c) Feature Hashing.

Figura 5.11: Os resultados do modelo SVM considerando os m´etodos de vetoriza¸c˜ao distintos. Para os trˆes modelos, o valor de C e a estr´ategia para m´ultiplas classes foram 0.1 e One-vs-Rest, respectivamente. Divergindo apenas na fun¸c˜ao de perda, a qual foi estabelecida como Hinge para os dois primeiros resultados e como Squared Hinge para o ´

ultimo.

Figura 5.12: Curva ROC do modelo SVM para representa¸c˜ao vetorial feature hashing, em que observa-se como menor probabilidade de atribui¸c˜ao de classe correta o valor de 84%.

Compara¸c˜ao dos Modelos Supervisionados

As Figuras 5.5(c), 5.7(a), 5.9(a) e 5.11(c) indicam os melhores resultados observados para cada um dos modelos de aprendizado supervisionado. Comparando-os com base nas m´etricas de avalia¸c˜ao, verifica-se que nenhum dos modelos obteve valores superiores `a 90%. Entretanto, o modelo de Floresta Aleat´oria apresentou melhor desempenho, com valores de 89,29%, aproximadamente, para todas as m´etricas com exce¸c˜ao da de Jaccard, para a qual obteve o valor pr´oximo a 80.65%. Dessa forma, de todos os modelos de aprendizado supervisionado, o que apresentou melhor desempenho foi o modelo Floresta Aleat´oria para representa¸c˜ao bag-of-words.

5.2.3

Compara¸c˜ao dos Modelos N˜ao Supervisionados e Super-

visionados

Uma vez identificados os modelos que obtiveram melhor resultado considerando as respec- tivas m´etricas e os tipos de aprendizado, ´e poss´ıvel realizar a compara¸c˜ao entre estes dois modelos ap´os aplica¸c˜ao de tratamento devido. Para isso, ´e feito um estudo de propor¸c˜oes do modelo n˜ao supervisionado quanto `a rela¸c˜ao de abrangˆencia dos agrupamentos. Con- siderando o modelo DBSCAN, que apresentou melhor desempenho entre os modelos de aprendizado n˜ao supervisionado, foram identificados 48 agrupamentos. Dessa forma, os 16 agrupamentos mais populosos foram categorizados como sendo pertencentes `a classe X, os 16 clusters intermedi´arios como integrantes da classe Y, e os ´ultimos 16 pertencentes `

a classe Z. Tomando-se os n´ıveis de classifica¸c˜ao originais, foi realizada uma equivalˆencia quanto a sua propor¸c˜ao em rela¸c˜ao a quantidade de documentos pertencentes a cada n´ı- vel, e as classes X, Y e Z foram ent˜ao nomeadas de acordo com as originais p´ublico, uso interno e confidencial.

Assim, foram ent˜ao aplicadas ao novo modelo DBSCAN as mesmas m´etricas de avalia¸c˜ao dos modelos supervisionados, de forma a compar´a-los apropriadamente. A figura 5.13, sem intervalo de confian¸ca devido `a utiliza¸c˜ao total do conjunto de dados, revela que este modelo apresenta desempenho inferior a 8% para todas as m´etricas. Portanto, seus resultados se mostram ´ınfimos quando comparados aos valores alcan¸cados pelos modelo supervisionados. Deste modo, o modelo floresta aleat´oria ´e identificado como o mais apropriado para categorizar os documentos do estudo em quest˜ao.

48

Figura 5.13: Avalia¸c˜ao do modelo DBSCAN segundo as m´etricas de avalia¸c˜ao dos modelos de aprendizado supervisionado

Cap´ıtulo 6

Conclus˜ao

Com a proposta de avaliar modelos de aprendizado n˜ao supervisionados e supervisionados no contexto de uma empresa cujas atividades di´arias envolvem tratamento de dados sens´ı- veis, buscava-se identificar qual modelo melhor atende tal cen´ario, atribuindo classifica¸c˜oes assertivas aos documentos considerados.

O estudo sobre o conjunto de dados indicou sua variedade em diversos aspectos,

Documentos relacionados