Resultados com classificadores bin´arios - Análise de sentimento em microblogues com base em ca

Com o subconjunto de dados de treino, foi avaliado numa primeira fase o desempenho dos classificadores binários individualmente. Foram utilizadas como features unigramas e bigramas com variação da frequência (igual para ambas). O principal objetivo nesta fase é tentar perceber nos classificadores em experimentação, os melhores resultados em combinação com a utilização do menor número de features, dado que um maior número de features alarga o tamanho do modelo e este aumento de complexidade pode não ser linear. Além disso, um número muito grande de features pode provocar o problema de overfitting ao confundir o classificador com demasiadas features. Nas tabelas abaixo encontram-se os melhores resultados para cada um dos classificadores binários, com a melhor configuração da frequência para feature e da combinação da utilização de unigramas e de unigramas em conjunto com bigramas, que servirá como base

3.6. RESULTADOS COM CLASSIFICADORES BIN ´ARIOS 23

classificador features n2f # features recall f-measure accuracy(%)

SMO unigramas 7 1367 0,72 0,72 72,92

RL unigramas 15 527 0,71 0,71 71,26

NB unigramas + bigramas 2 8 077 0,67 0,67 67,45

Tabela 3.3: Melhores resultados de cada classificador para o <P,O>.

P O classificado como

306 228 P

176 734 O

Tabela 3.4: Matriz de confusão com a execução do SMO.

para exploração dos resultados das arquiteturas de combinação dos classificadores binários. O valor do parâmetro de complexidade nesta fase não foi alterado (valor por defeito é 1).

Classificador <P,O> (Positivo - Outro)

Teve o seu melhor resultado com o classificador SMO, com um resultado muito próximo do RL, com menos de metade do número de features, ambos utilizando apenas unigramas. O NBteve o melhor resultado combinando unigramas e bigramas com uma frequência baixa, com mais de 8 mil features, mas muito abaixo dos anteriores. A Tabela3.3mostra os resultados da melhor execução de cada classificador e a Tabela3.4mostra a respetiva matriz de confusão da melhor execução.

Classificador <N,O> (Negativo - Outro)

Novamente, o classificador SMO obteve o melhor resultado utilizando unigramas. Também com unigramas e com cerca de 30% do número de features o classificador RL ficou a 0,49% do melhor resultado. O NB com unigramas e bigramas ficou a cerca de 3% dos melhores resultados, utilizando um grande número de features comparativamente. A Tabela3.5mostra os resultados de cada classificador e a Tabela3.6a respetiva matriz de confusão da melhor execução.

classificador features n2f # features recall f-measure accuracy(%)

SMO unigramas 6 1669 0,74 0,75 74,52

RL unigramas 13 616 0,74 0,74 74,03

NB unigramas + bigramas 2 8077 0,70 0,71 70,98

24 CAP´ITULO 3. AN ´ALISE DE SENTIMENTO DE TWEETS

N O classificado como

219 233 N

149 843 O

Tabela 3.6: Matriz de confusão da execução do SMO.

classificador features n2f # features recall f-measure accuracy(%)

SMO unigramas 15 527 0,86 0,86 86,36

RL unigramas 20 329 0,85 0,85 85,18

NB unigramas 20 329 0,83 0,83 83,80

Tabela 3.7: Melhores resultados de cada classificador para o <N,N+>.

Classificador <N,N+> (Negativo - Muito Negativo)

Os melhores resultados de cada classificador foram todos obtidos com menos de 600 features. O SMO obteve o melhor resultado, seguido do classificador RL a cerca de 1% e o NB um pouco mais longe, a cerca de 3%. Todos também têm em comum a utilização de unigramas. A Tabela3.7mostra os resultados e a Tabela3.8a matriz de confusão da melhor execução.

Classificador <P,P+> (Positivo - Muito Positivo)

Desta vez com a utilização de unigramas e bigramas o SMO obteve novamente o melhor resultado com menos de 1000 features. O classificador RL fica a cerca de 1%, com menos de metade do número de features, utilizando apenas unigramas. O NB, mais uma vez em último, a cerca de 3% do melhor resultado. A Tabela3.9mostra estes resultados e a Tabela3.10a matriz de confusão da melhor execução.

Classificador <NONE,O> (Sem sentimento - Outro)

Novamente, com unigramas e bigramas, SMO tem o melhor resultado, mas desta vez com execuções próximas por parte dos classificadores NB e RL que ficaram ambos a cerca de 1%. Ao contrário do verificado até aqui, o NB não fica com o pior resultado. A Tabela3.11 mostra

N N+ classificado como

1 192 51 N

166 35 N+

3.6. RESULTADOS COM CLASSIFICADORES BIN ´ARIOS 25

classificador features n2f # features recall f-measure accuracy(%)

SMO unigramas + bigramas 10 922 0,82 0,82 82,20

RL unigramas 17 437 0,81 0,81 81,23

NB unigramas 18 405 0,79 0,79 79,22

Tabela 3.9: Melhores resultados de cada classificador para o <P,P+>.

P P+ classificado como

1 006 140 P

160 138 P+

Tabela 3.10: Matriz de confusão da execução do SMO.

os resultados de cada classificador e a Tabela 3.12 mostra a matriz de confusão da melhor execução.

Classificador <NEU,O> (Neutro - Outro)

Por último, mais uma vez o SMO com o melhor resultado, e por mais uma vez também com a utilização de unigramas e bigramas. O classificador RL com apenas unigramas e cerca de metade do número de features fica a menos de 0,50% do SMO. O NB com perto de 4 mil features, tem o pior resultado, como mostra a Tabela 3.13. A Tabela 3.14 mostra a matriz de confusão para a melhor execução.

O classificador SMO obteve os melhores resultados em todos os classificadores binários. O NBsó por uma vez não obteve o pior resultado do três, que foi no classificador <NONE,O>. Em relação à complexidade dos modelos, o classificador RL apresenta resultados próximos, utilizando consideravelmente menos features, através de números de frequência altos. Este facto reduz bastante o tempo de treino dos modelos.

classificador features n2f # features recall f-measure accuracy(%)

SMO unigramas + bigramas 13 636 0,81 0,81 81,44

NB unigramas 8 1 180 0,80 0,80 80,47

RL unigramas 18 405 0,80 0,80 80,12

26 CAP´ITULO 3. AN ´ALISE DE SENTIMENTO DE TWEETS

NONE O classificado como

148 994 NONE

165 137 O

Tabela 3.12: Matriz de confusão da execução com o NB.

classificador features n2f # features recall f-measure accuracy(%)

SMO unigramas + bigramas 13 636 0,89 0,89 89,20

RL unigramas 20 329 0,89 0,88 88,78

NB unigramas 3 3 770 0,87 0,88 87,60

Tabela 3.13: Melhores resultados de cada classificador para o <NEU,O>.

No documento Análise de sentimento em microblogues com base em cascatas de classificacao (páginas 38-42)