• Nenhum resultado encontrado

Distribui¸ c˜ ao dos tweets no tempo

4.3 Resultados da filtragem com classificador bin´ ario

4.3.3 Distribui¸ c˜ ao dos tweets no tempo

Na presente subsec¸c˜ao s˜ao apresentados dois gr´aficos por doen¸ca, cujos eixos verticais marcam o n´umero de tweets por mˆes. O primeiro apresenta a sobreposi¸c˜ao das curvas de distribui¸c˜ao ao longo do tempo, do conjunto total dos tweets que mencionam a doen¸ca e do conjunto filtrado (ILA). Pretende-se com isto perceber a efic´acia da modalidade de filtragem, a partir de alguns eventos extraordin´arios que acontecem na linha de tempo.

O segundo gr´afico, divide o subconjunto ILA respetivo `a doen¸ca pelos v´arios agrupamentos emocionais e os disp˜oe ao longo do tempo. O objetivo passa por perceber a evolu¸c˜ao e identificar per´ıodos caracter´ısticos. Os agrupamentos de valˆencia neutra, representados anteriormente por escalas se cinzentos, s˜ao aqui reunidos numa ´unica curva a preto, de forma a melhorar a percetibilidade das v´arias curvas, sem com isto se perder informa¸c˜ao, j´a que, como mencionado anteriormente, n˜ao ´e relevante subdividir a valˆencia neutra por v´arios n´ıveis de ativa¸c˜ao. Afinal, como se exprime um sentimento neutro com diferentes intensidades?

Figura 4.2: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam psor´ıase, entre o conjunto total e o conjunto filtrado: tweets identificados como ILA (a vermelho) a partir do classificador bin´ario (ILA vs n˜ao-ILA). Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.2: A curva a preto representa a distribui¸c˜ao de todos os tweets que mencionam psor´ıase ao longo do tempo. A vermelho est´a representada a distribui¸c˜ao temporal dos tweets ILA, que ignora as muitas publica¸c˜oes de grupos pelo Dia Mundial da Psor´ıase com sucesso.

Figura 4.3: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam psor´ıase, identificados como ILA a partir do classificador bin´ario (ILA vs n˜ao-ILA), pelos v´arios quadrantes e fronteiras do referencial emocional adotado. Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.3: Neste gr´afico ´e poss´ıvel observar que um crescimento da curva a vermelho (V-A+) desde o in´ıcio de 2017, chegando `a publica¸c˜ao de 80 tweets por mˆes, enquanto as restantes emo¸c˜oes n˜ao ultrapassam as 20. Agora com maior resolu¸c˜ao, observa-se um pico em Outubro de 2010, provavelmente associado ao Dia Mundial da Psor´ıase, o que indica a n˜ao total resiliˆencia a este evento, por parte do filtro de tweets.

Classifica¸c˜ao de tweets com base em Crowdsourcing

Figura 4.4: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam urtic´aria, entre o conjunto total e o conjunto filtrado: tweets identificados como ILA (a vermelho) a partir do classificador bin´ario (ILA vs n˜ao-ILA). Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.4: A curva vermelha (ILA) parece acompanhar a tendˆencia da curva a preto durante todo o ano de 2018.

Figura 4.5: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam urtic´aria, identificados como ILA a partir do classificador bin´ario (ILA vs n˜ao- ILA), pelos v´arios quadrantes e fronteiras do referencial emocional adotado. Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.5: N˜ao se observa uma tendˆencia suficientemente est´avel na curva a vermelho.

Figura 4.6: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam dermatite at´opica, entre o conjunto total e o conjunto filtrado: tweets identificados como ILA (a vermelho) a partir do classificador bin´ario (ILA vs n˜ao-ILA). Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.6: O pico associado ao programa“Bem Estar”, parece manter-se na curva ILA. Tal se pode explicar porque as pessoas foram motivas a par- tilhar o seu testemunho sobre dermatite at´opica.

Segue-se um exemplo:

Tenho dermatite at´opica e sofri muito bulling na ´epoca da escola por

Figura 4.7: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam dermatite at´opica, identificados como ILA a partir do classificador bin´ario (ILA vs n˜ao-ILA), pelos v´arios quadrantes e fronteiras do referencial emocional adotado. Con- junto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.7: A partir de Setembro de 2017, surgem picos no n´umero de publica¸c˜oes associadas `as emo¸c˜oes negativas de alta intensidade (V-A+).

Figura 4.8: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam vitiligo, entre o conjunto total e o conjunto filtrado: tweets identificados como ILA (a vermelho) a partir do classificador bin´ario (ILA vs n˜ao-ILA). Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.8: Podemos concluir que o classificador ignorou com sucesso o epis´odio de publicidade abusiva.

Figura 4.9: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam vitiligo, identificados como ILA a partir do classificador bin´ario (ILA vs n˜ao-ILA), pelos v´arios quadrantes e fronteiras do referencial emocional adotado. Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.9: Duas observa¸c˜oes podem ser feitas com base neste gr´afico. A primeira, ´e de que ocorre um pico de 300 tweets no mˆes de Mar¸co de 2015, classificado com emo¸c˜ao negativa de m´edia intensidade (V-A0). Uma inspe¸c˜ao ao conjunto de dados permitiu verificar que 270 destes 300 tweets s˜ao semelhantes a:

na verdade sou negra e tenho vitiligo #VoteRuRushers #KCA

Dois erros s˜ao cometidos: em primeiro lugar, estes tweets constituem ru´ıdo, uma vez que citam o pronunciamento de uma personalidade ligada a uma banda de m´usica, que

Classifica¸c˜ao de tweets com base em Crowdsourcing faz uso do sentido figurado; e em segundo lugar, n˜ao transmite uma emo¸c˜ao negativa, sugerindo que a palavra ‘negra’ esteja associada a uma emo¸c˜ao negativa, o que n˜ao ´e admiss´ıvel. Assim se deduz que ambas as tarefas, filtragem e caracteriza¸c˜ao emocional, falharam neste ponto.

A segunda observa¸c˜ao que pode ser feita neste gr´afico, ´e que existe sazonalidade na curva vermelha, alcan¸cando 100 tweets nos meses de Janeiro. No mˆes de Janeiro ´e ver˜ao no Brasil e uma inspe¸c˜ao aos dados revelou a existˆencia de muitos tweets onde o autor compara a renova¸c˜ao da pele decorrente de uma queimadura solar com vitiligo. Por exemplo:

parece que eu tenho vitiligo de tanto q to descascando pqp

Figura 4.10: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam diabetes, entre o conjunto total e o conjunto filtrado: tweets identificados como ILA (a vermelho) a partir do classificador bin´ario (ILA vs n˜ao-ILA). Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.10: 4.11 com melhor resolu¸c˜ao e prevendo a soma das v´arias curvas, que a filtragem foi bem sucedida, ignorando os picos de Novembro.

Figura 4.11: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam diabetes, identificados como ILA a partir do classificador bin´ario (ILA vs n˜ao- ILA), pelos v´arios quadrantes e fronteiras do referencial emocional adotado. Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.11: Desde 2014, o curva a vermelho decorre com certa estabilidade dentro da janela de 300 a 700 tweets por mˆes.

Figura 4.12: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam asma, entre o conjunto total e o conjunto filtrado: tweets identificados como ILA (a vermelho) a partir do classificador bin´ario (ILA vs n˜ao-ILA). Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.12: A curva vermelha comporta-se como uma r´eplica de menor amplitude da curva a negro.

Figura 4.13: Compara¸c˜ao da distribui¸c˜ao do n´umero mensal de tweets que mencionam asma, identificados como ILA a partir do classificador bin´ario (ILA vs n˜ao-ILA), pelos v´arios quadrantes e fronteiras do referencial emocional adotado. Conjunto de treino exclusivo aos dados anotados em crowdsourcing.

Coment´ario - Figura 4.13: A curva vermelha, aqui representativa da emo¸c˜ao nega- tiva de alta intensidade, parece conservar certa oscila¸c˜ao e zonas baixas dentro daqueles meses em que ´e ver˜ao no Brasil: Dezembro a Mar¸co. Ou seja, pela altura do ver˜ao existem menos emo¸c˜oes negativas associadas `a men¸c˜ao da doen¸ca de asma. Fica ent˜ao a quest˜ao se existir´a prevalˆencia de asma no inverno.

Num artigo publicado num site de um hospital brasileiro 3 consta que “com a chegada do inverno crescem o n´umero de casos de asma”, porque com o frio, que por si s´o j´a desen- cadeia crises de asma, h´a uma “maior convivˆencia em locais fechados”, o que “favorece a transmiss˜ao de doen¸cas infecciosas, sobretudo virais, que tamb´em favorecem as crises de asma”. Pode-se ainda confirmar num estudo brasileiro sobre a prevalˆencia de asma: “A sazonalidade dos atendimentos por asma, com maior freq¨uˆencia nos meses de maio, junho e julho (...)” (Ezequiel et al. (2007)).

A an´alise emocional ao longo do tempo revela aqui um ponto forte, permitindo cor- relacionar, at´e certo ponto, zonas altas e baixas da curva de emo¸c˜ao negativa de alta intensidade com epis´odios de crise.

Pode ler-se num tweet datado em Junho de 2018:

Eu amo inverno, mas quando ataca minha asma j´a quero o ver~ao de novo

Vale lembrar que existem v´arios tipos de asma, e casos em que o ver˜ao tamb´em complica a vida dos doentes. Os resultados da an´alise emocional parecem ir ao encontro dos estudos de prevalˆencia de asma no Brasil.