• Nenhum resultado encontrado

O constante aumento da capacidade de processamento computacional e os estudos na área de Interação Humano-Computador (IHC) vêm motivando pesquisadores a tentar identificar aspectos individuais de usuários, em especial relacionados a questão física e emocional, e utilizar essa informação como base para a tomada de decisão, análise de satisfação e comportamento na execução de tarefas (FILHO et al.,2013). De fato, procedimentos de classificação têm ajudado na análise de repostas físicas e emocionais, auxiliando no diagnóstico da depressão, acidentes residenciais, mudança de comportamento, entre outros aspectos, fornecendo a oportunidade para análise em diversos contextos (ALVES,2016).

Pesquisas na área de ML têm gerado métodos que “aprendem” a partir de exemplos, e que podem ser utilizados para extrair padrões para a classificação (DUDA; RICHARD,1973;

2.3. Inteligência Artificial para a classificação do estado físico e emocional 35

ALVES,2016). Tais técnicas de classificação estão cada vez mais sendo aplicadas tanto para análise de aspectos físicos do usuário (OMATU et al.,2009;MAIA et al.,2015;MANO et al.,

2016b;NETO et al.,2019;OLIVEIRA et al.,2018) quanto para a análise de respostas emocio- nais (ØHRN; ROWLAND,2000;CHANEL et al.,2009;ZHOU et al.,2011;GONÇALVES et al.,2013a;RAMAKRISHNAN; EMARY,2013;ALVES,2016). Abaixo segue uma súmula conceitual de alguns algoritmos de classificação utilizados no reconhecimento de padrões dos usuários (ALVES,2016) e exploradas nesta Tese:

∙ Decision or Regression Tree – A Árvore de Decisão (Árv. Dec.) ou regressão, aplicada nos trabalhos deBailenson et al.(2008) ePeter e Urban(2012), utiliza uma árvore para realizar a classificação ou estimar de um valor de um dado teste. Um dos algoritmos mais famosos para gerar essas árvores é o C4.5, cuja árvore cresce a partir de uma abordagem “dividir e conquistar” e é ramificada utilizando o atributo que obtiver o melhor ganho de

informação (DUDA; RICHARD,1973).

∙ Fuzzy Logic - A Lógica Fuzzy, utilizada nos trabalhos deKatsis et al.(2008) e Peter e Urban(2012), é capaz de processar dados incompletos e de prover soluções aproximadas para problemas que outros métodos encontram dificuldades em solucionar (CLARK; NIBLETT,1989;KATSIS et al.,2008).

∙ k-Nearest Neighbor classification (kNN) - Classificação dos k-vizinhos mais próximos. O kNN, utilizado em alguns estudos (BAILENSON et al.,2008;YUAN et al.,2010) para o reconhecimento emocional, é uma abordagem de classificação não-paramétrica, isto é, não assume nenhuma distribuição de probabilidade para os dados a priori. O algoritmo kNN encontra um grupo de k objetos no conjunto de treino que estão mais próximos do objeto de teste e o classifica com a classe predominante dos seus k-vizinhos (FACELI,2011). ∙ Bayesian Networks – A Rede Bayesiana é um modelo de grafo probabilístico, aplicado nos

trabalhos deChanel et al.(2009),Peter e Urban(2012) eRamakrishnan e Emary(2013), e que representa um conjunto de variáveis aleatórias e suas dependências condicionais como um grafo acíclico1 direto (FACELI,2011). Por exemplo, o algoritmo Naive Bayes (N. Bayes) pode representar a relação entre os sintomas e as doenças, isto é, dado os sintomas, pode-se inferir a probabilidade de várias doenças.

∙ Support Vector Machine (SVM) - O algoritmo SVM, utilizados porLittlewort et al.(2011),

Peter e Urban(2012) eRamakrishnan e Emary(2013) para o reconhecimento de emoções, é um dos métodos mais robustos e acurados entre os algoritmos conhecidos. SegundoFa- celi (2011), o objetivo do SVM é encontrar a melhor função para distinguir duas ou mais classes dos dados de treinamento. A garantia da melhor função é atingida, pois o

1 Acíclico - aquilo que não é cíclico, ou seja, sua ocorrência é aleatória, mas pode se prever a sua

algoritmo maximiza a margem entre as classes e oferece melhor habilidade de genera- lização (CLARK; NIBLETT,1989; LITTLEWORT et al.,2011;RAMAKRISHNAN; EMARY,2013).

No entanto, pesquisas recentes (D’MELLO; KORY,2015;PORIA et al.,2017;GON- ÇALVES et al.,2017a;FIORI; VESELY-MAILLEFER,2018) apresentam o conceito de clas- sificação multimodal, isto é, a combinação de respostas de sensores e/ou algoritmos para o reconhecimento de padrões, em particular no reconhecimento de emoções.

A classificação multimodal pode ser visto como a fusão de informações de diferentes modalidades, isto é, o processo de combinar dados coletados de várias modalidades para tarefas de análise e classificação (PORIA et al., 2017), fornecendo informações adicionais com o aumento da precisão do resultado geral (D’MELLO; KORY, 2015). No entanto, como as informações são adquiridas de modalidades diferentes, é necessário considerar o período para a fusão multimodal em diferentes níveis. SegundoPoria et al.(2017), os níveis de fusão mais difundidos são: em nível de característica, em nível de decisão, fusão híbrida e fusão em nível de modelo. Tais níveis de fusão são descritos a seguir:

∙ Nível de característica: realiza a fusão dos recursos extraídos de várias modalidades, como por exemplo recursos visuais, sonoros e textuais, como um vetor geral para a análise. A vantagem da fusão em nível de característica é que a correlação no estágio inicial pode, potencialmente, facilitar a tarefa de classificação. A desvantagem desse processo de fusão é a sincronização de tempo, já que os recursos obtidos pertencem a diversas modalidades e podem descordar em muitos aspectos (ROSAS; MIHALCEA; MORENCY,

2013;SARKAR et al.,2014;PORIA et al.,2015).

∙ Nível de decisão: as características de cada modalidade são tratadas e classificadas, de forma independente, e os resultados são fundidos como um vetor de decisão para obter a decisão final. A vantagem do nível de decisão é que cada modalidade pode utilizar seu melhor classificador ou modelo para aprender suas características. No entanto, como desvantagem, o processo de aprendizagem de todos esses classificadores no estágio de fusão no nível de decisão torna-se custoso computacionalmente, visto o processo de aprendizagem de todos os classificadores no estágio de fusão no nível de decisão (ALAM; RICCARDI,2014;CAI; XIA,2015).

∙ Fusão híbrida: é a combinação dos níveis anteriores (nível de característica e nível de decisão). Este foi proposto na tentativa de explorar as vantagens das estratégias e superar as desvantagens de cada nível (WÖLLMER et al.,2013b;PORIA; CAMBRIA; GELBUKH,

2.4. Considerações finais 37

∙ Nível de modelo: é uma técnica que usa a correlação entre dados observados, em diferentes modalidades, com uma fusão descontraída dos dados, baseada na natureza básica dos métodos e no espaço do problema (METALLINOU et al.,2012;WÖLLMER et al.,2013a).

Considerando os aspectos multidimensionais do espaço semântico deScherer(2005) e a Teoria Componencial das Emoções (SCHERER,2001), o uso da abordagem multimodal faz sentido por considerar a abrangência que o estudo reflete sobre os aspectos físicos e emocionais do indivíduo (SCHERER,2005;MAHLKE; MINGE,2008;XAVIER; GARCIA; NERIS,2012). A Figura16ilustra a classificação multimodal no nível de característica, objeto de estudo desta Tese, para classificação das emoções do usuário considerando múltiplos sensores e Inteligência Artificial.

Figura 3 – Cenário de classificação multimodal da emoção considerando abordagem multimodal no nível de característica.

Fonte:Poria et al.(2015).

Vale salientar, que a abordagem multimodal adotada, não fica limitada ou estática a sensores específicos, podendo ser adicionados outros sensores a estrutura do modelo (linha tracejada da Figura 16), tornando-a dinâmica aos sensores utilizados no monitoramento dos usuários.

2.4

Considerações finais

Neste capítulo, foram abordados os principais conceitos relacionados a esta Tese. Primei- ramente, apresentamos brevemente os conceitos de IoT e sua utilização para prover ambientes

HSH. Em seguida, visto a subjetividade relacionada às emoções, apresentamos conceitos prévios sobre emoções e a Teoria Componencial das Emoções. Por fim, apresentamos, brevemente, os conceitos das abordagens utilizadas para a classificação de aspectos físicos e emocionais do usuário, com ênfase na abordagem multimodal.

39

CAPÍTULO

3

Documentos relacionados