poder´a resolver problemas quando os dados n˜ao s˜ao linearmente separ´aveis, e quando a SVM de margens suaves n˜ao produzirem resultados satisfat´orios.
2.4
Kernels
As SVMs tamb´em lidam com problemas n˜ao lineares, ou seja, ´e poss´ıvel fazer um mapeamento no espa¸co original dos dados de treinamento, chamando de espa¸co de en- tradas, para um espa¸co de dimens˜ao maior chamado de espa¸co de caracter´ısticas. Esse mapeamento pode ser expresso da seguinte forma, seja Φ : X −→ ℑ um mapeamento, em que X denota o espa¸co de entradas e ℑ o espa¸co de caracter´ısticas. A escolha apro- priada para Φ pode fazer com que os dados de treinamento possam ser linearmente separ´aveis. Como ilustra¸c˜ao, foram utilizados os dados da Figura 2.6 que est˜ao no R2,
atrav´es das vari´aveis x1 e x2, no qual ´e poss´ıvel realizar uma transforma¸c˜ao para o R3
com a fun¸c˜ao,
Φ(x) = (x21, x1x2, x22).
Com isso, a equa¸c˜ao em (2.1) do hiperplano ´e da forma, f (x) = w′Φ(x) + b = 0
f (x) = w1x21+ w2x1x2+ w3x22+ b = 0.
Com esse novo espa¸co, pode-se aplicar a SVM linear proposta por Vapnik (1995). Observe na Figura 2.7, os dados agora s˜ao linearmente separ´aveis, com isso, a taxa de acerto que antes era de 68,96% agora ´e de 100%.
A ideia dessa metodologia ´e aplicar uma fun¸c˜ao n˜ao linear φ nas vari´aveis que est˜ao no espa¸co de entradas, tornando uma dimens˜ao maior no espa¸co de caracter´ısticas, e ap´os isso, utilizar a SVM linear. ´E interessante utilizar a SVM com margens suaves, pois apesar das transforma¸c˜oes entre os espa¸cos, ainda podem existir dados com algum tipo de ru´ıdo. Um Kernel K ´e uma fun¸c˜ao que recebe 2 argumentos xi e xj no espa¸co
2.4 Kernels 18 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Grupo 1 Grupo 2 IVS
Figura 2.7: Dados linearmente separ´aveis no espa¸co de caracter´ısticas. de entrada, e computa o produto φ(x′
i)φ(xj) no espa¸co de caracter´ıstica, ou seja,
K(x′i, xj) = φ(x′i)φ(xj). (2.26)
Como foi mostrado no exemplo anteriormente, o Kernel ´e utilizado para construir um hiperplano ´otimo no espa¸co de caracter´ıstica. A fun¸c˜ao dual para o problema de otimiza¸c˜ao com a utiliza¸c˜ao de uma fun¸c˜ao Kernel ´e dada por,
LD = n X i=1 αi− 1 2 n X j=1 n X i=1 αiαjyiyjK(x′i, xj) (2.27)
sob as restri¸c˜oes em (2.11). Observe que, se φ ´e a fun¸c˜ao identidade em (2.26), logo K(x′
i, xj) = x′ixj, dando origem ao Kernel linear, consequentemente, (2.27) torna-se
igual a (2.22).
Segundo Lorena e Carvalho (2003), as fun¸c˜oes Kernels s˜ao muito ´uteis por causa da simplicidade do seu c´alculo e sua capacidade de representar espa¸cos abstratos. En- tretanto, para que uma fun¸c˜ao possa ser um Kernel e garanta a convexidade para a otimiza¸c˜ao, ´e necess´ario atender algumas condi¸c˜oes estabelecidas pelo Teorema de Mercer, ver Cristianini e Shawe-Taylor (2000). Na Tabela 2.1 est˜ao alguns exemplos dos Kernels mais utilizados (CRISTIANINI; SHAWE-TAYLOR, 2000). Note que o Kernel Linear ´e um caso particular do Polinomial quando k = 0, δ = 1 e d = 1.
´
2.4 Kernels 19
Tabela 2.1: Exemplos de algumas fun¸c˜oes Kernel. Tipo de Kernel Fun¸c˜ao K(x′
i, xj) correspondente Parˆametros
Polinomial [δ(x′
ixj) + k]d δ, k e d
Gaussiano ou Radial exp {−σ||xi− xj||2} σ
Sigmoide tanh [γ(x′
ixj) + λ] γ e λ
ou seja, o problema deixa de ser bin´ario, e se tˆem mais grupos para classificar, algumas metodologias de como fazer o treinamento e a classifica¸c˜ao em problemas como esses, s˜ao descritos em Thome (2012).
O software utilizado no presente trabalho para fazer todos os c´alculos de hiperplanos e gr´aficos, foi o software R 3.1.3 ver R Core Team (2015). Segue abaixo um modelo b´asico de como utilizar a SVM no R.
Programa¸c~ao em R. Pacote: kernlab.
Comandos b´asicos para utiliza¸c~ao da SVM: install.packages("kernlab") # baixar o pacote library("kernlab") # Carregar o pacote
ksvm(x, y, type = "C-svc", kernel = rbfdot(), C = 1) x - dados.
y - r´otulos.
type - indica o tipo da SVM, que por default ´e para classifica¸c~ao ("C-svc").
kernel - Kernel utilizado. Tem como padr~ao o Kernel Gaussiano, e podem
ser utilizados outros tipos de Kernels. Para mais detalhes sobre os ti- pos de Kernel que podem ser utilizados, basta usar o comando ?ksvm. C - o custo da penaliza¸c~ao da soma dos erros.
Cap´ıtulo 3
Eletroencefalografia e
Eletromiografia
Neste cap´ıtulo ser˜ao introduzidos alguns conceitos t´ecnicos sobre a maneira de como os dados s˜ao coletados atrav´es da EEG e EMG, juntamente com os experimentos rea- lizados para a obten¸c˜ao dos dados utilizados no presente trabalho.
3.1
Coleta de dados de EEG
O EEG ´e um exame que permite o estudo do registro das correntes el´etricas es- pontˆaneas emitidas pelo c´erebro captadas atrav´es de receptores chamados de eletrodos (LAGE, 2013). O EEG pode ser um m´etodo n˜ao invasivo, ou seja, os eletrodos s˜ao colocados sobre a cabe¸ca do indiv´ıduo, como mostra a Figura 3.1. No m´etodo invasivo, os eletrodos s˜ao colocados dentro do crˆanio do indiv´ıduo sobre o c´ortex cerebral.
Figura 3.1: Touca com eletrodos em uma pessoa. Fonte: Biosemi Systems.
3.1 Coleta de dados de EEG 21 A EEG ´e muito utilizada para identificar doen¸cas psicol´ogicas como a epilepsia, ou ainda, avalia¸c˜ao do coma, morte encef´alica, estresse p´os-traum´atico e at´e emo¸c˜oes humanas. Para gerar dados de EEG, ´e preciso realizar algum tipo de est´ımulo no indiv´ıduo, como por exemplo: imagens emotivas para avaliar as emo¸c˜oes, ou fazer com que o indiv´ıduo realize atividades no c´erebro como as dire¸c˜oes direita e esquerda, dependendo do objetivo do pesquisador. Ap´os o est´ımulo, os sinais s˜ao captados pelos eletrodos e ´e feita uma filtragem para eliminar ru´ıdos. Os sinais s˜ao medidos ao longo do tempo, mais especificamente em segundos, tornando o dado obtido em uma s´erie temporal. ´E importante ressaltar que, cada est´ımulo feito geram v´arios sinais, pois dependem do n´umero de eletrodos, ou seja, cada eletrodo gera um sinal. Existem v´arios tipos de touca com quantidade de eletrodos diferentes, como no Biosemi Systems (BIOSEMI, 20–). Nesse sistema existem toucas com 16, 32, 64 e 128 eletrodos dentre outras quantidades.
3.1.1
Dados de Est´ımulos Visuais
Os dados utilizados no presente trabalho foram os mesmos usados por Coutinho (2010), os dados foram coletados atrav´es de EEG pelo m´etodo n˜ao invasivo, utilizando uma touca com 128 eletrodos em um indiv´ıduo. Foram selecionados um conjunto de 10 imagens (ver Figura 3.2) em que cada imagem foi mostrada 4 vezes ao longo de 5 segundos em uma ordem aleat´oria. Ap´os a filtragem dos sinais, cada eletrodo possui um total de 164 pontos para cada est´ımulo feito. Com isso, um dos objetivos do trabalho ´e classificar corretamente os sinais produzidos pelo experimento.
Figura 3.2: Imagens utilizadas no experimento feito na The University of Texas - El Paso - UTEP.
3.1 Coleta de dados de EEG 22 palavra “imagem”, denotar´a as imagens da Figura 3.2 em que, a ordem das imagens por linha ser˜ao os pr´oprios nomes, respectivamente.
Como ilustra¸c˜ao, observe a Figura 3.3, com os sinais da primeira repeti¸c˜ao dos eletrodos 1 (a) e 2 (b) para as imagens 1 e 2.
(a) Tempo 0 50 100 150 −15 −10 −5 0 5 10 15 Imagem 1 Imagem 2 (b) Tempo 0 50 100 150 −15 −10 −5 0 5 10 15 Imagem 1 Imagem 2
Figura 3.3: Ilustra¸c˜ao dos dados das imagens 1 e 2 para os eletrodos 1 e 2.
3.1.2
Dados de Epilepsia
Uma outra aplica¸c˜ao que ser´a realizada s˜ao com dados de pacientes com e sem epi- lepsia. Esses dados est˜ao dispon´ıveis publicamente em EEG (20–) e para mais detalhes ver Andrzejak et al. (2001). Os objetivos do experimento eram comparar propriedades dinˆamicas de atividade el´etrica cerebral, em diferentes regi˜oes de grava¸c˜ao de diferentes estados cerebrais fisiol´ogicos e patol´ogicos. A base de dados ´e composta por 5 bancos (A-E) captados atrav´es de 100 canais diferentes. Os bancos A e B consistem em seg-
3.2 Coleta de dados de EMG 23