Kernels - Classificador máquina de suporte vetorial com análise de Fourier aplicada em dados de

poderá resolver problemas quando os dados não são linearmente separáveis, e quando a SVM de margens suaves não produzirem resultados satisfatórios.

2.4 Kernels

As SVMs também lidam com problemas não lineares, ou seja, é poss´ıvel fazer um mapeamento no espa¸co original dos dados de treinamento, chamando de espa¸co de entradas, para um espa¸co de dimensão maior chamado de espa¸co de caracter´ısticas. Esse mapeamento pode ser expresso da seguinte forma, seja Φ : X −→ ℑ um mapeamento, em que X denota o espa¸co de entradas e ℑ o espa¸co de caracter´ısticas. A escolha apro- priada para Φ pode fazer com que os dados de treinamento possam ser linearmente separáveis. Como ilustra¸cão, foram utilizados os dados da Figura 2.6 que estão no R2_,

através das variáveis x1 e x2, no qual é poss´ıvel realizar uma transforma¸cão para o R3

com a fun¸c˜ao,

Φ(x) = (x2₁, x1x2, x22).

Com isso, a equa¸c˜ao em (2.1) do hiperplano ´e da forma, f (x) = w′Φ(x) + b = 0

f (x) = w1x21+ w2x1x2+ w3x22+ b = 0.

Com esse novo espa¸co, pode-se aplicar a SVM linear proposta por Vapnik (1995). Observe na Figura 2.7, os dados agora são linearmente separáveis, com isso, a taxa de acerto que antes era de 68,96% agora é de 100%.

A ideia dessa metodologia é aplicar uma fun¸cão não linear φ nas variáveis que estão no espa¸co de entradas, tornando uma dimensão maior no espa¸co de caracter´ısticas, e após isso, utilizar a SVM linear. É interessante utilizar a SVM com margens suaves, pois apesar das transforma¸cões entre os espa¸cos, ainda podem existir dados com algum tipo de ru´ıdo. Um Kernel K é uma fun¸cão que recebe 2 argumentos xi e xj no espa¸co

2.4 Kernels 18 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Grupo 1 Grupo 2 IVS

Figura 2.7: Dados linearmente separ´aveis no espa¸co de caracter´ısticas. de entrada, e computa o produto φ(x′

i)φ(xj) no espa¸co de caracter´ıstica, ou seja,

K(x′_i, xj) = φ(x′i)φ(xj). (2.26)

Como foi mostrado no exemplo anteriormente, o Kernel é utilizado para construir um hiperplano ótimo no espa¸co de caracter´ıstica. A fun¸cão dual para o problema de otimiza¸cão com a utiliza¸cão de uma fun¸cão Kernel é dada por,

LD = n X i=1 αi− 1 2 n X j=1 n X i=1 αiαjyiyjK(x′i, xj) (2.27)

sob as restri¸cões em (2.11). Observe que, se φ é a fun¸cão identidade em (2.26), logo K(x′

i, xj) = x′ixj, dando origem ao Kernel linear, consequentemente, (2.27) torna-se

igual a (2.22).

Segundo Lorena e Carvalho (2003), as fun¸cões Kernels são muito úteis por causa da simplicidade do seu cálculo e sua capacidade de representar espa¸cos abstratos. En- tretanto, para que uma fun¸cão possa ser um Kernel e garanta a convexidade para a otimiza¸cão, é necessário atender algumas condi¸cões estabelecidas pelo Teorema de Mercer, ver Cristianini e Shawe-Taylor (2000). Na Tabela 2.1 estão alguns exemplos dos Kernels mais utilizados (CRISTIANINI; SHAWE-TAYLOR, 2000). Note que o Kernel Linear é um caso particular do Polinomial quando k = 0, δ = 1 e d = 1.

2.4 Kernels 19

Tabela 2.1: Exemplos de algumas fun¸c˜oes Kernel. Tipo de Kernel Fun¸c˜ao K(x′

i, xj) correspondente Parˆametros

Polinomial [δ(x′

ixj) + k]d δ, k e d

Gaussiano ou Radial _{exp {−σ||x}i− xj||2} σ

Sigmoide tanh [γ(x′

ixj) + λ] γ e λ

ou seja, o problema deixa de ser binário, e se têm mais grupos para classificar, algumas metodologias de como fazer o treinamento e a classifica¸cão em problemas como esses, são descritos em Thome (2012).

O software utilizado no presente trabalho para fazer todos os cálculos de hiperplanos e gráficos, foi o software R 3.1.3 ver R Core Team (2015). Segue abaixo um modelo básico de como utilizar a SVM no R.

Programa¸c~ao em R. Pacote: kernlab.

Comandos b´asicos para utiliza¸c~ao da SVM: install.packages("kernlab") # baixar o pacote library("kernlab") # Carregar o pacote

ksvm(x, y, type = "C-svc", kernel = rbfdot(), C = 1) x - dados.

y - r´otulos.

type - indica o tipo da SVM, que por default ´e para classifica¸c~ao ("C-svc").

kernel - Kernel utilizado. Tem como padr~ao o Kernel Gaussiano, e podem

ser utilizados outros tipos de Kernels. Para mais detalhes sobre os tipos de Kernel que podem ser utilizados, basta usar o comando ?ksvm. C - o custo da penaliza¸c~ao da soma dos erros.

Cap´ıtulo 3

Eletroencefalografia e

Eletromiografia

Neste cap´ıtulo serão introduzidos alguns conceitos técnicos sobre a maneira de como os dados são coletados através da EEG e EMG, juntamente com os experimentos rea- lizados para a obten¸cão dos dados utilizados no presente trabalho.

3.1 Coleta de dados de EEG

O EEG é um exame que permite o estudo do registro das correntes elétricas es- pontâneas emitidas pelo cérebro captadas através de receptores chamados de eletrodos (LAGE, 2013). O EEG pode ser um método não invasivo, ou seja, os eletrodos são colocados sobre a cabe¸ca do indiv´ıduo, como mostra a Figura 3.1. No método invasivo, os eletrodos são colocados dentro do crânio do indiv´ıduo sobre o córtex cerebral.

Figura 3.1: Touca com eletrodos em uma pessoa. Fonte: Biosemi Systems.

3.1 Coleta de dados de EEG 21 A EEG é muito utilizada para identificar doen¸cas psicológicas como a epilepsia, ou ainda, avalia¸cão do coma, morte encefálica, estresse pós-traumático e até emo¸cões humanas. Para gerar dados de EEG, é preciso realizar algum tipo de est´ımulo no indiv´ıduo, como por exemplo: imagens emotivas para avaliar as emo¸cões, ou fazer com que o indiv´ıduo realize atividades no cérebro como as dire¸cões direita e esquerda, dependendo do objetivo do pesquisador. Após o est´ımulo, os sinais são captados pelos eletrodos e é feita uma filtragem para eliminar ru´ıdos. Os sinais são medidos ao longo do tempo, mais especificamente em segundos, tornando o dado obtido em uma série temporal. É importante ressaltar que, cada est´ımulo feito geram vários sinais, pois dependem do número de eletrodos, ou seja, cada eletrodo gera um sinal. Existem vários tipos de touca com quantidade de eletrodos diferentes, como no Biosemi Systems (BIOSEMI, 20–). Nesse sistema existem toucas com 16, 32, 64 e 128 eletrodos dentre outras quantidades.

3.1.1 Dados de Est´ımulos Visuais

Os dados utilizados no presente trabalho foram os mesmos usados por Coutinho (2010), os dados foram coletados através de EEG pelo método não invasivo, utilizando uma touca com 128 eletrodos em um indiv´ıduo. Foram selecionados um conjunto de 10 imagens (ver Figura 3.2) em que cada imagem foi mostrada 4 vezes ao longo de 5 segundos em uma ordem aleatória. Após a filtragem dos sinais, cada eletrodo possui um total de 164 pontos para cada est´ımulo feito. Com isso, um dos objetivos do trabalho é classificar corretamente os sinais produzidos pelo experimento.

Figura 3.2: Imagens utilizadas no experimento feito na The University of Texas - El Paso - UTEP.

3.1 Coleta de dados de EEG 22 palavra “imagem”, denotará as imagens da Figura 3.2 em que, a ordem das imagens por linha serão os próprios nomes, respectivamente.

Como ilustra¸c˜ao, observe a Figura 3.3, com os sinais da primeira repeti¸c˜ao dos eletrodos 1 (a) e 2 (b) para as imagens 1 e 2.

(a) Tempo 0 50 100 150 −15 −10 −5 0 5 10 15 Imagem 1 Imagem 2 (b) Tempo 0 50 100 150 −15 −10 −5 0 5 10 15 Imagem 1 Imagem 2

Figura 3.3: Ilustra¸c˜ao dos dados das imagens 1 e 2 para os eletrodos 1 e 2.

3.1.2 Dados de Epilepsia

Uma outra aplica¸cão que será realizada são com dados de pacientes com e sem epilepsia. Esses dados estão dispon´ıveis publicamente em EEG (20–) e para mais detalhes ver Andrzejak et al. (2001). Os objetivos do experimento eram comparar propriedades dinâmicas de atividade elétrica cerebral, em diferentes regiões de grava¸cão de diferentes estados cerebrais fisiológicos e patológicos. A base de dados é composta por 5 bancos (A-E) captados através de 100 canais diferentes. Os bancos A e B consistem em seg-

3.2 Coleta de dados de EMG 23

No documento Classificador máquina de suporte vetorial com análise de Fourier aplicada em dados de EEG e EMG (páginas 33-39)