• Nenhum resultado encontrado

poder´a resolver problemas quando os dados n˜ao s˜ao linearmente separ´aveis, e quando a SVM de margens suaves n˜ao produzirem resultados satisfat´orios.

2.4

Kernels

As SVMs tamb´em lidam com problemas n˜ao lineares, ou seja, ´e poss´ıvel fazer um mapeamento no espa¸co original dos dados de treinamento, chamando de espa¸co de en- tradas, para um espa¸co de dimens˜ao maior chamado de espa¸co de caracter´ısticas. Esse mapeamento pode ser expresso da seguinte forma, seja Φ : X −→ ℑ um mapeamento, em que X denota o espa¸co de entradas e ℑ o espa¸co de caracter´ısticas. A escolha apro- priada para Φ pode fazer com que os dados de treinamento possam ser linearmente separ´aveis. Como ilustra¸c˜ao, foram utilizados os dados da Figura 2.6 que est˜ao no R2,

atrav´es das vari´aveis x1 e x2, no qual ´e poss´ıvel realizar uma transforma¸c˜ao para o R3

com a fun¸c˜ao,

Φ(x) = (x21, x1x2, x22).

Com isso, a equa¸c˜ao em (2.1) do hiperplano ´e da forma, f (x) = w′Φ(x) + b = 0

f (x) = w1x21+ w2x1x2+ w3x22+ b = 0.

Com esse novo espa¸co, pode-se aplicar a SVM linear proposta por Vapnik (1995). Observe na Figura 2.7, os dados agora s˜ao linearmente separ´aveis, com isso, a taxa de acerto que antes era de 68,96% agora ´e de 100%.

A ideia dessa metodologia ´e aplicar uma fun¸c˜ao n˜ao linear φ nas vari´aveis que est˜ao no espa¸co de entradas, tornando uma dimens˜ao maior no espa¸co de caracter´ısticas, e ap´os isso, utilizar a SVM linear. ´E interessante utilizar a SVM com margens suaves, pois apesar das transforma¸c˜oes entre os espa¸cos, ainda podem existir dados com algum tipo de ru´ıdo. Um Kernel K ´e uma fun¸c˜ao que recebe 2 argumentos xi e xj no espa¸co

2.4 Kernels 18 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Grupo 1 Grupo 2 IVS

Figura 2.7: Dados linearmente separ´aveis no espa¸co de caracter´ısticas. de entrada, e computa o produto φ(x′

i)φ(xj) no espa¸co de caracter´ıstica, ou seja,

K(x′i, xj) = φ(x′i)φ(xj). (2.26)

Como foi mostrado no exemplo anteriormente, o Kernel ´e utilizado para construir um hiperplano ´otimo no espa¸co de caracter´ıstica. A fun¸c˜ao dual para o problema de otimiza¸c˜ao com a utiliza¸c˜ao de uma fun¸c˜ao Kernel ´e dada por,

LD = n X i=1 αi− 1 2 n X j=1 n X i=1 αiαjyiyjK(x′i, xj) (2.27)

sob as restri¸c˜oes em (2.11). Observe que, se φ ´e a fun¸c˜ao identidade em (2.26), logo K(x′

i, xj) = x′ixj, dando origem ao Kernel linear, consequentemente, (2.27) torna-se

igual a (2.22).

Segundo Lorena e Carvalho (2003), as fun¸c˜oes Kernels s˜ao muito ´uteis por causa da simplicidade do seu c´alculo e sua capacidade de representar espa¸cos abstratos. En- tretanto, para que uma fun¸c˜ao possa ser um Kernel e garanta a convexidade para a otimiza¸c˜ao, ´e necess´ario atender algumas condi¸c˜oes estabelecidas pelo Teorema de Mercer, ver Cristianini e Shawe-Taylor (2000). Na Tabela 2.1 est˜ao alguns exemplos dos Kernels mais utilizados (CRISTIANINI; SHAWE-TAYLOR, 2000). Note que o Kernel Linear ´e um caso particular do Polinomial quando k = 0, δ = 1 e d = 1.

´

2.4 Kernels 19

Tabela 2.1: Exemplos de algumas fun¸c˜oes Kernel. Tipo de Kernel Fun¸c˜ao K(x′

i, xj) correspondente Parˆametros

Polinomial [δ(x′

ixj) + k]d δ, k e d

Gaussiano ou Radial exp {−σ||xi− xj||2} σ

Sigmoide tanh [γ(x′

ixj) + λ] γ e λ

ou seja, o problema deixa de ser bin´ario, e se tˆem mais grupos para classificar, algumas metodologias de como fazer o treinamento e a classifica¸c˜ao em problemas como esses, s˜ao descritos em Thome (2012).

O software utilizado no presente trabalho para fazer todos os c´alculos de hiperplanos e gr´aficos, foi o software R 3.1.3 ver R Core Team (2015). Segue abaixo um modelo b´asico de como utilizar a SVM no R.

Programa¸c~ao em R. Pacote: kernlab.

Comandos b´asicos para utiliza¸c~ao da SVM: install.packages("kernlab") # baixar o pacote library("kernlab") # Carregar o pacote

ksvm(x, y, type = "C-svc", kernel = rbfdot(), C = 1) x - dados.

y - r´otulos.

type - indica o tipo da SVM, que por default ´e para classifica¸c~ao ("C-svc").

kernel - Kernel utilizado. Tem como padr~ao o Kernel Gaussiano, e podem

ser utilizados outros tipos de Kernels. Para mais detalhes sobre os ti- pos de Kernel que podem ser utilizados, basta usar o comando ?ksvm. C - o custo da penaliza¸c~ao da soma dos erros.

Cap´ıtulo 3

Eletroencefalografia e

Eletromiografia

Neste cap´ıtulo ser˜ao introduzidos alguns conceitos t´ecnicos sobre a maneira de como os dados s˜ao coletados atrav´es da EEG e EMG, juntamente com os experimentos rea- lizados para a obten¸c˜ao dos dados utilizados no presente trabalho.

3.1

Coleta de dados de EEG

O EEG ´e um exame que permite o estudo do registro das correntes el´etricas es- pontˆaneas emitidas pelo c´erebro captadas atrav´es de receptores chamados de eletrodos (LAGE, 2013). O EEG pode ser um m´etodo n˜ao invasivo, ou seja, os eletrodos s˜ao colocados sobre a cabe¸ca do indiv´ıduo, como mostra a Figura 3.1. No m´etodo invasivo, os eletrodos s˜ao colocados dentro do crˆanio do indiv´ıduo sobre o c´ortex cerebral.

Figura 3.1: Touca com eletrodos em uma pessoa. Fonte: Biosemi Systems.

3.1 Coleta de dados de EEG 21 A EEG ´e muito utilizada para identificar doen¸cas psicol´ogicas como a epilepsia, ou ainda, avalia¸c˜ao do coma, morte encef´alica, estresse p´os-traum´atico e at´e emo¸c˜oes humanas. Para gerar dados de EEG, ´e preciso realizar algum tipo de est´ımulo no indiv´ıduo, como por exemplo: imagens emotivas para avaliar as emo¸c˜oes, ou fazer com que o indiv´ıduo realize atividades no c´erebro como as dire¸c˜oes direita e esquerda, dependendo do objetivo do pesquisador. Ap´os o est´ımulo, os sinais s˜ao captados pelos eletrodos e ´e feita uma filtragem para eliminar ru´ıdos. Os sinais s˜ao medidos ao longo do tempo, mais especificamente em segundos, tornando o dado obtido em uma s´erie temporal. ´E importante ressaltar que, cada est´ımulo feito geram v´arios sinais, pois dependem do n´umero de eletrodos, ou seja, cada eletrodo gera um sinal. Existem v´arios tipos de touca com quantidade de eletrodos diferentes, como no Biosemi Systems (BIOSEMI, 20–). Nesse sistema existem toucas com 16, 32, 64 e 128 eletrodos dentre outras quantidades.

3.1.1

Dados de Est´ımulos Visuais

Os dados utilizados no presente trabalho foram os mesmos usados por Coutinho (2010), os dados foram coletados atrav´es de EEG pelo m´etodo n˜ao invasivo, utilizando uma touca com 128 eletrodos em um indiv´ıduo. Foram selecionados um conjunto de 10 imagens (ver Figura 3.2) em que cada imagem foi mostrada 4 vezes ao longo de 5 segundos em uma ordem aleat´oria. Ap´os a filtragem dos sinais, cada eletrodo possui um total de 164 pontos para cada est´ımulo feito. Com isso, um dos objetivos do trabalho ´e classificar corretamente os sinais produzidos pelo experimento.

Figura 3.2: Imagens utilizadas no experimento feito na The University of Texas - El Paso - UTEP.

3.1 Coleta de dados de EEG 22 palavra “imagem”, denotar´a as imagens da Figura 3.2 em que, a ordem das imagens por linha ser˜ao os pr´oprios nomes, respectivamente.

Como ilustra¸c˜ao, observe a Figura 3.3, com os sinais da primeira repeti¸c˜ao dos eletrodos 1 (a) e 2 (b) para as imagens 1 e 2.

(a) Tempo 0 50 100 150 −15 −10 −5 0 5 10 15 Imagem 1 Imagem 2 (b) Tempo 0 50 100 150 −15 −10 −5 0 5 10 15 Imagem 1 Imagem 2

Figura 3.3: Ilustra¸c˜ao dos dados das imagens 1 e 2 para os eletrodos 1 e 2.

3.1.2

Dados de Epilepsia

Uma outra aplica¸c˜ao que ser´a realizada s˜ao com dados de pacientes com e sem epi- lepsia. Esses dados est˜ao dispon´ıveis publicamente em EEG (20–) e para mais detalhes ver Andrzejak et al. (2001). Os objetivos do experimento eram comparar propriedades dinˆamicas de atividade el´etrica cerebral, em diferentes regi˜oes de grava¸c˜ao de diferentes estados cerebrais fisiol´ogicos e patol´ogicos. A base de dados ´e composta por 5 bancos (A-E) captados atrav´es de 100 canais diferentes. Os bancos A e B consistem em seg-

3.2 Coleta de dados de EMG 23

Documentos relacionados