3.3 Classifica¸c˜ ao do movimento
3.3.2 Determina¸c˜ ao do Conjunto de Exemplos
O conjunto de exemplos, ´e uma matriz de informa¸c˜oes que re´une os componentes mais relevantes das classes dentro de um grupo de dados. A etapa de classifica¸c˜ao dos comportamentos ´e sens´ıvel a sele¸c˜ao destes exemplos, dado que, um ´otimo conjunto de componentes permitir´a uma melhor discrimina¸c˜ao entre as classes.
Para a constru¸c˜ao do conjunto, foi usada a atividade oscilat´oria da banda alfa. Segmentos do sinal relacionados para os dois comportamentos a serem identificados: movimento e n˜ao movimento, foram extra´ıdos do sinal preprocessado. Na Figura
3.8 se ilustra a delimita¸c˜ao das duas a¸c˜oes, comparando o sinal m´edio do sensor com a atividade m´edia da banda alfa para trials em movimento (indicado no quadro preto da figura superior) como tamb´em naqueles em que n˜ao foi desenvolvida a a¸c˜ao, ambos sinais encontram-se referenciados ao intervalo de repouso t < 0ms. A varia¸c˜ao da atividade oscilat´oria durante a execu¸c˜ao ou n˜ao de movimento foi similar `
a vista como o ERSP, encontrando-se picos de energia menores a 1µV durante a execu¸c˜ao, e picos que excedem este valor em intervalos de n˜ao movimento.
Figura 3.8: Compara¸c˜ao do movimento com a atividade EEG da banda alfa. A energia do sinal EEG em microvolt ao quadrado (µV2), referenciada a o intervalo
de Repouso (t < 0). Observa-se um decremento da amplitude do sinal no intervalo definido pelo quadro preto. Este decremento est´a associado ao movimento. Entre- tanto, nas etapas de inatividade do bra¸co o sinal da banda apresenta oscila¸c˜oes com uma amplitude maior respeito ao intervalo descrito.
Besserve et al. [118], considera que, se as sincroniza¸c˜oes e dessincroniza¸c˜oes de uma determinada banda sejam constru´ıdas respeito a uma linha base, este com-
portamento pode ser considerado como um evento que foi induzido por uma a¸c˜ao. Por´em, uma atividade cont´ınua, como a execu¸c˜ao ou n˜ao de um movimento, pode ser caracterizada por medi¸c˜oes do ERD /ERS. Esta informa¸c˜ao pode ser extra´ıda do EEG usando estima¸c˜ao espectral ou filtra¸c˜ao da banda, como no caso particular.
Portanto, foi definida a Classe 1, como a atividade cognitiva relacionada com a execu¸c˜ao do movimento, a qual foi conformada por componentes do sinal que se encontraram dentro do intervalo da a¸c˜ao de movimento. E sinais dos testes de n˜ao movimento para um t > 2000ms foram usados para conformar a Classe 2.
Janelamento
Assumindo que as propriedades do sinal s˜ao invariantes ao longo dos segmentos, uma subdivis˜ao Ti foi feita para cada classe. Isto permitiu aplicar an´alise estat´ıstica
no sinal EEG [126] e tamb´em gerar um maior n´umero de janelas as quais foram pro- cessadas como m´ultiplos trials que descrevem a mesma condi¸c˜ao experimental [118]. Janelas com divis˜oes do sinal de 1000, 500 e 100 ms, foram criadas para analisar sua influˆencia durante a classifica¸c˜ao. O n´umero de exemplos n que comp˜oem cada classe depender´a do valor da subdivis˜ao.
Caracteriza¸c˜ao da atividade neural
Um conjunto de atributos foram extra´ıdos de cada janela para representar a distri- bui¸c˜ao tempo-frequˆencia do sinal EEG : m´edia, RMS e valor m´aximo; e mudan¸cas na distribui¸c˜ao do sinal EEG : desvio padr˜ao e curtoses. [127]. Esta sele¸c˜ao de valo- res permite que cada janela Ti seja representada como um ponto pertencente a um
espa¸co de dimens˜ao m .
T{k}i = [x1i, x2i, . . . , xmi] (3.2)
Sendo que xmi ∴ m = [1, 2, . . . , 5], i = [1, 2, . . . n], representa cada um dos 5
atributos que caracterizam Ti ∈ <1×5 das k -´esima, sendo k = [1, 2].
Normaliza¸c˜ao
Dado que os valores entre atributos possuem distintas magnitudes, ´e necess´ario efetuar uma normaliza¸c˜ao. Assim, evita-se que valores demasiado grandes tenham influˆencia no resultado da classifica¸c˜ao. A normaliza¸c˜ao foi aplicada de forma que os dados tiveram m´edia zero (µ = 0) e varian¸ca unit´aria (σ2 = 1).
Uma forma de normalizar um valor ´e aplicando nele o Z-score [128] cuja f´ormula ´e:
ˆ xmi=
xmi− ¯xm
σ , i = 1, 2, . . . n (3.3)
Sendo: ¯xma m´edia, σ o desvio padr˜ao de xm ∈ <m×1, e ˆxmi´e o valor normalizado
do i−´esimo atributo de xm.
Quantifica¸c˜ao da capacidade discriminat´oria de cada atributo ´
E necess´ario quantificar cada atributo normalizado do conjunto de exemplos respeito `
a sua capacidade de discrimina¸c˜ao entre as classes, para isto foi usado o crit´erio de discrimina¸c˜ao de Fisher (FDR) [128]: F DR = (m1− m2) 2 σ2 1 + σ22 (3.4) Sendo m1 e m2 a respectiva m´edia e σ12 e σ22 a varian¸ca de associada aos valores
de um atributo xmdas classes c = [1, 2]. ´E esperado que atributos com um FDR alto
sejam aqueles com maior distˆancia entre suas m´edias e menor varian¸ca entre seus valores, entanto, aqueles atributos cujas distribui¸c˜oes se encontrem mais pr´oximas entre sim ou superpostas, ter˜ao um FDR menor.
Sele¸c˜ao de atributos para formar o conjunto de exemplos final
Tendo-se a quantifica¸c˜ao da discrimina¸c˜ao dos atributos acorde com o FDR, o valor num´erico correspondente foi organizado descendentemente. Unicamente os trˆes pri- meiros parˆametros foram escolhidos, sendo eliminado os restantes. Esta elimina¸c˜ao de atributos ´e comumente usada para prevenir o overfitting e projetar classifica- dores que possam responder bem no momento de usar dados fora do conjunto de treinamento [128].
A quantifica¸c˜ao dos atributos foi efetuada unicamente com sinais do canal C3, e
posteriormente replicada nos canais adjacentes ordenados de acordo com a coerˆencia de seu sinal. ´E razo´avel pensar que esta valora¸c˜ao, ´e mais precisa naqueles canais que se encontram pr´oximos a C3, dado que as oscila¸c˜oes geralmente refletem sincronismo
entre regi˜oes pr´oximas[118]. No cap´ıtulo 4 encontrou-se que os canais mais afastados localizados na regi˜ao oposta a C3 apresentam uma coerˆencia menor a 0.5; portanto,
´e poss´ıvel que tenham uma organiza¸c˜ao de atributos distinta, mais por conveniˆencia, se assume que o crit´erio de sele¸c˜ao de atributos seja similar para todos os canais que conformaram o classificador.
Tabela 3.1: Descri¸c˜ao do Conjunto de exemplos final X1 X2 · · · Xj Y T1 x {1}, 11 x {1}, 12 x {1}, 13 x {2}, 11 x {2}, 12 x {2}, 13 · · · x {j}, 11 x {j}, 12 x {j}, 13 y1 T2 x {1}, 21 x {1}, 22 x {1}, 23 x {2}, 21 x {2}, 22 x {2}, 23 · · · x {j}, 21 x {j}, 22 x {j}, 23 y2 .. . ... ... ... ... ... ... . .. ... ... ... ... Ti x {1}, i,1 x {1}, i,2 x {1}, i,3 x {2}, i,1 x {2}, i,2 x {2}, i,3 · · · x {j}, i,1 x {j}, i,2 x {j}, i,3 yi
Na tabela 3.1, cada linha i representa o i -´esimo exemplo (i = 1, 2, . . . , n) confor- mado por j canais (j = 1, 2, . . . c) cada um descrito por trˆes atributos. Se abandonou o uso do sub´ındice {k} para denominar a classe, sendo substitu´ıdo por o vetor de etiquetas Y ∈ <i×1 que armazena o valor da k classe do i -´esimo exemplo T
i, sendo
que yi ∈ [c1, c2]. O conjunto de exemplos se pode separar na matriz X ∈ <i×3c, que
cont´em os valores dos atributos da ambas classes distribu´ıdos em colunas, e o vetor Y que contem as etiquetas contendo a classe que pertence o atributo.
Na figura 3.9 se resume os passos a seguir no processo de extra¸c˜ao de exemplos que procede a etapa de pr´e-processamento descrita na figura 3.7.
Figura 3.9: Etapas da conforma¸c˜ao do conjunto de exemplos.