ATA DA BANCA EXAMINADORA

Título do trabalho: Interface cérebro-computador para classificação de banco de imagens de acervos museológicos. O processamento de sinais EEG, por inteligência artificial, utilizando um conjunto de wavelets para uma análise espacial e temporal de sinais cerebrais, oferece uma alternativa às aplicações RIBC como forma de classificar e ordenar um conjunto de imagens.

MOTIVAÇÃO

A imagem também tem assumido cada vez mais o papel de disseminação do conhecimento: filmes, DVDs e álbuns fotográficos são cada vez mais comuns, e os avanços tecnológicos têm contribuído para uma difusão cada vez mais sofisticada do conhecimento científico arqueológico. Por outro lado, desde a década de 1980, os historiadores, incluindo os contemporâneos, têm utilizado cada vez mais a imagem, estática ou não, como documento para o conhecimento do passado.

OBJETIVOS DA PESQUISA

Esta nova linha de trabalho prevê a utilização de imagens para a construção do conhecimento sobre a antiguidade grega. Este trabalho ampliará o conceito de uso de imagens dentro da arqueologia visual, proposto anteriormente, através da aplicação de novas tecnologias.

ESTRUTURA DO TRABALHO

Content-Based Image Retrieval (RIBC), difundido em inglês como CBIR, é o resultado específico da busca por um conjunto de imagens, e o resultado é semelhante ao objeto pesquisado (COX et al., 2000). O termo foi definido para abranger a gestão de imagens em diversas áreas do conhecimento, tais como: galerias de arte e gestão de museus, projetos de arquitetura e engenharia, sensoriamento remoto e gestão de recursos, sistemas de informação geográfica, gestão de bases de dados científicas, previsão do tempo e aplicação da lei e investigação criminal. .

COMPONENTES DE UM SISTEMA DE CBIR

Até então, havia duas direções para abordar o assunto (GUDIVADA; RAGHAVAN, 1995), a primeira funcionando como um sistema de banco de dados convencional, onde as informações eram extraídas manualmente e as consultas eram realizadas de acordo com uma representação de atributos. predefinido para o contexto tratado. Esses dois extremos tiveram e ainda têm limitações porque por um lado havia a capacidade humana de definir um modelo de banco de dados e por outro lado um alto custo computacional para o processamento automático de todas as imagens de um conjunto.

DESCONTINUIDADES SEMÂNTICAS

BIOSINAIS EM APLICAÇÕES DE CBIR

Ao compreender o nível de atenção, é possível avaliar os processos envolvidos na percepção e os conceitos compreendidos quando uma pessoa olha uma imagem (LI et al., 2010). Do ponto de vista mecânico da interface humano-computador, algumas pesquisas mostram que é possível utilizar a captura de visão para enviar comandos ao computador (MORIMOTO; MIMICA, 2005), como a posição do cursor na tela para alterar o mouse de acordo ao ponto de vista.

BANCOS DE IMAGENS PARA COMPARAÇÃO DE CBIR

Caltech 101

Banco de dados de imagens naturais contendo aproximadamente 9.144 imagens, organizadas em 101 categorias, com variação de 40 a 800 imagens por categoria, sendo 50 imagens na maioria das categorias. Este banco de dados de imagens é usado principalmente para treinar algoritmos de reconhecimento para aplicações de visão computacional.

Nausitoo

O sistema nervoso central é um sistema complexo responsável por toda a rede que transporta informações para as mais diversas partes do corpo humano, desde a coordenação de sistemas, como os responsáveis pela respiração, até a forma como entendemos o ambiente que nos rodeia. sobre. O cérebro, conforme mostra a Figura 6, é representado pelas seguintes estruturas, que geralmente estão associadas às seguintes funções: .. a) cerebelo: associado ao equilíbrio e coordenação dos movimentos corporais;.

SINAIS CEREBRAIS

ELETROENCEFALOGRAMA

SISTEMA 10–20 DE EEG

Os eletrodos na posição (A) são colocados no lóbulo da orelha e normalmente são usados como eletrodos de referência. Ainda na Figura 10, os eletrodos marcados em cinza representam a proposta inicial do modelo que incluía 22 eletrodos dispostos ao longo do couro cabeludo; porém, com o avanço dos equipamentos de medição, trouxe a possibilidade de um volume muito maior de canais de medição, o que exigiu a ampliação do sistema 10-20 para acomodar esses novos eletrodos, conforme mostrado no conjunto de 75 eletrodos.

BANDAS DE FREQUÊNCIA

POTENCIAIS EVOCADOS

A Figura 12 apresenta alguns dos principais componentes de um PRE, sua localização no tempo após a ocorrência de um estímulo, a nomenclatura de cada um dos eventos, além da polaridade (positiva ou negativa) em que esses eventos ocorrem. Essas ondas são exibidas nos eletrodos em função da soma de cada onda inicial multiplicada por um fator de ponderação. A soma de cada um dos componentes, multiplicada pelo fator de peso, é observada como diferentes ondas resultantes em cada eletrodo.

P300 E INTERFACE CÉREBRO-COMPUTADOR

A solução mais comumente utilizada para evitar este nível de relação sinal-ruído (SNR) é calcular uma média para todos os eventos alvo e outra para todos os eventos não-alvo, comparando-os assim. para determinar a existência de um sinal característico do ERP e seus marcadores, por exemplo, a existência de uma deflexão dentro de 300ms do início do estímulo (DONCHIN;. 2011) propôs uma abordagem diferente para cada tentativa de observar os eventos alvo e detectar um padrão de classificação individual em relação ao alvo sem evento. Aplicando regressão linear a um filtro espacial, para comparar todos os eletrodos no topo da cabeça, os sinais são processados com as janelas de eventos individuais, de forma que ocorre um filtro nos sinais e os eventos do ERP são destacados.

PLATAFORMAS DE BCI

O pacote também contém um conjunto de filtros que podem ser aplicados diretamente nos sinais e uma interface para representação gráfica dos dados. Uma maneira de entender o uso de wavelets é usar como referência a Transformada Discreta de Fourier (DFT), onde um sinal semelhante ao sinal EEG no momento mostrado na Figura 11 é decomposto em uma série de ondas senoidais, cuja soma representa o sinal original. O método supervisionado geralmente é usado em conjuntos de dados categorizados, esses dados são usados para treinar modelos matemáticos que posteriormente definirão a qual tipo de categoria o conjunto de dados de entrada pertence.

CLASSIFICADOR DE RIDGE

A regressão Ridge é conhecida por sua resiliência ao overfitting do aprendizado de máquina, resultando em um único ponto de conversão (JAMES et al., 2013) e também tem um bom desempenho contra vetores de entrada que são ainda maiores em tamanho do que o tamanho das amostras de entrada (matrizes de alta dimensão). . No caso do classificador deridge (PEDREGOSA et al., 2011), conforme equação 7, o fator α é configurado como parâmetro de entrada do treinamento do classificador para que o resultado final da predição seja verificado. Para verificar os resultados, diferentes níveis de α podem ser aplicados a um método de classificação de aprendizado de máquina gridsearch para determinar o resultado máximo da classificação.

CLASSIFICAÇÃO DE CBIR VIA EEG

HARDWARE DE AQUISIÇÃO DE EEG

MÉTODO DE APRESENTAÇÃO DAS IMAGENS

Amplificador actiCHamp de 32 canais com taxa de aquisição de 1kHz com eletrodos em um conjunto de padrão 10–20 referenciado pela média de todos os canais. Os voluntários foram posicionados a 60 cm da tela com as imagens ocupando aproximadamente 6◦ x 4◦ do campo visual e todos foram orientados a contar silenciosamente as imagens de um determinado objeto. Em seguida, a distância euclidiana é calculada nos histogramas coloridos e as imagens são classificadas e agrupadas.

BANCOS DE DADOS DE IMAGEM

Primeiro é aplicada uma conversão de cores do padrão RGB (Vermelho, Verde, Azul) para HSV (Matiz, Saturação, Valor), um processo trivial em visão computacional para alterar a dimensão da cor.

SOFTWARE DE BCI

VOLUNTÁRIOS E CARACTERÍSTICAS

PRÉ-PROCESSAMENTO E PROCESSAMENTO DOS DADOS

ANÁLISE CRÍTICA

A maioria dos artigos não faz distinção entre voluntários, exceto em Mohedano et al. 2015) há uma distinção clara entre especialistas e não especialistas e em Bellman et al. 2016) há uma distinção entre pessoas que estão ou não conscientes da tarefa de destacar imagens interessantes. 2018), é apresentada uma discussão sobre a utilização do ERP juntamente com o RSVP para o desenvolvimento de aplicações BCI e o artigo também apresenta uma visão geral dos diversos artigos nesta área. Este capítulo descreve o processo no qual um voluntário é apresentado a um cenário RSVP, com um banco de dados de imagens, e como os sinais EEG são capturados e processados para separar o grupo de imagens. Na Figura 19 é possível observar as etapas do modelo de processamento de sinais EEG adotado.

MATERIAL

Banco de dados de imagens

Aquisição de EEG

VOLUNTÁRIOS

MÉTODO

Processamento dos dados
Avaliação dos sinais de P300
Classificação individual das imagens alvo
Seleção da família de wavelets
Comparação entre os grupos de especialistas e não especialistas
Comparação entre as bases de dados para o grupo de especialistas
Teste do classificador

O fator F1 será utilizado como referência para todas as análises, pois equilibra o PR e o RC, proporcionando maior qualidade aos resultados obtidos em bases de dados não balanceadas, como é o caso dos dados obtidos. Após a escolha da família e da ordem das wavelets, propõe-se aplicar o teste de independência do qui-quadrado (χ2) aos resultados positivos dos eventos processados pela matriz de confusão de aprendizado de máquina, comparando grupos de especialistas e não especialistas, e então utilizando o mesmo teste para comparar a relação dos especialistas com os bancos de imagens. A mesma avaliação foi desenvolvida para o grupo de especialistas em relação ao teste realizado com os dois bancos de imagens: Caltech 101 e Nausitoo.

COMITÊ DE ÉTICA EM PESQUISA CIENTÍFICA

Para confirmar a generalização do treinamento do classificador deridge, foi solicitado a um dos especialistas (voluntário 10) que realizasse uma aquisição adicional de EEG em cada um dos conjuntos de dados (Caltech 101 e Nausitoo). Assim, o classificador foi treinado conforme descrito na Tabela 8 e foi realizado o teste de generalização do classificador com aquisição incremental.

AVALIAÇÃO DOS SINAIS DE P300

CLASSIFICAÇÃO INDIVIDUAL DAS IMAGENS ALVO

Seleção da família de wavelets

As famílias que apresentarem resultados abaixo da linha de corte definida poderão ser excluídas, para que sejam selecionados os grupos mais significativos. Foram excluídas as famílias que não obtiveram pontuação superior a 70% de F1 em nenhum teste e aquelas que não passaram no teste Tukey HSD. Avaliando os resultados da Figura 24, as famílias DMEY, HER e SYM podem ser excluídas pela taxa de classificação F1 inferior a 70%.

Comparação entre os grupos de especialistas e não especialistas

Outra consideração foi o fato de nem todas as famílias disponíveis neste teste possuírem o mesmo número de derivações, o que é um terceiro fator considerado, pois o maior número de derivações pode fornecer mais dados estatísticos para seleção de famílias. Para definir qual família dessas duas opções foi adotada a família wavelet com maior número de ordens disponíveis. A família DB, que possui 38 pedidos, foi selecionada contra a COIF, que possui apenas 17 pedidos (WASI-LEWSKI, 2006).

Comparação entre as bases de dados para o grupo de especialistas

Da família DB, o melhor resultado foi obtido com Daubechies da ordem 32 (DB32), com precisão de 97% e pontuação F1 de 80% em média para todos os voluntários. Com os resultados estatísticos, rejeita-se a hipótese H0, dada a existência de relação entre os resultados positivos dos especialistas para as duas bases de imagens adotadas (H1).

Teste de generalização do classificador

Considerando o trabalho realizado, é possível observar o uso da inteligência artificial em combinação com sinais cerebrais para classificar diferentes bases de dados de imagens com uma taxa de sucesso superior aos resultados obtidos em outros trabalhos. Os experimentos demonstraram a existência de uma ligação entre os sinais cerebrais e os resultados apresentados para diferentes conjuntos de dados de imagens a um grupo de especialistas. Foi possível propor um modelo de processamento de sinais cerebrais para aplicações em arqueologia visual e o modelo apresenta resultados que permitem avaliar o desempenho de especialistas através da relação de duas bases de imagens pesquisadas.

-based Image Retrieval, Outubro, v. Disponível em: