• Nenhum resultado encontrado

V i conjunto de vetores de características

2.4 Combinação de Classificadores

concatenação dos histogramas gerados para cada seção, maiores informações podem ser obtidas em [36]

2.3.2

Spatial Entropy Analisys (SEnA)

A técnica SEnA é bastante semelhante ao SSCA, ela propõe o calculo de uma medida de diversidade das regiões da imagem de forma a se obter um vetor descritor da impressão digital [44].

A análise do SEnA é divida em dois passos (Figura 2.6). O primeiro passo é uma etapa de otimização de parâmetros, utiliza-se de um algoritmo genético para obter o melhor tamanho da janela utilizada para segmentar as imagens em regiões.

O segundo passo realiza-se a a geração do vetor descritor. Este vetor é obtido dividindo a imagem da impressão digital em regiões e computando uma medida de aleatoriedade de cada região. A medida adotada no SEnA é a entropia e pode ser definida pela Equação 2.2.

s= −

N−1

i=0

H(i) log2H(i), 2.2

sendo H(n) o histograma normalizado e N o número de bins. Considerando uma imagem em tons de cinza, o número de bins é igual a 256. Após computar a entropia de cada região, gera-se um mapa de entropia da imagem que é concatenado produzindo como saída um vetor descritor para cada imagem de entrada, maiores detalhes podem ser obtidos em [44].

2.4

Combinação de Classificadores

Muitos estudos apontam que problemas de classificação, na maioria das vezes, são melhores resolvidos quando se utiliza a combinação de vários classificadores ao invés de um classificador individual [9]. Uma das motivações para se combinar classificadores parte do teorema "No Free Lunch" [49] que afirma não existir um único classificador que possa ser considerado ótimo para todos os problemas, ou seja, o desempenho alto em uma classe é compensado com um mal desempenho na outra. Um outro fator importante é que em um problema de classificação raramente se conhece uma distribuição completa dos dados, bem como o comportamento dos algoritmos de classificação, o que torna a tarefa de determinar um bom e único classificador que solucione um dado problema bastante difícil.

A ideia principal que envolve a criação de um classificador combinado está na possibi- lidade de aumentar a representatividade do classificador gerado pela combinação, diminuindo desta forma a influência de mínimos/máximos locais (que podem ocorrer quando se utiliza de um único). Ao se combinar classificadores é possível potencializar características fortes dos classificadores e minimizar suas características fracas [42].

30 2.4. COMBINAÇÃO DE CLASSIFICADORES

Figura 2.6: Diagrama de atividades do SEnA. Composto de dois passos, otimização de parâmetros e extração do descritor.

31 2.4. COMBINAÇÃO DE CLASSIFICADORES Por esses motivos, o uso de combinação de classificadores vêm sendo amplamente utilizados em diversos contexto e visa obter um classificador combinado que apresente melhores resultados que um único classificador especialista. Além disso, a combinação de classificadores trás outras vantagens ao permitir que estrategias diferentes para solucionar um problema sejam combinadas e se obtenha uma solução única, como é o caso na identificação pessoal utilizando combinação de classificadores baseados em voz, face e impressão digital [18].

O uso da combinação de classificadores geralmente destina-se a solucionar problemas que apresentam características bastantes variantes, não apresentem uma uniformidade na distribuição dos dados, apresentem um grande números de classes, dados ruidosos e padrões com pouca representatividade. Utilizar um único classificador pode apresentar-se ineficiente para se obter a solução desejada nestes cenários, e poderia limitar o poder de reconhecimento do sistema. Entretanto, para cenários mais simples a escolha de um único classificador pode ser suficiente para solucionar o problema, obtendo boas taxas de classificação e baixo custo computacional.

2.4.1

Estratégias de Combinação de Classificadores

De posse de um conjunto de classificadores (pool de classificadores) a decisão final pode ser obtida por várias regras de combinação (fusão). Neste caso, existem três abordagens principais [24]:

 Fusão: baseia-se na combinação competitiva dos classificadores. Cada classificador

possui conhecimento dos dados de entrada e apresentam sua decisão com base nessa informação. A decisão final de cada classificador é combinada por meio de métodos de combinação tais como, média, soma, média, voto majoritário, dentre outros, de modo a se obter uma saída única que determina a classe do padrão de entrada [40].

 Seleção: ao contrário da fusão, apenas um classificador é utilizado para determinar a

classe do padrão. Nesta abordagem supõe-se que cada classificador conhece apenas determinada parcela dos dados ou dos atributos, sendo portanto complementares entre si. O classificador é selecionado para determinar a classe do padrão de entrada com base nos atributos que são de sua competência. Um dos principais métodos de seleção de classificadores foi proposto em [50] e é chamado Dynamic Classifier Selection.

 Híbrida: as abordagem híbridas baseiam-se tanto no uso da seleção quanto da

fusão de classificadores. Essa técnica é utilizada de modo a apresentar uma saída mais adequada para o padrão de entrada. Normalmente existe um critério para determinar quais classificadores serão utilizados para compor a decisão final. O processo natural das abordagens híbridas consistem na utilização de um processo de seleção de classificadores seguidos das técnicas de fusão. Dois exemplos principais das técnicas híbridas são: Dynamic Classifier Selection based on multiple classifier

32 2.4. COMBINAÇÃO DE CLASSIFICADORES behavior(Dcs-MCS) e Dynamic classifier selection using also Decision Templates (Dcs-DT)[24].

A abordagem hibrida será a utilizada neste trabalho para detecção de impressões digitais falsas com base na combinação e seleção de classificadores e será vista em mais detalhes no próximo em conjunto com a arquitetura proposta.

33 33 33

3

Arquitetura Proposta

Neste capítulo é exposta uma visão geral da arquitetura proposta. A arquitetura desen- volvida apresenta uma abordagem para seleção e combinação de classificadores para detecção de impressões digitais falsas. A abordagem é dividida em 2 (duas) fases: Treinamento e Teste. Na fase de treinamento, as imagens são inicialmente divididas em vários grupos de treinamento, cada grupo contém os elementos que apresentam um determinado grau de similaridade entre si. Esses grupos são utilizados para a criação do conjunto de classificadores especialistas nas regiões encontradas. Na fase de teste são realizadas a seleção dinâmica e a combinação des- ses classificadores, tendo como saída um subconjunto de classificadores que é utilizado para classificar um determinado padrão de entrada.

O capítulo está estruturado da seguinte forma: a Seção 3.1 apresenta uma visão geral da arquitetura proposta. Na Seção 3.2 é descrita a abordagem de agrupamento de dados utilizada para formação das partições. Em seguida, na Seção 3.3, são apresentados detalhes da geração dos classificadores, bem como a técnica utilizada para extração de características. Os classificadores obtidos são selecionados por meio da técnica de seleção dinâmica de classificadores visando obter um subconjunto dos classificadores gerados, esse processo é descrito na Seção 3.4. Por fim, a Seção 3.5 apresenta como os classificadores selecionados são combinados para obter a classe do padrão de entrada.

3.1

Arquitetura do Sistema

O sistema proposto é composto por 4 (quatro) módulos: Módulo de Agrupamento de Dados, Módulo de Geração de Classificadores, Módulo de Seleção Dinâmica de Classificadores e o Módulo de Combinação de Classificadores. A Figura 3.1 mostra a visão geral dos módulos desse sistema. Os módulos de Agrupamento de Dados e o de Geração de Classificadores compõem a fase de treinamento do sistema, já os módulos de Seleção Dinâmica de Classificadores e o de Combinação de Classificadores compõem a fase de teste.

O processamento dos dados tem início no módulo de Agrupamento de Dados. Os dados de treinamentoT são inicialmente agrupados em n grupos de treinamento {T1, T2, ..., Tn}, cada

Documentos relacionados