IVAN LUCAS REIS SILVA
ALG O R ITM O S BASEADOS EM INTELIG ÊNCIA DE ENXAM ES APLIC AD O S À M U LTILIM IAR IZAÇÃ O DE IMAGENS
CURITIBA 2018
ALG O R ITM O S BASEADOS EM INTELIG ÊNCIA DE ENXAM ES APLIC AD O S À M U LTILIM IAR IZAÇÃ O DE IMAGENS
Dissertação apresentada ao Program a de Pós-G raduação em Engenharia Elétrica, Á rea de Concentração Sistem as Eletrônicos, D epartam ento de Engenharia Elétrica, Setor de Tecnologia, U niversidade Federal do Paraná, como parte das exigências para a obtenção do título de M estre em Engenharia Elétrica.
Orientador: Prof. Dr. Leandro dos Santos Coelho
C UR ITIBA 2018
S586a Silva, Ivan Lucas Reis
Algoritmos baseados em inteligência de enxames aplicados à multilimiarização de imagens [recurso eletrônico] / Ivan Lucas Reis Silva - Curitiba, 2018.
Dissertação (mestrado) - Universidade Federal do Paraná, Programa de Pós-Graduação em Engenharia Elétrica, Departamento de Elétrica no Setor de Tecnologia.
Orientador: Prof. Dr. Leandro dos Santos Coelho
1. Engenharia elétrica. 2. Processamento de imagem. I. Universidade Federal do Paraná. II. Coelho, Leandro dos Santos. III. Título.
CDD 621.367
Bibliotecária: Vilma Machado CRB9/1563
U F~ P R
PROGRAMA DE PÓS-GRADUAÇÃO ENGENHARIA ELÉTRICATERMO DE APROVAÇÃO
Os membros da Banca Examinadora designada pelo Colegiado do Programa de Pós-Graduação em ENGENHARIA ELÉTRICA da Universidade Federal do Paraná foram convocados para realizar a arguição da Dissertação de Mestrado de IVAN LUCAS REIS SILVA intitulada: Algoritmos baseados em inteligência de enxames aplicados à mulíilimiarização de imagens, após terem inquirido o aluno e realizado a avaliação do trabalho, são de parecer pela sua A f f í o \!A Ç ã n_________________ no rito de defesa.
A outorga do titulo de mestre está sujeita à homologação pelo colegiado, ao atendimento de todas as indicações e correções solicitadas peta banca e ao pleno atendimento das demandas regimentais do Programa de Pós-Graduação.
Curitiba, 2Q de Agosto de 2018.
LEANDRO DOS SANTOS COELHO Presidente da Banoa Examinadora (UFPR)
ROBERTO ZANFTTI FRFIRF Avaliador Externo (PUCPR)
C U ,
LUIS HENRIQUE ASSUMPÇÃO LOLÍS Av2,isdor 'ntsrrc JUF"PíR)
Dep.Eng.Elétrica-DELT, Centro Politécnico - UFPR - Curitiba - Paraná - Brasil CEP 81531990 - Tel: 41 3361-3622 - E-mail: [email protected]
À minha mãe, Ivone, que já se foi, mas continua sendo minha m aior força e inspiração na vida.
Ao meu pai e irmão, Devanir e Iran, com quem com partilhei m om entos de alegria, tristeza e ansiedade.
Aos meus am igos Silvio, Eldrey e Giovana, que sem pre acreditaram em mim.
À Deus acim a de tudo, pelo am or imenso e gratuito; pela vida, oportunidades e capacidades com as quais fui abençoado; por ter colocado pessoas ilum inadas em meu caminho.
À m inha família, especialm ente ao meu pai e à m inha mãe, por todo o apoio e encorajam ento, assim como os sacrifícios feitos para que eu chegasse até aqui.
A o meu orientador, o ProfessorLeandro dos Santos Coelho, pelo estím ulo à pesquisa, por sua paciência e colaboração na elaboração da dissertação.
A os m em bros da banca por terem gentilm ente aceito o convite para participarem da avaliação deste trabalho.
geração e armazenamento de informações digitais evoluem. Uma das etapas iniciais do processamento de imagem é a segmentação, onde a multilimiarização é uma das técnicas de segmentação mais simples. Um focorelevante de pesquisa nesta área é o projeto de abordagens visando a separação de diferentes objetos na imagem em grupos, por meio de limiares, para facilitar assim a interpretação da informação contida na imagem. Uma imagem perde informação, ou entropia, quando é limiarizada. A equação de limiarização multiníveis de Kapur calcula, a partir dos limiares escolhidos, qual a quantidade de informação que uma imagem apresentará após a limiarização. Assim, pela maximização da equação de multimiliarização de Kapur, é possível determinar os limiares que retornam uma imagem com valor maior de entropia. Quanto maior a quantidade de limiares, maior a dificuldade para encontrar a melhor solução, devido ao aumento significativo da quantidade de possíveis soluções. O objetivo desta dissertação é de apresentar um estudo comparativodecinco algoritmos de otimização (meta-heurísticas de otimização)da inteligência de enxame, incluindo Otimização por Enxame de Partículas (PSO), Otimização por Enxame de Partículas Darwiniano (DPSO), Otimização por Enxame de Partículas Darwiniano de Ordem Fracionária (FO-DPSO), Otimizador baseado no comportamento dos Lobos-cinza (GWO) e Otimizador inspirado no comportamento da Formiga-leão (ALO), de forma a avaliarqual deles obtém a melhor solução e convergência em termos da função objetivo relacionada a entropia da imagem. Uma contribuição desta dissertação é a aplicação de diferentes meta-heurísticas de otimização ao problema de multilimiarização de imagens, assim como o estudo do impacto das suas variáveis de controle (hiperparâmetros) para o problema em questão.Nesta dissertação são apresentados resultados paraquatro imagens diferentes, sendo duas imagens registradas por satélite (Rio Hunza e Yellowstone) e outras duas imagens teste (benchmark) obtidas do Centro de Engenharia Elétrica e Ciência da Computação do MIT (Massachussetts Institute of Technology). Os resultados são comparados considerando a média e o desvio padrão da entropia de cada imagem resultante. Com base nos resultados obtidos conclui-se que o algoritmo mais indicado para o problema de multilimiarização de imagens dos avaliados é o GWO, pelo seu desempenho superior em relação aos outros algoritmos e pelas entropias das imagens resultantes serem satisfatórias.
Palavras-chave: Segmentação de imagens. Multilimiarização. Inteligência de enxames.
Otimização por enxame de partículas. Otimizador dos lobos-cinza. Otimizador formiga-leão.
technologies evolution. One of the initial stages of image processing is segmentation procedure, where the multi level thresholding is one of the simplest segmentation approaches. A relevant research objective in this field is the design of approaches aimed at separating different objects in the image into groups, through thresholds, to facilitate the interpretation of the information contained in the image. An image loses information, or entropy, when it is thresholded. The Kapur multilevel thresholding equation calculates, from the chosen thresholds, how much information an image will present after the thresholding.
Thus, by the maximization of the Kapur multilevel limiarization equation, it is possible to determine the thresholds that return an image with a larger value of entropy. The higher the amount of thresholds, the greater the difficulty in finding the best solution, due to the significant increase in the quantity of possible solutions. The objective of this dissertation is to present a comparative study between fiveoptimization metaheuristics of the swarm intelligence field, including Particle Swarm Optimization (PSO), Darwinian Particle Swarm Optimization (DPSO), Fractional Order Darwinian Particle Swarm Optimization (FO-DPSO), Grey Wolf Optimizer (GWO) and the Ant lion behavioral optimizer (ALO), in order to identify which one gets the best solution and convergence in terms of the objective function and the entropy of the image. A contribution of this dissertation is the application of different optimization metaheuristics to the problem of multilimizing of images, as well as the study of the impact of its control variables (hyperparameters) on the problem in question.
Experiments are conducted with four images, two images being recorded by satellite (Hunza River and Yellowstone) and two other test(benchmark) images obtained from MIT's (Massachussetts Institute of Technology) Electrical Engineering and Computer Science Center. The results are compared considering the mean and standard deviation values of each resulting image entropy.Based on the results obtained it is concluded that the most suitable algorithm for the problem of multilevel thresholding of images is the GWO, for its superior performance in relation to the other tested algorithms and satisfactory entropies of the resulting images.
Key-words: Image segmentation. Multilevel thresholding. Kapur’s entropy. Swarm intelligence. Particle swarm optimization. Grey wolf optimizer. Ant lion optimizer.
Figura 2-Im agem representada por uma m atriz f(x ,y )...24
Figura 3- Detalhe am pliado de uma im agem ... 25
Figura 4 - Histogram a de im a g e m ...26
Figura 5 - Imagem A com entropia zero e imagem B com entropia m á xim a ... 28
Figura 6- Histogram a de níveis de cinza, divididos por um limiar único T... 30
Figura 7- Histogram a particionado em m últiplos lim ia res... 31
Figura 8- C om portam ento da caça dos lobos c in z e n to s ... 52
Figura 9 - V etores de posição 2D e suas possíveis localizações subsequentes 54 Figura 10 - Vetores de posição 3D e suas possíveis localizações seguintes...55
Figura 11- A tualização de posição no G W O ... 56
Figura 12 - Form iga-leão em sua form a a d u lta ...59
Figura 13 - Larva da fo rm ig a -le ã o ...60
Figura 14 - Arm adilha construída pela larva da fo rm ig a -le ã o ... 61
Figura 15 - C am inhada aleatória de uma form iga dentro de uma arm adilha de fo rm ig a -le ã o ... 65
Figura 16 - Limites superior (c) e inferior (d) a d a p ta tivo s... 67
Figura 17 - Imagem B a rco s... 79
Figura 18 - Histogram a da imagem 'B arcos'... 80
Figura 19- Imagem B á rb a ra ... 80
Figura 20 - Histogram a da imagem 'B á rb a ra '... 80
Figura 21- Imagem Rio H u n z a ...81
Figura 22 - Histogram a da imagem 'Rio H u n z a '... 81
Figura 23 - Imagem Y e llo w sto n e ... 82
Figura 24 - Histogram a da imagem 'Y e llo w s to n e '... 82
Figura 25 - Tem po de execução para diferentes quantidades de agentes do algoritm o A L O ... 85
Figura 26 - Entropia resultante para diferentes quantidades de agentes do algoritm o A L O ...8 6 Figura 27 - Tem po de execução para diferentes quantidades de gerações do algoritm o A L O ... 87
Figura 29 - Tem po de execução para diferentes quantidades de agentes do algoritm o G W O ...8 8 Figura 30 - Entropia resultante para diferentes quantidades de agentes do algoritm o G W O ...89 Figura 31 - Tem po de execução para diferentes quantidades de gerações do algoritm o G W O ... 90 Figura 32 - Entropia resultante para diferentes quantidades de gerações do algoritm o G W O ...90 Figura 33 - Tem po de execução para as diferentes populações iniciais do algoritm o PSO ... 91 Figura 34 - Entropia das im agens resultantes para as diferentes populações iniciais do algoritm o P S O ...92 Figura 35 - Tem po de execução para os diferentes pesos individuais utilizados pelo algoritm o P S O ...92 Figura 36- Entropia das im agens resultantes para os diferentes pesos individuais utilizados pelo algoritm o P S O ...93 Figura 37 - Tem po de execução para os diferentes pesos sociais utilizados pelo algoritm o P S O ...93 Figura 38- Entropia das im agens resultantes para os diferentes pesos sociais utilizados pelo algoritm o P S O ...94 Figura 39 - Tem po de execução para os diferentes fatores de inércia utilizados pelo algoritm o P S O ...95 Figura 40- Entropia das im agens resultantes para os diferentes fatores de inércia utilizados pelo algoritm o P S O ...95 Figura 41 - Tem po de execução para as diferentes populações m ínim as do algoritm o D P S O ...97 Figura 42- Entropia das im agens resultantes para as diferentes populações m ínim as do algoritm o D P S O ... 97 Figura 43 - Tem po de execução para as diferenças entre populações m ínim as e m áxim as do algoritm o D P S O ...98 Figura 44- Entropia das im agens resultantes para as diferenças entre populações m ínim as e m áxim as do algoritm o D P S O ... 98
Figura 46- Entropia das im agens resultantes para as diferentes enxam es iniciais do algoritm o D P S O ... 100 Figura 47 - Tem po de execução para as diferentes enxam es m ínim os do algoritm o D P S O ... 100 Figura 48- Entropia das im agens resultantes para as diferentes enxam es m ínim os do algoritm o D P S O ... 101 Figura 49 - Tem po de execução para as diferenças entre enxam es m ínim os e m áxim os do algoritm o D P S O ...102 Figura 50- Entropia das im agens resultantes para as diferenças entre enxam es m ínim os e m áxim os do algoritm o D P S O ... 102 Figura 51- Tem po de execução para as diferentes valores de estagnação do algoritm o D P S O ... 103 Figura 52- Entropia das im agens resultantes para as diferentes valores de estagnação do algoritm o D P S O ... 103 Figura 53 - Tem po de execução para as diferentes quantidades de gerações do algoritm o D P S O ... 104 Figura 54- Entropia das im agens resultantes para as diferentes quantidades de gerações do algoritm o D P S O ...104 Figura 55- Tem po de execução para os diferentes coeficientes fracionários do algoritm o F O -D P S O ... 106 Figura 56- Entropia das im agens resultantes para os diferentes coeficientes fracionários do algoritm o F O -D P S O ... 107 Figura 57- Tem po de execução para os diferentes distâncias m ínim as entre picos para o algorítm o de fo rç a -b ru ta ... 108 Figura 58- Entropia das im agens resultantes para os diferentes distâncias m ínim as entre picos para o algorítm o de força-bruta...109 Figura 59- Tem po de execução para os diferentes janelas de suavização para o algorítm o de fo rç a -b ru ta ...1 1 0
Figura 60- Entropia das imagens resultantes para os diferentes janelas de suavização para o algorítm o de fo rç a -b ru ta ...1 1 0
Tabela 2 - Tem pos de execução (em segundos) para a imagem B arbara...112
Tabela 3 - Tem pos de execução (em segundos) para a imagem B a rc o s ... 112
Tabela 4 - Tem pos de execução (em segundos) para a imagem Rio H unza... 112
Tabela 5 - Tem pos de execução (em segundos) para a imagem Y e llo w s to n e ... 113
Tabela 6 - Entropias resultantes para a imagem B a rb a ra ... 113
Tabela 7 - Entropias resultantes para a imagem B arcos... 114
Tabela 8 - Entropias resultantes para a imagem Rio H u n z a ... 114
Tabela 9 - Entropias resultantes para a imagem Y ellow stone... 114
A C O BSPPM -A nt-C olony Optim ization B ased B inary Search P oint M atching BA -B at Algorithm
C HBM A -C ooperative H oney Bee M ating Algorithm DE- D ifferential Evolution
DPSO -D arw inian Particle Swarm O ptim ization FA - Firefly Algorithm
FASSO -Fuzzy A daptive Sw allow Swarm Optim ization
FO-DPSO -Fractional-O rder D arw inian Particle Swarm Optim ization GA -G enetic Algorithm
GO A - G rasshopper O ptim ization Algorithm GW O - Grey W olf O ptim izer
HBM A -H oney Bee Mating Algorithm HS - H irschberg-SinclairAlgorithm IGP -Interior G atew ay P rotocol MFO -M oth-Flam e Optim ization MRI - M agnetic Resonance Im aging M SSIM - Mean Structural Sim ilarity PSO - Particle Swarm O ptim ization
PSO G SA -Particle Swarm O ptim ization G ravitational Search Algorithm SCA -Sine Cosine Algorithm
SSO -Sim plified Swarm O ptim ization
W O A - Whale O ptim ization Algorithm
1. IN TR O D U Ç Ã O ...16
1.1 P R O B LE M A TIZA Ç Ã O ... 18
1.2 O B JE T IV O S ...19
1.2.1 Objetivo G e ra l... 19
1.2.2 Objetivos e sp e cífico s...19
1.3 JU S T IF IC A T IV A ...20
1.4 M ETO DO LO G IA DE P E S Q U IS A ... 21
1.5 ESTR U TU RA DO D O C U M E N T O ... 21
2. PR O C ESSAM EN TO DIGITAL DE IM A G E M ... 22
2.1 FUNDAM ENTO S DE IM AGENS D IG IT A IS ... 23
2.1.1 Etapas fundam entais do processam ento de im a g e m ...23
2.1.2 M odelo de im agens...24
2.1.3 Am ostragem e q u a n tiz a ç ã o ...25
2.1.4 Histogram a da im agem ... 26
2.1.5 Entropia em im a g e n s... 27
2.2Segm entação de im a g e n s ... 28
2.2.1 Lim iarização...29
2.2.2 Lim iarização por e ntropia... 31
3. REVISÃO DA LITE R A TU R A ... 35
4. M ETA-H EU RÍSTIC AS DE IN TELIG ÊNCIA DE E N X A M E ... 43
4.1 FUNDAM ENTO S DE IN TELIG ÊNCIA DE E N X A M E ...45
4.1.1Princípios biológicos da inteligência de enxam e ... 46
4.1.2 Processo de auto-organização de um en xam e ... 47
4.1.3 Categorização de co m p ortam e n to s...48
4.1.4 M odulação de com portam entos a u to -org a n iza d o s... 49
4.2.2 O tim izador form iga-leão (A nt Lion Optimizer, A L O )... S8 4.2.3 Algoritm o de otim ização por enxam e de partículas (Particle Swarm
Optimization, P S O )... 70
4.2.4 Algoritm o de otim ização por enxam e de partículas Darwiniano (Darwinian Particle Swarm Optimization, D P S O )... 74
4.2.5 Algoritm o de otim ização por enxam e de partículas Darwiniano de ordem fracionária (Fractional-O rder D arw inian Particle Swarm Optimization, FO-DPSO ) ... 77
5. IM AGENS DE T E S T E ...79
6. AN ÁLISE DE R E S U L T A D O S ...84
6.1 D ETERM INAÇÃO DOS PARÂM ETRO S DE C O N T R O LE ... 84
6.1.1 O tim izador form iga leão (A L O )... 84
6.1.2 O tim izador lobo cinzento (G W O )...8 8 6.1.3 O tim izador por enxam e de partículas (P S O )...91
6.1.4 O tim izador por enxam e de partículas Darwiniano (D P S O )... 96
6.1.5 O tim izador por enxam e de partículas Darwiniano de ordem fracionária (FO- DPSO) ... 10S 6.1.6 O tim izador por fo rç a -b ru ta ... 108
7. CO M PARAÇÃO ENTRE M ETA-H EU RÍSTIC AS DE O TIM IZAÇÃO E A LG O R ITM O F O R Ç A -B R U T A ...112
8. CO NCLUSÃO E FUTURA P E S Q U IS A ...11S R E F E R Ê N C IA S ... 117
1. INTRO DUÇÃO
Diversos m étodos são sugeridos na literatura para o processo de segm entação de imagens, tais como (CHEN e t al., 2018;W ANG , B.; CHEN; CHENG, 2018). Um método sim ples e eficaz que vem sendo am plam ente utilizado é o de lim iarização e m ultilim iarização (MERZBAN; ELBAYOUMI, 2019). A segm entação de imagens é uma etapa relevante no processam ento de imagens, pois uma segm entação ineficiente pode com prom eter os próxim os passos do processam ento, como, por exemplo, a interpretação dos dados contidos na imagem.
A m ultilim iarização ou lim iarização m ultinível é uma técnica que visa separar os diferentes objetos contidos na imagem. Entende-se que quanto m elhor segm entados estão os objetos de interesse em uma imagem, mais inform ações essa imagem transm ite. Para m edir a quantidade de inform ação contida em uma imagem é utilizada a entropia da mesma, logo os limiares da m ultilim iarização que resultem em uma segm entação adequada podem ser obtidos quando a entropia da imagem é m axim izada.A entropia é uma m edida de desordem ou uma medida de inform ações heterogêneas e é sabido que a quantidade de inform ação não pode ser negativa (KARCI, 2016).
M ultilim iarização é considerado um problem a para o qual as abordagens clássicas de métodos de otim ização pode ser com plexas de aplicar com eficiência. Sendo assim, o em prego de m eta-heurísticasse torna recom endado (H IN O JO SA e t al., 2018). As m eta-heurísticas podem obter soluções para problem as de otim ização com putacionalm ente intratáveis obtidas por meio de métodos exatos, cuja form ulação m atem ática não é com pletam ente conhecida ou cujos requisitos são difíceis de serem atendidos usando abordagens convencionais de otimização, em contrapartida seus resultados não são necessariam ente ótimos. O term o heurística deriva da palavra grega heuristiken, que significa encontrar ou descobrir. As m eta- heurísticas buscam por soluções subótim as de boa qualidade, visando obter um com prom isso entre a qualidade das soluções obtidas e o custo com putacional para exploração do espaço de busca. No entanto, as m eta-heurísticas podem não apresentar garantia de factibilidade e/ou otim alidade das soluções encontradas.
Uma m eta-heurística pode ser definida como um ou mais heurísticascom binadas de form a a operar em sinergia na busca por soluções promissoras. As m eta-heurísticas são geralm ente aplicadas a problem as para os quais não existe um algoritm o capaz de resolver o problem a ou quando estes requerem acentuadas quantidades de recursos com putacionais, tornando inviável sua aplicação prática.
Uma vez que am axim ização da função objetivo da entropia na m ultilim iarização é um problem a cuja solução analítica é inviável(H IN O JO SA e t al., 2018), o que justifica necessidade de utilização de m eta-heurísticas de otim ização em sua resolução. Exem plos de m eta-heurísticas de otim ização são os algoritm os bio- inspirados de inteligência de enxames, que emulam características da inteligência coletiva e social na resolução de problem as (ERTENLICE; KALAYCI, 2018, M AVROVOUNIO TIS; LI; YANG, 2017;KO LIAS; KAM BOURAKIS; M ARAG OUDAKIS,
2 0 1 1).
A Inteligência de enxames, é um conjunto de técnicas inspiradas no com portam ento coletivo de sistem as auto-organizados, distribuídos, autônom os, flexíveis e dinâm icos. Estes sistem as são form ados por uma população de agentes com putacionais sim ples que possuem a capacidade de perceber e m odificar o seu am biente de m aneira local. Esta capacidade torna possível a com unicação entre os agentes, que captam as m udanças no am biente geradas pelo com portam ento de seus congêneres. Em bora não exista uma estrutura centralizada de controle que estabelece com o os agentes devem se comportar, e m esm o não havendo um m odelo explícito do ambiente, as interações locais entre os agentes geralm ente levam ao surgim ento de um com portam ento global que se aproxim a da solução do problem a (SERAPIÃO , 2009).
O algoritm o de O tim ização por Enxam e de Partículas (do inglês,P article Swarm O ptim ization (PSO) (KENNEDY; EBERHART, 1995) é uma m eta-heurística inspirada nos processos sócio-cognitivos observados e em pregados em m odelos abstratos da inteligência e aprendizado coletivo. O PSO, desde sua inicial proposição, têm sido influenciado pelos conceitos da com putação evolucionária.
Existem outras abordagens de PSO que podem ser eficientes para problem as de otim ização global. O algoritm o de O tim ização por Enxam e de Partículas Darwiniano (do inglês, Darwinian P article Swarm Optimization, DPSO) (TILLETT; RAO; e t al.,
2005) foi concebido visando uma cálculo paralelo utilizando o PSO, na tentativa de m elhorar a sua velocidade de convergência e qualidade de soluções obtidas.
O algoritm o de O tim ização por Enxame de Partículas Darwiniano de ordem fracionada (do inglês, F ractional-O rder D arw inian Particle Swarm Optimization, FO- D P S O )(C O U C E IR O et al., 2012) é uma extensão do DPSOna qual o cálculo fracionário é utilizado para controlar a taxa de convergência do algoritmo. O algoritm o DPSO, em bora apresente um desem penho superior quando com parado com o PSO para muitos problem as teste (benchm arks) de otim ização global no dom ínio contínuo, apresenta tam bém a desvantagem de ser mais com plexo com putacionalm ente, O FO-DPSO por sua vez controla a taxa de convergência do DPSO utilizando cálculo fracionário (SO LTEIRO PIRES e t al., 2010).
O O tim izador do Lobo C inzento (G rey W o lf O ptim izer (GW O ))(M IRJALILI;
MIRJALILI; LEWIS, 2014)é baseado no com portam ento social e hierárquico apresentado na alcatéia dos Lobos cinzentos (Canis Lupus). Quatro tipos de lobos são utilizados na sim ulação de liderança e hierarquia, sendo eles alpha, beta, delta e ômega. Adicionalm ente, são im plem entados os três passos da caça ao alimento, sendo tais passos: procura pela presa, cerco sobre a presa e o ataque em si.
O O tim izador Form iga-Leão (Ant Lion Optimizer, ALO )(M IR JALILI, 2015) é inspirado no com portam ento de caça das larvas de Form iga-leão, baseado na construção de arm adilhas para atrair a presa. Os passos principais da caça são im plem entadosincluindo a m ovim entação aleatória das form igas, a construção de arm adilhas, o aprisionam ento das form igas nas arm adilhas, captura da presa e a reconstrução das armadilhas.
1.1 PROBLEM ATIZAÇÃO
Muitas m eta-heurísticas têm sido avaliadas quanto ao seu desem penho em encontrar solução para problem as de otim ização global (D A S et al., 2011) e (SALCEDO -SANZ, 2016). O algoritm o de O tim ização por Enxam es de Partículas (PSO) foi proposto em (KENNEDY; EBERHART, 1995) e desde então pesquisadores procuram testá-lo em diferentes problem as e tam bém tentam propor m elhoram entos ao algoritmo, entre eles estão os algoritm os de Otim ização por Enxam es de Partículas Darwiniano (DPSO) e O tim ização por Enxam es de Partículas D arwiniano de Ordem Fracionária (FO-DPSO), publicados em (TILLETT; R AO et al.,
2005 e C OUCEIRO e t al., 2012) respectivam ente. O O tim izador do Lobo Cinzento (GW O) e o O tim izador Form iga-leão (ALO) são algoritm os que foram publicados recentem ente em (MIRJALILI; MIRJALILI; LEWIS, 2014; M IRJALILI, 2015), respectivam ente.
A m axim ização da função objetivo da lim iarização m ultinível por entropia de imagens é desafiadora e pode ser considerada com o um apropriado problem a de otim ização global para testar o desem penho desses algoritm os. Quanto m aior o núm ero de lim iares na limiarização, mais com plexa esse tipo de segm entação de imagem se torna.
O problem a considerado nestadissertação é a m axim ização da função objetivo da lim iarização m ultinível por entropia de imagens, para gerar uma segm entação em que os objetos de interesse na imagem estejam adequadam ente separados.
1.2 OBJETIVOS
A seguir são m encionados os objetivo geral e os objetivos específicos desta dissertação.
1.2.1 Objetivo Geral
O objetivo geral desta dissertação é com parar o desem penho de diferentes meta- heurísticas de otim ização baseadas em inteligência de enxam es visando a m ultilim iarização baseada em informação de entropia de imagens.
1.2.2 Objetivos específicos
Os objetivos específicos desta dissertação são os seguintes:
• Projetar, im plem entar e validar o algoritm o de otim ização baseado em Enxam e de Partículas e suas variantes Darwiniana e de Ordem Fracionária;
• Projetar, im plem entar e validar o algoritm o de otim ização baseado no com portam ento dos Lobos Cinzentos;
• Projetar, im plem entar e validar o algoritm o de otim ização baseado no com portam ento da Formiga Leão;
• A plicar as m eta-heurísticasde otim ização im plem entadas ao estudo de caso de m ultilim iarização de imagem;
• Definir os parâm etros de controle (hiperparâm etros) das m eta-heurísticas de otim ização utlizadas, de form a que seja possível a sua com paração e análise do desem penhodas m esm as em term os de convergência e qualidade das soluções obtidas;
• M edir o desem penho dos algoritm os no m étodo de segm entação escolhido, em term os de tem po com putacional e entropia das imagens resultantes, por meio de análise de desem penho frente a problem asteste apresentados na literatura recente.
1.3 JU STIFIC ATIVA
A segm entação de imagem vem apresentando crescim ento significativo e é utilizada em vários ramos do conhecim ento. Tanto que, por exemplo, possui aplicação em diagnóstico de doenças, fotointerpretação na agricultura, reconhecim ento de faces em imagens, controle autom ático de tráfego, sistem as de visão com putacional para veículos autônom os e identificação de placas de veículos em equipam entos de m onitoram ento de trânsito, entre outros. Os m odelos com putacionais clássicos de segm entação de imagem não são, m uitas vezes, suficientes na resolução de problem as nas mais diversas aplicações em que a segm entação de im agens pode atuar. Logo, há a necessidade de busca de soluções e alternativas mais eficazes.
Nesse contexto, a utilização de m eta-heurísticas de otim ização vem sendo cada vez mais comum, com a geração de m odelos que se com portem de form a inspirada em m odelos inteligentes presentes na natureza. Uma inspiração no projeto de meta- heurísticas de otim ização é o estudo de algoritm os de otim ização de inteligência de enxames, que são algoritm os que possuem características de com portam ento coletivo e social e que atuam na otim ização de soluções para muitas áreas do conhecim ento (M AVRO VO UNIOTIS; LI; YANG, 2017).
Conform e m encionado, esta dissertação aborda cinco m eta-heurísticas de otim ização baseadas em inteligência de enxam es e avalia seus desem penhos em segm entar as imagens teste escolhidas. O desem penho das m eta-heurísticas de otim ização é avaliado levando em consideração tantoo tem po de execução quanto a entropia das imagens resultantes. Essadissertação pode ser útil para determ inar uma solução mais eficiente, em term os de desem penho com putacional e entropia da imagem resultante,para a m ultilim iarização de imagens, apresentando evidências em favor da m eta-heurística escolhida. Essa dissertação pode tam bém ser
considerada um elo dentro da série de estudos sobre a utilização de meta- heurísticas de otim ização aplicadas ao problem a de m ultilim iarização de imagem.
1.4 M ETO DO LO G IA DE PESQ UISA
A m etodologia de pesquisa pode variar conform e sua natureza. Com o este trabalho tem o objetivo de com parar desem penho de m eta-heurísticas de otim ização em segm entação de imagem por lim iarização m ultinível por entropia, ou seja, procura gerar conhecim entos para aplicação prática dirigida à solução de um problem a específico e não universal, a natureza da pesquisa é aplicada.
Ela tam bém pode ser considerada quantitativa, pois as im agens utilizadas para segm entação são digitalizadas por quantização e am ostragem e são convertidas em m atrizes de números, que são conjuntos de inform ações que podem ser classificados e analisados.
1.5 ESTR U TU RA DO DO CUM ENTO
O restante desta dissertação está organizado da seguinte form a.O capítulo 2 apresenta uma revisão da literatura sobre segm entação e lim iarização de im agens e tam bém sobre os algoritm os utilizados.
Depois, o capítulo 3 apresenta alguns conceitos fundam entais de processam ento de imagem e também esclarece a respeito de segm entação de im agens e lim iarização por entropia.O capítulo4 expõe algum as características das m eta-heurísticas utilizadas, explica resum idam ente a base dos algoritm os inspirados em inteligência de enxam es e ainda apresenta os conceitos dos algoritm os escolhidos para a segm entação de imagem.
O capítulo5 apresenta as im agens teste utilizadas e os seus histogram as correspondentes.O capítulo 6 detalha os resultadosda busca pelos melhores parâm etros de controle dos algoritm os abordados da inteligência de enxames.
O capítulo7 apresenta a com paração entre os resultados obtidos a partir de m eta- heurísticase os resultados obtidos a partir do algoritm o de força-bruta.O capítulo 8 é dedicado à conclusões obtidasnesta dissertação e à pesquisa futura.
2. PRO C ESSA M ENTO DIGITAL DE IMAGEM
Por Processam ento Digital de Im agens (PDI) entende-se a m anipulação de uma imagem por com putador de modo que a entrada e a saída do processo sejam imagens. O objetivo de se usar processam ento digital de im agens é m elhorar o aspecto visual de certas feições estruturais para o analista hum ano e fornecer outros subsídios para a sua interpretação, inclusive gerando produtos que possam ser posteriorm ente subm etidos a outros processam entos (CÂM ARA e t al., 1996). O resultado desse processo é a produção de outras imagens, estas já contendo inform ações específicas, extraídas e realçadas a partir das im agens "brutas” .
A inform ação de interesse é caracterizada em função das propriedades dos objetos ou padrões que com põem a imagem. Portanto, extrair inform ação de imagens envolve o reconhecim ento de objetos ou padrões. A m aior parte dessa atividade requer aprim oradacapacidade de cognição por parte do intérprete, devido à com plexidade dos processos envolvidos e à falta de algoritm os com putacionais precisos o suficientepara realizá-lo de form a automática.
O sistem a visual hum ano possui uma notável capacidade de reconhecer padrões.
Contudo, ele dificilm ente é capaz de processar o "enorm e” volum e de informação presente num a imagem. V ários tipos de degradações e distorções, inerentes aos processos de aquisição, transm issão e visualização de imagens, contribuem para lim itar ainda mais essa capacidade do olho humano.
Um dos focos das pesquisas na área de processam ento de imagens é o de rem over essas barreiras, inerentes ao sistem a visual humano, facilitando a extração de inform ações a partir de imagens.
Nas próxim as seções deste capítulo são apresentados alguns fundam entos do processam ento de imagens e o tipo de segm entação adotada nestadissertação.
2.1 FUNDAM ENTO S DE IMAGENS DIGITAIS
A lguns fundam entos do processam ento de im agens serão discutidos nesta seção, pois são base para o entendim ento da segm entação proposta.
2.1.1 Etapas fundam entais do processam ento de imagem
As etapas fundam entais do processam ento de imagem estão apresentadas na Figura 1.
Figura 1-Etapas do processam ento de imagem
Fonte:Adaptado de (PEDRINI; SCHWARTZ, 2008), p. 5.
A aquisição de imagens é realizada por meio de um sensor de im ageam ento, que poderia ser uma câm era de televisão, por exemplo, resultando em uma imagem digital. O pré-processam ento é o passo em que a imagem é tratada de form a a se aum entarem as chances de as etapas seguintes serem realizadas. Um exem plo de pré-processam ento é a rem oção de ruídos por meio de aplicação de filtros e o realce de contrastes. A segm entação é a divisão da imagem em partes m enores que sejam objetos que tenham algum a relevância para a determ inada aplicação. Essa etapa será detalhada na seção 2.2. A representação é a ação de representar uma imagem de uma form a que seja conveniente para o subsequente processam ento
com putacional. O processo de descrição procura extrair características da imagem que resultem em inform ações quantitativas, norm alm ente para classificação de objetos. O reconhecim ento rotula um objeto de relevência na imagem e a interpretação atribui significado a um conjunto de objetos (G O NZALEZ e W OODS, 2000;PEDR IN I e SCHW ARTZ, 2007).
2.1.2 M odelo de imagens
SegundoRUSS (2002) uma imagem m onocrom ática, com som ente tons de cinza, pode ser representada por uma função de níveis de cinza ou de intensidade luminosa, definida como f ( x , y). A am plitude das coordenadas ( x , y ) fornece o brilho, ou a intensidade da imagem naquele ponto. Como m ostra a Figura 2, uma m atriz bidim ensional também pode ser utilizada para representar uma imagem, em que cada elem ento ( x , y ) da m atrizrepresenta um p ixe l da imagem. Cada p ixe l da imagem contém o valor de intensidade ou nível de cinza igual a f ( x , y ) correspondente. A Figura 3 m ostra um detalhe de uma imagem aérea, na qual cada pixe l contém seu respectivo nível de cinza, e apresenta a m atriz correspondente do detalhe ampliado, cujos elem entos são os valores da intensidade de cada p ix e l.
Figura 2-Im agem representada por uma m atriz f(x,y)
Fonte: Tecnologia radiológica, 2015.
Figura 3- Detalhe am pliado de uma imagem
Fonte: W ordpress, 2015.
2.1.3 Am ostragem e quantização
SegundoPED RINI eS C H W A R TZ (2007), para que a função f ( x , y), apresentada na seção anterior, possa ser tratada por processam ento com putacional, ela precisa ser digitalizada tanto em am plitude como espacialm ente. A digitalização espacial é a am ostragem , na qual são escolhidos o núm ero de linhas e colunas da m atriz que representará a imagem. A de am plitude é a quantização, que também pode ser denom inada de quantização em níveis de cinza.
Norm alm ente, a qualidade da imagem se dá pela am ostragem com que é realizada.
Quanto m aior o núm ero de linhas e colunas da m atriz que representa a imagem, m aior é a qualidade. O tam anho da m atriz é com um ente conhecido como resolução da imagem. Logo quanto m aior a resolução da imagem, m aior é a qualidade. A am ostragem insuficiente de uma imagem pode fazer com que os contornos presentes na imagem tenham aparência serrilhada (GONZALEZ; W OODS, 2000).
Quanto m aior a quantização, ou quanto m aior a quantidade de níveis de cinza para representar uma imagem, mais fiel é a representação da imagem digital com relação à imagem real. Uma imagem com quantização insuficiente pode gerar falsos contornos, que em uma representação da imagem com quantização suficiente, estariam em níveis de cinza distintos. Com o a imagem está insuficientem ente quantizada, esses contornos acabam se tornando um contorno único, que é diferente do contorno presente na imagem real (PEDRINI; SCHW ARTZ, 2007).
2.1.4 Histogram a da imagem
O histogram a é a form a mais comum de se representar a distribuição dos tons de cinza em uma imagem. A representação é feita por meio de um gráfico em que o eixo das abcissas são os níveis de cinza e o das ordenadas são quantidades de pixels. O histogram a é a relação entre intensidade e quantidade de pixels, ou seja, cada ponto do gráfico representa a quantidade, em toda a imagem, de pixels que contêm a intensidade da abcissa do ponto da curva (GONZALEZ; W OODS, 2000). A Figura 4 m ostra uma imagem e seu histograma.
Figura 4 - Histogram a de imagem
Fonte:Adaptado de (HOMEPAGES, 2015).
Uma imagem possui um único histograma, porém um histogram a não representa som ente uma imagem. Geralmente, diferentes im agens podem ser representadas pelo m esm o histograma. O histogram a ainda pode ser considerado como uma distribuição de probabilidades discreta. Nesse caso, o núm ero de pixels para uma determ inada intensidade é usado para calcular a probabilidade de se encontrar um p ixe l com aquele valor de intensidade. Assim o histogram a p ( f ) pode ser definido
como
n i
P( 0 = — n (2.1)
o n de n jcorre sp o nd e ao núm ero de ocorrências da intensidade te n é o núm ero total de pixels na imagem f (GONZALEZ; W OODS, 2000; PEDRINI; SCHW ARTZ, 2007).
2.1.5 Entropia em imagens
SHANNON (1948) introduziu a Teoria da Informação, que apresenta um novo m odelo m atem ático para sistem as de com unicação. A intenção do pai da teoria da inform ação era descobrir as leis que governam os sistem as usados em com unicação e m anipulação da informação. Seu objetivo era tam bém definir, em m edidas quantitativas, a inform ação e a capacidade de sistem as de transm itir, am azenar e processar informação. Um dos frutos de seus estudos foi o princípio fundam ental da teoria da inform ação que estabelece que a geração de inform ação pode ser m odelada como um processo probabilístico.
Em seu trabalho, Shannonfoi quem difundiu prim eiram ente o conceito de entropia na informação, com o uma form a de m edição quantitativa da informação, baseando-se na expressão de entropia de Boltzm ann (1896) da term odinâm ica. Para Shannon, a quantidade de inform ação transm itida por um canal de com unicação é inversam ente relacionada com a previsibilidade da m ensagem. Uma m oeda com duas caras, por exemplo, não transm ite informação, pois a mensagem originada pelo lançam ento da m oeda é sem pre cara, a probabilidade é 1, ou 100%, não há incerteza (GONZALEZ;
W OODS, 2000).
Uma imagem pode ser considerada como o resultado de um processo estocástico. A probabilidadepjcorrespondeà probabilidade de um p ixe l assum ir uma intensidade, ou nível de cinza, i, tal que i = 0 , 1 , . . . , L máx, em que L máx é valor m áxim o da escala de cinza. A função densidade de probabilidade pode ser obtida pela função do histogram a (2.1) em que Xf™ g*Pí = 1 e p j é a probabilidade do i-ésim o tom ser utilizado novam ente (PEDRINI; SCHW ARTZ, 2007).
A entropia H de uma imagem pode ser calculada como
(2.2)
e seu valor é sem pre positivo. A base do logaritm o na Equação 2.3 determ ina a unidade com que se mede a entropia. Utilizando-se um logaritm o de base r , a m edida da entropia é em unidades r-árias. Se a base fo r 2, a unidade resultante é binária, ou em bits. Quando todos os pixels da imagem possuem o m esm o nível de cinza, o valor da entropia é zero, o m enor possível. Já, quando a entropia é máxima, é porque a imagem contém a m esm a quantidade de pixels para todos os níveis de cinza (BOVIK, 2009).
Na Figura 5, a imagem A apresentada possui entropia zero, já a imagem B possui entropia máxima, considerando as im agens de tam anho igual a 256x256 pixels.
Figura 5 - Imagem A com entropia zero e imagem B com entropia máxima
Fonte: Adaptado de (PEDRINI; SCHWARTZ, 2008), p. 29.
2.2S egm entação de imagens
A análise de im agens é uma área do processam ento de imagens em que há a extração de inform ação de uma imagem. Normalmente, a prim eira etapa em análise de im agens é a segm entação de imagens. Essa etapa divide uma imagem em partes m enores que se diferenciam entre si, que são objetos de interesse ou de
relevância para uma determ inada aplicação. Uma das etapas seguintes à segm entação de imagem é a interpretação de imagem, que é um processo complexo. A subdivisão de form a efetiva da imagem pode auxiliar esse passo seguinte da análise de im agens (WANG, W EIW EI; WU, 2017).
A segm entação da imagem deve ser realizada até um nível em que os objetos de interesse estejam isolados. Há várias técnicas de segm entação de im agens e geralm ente elas são baseadas nas propriedades dos níveis de cinza:
descontinuidade e sim ilaridade. A prim eira abordagem é a subdivisão da imagem levando-se em conta as m udanças abruptas dos níveis de cinza. Já a segunda abordagem procura agrupar pontos da imagem cujos valores de nível de cinza sejam sim ilares (PEDRINI; SCHW ARTZ, 2007).
2.2.1 Lim iarização
Segundo G O NZALE Z e W O O DS (2000), a lim iarização é uma das principais técnicas de segm entação de imagem. Ela é baseada na sim ilaridade dos valores de nível de cinza da imagem. Um histogram a dos níveis de cinza H ( L ) d e uma imagem f ( x , y ) é apresentado na Figura 6, de form a que os pixels dos objetos e os do fundo tenham seus níveis de cinza dividos em dois grupos dom inantes. Uma form a de diferenciar os objetos do fundo é estabelecendo um limiar Tq u e separe os dois grupos. Cada ponto ( x , y ) da imagem, tal que f ( x , y ) > T, é classificado com o um ponto que pertence ao objeto e cada ponto em que f ( x , y ) < T é identificado como um ponto do fundo. A imagem lim iarizada g ( x , y ) é então definida como
Essa lim iarização é definida também com o binarização, porque os pixels com níveis de cinza de valor m aior que o lim iar T recebem o valor 1, correspondente ao fundo da imagem, enquanto os que de valor m enor recebem o valor 0, que corresponde
0, se f ( x , y ) < T
1, se f ( x , y ) > T (2.3)
aos objetos. Ou seja, a imagem resultante tem apenas dois valores de intensidade, 1 (cor branca) e 0 (cor preta).
Figura 6- Histogram a de níveis de cinza, divididos por um limiar único T
G ' N ív e l d e
cin za
Fonte: Adaptado de (3D-DOCTOR, 2008).
A Figura 7 apresenta os níveis de cinza dos pixels de uma imagem f ( x , y ) , de form a que essas intensidades estão divididas em três grupos. Para separar esses grupos, dois limiares 7 \ e T2 podem ser escolhidos. Esse histogram a pode corresponder a uma imagem em que, sobre um fundo escuro, dois tipos de objetos são iluminados. Essa lim iarização é denom inada lim iarização m ultiníveis e pode ser definida como
g ( x , y ) =
l l t se f ( x , y ) < T 1 l 2, se T1 < f ( x , y ) < T 2
l 3) se f ( x , y ) > T 2
(2.4)
tal que, para cada intervalo, há a especificação deum a intensidade l correspondente. Esse é um caso mais geral da binarização. Q uanto em mais grupos
os níves de cinza de uma imagem se concentrarem , mais limiares T são necessários para separá-los (PEDRINI; SCHW ARTZ, 2007).
Figura 7- Histogram a particionado em m últiplos limiares
Fonte: Adaptado de (GONZALES; W OODS, 2000), p. 316.
A utilização de apenas um lim iar na segm entação de toda uma imagem nem sem pre é adequada, levando em consideração que a imagem pode possuir valores de intensidades próxim os entre os tipos de objetos ou ainda entre um tipo de objeto e o fundo. Para situações assim, resultados m elhores podem ser alcançados por meio da lim iarização com m últiplos valores de limiares (PEDRINI; SCHW ARTZ, 2007).
2.2.2 Lim iarização por entropia
Conform e apresentado na seção anterior, há a necessidade de calcular os valores de lim iar na limiarização. Esse cálculo deve ser feito de modo que os lim iares façam uma "boa” separação entre os tipos de objetos presentes na imagem e entre os tipos de objetos e o fundo da imagem. Entre os m elhores métodos de cálculo de limiares, as lim iarizações baseada em entropia têm atraído a atenção de pesquisadores, dentre as quais o método de lim iarização de (KAPUR; SAHOO; W ONG, 1985) baseado em entropia foi considerado com desem penho superior pelos pesquisadores (HARNRNO UCHE; DIAF; SIARRY, 2010; AKAY, 2013) com parado com outras técnicas de lim iarização (BHANDARI e t al., 2014).
2.2.2.1 Método de lim iarização binível de Kapur baseado em entropia
PUN (1980)propôs um método de lim iarização em que se procura a m axim izar a entropia de uma imagem. Nesse método a distribuição de probabilidade dos níveis de cinza do histogram a deve estar separada em duas classes distintas: uma representando o objeto e a outra, o fundo da imagem. As entropias H b ( T) e H W( T ) associadas, respectivam ente, aos pixels do fundo da imagem e do objeto, são definidas por
Hb( T) = - ^ P i l o g p i
i = 0
L—l
CO = - ^ Pi i°g Pi
í = 0 (2.5)
L —l v '
Hw
Í= T+ 1
Sendo E[=<d"Pí = 1, V i = ~ , tal que pt é a probabilidade de a intensidade is e r encontrada na imagem, é o núm ero de pixels com intensidade i, n é o núm ero de pixels presente na imagem eLé o núm ero de intensidades da imagem. É feita a análise da escala de intensidades com o objetivo de determ inar um valor de limiar T de form a que T = H b ( T ) + H W( T ) seja de valor máximo, resultando em um aapropriada separação entre o fundo da imagem e o tipo de objeto ((PEDRINI;
SCHW ARTZ, 2007), ou seja,
T = argm a x[ Hb(T) + HW( T)] (2.6)
KAPUR; SAHOO e W O NG (1985)propuseram que as entropias entropias H b ( T ) e H W( T), diferentem ente dePUN (1980), sejam calculadas por
P2(T) * p 2(T) Pi , Pi
Pi , Pi
(2.7)
(2.8)
sendo p^ T) = ?J = oPíP2(T) = Y? Í = t + iPíe P i(T ) + p 2( T) = 1. Como nos trabalhos de (PUN, 1980), é realizado um processo de escolha do limiar T com objetivo de m axim izar a equação2.6.
2.2.2.2 Método de lim iarização m ultiníveis de Kapur baseado em entropia
Na seção anterior, foi considerado o método de Kapur (1985) apenas para um único lim iarT, porém esse método pode também ser estendido para m últiplos limiares (SATHYA; KAYALVIZHI, 2011), em que, na imagem, há vários tipos de objetos relevantes, conform e segue
onde t±... t m são os m últiplos limiares. Como Pun (1980, 1981), os lim iares tq u e m elhor separem os tipos de objetos entre si e os tipos de objetos do fundo da imagem são encontrados com a m axim ização da som a das entropias, dado pela equação 2.1 1, ou seja
(2.9)
t = argm ax Ii=o
Ht (2.1 0)
tal que té um vetor que contém os m últiplos limiares t±... t m que maximizam a equação 2.11 (BHANDARI e t a l, 2014).
O foco da otim ização nesta dissertação é m axim izar a função objetivo representada pela equação 2.11por m eiode m eta-heurísticas de otim ização. Estas serão detalhadas no capítulo 4.
3. REVISÃO DA LITER ATUR A
Uma abordagem integrada à segm entação de im agens é apresentada por (BHALERAO; W ILSO N, 2001) que com bina inform ações de região e fronteira usando a estim ativa m áxim a a posteriori e a teoria da decisão. O algoritm o em prega estim ativa iterativa, orientada a decisão, realizada em uma nova representação m ulti-resolução.
O uso de uma técnica de m ulti-resolução garante tanto a robustez em relação ao ruído quanto a eficiência da com putação, enquanto o processo de decisão e estim ativa baseado em m odelo é flexível e espacialm ente local, evitando suposições sobre hom ogeneidade global ou tam anho e núm ero de regiões. Uma avaliação com parativa do método em relação a m étodos únicos som ente para região e som ente para fronteira é apresentada e m ostra que eles produzem segm entações precisas com índices de sinal e ruído baixos.
A m istura finita é uma ferram enta de m odelagem probabilística flexível e poderosa, podendo ser usada para fornecer um grupo (cluster) baseado em m odelo no campo de reconhecim ento de padrões. No entanto, a aplicação de m isturas finitas à segm entação de im agens apresenta algum as limitações, tais como a estim ativa do núm ero de com ponentes ainda ser uma questão aberta e o agrupam ento de dados baseado em m istura não considerar inform ações espaciais, o que é im portante para que regiões suaves sejam obtidas nos resultados da segm entação. Na pesquisa de (YANG, XIANGYU; KRISHNAN, 2004), a informação espacial é usada como um conhecim ento prévio do núm ero de com ponentes. A inform ação espacial não indica o valor do núm ero de com ponentes, em vez disso, ela fornece algum as inform ações indiretas sobre esse valor. Um algoritm o baseado em m axim ização de expectativa é desenvolvido para estim ar a densidade da m istura usando a inform ação indireta. Os resultados experim entais com dados sim ulados da m istura G aussiana bidim ensional mostram que o algoritm o proposto é capaz de estim ar o núm ero de com ponentes com precisão sem usar nenhum critério de seleção do modelo. Os resultados da segm entação de im agens mostram que o algoritm o proposto possui m elhor desem penho na geração de regiões suaves nos resultados da segm entação em
com paração com os algoritm os com uns que utilizam os critérios de seleção do m odelo para estim ar o núm ero de componentes.
Uma form a alternativa de avaliação de desem penho para algoritm os de segm entação de imagem é apresentada por POLAK; ZHANG e PI (2009), definindo uma nova m edida de erro para a qualificação do algoritmo. Tal m edida de erro é baseada em com parações objeto-a-objeto entre a imagem segm entada e uma imagem de referência considerada com o verdadeira, levando em consideração o tam anho, a form a e a posição de cada objeto. Com parada com as m edidas de erro existentes o método proposto funciona no nível do objeto e é sensível tanto à sub- segm entação quanto à sobre-segm entação.
LO e t al.(2011) apresentam em sua pesquisa um método de segm entação de im agens a partir das características de textura invariantes de escala e rotação a partir da transform ada de com plex dual tree w avelet para a extração de características. O desem penho da segm entação de imagem utilizando esse novo método é então com parado com diferentes técnicas sobre diferentes bases de imagens, dem onstrando um desem penho satisfatório sobre imagens em geral e um desem penho particularm ente satisfatório sobre im agens que contenham objetos com texturas escalonadas e rotacionadas.
Um método tam bém utilizado para realizar a segm entação de im agens é a m áquina de vetor de suporte (do inglês, Support Vector M achine (SVM)), graças à sua utilidade em inúmeras áreas, tais como classificação de imagens, categorização de texto e reconhecim ento de escrita manual. Um dos principais problem as de pesquisa é com o m elhorar a eficiência do m odelo SVM original sem deteriorar o seu desem penho de classificação. Por isso, YU; W O N G e W EN (2011) propõem e sua pesquisa um algoritm o baseado em SVM m odificando as propriedades dos vetores de suporte e uma estratégia de poda para preservar vetores de suporte, ao m esm o tem po em que elim ina vetores de treinam ento redundantes. Os experim entos realizados mostram que a aproxim ação proposta pode reduzir a quantidade de vetores de treinam ento na entrada, preservando os vetores de suporte, o que leva a uma redução significativa no custo com putacional obtendo níveis de precisão similares, apresentando sucesso em aplicações de segm entação de imagens.
Em sua pesquisa, SONG e t al.(2015) propõem a utilização do algoritm o de otim ização baseado no com portam ento dos lobos cinzas (GW O) para resolver o problem a de inversão da curva de dispersão das ondas de superfície. A estratégia proposta é analisada utilizando dados da cam po com e sem ruído embutido. Para a verificação, os resultados obtidos com o GW O foram com parados com o algorítm o genético (GA), o algoritm o híbrido entre o otim izador por enxam e de partículas e o algoritm o de busca gravitacional (Particle Swarm Optim ization and G ravitational Search Algorithm , PSOGSA), e com o algoritm o baseado em informação de gradiente. Os resultados, tanto dos dados sintetizados quanto dos dados reais dem onstraram que o GW O apresentou um apropriadoequilíbrio na exploração do espaço de busca, o que resultou em uma boa evasão de ótim os locais e uma convergência rápida. SONG e t al. (2015) enfatizam que as vantagens do GW O são de que ele é um algoritm o simples, flexível, robusto e fácil de implementar, tendo tam bém m enos parâm etros de controle para serem ajustados que m uitas m eta- heurísticas.
A correspondência por padrão de pontos (do inglês P oint Pattern Matching, PPM) é a tarefa de em parelhar os pontos em duas im agens de uma m esm a cena. Existem muitas abordagens na literatura para a correspondência por padrão de pontos, tal com o em ZHU; LIANG e YAN (2014), onde os autores propõem a utilização de um algoritm o PPM robusto para a decom posição de QR-codes. No entanto, a desvantagem reside na alta com plexidade dos algoritmos. Para superar esta desvantagem , Sreeja e S ankar (2015) propõem um algoritm o baseado na busca binária pelo ponto de correspondência utilizando otim izador baseado no com portam ento da form iga-leão (do inglês, A nt-C olony O ptim ization B ased B inary Search P oint M atching -ACOBSPPM ). De acordo com essa abordagem , as bordas da imagem são arm azenadas na form a de padrões de pontos. Os resultados experim entais mostram que o algoritm o AC O BSPPM é eficiente quando com parado com as abordagens existentes de correspondência de padrões de pontos em term os de com plexidade de tem po e de precisão.
O método de lim iarização de Otsu(O TSU, 1979) é uma aproxim ação clássica na segm entação de imagens. Embora o método de aproxim ação bidim ensional (2D) de Otsu apresente um desem penho m elhor que o original na segm entação de im agens corrom pidas por ruído, ele é sensível ao ruído do tipo Salt& P epper (Sal e Pimenta).
Na tentativa de resolver esse problema, SHA; HOU e CUI (2016) apresentam um método de Otsu bidim ensional robusto, construindo o histogram a bidim ensional baseado na imagem suavizada tanto por filtros de média e mediana, em contraste com o método original que utiliza apenas o filtro da média. O vetor de limiares ótim os é determ inado por duas buscas unidim ensionais nas duas dim ensões do histogram a bidim ensional, em adição foi inserido um pós processam ento por região para lidar com os pixels de ruídos e bordas. Nos resultados experim entais, com parado com o método tradicional de Otsu bidim ensional, o método proposto apresentou uma m elhora significativa quanto aos ruídos nos casos G aussiano e Salt&Pepper.
Entre outros métodos, a entropia cruzada m ínim a é im plem entada por sua efetividade e simplicidade, tal método é eficiente e fornece excelentes resultados em casos de bi-lim iarização, mas sua avaliação fica com putacionalm ente custosa quando extendida para a m ulti-lim iarização. Por isso, em sua pesquisa, PARE e t al.
(2016) adotaram uma técnica de m ulti-lim iarização baseada no algoritm o baseado em pássaros cucopara renderizar o algoritm os de entropia cruzada m ínim a multinível de form a mais prática, reduzindo sua com plexidade. Os resultados experim entais baseados em resultados qualitativos e diferentes parâm etros de fidelidade mostraram que a aproxim ação proposta seleciona valores de lim iarização ótim os de form a mais eficiente e precisa quando com parado com outras técnicas, também produz im agens segm entadas de alta qualidade.
Na tentativa de reduzir o tem po necessário, JIA N G et al.(2016) sugerem em sua pesquisa a utilização de um algoritm o de m ulti-lim iarização baseado no com portam ento das abelhas (do inglês, H oney Bee M ating Algorithm , HBMA), e no aprendizado cooperativo, o que aum entou consideravelm ente a capacidade de pesquisa do algoritmo. No algoritm o adotado, foi adotada uma nova estratégia de inicialização de população para tornar a pesquisa mais eficiente, o que foi com provado nos resultados em com paração com outros algoritm os utilizados, tais como algum as variações do PSO.
Segundo KHAIRUZZAM AN e C HAU D HU R Y (2017) a m ultilim iarização é uma das áreas de m aior im portância no cam po da segentação de imagem. Entretanto, a com plexidade com putacional da m ultilim iarização aum enta exponencialm ente com o aum ento do núm ero de limiares, então para superar esse problem a é proposta uma
aproxim ação GWO. Tal m eta-heurística é aplicada ao problem a de m ultilim iarização utilizando funções de entropia de Kapur e Otsu entre classes. O desem penho do m étodo proposto é com parado então com versões do otim izador por enxam e de partículas e com BFO (B acterial Foraging Optim ization) baseados em m étodos de m ultilim iarização. A qualidade das im agens segm entadas é com putada utilizando o índiceM ean S tructural S im ilarity (MSSIM). Os resultados experim entais mostram que o m étodo proposto é mais estável e elabora soluções de de m aior qualidade do que os m étodos utilizando PSO e BFO, entretanto o método proposto se m ostrou mais rápido que o BFO mas m ais lento que o método baseado em PSO.
A determ inação de limiares ótim os para a segm entação de im agens obteve cada vez mais atenção nos últimos anos devido ao fato de ter muitas aplicações. Os m étodos mais utilizados para determ inar um limiar único para imagem, tal com o Otsu e Kapur, podem facilm ente ser extendidos para casos de m ultilim iarização, entretanto o consum o de tem po aum enta consideravelm ente nessa aplicação. Para evitar esse problema, A ZIZ e t al.(2017) examinam os algoritm os W O A e MFO para determ inar os diversos lim iares para a segm entação de imagens. Os resultados foram com parados com outros cinco algoritm os baseados em inteligênicia de enxames, sendo eles: SCA (Sine Cosine Algorithm ), HS (H irsch b e rg -S in cla ir Algorithm ), SSO (S im plified Swarm Optimization), FASSO (Fuzzy A daptive S w allow Swarm Optim ization) e FA (Firefly Algorithm ). O sresultados apresentadosm ostraram que os m étodos propostos tiveram m elhor desem penho que os outros algoritm os baseados em inteligência de enxames, também que o MFO obteve m elhores resultados que os obtidos pelo WOA.
N A ID U et al.(2016) propuseram em sua pesquisa um algoritm o de m ulti-lim iarização de im agens baseado no algoritm o FA com o objetivo de m axim izar a entropia proposta por Shannon, de form a sim ilar à entropia fuzzy. O algoritm o proposto do testado em um conjunto padrão de im agens os resultados foram com parados com m étodos baseados em entropia Shannon utilizando os m étodos de otim ização DE (D ifferential Evolution), PSO (Sw arm Optim ization) e BA (B at Algorithm ). O método proposto na pesquisa exibiu um m elhor desem penho na função objetivo, no índice de sim ilaridade estrutural, na proporção entre o pico do sinal e o ruído, no erro de classificação e no tem po de execução com putacional do que os m étodos utilizados como base de comparação.