SEGMENTAÇÃO POR MINIMIZAÇÃO DA ENTROPIA CRUZADA

A entropia cruzada é calculada pela informação média de uma mensagem sob a perspectiva de um modelo estatístico. A Equação 10 contém o cálculo da entropia cruzada de acordo com a modelagem proposta:

= − |�|∑ ∑ (log �+∑log � � �= ) � = ∈� (10) na qual:

 |�| é o número de pixels da imagem �.  é um pixel da imagem.

 � é número total de clusters presentes na segmentação.

 é uma função que assume valor ‘1’ caso o pixel pertença ao

cluster e ‘0’ caso contrário.

 é o número de bandas que compõem a imagem.

 _� é a função densidade de probabilidade do cluster para os valores de na banda .

As funções são utilizadas para a construção dos modelos estatísticos de cada cluster por meio de estimação não paramétrica. O modelo estatístico de um

cluster é construído de modo que haja estimativa (maior que zero) para cada um dos

256 possíveis valores que um pixel pode assumir em cada banda da imagem. Dessa forma, cada cluster possui funções independentes para estimação de probabilidades, uma para cada banda, construídas por meio de histogramas. A Equação 11 contém o cálculo da probabilidade estimada por um cluster para a ocorrência de um determinado valor na banda :

� = + ∑�∈�_{+ ∑}� �_�, ��

�∈� (11)

A função _�, �� é um contador de ocorrências que assume valor ‘1’ quando _� e _�_� possuem o mesmo valor, e ‘0’ caso contrário. O numerador da Equação 11 representa o número de observações de um determinado valor dentro da classe durante a etapa de treinamento. O denominador da Equação 11 representa o número de pixels atribuídos à classe durante o treinamento. O modelo de cada cluster é inicializado com uma ocorrência para todos os 256 valores

MATERIAIS E MÉTODOS 51

em todas as bandas que compõem a imagem. A probabilidade estimada inicialmente para a ocorrência de qualquer valor em qualquer banda é, portanto, 1/256. Ao final do treinamento, a probabilidade estimada para um determinado valor em uma banda será a frequência relativa desse valor naquela banda.

Conforme discutido no Capítulo 2, estimações não paramétricas precisam de um número maior de amostras que estimações paramétricas. Caso o total de pixels atribuídos a um cluster seja baixo, a estimação para a iteração seguinte ficará comprometida, com aspecto ruidoso, pois na estimação por histograma a observação de um valor não interfere na estimação para valores vizinhos. Para contornar essa deficiência, é aplicado um filtro gaussiano sobre o histograma (Figura 10). Utilizando um raio como parâmetro, o filtro gaussiano é construído com média zero e desvio padrão igual a um terço do valor do raio.

FIGURA 10 - INTERPOLAÇÃO DE VALORES NO HISTOGRAMA

Em destaque, conjunto de pixels utilizado para o treinamento, determinado pela função r do cluster que pode ser classificado como “outros”. Ao lado, histograma antes e após a aplicação do filtro gaussiano. Fonte: autoria própria.

O algoritmo desenvolvido tem por objetivo minimizar a Equação 10 por meio da manipulação das funções rk. Duas abordagens foram desenvolvidas para a segmentação da imagem baseada na minimização da Equação 10. A primeira abordagem realiza classificação pixel a pixel e a segunda abordagem opera sobre regiões.

52 MATERIAIS E MÉTODOS

3.3.1 Segmentação Pixel a Pixel

A etapa inicial da segmentação pixel a pixel é o treinamento realizado a partir da classificação do algoritmo K-Médias. O K-Médias recebe como entrada o número de clusters e tem como saída as regiões na qual se divide a imagem inicialmente, representadas pelas funções rk, e que serão utilizadas para estimação das densidades de probabilidade de cada classe. Para adicionar contexto espacial ao algoritmo, é aplicado um filtro gaussiano sobre as funções rk, o que torna as regiões temporariamente borradas, com valores entre ‘0’ e ‘1’. Em seguida, as funções tornam-se binárias novamente, recebendo valor ‘1’ o ponto com maior valor entre todas as funções, e recebendo valor ‘0’ os pontos correspondentes das demais funções. Esse processo baseia-se na segmentação desenvolvida por Awate et al. (2006). A Figura 11 ilustra a adição de contexto espacial a uma segmentação por meio da suavização por um filtro gaussiano.

FIGURA 11 - SUAVIZAÇÃO DA FUNÇÃO R

Composição RGB 543 (a); Função r da classe hidrografia (b); Suavização da função r por um filtro gaussiano (c); Função r suavizada após binarização (d). Fonte: autoria própria.

MATERIAIS E MÉTODOS 53

É importante destacar que esse processo de suavização não altera diretamente a classificação final dos pixels, mas sim os conjuntos de treinamento que serão utilizados na próxima iteração do algoritmo. Ao final de cada iteração, cada cluster terá calculado a informação de cada pixel, que ficará armazenada sob a forma de uma matriz. Essa matriz de informação é suavizada por um filtro gaussiano com o intuito de controlar o nível de detalhe da segmentação. Após consultar a matriz de informação de cada cluster num determinado ponto, o pixel correspondente será atribuído ao cluster cuja matriz apresentar menor valor. O Algoritmo 4 descreve os passos para a redução da entropia cruzada.

ALGORITMO 4 - MINIMIZAÇÃO DA ENTROPIA CRUZADA Selecionar sementes para o K-Médias pelo método Max-Min. Executar o K-Médias.

Repetir:

Realizar convolução entre a função r de cada classe e um filtro gaussiano.

Atribuir cada pixel da imagem à classe que possuir maior valor de r naquele ponto. Estimar a densidade de probabilidade das classes de acordo com as funções r. Calcular a matriz de informação para todas as classes.

Realizar convolução entre a matriz de informação de cada classe e um filtro gaussiano. Atribuir cada pixel da imagem à classe que obtiver menor informação naquele ponto. Enquanto houver redução da entropia cruzada.

Fonte: Autoria própria.

3.3.2 Segmentação por Região

Uma segunda abordagem de segmentação foi desenvolvida com a finalidade de eliminar o treinamento realizado a partir da classificação pelo K-Médias, tornando a segmentação baseada puramente na entropia cruzada entre regiões, obtidas pela transformada Watershed. A Equação 10 passa a ter a seguinte restrição:

, ∈ � ⇒ =

i. e., dois pixels x e y que pertençam a mesma região R serão necessariamente atribuídos à mesma classe. A imagem gradiente G utilizada pela transformada

Watershed é calculada pela máxima resposta do operador de Sobel em cada pixel

54 MATERIAIS E MÉTODOS

= max_≤�≤�√ � + � , (12)

onde Gx(xb) e Gy(xb) são as componentes horizontal e vertical do vetor gradiente no pixel x, banda b. O Algoritmo 5 resume a segmentação baseada em regiões. Para a escolha das sementes, o método Max-Min foi modificado para selecionar primeiramente a região que possuir mais pixels e adotar a entropia cruzada como medida de dissimilaridade.

ALGORITMO 5 - MINIMIZAÇÃO DA ENTROPIA CRUZADA COM REGIÕES Executar a Transformada Watershed.

Selecionar sementes (regiões) pelo método Max-Min. Repetir:

Estimar a densidade de probabilidade das classes de acordo com suas regiões. Atribuir cada região à classe que obtiver menor informação.

Enquanto houver redução da entropia cruzada. Fonte: autoria própria.

Na Figura 12 é ilustrada a escolha das sementes e o processo de minimização da entropia cruzada com a utilização de regiões. A abordagem por pixel é semelhante.

FIGURA 12 - REDUÇÃO DA ENTROPIA CRUZADA

MATERIAIS E MÉTODOS 55

No exemplo da Figura 12, percebe-se que já existe distinção entre as classes hidrografia, vegetação e outros na primeira iteração, onde as densidades de probabilidade de cada cluster são estimadas apenas com as amostras de cada semente selecionada. As iterações seguintes utilizam o resultado da segmentação anterior para determinar um novo conjunto de treinamento para cada classe e, assim, obter um modelo estatístico mais preciso, capaz de reduzir a entropia cruzada e obter uma melhor segmentação. A Tabela 1 relaciona a entropia cruzada com a concordância observada para as iterações do algoritmo ilustradas na Figura 12.

TABELA 1 - RELAÇÃO ENTRE REDUÇÃO DA ENTROPIA E AUMENTO DA CONCORDÂNCIA Iteração Entropia Cruzada (bits/símbolo) Concordância Observada

1 14,84 62,08%

6 10,58 76,64%

42 10,49 92,18%

Fonte: autoria própria.

A entropia cruzada tende a ser reduzida ao longo das iterações do algoritmo, ao mesmo tempo em que a concordância observada tende a aumentar.

No documento Segmentação não supervisionada de imagens de sensoriamento remoto por minimização da entropia cruzada (páginas 50-55)