• Nenhum resultado encontrado

de regiões de upwelling em mapas SST

4.3 Segmentação de imagens SST com FCM e sua validação

Para a aplicação do algoritmo FCM (Secção 2.3.1) a cada um dos mapas SST, é feita uma transformação do mapa original para uma matriz de atributos. Assim, o input para o algoritmo será uma matriz-coluna contendo todos os píxeis com valores de temperatura legíveis, ou seja, removendo os píxeis relativos a extensões nebulosas ou terrestres, identificados com o valor NaN, e o número total de clusters.

A obtenção de segmentações com a execução do algoritmo FCM foi feita para os valores de c entre 2 e 10, inclusivé. Estes valores foram estabelecidos pretendendo gerar segmentações que vão desde o mais redutor possível (2 clusters), até um estado em que se atingem resultados com sobre-segmentação, ou seja, o número de regiões encontradas nos mapas é mais do que o pretendido, havendo um nível de detalhe superior ao desejável. O parâmetro de fuzzificação m foi estabelecido em 2, seguindo o valor mais utilizado na literatura.

Sabendo que a qualidade dos resultados obtidos pela aplicação do FCM é dependente da geração aleatória de protótipos iniciais, uma das soluções para contornar esta questão mais re- conhecida na literatura [13, 21] passa por aplicar o algoritmo várias vezes, sempre ao mesmo conjunto de dados mas com protótipos iniciais distintos e, dentro das várias aplicações esco- lher aquela que melhore a função objectivo Jm. No trabalho desenvolvido, cada execução do

algoritmo FCM conteve 10 computações, ou seja, o resultado de uma aplicação é o melhor re- sultado de 10 computações do algoritmo, partindo de protótipos iniciais distintos. Assim, para cada execução, entende-se por número de iterações total e tempo total de execução do algoritmo como a soma das iterações e tempo gasto no total das 10 computações.

Mesmo sendo possível reduzir o valor em algumas computações, um número bastante redu- zido de computações é insuficiente para garantir os melhores resultados, levando à possibilidade de convergência da função objectivo para mínimos locais.

No Anexo F estão disponíveis os resultados de segmentação (mapas de pertença e fronteiras crispde clusters), entre c = 2 e c = 10 clusters, por aplicação do FCM.

4.3.1 Validação do melhor número de clusters

A tentativa de resolução do problema em causa com o algoritmo FCM carece evidentemente de resolução para a questão transversal aos algoritmos de agrupamento relativa ao número de grupos. Mesmo sabendo que num mapa de temperaturas oceânicas não existem, per se, grupos naturais distintos, é necessário encontrar boas segmentações. Para resolver essa situação o método utilizado baseou-se na análise de índices de validação aplicados aos resultados obtidos, seguindo o procedimento de validação descrito na Tabela 2.5.

Por análise experimental, verificou-se que as segmentações feitas com base em números de clusters reduzidos, 2 ou 3, dão origem a piores resultados para a identificação da região de upwelling. Uma das razões para essa situação prende-se desde logo com a localização ge- ográfica dos mapas SST e as características da região. Por exemplo, independentemente da ocorrência de upwelling ou não, os píxeis que estão mais a Sul nos mapas, nomeadamente os que se encontram numa latitude inferior ao Algarve, possuem normalmente uma temperatura média superior aos restantes. Assim, quando se obtém uma segmentação com 2 clusters, in- dependentemente do algoritmo, é natural que os grupos encontrados reflictam essa morfologia, segmentando águas da Região Norte, de temperatura mais reduzida, de águas da Região Sul, de temperatura superior. Devido ao comportamento típico do upwelling na região em estudo, surgindo junto à costa Oeste da Penínsulo Ibérica e “crescendo” na direcção do oceano, numa segmentação com 2 clusters é improvável que se consiga identificar correctamente a região de upwelling. Em aplicações com 3 clusters verifica-se que, tipicamente, as segmentações obtidas ainda são muito redutoras em relação às massas de água que se visualizam no mapa SST ori- ginal, não conseguindo assim uma segmentação ideal, ou seja, aquela que permite distinguir os píxeis identificados como upwelling nas marcações feitas por oceanógrafos.

Com base nessa análise, constata-se nos resultados das Figuras 4.3-4.7 que a definição do número de clusters com base nos índices PC (Equação 2.23), PE (Equação 2.24), XB (Equa- ção 2.18) e PBMF (Equação 2.22) não resulta, regra geral, em boas segmentações para os 61 mapas. O índice que obtém melhores resultados é o FS (Equação 2.21), já que análise empírica aos resultados obtidos indicou que as segmentações obtidas com um número de clusters entre 5 e 7 dão origem a bons resultados, em termos de comparação com as anotações feitas por oceanó- grafos. Análise aos resultados obtidas com 9 e 10 clusters mostrou que, embora possibilitando o reconhecimento de regiões de upwelling, as segmentações obtidas estavam sobre-segmentadas. No problema em questão, não havendo uma definição exacta, entende-se por sobre-segmentação como um estado em que a segmentação obtida contém informação excessiva para a definição do upwelling, nomeadamente através de um excessivo número de clusters.

Figura 4.3 Frequência do número final de clusters, de acordo com o índice Partition Coefficient.

Figura 4.4 Frequência do número final de clusters, de acordo com o índice Partition Entropy.

Figura 4.5 Frequência do número final de clusters, de acordo com o índice Xie-Beni.

Figura 4.6 Frequência do número final de clusters, de acordo com o índice Fukuyama-Sugeno.