• Nenhum resultado encontrado

Definição de features e critério para identificação e anotação de re giões de upwelling

de regiões de upwelling em mapas SST

3.2 Definição de features e critério para identificação e anotação de re giões de upwelling

A problemática da identificação de regiões de upwelling está definida em dois grandes módu- los. Inicialmente, a partir de um mapa de temperatura, pretende-se obter uma boa segmentação, que possibilite a identificação da região pretendida. A aplicação do algoritmo AP-FCM, intro- duzido na secção anterior, tem como objectivo a obtenção de uma segmentação sem recorrer à necessidade de introduzir o número de clusters como parâmetro de entrada. Posteriormente, é necessário encontrar o sub-conjunto de clusters que definem a região de upwelling. Este sub-conjunto representa a região de interesse do estudo elaborado, sendo que o objectivo passa por separar essa região do background, ou seja, separar os clusters correspondentes à região de upwelling dos restantes. O cluster de temperatura média superior ainda pertencente à região de upwelling é considerado o cluster de interesse, já que é o cluster que separa a região de interesse do background.

Nesta secção introduzem-se os padrões das regiões de upwelling em mapas de temperatura e define-se um conjunto de features que, a partir de uma segmentação previamente obtida, possibilitam a criação de um critério composto para identificação do cluster de interesse e, consequentemente, da região de upwelling.

3.2.1 Caracterização de padrões de upwelling em mapas SST

Em situações ideais, a região de upwelling pode ser caracterizada como uma região que cresce perpendicularmente à Costa Oeste da Península Ibérica, e que é separada das restantes águas, não pertencentes a essa região, por uma zona de transição com um gradiente térmico elevado, ou seja, variação relativamente brusca da temperatura entre as duas regiões. No entanto, nem sempre ocorrem essas situações ideiais, havendo situações onde há uma existência excessiva de ruído nos mapas de temperatura ou a diferença entre a região de upwelling e o oceano ao largo não é tão evidente. O grupo de mapas SST disponibilizado pelo Instituto de Oceanografia da Universidade de Lisboa foi produzido com o objectivo de cobrir as várias situações em que o upwelling ocorre. Podemos caracterizar três situações distintas: mapa SST sem ruído e com região de upwelling bem definida em termos de gradientes térmicos (Figura 3.1), mapa SST sem ruído e região de upwelling mal definida (Figura 3.2) e mapa SST com ruído, devido fundamentalmente à presença excessiva de regiões com nuvens (Figura 3.3).

Figura 3.1 Mapa de temperaturas SST, (2 de Agosto de 1998), com upwelling bem definido, com anotação visual da região de upwelling.

Figura 3.2 Mapa de temperaturas SST (12 de Junho de 1998), com upwelling mal definido, com anota- ção visual da região de upwelling.

Figura 3.3 Mapa de temperaturas SST (09 de Junho de 1998), com upwelling mal definido e presença excessiva de ruído sob a forma de nuvens, com anotação visual da região de upwelling.

3.2.2 Definição de fronteiras crisp de clusters

Para permitir a análise das segmentações obtidas foi desenvolvido um método para anotar au- tomaticamente as fronteiras obtidas. No trabalho desenvolvido em [18], essa análise foi feita somente com base na observação dos mapas de pertença (como o da Figura 3.4(a)), no entanto nesse resultado acaba-se por perder informação relativa aos valores de temperatura dos píxeis, sendo esse elemento um factor de cariz fundamental para a análise do upwelling.

Independentemente do algoritmo de segmentação utilizado, após a sua aplicação, os clusters foram ordenados por temperaturas médias, ficando o cluster com temperatura média mais fria identificado com a label 1 e o cluster com a temperatura média mais elevada identificado com a label c, sendo c o número total de clusters. Ou seja, independentemente da inicialização dos protótipos, seja esta feita aleatoriamente (FCM) ou com um método alternativo (AP-FCM), o resultado final tem sempre os clusters ordenados por temperatura média. Esta ordenação, para além de regularizar as labels dos clusters para todas as imagens, ajuda ao próprio reconheci- mento do upwelling, já que sabendo que o fenómeno é obrigatoriamente representado pelos clusterscom temperatura média inferior, pode-se definir o upwelling como o sub-conjunto dos primeiros k clusters. Na Sub-secção 3.2.6 apresenta-se o critério com thresholds para encon- trar esse valor de k. A Figura 3.4(a) exemplifica uma segmentação com identificação ordenada por temperatura média. Nos mapas de temperatura SST em que o upwelling está presente, os clustersmais frios encontram-se sempre mais próximos da linha costeira.

Define-se como fronteira de um cluster k, o conjunto de píxeis a si pertencentes, em que algum dos seus vizinhos pertença a um cluster que não seja k. Os vizinhos de um píxel (i, j) são definidos como uma "4-vizinhança", ou seja, o píxel superior (i+1,j), píxel inferior (i-1,j), píxel à esquerda (i,j-1) e píxel à direita (i,j+1). Contudo, para não coexistirem duas fronteiras entre o mesmo par de clusters k e k + 1 (i.e., a fronteira de Ck e a fronteira de Ck+1), a fronteira

de cada cluster k é apenas definida pela sua fronteira exterior, ou seja, os píxeis pertencentes ao cluster Ck cujos vizinhos pertençam a um cluster identificado com uma label superior. Assim,

a visualização das fronteiras nos mapas SST é feita com a marcação dos píxeis relativos à fronteira exterior de cada cluster.

Note-se que esta é uma definição de fronteiras crisp, feitas com base na classificação de píxeis após o passo de desfuzzificação, ignorando assim a natureza difusa, tanto dos algoritmos de agrupamento difuso como do próprio upwelling. Na Secção 3.3 são apresentadas medidas de fuzziness para estudar a identificação de fronteiras difusas.

Na Figura 3.4(b) visualizam-se as fronteiras obtidas a partir do mapa de segmentação vi- sualizado na Figura 3.4(a). Uma boa análise aos resultados de segmentação deve ter em conta ambos os resultados, já que a visualização de fronteiras sobre o mapa de temperaturas permite ter a noção de variações de temperaturas entre clusters, estando no entanto sempre dependende da escala de cores aplicada. A visualização do mapa de pertenças apresenta os clusters com a sua estrutura natural, permitindo a análise das estruturas da regiões de upwelling e restantes águas, sem depender da escala de cores.

passo de pós-processamento que elimina regiões não contíguas de clusters. Um dos objectivos da segmentação de imagem é a geração de regiões contíguas de píxeis e mesmo no domínio do problema em causa, pequenas regiões de píxeis pertencentes a um cluster que estão en- volvidas em regiões de píxeis de um outro cluster são consideradas ruído. Neste passo de pós-processamento também é melhorada a definição das fronteiras crisp pela aplicação de um passo de smooth.

(a) (b)

Figura 3.4 Visualização, em (b), das fronteiras crisp dos clusters obtidos na segmentação visualizada na figura (a), com identificação de clusters ordenada por temperatura média. Temperaturas médias de cada cluster: T1= 16◦C, T2= 18◦C, T3= 18.6◦C, T4= 19.2◦C, T5= 19.6◦C, T6= 20.7◦C.

3.2.3 Definição de diferença relativa de temperatura entre clusters

Com o objectivo de resolver o problema da definição de uma frente da região de upwelling, foi feita uma análise às temperaturas médias dos clusters obtidos nas segmentações. A base dessa análise teve como princípio as indicações dadas por oceanógrafos relativamente à própria natu- reza do fenómeno, indicando que a frente das regiões de upwelling poderia ser definida como a região onde se verifica uma maior, ou mais acentuada, diferença de temperatura. Assim, definiu-se uma nova feature, com base nas diferenças de temperaturas entre pares adjacentes de clusters, mas com a introdução do factor nk, a cardinalidade do cluster k, que permite estabele-

cer maiores valores para a feature T Di f f quando o cluster k tem menor cardinalidade, ou seja, é de extensão mais reduzida.

A introdução do factor nkvai de encontro à definição de diferença acentuada de temperatura,

cardinalidade muito elevada e que, por essa razão, ocupam uma área muito vasta, geografica- mente falando. Assim, a feature T Di f f , definida para cada cluster k, é calculada pela seguinte fórmula:

T Di f f(k) =Tk+1− Tk nk

, (1 ≤ k ≤ c − 1). (3.4)

3.2.4 Detecção de extensão cumulativa de clusters

De acordo com as anotações fornecidas por oceanógrafos, um dos factores que afectam a de- finição das regiões de upwelling prende-se com a região geográfica que esta ocupa, ou seja, verifica-se que a extensão da região anotada nunca ultrapassa um certo limite. Esta situação está ligada à relação que o fenómeno tem com a morfologia do fundo do oceano. A Figura 3.5 contém um mapa de batimetria (profundidade do oceano) e, por análise dos mapas SST e in- formação fornecida por oceanógrafos, verifica-se que os limites da região de upwelling estão relacionados com a profundidade existente, não atingindo, normalmente, regiões com mais de 4000 metros de profundidade. Assim, sabemos que as águas frias, relativas a uma região de upwelling, começam por surgir junto à costa e se vão expandido costa fora. No entanto, essa expansão não acontece infinitamente, ficando a região de upwelling limitada a uma determinada porção dos mapas de temperatura disponíveis. Com base nessa análise, outra das features defi- nidas para complemento à detecção das frentes de upwelling, estuda a extensão dos primeiros k clusters, em termos de percentagem de píxeis por eles ocupados.

A análise a esta feature permite-nos afirmar, com um elevado grau de certeza, que certos clustersnão podem pertencer à região de upwelling. Se, por exemplo, os primeiros 3 clusters de uma segmentação ocuparem 95% dos píxeis disponíveis, ou seja, todos aqueles píxeis que não contém o valor NaN, sabemos que, pelo menos, o cluster 3 não faz parte da região de upwelling, já que, nos mapas em análise, é impossível que a região pretendida ocupe tal percentagem de píxeis. Para um cluster k, a sua cardinalidade relativa cumulativa é definida pela fórmula:

CCard(k) = ∑

k j=1nj

n (3.5)

3.2.5 Detecção de ruído excessivo causado por extensões nebulosas

Outra questão que pode afectar a definição da região de upwelling é a presença excessiva de extensões nebulosas. Segundo oceanógrafos, estas regiões, que acabam por ser ruído nos mapas SST, são problemáticas já que a sua existência pode afectar os valores dos píxeis seus vizinhos, fazendo com que os valores de SST lidos não sejam fiáveis. Consequentemente, a definição da região de upwelling pode ser afectada em regiões com grandes extensões nebulosas, facto que se pode confirmar pelas anotações feitas por oceanógrafos, para identificação das regiões de upwelling dos anos de 1998 e 1999.

Figura 3.5 Mapa de batimetria ao largo da Península Ibérica. O quadrado marcado com cor preta corresponde área geográfica de cada mapa de temperaturas e, a verde, está marcada a região onde é testada a vizinhança de extensões nebulosas aos clusters.

definiu-se uma janela de dimensão 8 × 8 píxeis à sua volta como sendo a sua vizinhança e, para cada cluster em análise, contam-se quantos píxeis a si associados estão na vizinhança de algum píxel NaN, com excepção dos píxeis relativos à massa terrestre continental (presentes em todas as imagens). Por análise empírica, verificou-se que nas marcações feitas por oceanógrafos os casos onde a indicação é alterada pela presença de nuvens acontece numa região restrita, indicada a verde na Figura 3.5. Assim, é nessa região que se testa a intersecção dos clusters com nuvens. Note-se que situações em que as extensões nebulosas estejam muito afastadas da costa, e por isso excluídas da região onde se faz a análise, já são tratadas na análise da feature relativa à extensão dos clusters. Sendo NaNNeighbour a região que incorpora todos os píxeis na vizinhança 8 × 8 de um píxel de valor NaN e |x| a cardinalidade de um conjunto de píxeis x, tem-se como cálculo do ruído causado por extensões nebulosas para um cluster k, a seguinte medida:

3.2.6 Definição de critério de decisão para anotação da fronteira de upwelling

A definição do critério para identificação do cluster de interesse, que define a região de upwel- ling, teve como princípio a obtenção de fronteiras o mais semelhantes possíveis às anotações, feitas por oceanógrafos, pretendendo-se que este modelasse o critério que os próprios especia- listas usam para definir essas regiões. Uma das primeiras conclusões retiradas a partir da análise das anotações de regiões de upwelling feitas por oceanógrafos, foi que em várias anotações a fronteira de upwelling indicada variava em termos de gama de temperaturas, ao longo da ima- gem. Por exemplo, a anotação feita para o mapa de temperaturas visualizado nas Figuras 3.2 e 3.3, a anotação indica que a Norte do Cabo Espichel a fronteira de upwelling é indicada pelos píxeis de cor verde, e a Sul a fronteira já é definida pelos píxeis de cor amarela. Assim, numa única imagem, os píxeis com a temperatura representada pela cor amarela, estão incluídos na região de upwelling a Sul do Cabo Espichel, mas a Norte essa situação já não se verifica. Sendo óbvio que as segmentações obtidas pelos algoritmos em estudo não conseguem tratar situa- ções destas e obter bons resultados, ou seja, píxeis de temperaturas iguais ficarem classificados em clusters diferentes, estabeleceu-se que a análise para o critério de definição da fronteira de upwelling seria feita separadamente na Região Norte e na Região Sul, sendo essa separação feita na latitude onde se encontra o Cabo Espichel (38.4º N), já que se trata do ponto onde mais frequentemente há diferenciação nas anotações disponibilizadas. Esta posição corresponde à linha 260 nas matrizes dos mapas de temperatura SST disponíveis. Assim, para a análise à Re- gião Norte, no mapa de pertenças desfuzzificado resultante de uma segmentação, todos os píxeis de latitude inferior ao Cabo Espichel são colocados a NaN, acontecendo a situação inversa para a análise à Região Sul. Por esta razão, em alguns mapas, onde o critério definido indica clusters diferentes como limites da região de upwelling, na visualização de frente da região, a fronteira tem uma mudança brusca na latitude correspondente ao Cabo Espichel. Destaque-se que esta divisão dos mapas de temperatura é algo natural para os oceanógrafos, já que houve indicações de que as duas regiões têm características relativamente diferentes, nomeadamente em termos de temperaturas médias e salinidade.

Por análise dos resultados de segmentação da aplicação dos algoritmos FCM e AP-FCM, e comparação com as marcações das regiões de upwelling, conseguiu-se reduzir o espaço de análise nas segmentações obtidas. Para todas as segmentações obtidas com a aplicação do algo- ritmo APC3-FCM, com a análise da dispersão de dados como condição de paragem, verificou-se

que a fronteira de upwelling, de acordo com as anotações, correspondia sempre à fronteira ex- terior de um dos primeiros 3 clusters. Assim, a análise de features foi feita unicamente nesses clusters, considerados críticos e que definem uma região de interesse para este problema.

O critério que foi criado para identificar o cluster de interesse, para as duas regiões ana- lisadas distintamente, é composto pela análise das várias features definidas. Esta situação é natural já que há várias situações que um oceanógrafo analisa quando define uma região de upwelling, pelo que também há lugar à análise dessas mesmas situações quando se implementa um método automático para essa definição. A composição do critério pode ser definida como uma sequência de passos, que tem como resultado uma segmentação binária, definindo a região

de upwelling e as restantes águas presentes no mapa. Os principais passos são os seguintes: (i) separação do mapa de segmentação em Região Norte e Região Sul; (ii) análise à feature T Di f f; (iii) análise à extensão dos clusters; (iv) análise de existência de extensões nebulosas; e (v) construção do mapa de segmentação binário, com base nos resultados obtidos após (ii), (iii) e (iv). A Figura 3.6 contém um esquema com a sequência dos passos que compõe o módulo de definição do cluster de transição da região de upwelling.

Figura 3.6 Esquema da composição do critério para identificação do cluster de interesse, para a Região Norte e Região Sul.

A análise à feature T Di f f (Equação 3.4) é a que fornece melhor informação relativamente à decisão de que sub-conjunto de clusters define o upwelling, sendo que as análises posteriores, efectuadas sobre a Região Norte, melhoram a qualidade dos seus resultados. Destaque-se que na Região Sul, não se efectuam as análises às features todas, uma vez que nessa região não ocorrem as situações que cada feature analisa. Assim, na origem do critério composto está a análise de T Di f f (3), que começa por identificar o cluster de interesse (Border_Cluster). O método de análise de T Di f f é composto pelos passos 2-6, para a Região Norte, e 19-23, para Região Sul, do critério composto apresentado no Algoritmo 1. Sendo τT um valor limiar

Border_Cluster, que representa o limiar da região de upwelling, ou seja, define essa região como a união dos primeiros Border_Cluster clusters. Havendo duas regiões distintas onde a featureé analisada, τT tem a designação de τT Npara a Região Norte e de τT Spara o Sul. Note-se

que nesta análise nunca se indica que apenas o primeiro cluster faz parte da região de upwelling, uma vez que nos resultados obtidos, essa situação só acontece devido a situações estudadas em posteriores análises de features: extensão de clusters e extensões nebulosas.

De seguida, faz-se a análise da feature CCard (Equação 3.5), que analisa os clusters em ter- mos de percentagens de píxeis ocupados. Nesta fase, cuja aplicação é feita somente na Região Norte, apenas se tem em conta os primeiros Border_Cluster clusters, que resultaram do passo prévio, pelo que, o objectivo passa por diminuir o número de clusters que definem a região de upwelling, enquanto a percentagem de píxeis por si ocupado for excessiva. Sendo CCard(k) a cardinalidade relativa cumulativa do cluster k e τC um valor limiar, a partir do qual se con-

sidera como excessiva a percentagem de píxeis ocupados, a análise é feita nos passos 7-9 do Algoritmo 1.

A última análise feita estuda a perturbação na definição da fronteira de upwelling causada pela presença de extensões nebulosas, através da feature CloudNoise (Equação 3.6). Tal como no passo anterior, esta análise “recebe” um valor de Border_Cluster, como indicação dos clus- ters que definem a região de upwelling e é sobre esse resultado que estuda a existência de extensões nebulosas que possam condicionar a qualidade da região obtida. Assim, define-se um threshold τN como um valor limiar a partir do qual se considera que um cluster contém

demasiado ruído na sua vizinhança para se poder afirmar que pertence à região de upwelling. Note-se que a análise não é feita no primeiro cluster, uma vez que nos 4 mapas de temperatura onde não há anotação feita para a totalidade da Região Norte, os resultados não são possíveis de melhorar. O resultado final para Border_Cluster é calculado nos passos 10-12 do Algoritmo 1. Concluída a análise das features que compõem o critério para identificação do cluster de transição da região de upwelling, o resultado final são dois valores de Border_Cluster: um para a Região Norte (Border_Cluster_North) e outro para a Região Sul (Border_Cluster_South). Relembre-se que a separação Norte/Sul é feita na linha correspondente à latitude do Cabo Es- pichel, pelo que na visualização do resultado final, acima dessa linha tem-se a fronteira exterior do Border_Cluster_North e nas linhas inferiores a fronteira exterior do Border_Cluster_South. O critério composto, agrupando a análise de todas as feature é definido pelo Algoritmo 1.

Na aplicação do critério composto para identificação automática do cluster de interesse, os resultados obtidos são dependentes dos thresholds aplicados em cada passo. Inicialmente, os valores utilizados foram encontrados com base na observação empírica de resultados e na sua comparação com indicações das regiões de upwelling feitas por oceanógrafos. Contudo, para contornar a observação estritamente empírica, foi desenvolvido um método de obtenção de thresholdscom base no estudo do ganho de informação, apresentado em [48].

Em Teoria da Informação, o ganho de informação de um qualquer atributo a, respectiva- mente a uma classe V , indica a redução de incerteza sobre o valor de V quando se sabe o valor de a, ou seja, quão útil é o atributo a para descobrir V . Aplicando ao cálculo automático de

Algoritmo 1 Composição do critério para identificação do cluster de interesse

1: {Análise Região Norte, a partir do mapa de pertenças desfuzzificado da Região Norte.}