• Nenhum resultado encontrado

Validação e comparação dos modelos de suscetibilidade

CAPÍTULO 2: ÁREA DE ESTUDO

3.8. Validação e comparação dos modelos de suscetibilidade

A validação dos modelos de suscetibilidade é essencial para avaliar a capacidade preditiva dos mapas desenvolvidos (Begueria, 2006), e interpretar com rigor os resultados obtidos (Chung e Fabbri, 2003). De acordo com Frattini et al. (2010) para um modelo ser considerado aceitável é necessário que cumpra pelo menos três critérios: (i) adequabilidade (conceptual e matemática) em descrever o comportamento do sistema natural; (ii) robustez a pequenas alterações nos dados de base; e (iii) exatidão da previsão dos dados registados. Em situações em que não é expectável que o modelo seja perfeito, é necessário determinar qual é o seu grau de confiança (Remondo et al., 2003).

A determinação da qualidade dos modelos é feita com recurso a dois processos distintos: a avaliação do sucesso do modelo e da sua capacidade preditiva (Santacana e Corominas, 2001 e 2002). Na avaliação do sucesso é analisado o ajuste do modelo aos dados, uma vez que os movimentos utilizados no cálculo da suscetibilidade e validação dos mapas são os mesmos. Na avaliação da predição os dados utilizados para a validação são diferentes dos que foram integrados no processo de classificação da suscetibilidade, pelo que a validação é independente.

Segundo Chung e Fabbri (2003) a chave para a validação está na partição do inventário de movimentos de vertente em 2 grupos independentes, sendo que um grupo é utilizado para construção do modelo (grupo de modelação ou treino) e o outro é utilizado para legitimar os resultados obtidos (grupo de validação). A partição da base de dados dos movimentos de vertente é realizada geralmente utilizando três critérios distintos (e.g. Fabbri et al., 2002; Chung e Fabbri,

2003): (i) temporal (os movimentos de um determinado período são utilizados para a elaboração da avaliação da suscetibilidade, e a validação é realizada com os movimentos ocorridos noutro período na mesma área); (ii) espacial (é utilizada uma área para efetuar o modelo de suscetibilidade, que é depois validado com a aplicação da função ou procedimento a outra área com caraterísticas geológicas e geomorfológicas idênticas; e (iii) aleatório (na área de estudo são selecionados aleatoriamente dois grupos de dados um para análise e outro para validação).

Na presente dissertação utilizou-se, como já foi referido, uma partição de movimentos de vertente distinta, baseada no fator desencadeante. Os dois grupos de movimentos considerados (Grupo 1 – movimentos desencadeados pela precipitação; e Grupo 2 – movimentos desencadeados por sismos) foram utilizados alternadamente como grupo de modelação e grupo de validação, utilizando os algoritmos do Valor Informativo e da Regressão Logística. Todos os modelos foram validados com recurso à construção de curvas de sucesso e curvas de predição.

3.8.1. Curvas de sucesso e curvas de predição

As curvas de sucesso e de predição são demonstradas graficamente em termos percentuais, ou através de uma escala que varia entre 0 e 1, sendo representado no eixo das abcissas a área de estudo classificada por ordem decrescente de suscetibilidade e no eixo das ordenadas uma função de distribuição cumulativa da área instabilizada (Figura 3.13).

Figura 3.13 - Definição gráfica de uma curva de Sucesso ou de Predição (adaptado de Beguería, 2006).

Ambas as curvas expressam a porção de área necessária para explicar a ocorrência de uma determinada percentagem de movimentos (Santacana e Corominas, 2001 e 2002). Assim, as curvas de sucesso e de predição devem apresentar uma inclinação decrescente (Chung e Fabbri,

2003), isto é, o declive da curva deve diminuir de modo mais ou menos exponencial da UT de maior suscetibilidade para a de menor. Contudo, nas curvas de predição isto não acontece na grande maioria das vezes. Assim, quanto maior é a diferença da curva obtida em relação a diagonal (que representa um modelo com um acerto casuístico) melhor é o ajuste ou capacidade preditiva do modelo (e.g. Guzzeti, 2005; Remondo et al., 2003; Frattini et al., 2010).

A avaliação detalhada e quantificada da qualidade das curvas de sucesso e de predição foi feita com recurso ao cálculo da área abaixo da curva (AAC).

3.8.2. Área Abaixo da Curva (AAC)

A área abaixo da curva (AAC) corresponde a um valor uni-escalar (Bi e Benett, 2003) que permite avaliar quantitativamente a capacidade preditiva global de cada modelo de suscetibilidade. Os seus valores tão compreendidos numa escala entre 0 (incapacidade total) e 1 (predição perfeita). O valor de 0,5 corresponde ao resultado expectável numa distribuição completamente aleatória do fenómeno da área de estudo, enquanto valores inferiores a 0,75 revelam que os modelos apresentam sérias deficiências. Por sua vez, valores de AAC compreendidos entre 0,8 e 0,9 representam um ajuste muito satisfatório do modelo aos dados. Os modelos considerados como excelentes devem ter uma AAC igual ou superior a 0,9 (Guzzetti et al., 2005).

A expressão matemática da AAC é dada pela equação [3.8]: 𝐴𝐴𝐶 = ∑ [(𝐿𝑆𝑖− 𝐿𝑖) ×

(𝑎𝑖+ 𝑏𝑖)

2 ]

𝑛

𝑖=1

onde: 𝐿𝑆𝑖− 𝐿𝑖 é a amplitude de cada classe; 𝑎𝑖 é valor da ordenada correspondente a 𝐿𝑖; 𝑏𝑖 é o valor da ordenada correspondente a 𝐿𝑆𝑖; 𝑖 é o número de intervalos de valor ou número da classe.

3.8.3. Concordância espacial e comparação dos modelos de suscetibilidade

A avaliação da concordância espacial dos mapas de suscetibilidade resultantes de diferentes algoritmos deve ser realizada quando se pretendem comparar os resultados dos modelos preditivos, uma vez que modelos com AAC iguais poderão apresentar uma diferente distribuição espacial dos resultados de suscetibilidade (Sterlacchini et al., 2011).

A Estatística Kappa (k) encontra-se entre as ferramentas mais utilizadas para a comparação de mapas de suscetibilidade a movimentos de vertente (e.g. Guzzetti et al., 2005; van Den Eeckhaut et al., 2006; Sterlacchini et al., 2011; Zêzere et al., 2017). Este método permite estimar a repetibilidade de medidas, permitindo mensurar em quanto as observações verificadas na realidade se afastam das teoricamente esperadas. Para o efeito, utilizou-se a ferramenta Map Comparasion Kit desenvolvida pelo Research Institute for Knowledge Systems (Visser e Nijs, 2006).

O valor do índice Kappa (k) é obtido através da multiplicação de dois mapas parciais (Hagen- Zanker, 2002; Visser e Nijis, 2006; Hagen-Zanker et al.,2006), isto é, em termos gerais K relaciona a proporção das concordâncias observadas com a proporção que seria estatisticamente expectável numa relocalização aleatória das UT no mapa (equação [3.9]) (Hagen-Zanker et al.,2006).

𝑘 = 𝑃(𝑜) − 𝑃(𝑒) 1 − 𝑃(𝑒) =

𝑓(𝑜) − 𝑓(𝑒) 𝑁 − 𝑓(𝑒)

onde: P(o) corresponde à probabilidade observada de concordância entre os dois mapas de suscetibilidade e P(e) representa a probabilidade expectável, em termos estatísticos de existir concordância. F(o) corresponde à frequência entre o número de UT matriciais concordantes entre os dois mapas de suscetibilidade e o número total de UT matriciais incluídas na área de estudo; F(e) constitui a frequência de UT matriciais concordantes expectáveis estatisticamente; e N corresponde ao total de UT.

As proporções/frequências observadas (equação [3.10]) e expetáveis (equação [3.11]) obtêm- se através das seguintes equações:

𝑃𝑜= ∑ 𝑃𝑖𝑖 𝑛 𝑖=1 ↔ 𝑓𝑜 = ∑ 𝑓𝑖𝑖 𝑛 𝑖=1

onde: i representa o número de ordem de classes; n é o número de classes; 𝑃𝑖𝑖 constitui a proporção de UT concordantes na classe i; e 𝑓𝑖𝑖 representa a frequência de UT concordantes na classe i de UT. 𝑃𝑒= ∑ 𝑃𝑡𝑖𝑧 ×𝑃𝑡𝑖𝑤 𝑛 𝑖=1 ↔ 𝑓𝑒= ∑ 𝑓𝑡𝑖𝑧 ×𝑓𝑡𝑖𝑤 𝑁 𝑛 𝑖=1

onde: i constitui o número de ordem da classe; n é o número de classes; 𝑃𝑡𝑖 constitui a proporção total de UT na classe i; 𝑓𝑡𝑖 representa a frequência total de UT na classe i; z e w são os mapas de comparação; e N é o total de UT.

O valor de K apresenta uma variação entre -1 e 1, sendo que os valores positivos traduzem um grau de concordância acima do que era estatisticamente expectável (concordância perfeita K=1). Quando K=0 significa que a concordância obtida não é melhor do que a que seria alcançada através de uma distribuição aleatória das classificações. Por seu turno, os valores negativos estão associados a uma não conformidade entre mapas abaixo do aleatório.

A estatística Kappa resulta de dois tipos de semelhança, a semelhança da quantidade e de similaridade de localização. A quantidade refere-se ao número total de células fixadas para cada categoria encontrada no mapa (e.g. histograma), e a localização refere-se à distribuição espacial das diferentes categorias de um mapa (Rocha, 2012). Assim, de modo a compreender em que extensão as medidas de similaridade de localização e de quantidade estão representadas na estatística Kappa, esta é dividida em duas estatísticas, o Kappa Histograma (KHisto) e o Kappa

[3.9]

[3.10]

Localização (KLoc). A relação entre os três elementos é dada pela seguinte expressão (equação [3.12] (Hagen, 2002):

𝐾𝑎𝑝𝑝𝑎 = 𝐾𝐻𝑖𝑠𝑡𝑜×𝐾𝐿𝑜𝑐

Landise e Koch (1977) propuseram uma classificação para os diferentes níveis de concordância entre os mapas, segundo os valores do índice K (Quadro 3.12).

Quadro 3.12 - Diferentes níveis de concordância baseados nos valores de K (Landis e Koch, 1977). Valores de K Nível de concordância

≤ 0 Nenhum ]0 – 0,20] Ligeiro ]0,20 – 0,40] Considerável ]0,40 – 0,60] Moderado ]0,60 – 0,80] Substancial ]0,80 - 1] Excelente