• Nenhum resultado encontrado

4. Informação de suporte à análise

5.2. Pré-processamento (Normalização das variáveis)

Os modelos são simplificações da realidade. Os modelos preditivos dependem de modelos estatísticos empíricos, que por sua vez dependem da natureza do conjunto de dados. O estudo de padrões espaciais, muitas vezes complexos e mal compreendidos, beneficia dessa abordagem amplamente independente de qualquer conhecimento pré- existente de processos subjacentes. Tal como os modelos estatísticos, os modelos difusos

92

(fuzzy) adaptam-se bem ao desenvolvimento de modelos empíricos, preditivos e data driven (Puig, 2011).

Com o rápido desenvolvimento dos Sistemas de Informação Geográfica, a forma de recolha, armazenamento, análise e disposição da informação alterou-se, conseguindo- se adaptar as informações a diferentes fenómenos. Por norma, diferentes critérios apresentam valores distintos, o que os torna incomparáveis entre si, inviabilizando a sua agregação imediata. Assim, de modo a resolver este problema, procede-se à normalização dos valores dos critérios, atribuindo a mesma escala de valores aos critérios, conseguindo minimizar os problemas oriundos do uso de diferentes escalas entre os critérios. Dependendo do tipo de fenómeno em estudo, este pode demonstrar um grau de indefinição ou incerteza (fuzzy), muitas vezes associado ao processo de tomada de decisão, que não poderá ser expresso com conjuntos nítidos de limites de classe (Kainz, 2001).

Na base da modelação cartográfica nos SIG está a lógica booleana. Esta é de natureza nítida (crisp), determinista e exata, não dando margem para imprecisões na informação geográfica e nos processos de tomada de decisões. Esta abordagem consiste na atribuição de apenas um atributo a cada entidade espacial, impondo limites nítidos, permitindo, simplesmente, que uma entidade espacial possa pertencer ou não a um conjunto (Sui, 1992). No entanto, esta técnica convencional de modelagem cartográfica provou ser de bastante difícil aplicação em algumas aplicações SIG, onde a imprecisão prevalece, porque nem todas as entidades na base de dados espacial podem ser definidas exclusivamente, seja no conjunto de atributos ou no seu delineamento espacial (Leung, 1988, citado por Sui, 1992).

Para fazer face a este tipo de problemas, surgiu a lógica fuzzy. Esta abordagem introduziu conceitos como "íngreme", "próximo" ou "adequado" (Kainz, 2001) para caracterizar os critérios de um fenómeno, permitindo qualificar entidades espaciais que não têm limites definidos e que são expressos com graus de participação, fazendo com que seja mais apropriada do que uma classificação binária sim/não. A Figura 5.4 exibe as diferenças entre a lógica booleana e a lógica fuzzy.

93

Figura 5.4: Lógica Booleana (a) vs. Lógica Fuzzy (b) Fonte: Sui (1992, p.103)

Tal como a figura acima mostra, a lógica booleana funciona como uma classificação binária (duas classes mutuamente exclusivas), onde um fenómeno apenas pode ocorrer ou não ocorrer, não sofrendo alterações ao longo do tempo. Por outro lado, a lógica fuzzy não tem os seus limites tão rígidos, permitindo que o fenómeno possa ter um escalonamento de valores representando a sua possibilidade de ocorrência, ou seja, a transição entre a pertença e a não-pertença de uma localização num conjunto é gradual.

Por norma, um conjunto fuzzy varia entre 0,0 e 1,0, indicando um incremento contínuo da total não-pertença à total pertença. Para representar dados espaciais num esquema fuzzy, é necessária a sua transformação para camadas matriciais, uma vez que a maioria dos dados geográficos não possui limites nítidos e cada célula como um conjunto de elementos (Sui, 1992). Assim, a cada célula no ficheiro matricial será anexado um conjunto de classificações de associações que indicam o atributo que estará representado na célula.

Esta abordagem apresenta funções diferentes para definir a transformação ou remapeamento dos valores de entrada para novos valores (Quadro 5.1). O processo de transformação é chamado de fuzzification, e estabelece a associação fuzzy para cada valor de entrada. Os valores transformados variam de 0.0 a 1.0, definindo a possibilidade de associação a uma classe ou conjunto especificado, em que 1 determina a pertença ao conjunto. Cada classe fuzzy define uma função contínua e cada função captura um tipo diferente de transformação para obter um efeito desejado. (ESRI, sem data-a).

94

Dito isto, para esta dissertação foram transformadas as variáveis, anteriormente tratadas, em classes fuzzy através da função FuzzyLinear, para assim conseguir realizar os modelos estatísticos preditivos.

Quadro 5.1: Funções Fuzzy (ArcGIS help)

Tipo de Função Definição

FuzzyGaussian

Define uma função de pertença difusa através de uma distribuição normal ou gaussiana em torno de um ponto médio especificado pelo utilizador (que é atribuído a uma pertença de 1), com um spread definido diminuindo para zero.

FuzzyLarge

Define uma função de pertença difusa, onde os maiores valores de entrada têm pertença mais perto de 1. A função é definida por um ponto médio especificado pelo utilizador (que é atribuído a uma pertença de 0,5), com um spread definido.

FuzzyLinear

Define uma função de pertença difusa através de uma transformação linear entre o valor mínimo especificado pelo utilizador, com uma pertença de 0, até o valor máximo definido pelo utilizador, que é atribuído a uma pertença de 1.

FuzzyMSLarge

Define uma associação difusa através de uma função baseada na média e no desvio-padrão, com os maiores valores tendo uma pertença mais perto de 1.

FuzzyMSSmall

Define uma associação difusa através de uma função baseada na média e no desvio-padrão, com valores menores, tendo uma pertença mais perto de 1.

FuzzyNear

Define uma função de pertença difusa em torno de um valor específico, que é definido por um ponto central indicado pelo utilizador (que é atribuído a uma pertença de 1), com um spread definido diminuindo para zero.

FuzzySmall

Define uma função de pertença difusa com os menores valores de entrada tendo pertença mais perto de 1. A função é definida por um ponto médio especificado pelo utilizador (que é atribuído a uma pertença de 0,5), com um spread definido.

95

Documentos relacionados