ANÁLISE ESPACIAL DOS
DADOS EM SIG
Diogo Santos Campos
ENGENHEIRO AGRÍCOLA, D.Sc. Prof. do IFMG – Campus Bambuí
ANÁLISE DOS DADOS COM USO
DE SIGs
Deve ser feita de forma criteriosa (transformação em informações úteis a
gestão).
Tomando como exemplo a amostragem de solo georreferenciada em grade.
ANÁLISE DOS DADOS COM USO
DE SIGs
SÃO ELAS:
• Planejamento da grade amostral;
• Análise exploratória dos dados;
• Modelagem do comportamento espacial dos atributos;
• Geração das superfícies interpoladas;
• Análise das superfícies obtidas; e
ANÁLISE DOS DADOS COM USO
DE SIGs
Após a coleta das amostras e suas
respectivas análises laboratoriais, esses dados devem ser unidos às coordenadas
dos seus respectivos pontos.
ANÁLISE EXPLORATÓRIA
DOS DADOS
A análise exploratória dos dados possuem duas principais finalidades:
1. Identificar ERROS e valores DISCREPANTES; e
ANÁLISE EXPLORATÓRIA
DOS DADOS
Qualquer análise exploratória de dados começa com a observação descritiva:
• Média;
• Mediana;
• Moda;
• Variância e Desvio Padrão;
• Valores Máximos e Mínimos;
• Número de Pontos;
• Assimetria de distribuição;
ANÁLISE EXPLORATÓRIA
DOS DADOS
Os dados descritivos podem também ser inferidos de maneira visual:
• Diagrama de caixa (boxplot);
ANÁLISE EXPLORATÓRIA
DOS DADOS
DIAGRAMAS DE CAIXA (BOXPLOT)
O conjunto de dados é dividido em quartis, comparando-os com a média e
mediana.
ANÁLISE EXPLORATÓRIA
DOS DADOS
ANÁLISE EXPLORATÓRIA
DOS DADOS
ANÁLISE EXPLORATÓRIA
DOS DADOS
HISTOGRAMAS
(Diagrama de Frequências)
• Os Histogramas são utilizados quando são utilizados DADOS DENSOS.
• Permite avaliar a qualidade dos dados.
• Idéia primária se a variável é homogênea (distribuição normal); ou
ANÁLISE EXPLORATÓRIA
DOS DADOS
ANÁLISE EXPLORATÓRIA
DOS DADOS
ANÁLISE EXPLORATÓRIA
DOS DADOS
TÉCNICAS COM USO DE HISTOGRAMAS
Eliminação de Limites Extremos ou Inconsistentes
Retirada de desvios padrões acima e abaixo da média ou mediana:
• 1 (corte extremo);
• 2 (corte mediano); ou
ANÁLISE EXPLORATÓRIA
DOS DADOS
ANÁLISE EXPLORATÓRIA
DOS DADOS
TÉCNICAS COM USO DE HISTOGRAMAS
• A vantagem dessa técnica é que podem ser retirados valores discrepantes;
MAS...
• Cuidado para não retirar dados relevantes (principalmente com uso de um corte extremo).
ANÁLISE DAS INFORMAÇÕES
OBTIDAS
• Os SIGs associam os atributos com a posição obtida;
• Permitem trabalhar com vários atributos para a mesma posição visualizados na forma de camadas (layers, PIs, ...);
ANÁLISE DAS INFORMAÇÕES
OBTIDAS
DEMANDA MAIS NOBRE EM AP
. . .
Análise das relações de CAUSA e EFEITO.
Essas análise podem ser feitas por meio de geração de modelos com uso dos
INTERPOLAÇÕES
O processo de criação de MAPAS em AP depende muito de técnicas de
INTERPOLAÇÃO.
O QUE É INTERPOLAÇÃO?
INTERPOLAÇÕES
INTERPOLAÇÃO
Exemplo: Na elaboração de um mapeamento de precipitação (chuva) de um determinado país, não
são encontradas estações meteorológicas
suficientes distribuídas uniformemente para cobrir toda a região.
INTERPOLAÇÕES
O processo de INTERPOLAÇÃO em AP baseia-se na premissa que pontos mais próximos tendem a ser mais parecidos do
que pontos distantes.
O processo é dividido em duas etapas:
1. Definição do relacionamento de vizinhança (vizinhos apropriados); e
INTERPOLAÇÕES
Os SIGs disponibilizam vários métodos de interpolação.
A escolha do método é importante na geração dos mapas.
MÉTODOS: característica de tratar os dados e PESOS, normalmente
inversamente proporcional a distância entre pontos (mais próximo, mais
INTERPOLAÇÕES
- IMPORTANTE SABER
–
Um mesmo conjunto de dados pode resultar em diferentes superfícies com
INTERPOLAÇÕES
Métodos de INTERPOLAÇÃO mais usados em AP:
• Triangulação;
• Vizinho mais próximo;
• Mínima curvatura (SPLINE);
• Inverso da Distância; e
MÉTODOS DE INTERPOLAÇÃO
TRIANGULAÇÃO
• Geralmente usado na modelagem de superfícies de terrenos em topografia (interpolação linear).
• Grade formada por conexão entre amostras do fenômeno, utilizando a triangulação.
MÉTODOS DE INTERPOLAÇÃO
VIZINHO MAIS PRÓXIMO
• Atribui o valor do ponto amostrado mais próximo ao valor do pixel interpolado.
MÍNIMA CURVATURA (SPLINE)
• Geram superfícies por “janelas móveis”;
MÉTODOS DE INTERPOLAÇÃO
INVERSO DA DISTÂNCIA
• Método muito usado em AP (prático e com resultados satisfatórios);
MÉTODOS DE INTERPOLAÇÃO
KRIGAGEM
• Método mais usados pelos profissionais em AP;
• Flexível para interpolações;
• Minimiza a variância de erros;
• Incorpora a dependência espacial;
GEOESTATÍSTICA
• Ramo da Estatística Espacial que usa o conceito de funções aleatórias para incorporar a dependência espacial aos modelos para variáveis georeferenciadas.
GEOESTATÍSTICA
DEPENDÊNCIA ESPACIAL
• Tendência que o valor de uma variável de uma localização assemelhe-se mais ao valor de suas amostras vizinhas do que ao restante das localizações do espaço amostral.
GEOESTATÍSTICA
DEPENDÊNCIA ESPACIAL
• A quantificação da dependência espacial
levou ao desenvolvimento da estatística espacial (GEOESTATÍSTICA);
GEOESTATÍSTICA
Interesses da AP em GEOESTATÍSTICA:
I) Descrever e modelar padrões espaciais por meio da modelagem de SEMIVARIOGRAMAS;
II) Predizer valores não amostrados por meio da KRIGAGEM;
GEOESTATÍSTICA
SEMIVARIOGRAMA
• Principal ferramenta utilizada para estudar a dependência espacial.
GEOESTATÍSTICA
SEMIVARIOGRAMA
• Ferramenta usual de suporte a KRIGAGEM.
• Permite representar quantitativamente a variação de um fenômeno no espaço.
GEOESTATÍSTICA
SEMIVARIOGRAMA
Para mensurar a VARIABILIDADE de um atributo com uso de um SEMIVARIOGRAMA é calculada a SEMIVARIÂNCIA para cada par de pontos do conjunto de dados.
SEMIVARIÂNCIA: mede o grau de dependência espacial de dois pontos.
SEMIVARIOGRAMA DE NUVEM
SEMIVARIOGRAMA DE NUVEM
Exemplo:
Quantos pares de pontos são plotados em um SEMIVARIOGRAMA de NÚVEM de uma amostragem de 20 pontos?
𝐶𝑛,𝑝 = 𝑝! × 𝑛 − 𝑝 !𝑛!
SEMIVARIOGRAMA EXPERIMENTAL
É obtido com a média ponderada dos valores de semivariância para cada intervalo de distância
SEMIVARIOGRAMA TEÓRICO
O gráfico do SEMIVARIOGRAMA
EXPERIMENTAL é formado por uma série de valores que se ajusta a um modelo matemático
(SEMIVARIOGRAMA TEÓRICO).
Em AP os modelos mais usados são:
• Esférico;
• Exponencial; e
COMPONENTES DO SEMIVARIOGRAMA
COMPONENTES DO SEMIVARIOGRAMA
Com o ajuste do semivariograma teórico, são definidos os componentes para o cálculo da KRIGAGEM:
• Efeito Pepita (C0);
• Patamar (C);
• Alcance (α);
COMPONENTES DO SEMIVARIOGRAMA
COMPONENTES DO SEMIVARIOGRAMA
ALCANCE
Distância a partir da qual as amostras passam a ser independentes.
A variação entre dois pontos não é mais em função da distância entre eles.
Quanto MENOR for o alcance, MAIOR a Variabilidade (deve-se adotar uma grade mais densa).
Alcance (α): distância dentro da qual as amostras apresentam-se correlacionadas espacialmente. No
COMPONENTES DO SEMIVARIOGRAMA
ALCANCE
Indica a distância mínima exigida entre amostras para que a variabilidade de um atributo seja fielmente modelada.
Pesquisadores recomendam que a distância mínima entre amostras devem ser igual ou inferior à metade do alcance.
COMPONENTES DO SEMIVARIOGRAMA
ALCANCE
A partir do alcance as semivariâncias não aumentam com o distanciamento das amostras e se estabiliza (variação entre pontos é aleatória).
Patamar (C): é o valor do semivariograma correspondente a seu alcance (α). Deste ponto em diante, considera-se que
não existe mais dependência espacial entre as amostras, porque a variância da diferença entre pares de amostras
torna-se invariante com a distância.
Contribuição (C1): é a diferença entre o patamar (C) e o
COMPONENTES DO SEMIVARIOGRAMA
EFEITO PEPITA
Valor da semivariância obtido na distância zero entre amostras.
Porção da variância não explicada pela distância entre pontos.
Ocorre devido a erros de medição (imprecisão dos métodos de análise).
Efeito Pepita (C0): idealmente, ϒ(0)=0. Entretanto, na prática, à medida que h tende para 0 (zero), ϒ(h) se
aproxima de um valor positivo chamado Efeito Pepita (C0),
que revela a descontinuidade do semivariograma para distâncias menores do que a menor distância entre as amostras. Parte desta descontinuidade pode ser também devida a erros de medição, mas é impossível quantificar se a
maior contribuição provém dos erros de medição ou da variabilidade de pequena escala não captada pela
COMPONENTES DO SEMIVARIOGRAMA
EFEITO PEPITA PURO
COMPONENTES DO SEMIVARIOGRAMA
CAUSAS DO EFEITO PEPITA PURO
Erros na coleta de amostras:
• Receptores GNSS;
• Erros na coleta e análise laboratorial. Erros na escala de trabalho:
GRAU DE DEPENDÊNCIA ESPACIAL (GDE)
É uma forma de quantificar o quão dependentes da localização os valores de um determinado atributo são.
𝐺𝐷𝐸 =
𝐶
𝐶
0• DE forte: GDE <25%
• DE moderada: 25% < GDE < 75%
• DE fraca: GDE >75%
EXIGÊNCIAS PARA A CORRETA
ESTIMATIVA DA
DEPENDÊNCIA ESPACIAL E KRIGAGEM
Geoestatísticos e Matemáticos defendem a coleta de no mínimo 50 amostras para uma boa eficiência da estimativa da DE e
Krigagem.
IMPORTANTE:
• Análise exploratória dos dados (busca por valores anômalos);
EXIGÊNCIAS PARA A CORRETA
ESTIMATIVA DA
DEPENDÊNCIA ESPACIAL E KRIGAGEM
Recomendações na geração dos SEMIVARIOGRAMAS:
• Número mínimo de pares em cada passo (lag) = 30;
• Maior o passo => Menor a Confiabilidade so Semivariograma;
EXIGÊNCIAS PARA A CORRETA
ESTIMATIVA DA
DEPENDÊNCIA ESPACIAL E KRIGAGEM
Para a correta modelagem do Semivariograma, os dados devem apresentar ISOTROPIA.
ISOTROPIA:
EXIGÊNCIAS PARA A CORRETA
ESTIMATIVA DA
DEPENDÊNCIA ESPACIAL E KRIGAGEM
EXIGÊNCIAS PARA A CORRETA
ESTIMATIVA DA
DEPENDÊNCIA ESPACIAL E KRIGAGEM
Quando o Semivariograma Experimental apresentar comportamento inconstante, pode ser um indicativo de que a variável apresente ANISOTROPIA.
ANISOTROPIA:
Valores dos atributos dependem da direção de análise dos dados.
EXIGÊNCIAS PARA A CORRETA
ESTIMATIVA DA
DEPENDÊNCIA ESPACIAL E KRIGAGEM
GERAÇÃO DO SEMIVARIOGRAMA
- CONCEITOS IMPORTANTES -
Lag (passo):
Refere-se a uma distância pré-definida, a qual é utilizada no cálculo do semivariograma (incremento).