67
7. Coleta de Dados para SIG’s
O mundo em que vivemos é infinitamente complexo e para compreendê-lo é necessário simplificá-compreendê-lo por meio de modecompreendê-los. Com uso de uma base de dados pode-se ter uma visão particular (limitada) do mundo. O usuário “vê” o mundo real por intermédio das bases de dados. As medições e as amostras contidas na base de dados devem ser uma representação do mundo tão completa e fiel quanto possível (técnica e economicamente). O conteúdo de uma base de dados deve ser relevante em termos de temas e características capturados, abrangência temporal e deve representar a área de estudos.
Para representar a realidade, a base de dados deve conter representações digitais de objetos discretos. Muitas feições representadas nos mapas, tais como curvas de nível e divisão política, são fictícias.
Uma base de dados pode incluir a versão digital de objetos reais (poços, estradas, lagos), a versão digital de feições abstratas (isoietas, limites entre classes), objetos artificiais criados para representar a realidade (pixels, tins) e dados contínuos (não discretos).
Uma superfície contínua representa fenômenos onde cada localização na superfície é uma medida da concentração, do nível, ou de sua relação com um ponto fixo no espaço ou com uma fonte emissora. Dados contínuos são também chamados de dados de campo, dados de superfície ou dados não discretos. Os diferentes tipos de superfícies contínuas podem ser:
Derivadas a partir de características que definem uma superfície onde cada localização é medida a partir de um referencial. Um bom exemplo é a elevação, que é medida em relação ao nível médio dos mares;
Superfícies de concentração, que são usadas para descrever fenômenos que variam progressivamente à medida em que se deslocam ao longo do terreno. Bons exemplos são os movimentos dos fluidos, dispersão, difusão, cuja direção de escoamento é das áreas de maior para as de menor concentração, até a estabilização do nível.
Na representação e na modelagem de várias feições, nem sempre os limites são claramente discretos ou contínuos. Um continuum, cujos extremos
68
são feições discretas puras e feições contínuas puras, é criado ao se representar feições geográficas.
A maioria das feições situa-se em algum ponto entre esses extremos (exemplos: tipo de solos, bordas de florestas, limites de brejos, mercado geográfico influenciado por uma campanha publicitária veiculada na televisão). O fator que determina em que parte do continuum uma determinada feição cai é a facilidade de se definir os limites dessa feição. Células podem representar todas as feições nesse continuum.
Algumas características existem em toda parte e variam continuamente ao longo da superfície terrestre (elevação, pressão e temperatura atmosférica, vegetação natural, tipo de solos). Essa variação é medida por meio de amostragem.
A estatística realiza medições/amostras o mais acurado (exato) possível. Existem diferentes maneiras de para representar a variação, são elas:
Medições em pontos amostrais (exemplo: estações climáticas); Medições ao longo de trajetos;
Divisão da área em zonas amostrais, para isso assume-se que a variável é constante dentro de cada zona (exemplo: mapeamento de solos);
Desenho de curvas de nível (exemplo: levantamento topográfico altimétrico).
Cada um desses métodos cria objetos discretos como pontos, linhas, áreas, variação contínua representada por objetos discretos, etc.
Um grid (grade regular amostral) pode ser visto de duas maneiras:
Caso especial de pontos amostrais, onde os pontos são regularmente espaçados;
69
Cada método é uma aproximação, capturando apenas parte da variação real, assim, podemos citar como exemplos:
Um ponto amostral perde a variação entre pontos (pontos capturados ao longo de um rio);
Os trajetos não capturam a variação fora dos trajetos;
Para zonas assume-se a homogeneidade dentro de cada zona e ocorre variação brusca nas bordas;
As curvas de nível perdem a variação entre curvas de nível.
Para o caso de zonas amostrais, pode-se melhorar o sucesso de cada método de várias formas. Para representar os limites, pode-se usar uma linha mais grossa, sugerindo imprecisão. As zonas podem ser descritas como misturas de classes ao invés de classes puras (exemplo: 70% de solo tipo A, 30% de solo tipo B).
7.1. Amostragem Espacial
Os fenômenos no mundo real podem ser descritos em três “modos” distintos:
Espacial (variação de lugar para lugar); Temporal (variação de tempo em tempo);
Temático (variação de uma característica para outra, ou seja, de um tema para outro).
Qualquer propriedade mensurável ou descritível do mundo insere-se em um desses três modos, lugar, tempo e tema. Geralmente, ao estudar um fenômeno do mundo real, mantém-se um dos três modos fixo, varia-se o segundo de uma maneira controlada e mede-se o terceiro modo.
Exemplos:
Em diferentes municípios de Minas Gerais (localização variável), medir a porcentagem de pessoas que adquiriram automóveis (tema medido) em 1999 (tempo fixo);
Em um depósito de lixo tóxico (local fixo), medir o nível de toxidez (tema medido) a cada ano (tempo variável) durante cinco anos;
70
Determinar a concentração de cálcio, fósforo, potássio e teor de matéria orgânica (tema variável) para o talhão 583 (local medido) no mês de março de 2000 (tempo fixo).
O modo ESPACIAL da informação é denominado de localização e é medido em algum sistema de coordenadas.
O modo TEMÁTICO é representado por atributos que definem as diferentes características dos objetos (exemplo: rodovia não-pavimentada, solo argiloso) e são armazenados em tabelas de atributos onde:
Cada objeto (feição) corresponde a uma linha da tabela; Cada característica (atributo) corresponde a uma coluna;
A tabela apresenta o modo temático e alguns dos modos espaciais. O modo TEMPORAL da informação pode ser representado de várias formas, tais como:
Especificando-se o intervalo de tempo de vida de um fenômeno (exemplo: intensidade de uma precipitação);
Capturando-se a informação em determinados horários (exemplo: temperatura do teto de um supermercado medida a cada hora);
Especificando-se as taxas de movimento dos objetos (exemplo: velocidade de propagação de um incêndio florestal).
Dependendo de como o modo temporal é capturado, pode-se incluí-lo em uma única tabela de atributos ou então, representá-lo por uma série de tabelas de atributos para a mesma coleção de objetos ao longo do tempo.
7.1.1. Amostrando a realidade
Dependendo do tipo de sistema de medições adotado a escala de medição pode ter um impacto dramático na interpretação dos valores resultantes. Exemplos:
Uma distância de 20 km é o dobro de 10 km;
Algo que pesa 100 kg representa um terço do peso de um objeto de 300 kg;
71
Quem chegou em primeiro lugar dificilmente terá sido três vezes mais rápido do que quem chegou em terceiro lugar;
Uma pessoa com 60 anos de idade é duas vezes mais velha que outra de 30 anos, entretanto, o mais velho de dois indivíduos somente terá o dobro da idade do mais jovem uma única vez.
A relevância dessa discussão sobre números está no fato de que nem todos os números podem ser tratados da mesma forma. É importante reconhecer as diferentes escalas de medição usadas em dados matriciais uma vez que elas determinam o tipo de operações e de funções matemáticas que podem ser aplicadas a esses dados de modo a ter-se resultados previsíveis.
Os valores numéricos podem ser agrupados em quatro escalas de medição: nominal, ordinal, intervalo, razão.
Nominal
Nesse grupo, os números estabelecem meramente identidade, representando qualidades e não quantidades, exemplos:
Um número de telefone representa uma identidade única do telefone; Números de placas de automóveis representam identidades únicas de
automóveis;
Em uma corrida, os números designados aos corredores estão em uma escala nominal;
Esquemas de codificação de tipo de solos, uso da terra, dentre outros, são medições nominais.
Ordinal
Nesse grupo, os números definem apenas uma ordem, não estabelecendo magnitude ou proporções relativas, exemplos:
Em uma corrida, a ordem de chegada (primeiro, segundo, terceiro colocado) são medições ordinais, porém, não se pode inferir, a partir dessa informação, a diferença de tempo entre cada finalista;
O número de telefone 3431-5151 não é maior que 3431-7171, pois os números de telefone NÃO são ordinais;
72
Ordinais utilizados para expressar preferência (lista dos melhores hotéis de Bambuí).
Intervalo
Nesse grupo, os valores possuem uma sequência natural, estando dispostos em uma escala calibrada e a determinação de razão e proporção perdem o significado. Exemplos:
A escala não começa no zero (não existe um zero verdadeiro no tempo ou no espaço definindo a origem da escala);
A diferença entre valores faz sentido mas a divisão não (faz sentido dizer que 20º C é 10º C mais quente que 10º C, mas não se pode dizer que seja duas vezes mais quente, pois a temperatura em Celsius é uma escala de intervalo);
Horas, anos em um calendário e o valor de pH são exemplos de medições de intervalo (uma vez que não existe um zero verdadeiro, somente comparações relativas, no caso de subtrações, poderão ser efetuadas).
Razão
Nesse grupo, os valores desse sistema de medição possuem uma sequência natural, sendo derivados em relação a um ponto zero fixo em uma escala linear. Assim, quando existe um zero verdadeiro, tanto a diferença quanto a divisão entre valores fazem sentido e passam a ter significado. Exemplos:
É correto dizer que um edifício de 30 m de altura é duas vezes mais alto do que um prédio de 15m (a altura é uma escala de razão);
Idade, distância, peso, volume são exemplos de medições de razão.
7.2. Tipos de Entrada de Dados
A introdução de dados em um SIG é feita com uso de produtos originados de Sensoriamento Remoto, do uso de planilhas de dados, uso de informações de Sistemas de Posicionamento Global, processos de digitalização vetorização, dentre outros.
73
7.2.1. Digitalização
É o processo em que os dados como mapas, fotos ou imagens são transferidos para um computador por meio de interfaces (scanners) e programas especialmente desenvolvidos para este fim. Muitas vezes, empresas que possuem mapas cartográficos e informações obtidas por meio de levantamentos topográficos, querem utilizar todo esse armazenamento de forma digital e integrado em um SIG.
Os dados são inseridos nos SIGs pela digitalização manual ou varredura por scanners. Os scanners fazem as varreduras dos dados e os transformam em formato digital matricial (“rasterização”).
Vários são os formatos de arquivos matriciais usados em SIG. Alguns bons exemplos são os formatos BMP, TIFF, JPEG, GIF, PNG, dentre outros.
Quantidade de pixels
A quantidade de pixels (resolução digital) de uma imagem é definida pela altura, baseado no número de linhas da matriz e pela largura, que refere-se ao número de colunas. A resolução digital (R) de uma imagem pode refere-ser definida por:
d
R
p
e
d
p
R
74
onde:
R = resolução digital (horizontal ou vertical);
p = número de pixels da largura (colunas da matriz) ou altura (linhas da matriz) da imagem;
d = largura (ou altura) de impressão da imagem em polegadas.
Exemplo:
Na digitalização de uma determinada imagem de dimensões 5,93 cm x 6,73 cm (2,333” x 2,65”), com uso de uma resolução digital de 300x300 dpi, qual será a quantidade de pixels da altura e da largura dessa imagem?
De acordo com a equação apresentada, temos:
".
65
,
2
;
"
333
,
2
;
300
l ad
e
d
dpi
R
Comop
R
d
, teremos:ura
l
de
pixels
dpi
d
R
p
altura
de
pixels
dpi
d
R
p
l l a aarg
795
"
65
,
2
300
700
"
333
,
2
300
Portanto, a imagem digitalizada terá 700 pixels de altura e 795 pixels de largura.
7.2.2. Vetorização
É o processo de transporte de dos elementos de uma imagem (matricial) para o formato vetorial. Essa vetorização pode ser feita manualmente ou com processos semiautomáticos ou automáticos.
Vetorização manual
Geralmente a vetorização manual é feita por um operador que desenha os detalhes contidos em uma imagem (papel ou rasterizada) com uso de um
75
mouse. A vetorização manual pode ser feita com uso de mesas digitalizadoras ou diretamente na tela do monitor do computador.
Vetorização automática
Nesse processo, a transformação da imagem matricial em vetorial é feita de maneira automática com uso de programas e rotinas específicas. Quase sempre, quando se faz um procedimento de vetorização automática, se faz necessário um tratamento final (edição posterior) da imagem obtida. Esse tratamento é demorado e oneroso o que muitas vezes restringe a sua utilização.
Vetorização semiautomática
O processo de vetorização semiautomática mescla as facilidades da vetorização automática com a experiência do operador. Nesse processo, o operador orienta as ações ou o caminho a ser percorrido pelo cursor durante o processo de vetorização. Assim como na vetorização automática, nesse processo também se faz necessário um tratamento final (edição posterior) da imagem obtida, porém menos demorado e oneroso que o processo totalmente automático.
7.2.3. Dados alfanuméricos
Em SIG, a inserção de dados alfanuméricos é feita por meio de tabelas que podem ser criadas diretamente nele ou também podem ser importadas. As
76
informações contidas nessas tabelas devem estar vinculadas a um sistema de coordenadas conhecido.
7.2.4. Dados de Sistema de Posicionamento Global
Dados coletados em sistemas de posicionamento global podem ser inseridos em SIG com uso de programas ou rotinas específicas para tal. Atualmente os SIGs possuem a capacidade de comunicação com esses sistemas, dispensando o uso de programas ou rotinas específicas como supracitado.
7.3. Dados Socioeconômicos / 7.4. Dados Ambientais
Em SIG, os dados socioeconômicos e ambientais, geralmente são inseridos como dados alfanuméricos, descritos no item 7.2.3.