• Nenhum resultado encontrado

2. REVISÃO DE LITERATURA

2.7 SISTEMA DE AMOSTRAGEM

2.7.3 Processos de amostragem

Entende-se por processo de amostragem a abordagem da população referente ao conjunto de unidades amostrais (PÉLLICO-NETO e BRENA, 1997). Segundo CONGALTON e GREEN (2009) na avaliação da acuracidade, a seleção de unidades amostrais para a coleta dados de referência pode proceder por meio de cinco processos de amostragem, sendo: a amostragem aleatória simples, a amostragem sistemática, a amostragem estratificada aleatória, a amostragem por agrupamento (cluster) e a amostragem sistemática estratificada não-alinhada. Em uma amostragem aleatória simples, cada unidade de amostra na área de estudo tem uma igual possibilidade da seleção (CONGALTON e GREEN, 2009), sendo as unidades amostrais sorteadas de acordo com um critério probabilístico aleatório (PÉLLICO-NETO e BRENA, 1997). Na amostragem aleatória simples não existem garantias da uniformidade na distribuição das amostras por toda a extensão da área de interesse, fazendo com que, na maioria das vezes, partes da área fiquem sub-amostradas e outras super- amostradas (BRITES et al., 1996). A amostragem aleatória também pode ser problemática, devido à dificuldade de localização das unidades amostrais em campo.

A amostragem sistemática é um processo em que as unidades amostrais são selecionados em algum intervalo específico e regular sobre a área de estudo. Na maioria dos casos, a primeira amostra é selecionada de forma aleatória e as amostra sucessiva são tomada respeitando o intervalo a partir da primeira. A vantagem principal da amostragem sistemática é a facilidade na preparação das amostras de maneira uniforme sobre a área de estudo (CONGALTON e GREEN, 2009). O tamanho da população não precisa ser conhecido uma vez que cada unidade, que ocorre dentro do intervalo de amostragem fixado, é selecionada sequencialmente após ser definida a unidade inicial (PÉLLICO-NETO e BRENA, 1997).

O processo de amostragem aleatória estratificada é similar à amostragem aleatória simples, porém, deve-se ter algum conhecimento prévio sobre a área de estudo para, então, dividi-la em grupos ou os estratos (CONGALTON e GREEN, 2009). Posterior a estratificação, as unidades amostrais são selecionadas aleatoriamente em cada estrato (PÉLLICO-NETO e BRENA, 1997). No caso da avaliação da exatidão de mapas a

estratificação será de acordo com as classes do mapa, sendo que todos os estratos (classes do mapa), independente do tamanho, estarão incluídos na amostra.

A amostragem por agrupamento tem seu uso para avaliar a exatidão dos mapas de dados remotamente detectados, nos casos de necessidade de coletar rapidamente a informação em muitas amostras com grande proximidade umas das outras. Entretanto, este processo de amostragem deve ser usado com grande cuidado, visto que simplesmente tomar um grande número de unidades amostrais próximas (sejam pixels, um conjunto de pixels ou polígono) não é um método válido para a coleta de dados se cada unidade amostrada não for

independente das outras, fato que não adicionará informações (CONGALTON e GREEN, 2009).

A amostragem estratificada sistemática não-alinhada tenta combinar as vantagens do acaso e da estratificação com a facilidade de uma amostra sistemática, sem cometer os erros da periodicidade comuns à amostragem sistemática (CONGALTON e GREEN, 2009). De acordo com CAMPBELL (1987), a área de estudo é dividida em células uniformes, geralmente um reticulado quadrado, que representam a porção sistemática do processo. O uso do reticulado de células como base para a estratificação significa que as observações são distribuídas de maneira a contemplar toda a extensão da área. A casualização é proporcionada pela localização das observações dentro de cada parcela (célula), que não permite o rígido alinhamento, característico da amostragem sistemática pura. Desta forma, introduz-se um elemento de chance que aumenta a probabilidade de que as observações venham a contemplar as categorias presentes na região.

A amostragem sistemática pode ser realizada em faixas, sendo estruturada com a divisão da área de estudo em (N) faixas de igual largura, que destas seleciona uma amostra de (n) faixas, com um intervalo de (k) faixas. A primeira faixa pode ser selecionada mediante a aleatorização de um número entre (1) e (N), sendo as demais selecionadas estendendo-se o intervalo (k), em ambas as direções, a partir da faixa inicial. A seleção pode ser feita, também, sorteando uma faixa entre (1) e (k), sendo as demais amostras selecionadas pelo resultado da soma do intervalo (k) ao número da faixa anterior escolhida. Ambos os procedimentos produzem o mesmo número de amostras sistemáticas prováveis, devendo ser preferido o primeiro, quando possível. O segundo método pode ser usado quando o tamanho da população não é conhecido (PÉLLICO-NETO e BRENA, 1997).

CONGALTON (1988) executou simulações de amostragem em três áreas distintas, usando os processo aleatória, aleatória estratificada, sistemática, estratificada sistemática não-

alinhada e em agrupamento. Concluiu que para as três áreas a amostragem aleatória simples e a aleatória estratificada forneceram resultados satisfatórios. COCHRAN (1965) afirma que a amostragem sistemática, em geral, apresenta maior precisão que a aleatória simples e similaridade com a amostragem estratificada.

De acordo com USDA FOREST SERVICE (1995) a amostragem aleatória geralmente não é prática no campo, e a amostragem estratificada exige a seleção dos locais para a avaliação da exatidão depois do término da classificação. Uma atitude razoável seria no inicio do trabalho coletar dados pelo método sistemático aleatório e para suplementar a quantidade de amostras por meio da amostragem aleatória estratificada após o término atividades de classificação. Segundo BRITES et al. (1996), os índices de exatidão podem ser superestimados conforme a estratégia de amostragem empregada na geração dos dados de referência, podendo esta diferença ser determinante na decisão do usuário em aceitar ou não o produto gerado.

BOLFE et al. (2004) aferiu a acuracidade temática dos resultados obtidos na classificação digital dos povoamentos florestais por meio de amostragem sistemática, sendo criado um sistema de grade com 2.500 x 2.500 m para povoamentos implantados e de 10.000 x 10.000 m para povoamentos de florestas nativas, com alocação de áreas-controle em cada um dos pontos de cruzamento das linhas da grade. Identificaram-se as coordenadas desses pontos, inserido-as no equipamento GPS para sua localização em campo.

Além da análise da acuracidade torna-se interessante desenvolver uma análise de efeitos que provocam os erros de classificação. Por meio de análise de variância de fator único permite-se realizar uma comparação quantitativa dos efeitos, determinando o percentual de discrepância entre uma classificação obtida e a esperada.

Os experimentos com arranjos fatoriais dos tratamentos são aqueles onde o efeito de dois ou mais fatores são investigados ao mesmo tempo. Este tipo de experimento não constitui um delineamento experimental diferente, se caracteriza pelo modo como o conjunto de tratamentos é arranjado, proporcionando a representação de todas as combinações possíveis de dois ou mais fatores (KOEHLER, 2006). Os arranjos fatoriais são utilizados em qualquer tipo de delineamento experimental. Quando aplicada a análise de fatoriais, a casualização deve ser realizada de acordo com os princípios especificados para o delineamento experimental utilizado para teste do conjunto de tratamentos resultante do arranjo.

MELLO et al. (2009) utilizaram para a determinação da acuracidade do mapeamento da flora nativa e dos reflorestamentos de Minas Gerais, o procedimento de amostragem casual simples (ACS), com proporção, definindo o tamanho da amostra de referência através da fixação da acuracidade desejada em 85%, descartando o uso de uma amostra piloto. O erro admissível empregado neste trabalho foi de 5% à probabilidade de 95%. Dessa forma o tamanho da amostra de referência calculado foi de aproximadamente 196 pontos amostrais

para todas as classes do mapeamento, para um valor crítico de Z tendendo ao infinito (Z = 1,96).

Por meio da base digital de rodovias, foram selecionadas aleatoriamente 50% dessas, independentemente de serem rodovias federais ou estaduais, pavimentadas ou não, alocando nessas os pontos amostrais. As não selecionadas, mas que foram trafegadas para atingir as selecionadas, eram amostradas quando notada qualquer região com concentração de fisionomias que não haviam nas rodovias selecionadas. Obteve-se o na avaliação da acuracidade 87,29%, 81,74%, 86,31% para Exatidão Global, índice Kappa e coeficiente de concordância Tau, respectivamente.