5. MATERIAL E MÉTODOS
5.3 Método desenvolvido
5.3.3 Classificação dos mapas de produtividade de milho e soja
Os mapas de produtividade foram submetidos a um processo de classificação através da técnica de análise de agrupamentos (multivariate clustering), para identificar as áreas (sub-regiões) com padrão de variação identificável para os valores de produtividade entre anos agrícolas subseqüentes. Em virtude de se trabalhar com culturas que apresentam níveis de produtividade totalmente diferentes (milho e soja), inicialmente, os mapas interpolados foram padronizados, fazendo-se uso da distribuição da variável padronizada “z” (com média zero e desvio padrão unitário), partindo-se da interpolação dos valores normais (t/ha), pela técnica da krigagem ordinária, conforme procedimento descrito a seguir:
• A região interpolada foi delimitada pelo cruzamento com a imagem contendo o perímetro da área colhida;
• A padronização dos valores interpolados foi conduzida no módulo Image Calculator do IDRISI, baseada na equação:
z = (x - µ)/s (5)
onde:
z = valor padronizado da produtividade para a respectiva safra;
x = valor original (representado por cada uma das células da imagem interpolada);
µ = média da produtividade calculada para o conjunto de dados que originou a superfície; e,
s = desvio padrão calculado para o conjunto de dados que originou a superfície.
Como o procedimento foi aplicado a toda a imagem, os valores de fundo (que possuem valor zero) foram também padronizados, embora não tenham contribuído para o cálculo da média e do desvio padrão. Por essa razão, fez-se necessário uma nova exclusão de valores externos à área colhida, através do cruzamento com a imagem contendo o referido perímetro.
Essa padronização dos dados poderia ser efetuada diretamente sobre os valores pontuais na planilha eletrônica, antes de interpolar. Entretanto, embora a estrutura da variabilidade seja detectada da mesma maneira para os dados transformados, a técnica de interpolação por krigagem ordinária não apresentaria os resultados esperados, uma vez que seria necessária uma interpolação específica para dados padronizados, os quais incluem valores negativos em sua distribuição, semelhante ao que ocorre com dados que exibem uma distribuição logarítmica.
5.3.3.1 Análise de agrupamentos dos dados de produtividade de milho e soja
Um conjunto de dados multivariado, como os representados pelos mapas de produtividade de três safras, pode ser comparado a um grupo de bandas espectrais de uma imagem de satélite, os quais permitem a adoção de técnicas de análise de agrupamento para realizar a classificação das feições observadas em uma imagem composta pelas respectivas bandas. Na imagem de satélite, cada célula registra a reflectância relativa ao tipo de cobertura presente na superfície abrangida pela sua resolução espacial. No mapa de produtividade, cada célula registrou o nível de produtividade estimado pelo processo de interpolação. Assim, foi aplicado aos dados de produtividade o procedimento descrito a seguir:
• Através do SIG IDRISI, foi criada uma imagem composta dos 3 anos pelo módulo COMPOSITE. Para que este módulo execute a composição da imagem, a lógica do procedimento computacional exige que as imagens dos dados de produtividade sejam convertidas para dados do tipo byte em 256 níveis discretos. Para isto, foi usado o módulo STRETCH.
• A imagem composta foi classificada de acordo com o método de classificação não supervisionada implementado no módulo CLUSTER, que é uma variante especial de uma técnica de análise de agrupamento de Picos de Histograma (Richards, 1993, citado por Eastman, 1999). O procedimento pode ser mais bem entendido pela perspectiva de uma única imagem, quando o histograma de valores de reflectância ou, no caso, dos níveis de produtividade mostraria um número de picos e de vales. Os picos representam, conforme Eastman (1999), grupos de valores mais freqüentes associados com algum tipo de cobertura do solo, sendo que no caso da produtividade,
estaria associado com algum padrão de comportamento. A classificação poderia ser, opcionalmente, mais ampla, quando não incluiria a definição de um número muito pormenorizado de classes, ou refinada, quando uma segregação mais acentuada seria efetuada. Havia ainda a possibilidade de limitar o número máximo de grupos que seriam formados. Quando o procedimento foi aplicado sem restrições, o algoritmo efetuou a separação de todos os grupos identificáveis, desde grupos com maior freqüência até aqueles cuja freqüência chegou a ser insignificante. Para concentrar em um número de agrupamentos que permitisse analisar uma possível associação com algumas categorias de comportamento da produtividade, tais como produtividade acima ou abaixo da média, produtividade ascendente ou descendente, foi limitado em 3 ou 4 o número máximo de agrupamentos nos quais os valores seriam classificados.
5.3.3.2 Determinação de classes de comportamento da produtividade de milho e soja
Para a classificação da produtividade, de acordo com o seu comportamento durante as três safras, foram usados os mapas padronizados pela variável z, conforme apresentado pela equação (5).
Pela tabela de distribuição de probabilidade da variável padronizada “z”, 33% dos valores ficam abaixo de –0,44; 34% estão compreendidos entre –0,44 e +0,44; os 33% restantes ficam acima de +0,44. Desta forma, partindo-se dos valores de produtividade padronizados pela variável “z”, pôde-se dividir o conjunto em 3 porções, os quais corresponderam a valores abaixo da média (z < -0,44), em torno da média (-0,44 ≤ z ≤ +0,44) e acima da média (z > +0,44). Com estes intervalos, reclassificou-se cada mapa de produtividade. A partir daí foi possível efetuar um cruzamento destes mapas primariamente classificados por este critério, de modo a obter um conjunto de associações entre os três anos que indicaria os diferentes comportamentos da produtividade em cada local da área. Preliminarmente, foi obtido um mapa de comportamento da produtividade cujas áreas indicaram qual o nível de produtividade obtido para aquele local no decorrer do período. Num determinado local, a produtividade pode ter sido, por exemplo, abaixo da média no primeiro ano, abaixo da média no segundo ano e em torno da média no terceiro ano. Essa sobreposição resultaria 27 possíveis combinações. Esse nível de fragmentação implicou em maior
dificuldade de efetuar uma possível associação destas combinações com algum agrupamento classificado previamente. Dessa forma, foi preciso adotar um critério de união dessas combinações, de modo a definir 3 ou 4 classes de comportamento mais abrangentes, que poderia resultar num mapa menos restritivo para comparações posteriores. Assim, definiu-se que as combinações seriam agrupadas em torno de 3 ou 4 comportamentos distintos, como por exemplo, produtividade ascendente, descendente, oscilante ou estagnada.