• Nenhum resultado encontrado

Aspectos a Considerar na Construção de Modelos de Crescimento e Produção

2. MODELOS DE CRESCIMENTO E PRODUÇÃO

2.1. Construção de Modelos de Crescimento e Produção

2.1.6. Aspectos a Considerar na Construção de Modelos de Crescimento e Produção

Na construção de um modelo de crescimento e produção deverá ter-se em consideração:

‰ que tipo de modelo se irá usar,

‰ que inputs serão necessários,

‰ que outputs se pretendem,

‰ que dados se dispõem para o seu ajustamento,

‰ que recursos se dispõem para a construção, teste e utilização do modelo (Vanclay, 1994).

Devendo o modelo de crescimento e produção ser concebido de forma:

‰ a permitir a projecção das variáveis de uma forma recorrente,

‰ a excluir a inclusão de variáveis ou parâmetros desnecessários no modelo,

‰ a restringir as medição de campo às necessárias para a sua utilização,

‰ a evitar a complexidade da estrutura do modelo e

‰ a favorecer a aplicação generalizada do modelo (Vanclay, 1994).

Em termos genéricos, podemos considerar quatro fases na construção de um modelo de crescimento e produção:

‰ obtenção da amostra (dados),

‰ concepção da estrutura do modelo,

‰ modelação de cada uma das componentes do modelo, incluindo

- selecção dos modelos candidatos, - ajustamento dos modelos,

- estudo dos modelos e - selecção do melhor modelo,

‰ avaliação do modelo na sua globalidade (p.e., Alder, 1980; Tomé, 1988; Vanclay, 1994).

Apresentam-se como principais dificuldades à concretização da recolha de dados, a demarcação e medição de parcelas e a sua manutenção no campo por longos períodos de tempo (p.e., Alder, 1980; Oliveira, 1980; Vanclay, 1994).

Após a obtenção dos dados, o passo seguinte na construção de um modelo de crescimento e produção é a concepção da sua estrutura, através da formulação das relações funcionais necessárias e o subsequente ajustamento dos modelos aos dados. O tipo de curvas ajustadas podem estar baseadas nalguma lei de crescimento ou apenas representarem a tendência das variáveis em análise (Alder, 1980).

As variáveis a usar nos modelos devem ser cuidadosamente escolhidas de forma a assegurarem predições biologicamente realistas na amplitude de condições possíveis. O conhecimento dos processos biológicos que afectam o crescimento das árvores e a sua dinâmica em povoamento ajudam na formulação de hipóteses para a selecção de variáveis explicativas potencialmente úteis (Vanclay, 1994).

De igual forma, é importante assegurar que os modelos a ajustar aos dados (modelos candidatos) não violam nenhum dos princípios biológicos do crescimento das árvores e dos povoamentos (p.e., Tomé, 1988; Vanclay, 1994). Por exemplo, analisando o processo de crescimento da árvore individual (Figura 2.1.), podemos apercebermo-nos que a equação de crescimento a ajustar deve estar de acordo com os princípios do crescimento biológico, ou seja:

‰ a curva é limitada pela produção zero no início e por uma produção máxima finita

atingida em idade avançada (existência de uma assímptota);

‰ a taxa relativa de crescimento apresenta um máximo na fase inicial, após o qual é

decrescente;

‰ o declive da curva aumenta com produções crescentes na fase inicial e decresce na

fase final (tem ponto de inflexão) (Tomé, 1989).

A examinação visual cuidada dos dados é uma das melhores formas para começar a entender o conjunto dos dados recolhidos, escolher os modelos candidatos para representar os dados e procurar erros nos modelos e nos dados. Por exemplo, realizando os gráficos dos dados, mostrando a relação entre a variável dependente (variável resposta) e as possíveis variáveis independentes (variáveis explicativas) (Vanclay, 1994).

No ajustamento dos modelos aos dados, usualmente recorre-se às técnicas de regressão. O ajustamento de modelos lineares é realizado por regressão linear, a maior parte das vezes segundo o método dos mínimos quadrados ordinários (OLS - ordinary least squares), por vezes ponderados. Os modelos não lineares são ajustados por regressão não linear, segundo o método dos mínimos quadrados, ponderados ou não (LS - least squares) (p.e., Vanclay, 1994; Carvalho, 1999).

A regressão não linear, ao contrário da regressão linear, não providencia facilmente uma única solução que minimiza a soma dos quadrados dos resíduos para um dado conjunto de variáveis. As soluções são obtidas através de um processo iterativo e podem ser influenciadas

pelo método de estimação utilizado e as condições iniciais especificadas pelo utilizador (input de parâmetros iniciais). O método de estimação mais simples e frequentemente utilizado é o método de Gauss-Newton. No caso dos modelos não lineares, mas linearizáveis, é possível utilizaram-se os coeficientes de regressão estimados no ajustamento por regressão linear desse modelo linearizado, como parâmetros inicializadores ao processo. No caso dos modelos não lineares, não linearizáveis, há a necessidade de se proceder previamente à pesquisa de soluções iniciais (p.e., Myers, 1986; Carvalho, 1999).

A regressão linear e outros métodos dos mínimos quadrados, são resolvidos por minimização da soma do quadrado dos erros, logo a natureza destes erros tem uma grande influência na qualidade do modelo ajustado. Estes métodos têm por base os seguintes pressupostos:

‰ os erros são independentes (não correlacionados),

‰ os erros apresentam-se normalmente distribuídos,

‰ com média igual a zero e

‰ variância constante (p.e., Myers, 1986; Carvalho, 1999).

Em muitas aplicações biológicas, os erros não apresentam uma distribuição idêntica para todos os valores da variável resposta, i.e. a sua variância não é homogénea. Quando a variância dos erros não é constante, mas aumenta ou diminui à medida que o valor esperado da variável resposta aumenta, considera-se que os dados apresentam heterocedasticidade. Neste caso os valores extremos podem influenciar de maneira desproporcionada a forma da equação, havendo a necessidade de recorrer a métodos de regressão ponderada (p.e., Myers, 1986; Dilorio, 1991).

Muitos dos testes estatísticos ou outras análises que envolvam inferência estatística utilizados no estudo dos modelos são sensíveis à falta de normalidade dos dados originando estimativas imprecisas (Carvalho, 1999).

A ocorrência de “outliers” tem uma grande influência nas estimativas dos mínimos quadrados, e se estes forem originados por erros de medição podem levar a predições com erro. No entanto, nem todos os “outliers” são causados por erros de medição, não devendo estes serem apagados do conjunto de dados sem um averiguação cuidada da sua fonte e validade (Vanclay, 1994).

No caso de dados de acréscimos é necessário uma atenção especial quando se examinam os “outliers”. Podem ocorrer erros de medição associados a um valor excessivamente grande no período precedente ou antecedente, originando valores negativos ou positivos. Assim, os “outliers” negativos não devem ser removidos da análise sem que se removam também os correspondes “outliers” positivos. Porém, nem todos os decréscimos são causados por erros de medição, alguns resultam da variação natural na dimensão do tronco e por isso não devem ser

removidos da análise. Estes aspectos enfatizam a importância de se utilizar um intervalo, entre medições sucessivas, suficientemente longo de forma a que os acréscimos sejam maiores relativamente aos erros de medição e a qualquer flutuação na dimensão do tronco (Vanclay, 1994).

As variáveis explicativas utilizadas nos modelos assumem-se como independentes; no entanto, é frequente estas estarem relacionadas, como p.e., o diâmetro com a área basal e a área basal por hectare e o factor de competição das copas. A colinearidade, i.e. a ocorrência de multidependências quasi-lineares entre os regressores e que se verifica em consequência da existência de correlações entre as diversas variáveis explicativas entre si, também pode existir quando as variáveis são recolhidas de uma forma oportunística e sem uma estratégia de delineamento deliberada. Também, a realização de medições sucessivas como se verificam no caso das parcelas permanentes comprometem a independência das observações, visto que as medições repetidas no tempo tendem a estar correlacionadas e portanto não são estatisticamente independentes. Esta correlação origina problemas numéricos na estimativa dos parâmetros, embora não iniba a capacidade de se obter um bom ajustamento, nem afecte as inferências sobre as respostas médias ou predições a partir de novas observações (Vanclay, 1994).

As técnicas de regressão robusta pretendem ultrapassar os problemas da distribuição não normal dos erros e da correlação das variáveis explicativas. Estas técnicas minimizam também o impacto de “outliers que não podem ser omitidos da análise e que têm um efeito excessivo na estimativa dos coeficientes de regressão (Myers, 1986).

A regressão baseada no método dos mínimos quadrados ordinários assume que as variáveis explicativas são contínuas, precisas e sem erro, no entanto nas aplicações florestais, na prática estas não o são, podem conter erro e os seus valores apresentam-se arredondados. No entanto, a análise pelos mínimos quadrados pode ser realizada na medida em que as suas implicações são pequenas, visto a amplitude de cada variável explicativa ser maior que o seu erro. No sentido de minimizar estes problemas deve-se manter a maior precisão possível na medição das variáveis preditoras e resposta, assegurando que nas parcelas permanentes todos os parâmetros da parcela e da árvore são medidos de forma a que o crescimento médio (ou outras mudanças) seja substancialmente maior que o erro de medição provável (e.g., medir os diâmetros com precisão ao mm, e em intervalos suficientemente longos que permitam 1 cm de acréscimo em média) (Vanclay, 1994).

Após os modelos serem ajustados aos dados, estes deverão ser testados para determinar a sua validade e precisão. No estudo dos modelos, utilizam-se diversas estatísticas, calculadas ou não durante o processo de ajustamento dos modelos, para avaliar comparativamente as prestações destes, como por exemplo a qualidade do ajustamento, a capacidade preditiva e a existência de colinearidade, com vista à selecção do melhor modelo de entre os candidatos (p.e., Tomé, 1988; Carvalho, 1999).

A validação dos modelos pretende determinar se os modelos de facto representam a realidade. Assim,

‰ a predição aproximar-se-á da realidade quanto mais esforços forem postos na

recolha de dados e construção do modelo;

‰ a partir de determinada altura o aumento dos custos de recolha de dados e

construção do modelo não compensam o acréscimo de precisão;

‰ o modelo será mais ou menos preciso para determinadas amplitudes da aplicação

das variáveis de predição e

‰ o processo de validação deve assumir igual importância que o da construção do

modelo (Vanclay, 1994).

Se for detectada alguma falha haverá necessidade de voltar ao campo de modo a melhorar a qualidade dos dados e/ou a estrutura do modelo. Noutros casos haverá que recorrer a conceitos alternativos para o delineamento e recolha de dados (p.e., Alder, 1980; Vanclay, 1994).

No processo de validação o modelo será usado para predizer o comportamento dos povoamentos onde se recolheram os dados e os resultados comparados com as observações actuais - análise de resíduos de predição. O cálculo dos resíduos do modelo são a maneira prática de avaliar as propriedades dos erros do modelo e a capacidade preditiva do modelo. Como os resíduos crescem com a dependência das variáveis calculadas, em geral, analisam-se os resíduos da variável final. É frequente, ser necessário repetir o processo de validação várias vezes, procedendo ao ajustamento ou a correcções ao modelo nos estágios onde ocorreram anomalias. Neste domínio, revela-se útil a realização e o exame visual de gráficos do tipo:

‰ gráficos mostrando os dados e o modelo ajustado em relação às variáveis

independentes escolhidas,

‰ gráficos dos resíduos em relação aos valores estimados, e em relação a variáveis

independentes alternativas e em relação a outras estatísticas, para verificação da validade de alguns dos pressupostos da análise de regressão e

‰ gráficos mostrando o modelo ajustado para uma ampla gama de valores das

variáveis independentes para avaliação dos seus extremos (validade da extrapolação) (Vanclay, 1994).

A validação do modelo pode utilizar os mesmos dados que os usados na construção do modelo - autovalidação - ou um conjunto de dados que não foram utilizados na construção (ajustamento) do modelo - validação independente ou cruzada. Preferencialmente, deve-se optar pela segunda alternativa, visto que, a validação cruzada, ao recorrer à aplicação do

modelo a dados adicionais independentes dos utilizados no ajustamento do modelo, permite detectar inconsistências na formulação do modelo que no caso da autovalidação podem ficar camufladas pelas características dos dados utilizados (Alder, 1980).

Podem existir um número de razões, para que os modelos apresentem um mau ajustamento quando da validação com um conjunto de dados independentes:

‰ os dados originais usados na construção do modelo apresentam um padrão de

desenvolvimento, quanto ao crescimento, diferente dos dados de validação;

‰ os métodos de ajustamento das equações usadas no modelo foram inapropriadas;

‰ a extrapolação de algumas das equações para fora da região em que foram

ajustadas;

‰ se o modelo envolve um sistema de equações, este pode apresentar-se instável

quando tratado como um todo, embora cada função separadamente se ajuste adequadamente aos dados - para estes casos, existem métodos matemáticos que nos permitem construir sistemas de equações compatíveis entre si - e

‰ erros de cálculo e de aplicação das equações e/ou gráficos do modelo (p.e., Alder,

1980; Vanclay, 1994).

A análise de resíduos tradicional, i.e. obtidos por autovalidação, apresenta algumas limitações na medida em que os resíduos nem sempre têm um comportamento idêntico aos erros do modelo, visto que a variância dos resíduos em torno de zero se torna menor à medida do seu afastamento do centro dos dados e por outro lado porque se verifica a existência de correlação dos resíduos entre si. No entanto, a análise dos resíduos deve ser realizada com o objectivo de detectar discrepâncias entre o modelo postulado e os dados observados (p.e., Myers, 1986), designadamente:

‰ a ocorrência de ajustamento por defeito;

‰ a violação da hipótese de homogeneidade da variância;

‰ pontos suspeitos e/ou erros nos dados;

‰ a não normalidade dos erros e

‰ a existência de pontos altamente influentes.

A análise dos resíduos PRESS (Prediction Errors Sum of Squares) permite avaliar a capacidade preditiva dos modelos por validação cruzada, gerando um conjunto de resíduos independentes aos dados. Os resíduos PRESS são definidos supondo que se ajusta o modelo n vezes, suprimindo de cada vez uma das observações (p.e., Myers, 1986).

Os resíduos studentizados, são outro exemplo de resíduos independentes aos dados. Estes têm a mesma precisão que os resíduos tradicionais, são independentes da localização do ponto, adimensionais e apresentam uma estrutura semelhante ao t-student (p.e., Myers, 1986). De facto, o resíduo studentizado não é mais do que o resíduo PRESS standartizado, i.e. dividido pela raiz quadrada da sua variância.

Outra fase importante da construção do modelo é a avaliação do modelo de crescimento e produção na sua globalidade, a qual deve revelar se existem erros e deficiências no modelo:

‰ se os diversos modelos que o constituem representam adequadamente os

processos biológicos envolvidos;

‰ se estão correctamente combinados entre si, confirmando-se que não existem

inconsistências internas;

‰ se as constantes numéricas obtidas no ajustamento dos modelos são de facto as

melhores estimativas;

‰ qual a amplitude condições quanto à estação e tipo de povoamentos a que o

modelo se aplica;

‰ se o modelo satisfaz os requisitos de precisão necessários;

‰ se o modelo fornece predições realísticas dentro de um leque de aplicações

semelhantes e

‰ como as predições do modelo são sensíveis aos erros das estimativas dos

coeficientes e das variáveis de entrada (Vanclay, 1994).

Alguns aspectos da avaliação do modelo global referidos podem ser realizados durante a construção do modelo enquanto que outros necessitam da realização de testes adicionais (Vanclay, 1994). No entanto, segundo Tomé e Soares (1999), a análise do enviesamento dos modelos e qualidade das predições com base em testes estatísticos como, o teste t-student, o teste de Freese, o teste de Wicoxon e o teste da regressão, não acrescentam informação muito mais relevante do que a análise gráfica ou a análise baseadas nas médias dos resíduos de predição ou dos resíduos de predição absolutos. Para além, de um modo geral, os testes serem demasiado exigentes e por vezes dificultarem a interpretação dos resultados (Carvalho, 1999).

Na fase de implementação do modelo este pode ser usado como um conjunto de tabelas ou gráficos, ou como um programa em computador que produzirá uma tabela ou gráfico do crescimento e produção, para uma particular situação de intervenções silvícolas ou formando um submodelo integrado num programa mais amplo de planeamento florestal, o qual

usualmente incorpora informação do inventário numa base de dados, assim como de condicionantes económicas e técnicas na exploração e intervenções silvícolas (Alder, 1980).

Seja qual for o método utilizado na construção do modelo, o seu funcionamento pode basear-se, essencialmente, segundo dois processos:

‰ Processos estáticos - aqueles em que a produção (V em m3.ha-1) é estimada

directamente como função das variáveis, ao nível do povoamento, idade, qualidade da estação e história da sua densidade (p.e., equação de produção:

V = f (t, SI, G ou N)). A produção pode também ser obtida como função da área

basal por hectare do povoamento e da sua altura média ou altura dominante (p.e.,

equação de cubagem: V = f (G, h ou hdom)). Estes métodos são estáticos na

medida em que as funções de produção não permitem qualquer variação na história do tratamento do povoamento, excepto dentro de classes muito amplas de tratamentos alternativos de desbastes que já estivessem presentes nos dados recolhidos. As componentes da produção de maior interesse são o volume e o diâmetro médio. É possível determinar o volume do povoamento sabendo o número de árvores do povoamento, a sua altura média e o diâmetro médio recorrendo às equações de volume de dupla entrada. A variável número de árvores é utilizada para definir os tratamentos de desbaste, enquanto a altura é o modo mais corrente para a classificação da qualidade de estação (Alder, 1980).

As limitações dos modelos estáticos de produção, embora de construção mais simples, são:

- a dificuldade em combinar situações radicalmente diferentes ou variáveis dos vários tratamentos ocorridos e obter um modelo consistente;

- após o modelo construído, não ser possível predizer produções para tratamentos alternativos para além daqueles consignados no modelo;

- a determinação da produção saída em desbaste (volume secundário) ser difícil, excepto se existirem registos de confiança das árvores cortadas, o que nem sempre se verifica mesmo quando se trata de parcelas permanentes (Alder, 1980).

‰ Processos dinâmicos - aqueles em que se modelam as taxas de variação dentro do

sistema. Isto significa que a base da predição são os acréscimos em diâmetro, em área basal ou em volume. Representam de uma forma mais realista a verdadeira causa e efeitos da dependência entre a densidade e a produção do povoamento. Estão livres da limitação de que os dados devam representar séries consistentes da história da densidade do povoamento e consequentemente podem ser usados

como base para analisar e sintetizar dados de uma grande variedade de tipos de ensaios e de parcelas permanentes. Têm como base funções que predizem os acréscimos em diâmetro médio, área basal ou volume por hectare em pequenos intervalos de tempo, como função da densidade do povoamento e expresso em termos da área basal e/ou idade e idade e classe de qualidade. Para se obterem as predições da produção, a função de crescimento é integrada matematicamente ou iterativamente somada ao longo de anos sucessivos (Alder, 1980).

Para realizar a simulação do modelo construído consideram-se as seguintes fases de operação:

‰ Fase inicial - onde se indicam os valores iniciais, como p.e., da área basal, altura e

número de árvores do povoamento;

‰ Fase dinâmica - quando o crescimento do povoamento é calculado e somado às

existências, as operações de corte são realizadas se necessário, a idade do povoamento é incrementada, repetindo-se o processo, que terminará quando o povoamento é cortado ou o período a analisar chegar ao fim (Alder, 1980).