CAPÍTULO II USO DE MODELO DE REGRESSÃO LOGÍSTICA PARA
3.2. PROCESSAMENTO E ANÁLISE DOS DADOS
Foram calculados índices de competição independentes da distância (IID) para avaliação da competição submetida a cada indivíduo de Euterpe edulis (Tabela 8).
Tabela 8 - Índices de competição independentes da distância calculados no estudo.
Índice Autor (ano) Equação
𝐼𝐼𝐷1 = 𝐴𝑆𝑖
2
𝐴𝑆𝑞2 STAGE (1973) (1)
𝐼𝐼𝐷2 = 𝐵𝐴𝐿𝑖 STAGE (1973) (2)
Onde: 𝐴𝑆𝑖 = área seccional do fuste da árvore-objeto, medido a 1,30 m de altura (m²), 𝐴𝑆𝑞 = área seccional correspondente ao diâmetro médio (q) dos fustes das árvores vizinhas (m²); 𝐵𝐴𝐿𝑖 = somatório das áreas seccionais dos fustes das árvores vizinhas maiores que o fuste da árvore-objeto.
Com o uso das informações dos coeficientes de correlação simples das variáveis independentes com a variável dependente (Tabela 9), foram selecionados o DAP, Altura total (Ht) e o 𝐼𝐼𝐷1 para a construção do modelo de probabilidade de ocorrência de produção
Tabela 9 - Correlação entre variáveis dendrométricas, número de cachos e índices de competição. Cachos Ht DAP 𝐼𝐼𝐷1 𝐼𝐼𝐷2 Cachos 1 Ht 0,5719 1 DAP 0,5304 0,8269 1 𝐼𝐼𝐷1 0,4334 0,5639 0,7917 1 𝐼𝐼𝐷2 -0,4221 -0,5667 -0,7208 0,7308 1
Em que, Ht = Altura do indivíduo de Juçara; DAP = Diâmetro à 1,30 do solo; 𝐼𝐼𝐷1= Índice de competição 01; 𝐼𝐼𝐷2= Índice de competição 02.
Para início de entendimento sobre a influência das variáveis dendrométricas sobre a produção de cachos da Juçara, os indivíduos amostrados da espécie foram estratificados pela sua distribuição diamétrica e estrutura vertical. A definição de estratos verticais seguiu os critérios descritos por Souza e Soares (2013), Tabela 10. Os estratos foram calculados por parcela, incluindo todos os indivíduos arbóreos amostrados, de todas as espécies encontradas.
Tabela 10 - Estratificação em altura do povoamento florestal amostrado.
Estrato Fórmula
Inferior hhm1S
Médio hm-1Shhm1S
Superior h hm1S
Em que, h = altura total de cada indivíduo; hm = altura média dos indivíduos amostrados; S = desvio padrão da altura média.
Para estimar a probabilidade de produção de cachos em indivíduos de Euterpe edulis, optou-se pelo uso do modelo de probabilidade Logit. Adequado para estimar a probabilidade de ocorrência de um determinado evento, tal modelo tem sido utilizado em diversos estudos e diferentes áreas, como biologia, epidemiologia, medicina, economia, engenharia, entre outros (PINO, 2007).
Modelo de variável dependente limitada, o regressando é uma variável binária, podendo assumir dois valores, 1 se houver a ocorrência do evento e 0 em caso contrário (GUJARATI; PORTER, 2011). Desta forma, no presente estudo, os resultados do modelo apresentam a probabilidade de produção para determinado indivíduo de Juçara, dado seus valores de diâmetro, altura total e índice de competição. Para construção do mesmo utilizou- se todos indivíduos amostrados da espécie, a variável número de cachos, mesmo apresentando valores observados entre 0 e 4 cachos, foi transformada em variável binária.
A distribuição logística é utilizada como função de ligação no modelo Logit e pode ser escrito por:
𝑃𝑖 = 𝐸(𝑌 = 1ǀ 𝑋𝑖) = 𝑓(βX) (3)
Onde, Pi é a probabilidade do indivíduo i produzir pelo menos um cacho de frutos;
f é a função de distribuição acumulada; X é um vetor de variáveis explicativas; e β são parâmetros desconhecidos a serem estimados. A representação dessa relação no modelo Logit segue a seguinte forma:
𝑃𝑖 = 𝐸(𝑌 = 1ǀ 𝑋𝑖) = 1
1+𝑒−(βX) =
𝑒(Z) 1+𝑒(𝑍)
(4) Onde 𝑍𝑖= βX, sendo β os parâmetros desconhecidos e X o vetor de variáveis explicativas. Se a probabilidade de ocorrência de produção do indivíduo de Juçara é 𝑃𝑖, a não
ocorrência será (1- 𝑃𝑖). Dividindo a probabilidade de ocorrência pela não ocorrência, temos: 𝑃𝑖
1 − 𝑃𝑖 =
1 + 𝑒𝑍𝑖
1 + 𝑒−𝑍𝑖 = 𝑒
𝑍𝑖 (5)
A equação (5) representa a razão de chances de uma palmeira produzir, sendo a divisão entre a probabilidade de que um indivíduo de Juçara produza, pela probabilidade de que não haja produção para o mesmo. Realizando o logaritmo natural da equação (5) obtêm- se o logit (L):
𝐿𝑖 = ln ( 𝑃𝑖
1−𝑃𝑖) = 𝑍𝑖 = βX
(6)
Desta forma, o logaritmo da razão de chances (logit), 𝐿𝑖, é uma função linear das variáveis explicativas e dos parâmetros calculados.
Os parâmetros do modelo Logit são estimados pelo método da máxima verossimilhança (MV), cujo objetivo é maximizar a função de verossimilhança, ou seja, obter valores para os parâmetros ainda desconhecidos que eleve ao máximo a possibilidade de se observar os dados da variável dependente apresentados na matriz de entrada.
Para o presente estudo a função logística pode ser expressa da seguinte forma: ln ( 𝑃𝑖
1−𝑃𝑖) = β1+ β2𝐷𝐴𝑃 + β3𝐻𝑡 + β4𝐼𝐼𝐷1+ ɛ (7) Em que, DAP é o diâmetro à altura do peito, Ht a altura total do indivíduo de Euterpe edulis, 𝐼𝐼𝐷1 o índice de competição 1 calculado e ɛ o erro aleatório.
Os coeficientes estimados fornecem a variação no Logit a partir da mudança de uma unidade da variável independente. Valores positivos dos parâmetros significam que o aumento da variável independente retornará um aumento da probabilidade de ocorrência do fenômeno, ou seja, são diretamente proporcionais. Valores negativos para os regressores significa uma relação inversamente proporcional, na qual o aumento da variável independente significa a diminuição da probabilidade de ocorrência do fenômeno estudado. A hipótese é de que os parâmetros resultantes da aplicação do modelo Logit sejam positivos, tendo uma previsão de que o aumento nos valores do diâmetro, da altura e do índice de competição (com diminuição da competição), afetem positivamente a probabilidade de produção de cachos da Juçara.
Para testar a hipótese nula, em que os coeficientes estimados são simultaneamente iguais a zero, aplicou-se a função teste LR qui-quadrado. Semelhante ao teste F para modelos de regressão linear simples, a razão de verossimilhança segue a distribuição estatística X2, na qual o número de graus de liberdade é igual ao número de variáveis independentes do modelo (GUJARATI; PORTER, 2011).
A qualidade do ajuste em modelos de regressão binária não segue a medida convencional de qualidade de ajustamento, R². São empregadas medidas semelhantes, chamadas de pseudo R2 (GUJARATI; PORTER, 2011). Neste trabalho foram usados o R²
de McFradden (𝑅𝑀𝑐𝐹2 ) e count R2.
Optou-se por reestimar o modelo sem as variáveis não-significativas, para testar se a retirada dessas afetaria o ajuste. Os cálculos do presente trabalho foram realizados com o uso do software Stata/SE 12.0 (STATACORP, 2011).
4. RESULTADOS E DISCUSSÃO
4.1. DISTRIBUIÇÃO DOS INDIVÍDUOS EM CLASSE DIAMÉTRICA E EM