PROCESSAMENTO E ANÁLISE DOS DADOS - USO DE MODELO DE REGRESSÃO LOGÍSTICA PARA

CAPÍTULO II USO DE MODELO DE REGRESSÃO LOGÍSTICA PARA

3.2. PROCESSAMENTO E ANÁLISE DOS DADOS

Foram calculados índices de competição independentes da distância (IID) para avaliação da competição submetida a cada indivíduo de Euterpe edulis (Tabela 8).

Tabela 8 - Índices de competição independentes da distância calculados no estudo.

Índice Autor (ano) Equação

𝐼𝐼𝐷₁ = 𝐴𝑆𝑖

𝐴𝑆𝑞2 STAGE (1973) (1)

𝐼𝐼𝐷2 = 𝐵𝐴𝐿𝑖 STAGE (1973) (2)

Onde: 𝐴𝑆_𝑖 = área seccional do fuste da árvore-objeto, medido a 1,30 m de altura (m²), 𝐴𝑆𝑞 = área seccional correspondente ao diâmetro médio (q) dos fustes das árvores vizinhas (m²); 𝐵𝐴𝐿_𝑖 = somatório das áreas seccionais dos fustes das árvores vizinhas maiores que o fuste da árvore-objeto.

Com o uso das informações dos coeficientes de correlação simples das variáveis independentes com a variável dependente (Tabela 9), foram selecionados o DAP, Altura total (Ht) e o 𝐼𝐼𝐷1 para a construção do modelo de probabilidade de ocorrência de produção

Tabela 9 - Correlação entre variáveis dendrométricas, número de cachos e índices de competição. Cachos Ht DAP 𝐼𝐼𝐷₁ 𝐼𝐼𝐷₂ Cachos 1 Ht 0,5719 1 DAP 0,5304 0,8269 1 𝐼𝐼𝐷₁ 0,4334 0,5639 0,7917 1 𝐼𝐼𝐷₂ -0,4221 -0,5667 -0,7208 0,7308 1

Em que, Ht = Altura do indivíduo de Juçara; DAP = Diâmetro à 1,30 do solo; 𝐼𝐼𝐷₁= Índice de competição 01; 𝐼𝐼𝐷₂= Índice de competição 02.

Para início de entendimento sobre a influência das variáveis dendrométricas sobre a produção de cachos da Juçara, os indivíduos amostrados da espécie foram estratificados pela sua distribuição diamétrica e estrutura vertical. A definição de estratos verticais seguiu os critérios descritos por Souza e Soares (2013), Tabela 10. Os estratos foram calculados por parcela, incluindo todos os indivíduos arbóreos amostrados, de todas as espécies encontradas.

Tabela 10 - Estratificação em altura do povoamento florestal amostrado.

Estrato Fórmula

Inferior _h_hm₁_S

Médio hm-1Shhm1S

Superior h hm1S

Em que, h = altura total de cada indivíduo; hm = altura média dos indivíduos amostrados; S = desvio padrão da altura média.

Para estimar a probabilidade de produção de cachos em indivíduos de Euterpe edulis, optou-se pelo uso do modelo de probabilidade Logit. Adequado para estimar a probabilidade de ocorrência de um determinado evento, tal modelo tem sido utilizado em diversos estudos e diferentes áreas, como biologia, epidemiologia, medicina, economia, engenharia, entre outros (PINO, 2007).

Modelo de variável dependente limitada, o regressando é uma variável binária, podendo assumir dois valores, 1 se houver a ocorrência do evento e 0 em caso contrário (GUJARATI; PORTER, 2011). Desta forma, no presente estudo, os resultados do modelo apresentam a probabilidade de produção para determinado indivíduo de Juçara, dado seus valores de diâmetro, altura total e índice de competição. Para construção do mesmo utilizou- se todos indivíduos amostrados da espécie, a variável número de cachos, mesmo apresentando valores observados entre 0 e 4 cachos, foi transformada em variável binária.

A distribuição logística é utilizada como função de ligação no modelo Logit e pode ser escrito por:

𝑃_𝑖 = 𝐸(𝑌 = 1ǀ 𝑋_𝑖) = 𝑓(βX) (3)

Onde, Pi é a probabilidade do indivíduo i produzir pelo menos um cacho de frutos;

f é a função de distribuição acumulada; X é um vetor de variáveis explicativas; e β são parâmetros desconhecidos a serem estimados. A representação dessa relação no modelo Logit segue a seguinte forma:

𝑃_𝑖 = 𝐸(𝑌 = 1ǀ 𝑋_𝑖) = 1

1+𝑒−(βX) =

𝑒(Z) 1+𝑒(𝑍)

(4) Onde 𝑍_𝑖= βX, sendo β os parâmetros desconhecidos e X o vetor de variáveis explicativas. Se a probabilidade de ocorrência de produção do indivíduo de Juçara é 𝑃𝑖, a não

ocorrência será (1- 𝑃_𝑖). Dividindo a probabilidade de ocorrência pela não ocorrência, temos: 𝑃_𝑖

1 − 𝑃_𝑖 =

1 + 𝑒𝑍𝑖

1 + 𝑒−𝑍𝑖 = 𝑒

𝑍𝑖 (5)

A equação (5) representa a razão de chances de uma palmeira produzir, sendo a divisão entre a probabilidade de que um indivíduo de Juçara produza, pela probabilidade de que não haja produção para o mesmo. Realizando o logaritmo natural da equação (5) obtêm- se o logit (L):

𝐿_𝑖 = ln ( 𝑃𝑖

1−𝑃𝑖) = 𝑍𝑖 = βX

(6)

Desta forma, o logaritmo da razão de chances (logit), 𝐿_𝑖, é uma função linear das variáveis explicativas e dos parâmetros calculados.

Os parâmetros do modelo Logit são estimados pelo método da máxima verossimilhança (MV), cujo objetivo é maximizar a função de verossimilhança, ou seja, obter valores para os parâmetros ainda desconhecidos que eleve ao máximo a possibilidade de se observar os dados da variável dependente apresentados na matriz de entrada.

Para o presente estudo a função logística pode ser expressa da seguinte forma: ln ( 𝑃𝑖

1−𝑃𝑖) = β1+ β2𝐷𝐴𝑃 + β3𝐻𝑡 + β4𝐼𝐼𝐷1+ ɛ (7) Em que, DAP é o diâmetro à altura do peito, Ht a altura total do indivíduo de Euterpe edulis, 𝐼𝐼𝐷₁ o índice de competição 1 calculado e ɛ o erro aleatório.

Os coeficientes estimados fornecem a variação no Logit a partir da mudança de uma unidade da variável independente. Valores positivos dos parâmetros significam que o aumento da variável independente retornará um aumento da probabilidade de ocorrência do fenômeno, ou seja, são diretamente proporcionais. Valores negativos para os regressores significa uma relação inversamente proporcional, na qual o aumento da variável independente significa a diminuição da probabilidade de ocorrência do fenômeno estudado. A hipótese é de que os parâmetros resultantes da aplicação do modelo Logit sejam positivos, tendo uma previsão de que o aumento nos valores do diâmetro, da altura e do índice de competição (com diminuição da competição), afetem positivamente a probabilidade de produção de cachos da Juçara.

Para testar a hipótese nula, em que os coeficientes estimados são simultaneamente iguais a zero, aplicou-se a função teste LR qui-quadrado. Semelhante ao teste F para modelos de regressão linear simples, a razão de verossimilhança segue a distribuição estatística X2, na qual o número de graus de liberdade é igual ao número de variáveis independentes do modelo (GUJARATI; PORTER, 2011).

A qualidade do ajuste em modelos de regressão binária não segue a medida convencional de qualidade de ajustamento, R². São empregadas medidas semelhantes, chamadas de pseudo R2_{(GUJARATI; PORTER, 2011). Neste trabalho foram usados o R²}

de McFradden (𝑅_𝑀𝑐𝐹2 _{) e count R}2_.

Optou-se por reestimar o modelo sem as variáveis não-significativas, para testar se a retirada dessas afetaria o ajuste. Os cálculos do presente trabalho foram realizados com o uso do software Stata/SE 12.0 (STATACORP, 2011).

4. RESULTADOS E DISCUSSÃO

4.1. DISTRIBUIÇÃO DOS INDIVÍDUOS EM CLASSE DIAMÉTRICA E EM

No documento Caracterização e potencial manejo de fragmento de floresta estacional semidecidual (páginas 53-56)