Distribuição e riqueza de espécies
arbóreas no Estado de Santa Catarina:
modelos atuais e futuros
Ernestino Guarino (Embrapa Acre)
Fernando S. Rocha (UFRGS)
João André Jarenkow (UFRGS) +
Apresentação dividida em duas partes
Teórica
Prática
Objetivo do projeto Um pouco da teoria envolvida por trás dos métodos propostosExemplo com
3 espécies
Mas o que são
modelos de distribuição de espécies
?
De forma simples, MDE é uma forma de extrapolar dados de ocorrência (0/1) no espaço e no tempo (Franklin 2009)
Mas o que são
modelos de distribuição de espécies
?
Qualquer modelo estatístico ou conjunto de regras utilizado para descrever a relação empírica entre a ocorrência de uma espécie e um conjunto de variáveis
Mas o que são
modelos de distribuição de espécies
?
Estes modelos tem como base a teoria do nicho hipervolumétrico de Hutchinson (1957) e representam quais os fatores controlam a distribuição das espécies na
Por que modelar a
distribuição das espécies
?
- Biogeografia;
- Design de reservas e planejamento de ações de conservação;
- Definição de áreas para reintrodução ou translocação de
espécies;
- Planejamento de expedições de coletas de germoplasma;
- Risco de invasão de espécies;
Além das mudanças climáticas, existe um outro
fator importante a ser observado: mudanças no
uso do solo geradas pelas alterações propostas
Objetivos gerais da proposta
Modelar a
distribuição
e a
riqueza de espécies
arbóreas e arborescentes
no estado de Santa
Catarina e predizer, para diferentes
cenários legais
e
ambientais futuros
, quais os impactos na distribuição
e
riqueza
das
espécies,
indicando
quais
potencialmente aumentarão a ocorrência e quais a
diminuirão, bem como quais zonas do Estado serão
mais sensíveis a possíveis diminuições na riqueza.
Objetivos específicos da proposta
(i)
fundamentar a formulação da política florestal do estado;
(ii)
fornecer informações para o zoneamento
econômico-ecológico para a atividade florestal no estado;
(iii)
gerar informações para a atualização da lista das
espécies vegetais ameaçadas de extinção e
(iv)
subsidiar a identificação e definição de áreas prioritárias
para a conservação de ecossistemas e a recuperação de
ecossistemas degradados.
Metas
Meta 1:
Vincular a produção oriunda deste projeto ao
ensino de graduação e pós-graduação, inserindo ao
longo do trabalho alunos de iniciação científica, mestrado
e doutorado.
(João André Jarenkow).
1 aluno de pós graduação envolvido (Márcio Verdi - PPG
Botânica da UFRGS)
Metas
Meta 2:
Fornecer publicações científicas que permitam
aos gestores estaduais obter subsídios para a definição e
o estabelecimento de políticas públicas para a
conservação e o manejo da flora catarinense.
(toda a
equipe)
Modelamos a distribuição de três espécies:
Araucaria angustifolia
Dicksonia sellowiana
Ocotea porosa
Métodos
-
19 variáveis bioclimáticas geradas por interpolação de dados
de climáticos mensais
-wolrdclim global climate data,
www.worldclim.org
- 0.93 x 0.93 km
2= 0.86 km
2resolução espacial (i.e., resolução
máxima 18.6 x 18.6 km = 344 km
2)
Localização das estações climáticas (http://www.worldclim.org/methods)
BIO1 = Annual Mean Temperature
BIO2 = Mean Diurnal Range (Mean of monthly (max temp - min temp)) BIO3 = Isothermality (BIO2/BIO7)
BIO4 = Temperature Seasonality (standard deviation *100) BIO5 = Max Temperature of Warmest Month
BIO6 = Min Temperature of Coldest Month BIO7 = Temperature Annual Range
BIO8 = Mean Temperature of Wettest Quarter BIO9 = Mean Temperature of Driest Quarter BIO10 = Mean Temperature of Warmest Quarter BIO11 = Mean Temperature of Coldest Quarter BIO12 = Annual Precipitation
BIO13 = Precipitation of Wettest Month BIO14 = Precipitation of Driest Month
BIO15 = Precipitation Seasonality (Coefficient of Variation) BIO16 = Precipitation of Wettest Quarter
BIO17 = Precipitation of Driest Quarter BIO18 = Precipitation of Warmest Quarter BIO19 = Precipitation of Coldest Quarter
Programas utilizados
Quantum GIS + GRASS (www.qgis.org) R (www.r-project.org)
Atenção:Com exceção do Windows, todos os programas utilizados na execução do trabalho são livres, isso significa uma redução de gastos na execução e a não utilização de programas “piratas”.
Métodos
- Foi ajustado um modelo (GLM) para cada espécie, sendo
que as variáveis preditoras mais significativas foram
selecionada por meio do AIC (Akaike Information Criterion)
baseado em um processo de escolha stepwise (ambas as
direções);
- Para evitar multicolinearidade variáveis ambientais com
correlação de Pearson (r)
≥
0.8 foram retiradas da análise
BIO1 = Annual Mean Temperature
BIO2 = Mean Diurnal Range (Mean of monthly (max temp - min temp)) BIO4 = Temperature Seasonality (standard deviation *100)
BIO8 = Mean Temperature of Wettest Quarter BIO9 = Mean Temperature of Driest Quarter
BIO12 = Annual Precipitation
BIO13 = Precipitation of Wettest Month BIO14 = Precipitation of Driest Month
Métodos
Validação:
cross-validation
, dividindo o conjunto de dados em
dois: treino e teste.
Esta divisão foi realizada utilizando o método k-fold. Neste
método o conjunto de dados é particionado aleatoriamente em k
subamostras, onde as k-1 subamostras são retidas para criar
modelos de treino enquanto uma subamostra de tamanho k é
retida para posteriormente testar os modelos, sendo este
k subgrupos (folds, k=10)
Todas as parcelas (1000)
Conjunto de teste (k, n=100) Conjunto treino (k-1, n=900) Modelo ajustado (treino) Parâmetros de avaliação do conjunto treino Parâmetros de avaliação
do conjunto teste
Procedimento é repetido
10x
média ± DP média ± DP k subgrupos (folds, k=10) Todas as parcelas (1000)Métodos
A partir desse conjunto de teste e de treino nos calculamos
os seguintes parâmetros de avaliação dos modelos:
-
AUC (Area under the ROC curve):
mede a capacidade do modelo discriminar presenças e
ausências, seu valor varia de 0 – 1. Modelos com AUC
≥
0.75 são considerados bons (Elith et al. 2006)
Métodos
- Sensibilidade:
é a proporção de presenças que são corretamente
preditas. É posteriormente utilizada para calcular o erro de
omissão (prever a ausência de uma
espécie quando ela está presente) (Franklin 2009).
- Especificidade:
é a proporção de ausências observadas que são preditas
corretamente. É posteriormente utilizada para calcular o
erro de comissão (predizer a
presença de uma espécie quando ela não está presente)
(Franklin 2009).
Matriz de
confusão
P re d it a Observada + -+ a b - c da = Positivo verdadeiro b = Falso positivo c = Falso negativo d = Verdadeiro negativo P re d it a Observada + -+ a b - c d
a
(
a+c
)
Sensibilidade =
d
(
d+b
)
Especificidade =
P re d it a Observada + -+ a b - c dMétodos
- TSS (True Skill Statistic):
1-(Sensitividade+Especificidade). Varia entre -1 e +1,
sendo que zero, ou menos, indica baixa concordância entre
dados observados e
preditos (modelos não melhores do que o acaso), enquanto
valores próximos a +1 indicam alta concordância (Allouche
et al. 2006).
Araucaria angustifolia minimum: 0.37 maximum: 0.99 AUC training: 0.875 ± 0.006 AUC test: 0.855 ± 0.057 ST training: 0.851 ± 0.033 ST test: 0.855 ± 0.077 SP training: 0.815 ± 0.024 SP test: 0.813 ±0.065 TSS training: 0.565 ± 0.035 TSS test: 0.585 ± 0.147
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 11.883334 4.809320 2.471 0.013477 * bio2_34 0.095157 0.027938 3.406 0.000659 *** bio4_34 -0.003961 0.001728 -2.292 0.021880 * bio8_34 -0.040751 0.009630 -4.231 2.32e-05 *** bio12_34 0.007719 0.005167 1.494 0.135194 bio13_34 -0.109458 0.048498 -2.257 0.024010 * bio15_34 0.246171 0.147996 1.663 0.096239 . ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 379.09 on 286 degrees of freedom Residual deviance: 242.02 on 280 degrees of freedom
Pseudo R2: 36.15%
AIC: 256.02
Dicksonia sellowiana minimum: 0.98 maximum: 0.99 AUC training: 0.843 ± 0.008 AUC test: 0.781 ± 0.076 ST training: 0.816 ± 0.033 ST test: 0.846 ± 0.126 SP training: 0.736 ± 0.033 SP test: 0.690 ± 0.166 TSS training: 0.509 ± 0.024 TSS test: 0.6125 ± 0.174
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.426614 3.743742 0.114 0.9093 bio1_34 -0.107484 0.013785 -7.797 6.34e-15 *** bio4_34 0.004979 0.001161 4.289 1.79e-05 *** bio13_34 0.014834 0.008560 1.733 0.0831 . ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 396.33 on 286 degrees of freedom Residual deviance: 278.88 on 283 degrees of freedom
Pseudo R2: 29.63%
AIC: 286.88
Ocotea porosa minimum: 0 maximum: 0.93 AUC training: 0.904 ± 0.0124 AUC test: 0.881 ± 0.099 ST training:0.777 ± 0.0316 ST test:0.843 ± 0.125 SP training: 0.922 ± 0.0146 SP test: 0.870 ± 0.151 TSS training:0.655 ± 0.045 TSS test: 0.711 ± 0.118
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 6.694679 4.322756 1.549 0.12145 bio1_34 -0.119920 0.024624 -4.870 1.12e-06 *** bio2_34 0.187987 0.028778 6.532 6.48e-11 *** bio12_34 -0.023852 0.007114 -3.353 0.00080 *** bio13_34 0.199317 0.065159 3.059 0.00222 ** bio15_34 -0.364078 0.194141 -1.875 0.06075 . ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 262.34 on 286 degrees of freedom Residual deviance: 159.56 on 281 degrees of freedom
Pseudo R2: 39.18%
AIC: 171.56