CST-304-3: EMBio
Fundamentos de Ecologia e de Modelagem Ambiental aplicados à conservação da Biodiversidade
Daniel E SILVA
esilva@dsr.inpe.br SERE1 sala 22 / ramal 6436
- Percurso e temáticas
- Conteúdo do curso:
- técnicas de classificação e ordenação da biodiversidade
- exemplos aplicados ao estudo da vegetação
- nível de organização: comunidade vegetal
- unidade: espécie/indivíduos em plot
Observando variações espaciais da composição em espécies
Por que em um dado lugar existem espécies frequentes, outras raras e ainda outras nunca observadas? Por que combinações similares de espécies se repetem em ambientes similares?
Autoecologia – estratégia de vida – contexto regional
Por que sob condições similares, a composição da vegetação não é exatamente a mesma? Espécies coocorrentes tem nicho similar?
Observando variações espaciais da composição de espécies
Classificação climática de Köppen-Geiger para o Brasil
Variações espaciais das condições ambientais
Mapa do solo do Brasil (EMBRAPA, 2001)
T°C
P
Padrões espaciais de distribuição das espécies
Exigências específicas atrás de cada ocorrência (nicho) esp. T°C P esp.3 esp.1 esp.2
Variações espaciais da composição de espécies relacionadas a gradientes de condições ambientais
esp.4 P T°C Abu ndâ nci a
+
Esp. 2+3 = P baixa, T°C media Esp. 1+4 = T°C e P altas
Realidade mais complexa!!
unimodal
Por que a mudança de composição da vegetação é geralmente gradual no espaço?
Observando variações espaciais da composição de espécies
Variação de condições é gradual Autoecologia própria a cada espécie
A comunidade ≠ organismo, = integração de vários organismos
(Palmer, 2013)
Condições ótimas (abundância da espécie máxima) = combinação única de valores para vários fatores
Apesar de altas correlações espaciais entre fatores (ambientais/históricos/antrópicos): combinações infinitas
Por que ordenar e classificar a vegetação?
Detectar os padrões de distribuição da vegetação e entender as suas relações com as
condições ambientais é crucial para entender como as comunidades respondem às
mudanças de ambiente.
Ordenar: organização de espécies ou plots ao longo de gradientes (coocorrência, similaridade florísitica) Classificar: colocação de espécies ou plots em grupos, de acordo com os critérios de coocorrência e similaridade florísitica
Sintetizar as informações sobre os padrões de distribuição para entender os processos
modeladores da biodiversidade (ferramentas para conservação/recuperação)
Adaptar nível e escala de estudo (hierarquização da classificação) Analisar os padrões de distribuição da biodiversidade com eficiência Sistematizar a interpretação de padrões
Como ordenar e classificar a vegetação?
Dados de composição da vegetação
Sp. p1 p2 p3 p4 p5 p6 p7 p8 p9 p1 p11 p12 p13 p14 p15 p16 p17 p18 p19 p2 p21 p22 p23 p24 p25 p26 p27 p28 p29 Angelica sylvestris 2 1 1 Athyrium filix-femina 5 6 35 3 15 35 25 55 25 1 2 7 6 75 5 2 9 85 85 45 75 65 7 7 25 3 Callitriche platycarpa 1 1 Callitriche stagnalis 2 1 1 2 1 Cardamine pratensis 5 1 1 2 5 1 2 Carex pendula 5 1 1 5 1 15 15 5 5 Carex remota 1 2 15 5 5 5 5 5 1 25 5 5 Chrysosplenium oppositifolium 2 1 1 Cirsium palustre 5 2 1 5 Deschampsia cespitosa 5 5 3 25 5 2 25 35 15 1 2 65 4 9 3 25 1 4 35 15 25 Filipendula ulmaria 1 1 Galium palustre 1 1 Glyceria fluitans 2 1 5 2 2 Juncus effusus 15 1 15 1 Lotus uliginosus 5 1 1 1 Lysimachia nemorum 2 1 1 1 1 1 Mentha arvensis 1 1 Myosotis scorpioides 2 1 Persicaria hydropiper 1 1 Ranunculus repens 1 1 2 5 Rumex sanguineus 2 1 2 2 Scrophularia auriculata 1 1 Solanum dulcamara 1 1 Sphagnum palustre 1 1 Stachys sylvatica 2 1 1 1 Stellaria alsine 1 1
Espécies
plots
Ocorrência ou abundância
Espécie rara Espécie frequenteMaior riqueza Menor riqueza
Frequência de ocorrências das 26 espécies no conjunto de plots
Riqueza específica dos 29 plots Espécies raras
Espécies frequentes
Menor riqueza
Maior riqueza
Como ordenar e classificar a vegetação?
Classificação/ordenação simples
- classificação subjetiva:
Associação de espécie(s) dominante(s) ou característica(s) de um ambiente.
- classificação/ordenação matemática:
Índices de similaridade de comunidades:
Jaccard (1901) : ISJ= Sorensen (1948): ISS=
Ordenação:
1 plot de referênciaN° espécies comunas
N° total espécies
Plots 1 2 3 4 1 1 2 0.8 1 3 0.3 0.8 1 4 0.2 0.4 0.7 1N° espécies comunas
N° médio de espécies
Limiar subjetivo para agrupar
Aumento do número de plots?
Qual critério de seleção
do plot de referência?
Subjetivo
Difícil reprodução
Conhecimentos acentuados em Ecologia
Laborioso
Não sintético
Vn
Pm
Vn
Pm
Como ordenar e classificar a vegetação?
Variáveis (Vn)
Ob
se
rv
aç
ões
(
Pm
)
Quantitativo,
qualitativo
V3
Como resumir a variabilidade dessas observações?V1
V2
Pm
Classificação/ordenação baseadas em análises multivariáveis
- análise multivariável:
Vn
Pm
Variância máxima V2 V1 V3 V1 V2 V3 V1 V3 V2Procurando a solução...
Obj. análise multivariável: voltar a um espaço de dimensão reduzida com a menor deformação
Variância máxima
F1
Variáveis (Vn) V ar iá vei s (Vn ) Matriz de variância-covariância Variáveis (Vn) V ar iá vei s (Vn ) Matriz de correlaçãoProcurando os n Fatores...
Como ordenar e classificar a vegetação?
Classificação/ordenação baseadas em análises multivariáveis
- análise multivariável:
O que a análise multivariável traz para o estudo da distribuição da vegetação?
Ferramenta exploratória para a interpretação de dados pelo ecólogo.
Identificação de gradientes de composição, de forma sintética, eficiente e sistemática (reproduzível) “Ordination [multivariate techniques] primarily endeavors to represent sample and species relationships as faithfully as possible in a low-dimensional space” (Gauch, 1982) = Dimension reduction techniques Quantificação dos gradientes, legível e intuitivo
Como ordenar e classificar a vegetação?
Técnicas de ordenação baseadas em análises multivariáveis
Análise indireta de gradiente: utiliza as espécies para identificar quais são os gradientes ambientais
mais importantes
Análise direta de gradiente: utiliza as espécies E as descrições do ambiente, similar a uma regressão
entre os dois tipos, testando a hipótese nula (não existe relação)
Indirect gradient analysis Distance-based approaches
- Polar ordination, PO (Bray-Curtis ordination)
- Principal Coordinates Analysis, PCoA (Metric multidimensional scaling) - Nonmetric Multidimensional Scaling, NMDS
Eigenanalysis-based approaches
- Linear model: Principal Components Analysis, PCA
- Unimodal model: Correspondence Analysis, CA (Reciprocal Averaging) / Detrended Correspondence Analysis, DCA
Direct gradient analysis Linear model
- Redundancy Analysis, RDA
Unimodal model
Como ordenar e classificar a vegetação?
Técnicas de classificação automática
Não-hierárquica: número de classes/grupos prédefinido Hierárquica: aglomeração ou divisão
Ordenação: análise indireta de gradiente
Análise de Componentes Principais (ACP) (Pearson, 1901)
Vn Pm F1 F1 F2 F1 F2
Um fator (eixo) = combinação de todas as variáveis Vn
F1 representa a maior variância, F2 a maior variância restante, etc... F1 e F2 ortogonais (não correlacionados)
Variância explicada por iF > a explicada por iV Representação por plano
Pm Pm Pm F1 F2 Pm Vn
Variáveis (Vn)
O
b
se
rv
aç
ões
(
Pm
)
Quantitativo
Ordenação: análise indireta de gradiente
Análise de Componentes Principais (ACP) (Pearson, 1901)
F1
F2
Pm
Vn Plots em substrato de granito
Plots em substrato de calcário
Sp. calcífilas Sp. acidófilas Fatores (Fn) V ar iá ve is (Vn ) Fatores (Fn) O b serv aç õ es (Pm )
Ma
tr
iz
es
de
corr
elaç
ão
Ordenação: análise indireta de gradiente
Análise de Componentes Principais (ACP) (Pearson, 1901)
Ordenação: análise indireta de gradiente
Análise de Componentes Principais (ACP) (Pearson, 1901)
Problemas!!
ACP: Vegetação:
Variáveis quantitativas continuas ≠ Abundância ou ocorrência
Modelo linear Resposta ambiente-vegetação unimodal
Perfeito para dados ambientais
P Abu n d an ci a
Ordenação: análise indireta de gradiente
Análise de Correspondências (AC) (Hirschfeld, 1935; Benzecri, 1973)
Mesmos princípios que a ACP Modelo de resposta unimodal
Variáveis quantitativas, semiquantitativas, binárias
Tenta maximizar a correspondência entre variaveis e observações nos novos planos ≠ maximizar a variância (ACP)
Ordenação: análise direta de gradiente
Os gradientes de distribuição das espécies são correlacionados aos gradientes ambientais?
Hipótese nula: não existe relação
Análise de Correspondência Canônica (ACC) (Hotelling, 1936; Ter Braak, 1986)
Mesmos princípios que a AC
Fatores (eixos) “forçados” a serem combinações de variáveis ambientais
=> as combinações de variáveis ambientais mais correlacionadas com a composição em espécies contribuem mais à formação de um fator (eixo).
F1 = a1 x Amb1 + b1 x Amb2 + c1 x Amb3
F2 = a2 x Amb1 + b2 x Amb2 + c2 x Amb3 etc... Sp1 Sp2 plots AC: Eixo 1? Sp1 Sp2 plots ACC: Eixo 1? Amb.1 Amb.2 Amb.3 Ex: Sp1 e Sp2 correlacionados
Ordenação: análise direta de gradiente
Análise de Correspondência Canônica (ACC) (Hotelling, 1936; Ter Braak, 1986)
(Palmer, 2013)
Asimina triloba, Quercus muehlenbergii, Fraxinus americana: pH alto
Quercus stellata, Quercus marilandica, Carya texana: solos ácidos
Cephalanthus occidentalis, Salix nigra: zonas úmidas
Classificação não hierárquica
Inconveniente: número pré-definido de classes influencia os resultados
Ex: Centros móveis
Variáveis (Vn) O b ser va çõ e s (Pm ) Dados quantitativos Observações (Pm) O b ser va çõ e s (Pm ) Matriz de distâncias
Escolha aleatória de n indivíduos como centros de n classes Agregação dos indivíduos nos centros de classes
Calculo dos novos centros de classes
Classificação hierárquica
Número de classes não interfere nos resultados, adaptável Dois tipos: agregação ou divisão
Classificação ascendente hierárquica (agregação)
Variáveis (Vn) O b ser va çõ e s (Pn ) Dados quantitativos Observações (Pn) O b ser va çõ e s (Pn ) Matriz de distâncias (euclidiana, Bray-Curtis, ...)
Agrupamento das 2 observações de menor distância Prosseguindo: nova matriz, atualizada, vários métodos (UPGMA, Ward, etc...)
Classificação hierárquica
Número de classes não interfere nos resultados, adaptável Dois tipos: agregação ou divisão
Classificação ascendente hierárquica (agregação)
Biomassa espécies V1 e V2. Plots A a E.
Método UPGMA:
Classificação hierárquica
Número de classes não interfere nos resultados, adaptável Dois tipos: agregação ou divisão
Classificação ascendente hierárquica (agregação)
Classificação hierárquica
Número de classes não interfere nos resultados, adaptável Dois tipos: agregação ou divisão
Classificação ascendente hierárquica (agregação)
Representação das classes nos planos fatoriais da AC Estatísticas dos grupos para variáveis ambientais
Fator 2
Fator 1
Plots em função da similaridade florística Espécies em função da coocorrência
Biomassa espécies V1 e V2. Plots A a E.
Possibilidade de classificar a partir de fatores de análise multivariável (ex.: AC)
Classificação hierárquica
Número de classes não interfere nos resultados, adaptável Dois tipos: agregação ou divisão
Classificação hierárquica por divisão (TWINSPAN)
Primeiro eixo de uma CA: divisão no centróide Repetição para cada grupo formado
Sp. p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 p13 p14 p15 p16 p17 p18 p19 p20 p21 p22 p23 p24 p25 p26 p27 p28 p29 Angelica sylvestris 2 1 1 Athyrium filix-femina 5 6 35 3 15 35 25 55 25 1 2 7 6 75 5 2 9 85 85 45 75 65 7 7 25 3 Callitriche platycarpa 1 1 Callitriche stagnalis 2 1 1 2 1 Cardamine pratensis 5 1 1 2 5 1 2 Carex pendula 5 1 1 5 1 15 15 5 5 Carex remota 1 2 15 5 5 5 5 5 1 25 5 5 Chrysosplenium oppositifolium 2 1 1 Cirsium palustre 5 2 1 5 Deschampsia cespitosa 5 5 3 25 5 2 25 35 15 1 2 65 4 9 3 25 10 40 35 15 25 Filipendula ulmaria 1 1 Galium palustre 1 1 Glyceria fluitans 2 1 5 2 2 Juncus effusus 15 1 15 10 Lotus uliginosus 5 1 1 1 Lysimachia nemorum 2 1 1 1 1 1 Mentha arvensis 1 1 Myosotis scorpioides 2 1 Persicaria hydropiper 1 1 Ranunculus repens 1 1 2 5 Rumex sanguineus 2 1 2 2 Scrophularia auriculata 1 1 Solanum dulcamara 1 1 Sphagnum palustre 1 1 Stachys sylvatica 2 1 1 1 Stellaria alsine 1 1
Espécies
plots
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# DADOS QUANTITATIVOS: ABUNDANCIA DE ESPECIES
# FILTROS: conservar especies presentes em mais de um plot e plots com riqueza S>1
# carregar o arquivo txt de dados (veg_quant.txt, separador tabulacao)
arquivo <- "C:/.../veg_quant.txt"
x <- read.table(arquivo, header = TRUE, sep = "\t") x
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# deletar a coluna sp. x2 <- x[,2:30] x2 # transpor sp e plots tx2 <- t(x2) tx2 # analise acp# carregar pacote para acp (ade4)
library(ade4)
# acp
acp <- princomp(as.matrix(tx2),cor=TRUE) print(acp)
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# Valores proprios (eigenvalues) = variancia explicada por cada eixo
plot(acp,main="Valores proprios")
# escores das observacoes (plots)
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# Representacao das observacoes e variaveis no primeiro plano
biplot(acp, choices = 1:2,
main="Gradientes de composição da vegetação\nEixos 1x2")
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# Representacao das observacoes e variaveis no segundo plano (eixos 1 e 3)
biplot(acp, choices = 1:3,
main="Gradientes de composição da vegetação\nEixos 1x3")
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# Representacao alternativa das observacoes, variaveis e v. proprios
acp2 = dudi.pca(as.matrix(tx2),scannf=F,nf=2)
scatter(acp2,posieig="topright", sub = "Análise de Componentes Principais")
# Representacao das variaveis
s.label(acp2$co,boxes=F)
# Representacao das observacoes
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# Representacao alternativa das observacoes, variaveis e v. proprias
acp2 = dudi.pca(as.matrix(tx2),scannf=F,nf=2)
scatter(acp2,posieig="topright", sub = "Análise de Componentes Principais")
# Representacao das variaveis
s.label(acp2$co,boxes=F)
# Representacao das observacoes
s.label(acp2$li,boxes=F)
# Correlacoes entre variaveis e eixos
cor(acp2$tab[,'V26'],acp2$li[,1]) cor(acp2$tab[,'V24'],acp2$li[,2]) cor(acp2$tab[,'V24'],acp2$li[,1]) [1] 0.9514178 [1] 0.9044894 [1] -0.02015634
Sp. p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 p13 p14 p15 p16 p17 p18 p19 p20 p21 p22 p23 p24 p25 p26 p27 p28 p29 Angelica sylvestris 2 1 1 Athyrium filix-femina 5 6 35 3 15 35 25 55 25 1 2 7 6 75 5 2 9 85 85 45 75 65 7 7 25 3 Callitriche platycarpa 1 1 Callitriche stagnalis 2 1 1 2 1 Cardamine pratensis 5 1 1 2 5 1 2 Carex pendula 5 1 1 5 1 15 15 5 5 Carex remota 1 2 15 5 5 5 5 5 1 25 5 5 Chrysosplenium oppositifolium 2 1 1 Cirsium palustre 5 2 1 5 Deschampsia cespitosa 5 5 3 25 5 2 25 35 15 1 2 65 4 9 3 25 10 40 35 15 25 Filipendula ulmaria 1 1 Galium palustre 1 1 Glyceria fluitans 2 1 5 2 2 Juncus effusus 15 1 15 10 Lotus uliginosus 5 1 1 1 Lysimachia nemorum 2 1 1 1 1 1 Mentha arvensis 1 1 Myosotis scorpioides 2 1 Persicaria hydropiper 1 1 Ranunculus repens 1 1 2 5 Rumex sanguineus 2 1 2 2 Scrophularia auriculata 1 1 Solanum dulcamara 1 1 Sphagnum palustre 1 1 Stachys sylvatica 2 1 1 1 Stellaria alsine 1 1
Espécies
plots
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# eliminacao dos plots singulares: p1, p7, p11 e p12
# p1 e p7: riqueza S alta, e p11 e p12 especies raras e exclusivas
x3 <- x2[,-1] x4 <- x3[,-6] x5 <- x4[,-9] x6 <- x5[,-9] x6
# eliminacao das especies ausentas (Galium palustre, Mentha arvensis,
Myosotis scorpioides, Persicaria hydropiper, Solanum dulcamara, Sphagnum palustre) x3 <- x6[-12,] x4 <- x3[-16,] x5 <- x4[-16,] x6 <- x5[-16,] x7 <- x6[-19,] x8 <- x7[-19,] x9 <- x8[-20,] x9
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: ACP
# transpor sp e plots dos dados selecionados
tx9 <- t(x9) tx9
# Representacao alternativa das
observacoes, variaveis e v. proprios
acp9 = dudi.pca(as.matrix(tx9),scannf=F, nf=2)
scatter(acp9,posieig="topleft", sub = "Análise de Componentes Principais")
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: CAH
# carregar o arquivo txt de dados # deletar a coluna sp.
# transpor sp e plots -> tx2
# centrar e reduzir = padronizacao (so para dados nao binarios)
tx2r <- scale(tx2, center = TRUE, scale = TRUE) tx2r
# calculo das distancias (metodo "Euclidian" escolhido)
distx <- dist(tx2, method ="euclidean", diag=FALSE, upper=FALSE)
# classificacao hierarquica ascendente (metodos Ward e average UPGMA)
chaward <- hclust(distx,"ward")
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: CAH
# representacao classificacao hierarquica ascendente (metodos Ward e average UPGMA testados)
plot(chaward,hang=-1) plot(chaupgma,hang=-1)
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: CAH
# representacao classificação hierarquica ascendente (metodos Ward e average UPGMA testados)
plot(chaward,hang=-1) plot(chaupgma,hang=-1)
# recuperacao dos grupos (selecionar o numero de classes)
ward5 <- cutree(chaward,5) upgma5 <- cutree(chaupgma,5) ward9 <- cutree(chaward,9) upgma9 <- cutree(chaupgma,9)
# representacao dos grupos no primeiro plano da acp
biplot(acp,xlabs=ward5,choices = c(1,2),main="Gradientes de composição da vegetação") abline(v=0,h=0) biplot(acp,xlabs=ward9,choices = c(1,2),main="Gradientes de composição da vegetação") abline(v=0,h=0)
Exemplo: dados de ocorrência de briófitas (Palmer, 2013)
Usando R: CAH
# representacao dos grupos no primeiro plano da acp