Técnicas de Ordenação e Classificação da Biodiversidade

(1)

CST-304-3: EMBio

Fundamentos de Ecologia e de Modelagem Ambiental aplicados à conservação da Biodiversidade

Daniel E SILVA

esilva@dsr.inpe.br SERE1 sala 22 / ramal 6436

(2)

- Percurso e temáticas

- Conteúdo do curso:

- técnicas de classificação e ordenação da biodiversidade

- exemplos aplicados ao estudo da vegetação

- nível de organização: comunidade vegetal

- unidade: espécie/indivíduos em plot

(3)

Observando variações espaciais da composição em espécies

Por que em um dado lugar existem espécies frequentes, outras raras e ainda outras nunca observadas? Por que combinações similares de espécies se repetem em ambientes similares?

Autoecologia – estratégia de vida – contexto regional

Por que sob condições similares, a composição da vegetação não é exatamente a mesma? Espécies coocorrentes tem nicho similar?

(4)

Observando variações espaciais da composição de espécies

Classificação climática de Köppen-Geiger para o Brasil

Variações espaciais das condições ambientais

Mapa do solo do Brasil (EMBRAPA, 2001)

T°C

P

Padrões espaciais de distribuição das espécies

Exigências específicas atrás de cada ocorrência (nicho) esp. T°C P esp.3 esp.1 esp.2

Variações espaciais da composição de espécies relacionadas a gradientes de condições ambientais

esp.4 P T°C Abu ndâ nci a

+

Esp. 2+3 = P baixa, T°C media Esp. 1+4 = T°C e P altas

Realidade mais complexa!!

unimodal

(5)

Por que a mudança de composição da vegetação é geralmente gradual no espaço?

Observando variações espaciais da composição de espécies

Variação de condições é gradual Autoecologia própria a cada espécie

A comunidade ≠ organismo, = integração de vários organismos

(Palmer, 2013)

Condições ótimas (abundância da espécie máxima) = combinação única de valores para vários fatores

Apesar de altas correlações espaciais entre fatores (ambientais/históricos/antrópicos): combinações infinitas

(6)

Por que ordenar e classificar a vegetação?

Detectar os padrões de distribuição da vegetação e entender as suas relações com as

condições ambientais é crucial para entender como as comunidades respondem às

mudanças de ambiente.

Ordenar: organização de espécies ou plots ao longo de gradientes (coocorrência, similaridade florísitica) Classificar: colocação de espécies ou plots em grupos, de acordo com os critérios de coocorrência e similaridade florísitica

Sintetizar as informações sobre os padrões de distribuição para entender os processos

modeladores da biodiversidade (ferramentas para conservação/recuperação)

Adaptar nível e escala de estudo (hierarquização da classificação) Analisar os padrões de distribuição da biodiversidade com eficiência Sistematizar a interpretação de padrões

(7)

Como ordenar e classificar a vegetação?

Dados de composição da vegetação

Sp. p1 p2 p3 p4 p5 p6 p7 p8 p9 p1 p11 p12 p13 p14 p15 p16 p17 p18 p19 p2 p21 p22 p23 p24 p25 p26 p27 p28 p29 Angelica sylvestris 2 1 1 Athyrium filix-femina 5 6 35 3 15 35 25 55 25 1 2 7 6 75 5 2 9 85 85 45 75 65 7 7 25 3 Callitriche platycarpa 1 1 Callitriche stagnalis 2 1 1 2 1 Cardamine pratensis 5 1 1 2 5 1 2 Carex pendula 5 1 1 5 1 15 15 5 5 Carex remota 1 2 15 5 5 5 5 5 1 25 5 5 Chrysosplenium oppositifolium 2 1 1 Cirsium palustre 5 2 1 5 Deschampsia cespitosa 5 5 3 25 5 2 25 35 15 1 2 65 4 9 3 25 1 4 35 15 25 Filipendula ulmaria 1 1 Galium palustre 1 1 Glyceria fluitans 2 1 5 2 2 Juncus effusus 15 1 15 1 Lotus uliginosus 5 1 1 1 Lysimachia nemorum 2 1 1 1 1 1 Mentha arvensis 1 1 Myosotis scorpioides 2 1 Persicaria hydropiper 1 1 Ranunculus repens 1 1 2 5 Rumex sanguineus 2 1 2 2 Scrophularia auriculata 1 1 Solanum dulcamara 1 1 Sphagnum palustre 1 1 Stachys sylvatica 2 1 1 1 Stellaria alsine 1 1

Espécies

plots

Ocorrência ou abundância

Espécie rara Espécie frequente

Maior riqueza _{Menor riqueza}

Frequência de ocorrências das 26 espécies no conjunto de plots

Riqueza específica dos 29 plots Espécies raras

Espécies frequentes

Menor riqueza

Maior riqueza

(8)

Como ordenar e classificar a vegetação?

Classificação/ordenação simples

- classificação subjetiva:

Associação de espécie(s) dominante(s) ou característica(s) de um ambiente.

- classificação/ordenação matemática:

Índices de similaridade de comunidades:

Jaccard (1901) : IS_J= Sorensen (1948): IS_S=

Ordenação:

1 plot de referência

N° espécies comunas

N° total espécies

Plots 1 2 3 4 1 1 2 0.8 1 3 0.3 0.8 1 4 0.2 0.4 0.7 1

N° espécies comunas

N° médio de espécies

Limiar subjetivo para agrupar

Aumento do número de plots?

Qual critério de seleção

do plot de referência?

Subjetivo

Difícil reprodução

Conhecimentos acentuados em Ecologia

Laborioso

Não sintético

(9)

Vn

Pm

Vn

Pm

Como ordenar e classificar a vegetação?

Variáveis (Vn)

Ob

se

rv

aç

ões

(

Pm

)

Quantitativo,

qualitativo

V3

_{Como resumir a variabilidade dessas observações?}

V1

V2

Pm

Classificação/ordenação baseadas em análises multivariáveis

- análise multivariável:

Vn

Pm

Variância máxima V2 V1 V3 V1 V2 V3 V1 V3 V2

Procurando a solução...

Obj. análise multivariável: voltar a um espaço de dimensão reduzida com a menor deformação

Variância máxima



F1

Variáveis (Vn) V ar iá vei s (Vn ) Matriz de variância-covariância Variáveis (Vn) V ar iá vei s (Vn ) Matriz de correlação

Procurando os n Fatores...

(10)

Como ordenar e classificar a vegetação?

Classificação/ordenação baseadas em análises multivariáveis

- análise multivariável:

O que a análise multivariável traz para o estudo da distribuição da vegetação?

Ferramenta exploratória para a interpretação de dados pelo ecólogo.

Identificação de gradientes de composição, de forma sintética, eficiente e sistemática (reproduzível) “Ordination [multivariate techniques] primarily endeavors to represent sample and species relationships as faithfully as possible in a low-dimensional space” (Gauch, 1982) = Dimension reduction techniques Quantificação dos gradientes, legível e intuitivo

(11)

Como ordenar e classificar a vegetação?

Técnicas de ordenação baseadas em análises multivariáveis

Análise indireta de gradiente: utiliza as espécies para identificar quais são os gradientes ambientais

mais importantes

Análise direta de gradiente: utiliza as espécies E as descrições do ambiente, similar a uma regressão

entre os dois tipos, testando a hipótese nula (não existe relação)

Indirect gradient analysis Distance-based approaches

- Polar ordination, PO (Bray-Curtis ordination)

- Principal Coordinates Analysis, PCoA (Metric multidimensional scaling) - Nonmetric Multidimensional Scaling, NMDS

Eigenanalysis-based approaches

- Linear model: Principal Components Analysis, PCA

- Unimodal model: Correspondence Analysis, CA (Reciprocal Averaging) / Detrended Correspondence Analysis, DCA

Direct gradient analysis Linear model

- Redundancy Analysis, RDA

Unimodal model

(12)

Como ordenar e classificar a vegetação?

Técnicas de classificação automática

Não-hierárquica: número de classes/grupos prédefinido Hierárquica: aglomeração ou divisão

(13)

Ordenação: análise indireta de gradiente

Análise de Componentes Principais (ACP) (Pearson, 1901)

Vn Pm F1 F1 F2 F1 F2

Um fator (eixo) = combinação de todas as variáveis Vn

F1 representa a maior variância, F2 a maior variância restante, etc... F1 e F2 ortogonais (não correlacionados)

Variância explicada por iF > a explicada por iV Representação por plano

Pm Pm _Pm F1 F2 Pm Vn

Variáveis (Vn)

O

b

se

rv

aç

ões

(

Pm

)

Quantitativo

(14)

Ordenação: análise indireta de gradiente

Análise de Componentes Principais (ACP) (Pearson, 1901)

F1

F2

Pm

Vn Plots em substrato de granito

Plots em substrato de calcário

Sp. calcífilas Sp. acidófilas Fatores (Fn) V ar iá ve is (Vn ) Fatores (Fn) O b serv aç õ es (Pm )

Ma

tr

iz

es

de

corr

elaç

ão

(15)

Ordenação: análise indireta de gradiente

Análise de Componentes Principais (ACP) (Pearson, 1901)

(16)

Ordenação: análise indireta de gradiente

Análise de Componentes Principais (ACP) (Pearson, 1901)

Problemas!!

ACP: Vegetação:

Variáveis quantitativas continuas ≠ Abundância ou ocorrência

Modelo linear Resposta ambiente-vegetação unimodal

Perfeito para dados ambientais

P Abu n d an ci a

(17)

Ordenação: análise indireta de gradiente

Análise de Correspondências (AC) (Hirschfeld, 1935; Benzecri, 1973)

Mesmos princípios que a ACP Modelo de resposta unimodal

Variáveis quantitativas, semiquantitativas, binárias

Tenta maximizar a correspondência entre variaveis e observações nos novos planos ≠ maximizar a variância (ACP)

(18)

Ordenação: análise direta de gradiente

Os gradientes de distribuição das espécies são correlacionados aos gradientes ambientais?

Hipótese nula: não existe relação

Análise de Correspondência Canônica (ACC) (Hotelling, 1936; Ter Braak, 1986)

Mesmos princípios que a AC

Fatores (eixos) “forçados” a serem combinações de variáveis ambientais

=> as combinações de variáveis ambientais mais correlacionadas com a composição em espécies contribuem mais à formação de um fator (eixo).

F1 = a1 x Amb1 + b1 x Amb2 + c1 x Amb3

F2 = a2 x Amb1 + b2 x Amb2 + c2 x Amb3 etc... Sp1 Sp2 plots AC: Eixo 1? Sp1 Sp2 plots ACC: Eixo 1? Amb.1 Amb.2 Amb.3 Ex: Sp1 e Sp2 correlacionados

(19)

Ordenação: análise direta de gradiente

Análise de Correspondência Canônica (ACC) (Hotelling, 1936; Ter Braak, 1986)

(Palmer, 2013)

Asimina triloba, Quercus muehlenbergii, Fraxinus americana: pH alto

Quercus stellata, Quercus marilandica, Carya texana: solos ácidos

Cephalanthus occidentalis, Salix nigra: zonas úmidas

(20)

Classificação não hierárquica

Inconveniente: número pré-definido de classes influencia os resultados

Ex: Centros móveis

Variáveis (Vn) O b ser va çõ e s (Pm ) Dados quantitativos Observações (Pm) O b ser va çõ e s (Pm ) Matriz de distâncias

Escolha aleatória de n indivíduos como centros de n classes Agregação dos indivíduos nos centros de classes

Calculo dos novos centros de classes

(21)

Classificação hierárquica

Número de classes não interfere nos resultados, adaptável Dois tipos: agregação ou divisão

Classificação ascendente hierárquica (agregação)

Variáveis (Vn) O b ser va çõ e s (Pn ) Dados quantitativos Observações (Pn) O b ser va çõ e s (Pn ) Matriz de distâncias (euclidiana, Bray-Curtis, ...)

Agrupamento das 2 observações de menor distância Prosseguindo: nova matriz, atualizada, vários métodos (UPGMA, Ward, etc...)

(22)

Classificação hierárquica

Classificação ascendente hierárquica (agregação)

Biomassa espécies V1 e V2. Plots A a E.

Método UPGMA:

(23)

Classificação hierárquica

Classificação ascendente hierárquica (agregação)

(24)

Classificação hierárquica

Classificação ascendente hierárquica (agregação)

Representação das classes nos planos fatoriais da AC Estatísticas dos grupos para variáveis ambientais

Fator 2

Fator 1

Plots em função da similaridade florística Espécies em função da coocorrência

Biomassa espécies V1 e V2. Plots A a E.

Possibilidade de classificar a partir de fatores de análise multivariável (ex.: AC)

(25)

Classificação hierárquica

Classificação hierárquica por divisão (TWINSPAN)

Primeiro eixo de uma CA: divisão no centróide Repetição para cada grupo formado

(26)

Sp. p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 p13 p14 p15 p16 p17 p18 p19 p20 p21 p22 p23 p24 p25 p26 p27 p28 p29 Angelica sylvestris 2 1 1 Athyrium filix-femina 5 6 35 3 15 35 25 55 25 1 2 7 6 75 5 2 9 85 85 45 75 65 7 7 25 3 Callitriche platycarpa 1 1 Callitriche stagnalis 2 1 1 2 1 Cardamine pratensis 5 1 1 2 5 1 2 Carex pendula 5 1 1 5 1 15 15 5 5 Carex remota 1 2 15 5 5 5 5 5 1 25 5 5 Chrysosplenium oppositifolium 2 1 1 Cirsium palustre 5 2 1 5 Deschampsia cespitosa 5 5 3 25 5 2 25 35 15 1 2 65 4 9 3 25 10 40 35 15 25 Filipendula ulmaria 1 1 Galium palustre 1 1 Glyceria fluitans 2 1 5 2 2 Juncus effusus 15 1 15 10 Lotus uliginosus 5 1 1 1 Lysimachia nemorum 2 1 1 1 1 1 Mentha arvensis 1 1 Myosotis scorpioides 2 1 Persicaria hydropiper 1 1 Ranunculus repens 1 1 2 5 Rumex sanguineus 2 1 2 2 Scrophularia auriculata 1 1 Solanum dulcamara 1 1 Sphagnum palustre 1 1 Stachys sylvatica 2 1 1 1 Stellaria alsine 1 1

Espécies

plots

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

(27)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# DADOS QUANTITATIVOS: ABUNDANCIA DE ESPECIES

# FILTROS: conservar especies presentes em mais de um plot e plots com riqueza S>1

# carregar o arquivo txt de dados (veg_quant.txt, separador tabulacao)

arquivo <- "C:/.../veg_quant.txt"

x <- read.table(arquivo, header = TRUE, sep = "\t") x

(28)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# deletar a coluna sp. x2 <- x[,2:30] x2 # transpor sp e plots tx2 <- t(x2) tx2 # analise acp

# carregar pacote para acp (ade4)

library(ade4)

# acp

acp <- princomp(as.matrix(tx2),cor=TRUE) print(acp)

(29)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# Valores proprios (eigenvalues) = variancia explicada por cada eixo

plot(acp,main="Valores proprios")

# escores das observacoes (plots)

(30)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# Representacao das observacoes e variaveis no primeiro plano

biplot(acp, choices = 1:2,

main="Gradientes de composição da vegetação\nEixos 1x2")

(31)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# Representacao das observacoes e variaveis no segundo plano (eixos 1 e 3)

biplot(acp, choices = 1:3,

main="Gradientes de composição da vegetação\nEixos 1x3")

(32)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# Representacao alternativa das observacoes, variaveis e v. proprios

acp2 = dudi.pca(as.matrix(tx2),scannf=F,nf=2)

scatter(acp2,posieig="topright", sub = "Análise de Componentes Principais")

# Representacao das variaveis

s.label(acp2$co,boxes=F)

# Representacao das observacoes

(33)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# Representacao alternativa das observacoes, variaveis e v. proprias

acp2 = dudi.pca(as.matrix(tx2),scannf=F,nf=2)

scatter(acp2,posieig="topright", sub = "Análise de Componentes Principais")

# Representacao das variaveis

s.label(acp2$co,boxes=F)

# Representacao das observacoes

s.label(acp2$li,boxes=F)

# Correlacoes entre variaveis e eixos

cor(acp2$tab[,'V26'],acp2$li[,1]) cor(acp2$tab[,'V24'],acp2$li[,2]) cor(acp2$tab[,'V24'],acp2$li[,1]) [1] 0.9514178 [1] 0.9044894 [1] -0.02015634

(34)

Sp. p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 p13 p14 p15 p16 p17 p18 p19 p20 p21 p22 p23 p24 p25 p26 p27 p28 p29 Angelica sylvestris 2 1 1 Athyrium filix-femina 5 6 35 3 15 35 25 55 25 1 2 7 6 75 5 2 9 85 85 45 75 65 7 7 25 3 Callitriche platycarpa 1 1 Callitriche stagnalis 2 1 1 2 1 Cardamine pratensis 5 1 1 2 5 1 2 Carex pendula 5 1 1 5 1 15 15 5 5 Carex remota 1 2 15 5 5 5 5 5 1 25 5 5 Chrysosplenium oppositifolium 2 1 1 Cirsium palustre 5 2 1 5 Deschampsia cespitosa 5 5 3 25 5 2 25 35 15 1 2 65 4 9 3 25 10 40 35 15 25 Filipendula ulmaria 1 1 Galium palustre 1 1 Glyceria fluitans 2 1 5 2 2 Juncus effusus 15 1 15 10 Lotus uliginosus 5 1 1 1 Lysimachia nemorum 2 1 1 1 1 1 Mentha arvensis 1 1 Myosotis scorpioides 2 1 Persicaria hydropiper 1 1 Ranunculus repens 1 1 2 5 Rumex sanguineus 2 1 2 2 Scrophularia auriculata 1 1 Solanum dulcamara 1 1 Sphagnum palustre 1 1 Stachys sylvatica 2 1 1 1 Stellaria alsine 1 1

Espécies

plots

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

(35)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# eliminacao dos plots singulares: p1, p7, p11 e p12

# p1 e p7: riqueza S alta, e p11 e p12 especies raras e exclusivas

x3 <- x2[,-1] x4 <- x3[,-6] x5 <- x4[,-9] x6 <- x5[,-9] x6

# eliminacao das especies ausentas (Galium palustre, Mentha arvensis,

Myosotis scorpioides, Persicaria hydropiper, Solanum dulcamara, Sphagnum palustre) x3 <- x6[-12,] x4 <- x3[-16,] x5 <- x4[-16,] x6 <- x5[-16,] x7 <- x6[-19,] x8 <- x7[-19,] x9 <- x8[-20,] x9

(36)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: ACP

# transpor sp e plots dos dados selecionados

tx9 <- t(x9) tx9

# Representacao alternativa das

observacoes, variaveis e v. proprios

acp9 = dudi.pca(as.matrix(tx9),scannf=F, nf=2)

scatter(acp9,posieig="topleft", sub = "Análise de Componentes Principais")

(37)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: CAH

# carregar o arquivo txt de dados # deletar a coluna sp.

# transpor sp e plots -> tx2

# centrar e reduzir = padronizacao (so para dados nao binarios)

tx2r <- scale(tx2, center = TRUE, scale = TRUE) tx2r

# calculo das distancias (metodo "Euclidian" escolhido)

distx <- dist(tx2, method ="euclidean", diag=FALSE, upper=FALSE)

# classificacao hierarquica ascendente (metodos Ward e average UPGMA)

chaward <- hclust(distx,"ward")

(38)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: CAH

# representacao classificacao hierarquica ascendente (metodos Ward e average UPGMA testados)

plot(chaward,hang=-1) plot(chaupgma,hang=-1)

(39)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: CAH

# representacao classificação hierarquica ascendente (metodos Ward e average UPGMA testados)

plot(chaward,hang=-1) plot(chaupgma,hang=-1)

# recuperacao dos grupos (selecionar o numero de classes)

ward5 <- cutree(chaward,5) upgma5 <- cutree(chaupgma,5) ward9 <- cutree(chaward,9) upgma9 <- cutree(chaupgma,9)

# representacao dos grupos no primeiro plano da acp

biplot(acp,xlabs=ward5,choices = c(1,2),main="Gradientes de composição da vegetação") abline(v=0,h=0) biplot(acp,xlabs=ward9,choices = c(1,2),main="Gradientes de composição da vegetação") abline(v=0,h=0)

(40)

Exemplo: dados de ocorrência de briófitas (Palmer, 2013)

Usando R: CAH

# representacao dos grupos no primeiro plano da acp

(41)