Tutorial da vers

(1)

Tutorial da vers˜ ao beta do pacote sads

Paulo Inácio Prado e Murilo Dantas Miranda Laboratório de Ecologia Teórica

Depto de Ecologia, IB, USP http://ecologia.ib.usp.br/let/

prado@ib.usp.br 21 de janeiro de 2013

1 Introdu¸ c˜ ao

A dominância numérica de poucas espécies nas comunidades biológicas é uma das poucas leis gerais da ecologia (McGill et al., 2007). A maioria das espécies nas comunidades são representadas por poucos indiv´ıduos, e poucas são as espécies abundantes, resultando em um histograma de distribui¸cão de abundâncias tipicamente côncavo, conhecido na literatura como“hollow curve”. Há pouqu´ıssimas exce¸cões a este padrão, o que o torna um descritor básico da estrutura das comunidades. Embora o padrão seja único, muitas distribui¸cões teóricas de probabilidade foram propostas para descrevê-lo. Portanto, o uso de sads para descrever e comparar comunidades demanda ferramentas estat´ısticas para ajustar os vários modelos dispon´ıveis e identificar o que melhor descreve os dados.

Uma das ferramentas mais promissoras baseiam-se no princ´ıpio de verossimilhan¸ca estat´ıs- tica (Edwards, 1972; Royall, 2000) para criar protocolos de ajuste e compara¸cão simultânea de várias hipóteses estat´ısticas concorrentes. Um dos mais simples é a sele¸cão de modelos baseada em ´ındices de informa¸cão (Burnham & Anderson, 2002), que ordena um conjunto de modelos de acordo com sua plausibilidade frente aos dados, levando em conta sua par- cimônia. Na escala proposta recentemente por McGill (2003), essa seria a categoria mais rigorosa de testes de ajustes dos dados a modelos teóricos. O uso crescente destes conceitos

é considerada uma mudan¸ca no paradigma de análise de dados, em resposta às limita¸cões que as abordagens tradicionais impõem a muitas áreas da biologia (Johnson & Omland, 2004).

O pacote sads do ambiente estat´ıstico R(R Development Core Team, 2012) tem fun¸cões para ajustar modelos de distribui¸cão de abundância de espécies pelo método da máxima verossimilhan¸ca, e diagnosticar a qualidade do ajuste. Também permite a compara¸cão de diferentes modelos ajustados ao mesmo conjunto de dados com gráficos e métodos de sele¸cão

(2)

de modelos (Burnham & Anderson, 2002). Este documento ´e um tutorial para uso deste pacote, que apresenta os conceitos estat´ısticos b´asicos envolvidos.

2 Instala¸ c˜ ao

O pacote ainda está em testes, por isso não está dispon´ıvel no repositório CRAN do R. No momento temos uma versão beta compilada para Linux. Para instalar a versão de teste do pacotesads, você precisa adicionar os seguintes pacotes à sua instala¸cão de R:

• bbmle(Bolker & Team, 2012)

• poilog (Grøtan & Engen, 2008)

• VGAM(Yee, 2012)

• untb(Hankin, 2007)

Após adicionar os pacotes acima à sua instala¸cão deR, vá ao s´ıtio do Laboratório de Ecologia Teórica do IBUSP, se¸cãoR codes (http://ecologia.ib.usp.br/let/doku.php?id=engl:

tutorials:rcode). Baixe o arquivosads_0.1.01.tar.gzpara um diret´orio. Execute oR, carregue e chame o pacote com

> install.packages("diretorio/sads_0.1.01.tar.gz", repos=NULL)

> library(sads)

ondediretorioé o caminho para o diretório onde você copiou o arquivo.

3 An´ alise explorat´ oria

O objeto de dados básico para as análises desads é um vetor com valores das abundâncias de cada uma das espécies, registradas em uma amostra ou comunidade. Neste tutorial usaremos a abundância de espécies de mariposas capturadas em armadilhas luminosas na Inglaterra (Fisher et al., 1943) e biomassa de animais bentônicos em substratos artificiais (Arntz & Rumohr, 1982). Objetos com esses dois vetores de abundâncias estão dispon´ıveis no pacote sads. Veja as páginas de ajuda para mais informa¸cões. Carregue os objetos na

´

area de trabalho com os comandos:

> data(moths)# William's moth data

> data(ARN82.eB.apr77)# Arntz et al. benthos data

(3)

3.1 Qual o melhor gr´afico?

As sads são a maneira como o total de indiv´ıduos (ou biomassa) na amostra se distribuem pelas espécies. Trata-se, portanto, de uma distribui¸cão de frequência, e a primeira escolha para visualizá-la é um histograma, cujo resultado está na Figura 1:

> par(mfrow=c(2,1))

> hist(moths, xlab="Abundancia (n de indiv´ıduos)", ylab="N de especies",main="Mariposas")

> hist(ARN82.eB.apr77, xlab="Abundancia (biomassa, g)", ylab="N de especies", main="Animais bent^onicos")

> par(mfrow=c(1,1))

Os gráficos que você obteve mostram um problema comum de se usar histogramas com escala aritmética para representar SADs. Como na maioria das amostras tomadas de comunidades, há muitas espécies raras e pouqu´ıssimas abundantes. O resultado é um histograma fortemente côncavo, e fica dif´ıcil comparar a frequência de espécies abundantes. As duas alternativas mais usadas são o gráfico de oitavas (Preston, 1948) e de rank-abundância ¹ (MacArthur, 1957).

3.2 Tabela e gr´afico de oitavas

Nos histogramas de SADs com escala aritmética as primeiras classes (abundâncias baixas) concentram a maioria das espécies. Uma solu¸cão é aumentar o intervalo de classe para as espécies abundantes. Preston (1948) propôs escalas em potência de base de dois, que ele chamou de oitavas. O limite das classes são dados por essas potências:

Primeira oitava: 2⁰ = 1 indiv´ıduo Segunda oitava: 2¹ = 2 indiv´ıduos

Terceira oitava: mais que 2¹= 2 até 2²= 4 indiv´ıduos n-ésima oitava: mais que 2ⁿ⁻² até 2ⁿ⁻¹ indiv´ıduos

Assim, a amplitude das classes aumenta com a abundância, o que compensa o fato de que espécies mais abundantes são poucas. Por exemplo, a primeira oitava é o número de espécies com apenas um indiv´ıduo², mas a décima oitava inclui as espécies com abundâncias entre 257 e 512 indiv´ıduos, um intervalo bem mais amplo. Como qualquer escala logar´ıtmica, as oitavas de Preston ’aproximam’ valores altos. Use a fun¸cão octav para gerar uma tabela com o número de espécies por oitava em cada amostra:

1tamb´em conhecido por diagrama de Whittaker ou diagrama de abundˆancia

2singletons

(4)

Mariposas

Abundancia (n de indivíduos)

N de especies

0 500 1000 1500 2000

0100200

Animais bentônicos

Abundancia (biomassa, g)

N de especies

0 10 20 30 40 50 60 70

01030

Figura 1: Número de espécies por classes de abundância em número de indiv´ıduos (acima) e em biomasa (abaixo).

> (moths.oc <- octav(moths)) Object of class "octav"

octave upper Freq

1 1 1 35

2 2 2 11

3 3 4 29

4 4 8 32

5 5 16 26

(5)

6 6 32 32

7 7 64 31

8 8 128 13

9 9 256 19

10 10 512 5

11 11 1024 6

12 12 2048 0

13 13 4096 1

> (arn.oc <- octav(ARN82.eB.apr77)) Object of class "octav"

octave upper Freq

1 -5 0.015625 3

2 -4 0.031250 5

3 -3 0.062500 4

4 -2 0.125000 6

5 -1 0.250000 3

6 0 0.500000 5

7 1 1.000000 2

8 2 2.000000 4

9 3 4.000000 3

10 4 8.000000 1

11 5 16.000000 2

12 6 32.000000 0

13 7 64.000000 1

14 8 128.000000 1

Para os dados de biomassa temos oitavas negativas, pois para representar valores de biomassa menores que um precisamos de expoentes negativos:

Primeira oitava negativa: 2⁻¹= 0.5 a 2⁰= 1 unidades de biomassa Segunda oitava negativa: 2⁻² = 0.25 a 2⁻¹= 0.5 unidades de biomassa n-´esima oitava negativa: mais que 2²⁻ⁿ at´e 2¹⁻ⁿ unidades de biomassa

Para criar um gráfico de oitavas, basta aplicar a fun¸cão plotao objeto que você criou com a fun¸cão octav ³. Também é poss´ıvel alterar qualquer parâmetro gráfico do histograma.

Os comandos abaixo exemplificam, e o resultado est´a na figura 2

3Nota técnica: o comandooctavcria um objeto da classeoctav, para qual há um método espec´ıfico para a fun¸cãoplot. Para entender melhor a mágica, é preciso ler sobre classes e métodos emR. Mas não é necessário para que ela funcione.

(6)

> par(mfrow=c(2,1))

> plot(moths.oc)

> ##Changing graphical parameters

> plot(moths.oc, col="white", ylab="N de esp´ecies", xlab="Oitavas de abund^ancia")

> par(mfrow=c(1,1))

O gráfico de oitavas para dados de biomassa terá alguns intervalos de classe menores do que um, que correspondem às oitavas negativas (fig 3):

> plot(arn.oc)

Cuidado: não se esque¸ca que os intervalos de classe nos histogramas de oitavas não estão mais numa escala aritmética e sim logar´ıtmica. Assim, quanto maior a classe, maior o intervalo de abundância que ela contém. Uma maneira mais honesta de representar esse histograma seria (fig 4):

> hist(moths[moths<=128],breaks=c(0,2^(0:7)), xlab="Abundance class",

ylab="Number os species", main="")

Nesse histograma as larguras das barras variam, indicando corretamente que os intervalos de classe são diferentes. No gráfico de oitavas todas as barras são ajustadas para a mesma largura. Em uma analogia geométrica, as barras longas e finas são alargadas e diminuem de altura. As largas e baixas são estreitadas, e se elevam. Com isso as classes de menor abundância não dominam a escala das ordenadas (y), permitindo avaliar diferen¸cas nas classes de maior abundância. O pre¸co que se paga é uma distor¸cão da escala aritmética, que não pode ser ignorada.

3.3 Tabelas e gr´afico de rank-abundˆancia

Para esse gráfico, primeiro criamos uma tabela com as espécies ordenadas da maior para a menor abundância, com a fun¸cão rad:

> head(moths.rad <- rad(moths)) rank abund

1 1 2349

2 2 823

3 3 743

(7)

Abundance class

N of species 01025

1 4 16 64 256 1024 4096

Oitavas de abundância

N de espécies 01025

1 4 16 64 256 1024 4096

Figura 2: Número de espécies por oitavas de abundância em uma amostra de mariposas capturadas com armadilhas luminosas (Fisher et al., 1943). As oitavas são classes de abun- dância em escala logar´ıtmica de base 2. Assim, a primeira oitava inclui espécies com um indiv´ıduo, a segunda com dois, a terceira com 3 a 4, e assim sucessivamente. Acima: padrão do método plot para um objeto da classe octav; abaixo: gráfico com alguns parâmetros modificados pelo usuário.

4 4 604

5 5 589

6 6 572

> head(arn.rad <- rad(ARN82.eB.apr77))

(8)

Abundance class N of species 0123456

0.015625 0.25 1 4 16 64

Figura 3: Número de espécies por oitavas de biomassa em uma amostra de animais marinhos bentônicos (Arntz & Rumohr, 1982).

rank abund sp17 1 67.21 sp11 2 54.67 sp33 3 14.67 sp9 4 9.90 sp30 5 5.71 sp10 6 2.88

Em seguida, plotamos a abundância de cada espécie em escala logar´ıtmica em fun¸cão do rank da espécie. O gráfico será sempre uma linha descendente, mas a sua inclina¸cão nos informa sobre a dominância. O comprimento da linha revela o número de espécies. Para obter os gráficos (fig. 5), aplique o comandoplot às tabelas obtidas com o comandorad:

(9)

Abundance class

Number os species

0 20 40 60 80 100 120

0.000.050.100.15

Figura 4: Histograma honesto com classes em potência de 2: a largura das barras é pro- porcional ao intervalo de cada classe. Os dados são números de mariposas capturadas em armadilhas luminosas (Fisher et al., 1943). O histograma mostra abundâncias até 2⁷ = 128 indiv´ıduos, para fins ilustrativos.

> par(mfrow=c(2,1))

> plot(moths.rad, ylab="Number of individuals")

> plot(arn.rad, ylab="Biomass")

> par(mfrow=c(1,1))

4 Ajuste de modelos

V´arios modelos matem´aticos foram criados para descrever as sads. Um dos mais simples

é a série logar´ıtmica de Fisher et al. (1943), em que o número esperado de espécies com n

(10)

●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

Species Rank Number of individuals 110500

20 40 60 80 120 160 200 240

● ●

● ●●

● ● ● ●● ● ● ●

● ● ● ●● ●

● ● ● ●● ● ● ● ● ●● ● ● ● ●● ● ●

● ● ●

Species Rank

Biomass 0.010.5050.00

5 10 15 20 25 30 35 40

Figura 5: Diagramas de rank-abundância das amostras de mariposas capturadas com armadilhas luminosas (Fisher et al., 1943) (acima), e organismos bentônicos em substratos artificiais (Arntz & Rumohr, 1982) (abaixo). Cada ponto representa uma espécie. Nas ordenadas está oranking de abundância das espécies (a mais abundante temranking um), e nas abcissas está a abundância, em escala logar´ıtmica.

indiv´ıduos ´e

(11)

S(n) = αXⁿ

n (1)

Sendoαo único parâmetro desse modelo, conhecido comoalfa de Fisher. A constanteX é uma fun¸cão deα e do total de indiv´ıduos na comunidade, N, e é sempre menor do que 1, mas tende a esse valor à medida que tamanho da amostra aumenta:

X = N

N+α (2)

Para ajustar a série logar´ıtmica a um conjunto de dados temos que descobrir o valor do parâ- metroα que resulta na melhor previsão do número de espécies em cada abundância. Fisher descobriu um método numérico para fazer isto (Fisher et al., 1943) , que está implementado no pacotesads, que tem também fun¸cões para avalia¸cão da qualidade do ajuste.

4.1 Ajuste: objeto fitsad

Os dados de mariposas que usamos foram os originalmente utilizados por Fisher para desen- volver sua s´erie logar´ıtmica (Fisher et al., 1943). Para fazer o ajuste use a fun¸c˜ao fitsad:

> (moths.ls <- fitsad(moths,"ls")) Call:

mle2(minuslogl = LL, start = list(alpha = alfa), method = "Brent", data = list(x = x), lower = 0, upper = upper)

Coefficients:

alpha 40.24728

Log-likelihood: -1087.71

A fun¸cãofitsadusa a fun¸cãomle2do pacotebbmle(Bolker & Team, 2012), que implementa um método genérico de ajuste de modelos estat´ısticos por máxima verossimilhan¸ca (Bolker, 2008). O ajuste de modelos desads é um caso particular desses procedimentos, e a fun¸cão fitsadpode ser vista como uma aplica¸cão particular, que ”aproveita”⁴ os procedimentos da aplica¸cão mais genérica. Por isso, o objeto resultante do ajuste guarda todas as informa¸cões sobre o modelo, que podem ser acessadas com fun¸cões e métodos já definidos. Abaixo os comandos para obter um resumo do modelo, seu coeficiente, e sua log-verossimilhan¸ca e valor de AIC:

4Outra nota t´ecnica: a fun¸c˜aofitsad gera um objeto da classefitsad, que herda toda a estrutura do objetomle2.

(12)

> summary(moths.ls)

Maximum likelihood estimation Call:

mle2(minuslogl = LL, start = list(alpha = alfa), method = "Brent", data = list(x = x), lower = 0, upper = upper)

Coefficients:

Estimate Std. Error z value Pr(z) alpha 40.247 6.961 5.7818 7.391e-09 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 -2 log L: 2175.425

> coef(moths.ls) alpha

40.24728

> logLik(moths.ls)

'log Lik.' -1087.713 (df=1)

> AIC(moths.ls)

[1] 2177.425

4.2 Avalia¸c˜ao do ajuste

Outro comando importante herdado ´e o de c´alculo do perfil de verossimilhan¸ca do modelo.

A verossimilhan¸ca expressa o quão plaus´ıvel é um modelo estat´ıstico como descri¸cão dos dados. Ela varia com o valor do(s) parâmetro(s) do modelo, e uma maneira de buscar o melhor ajuste é encontrar os valores de parâmetros que resultam na maior verossimilhan¸ca poss´ıvel. Chamamos esse procedimento de ajuste de máxima verossimilhan¸ca e os valores resultantes dos parâmetros suasestimativas de máxima verossimilhan¸ca (mle). Um diagnóstico importante do modelo é investigar como sua verossimilhan¸ca (portanto sua qualidade como descri¸cão dos dados) varia quando fazemos os parâmetros variar um pouco em torno dosmles. A tabela desses valores e a verossimilhan¸ca resultante é chamadaperfil de verossimilhan¸ca.

(13)

A fun¸cão profile gera o perfil ⁵, que é usado para calcular o intervalo de confian¸ca dos parâmetros. Fa¸ca isso para nosso ajuste da série logar´ıtmica:

> moths.ls.prf <- profile(moths.ls)

> confint(moths.ls.prf) # conf intervals 2.5 % 97.5 %

28.01537 55.36267

Vocˆe pode plotar os perfis em duas escalas, o que permite avaliar seus intervalos de verossimilhan¸ca e confian¸ca (fig. 6):

> par(mfrow=c(1,2))

> plotprofmle(moths.ls.prf)# log-likelihood profile

> plot(moths.ls.prf)# z-transformed profile

> par(mfrow=c(1,1))

Os perfis indicam a precisão dos parâmetros estimados. Para avaliar o ajuste do modelo aos dados, o pacotesads faz a fun¸cão plot produzir quatro gráficos de diagnóstico (fig.7), quando aplicados a um objeto de modelo desads:

> par(mfrow=c(2,2))

> plot(moths.ls)

> par(mfrow=c(1,1))

O dois primeiros gráficos são os diagramas de rank-abundância e de oitavas, com os valores previstos pelo modelo sobrepostos (linhas azuis). Os dois outros gráficos são duas maneiras mais efetivas, porém mais abstratas de avaliar o ajuste:

Gráfico de quantis: para cada espécie, plota o valor de abundância previsto pelo modelo (theoretical quantile)em fun¸cão do observado (empirical quantile).

Gráfico de percentis: para cada espécie, plota a probabilidade pelo modelo de que uma espécie tenha sua abundância ou maior (theoretical percentile, que é probabilidade acumulada teórica) em fun¸cão da propor¸cão observada de espécies que teve um valor igual ou superior de abundância (empirical percentile, que a probabilidade acumulada emp´ırica,ecdf)

Para esses dois gráficos, um ajuste perfeito do modelo resultaria em todos os valores observados iguais aos previstos. Neste caso, todos os pontos deveriam estar sobre uma linha de intercepto zero e inclina¸cão um. Esta linha é indicada em vermelho nos dois gráficos.

5como isso implica me ajustar muitos modelos (um para cada novo valor de parâmetros), esta fun¸cão pode demorar, e está muito sujeita a erros. Mas há maneiras de amenizar isso, veja Bolker (2008).

(14)

20 30 40 50 60

0123456

alpha

Negative relative log−likelihood

30 40 50 60

0.00.51.01.52.02.5

Likelihood profile: alpha

alpha

z

99%

95%

90%

80%

50%

Figura 6: Esquerda: Perfil de verossimilhan¸ca do alfa de Fisher ajustado aos dados de mariposas capturadas com armadilhas luminosas (Fisher et al., 1943). A linha vermelha delimita o intervalo de verossimilhan¸ca, que são valores dos parâmetro alfa que resultariam em modelos tão plaus´ıveis quanto o de máxima verossimilhan¸ca. Este intervalo dá expressa a precisão da estimativa do parâmetro. Direita: o mesmo perfil, com a verossimilhan¸ca transformada para uma variável normal padronizada (variável z). Aceitando-se que o parâ- metro tem distribui¸cão normal, nesta escala é poss´ıvel identificar os intervalos de confian¸ca, que estão indicados pelas linhas pontilhadas vermelho-claras.

(15)

1 4 16 64 1024

●

● ● ● ● ●

●

● ●

●

●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●

●

●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

Species Rank Species Abundance 1550500

20 60 120 180 240

●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ● ●

● ●

●

0 200 600 1000

05001500

Q−Q plot

Theoretical Quantile

Sample Quantiles

●●

●

●●

●

●●

●

●●

●● ●●●●●●●●●●● ●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

0.2 0.4 0.6 0.8 1.0

0.00.40.8

P−P plot

Theoretical Percentiles

Sample Percentiles

Figura 7: Gráficos para avalia¸cão do ajuste do modelo desad. Acima à esquerda: histograma em classes de abundância logar´ıtmicas de base 2 (oitavas);Acima à direita: gráfico de rank-abundância;Abaixo à esquerda: gráfico de quantil;Abaixo à direita: gráfico de percentis.Os pontos pretos são os valores observados e as linhas são os esperados pelo modelo. Veja texto para a interpreta¸cão dos gráficos.

.

(16)

5 Compara¸ c˜ ao de modelos

A fun¸cãofitsadajusta outros modelos além da série logar´ıtmica, que você pode indicar no segundo argumento da fun¸cão, chamado sad. Consulte a página de ajuda da fun¸cão para conhecer todas os modelos dispon´ıveis.

Para cada modelo, você pode ainda usar o argumento truncpara truncar a distribui¸cão de abundância em um valor m´ınimo. Como alguns modelos permitem o valor zero, é comum impedir esse valor com a truncagem, pois não há espécies com abundância zero. Os modelos com distribui¸cão discreta ⁶ que incluem o zero (Poisson-lognormal, binomial negativa, geométrica) estão truncadas por padrão no ajuste pela fun¸cão fitsad. As distribui¸cões cont´ınuas⁷ não estão truncadas por padrão.

Vamos ajustar aos dados das mariposas de Fisher tamb´em as distribui¸c˜oes lognormal truncada em 0,5 e Poisson-lognormal:

> (moths.pl <- fitsad(x=moths,sad="poilog"))#default is zero-truncated Call:

mle2(minuslogl = LL, start = as.list(pl.par), data = list(x = x)) Coefficients:

mu sig

1.996469 2.187126

> (moths.ln <- fitsad(x=moths,sad="lnorm", trunc=0.5)) # lognormal truncated at 0.5 Call:

mle2(minuslogl = LL, start = list(meanlog = meanlog, sdlog = sdlog), data = list(x = x))

Coefficients:

meanlog sdlog 2.274346 2.039740

Comparamos os modelos com o critério de informa¸cão de Akaike, que expressa a distância relativa de cada modelo a um modelo verdadeiro teórico. O modelo de menor o AIC é o

6que descrevem contagens, como n´umero de indiv´ıduos

7que podem descrever tamb´em vari´aveis cont´ınuas, como biomassa.

(17)

que está mais próximo dessa “verdade” teórica, ou seja, a descri¸cão mais plaus´ıvel para os dados,entre os modelos concorrentes. Modelos com uma diferen¸ca de AIC menor que 2 são considerados igualmente plaus´ıveis. Para facilitar a compara¸cão, atabela de sele¸cão de modelos mostra os AICs em ordem crescente, e também a diferen¸ca de cada um ao menor AIC, que é chamado ∆AIC. Os graus de liberdade (dfna tabela) correspondem ao número de parâmetros de cada modelo.

> AICtab(moths.ls, moths.pl, moths.ln, base=T) AIC df dAIC

moths.ln 2174.9 2 0.0 moths.pl 2176.1 2 1.2 moths.ls 2177.4 1 2.5

A sele¸cão de modelos indica que a distribui¸cão lognormal truncada em 0,5 é a descri¸cão mais plaus´ıvel desses dados, mas que as distribui¸cão Poisson-lognormal é um modelos igualmente bons. Podemos avaliar isso plotando as linhas dos previstos por esses modelos sobre os histogramas de oitavas. Para isso, primeiro calculamos o número espécies em cada oitava previstos pelos modelos com a fun¸cãooctavpred

> head(moths.ls.oc <- octavpred(moths.ls)) octave upper Freq

1 1 1 40.14377

2 2 2 20.02026

3 3 4 23.27123

4 4 8 25.12674

5 5 16 25.86285 6 6 32 25.67116

> head(moths.pl.oc <- octavpred(moths.pl)) octave upper Freq

1 1 1 27.58735

2 2 2 19.48216

3 3 4 26.76472

4 4 8 31.88374

5 5 16 33.16140 6 6 32 30.49061

> head(moths.ln.oc <- octavpred(moths.ln))

(18)

octave upper Freq

1 1 1 15.41886

2 2 2 22.44066

3 3 4 29.13034

4 4 8 33.72746

5 5 16 34.82976 6 6 32 32.08088

Em seguida usamos a fun¸c˜aoplotpara criar o histograma e a fun¸c˜ao linespara adicionar as linhas dos previstos (fig. 9):

> plot(moths.oc)

> lines(moths.ls.oc, col="blue")

> lines(moths.pl.oc, col="red")

> lines(moths.ln.oc, col="green")

> legend("topright",

c("Logseries", "Poisson-lognormal", "Truncated lognormal"), lty=1, col=c("blue","red", "green"))

Para comparar os modelos no diagrama de rank-abundˆancia primeiro criamos as tabelas com as abundˆancias previstas para cadarank:

> head(moths.ls.rad <- radpred(moths.ls)) rank abund

1 1 1180

2 2 854

3 3 710

4 4 619

5 5 554

6 6 503

> head(moths.pl.rad <- radpred(moths.pl)) rank abund

1 1 4348 2 2 1973 3 3 1322 4 4 1001

5 5 807

6 6 676

(19)

1 4 16 64 256 1024 4096

●

● ● ●

●

● ●

●

Logseries

Poisson−lognormal Truncated lognormal

Figura 8: Histogramas de oitavas de abundâncias de espécies de mariposas capturadas em armadilhas luminosas (Fisher et al., 1943), e número de espécies em cada oitava previsto por três modelos de distribui¸cão de abundância de espécies.

(20)

> head(moths.ln.rad <- radpred(moths.ln)) rank abund

1 1 3524.2394 2 2 1674.8603 3 3 1148.3539 4 4 883.6309 5 5 720.7864 6 6 609.2707

e em seguida criamos o gr´aficos e inclu´ımos das linhas dos valores previstos:

> plot(moths.rad)

> lines(moths.ls.rad, col="blue")

> lines(moths.pl.rad, col="red")

> lines(moths.ln.rad, col="green")

> legend("topright",

c("Logseries", "Poisson-lognormal", "Truncated lognormal"), lty=1, col=c("blue","red", "green"))

Embora os dados tenham sido usado por Fisher para exemplificar sua série logar´ıtmica, a Poisson-lognormal parece ser um modelo melhor ou equivalente, e a lognormal também é um modelo plaus´ıvel.

(21)

●

●●

●●●●

●

●●●●

●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●

●●●●●●●●●●●

●●●●●●●●●●

●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●

●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

Species Rank Species Abundance 151050500

20 40 60 80 120 160 200 240

Logseries

Poisson−lognormal Truncated lognormal

Figura 9: Gráfico derank-abundância de espécies de mariposas capturadas em armadilhas luminosas (Fisher et al., 1943), e as abundâncias prevista para cada espécie por três modelos de distribui¸cão de abundância de espécies.

(22)

Referˆ encias

Arntz, W. E. & H. Rumohr, 1982. An experimental study of macrobenthic colonization and succession, and the importance of seasonal variation in temperate latitudes. Journal of experimental marine biology and ecology 64:17–45.

Bolker, B., 2008. Ecological Models and Data in R. Princeton University Press, Princeton.

Bolker, B. & R. D. C. Team, 2012. bbmle: Tools for general maximum likelihood estimation.

R package version 1.0.5.1.

Burnham, K. P. & D. R. Anderson, 2002. Model Selection and Multimodel Inference - A Practical-Theoretic Approach. Springer-Verlag.

Edwards, A. W. F., 1972. Likelihood: An Account of the Statistical Concept of Likelihood and its Application to Scientific Inference. Cambridge University Press.

Fisher, R., A. Corbet, & C. Williams, 1943. The relation between the number of the species and the number of individuals in a random sample from animal population. Journal of Animal Ecology 12:42–58.

Grøtan, V. & S. Engen, 2008. poilog: Poisson lognormal and bivariate Poisson lognormal distribution. R package version 0.4.

Hankin, R. K. S., 2007. Introducing untb, an r package for simulating ecological drift under the unified neutral theory of biodiversity. Journal of Statistical Software 22.

Johnson, J. & K. Omland, 2004. Model selection in ecology and evolution.Trends in Ecology and Evolution 19:101–108.

MacArthur, R., 1957. On the relative abundance of bird species.Proceedings of the National Academy of Sciences of the United States of America 43:293.

McGill, B., 2003. Strong and weak tests of macroecological theory. Oikos 102:679–685.

McGill, B., R. Etienne, J. Gray, D. Alonso, M. Anderson, H. Benecha, M. Dornelas, B. En- quist, J. Green, F. He, A. Hurlbert, A. E. Magurran, P. Marquet, B. Maurer, A. Ostling, C. Soykan, K. Ugland, & E. White, 2007. Species abundance distributions: moving beyond single prediction theories to integration within an ecological framework. Ecology Letters 10:995–1015.

Preston, F. W., 1948. The commonness and rarity of species. Ecology 29:254–283.

R Development Core Team, 2012. R: A Language and Environment for Statistical Compu- ting. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.

(23)

Royall, R., 2000. Statistical Evidence: A Likelihood Paradigm. Chapman & Hall, London.

Yee, T. W., 2012. VGAM: Vector Generalized Linear and Additive Models. R package version 0.8-7.