Universidade Federal de Goiás
Programa de Pós-Graduação em Ecologia e Evolução
Elaboração e Delineamento de Projetos
www.ecoevol.ufg.br/adrimelo/planejamento
Aula 3
Prof. Adriano S. Melo – asm.adrimelo no gmail.com
“A investigação científica não termina com seus dados; ela se inicia com eles. O produto final da ciência é uma teoria ou hipótese de trabalho e não os chamados fatos” G.H. Mead (via R. Alves)
“We emphasize that the proper design of a scientific study is far more important than the specific techniques used in the analysis. As we shall see, a well-designed study is usually simple to analyze. On the other
hand, a poorly designed study or a botched experiment often cannot be salvaged, even with the most sophisticated analysis.”
Kutner et al. (2004)
“However, you cannot draw blood from a stone, and even the most sophisticated statistical analysis cannot rescue a poor design”
Gotelli & Ellison (Cap. 7)
[ “The wide subject of experimental design was opened up, aimed at … avoiding waste of effort in the accumulation of ill-planned, indecisive, or irrelevant observations.” Fisher (1955)
“The task now is to prevent it from being closed!” Underwood (1997)]
Desenhos Experimentais
Variáveis
categóricas
versus
contínuas
Variáveis
dependentes
versus
independentes
resposta explanatória
preditora
Todas análises univariadas são definidas pelas
combinações dos dois tipos de variáveis acima!
Regressão
Regressão e correlação: qual a diferença?
Alguns exemplos de regressão
no
f
ru
to
s
Quantidade de formigasno
f
ru
to
s
Quantidade de formigasEstudo observacional
Estudo experimental
Y ~ X
Regressão
Algo a evitar durante o planejamento
Quantidade de formigas
Se alguém te disser que esta regressão é significativa,
3012 40 50 60 70 80 90 100 0 14 0 16 0 18 0 20 0 22 0 24 0 26 0 15.516.0 16.5 17.017.5 18.0 18.519.0 19.5 População < 16 anos R e n d a V e n d a s 3012 40 50 60 70 80 90 100 0 14 0 16 0 18 0 20 0 22 0 24 0 26 0 15.516.0 16.5 17.017.5 18.0 18.519.0 19.5 População < 16 anos R e n d a V e n d a s
Regressão Múltipla
Gotelli & Ellison: 10 réplicas ou observações para cada preditor
Multicolinearidade
Exemplo: Y = X1 + X2 + X1:X2Y = Vendas
X1 = População < 16 anos X2 = Renda
População < 16 anos População < 16 anos
Rend a Rend
Análise de Variância
Fator: a variável explanatória ou preditora ou independente. Em
experimentação é comum ser categórica. O termo “fator” em geral é empregado para designar uma variável categórica, embora existam exceções.
Níveis de um fator: os estados que o fator pode assumir. No caso do exemplo dos seminários didáticos, tínhamos 2 níveis: professores que assistiram e os que não assistiram ao seminário.
Controles: Muitas vezes necessários, depende do estudo. Serve
para assegurar que o procedimento experimental não interferiu com resultados (e.g. placebo) e também como base comparativa (e.g.
Teste t e Análise de Variância (Anova)
S/ peixes C/ peixes
Tratamentos Controle S/peixes C/peixes Tratamentos
Fator Resp C 0,8 C 0,6 C 0,9 S 1,1 S 0,85 S 0,9 P 1,4 P 1,2 P 1,1 Fator Resp S 0,8 S 0,6 S 0,9 S 0,8 P 0,95 P 1,2 P 1,4 P 1,3
Y ~ X
Y ~ X
Co Ce2 Ce4 Ce2 Ce4 Co Ce4 Ce2 Co Ce2 Co Ce4 Co Ce4 Ce2 Bloco 1 Bloco 2 Bloco 3 Bloco 4 Bloco 5 Unidades experimentais 1 2 3 Flu xo Experimento Prochilodus. 3 níveis do fator de estudo Co = controle;
Ce2 = Controle de procedimento Ce4 = gaiola de exclusão 4 lados
O trabalho é feito por corredeiras, cada corredeira sendo 1 bloco.
Note que em cada corredeira existe uma réplica do tratamento.
Poderíamos ter mais de uma réplica por corredeira. Note também que a posição do tratamento dentro da corredeira é aleatória. Este desenho experimental em blocos seria útil no caso de haver indícios de que a
fauna entre corredeiras seja
distinta, ou seja que as corredeiras sejam muito diferentes umas das outras.
Refinando nosso estudo: Teste t pareado
Anova em bloco
Co Ce2 Ce4 Tratamentos
Análises em bloco sempre são interessantes?
Vantagem: controla variação indesejadaDesvantagem: perde-se graus de liberdade (~replicação)
Quando vale a pena?
Análise de Covariância
Mesma idéia do bloco, mas remove-se variação
usando preditor contínuo (a covariável)
Trat Veloc Deco C 1,3 0,5 C 2,5 0,8 C 3,4 0,9 C 4,8 1,3 C 5,1 1,4 C 6,0 1,6 E 2,1 0,2 E 3,2 0,4 E 3,6 0,5 E 4,1 0,7 E 5,8 0,8 E 6,1 0,9 Velocidade Exclusão Controle
Y ~ X1 + X2
Quando temos mais de uma variável preditora
Interação
Terra firme Terra alagável Regime de Inundação Arenoso Argiloso Tip o d e S olo
Inun Solo Resp F Argi 9 F Argi 10 F Argi 11 F Are 5 F Are 6 F Are 7 A Argi 13 A Argi 14 A Argi 15 A Are 5 A Are 6 A Are 7
Y ~ X1 + X2 + X1:X2
Quando temos mais de uma variável preditora
Análises não fatoriais
Correlação entre variáveis
preditoras é diferente de ‘0’
Problemas com
multicolinearidade ....
Análises fatoriais
Correlação entre
variáveis preditoras é ‘0’
0 1 2
X
10 1 2
X
1Vantagens da Anova fatorial em relação a várias Anovas simples
Interação
Fator fixo
Desempenho profs assistiram e não assistiram seminários diferem? Densidade palmeira difere entre tipos de alagamento?
Decomposição difere entre locais com e sem acesso de peixes?
Fator Aleatório
Existe variabilidade de desempenho de alunos entre escolas? Densidade de palmeira difere de um lugar para outro?
Taxas de decomposição são homogêneas no espaço?
Anova aninhada ou hierárquica (
nested
)
A qual escala está associada maior variabilidade?
região cidade sítio árvore
Anova aninhada ou hierárquica (
nested
)
A qual escala está associada maior variabilidade?
lagoa (km) praia (100 m) ponto (m)
Anova aninhada ou hierárquica (
nested
)
A qual escala está associada maior variabilidade?
Bacia (km) Riacho (100m) Corred. (m) Surber(cm)
Desenhos para estudos cuja resposta é binária
Qui-quadrado
Altu Ninho A 1 A 1 A 1 A 0 A 1 A 0 B 0 B 0 B 1 B 0 B 0 B 0 Presença Ninho (resposta)Sim Não Totais
Altas 4 2 6
Baixas 1 5 6
Totais 5 7 12
Desenhos para estudos cuja resposta é binária
Log-Linear
Altu Horiz Resp
A H 1 A H 1 A H 1 A V 0 A V 1 A V 0 B H 0 B H 0 B H 1 B V 0 B V 0 B V 0