Planejamento de Experimentos
Primeiro Semestre/2019
Delineamentos Inteiramente Casualizados
• O exemplo utilizado anteriormente da argamassa de cimento, pode ser considerado um experimento comparativo simples, ou um experimento de um único fator com dois níveis:
• Fator: formulação da argamassa;
• Nível: formulação original; formulação modificada.
• Muitos experimentos envolvem apenas um fator, porém, podem envolver mais do que apenas dois níveis;
• Iremos estudar, agora, experimentos completamente
aleatorizados, considerando um único fator com 𝑎 níveis (ou 𝑎 tratamentos).
Exemplo
• Um pesquisador pretende comparar 4 cultivares de pêssego quanto ao enraizamento de estacas.
• A área experimental disponibilizada para o experimento é um viveiro em condições controladas com capacidade para 20 parcelas.
• O pesquisador pode conseguir um máximo de 100 estacas por cultivar.
• Na literatura o número de estacas por parcela varia de 8 a 15.
Experimento Inteiramente Casualizado
• Sem a necessidade de controle local;
• Exemplo (Barbin, 2003):
• Objetivo: Comparar 4 cultivares de pêssego quanto ao enraizamento de estacas;
• Var. Resp.: número de estacas enraizadas por parcela;
• Fator em potencial / Trat: 4 cultivares de pêssego.
• Fator de perturbação: Não tem, pois a área experimental é um viveiro em condições controladas.
• Parcela: 20 estacas.
• Área Exp.: Viveiro em condições controladas com capacidade para 20 parcelas.
• Cada tratamento foi repetido 5 vezes;
• Os tratamentos foram designados às parcelas por meio de sorteio.
Experimento Inteiramente Casualizado
Croqui da Área Experimental
P1 P5 P9 P13 P17
P2 P6 P10 P14 P18
P3 P7 P11 P15 P19
P4 P8 P12 P16 P20
V2 V1
V3 V4
Urna com 5 rep. de cada cartão
V2
V4 V1
V1 V3
V3 V4
V2 V3
V4 V1
V2 V3
V4 V1 V2
V1 V3 V4
V2
Em cada parcela serão plantadas 20 estacas provenientes da variedade a ela designada. Passado o tempo necessário será observado o número de estacas enraizadas por parcela.
Experimento Inteiramente Casualizado
Resultados:
Tratamentos Repetições
Total
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 2 2 1 1 0 6
Var 2 (B) 1 0 0 1 1 3
Var 3 (C) 12 10 14 17 11 64
Var 4 (D) 7 9 15 8 10 49
122
Análise dos Dados
• Análise da Variância:
• Nem sempre pode ser utilizada;
• Só é indicada se o modelo matemático respeitar certas exigências.
• Modelo Matemático:
• Representação simplificada da realidade;
• Na experimentação é a representação da variável resposta
levando em consideração os fatores envolvidos no experimento.
Exemplo: Variedades de Pêssego
𝑦𝑖𝑗 = 𝑚 + 𝑡𝑖 + 𝑒𝑖𝑗 Número de estacas, da variedade i (i = 1, ..., 4), fixadas na repetição j (j = 1, ..., 5),
Média geral (número médio de estacas fixadas por parcela, independente de tratamento ou repetição)
Efeito do tratamento i, ou variedade i.
Erro aleatório ligado à variedade i na repetição j.
Pressuposições da Análise da Variância (ANOVA)
• O modelo deve ser aditivo;
• Os erros devem ter distribuição normal;
• Os erros devem ser independentes;
• Os erros dever ter a mesma variância (Homocedasticidade dos erros).
Pressuposições da Análise da Variância (ANOVA)
• É comum unir as 3 últimas exigências na seguinte expressão:
𝑒
𝑖𝑗~ N I D ( 0 , 𝜎
2)
Erro Experimental
Segue uma distribuição
Normal
Independentemente
Distribuida
Média 0 Variância constante 𝜎2
Verificação das Pressuposições
• Geralmente considera-se o modelo como aditivo por hipótese:
• Teste de não aditividade de Tukey.
• Normalidade dos erros:
• Teste de 𝜒2;
• Teste de Lilliefors;
• Teste de Shapiro Wilk;
• Teste de Kolmogorov-Smirnov.
• Independência dos erros:
• Princípio da casualização;
• Verificação gráfica.
• Homocedasticidade das variâncias:
• Teste de Hartley ou da razão máxima (Fmáx);
• Teste de Bartlett;
• Teste de Levene.
Aditividade do Modelo
• Modelos para experimentos são considerados aditivos pela sua simplicidade;
• Pode-se aplicar testes de não aditividade a modelos de mais de um fator ou que tenham um fator e algum tipo de controle local aplicado;
• Muitas vezes se o planejamento do experimento foi feito da maneira correta o modelo pode ser considerado como aditivo sem a necessidade de testes adicionais.
Análise de Resíduos
• Para aplicar um teste de normalidade dos erros, primeiro, é necessário obter as estimativas dos erros;
• Quanto mais simples o modelo matemático e o delineamento experimental, mais simples a obtenção das estimativas dos erros experimentais;
• A análise de resíduos permite a verificação da normalidade dos erros, homocedasticidade das variâncias e independência dos erros.
Como Obter os resíduos?
• Basta conhecer o modelo matemático:
• No caso do delineamento inteiramente casualizado, tem-se:
• 𝑦𝑖𝑗 = 𝑚 + 𝑡𝑖 + 𝑒𝑖𝑗, em que i representa o tratamento (de 1 a I) e j as repetições (de 1 a J)
• A estimativa da média geral (𝑚) é dada por:
• 𝑚 = 𝐺
𝐼𝐽, em que 𝐺 = 𝑦𝑖,𝑗 𝑖𝑗.
• As estimativas dos efeitos de tratamento (𝑡 𝑖) são dadas por:
• 𝑡 𝑖 = 𝑇𝐽𝑖 − 𝑚, em que 𝑇𝑖 = 𝑦𝑗 𝑖𝑗.
• As estimativas dos erros são dadas por:
• 𝑒 𝑖𝑗 = 𝑦𝑖𝑗 − 𝑚 − 𝑡 𝑖.
Exemplo
Trat Repetições
𝑻𝒊 𝑻𝒊
𝑱 𝒕 𝒊
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 2 2 1 1 0 6 1,2 1,2 – 6,1 = -4,9
Var 2 (B) 1 0 0 1 1 3 0,6 0,6 – 6,1 = -5,5
Var 3 (C) 12 10 14 17 11 64 12,8 12,8 – 6,1 = 6,7
Var 4 (D) 7 9 15 8 10 49 9,8 9,8 – 6,1 = 3,7
Total 122
𝑚 = 122
20 = 6,1
Trat Repetições
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 0,8 0,8 -0,2 -0,2 -1,2 Var 2 (B) 0,4 -0,6 -0,6 0,4 0,4 Var 3 (C) -0,8 -2,8 1,2 4,2 -1,8 Var 4 (D) -2,8 -0,8 5,2 -1,8 0,2
Tabela dos erros:
Trat Repetições
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 2 2 1 1 0
Var 2 (B) 1 0 0 1 1
Var 3 (C) 12 10 14 17 11
Var 4 (D) 7 9 15 8 10
Tabela dos resultados:
𝑒 𝑖𝑗 = 𝑦𝑖𝑗 − 6,1 − 𝑡 𝑖 𝑡 1 = −4,9
𝑡 2 = −5,5 𝑡 3 = 6,7 𝑡 4 = 3,7
Exemplo
Exemplo de Análise de Resíduos
• Obtenção dos erros padronizados:
𝑍𝑖 = 𝑋𝑖 − 𝑋 𝑠
• no nosso caso:
• 𝑋𝑖 = 𝑒𝑖𝑗;
• 𝑋 = 0 e
• 𝑠 é a estimativa do desvio padrão médio dos erros:
• 𝑍𝑖 = 𝑒𝑠 𝑖𝑗 = 𝑑𝑖𝑗 = desvios padronizados;
• 𝑠 = 𝑠 2;
• 𝑠 2 = 𝐼(𝐽−1) 𝑒𝑖𝑗2 = 𝑠𝐼𝑖2;
Exemplo de Análise de Resíduos
Trat Repetições
1ª 2ª 3ª 4ª 5ª Total 𝑠𝑖2
Var 1 (A) 0,64 0,64 0,04 0,04 1,44 2,8 0,7 Total / (5-1)
Var 2 (B) 0,16 0,36 0,36 0,16 0,16 1,2 0,3
Var 3 (C) 0,64 7,84 1,44 17,64 3,24 30,8 7,7 Var 4 (D) 7,84 0,64 27,04 3,24 0,04 38,8 9,7
Total 73,6 4,6 Média (𝑠 2)
Total / 16 4,6
Tabela contendo os valores dos erros elevados ao quadrado (𝑒𝑖𝑗2)
𝐼 𝐽 − 1 = 4 5 − 1 = 16
Trat Repetições
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 0,373 0,373 -0,093 -0,093 -0,560 Var 2 (B) 0,187 -0,280 -0,280 0,187 0,187 Var 3 (C) -0,373 -1,306 0,560 1,958 -0,839 Var 4 (D) -1,306 -0,373 2,425 -0,839 0,093
Tabela dos desvios padronizados:
Trat Repetições
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 0,8 0,8 -0,2 -0,2 -1,2 Var 2 (B) 0,4 -0,6 -0,6 0,4 0,4 Var 3 (C) -0,8 -2,8 1,2 4,2 -1,8 Var 4 (D) -2,8 -0,8 5,2 -1,8 0,2
Tabela dos erros:
𝑑𝑖𝑗 = 𝑒𝑖𝑗 𝑠
Exemplo
Q-Q Plot
O Q-Q Plot é um gráfico bastante útil na análise dos resíduos. Se os resíduos se posicionarem de maneira a formar uma reta
(aproximada), tem-se evidência de normalidade dos mesmos, se não, tem-se evidência de falta de
normalidade (como é o caso do exemplo dado).
Histograma
O histograma dos resíduos também é um bom indicador de normalidade dos dados. Se os resíduos forem normais, o seu histograma deve
representar uma amostra retirada de uma distribuição normal com média zero.
Novamente, o gráfico
produzido com os dados do exemplo é um indicativo da falta de normalidade dos resíduos.
Testes de Normalidade
• Teste de Lilliefors:
• p-value = 0.05114
• Teste de Shapiro Wilk:
• p-value = 0.02209
• Teste de Kolmogorov-Smirnov:
• p-value = 0.09014
Exemplo de Teste de Homocedasticidade
• Para calcular a estatística do teste de Hartley basta conhecer as variâncias dos erros para cada tratamento:
• O teste consiste em calcular a razão entre a maio e a menor variância:
Trat
𝑠𝑖2 Var 1 (A) 0,7 Var 2 (B) 0,3 Var 3 (C) 7,7 Var 4 (D) 9,7 4,6
𝐹𝑚á𝑥 = 𝑠𝑚á𝑥2
𝑠𝑚𝑖𝑛2 = 9,7
0,3 = 32,33 𝐹𝑚á𝑥(𝑡𝑎𝑏) 𝑘 = 4 variâncias 𝜐 = 4 g. l. (por 𝑠𝑖2)
20,6 (5%) 49,0(1%)
32,33 > 20,6
Rejeita-se a hipótese inicial de homocedasticidade das
variâncias
Testes de Homocedasticidade
• Teste de Bartlett:
• p-value = 0.006914
• Teste de Levene:
• p-value = 0.2341
Visualização Gráfica
-4 -3 -2 -1 0 1 2 3 4 5 6
0 2 4 6 8 10 12 14
Erros Padronizados
Valores Preditos
Preditos vs Erros Padronizados
Indicativo de uma possível heterogeneidade das variâncias
Verificação das Pressuposições
• O experimento respeita 2 pressuposições: Aditividade do modelo (por hipótese); Independência dos erros
(aleatorização).
• Porém duas pressuposições parecem não serem totalmente respeitadas: Normalidade dos erros (Lilliefors);
Homocedasticidade das variâncias (Hartley).
• Os problemas de falta de Homocedasticidade e/ou
Normalidade podem ser resolvidos (algumas vezes) com a transformação dos dados.
• Qual transformação usar?
Transformação de Dados
• Mais Comuns:
• 𝑥 + 𝑘, com 𝑘 sendo uma constante positiva, para dados de contagem;
• 𝑎𝑟𝑐 𝑠𝑒𝑛 𝑝/100, para dados de percentagem, geralmente para 0 ≤ 𝑝 ≤ 30% ou 70 ≤ 𝑝 ≤ 100%;
• log (𝑥 + 𝑘), quando hà proporcionalidade entre médias e desvios padrões.
• Box Cox:
• log 𝑠𝑖2 = 𝑏 ∗ log(𝑚𝑖) + 𝑐;
• 𝜆 = 1 − 𝑏 2.
• 𝜆 ≠ 0 → 𝑥∗ = 𝑥𝜆;
• 𝜆 = 0 → 𝑥∗ = log(𝑥);
𝒃 𝝀 Transformação
0 1 Nenhuma
1 1/2 𝑥
2 0 log (𝑥)
3 -1/2 1
𝑥
4 -1 1 𝑥
Exemplo de Transformação de Dados
Trat Repetições
1ª 2ª 3ª 4ª 5ª total 𝒎𝒊 𝒔𝒊𝟐
Var 1 (A) 2 2 1 1 0 6 1,2 0,7
Var 2 (B) 1 0 0 1 1 3 0,6 0,3
Var 3 (C) 12 10 14 17 11 64 12,8 7,7
Var 4 (D) 7 9 15 8 10 49 9,8 9,7
Tabela com os dados do experimento, média e variância por tratamento:
Trat 𝒍𝒐𝒈(𝒎𝒊) 𝒍𝒐𝒈(𝒔𝒊𝟐) 𝒍𝒐𝒈 𝒎𝒊 ∗ 𝒍𝒐𝒈(𝒔𝒊𝟐) 𝒍𝒐𝒈(𝒎𝒊) 𝟐 Var 1 (A) 0,079181 -0,1549 -0,01227 0,00627 Var 2 (B) -0,22185 -0,52288 0,116 0,049217 Var 3 (C) 1,10721 0,886491 0,981531 1,225914 Var 4 (D) 0,991226 0,986772 0,978114 0,982529 Total 1,955769 1,195482 2,06338 2,26393 Média 0,488942 0,29887
Tabela de auxílio para o cálculo de b:
Alternativas à Transformação
• Existem casos em que não é possível encontrar uma
transformação que resolva todos os problemas e permita a utilização da técnica da ANOVA.
• Nesses casos, recomenda-se:
• Análises não paramétricas; ou
• Modelos Lineares Generalizados.
Transformação dos dados
Trat Repetições
total mi si2
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 1,581 1,581 1,225 1,225 0,707 6,319 1,264 0,128 Var 2 (B) 1,225 0,707 0,707 1,225 1,225 5,088 1,018 0,078 Var 3 (C) 3,536 3,240 3,808 4,183 3,391 18,158 3,632 0,139 Var 4 (D) 2,739 3,082 3,937 2,915 3,240 15,914 3,183 0,214
Total 45,479
A tranformação recomendada foi 𝑥, porém, como existem parcelas com observações iguais a zero, recomenda-se a soma de uma constante dentro da raiz, logo a transformação utilizada foi: 𝑥 + 0,5
𝑭𝒎á𝒙 = 𝟎, 𝟐𝟏𝟒
𝟎, 𝟎𝟕𝟖 = 𝟐, 𝟕𝟓 < 𝟐𝟎, 𝟔 Corrigido o problema da
heterogeneidade das variâncias
Q-Q Plot dos Resíduos – pós transformação dos dados
Pode-se notar que os resíduos estão bem mais aproximados da reta após a transformação dos dados, o que indica uma alta
possibilidade de não se rejeitar a hipótese da normalidade dos resíduos após a transformação dos dados .
Histograma dos Resíduos – pós transformação dos dados
Assim como o Q-Q Plot, o histograma dos resíduos encontrados após a
transformação dos dados, também indica uma
possível normalidade dos mesmos.
Gráfico – Dados Transformados
-6 -4 -2 0 2 4 6
0 1 2 3 4
Erros Padronizados
Valores Preditos
Preditos vs Erros Padronizados (Dados Transformados
Pressuposições – Dados Transformados
• Após a transformação dos dados passamos a respeitar todas as pressuposições do modelo matemático;
• Se torna possível a utilização do método da ANOVA na análise dos resultados do experimento.
Análise da Variância
• Como fazer a Análise da Variância?
• Primeiro passo: Definir o esquema da ANOVA
Causa da Variação
Graus de Liberdade
Soma de Quadrados
Quadrado
Médio F
Tratamentos I-1 SQTrat QMTrat QMTrat/QMRes
Resíduos I(J-1) SQRes QMRes
Total IJ-1 SQTotal
Somas de Quadrados
• As Somas de Quadrados (SQ) são obtidas pelas seguintes expressões:
• SQTotal = 𝑦𝑖,𝑗 𝑖𝑗2 − 𝑦𝑖,𝑗 𝑖𝑗
2
𝐼𝐽 ;
• em que 𝑦𝑖,𝑗 𝑖𝑗
2
𝐼𝐽 = 𝐶 é denominado correção
• SQTrat = 1
𝐽 𝑦𝑖 𝑖∙2 − 𝐶 = 1
𝐽 𝑇𝑖 𝑖2 − 𝐶;
• SQRes = SQTotal − SQTrat.
Quadrados Médios e Teste F
• Os Quadrados Médios (QM) são obtidos pelas seguintes expressões:
• QMTrat = gl(Trat)SQTrat = SQTrat𝐼−1 ;
• QMRes = gl(Res)SQRes = 𝐼(𝐽−1)SQRes.
• O teste F considera a hipótese de nulidade:
• os efeitos dos tratamentos não diferem entre si (𝑡𝑟 = 𝑡𝑠, ∀ 𝑟 e 𝑠);
• e a alternativa:
• ao menos dois tratamentos diferem entre si (𝑡𝑟 ≠ 𝑡𝑠, para ao menos um 𝑟 ≠ 𝑠).
• A estatística do teste e: 𝐹 = QMTrat
QMRes.
Qual o Significado do Teste F
• Considere um delineamento inteiramente casualizado fixo (𝑚 e 𝑡𝑖 fixos e 𝑒𝑖𝑗 aleatório), tem-se:
• E QMRes = 𝜎2 → QMRes = 𝜎 2;
• E QMTrat = 𝜎2 + 𝐽Φ𝜏 → QMTrat = 𝜎 2 + 𝑗Φ𝜏, com Φ𝜏 = 𝑡 𝐼−1𝑖 𝑖2;
• Logo: 𝐹 = 𝜎2+
𝐽
𝐼−1 𝑡 𝑖 𝑖2
𝜎2 = 1 + 𝐽 Φ𝜎2𝜏.
• Ou seja, F se afasta de 1 a medida que 𝑡 𝑖 𝑖2 aumenta; como esse valor mede a variação dos efeitos de tratamento, tem-se que valores baixos indicam igualdade entre os tratamentos e valores altos diferenças entre os tratamentos.
Teste F
• Para saber o quanto o teste F deve se afastar de 1 para ser considerado significativo basta checar a tabela do teste, com 𝑛1 graus de liberdade de tratamentos (I-1) e 𝑛2 graus de
liberdade dos resíduos I(J-1).
• No nosso exemplo:
• 𝐹𝑜𝑏𝑠 = 62,87**;
• 𝐹𝑡𝑎𝑏 𝑛1 = 3
𝑛2 = 16 →
𝐹𝑡𝑎𝑏 = 3,24 (5%) 𝐹𝑡𝑎𝑏 = 5,29 (1%);
• Como o valor observado é maior do que o tabelado conclui-se que ao menos duas variedades se diferenciam quanto ao
estacamento de raizes. Costuma-se indicar que o valor é
significativo a um nível de 5% com * e altamente significativo (1%) com **.
Exemplo
• SQTotal = 1,5812 + ⋯ + 3,242 − 45,4794∗5 2 = 28,5844;
• SQTrat = 15 6,3192 + ⋯ + 15,9142 − 45,47920 2 = 26,3495;
• SQRes = 28,5844 − 26,3495 = 2,2349;
Causa da Variação
Graus de Liberdade
Soma de Quadrados
Quadrado
Médio F
Tratamentos 3 26,3495 8,7832 62,87
Resíduos 16 2,2349 0,1397
Total 19 28,5844
𝐶𝑉 = 100 0,1397
2,272 = 16,45% 𝐶𝑉 = 100 4,6
6,1 = 35,16%
Dados transformados Dados reais
Coeficiente de Variação
• Toda a Análise da Variância deve ser seguida de seu Coeficiente de Variação:
• 𝐶𝑉 = 𝑥 𝑠 100%
• O CV fornece um indicativo da maneira como o experimento foi conduzido;
• Quanto menor for o CV, maior é a probabilidade de que o experimento tenha sido bem instalado e conduzido;
• Em caso de ANOVAs feitas com dados transformados, deve-se utilizar o CV relativo aos dados originais.
Exercício
• Uma engenheira está interessado em investigar a relação entre a potência da Frequência de Rádio (FR) e a taxa de gravação de sua ferramenta;
• O objetivo de um experimento como esse é modelar a relação entre a potência da FR e a taxa de gravação, a fim de
especificar a potência que dará a taxa de gravação desejada;
• Ela está interessada em um gás específico (𝐶2𝐹6), e em um único espaço (0,80 cm), e quer testar quatro níveis de
potência de FR: 160W, 180W, 200W, e 220W;
• Ela decidiu testar 5 lâminas sujeitas a cada um dos níveis.
Exemplo – Ferramenta de
gravação para uma única lâmina
Suprimento de gás
Painel de controle do gás
Gerador de Frequência de Rádio
ânodo
cátodo lâmina
válvula
Bomba de vácuo
Exercício
Potência (W) Observações
Total Média
1 2 3 4 5
160 575 542 530 539 570 2756 551,2
180 565 593 590 579 610 2937 587,4
200 600 651 610 637 629 3127 625,4
220 725 700 715 685 710 3535 707,0
Considere os dados obtidos pelo experimentador (dados acima):
(a) Descreva o modelo matemático adequado;
(b) Calcule as estimativas dos parâmetros do modelo;
(c) Analise os resíduos, conclua e justifique se os pressupostos da ANOVA são respeitados ou não;
(d) Caso necessário utilize uma transformação;
(e) Faça a Análise da Variância, conclua e interprete.