• Nenhum resultado encontrado

Planejamento de Experimentos. Primeiro Semestre/2019

N/A
N/A
Protected

Academic year: 2022

Share "Planejamento de Experimentos. Primeiro Semestre/2019"

Copied!
44
0
0

Texto

(1)

Planejamento de Experimentos

Primeiro Semestre/2019

(2)

Delineamentos Inteiramente Casualizados

• O exemplo utilizado anteriormente da argamassa de cimento, pode ser considerado um experimento comparativo simples, ou um experimento de um único fator com dois níveis:

Fator: formulação da argamassa;

Nível: formulação original; formulação modificada.

• Muitos experimentos envolvem apenas um fator, porém, podem envolver mais do que apenas dois níveis;

• Iremos estudar, agora, experimentos completamente

aleatorizados, considerando um único fator com 𝑎 níveis (ou 𝑎 tratamentos).

(3)

Exemplo

Um pesquisador pretende comparar 4 cultivares de pêssego quanto ao enraizamento de estacas.

A área experimental disponibilizada para o experimento é um viveiro em condições controladas com capacidade para 20 parcelas.

O pesquisador pode conseguir um máximo de 100 estacas por cultivar.

Na literatura o número de estacas por parcela varia de 8 a 15.

(4)

Experimento Inteiramente Casualizado

• Sem a necessidade de controle local;

• Exemplo (Barbin, 2003):

Objetivo: Comparar 4 cultivares de pêssego quanto ao enraizamento de estacas;

Var. Resp.: número de estacas enraizadas por parcela;

Fator em potencial / Trat: 4 cultivares de pêssego.

Fator de perturbação: Não tem, pois a área experimental é um viveiro em condições controladas.

Parcela: 20 estacas.

Área Exp.: Viveiro em condições controladas com capacidade para 20 parcelas.

Cada tratamento foi repetido 5 vezes;

Os tratamentos foram designados às parcelas por meio de sorteio.

(5)

Experimento Inteiramente Casualizado

Croqui da Área Experimental

P1 P5 P9 P13 P17

P2 P6 P10 P14 P18

P3 P7 P11 P15 P19

P4 P8 P12 P16 P20

V2 V1

V3 V4

Urna com 5 rep. de cada cartão

V2

V4 V1

V1 V3

V3 V4

V2 V3

V4 V1

V2 V3

V4 V1 V2

V1 V3 V4

V2

Em cada parcela serão plantadas 20 estacas provenientes da variedade a ela designada. Passado o tempo necessário será observado o número de estacas enraizadas por parcela.

(6)

Experimento Inteiramente Casualizado

Resultados:

Tratamentos Repetições

Total

Var 1 (A) 2 2 1 1 0 6

Var 2 (B) 1 0 0 1 1 3

Var 3 (C) 12 10 14 17 11 64

Var 4 (D) 7 9 15 8 10 49

122

(7)

Análise dos Dados

• Análise da Variância:

Nem sempre pode ser utilizada;

Só é indicada se o modelo matemático respeitar certas exigências.

• Modelo Matemático:

Representação simplificada da realidade;

Na experimentação é a representação da variável resposta

levando em consideração os fatores envolvidos no experimento.

(8)

Exemplo: Variedades de Pêssego

𝑦𝑖𝑗 = 𝑚 + 𝑡𝑖 + 𝑒𝑖𝑗 Número de estacas, da variedade i (i = 1, ..., 4), fixadas na repetição j (j = 1, ..., 5),

Média geral (número médio de estacas fixadas por parcela, independente de tratamento ou repetição)

Efeito do tratamento i, ou variedade i.

Erro aleatório ligado à variedade i na repetição j.

(9)

Pressuposições da Análise da Variância (ANOVA)

• O modelo deve ser aditivo;

• Os erros devem ter distribuição normal;

• Os erros devem ser independentes;

• Os erros dever ter a mesma variância (Homocedasticidade dos erros).

(10)

Pressuposições da Análise da Variância (ANOVA)

• É comum unir as 3 últimas exigências na seguinte expressão:

𝑒

𝑖𝑗

~ N I D ( 0 , 𝜎

2

)

Erro Experimental

Segue uma distribuição

Normal

Independentemente

Distribuida

Média 0 Variância constante 𝜎2

(11)

Verificação das Pressuposições

Geralmente considera-se o modelo como aditivo por hipótese:

Teste de não aditividade de Tukey.

Normalidade dos erros:

Teste de 𝜒2;

Teste de Lilliefors;

Teste de Shapiro Wilk;

Teste de Kolmogorov-Smirnov.

Independência dos erros:

Princípio da casualização;

Verificação gráfica.

Homocedasticidade das variâncias:

Teste de Hartley ou da razão máxima (Fmáx);

Teste de Bartlett;

Teste de Levene.

(12)

Aditividade do Modelo

• Modelos para experimentos são considerados aditivos pela sua simplicidade;

• Pode-se aplicar testes de não aditividade a modelos de mais de um fator ou que tenham um fator e algum tipo de controle local aplicado;

• Muitas vezes se o planejamento do experimento foi feito da maneira correta o modelo pode ser considerado como aditivo sem a necessidade de testes adicionais.

(13)

Análise de Resíduos

• Para aplicar um teste de normalidade dos erros, primeiro, é necessário obter as estimativas dos erros;

• Quanto mais simples o modelo matemático e o delineamento experimental, mais simples a obtenção das estimativas dos erros experimentais;

• A análise de resíduos permite a verificação da normalidade dos erros, homocedasticidade das variâncias e independência dos erros.

(14)

Como Obter os resíduos?

• Basta conhecer o modelo matemático:

• No caso do delineamento inteiramente casualizado, tem-se:

𝑦𝑖𝑗 = 𝑚 + 𝑡𝑖 + 𝑒𝑖𝑗, em que i representa o tratamento (de 1 a I) e j as repetições (de 1 a J)

• A estimativa da média geral (𝑚) é dada por:

𝑚 = 𝐺

𝐼𝐽, em que 𝐺 = 𝑦𝑖,𝑗 𝑖𝑗.

• As estimativas dos efeitos de tratamento (𝑡 𝑖) são dadas por:

𝑡 𝑖 = 𝑇𝐽𝑖 − 𝑚, em que 𝑇𝑖 = 𝑦𝑗 𝑖𝑗.

• As estimativas dos erros são dadas por:

𝑒 𝑖𝑗 = 𝑦𝑖𝑗 − 𝑚 − 𝑡 𝑖.

(15)

Exemplo

Trat Repetições

𝑻𝒊 𝑻𝒊

𝑱 𝒕 𝒊

Var 1 (A) 2 2 1 1 0 6 1,2 1,2 – 6,1 = -4,9

Var 2 (B) 1 0 0 1 1 3 0,6 0,6 – 6,1 = -5,5

Var 3 (C) 12 10 14 17 11 64 12,8 12,8 – 6,1 = 6,7

Var 4 (D) 7 9 15 8 10 49 9,8 9,8 – 6,1 = 3,7

Total 122

𝑚 = 122

20 = 6,1

(16)

Trat Repetições

Var 1 (A) 0,8 0,8 -0,2 -0,2 -1,2 Var 2 (B) 0,4 -0,6 -0,6 0,4 0,4 Var 3 (C) -0,8 -2,8 1,2 4,2 -1,8 Var 4 (D) -2,8 -0,8 5,2 -1,8 0,2

Tabela dos erros:

Trat Repetições

Var 1 (A) 2 2 1 1 0

Var 2 (B) 1 0 0 1 1

Var 3 (C) 12 10 14 17 11

Var 4 (D) 7 9 15 8 10

Tabela dos resultados:

𝑒 𝑖𝑗 = 𝑦𝑖𝑗 − 6,1 − 𝑡 𝑖 𝑡 1 = −4,9

𝑡 2 = −5,5 𝑡 3 = 6,7 𝑡 4 = 3,7

Exemplo

(17)

Exemplo de Análise de Resíduos

• Obtenção dos erros padronizados:

𝑍𝑖 = 𝑋𝑖 − 𝑋 𝑠

• no nosso caso:

𝑋𝑖 = 𝑒𝑖𝑗;

𝑋 = 0 e

𝑠 é a estimativa do desvio padrão médio dos erros:

𝑍𝑖 = 𝑒𝑠 𝑖𝑗 = 𝑑𝑖𝑗 = desvios padronizados;

𝑠 = 𝑠 2;

𝑠 2 = 𝐼(𝐽−1) 𝑒𝑖𝑗2 = 𝑠𝐼𝑖2;

(18)

Exemplo de Análise de Resíduos

Trat Repetições

Total 𝑠𝑖2

Var 1 (A) 0,64 0,64 0,04 0,04 1,44 2,8 0,7 Total / (5-1)

Var 2 (B) 0,16 0,36 0,36 0,16 0,16 1,2 0,3

Var 3 (C) 0,64 7,84 1,44 17,64 3,24 30,8 7,7 Var 4 (D) 7,84 0,64 27,04 3,24 0,04 38,8 9,7

Total 73,6 4,6 Média (𝑠 2)

Total / 16 4,6

Tabela contendo os valores dos erros elevados ao quadrado (𝑒𝑖𝑗2)

𝐼 𝐽 − 1 = 4 5 − 1 = 16

(19)

Trat Repetições

Var 1 (A) 0,373 0,373 -0,093 -0,093 -0,560 Var 2 (B) 0,187 -0,280 -0,280 0,187 0,187 Var 3 (C) -0,373 -1,306 0,560 1,958 -0,839 Var 4 (D) -1,306 -0,373 2,425 -0,839 0,093

Tabela dos desvios padronizados:

Trat Repetições

Var 1 (A) 0,8 0,8 -0,2 -0,2 -1,2 Var 2 (B) 0,4 -0,6 -0,6 0,4 0,4 Var 3 (C) -0,8 -2,8 1,2 4,2 -1,8 Var 4 (D) -2,8 -0,8 5,2 -1,8 0,2

Tabela dos erros:

𝑑𝑖𝑗 = 𝑒𝑖𝑗 𝑠

Exemplo

(20)

Q-Q Plot

O Q-Q Plot é um gráfico bastante útil na análise dos resíduos. Se os resíduos se posicionarem de maneira a formar uma reta

(aproximada), tem-se evidência de normalidade dos mesmos, se não, tem-se evidência de falta de

normalidade (como é o caso do exemplo dado).

(21)

Histograma

O histograma dos resíduos também é um bom indicador de normalidade dos dados. Se os resíduos forem normais, o seu histograma deve

representar uma amostra retirada de uma distribuição normal com média zero.

Novamente, o gráfico

produzido com os dados do exemplo é um indicativo da falta de normalidade dos resíduos.

(22)

Testes de Normalidade

• Teste de Lilliefors:

p-value = 0.05114

• Teste de Shapiro Wilk:

p-value = 0.02209

• Teste de Kolmogorov-Smirnov:

p-value = 0.09014

(23)

Exemplo de Teste de Homocedasticidade

• Para calcular a estatística do teste de Hartley basta conhecer as variâncias dos erros para cada tratamento:

• O teste consiste em calcular a razão entre a maio e a menor variância:

Trat

𝑠𝑖2 Var 1 (A) 0,7 Var 2 (B) 0,3 Var 3 (C) 7,7 Var 4 (D) 9,7 4,6

𝐹𝑚á𝑥 = 𝑠𝑚á𝑥2

𝑠𝑚𝑖𝑛2 = 9,7

0,3 = 32,33 𝐹𝑚á𝑥(𝑡𝑎𝑏) 𝑘 = 4 variâncias 𝜐 = 4 g. l. (por 𝑠𝑖2)

20,6 (5%) 49,0(1%)

32,33 > 20,6

Rejeita-se a hipótese inicial de homocedasticidade das

variâncias

(24)

Testes de Homocedasticidade

• Teste de Bartlett:

p-value = 0.006914

• Teste de Levene:

p-value = 0.2341

(25)

Visualização Gráfica

-4 -3 -2 -1 0 1 2 3 4 5 6

0 2 4 6 8 10 12 14

Erros Padronizados

Valores Preditos

Preditos vs Erros Padronizados

Indicativo de uma possível heterogeneidade das variâncias

(26)

Verificação das Pressuposições

• O experimento respeita 2 pressuposições: Aditividade do modelo (por hipótese); Independência dos erros

(aleatorização).

• Porém duas pressuposições parecem não serem totalmente respeitadas: Normalidade dos erros (Lilliefors);

Homocedasticidade das variâncias (Hartley).

• Os problemas de falta de Homocedasticidade e/ou

Normalidade podem ser resolvidos (algumas vezes) com a transformação dos dados.

• Qual transformação usar?

(27)

Transformação de Dados

• Mais Comuns:

𝑥 + 𝑘, com 𝑘 sendo uma constante positiva, para dados de contagem;

𝑎𝑟𝑐 𝑠𝑒𝑛 𝑝/100, para dados de percentagem, geralmente para 0 ≤ 𝑝 ≤ 30% ou 70 ≤ 𝑝 ≤ 100%;

log (𝑥 + 𝑘), quando hà proporcionalidade entre médias e desvios padrões.

• Box Cox:

log 𝑠𝑖2 = 𝑏 ∗ log(𝑚𝑖) + 𝑐;

𝜆 = 1 − 𝑏 2.

𝜆 ≠ 0 → 𝑥 = 𝑥𝜆;

𝜆 = 0 → 𝑥 = log(𝑥);

𝒃 𝝀 Transformação

0 1 Nenhuma

1 1/2 𝑥

2 0 log (𝑥)

3 -1/2 1

𝑥

4 -1 1 𝑥

(28)

Exemplo de Transformação de Dados

Trat Repetições

total 𝒎𝒊 𝒔𝒊𝟐

Var 1 (A) 2 2 1 1 0 6 1,2 0,7

Var 2 (B) 1 0 0 1 1 3 0,6 0,3

Var 3 (C) 12 10 14 17 11 64 12,8 7,7

Var 4 (D) 7 9 15 8 10 49 9,8 9,7

Tabela com os dados do experimento, média e variância por tratamento:

Trat 𝒍𝒐𝒈(𝒎𝒊) 𝒍𝒐𝒈(𝒔𝒊𝟐) 𝒍𝒐𝒈 𝒎𝒊 ∗ 𝒍𝒐𝒈(𝒔𝒊𝟐) 𝒍𝒐𝒈(𝒎𝒊) 𝟐 Var 1 (A) 0,079181 -0,1549 -0,01227 0,00627 Var 2 (B) -0,22185 -0,52288 0,116 0,049217 Var 3 (C) 1,10721 0,886491 0,981531 1,225914 Var 4 (D) 0,991226 0,986772 0,978114 0,982529 Total 1,955769 1,195482 2,06338 2,26393 Média 0,488942 0,29887

Tabela de auxílio para o cálculo de b:

(29)

Alternativas à Transformação

• Existem casos em que não é possível encontrar uma

transformação que resolva todos os problemas e permita a utilização da técnica da ANOVA.

• Nesses casos, recomenda-se:

• Análises não paramétricas; ou

• Modelos Lineares Generalizados.

(30)

Transformação dos dados

Trat Repetições

total mi si2

Var 1 (A) 1,581 1,581 1,225 1,225 0,707 6,319 1,264 0,128 Var 2 (B) 1,225 0,707 0,707 1,225 1,225 5,088 1,018 0,078 Var 3 (C) 3,536 3,240 3,808 4,183 3,391 18,158 3,632 0,139 Var 4 (D) 2,739 3,082 3,937 2,915 3,240 15,914 3,183 0,214

Total 45,479

A tranformação recomendada foi 𝑥, porém, como existem parcelas com observações iguais a zero, recomenda-se a soma de uma constante dentro da raiz, logo a transformação utilizada foi: 𝑥 + 0,5

𝑭𝒎á𝒙 = 𝟎, 𝟐𝟏𝟒

𝟎, 𝟎𝟕𝟖 = 𝟐, 𝟕𝟓 < 𝟐𝟎, 𝟔 Corrigido o problema da

heterogeneidade das variâncias

(31)

Q-Q Plot dos Resíduos – pós transformação dos dados

Pode-se notar que os resíduos estão bem mais aproximados da reta após a transformação dos dados, o que indica uma alta

possibilidade de não se rejeitar a hipótese da normalidade dos resíduos após a transformação dos dados .

(32)

Histograma dos Resíduos – pós transformação dos dados

Assim como o Q-Q Plot, o histograma dos resíduos encontrados após a

transformação dos dados, também indica uma

possível normalidade dos mesmos.

(33)

Gráfico – Dados Transformados

-6 -4 -2 0 2 4 6

0 1 2 3 4

Erros Padronizados

Valores Preditos

Preditos vs Erros Padronizados (Dados Transformados

(34)

Pressuposições – Dados Transformados

• Após a transformação dos dados passamos a respeitar todas as pressuposições do modelo matemático;

• Se torna possível a utilização do método da ANOVA na análise dos resultados do experimento.

(35)

Análise da Variância

• Como fazer a Análise da Variância?

• Primeiro passo: Definir o esquema da ANOVA

Causa da Variação

Graus de Liberdade

Soma de Quadrados

Quadrado

Médio F

Tratamentos I-1 SQTrat QMTrat QMTrat/QMRes

Resíduos I(J-1) SQRes QMRes

Total IJ-1 SQTotal

(36)

Somas de Quadrados

• As Somas de Quadrados (SQ) são obtidas pelas seguintes expressões:

SQTotal = 𝑦𝑖,𝑗 𝑖𝑗2 𝑦𝑖,𝑗 𝑖𝑗

2

𝐼𝐽 ;

em que 𝑦𝑖,𝑗 𝑖𝑗

2

𝐼𝐽 = 𝐶 é denominado correção

SQTrat = 1

𝐽 𝑦𝑖 𝑖∙2 − 𝐶 = 1

𝐽 𝑇𝑖 𝑖2 − 𝐶;

SQRes = SQTotal − SQTrat.

(37)

Quadrados Médios e Teste F

• Os Quadrados Médios (QM) são obtidos pelas seguintes expressões:

• QMTrat = gl(Trat)SQTrat = SQTrat𝐼−1 ;

• QMRes = gl(Res)SQRes = 𝐼(𝐽−1)SQRes.

• O teste F considera a hipótese de nulidade:

os efeitos dos tratamentos não diferem entre si (𝑡𝑟 = 𝑡𝑠, ∀ 𝑟 e 𝑠);

• e a alternativa:

ao menos dois tratamentos diferem entre si (𝑡𝑟 ≠ 𝑡𝑠, para ao menos um 𝑟 ≠ 𝑠).

A estatística do teste e: 𝐹 = QMTrat

QMRes.

(38)

Qual o Significado do Teste F

• Considere um delineamento inteiramente casualizado fixo (𝑚 e 𝑡𝑖 fixos e 𝑒𝑖𝑗 aleatório), tem-se:

• E QMRes = 𝜎2 → QMRes = 𝜎 2;

• E QMTrat = 𝜎2 + 𝐽Φ𝜏 → QMTrat = 𝜎 2 + 𝑗Φ𝜏, com Φ𝜏 = 𝑡 𝐼−1𝑖 𝑖2;

• Logo: 𝐹 = 𝜎2+

𝐽

𝐼−1 𝑡 𝑖 𝑖2

𝜎2 = 1 + 𝐽 Φ𝜎2𝜏.

• Ou seja, F se afasta de 1 a medida que 𝑡 𝑖 𝑖2 aumenta; como esse valor mede a variação dos efeitos de tratamento, tem-se que valores baixos indicam igualdade entre os tratamentos e valores altos diferenças entre os tratamentos.

(39)

Teste F

• Para saber o quanto o teste F deve se afastar de 1 para ser considerado significativo basta checar a tabela do teste, com 𝑛1 graus de liberdade de tratamentos (I-1) e 𝑛2 graus de

liberdade dos resíduos I(J-1).

• No nosso exemplo:

𝐹𝑜𝑏𝑠 = 62,87**;

𝐹𝑡𝑎𝑏 𝑛1 = 3

𝑛2 = 16 →

𝐹𝑡𝑎𝑏 = 3,24 (5%) 𝐹𝑡𝑎𝑏 = 5,29 (1%);

Como o valor observado é maior do que o tabelado conclui-se que ao menos duas variedades se diferenciam quanto ao

estacamento de raizes. Costuma-se indicar que o valor é

significativo a um nível de 5% com * e altamente significativo (1%) com **.

(40)

Exemplo

• SQTotal = 1,5812 + ⋯ + 3,24245,4794∗5 2 = 28,5844;

• SQTrat = 15 6,3192 + ⋯ + 15,914245,47920 2 = 26,3495;

• SQRes = 28,5844 − 26,3495 = 2,2349;

Causa da Variação

Graus de Liberdade

Soma de Quadrados

Quadrado

Médio F

Tratamentos 3 26,3495 8,7832 62,87

Resíduos 16 2,2349 0,1397

Total 19 28,5844

𝐶𝑉 = 100 0,1397

2,272 = 16,45% 𝐶𝑉 = 100 4,6

6,1 = 35,16%

Dados transformados Dados reais

(41)

Coeficiente de Variação

• Toda a Análise da Variância deve ser seguida de seu Coeficiente de Variação:

• 𝐶𝑉 = 𝑥 𝑠 100%

• O CV fornece um indicativo da maneira como o experimento foi conduzido;

• Quanto menor for o CV, maior é a probabilidade de que o experimento tenha sido bem instalado e conduzido;

• Em caso de ANOVAs feitas com dados transformados, deve-se utilizar o CV relativo aos dados originais.

(42)

Exercício

• Uma engenheira está interessado em investigar a relação entre a potência da Frequência de Rádio (FR) e a taxa de gravação de sua ferramenta;

• O objetivo de um experimento como esse é modelar a relação entre a potência da FR e a taxa de gravação, a fim de

especificar a potência que dará a taxa de gravação desejada;

• Ela está interessada em um gás específico (𝐶2𝐹6), e em um único espaço (0,80 cm), e quer testar quatro níveis de

potência de FR: 160W, 180W, 200W, e 220W;

• Ela decidiu testar 5 lâminas sujeitas a cada um dos níveis.

(43)

Exemplo – Ferramenta de

gravação para uma única lâmina

Suprimento de gás

Painel de controle do gás

Gerador de Frequência de Rádio

ânodo

cátodo lâmina

válvula

Bomba de vácuo

(44)

Exercício

Potência (W) Observações

Total Média

1 2 3 4 5

160 575 542 530 539 570 2756 551,2

180 565 593 590 579 610 2937 587,4

200 600 651 610 637 629 3127 625,4

220 725 700 715 685 710 3535 707,0

Considere os dados obtidos pelo experimentador (dados acima):

(a) Descreva o modelo matemático adequado;

(b) Calcule as estimativas dos parâmetros do modelo;

(c) Analise os resíduos, conclua e justifique se os pressupostos da ANOVA são respeitados ou não;

(d) Caso necessário utilize uma transformação;

(e) Faça a Análise da Variância, conclua e interprete.

Referências

Documentos relacionados

Em uma primeira abordagem holística da situação a qual se deu em um encontro com os enfermeiros da localidade foi colocado em discussão temas como ‘’Porque a adolescente se

ocorridas no Brasil e dos objetivos e organização do Fórum, um representante de cada uma das ações e iniciativas de Reforma Política em curso hoje no Brasil (identificadas

gás é EMPREGO o setor de óleo e gás é responsável por 521.265 vagas, o correspondente a 1,3% de todos os empregos do Brasil (CAGED, jul2019) gás é INVESTIMENTO.. a cada R$

Com o presente projeto de investimento denominado &#34;Nexxpro Speed (Qualificação) - Reforço do Posicionamento Competitivo Internacional&#34;, a empresa pretende

Para tanto, é necessário que a Atenção Básica tenha alta resolutividade, com capacidade clínica e de cuidado e incorporação de tecnologias leves, leve duras e duras (diagnósticas

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

O mesmo procedimento deve ser observado por ocasião do adormecimento do fogo quando é invocado &#34;Que a luz da sua beleza continue flamejante em nossos corações&#34;, pelo

[r]