Critérios compostos para delineamentos ótimos robustos

(1)

ROBUSTOS

Marcelo Andrade da Silva

Disserta¸cão apresentada à Universidade Es-tadual Paulista “Júlio de Mesquita Filho” para a obten¸cão do t´ıtulo de Mestre em Bio-metria.

BOTUCATU S˜ao Paulo - Brasil

(2)

CRIT´ERIOS COMPOSTOS PARA DELINEAMENTOS ´OTIMOS ROBUSTOS

Marcelo Andrade da Silva

Orientadora: Prof.a _Dr.a _{Luzia Aparecida Trinca}

Disserta¸cão apresentada à Universidade Es-tadual Paulista “Júlio de Mesquita Filho” para a obten¸cão do t´ıtulo de Mestre em Bio-metria.

BOTUCATU S˜ao Paulo - Brasil

(3)

FICHA CATALOGR ÁFICA ELABORADA PELA SEÇ ÃO TÉC. AQUIS. TRATAMENTO DA INFORM. DIVIS ÃO DE BIBLIOTECA E DOCUMENTAÇ ÃO - CAMPUS DE BOTUCATU - UNESP BIBLIOTEC ÁRIA RESPONS ÁVEL: ROSEMEIRE APARECIDA VICENTE - CRB 8/5651

Silva, Marcelo Andrade.

Crit´erio composto para delineamentos ´otimos robustos / Marcelo Andrade da Silva. - Botucatu, 2014

Disserta¸c˜ao (mestrado) - Universidade Estadual Paulista, Instituto de Biociˆencias de Botucatu

Orientador: Luzia Aparecida Trinca Capes: 10202072

1. Biometria. 2. Planejamento experimental. 3. Programa¸cão heur´ıstica. 4. Estat´ıstica matemática. 5. Programa¸cão (Matemática).

(4)

Dedicat´

oria

Dedico aos meus pais

Ronaldo e Sonia

e tamb´em a minha

(5)

A Deus, por sua bondade, miseric´ordia e pelo seu infinito amor.

A minha fam´ılia, que deu suporte e insentivo para a realiza¸c˜ao deste

mestrado e a minha amada noiva, Raquel, pelo apoio, compreens˜ao e carinho.

A minha orientadora, professora Luzia Aparecida Trinca, pelo exemplo

de profissionalismo, pela paciˆencia, pelo tempo dedicado neste trabalho, pelos

con-selhos, entre muitas outras coisas, que foram fundamentais para o desenvolvimento

desta pesquisa.

A Universidade Estadual Paulista, Unesp, e ao Departamento de

Bio-estat´ıstica do Instituto de Biociˆencias de Botucatu pela estrutura, suporte t´ecnico e

secretaria.

Ao Programa de P´os-Gradua¸c˜ao em Biometria pela oportunidade dada

e confian¸ca depositada em mim para a realiza¸c˜ao do mestrado.

A Coordena¸c˜ao de Aperfei¸coamento de Pessoal de N´ıvel Superior,

CA-PES, pelo apoio financeiro durante o mestrado.

A todas as pessoas que direta ou indiretamente contribu´ıram para o

(6)

Sum´

ario

P´agina

LISTA DE FIGURAS vii

LISTA DE TABELAS viii

RESUMO ix

SUMMARY xi

1 INTRODUC¸ ˜AO 1

2 CONCEITOS B ´ASICOS E REVIS ˜AO DE

LITERATURA 5

2.1 Experimentos . . . 5

2.1.1 Trˆes princ´ıpios da experimenta¸c˜ao . . . 7

2.1.2 Experimentos fatoriais . . . 8

2.1.3 Propriedades de delineamento . . . 15

2.2 Modelo linear . . . 17

2.3 Delineamentos ´otimos de experimentos . . . 22

2.3.1 Crit´erios de otimalidade . . . 22

2.3.2 Crit´erios compostos . . . 26

2.3.3 Algoritmo de troca . . . 28

(7)

3.2 Implementa¸c˜ao do algoritmo de troca . . . 33

3.2.1 Atualiza¸c˜ao do determinante e da matriz inversa . . . 36

3.2.2 Algoritmo de troca por ponto e troca por coordenada . . . 37

4 RESULTADOS E DISCUSS ˜AO 38 4.1 Exemplo 1 (n= 16;k= 3;p= 10) . . . 40

4.2 Exemplo 2 (n= 24;k= 4;p= 11) . . . 44

4.3 Exemplo 3 (n= 24;k= 4;p= 15) . . . 45

4.4 Exemplo 4 (n= 36;k= 4;p= 15) . . . 50

5 CONCLUS ˜AO 54

(8)

Lista de Figuras

P´agina

1 Representa¸c˜ao esquem´atica de um experimento. . . 6

2 Representa¸c˜ao geom´etrica de um experimento fatorial 23 _{completo. . . .} ₁₂

3 Representa¸c˜ao geom´etrica de um experimento fatorial completo, DCC e

DBB para k= 3. . . 15

4 Comportamento da eficiência de delineamentos ótimos com a varia¸cão no

peso da propriedade DP. . . 39

(9)

P´agina

1 Formas de codifica¸c˜ao dos n´ıveis dos fatores e tratamentos em um

deli-neamento fatorial 23_{. . . .} ₁₁

2 Subconjuntos para 3 fatores . . . 14

3 Delineamentos com modelo com efeitos principais, quadr´aticos e

in-tera¸c˜oes 2 a 2 (n= 16;k = 3;p= 10) . . . 42

4 Eficiˆencia do DCC e DBB comparado com um delineamento ´otimo . . . 44

5 Delineamentos com modelo com efeitos lineares e intera¸c˜oes 2 a 2 (n =

24;k = 4;p= 11) . . . 46

6 Delineamentos utilizando crit´erios unidimensionais na busca com modelo

com efeitos principais, quadr´aticos e intera¸c˜oes 2 a 2 (n= 24;k = 4;p= 15) 48

7 Delineamentos utilizando crit´erios compostos na busca com modelo com

efeitos principais, quadr´aticos e intera¸c˜oes 2 a 2 (n= 24;k = 4;p= 15) . 49

8 Eficiˆencia dos delineamentos apresentados em Ahmad & Gilmour (2010) 51

9 Delineamentos com modelo com efeitos principais, quadr´aticos e

(10)

CRIT´ERIOS COMPOSTOS PARA DELINEAMENTOS ´OTIMOS ROBUSTOS

Autor: MARCELO ANDRADE DA SILVA

Orientadora: Prof.a _Dr.a _{LUZIA APARECIDA TRINCA}

RESUMO

Neste trabalho propomos a incorpora¸c˜ao de uma propriedade

relacio-nada a robustez de delineamentos frente a perda de observa¸c˜oes em experimentos

fatoriais, a qual denominamos critério H, na expressão de um critério composto.

Para a otimiza¸c˜ao, implementamos duas vers˜oes modificadas do algoritmo de troca

de Fedorov (1972), que é um método heur´ıstico para encontrar delineamentos ótimos

ou quase ´otimos exatos. Apresentamos quatro exemplos para examinar a

perfor-mance de delineamentos constru´ıdos com o novo crit´erio composto, os exemplos 1,

3 e 4 visam o modelo de segunda ordem completo e o exemplo 2 visa o modelo

de segunda ordem sem os efeitos quadr´aticos. Nos exemplos 1 e 3, para preservar

bom desempenho em outras propriedades, a eficiˆencia H n˜ao foi alta. Os resultados

obtidos no exemplo 2 mostraram grande contribui¸c˜ao do uso da propriedade H no

(11)

Em geral, o novo crit´erio composto produziu delineamentos mais

atra-tivos que os DP-´otimos de Gilmour & Trinca (2012), com valores deleverages mais

homogêneos, e portanto mais robustos à perda de observa¸cões. Produziu também

delineamentos com melhores propriedades do que os delineamentos constru´ıdos por

(12)

COMPOUND CRITERIA FOR ROBUST OPTIMUM DESIGNS

Author: MARCELO ANDRADE DA SILVA

Adviser: Prof.a _Dr.a _{LUZIA APARECIDA TRINCA}

SUMMARY

In this work we propose the use of a robustness measure to missing

data to construct designs for factorial experiments. The robustness property is

de-noted the H criterion and it is added to a compound design criterion expression.

Two versions of the modified exchange algorithm of Fedorov (1972) were

implemen-ted computationally for the search of exact optimum designs. Four examples are

presented, examples 1, 3 and 4 consider the full second-order model and example 2

considers second-order model excluding the quadratic effects. The examples 1 and

3, in order to preserve good efficiency with respect to other properties, their H

effi-ciency is not high. The results for example 2 showed good performance of the new

compound criterion since it produced designs high by efficient for all other properties.

In general, the new compound criterion produced more attractive

de-signs than the DP criterion of Gilmour & Trinca (2012) since their leverages were

(13)

designs were also more attractive than those constructed by subsets as in Ahmad &

(14)

1 INTRODUC

¸ ˜

AO

Nas áreas biotecnológicas, industriais, farmacêuticas, agr´ıcolas, entre

outras, muitas vezes é necessário obter informa¸cões sobre produtos e processos

em-piricamente. Pessoas envolvidas com o problema em quest˜ao precisam planejar e

executar experimentos, coletar os resultados e analis´a-los. Experimentos s˜ao estudos

controlados com altera¸c˜oes deliberadas que s˜ao realizados para resolver problemas

de fabrica¸cão ou produ¸cão de material inerte ou biológico, decidir entre diferentes

produtos ou metodologias, entender a influˆencia de determinados fatores, entre

ou-tros. Esta tarefa torna-se cada vez mais complexa e deve ser executada com muito

cuidado e aten¸c˜ao na medida que se intensifica a base tecnol´ogica dos produtos.

A teoria de delineamento de experimentos (em inglˆes, Design of

Expe-riments) inclui um conjunto de conceitos, princ´ıpios e metodologias para se planejar

pesquisas experimentais, buscando atender basicamente dois grandes objetivos: a

maior precis˜ao estat´ıstica poss´ıvel na resposta e o menor custo poss´ıvel na execu¸c˜ao

do experimento. Os primeiros registros de experimentos planejados datam da

se-gunda metade do século XIX no contexto de fertiliza¸cão do solo e sele¸cão de

va-riedades de importˆancia agr´ıcola na Inglaterra. A formaliza¸c˜ao e justificativas dos

princ´ıpios que validam os resultados experimentais surgiram com os valiosos

tra-balhos de Sir Ronald A. Fisher, matem´atico, estat´ıstico e geneticista, na primeira

metade do s´eculo XX, tanto para as pesquisas experimentais quanto para a ´area de

m´etodos estat´ısticos em geral.

A ´area de delineamentos ´otimos de experimentos teve grande impulso

com o trabalho de Kiefer (1959), que estruturou uma teoria de constru¸c˜ao de

(15)

parˆametros do modelo, recebendo o nome de Teoria de Delineamentos ´Otimos.

Kie-fer generalizou e formalizou matematicamente um problema que j´a havia permeado

a bibliografia com casos particulares (Student, 1917; Smith, 1918; Student, 1918

apud Atkinson & Bailey, 2001). A falta de recursos computacionais fez com que a aplica¸c˜ao desta teoria acontecesse apenas a partir de 1970.

A teoria de delineamentos ótimos presume que a fun¸cão matemática

(modelo) que relaciona a vari´avel resposta e os fatores ´e conhecida e apenas seus

parâmetros são desconhecidos. Os tratamentos e suas repeti¸cões a serem utilizados

no experimento são escolhidos de forma a fornecerem o máximo de informa¸cão sobre

os parâmetros desconhecidos. A formula¸cão pode ser em dois contextos: assintótico

e exato. No assint´otico, faz-se buscas em espa¸cos cont´ınuos, cuja otimalidade ´e

garantida para n, o tamanho do experimento, tendendo a _∞, em que o n´umero das

repeti¸c˜oes de tratamentos s˜ao traduzidos para pesos assumindo valores entre 0 e 1 que

integram a unidade. Os delineamentos obtidos s˜ao chamados de te´oricos, cont´ınuos

ou aproximados. No contexto exato, faz-se buscas em espa¸cos discretos, para n

finito e inteiro, no qual o número de repeti¸cões também é restrito ao conjunto dos

inteiros, cuja soma totaliza n. Os delineamentos obtidos s˜ao chamados de exatos ou

discretos. Este trabalho se restringe ao contexto exato. Para o modelo linear cl´assico

(Y =Xβ+ε), um delineamento ´otimo especifica a matriz de delineamento,X, de tal forma que alguma fun¸c˜ao de interesse deX′

Xseja otimizada. Essas fun¸cões refletem os objetivos do experimento e são chamadas “fun¸cões critério”. Critérios compostos

de otimalidade incorporam m´ultiplos objetivos, de acordo com as necessidades do

pesquisador nas fases posteriores ao planejamento de experimento. ´

E consenso que a pesquisa experimental envolve v´arias etapas

impor-tantes sintetizadas a seguir.

Conhecimento da problemática: o planejamento para um experimento bem su-cedido requer a avalia¸cão e utiliza¸cão de toda a informa¸cão prévia sobre o

(16)

3

Escolha de um modelo: delineamentos ´otimos experimentais dependem do mo-delo que relaciona a vari´avel resposta aos fatores. E preciso considerar o´

princ´ıpio da parsimˆonia na escolha de um modelo: simplicidade e utilidade

do modelo.

Delineamento do experimento: a escolha do delineamento ´e fundamental para que os aspectos de interesse do pesquisador sejam otimizados e, nas fases

pos-teriores ao planejamento de experimentos, venha atender os objetivos da

pes-quisa.

Condu¸c˜ao do experimento: o pesquisador deve acompanhar e conduzir o expe-rimento cuidadosamente para assegurar o cumpexpe-rimento ao plano estabelecido

previamente. Deve ser dado particular aten¸cão à precisão e à acurácia dos

processos de mensura¸c˜ao.

Análise dos dados: quase sempre é necessário uma investiga¸cão preliminar gráfica e uma análise estat´ıstica mais formal produzindo estimativas dos parâmetros

e intervalos de confian¸ca associados.

A experimenta¸c˜ao ´e iterativa. As etapas apresentadas sugerem um caminho direto

a partir da formula¸cão do problema até a solu¸cão. No entanto, em cada etapa, o

pesquisador pode ter que reconsiderar as decis˜oes tomadas em fases anteriores da

investiga¸cão. Problemas que surgem em estágios intermediários podem adicionar à

eventual compreens˜ao do problema.

Na pr´atica, durante a execu¸c˜ao do experimento pode ocorrer perda de

observa¸cões devido a situa¸cões inesperadas. Observa¸cões perdidas podem produzir

estimativas tendenciosas, ou seja, resultados distorcidos, ou at´e mesmo n˜ao permitir

a estimabilidade de alguns parâmetros do modelo pré-definido. Observa¸cões que

desempenham papel muito influente no ajuste do modelo também não são desejadas

na modelagem estat´ıstica em geral. Delineamentos robustos `a perda de observa¸c˜oes

são atraentes, já que são mais confiáveis para o pesquisador. A teoria de modelos

(17)

neste quesito deve apresentar homogeneidade nos valores de tais medidas. Dessa

forma, propomos um crit´erio de otimalidade com o objetivo de buscar delineamentos

formados por tratamentos que n˜ao se destacam em termos de influˆencia.

Na literatura, o m´etodo de busca mais conhecido e usado para

cons-truir delineamentos ´otimos exatos ´e o algoritmo de troca (exchange). Proposto por

Fedorov (1972), este método é uma heur´ıstica de otimiza¸cão que consiste em, a partir

de um delineamento inicial, realizar trocas, substituindo seus pontos por pontos

can-didatos até a melhora no valor do critério cessar. Usualmente, a implementa¸cão do

algoritmo de troca ´e realizada em software estat´ısticos, como, por exemplo, R Core

Team (2013) ou SAS/IML de SAS Institute Inc. (2007), por´em, para

experimen-tos com n´umero de fatores e n´ıveis elevados, exige-se uma eficiˆencia computacional

alta. Por este motivo a implementa¸c˜ao deste m´etodo foi feita em linguagem C.

Exis-tem também procedimentos automáticos para constru¸cão de delineamentos ótimos

utilizando crit´erios usuais como o PROC OPTEX/SAS e o pacote algdesign no R.

Este trabalho est´a dividido da seguinte forma: no Cap´ıtulo 2 s˜ao

abordados alguns fundamentos b´asicos de experimentos, experimentos fatoriais,

es-tima¸cão de parâmetros para modelos lineares, a teoria de delineamentos ótimos de

experimentos e uma revisão de algumas versões do algoritmo de troca que há na

literatura; no Cap´ıtulo 3 ´e apresentada a proposta de um novo crit´erio de

otima-lidade, a utiliza¸cão de critérios compostos para a busca de delineamentos ótimos e

detalhes dos algoritmos implementados neste trabalho; os resultados s˜ao

apresenta-dos no Cap´ıtulo 4 através de quatro exemplos e as conclusões deste trabalho estão

(18)

2 CONCEITOS B ´

ASICOS E REVIS ˜

AO DE

LITERATURA

2.1 Experimentos

Experimentos s˜ao realizados por pesquisadores em praticamente todas

as ´areas do conhecimento com o objetivo de investigar as rela¸c˜oes de causa e efeito

de uma determinada situa¸c˜ao de interesse. Literalmente, um experimento ´e um teste

que envolve uma altera¸c˜ao deliberada e uma leitura das consequˆencias. Mais

formal-mente, podemos definir um experimento como um teste ou uma sucess˜ao de testes

em que as altera¸cões propositais são feitas nas chamadas variáveis independentes ou

fatores em condi¸c˜oes experimentais adequadas, para que possamos observar e

iden-tificar quais vari´aveis independentes ou fatores causam as mudan¸cas nas vari´aveis

respostas, as consequˆencias.

A Figura 1 ´e uma representa¸c˜ao em esquema de um experimento. O

processo consiste em medir os valores das h respostas, denotadas por y1, . . . , yh.

Estas variáveis são dependentes dos k fatores u1, . . . , uk, cujos valores são

previa-mente prescritos pelo delineamento experimental. Os valores das respostas podem

também depender de r variáveis concomitantes z1, . . . , zr que podem, ou não, ser

conhecidos pelo pesquisador. A rela¸c˜ao entre os fatores u’s e as respostas medidas

y’s ´e modificada pela presen¸ca de outros fatores desconhecidos e/ou de importˆancia

pouco relevante considerados erros aleat´orios, representados porε’s. Tal modifica¸c˜ao

´e suposta ser aditiva e, ent˜ao, matematicamente, podemos escrever

(19)

Figura 1 - Representa¸c˜ao esquem´atica de um experimento.

em que µi ´e a esperan¸ca de Yij, ou seja, da resposta aleat´oria quando o tratamento

ui = (u1, . . . , uk)′´e aplicado naj-´esima unidade parai= 1,2, . . . , tej = 1,2, . . . , ni,

com ∑t

i=1ni =n.

Em todo experimento, a unidade experimental deve estar identificada.

A unidade experimental ´e a por¸c˜ao do material experimental para a qual o tratamento

´e atribu´ıdo e aplicado. Para ilustrar este conceito, vamos imaginar, por exemplo,

que se alguns tipos de drogas s˜ao testados em um grupo de pessoas e cada pessoa

é alocada aleatoriamente à determinada droga, então cada pessoa é uma unidade

experimental. Se, por outro lado, alguns tipos de pomadas forem testados em cada

bra¸co, sendo que cada bra¸co ´e alocado aleatoriamente ao tipo de pomada, ent˜ao cada

bra¸co ser´a uma unidade experimental.

Para o êxito de um experimento, é essencial planejá-lo. Escolher

cor-retamente quais fatores e seus respectivos n´ıveis, a unidade experimental, o n´umero

de observa¸c˜oes e repeti¸c˜oes de cada tratamento, a forma de controle de

variabili-dade exógena e a forma de aleatoriza¸cão para distribuir os tratamentos são itens que

(20)

7

plano dado ao experimento, o desenho do experimento, o esquema montado para que

seja entendido tecnicamente a realiza¸c˜ao do experimento.

2.1.1 Trˆes princ´ıpios da experimenta¸c˜ao

Os princ´ıpios b´asicos da experimenta¸c˜ao foram introduzidos ou pelo

menos formalizados nos trabalhos pioneiros de Fisher (1925), Fisher (1926) e Fisher

(1935) e são apresentados e explicados nos vários livros clássicos escritos por autores

consagrados na ´area, como Kempthorne (1952), Cochran & Cox (1957), Cox (1958),

Montgomery (2001), Box et al. (2005), Hinkelmann & Kempthorne (2005), Atkinson

et al. (2007), Bailey (2008), Hinkelmann & Kempthorne (2008), Wu & Hamada

(2009), entre outros.

Para assegurar a legitimidade da an´alise estat´ıstica dos resultados

ex-perimentais e aumentar sua precis˜ao, temos que planejar o experimento atentando

para três princ´ıpios básicos que são cruciais para qualquer experimento.

O primeiro princ´ıpio ´e da repeti¸c˜ao. Todo tratamento (ou pelo menos

alguns deles) devem ser aplicados a v´arias unidades experimentais, criando repeti¸c˜oes

dos tratamentos. Estas repeti¸c˜oes nos permitem estimar o erro aleat´orio

experimen-tal.

Para garantir a validade da an´alise dos resultados, temos o segundo

princ´ıpio, que ´e a aleatoriza¸c˜ao. Este princ´ıpio elimina qualquer subjetividade que

possa existir na distribui¸c˜ao dos tratamentos `as unidades experimentais, levando

a estimativas n˜ao viciadas dos efeitos dos tratamentos e da variabilidade do erro

experimental. Além do mais, o processo de aleatoriza¸cão gera uma popula¸cão de

experimentos que poderiam ser realizados, embora na pr´atica apenas um ´e realizado,

garantindo a validade dos testes realizados na an´alise dos resultados. Essa validade

não depende de suposi¸cões fortes ou complicadas sobre o processo de gera¸cão dos

dados, depende apenas do processo de aleatoriza¸c˜ao (Mead et al., 2012).

A redu¸c˜ao do erro experimental ´e um dos principais objetivos na

(21)

local. A aplica¸cão deste princ´ıpio pode ser via padroniza¸cão das condi¸cões externas

do experimento, tornando-as homogˆeneas ou via blocagem. A blocagem consiste em

dividir o conjunto total de unidades experimentais em subconjuntos chamados

blo-cos, de tal forma que cada bloco contenha unidades experimentais t˜ao homogˆeneas

quanto poss´ıvel. Desta forma, a compara¸c˜ao de tratamentos fica mais equilibrada,

eliminando o efeito causado pelas diferen¸cas entre as unidades experimentais. A

blocagem ´e determinada pelas condi¸c˜oes experimentais e pelos requisitos para a

sen-sibilidade desejada do experimento, por´em uma quantidade grande de blocos num

experimento irá torná-lo mais complexo para executá-lo e para analisar seus

resul-tados.

2.1.2 Experimentos fatoriais

A investiga¸c˜ao dos efeitos de dois ou mais fatores ´e alvo de estudo em

muitos experimentos nas ´areas biotecnol´ogicas, industriais, agr´ıcolas, entre outras.

Em um experimento fatorial, cada unidade experimental recebe uma combina¸c˜ao de

n´ıveis dos k fatores, chamada tratamento. Estes experimentos foram introduzidos

na d´ecada de 1930 com trabalhos de Fisher (1935) e Yates (1937) no contexto de

experimentos agronˆomicos.

O termo experimento fatorial aplica-se `a estrutura de tratamento

uti-lizada e n˜ao ao delineamento. Dessa forma, podemos ter um experimento fatorial

em delineamentos inteiramente aleatorizados, em delineamentos aleatorizados em

blocos, em delineamentos em linhas, colunas e outras estruturas. Por´em, nesta

pes-quisa ser´a utilizado experimentos nos quais o pespes-quisador pode controlar as condi¸c˜oes

experimentais, mantendo-as homogˆeneas, ou seja, delineamentos inteiramente

alea-torizados.

Em um experimento fatorial completo h´a pelo menos uma unidade

ex-perimental para cada poss´ıvel combina¸c˜ao de n´ıveis dos fatores. Por exemplo, na

agricultura é poss´ıvel estudar a influência das combina¸cões dos diferentes n´ıveis dos

(22)

concen-9

tra¸cão de nitrato de potássio (10 ml, 20 ml e 30 ml) na germina¸cão de sementes

de melancia. Os n´ıveis dos fatores irriga¸c˜ao e luminosidade podem ser classificados

como qualitativos, enquanto os n´ıveis do fator nitrato de pot´assio s˜ao

quantitati-vos. Um tratamento consiste em uma combina¸c˜ao dos n´ıveis de cada fator. Como

temos três n´ıveis de irriga¸cão, três n´ıveis de luminosidade e três n´ıveis de nitrato

de potássio, há, então, 3_×3_×3 = 33 _{= 27 diferentes tratamentos que devem ser}

testados para que este experimento seja completo. Nesta representa¸c˜ao, a base se

refere ao n´umero de n´ıveis e o expoente ao n´umero de fatores. Fisher reconheceu e

explicou as vantagens de se variar mais de um fator num mesmo experimento. Al´em

de mais econˆomico do que executar experimentos separados, um para cada fator, o

fatorial permite estima¸cão, além dos efeitos principais, das intera¸cões entre os

fato-res. Dizemos que dois fatores interagem quando o efeito de um deles ´e modificado

pela altera¸c˜ao nos n´ıveis do outro fator.

Para efeito de exemplifica¸c˜ao, vamos considerar k fatores, cada um

com 2 n´ıveis, ou seja, o fatorial 2k_{. Sob a suposi¸cão de que as observa¸cões são não}

correlacionados e tˆem variˆancias iguais, estes tratamentos fornecem estimativas dos

efeitos com variˆancia m´ınima independentes da m´edia e dos 2k₋_{1 efeitos:}

k efeitos principais,

k(k−1)

2 efeitos de intera¸c˜oes de dois fatores,

k(k−1)(k−2)

2·3 efeitos de intera¸c˜oes de trˆes fatores,

...

k(k−1)(k−1)·...·(k−h−1)

h! efeitos de intera¸c˜oes deh fatores,

...

1 efeito de intera¸c˜oes de k fatores,

Por exemplo, em um delineamento fatorial 24 _{completo, 16 efeitos}

po-dem ser estimados: a m´edia, 4 efeitos principais, 6 intera¸c˜oes de dois fatores, 4

(23)

Fatores quantitativos assumem valores (n´ıveis) em intervalos denotados

por ui,min ≤ ui ≤ ui,max, (i = 1, . . . , k), usualmente em escalas e/ou unidades de

medidas distintas. A fim de auxiliar a aprecia¸c˜ao do plano experimental e os c´alculos

de análise e interpreta¸cão dos resultados experimentais, é conveniente padronizar ou

codificar os n´ıveis de todos os fatores numa mesma escala, em geral, no intervalo

[₋1; 1]. Para a codifica¸cão, o cálculo é definido por

xi =

ui−ui0

∆i

(i= 1, . . . , k) (2)

em que

ui0 =

ui,min+ui,max

2 e ∆i =ui,max−ui0 =ui0−ui,min

Muitas vezes ´e desej´avel retornar aos valores originais dos fatores,

espe-cialmente para uso posterior dos resultados. O c´alculo para reverter a transforma¸c˜ao

(2) ´e dado por

ui =ui0+xi∆i (i= 1, . . . , k) (3)

Al´em desta forma de codifica¸c˜ao, existem outras formas utilizadas para

exibir os n´ıveis dos fatores de um delineamento fatorial 2k. A Tabela 1 apresenta um exemplo de quatro formas de codifica¸c˜ao para um experimento fatorial 23_.

A Codifica¸cão 1 apresentada na Tabela 1 é gerada pela Equa¸cão (2),

por´em, como este exemplo refere-se a um fatorial com 3 fatores e cada um com 2

n´ıveis, é óbvio que estes n´ıveis seriam ₋1 e 1. Uma outra forma de apresentar é

apenas citar que estamos nos referindo ao n´ıvel “baixo” ou ao n´ıvel “alto” do fator

(Codifica¸c˜ao 2). A Codifica¸c˜ao 3 apresenta os sinais “+” e “₋” respectivamente no

lugar de “1” e “₋1” visto na Codifica¸c˜ao 1. A Codifica¸c˜ao 4 mostra que um fator

está no n´ıvel alto através da letra minúscula deste fator e, caso este fator estiver no

n´ıvel baixo, esta situa¸cão é mostrada pela ausência da letra que representa o fator.

Quando todos os fatores estiverem no n´ıvel baixo, o tratamento ´e representado pelo

s´ımbolo “(1)”.

Quando os fatores s˜ao quantitativos, o delineamento experimental pode

(24)

11

Tabela 1. Formas de codifica¸c˜ao dos n´ıveis dos fatores e tratamentos em um

deline-amento fatorial 23_.

Codifica¸cão 1 Codifica¸cão 2 Codifica¸cão 3 Codifica¸cão 4

X1 X2 X3

1 1 1

1 1 ₋1

1 ₋1 1

1 ₋1 ₋1

−1 1 1 −1 1 ₋1 −1 ₋1 1 −1 ₋1 ₋1

X1 X2 X3

Alto Alto Alto

Alto Alto Baixo

Alto Baixo Alto

Alto Baixo Baixo

Baixo Alto Alto

Baixo Alto Baixo

Baixo Baixo Alto

Baixo Baixo Baixo

X1 X2 X3

+ + + + + ₋ + ₋ + + ₋ ₋ − + + − + ₋ − − + − − −

x1x2x3

x1x2

x1x3

x1

x2x3

x2

x3

(1)

ponto cujas coordenadas s˜ao os n´ıveis de cada fator. No exemplo de um experimento

fatorial 23 _{completo, temos 8 vértices e a representa¸cão geométrica segue na Figura}

2. O cubo formado constitui a região experimental. Para k >3, a região é formada

por um hiper-cubo. ´

E fácil perceber que aumentando o número de fatores e n´ıveis, o número

de tratamentos cresce drasticamente. Se inclu´ıssemos mais 2 fatores no exemplo da

melancia, cada um com 3 n´ıveis, ent˜ao passar´ıamos a ter 35 _{= 243 tratamentos}

distintos. Muitas vezes é inviável testar e avaliar um grande número de tratamentos

por motivos financeiros, de tempo ou porque o material experimental ´e limitado,

sendo necess´ario manter um equil´ıbrio entre o volume de informa¸c˜ao obtido e o

custo envolvido para o experimento. Dessa forma, são necessários métodos para

planejar experimentos utilizando apenas fra¸c˜oes dos poss´ıveis tratamentos de fatorial

completo, o que permite reduzir o n´umero de observa¸c˜oes e, consequentemente, o

custo de realiza¸c˜ao do experimento.

(25)

Figura 2 - Representa¸c˜ao geom´etrica de um experimento fatorial 23 _completo.

apareceram ap´os a dissemina¸c˜ao dos fatoriais. Finney (1945), motivado pelos

ar-gumentos de que, na prática, intera¸cões entre vários fatores não são considerados

relevantes, propôs métodos para a sele¸cão de fra¸cões do fatorial completo. Tais

fra¸c˜oes receberam o nome de regulares. Elas s˜ao obtidas escolhendo-se contrastes ou

efeitos que s˜ao deliberadamente confundidos ou insepar´aveis de outros. Em geral,

escolhem-se intera¸cões de alta ordem para a determina¸cão da fra¸cão a ser utilizada.

Uma vez escolhida a fra¸c˜ao, fica determinado um padr˜ao de confundimentos entre

os demais efeitos levando ao conceito de Resolu¸c˜ao. Box & Hunter (1961a) e Box &

Hunter (1961b) classificaram as fra¸cões úteis dos fatoriais 2k _{em Resolu¸cão} _III_,_IV_,

V e V I. Por exemplo, numa fra¸cão com Resolu¸cão III, efeitos principais estão, no

máximo, confundidos com intera¸cões de dois fatores, ou seja, não há confundimento

entre os efeitos principais. Já a fra¸cão com Resolu¸cão IV, efeitos principais não

são confundidos com intera¸cões de dois fatores, mas intera¸cões de dois fatores estão

confundidos entre si. Na Resolu¸c˜aoV, efeitos principais s´o podem estar confundidos

com intera¸cões de ordens superiores a 3 e as intera¸cões duplas não são

confundi-das entre si. Estes conceitos e métodos para sele¸cão de fra¸cões estão didaticamente

descritos em Box & Hunter (1961a), Box & Hunter (1961b) e Montgomery (2001).

(26)

13

na pr´atica, pois exige que o n´umero de unidades experimentais para fatoriais 2k _seja

potˆencia de base 2. Seu uso ´e mais comum nas fases iniciais da pesquisa na qual se faz

uma triagem dos fatores importantes no processo de interesse. Uma vez selecionados

os fatores potenciais, outro experimento ´e realizado, em geral, utilizando-se mais

que dois n´ıveis de cada fator, possibilitando o ajuste de modelos mais completos

e a estima¸c˜ao de combina¸c˜ao dos n´ıveis que otimiza alguma resposta de interesse.

Esta área de investiga¸cão recebe o nome de Métodos de Superf´ıcie de Resposta,

na qual faz-se extenso uso de ajuste de polinˆomios para aproximar a rela¸c˜ao entre

vari´aveis respostas e os fatores. Desta forma, o desenvolvimento de m´etodos para

sele¸cão do conjunto de combina¸cões do fatorial, que agora é, no m´ınimo, do tipo

3k _{´e considerado importante. Com esta estrutura de tratamento mais complexa, a}

metodologia para sele¸cão de fra¸cões é bem mais complicada e restritiva. Grandes

avan¸cos se deram com o trabalho de Box & Wilson (1951), que introduziram o

Delineamento Central Composto (DCC) e Box & Behnken (1960), com o popular

Delineamento Box-Behnken (DBB), ambos possibilitando grande redu¸c˜ao no n´umero

de tratamentos utilizados. Outras ideias surgiram com Draper (1985) que propˆos o

DCC de tamanho menor que o DCC padr˜ao. Tais alternativas foram estendidas para

outros delineamentos mais flex´ıveis e/ou eficientes com os delineamentos formados

por subconjuntos de 3k _{de Hoke (1974) e Gilmour (2006).}

Para fornecer uma ideia sobre como s˜ao formados o DCC, o DBB e

subsets em geral, vamos usar a nota¸c˜ao de subconjuntos de pontos do fatorial 3k

de Gilmour (2006). Seja Sr o subconjunto de tratamentos tais que cada um dos r

(r _≤ k) fatores aparecem nos n´ıveis extremos e k₋r s˜ao fixados em 0. Assim, o

subconjunto formado pelos 2k _{tratamentos ´e denotado por} _S

k, o tratamento que se

refere ao ponto central da regi˜ao experimental ´eS0 (todos os fatores fixados em zero)

e assim por diante. Por exemplo, para k = 3, S2 s˜ao os pontos m´edios das arestas

do cubo e S1 s˜ao os pontos centrais das faces. Tais pontos podem estar deslocados

para pertencer à superf´ıcie da esfera no caso da região experimental ser esférica. A

(27)

Tabela 2: Subconjuntos para 3 fatores

S3 S2 S1 S0

−1 ₋1 ₋1

1 ₋1 ₋1

−1 1 ₋1

1 1 ₋1

−1 ₋1 1

1 ₋1 1

−1 1 1

1 1 1

−α2 −α2 0

α2 −α2 0

−α2 α2 0

α2 α2 0

−α2 0 −α2

α2 0 −α2

−α2 0 α2

α2 0 α2

0 ₋α2 −α2

0 α2 −α2

0 ₋α2 α2

0 α2 α2

−α1 0 0

α1 0 0

0 ₋α1 0

0 α1 0

0 0 ₋α1

0 0 α1

0 0 0

Assim, o DCC ´e formado pelo subconjuntoSk(parte fatorial) acrescido

de S1 (pontos axiais) e algumas repeti¸c˜oes de S0 (ponto central). O DCC mais

econômico (small DCC) de Draper (1985) utiliza uma fra¸cão regular ao invés do

Sk completo. O DBB combina o 2k com um delineamento em blocos incompletos

para tratamentos n˜ao estruturados. Em cada bloco os tratamentos presentes s˜ao

substitu´ıdos por n´ıveis₋αi ou +αi, comi= 1,2 e os tratamentos ausentes s˜ao fixados

em 0. Por exemplo, para k = 3, o DBB ´e formado pelo subconjunto S2 acrescido

de algumas repeti¸cões de S0. A Figura 3 mostra a representa¸cão geométrica de um

experimento fatorial completo, DCC e DBB para 3 fatores.

Os métodos de constru¸cão de delineamentos ótimos cuja origem data

da d´ecada de 1940 (Wald, 1943; Chernoff, 1953; Kiefer, 1959) s˜ao alternativas muito

mais flex´ıveis e capazes de lidar com qualquer estrutura imposta pela pr´atica. No

contexto de experimentos fatoriais, a constru¸c˜ao de um delineamento ´otimo consiste

na sele¸c˜ao do subconjunto de tratamentos que otimiza alguma propriedade de

inte-resse relacionada `a an´alise estat´ıstica dos resultados experimentais. Essa metodologia

(28)

15

Figura 3 - Representa¸c˜ao geom´etrica de um experimento fatorial completo, DCC e

DBB para k = 3.

2.1.3 Propriedades de delineamento

Segundo Box & Draper (1975) e Box & Draper (1987), o delineamento

de um experimento deve:

1. Produzir dados informativos em toda a regi˜ao de interesse, sendo que essa

região não necessariamente coincida com a região do delineamento (cuboidal,

esf´erico, entre outros).

2. Assegurar que a resposta estimada ˆy(x) seja t˜ao pr´oxima quanto poss´ıvel do seu valor esperadoE(Y(x)) em x.

3. Permitir, se necess´ario, detectar poss´ıvel falta de ajuste.

4. Permitir estima¸c˜ao de transforma¸c˜oes da resposta e dos fatores experimentais

quantitativos.

5. Permitir que experimentos sejam realizados em blocos.

(29)

Por exemplo, um delineamento de segunda ordem é constru´ıdo após análise de

um experimento inicial de primeira ordem.

7. Fornecer uma estimativa n˜ao viciada de erro aleat´orio.

8. Ser robusto a presen¸ca de observa¸c˜oes estranhas e ser robustos a viola¸c˜oes das

suposi¸c˜oes do modelo normal usual.

9. Requerer um n´umero m´ınimo de ensaios experimentais.

10. Fornecer padr˜oes de dados simples que permitem visualiza¸c˜ao imediata.

11. Resultar em c´alculos simples.

12. Ser robusto a erros de medidas nas vari´aveis experimentais.

13. Não requerer um número impraticável de n´ıveis dos fatores.

14. Permitir um controle para manter a suposi¸c˜ao de “variˆancia constante”.

Obviamente, a relevância dos 14 pontos acima é relativa às

cir-cunstˆancias de cada caso. Por exemplo, a propriedade 11, que requer simplicidade

nos cálculos, não é muito importante se houver software dispon´ıvel, desde que seja

poss´ıvel verificar que todos os dados de entrada foram inseridos corretamente no

computador.

V´arias destas propriedades est˜ao relacionadas com ortogonalidade

en-tre os efeitos e/ou balanceamento, que foram consideradas importantes e ainda hoje,

se poss´ıvel, s˜ao desejadas, conforme destacado em Atkinson et al. (2007), que tamb´em

cita a propriedade de rotacionalidade para experimentos de superf´ıcie de resposta.

Um delineamento rotacional ´e aquele cujas variˆancias das respostas preditas depende

apenas da distˆancia do ponto ao centro da regi˜ao experimental, ou seja, independe

da dire¸c˜ao do ponto.

A ortogonalidade é uma propriedade útil e desejável para um

(30)

17

´e poss´ıvel analisar de forma simples as m´edias de tratamentos para efeito de

com-para¸cão e também realizar uma única análise de variância, com a soma de quadrados

sendo calculada facilmente. Muitos dos delineamentos cl´assicos existentes e mais

usa-dos s˜ao ortogonais, mas se a ortogonalidade n˜ao pode ser alcan¸cada, a procura por

um experimento balanceado (mesmo número de repeti¸cões para cada tratamento) é

frequente.

2.2 Modelo linear

O objetivo de um experimento ´e esclarecer o comportamento de um

sistema e estimar efeitos dos fatores experimentais, o que geralmente envolve o ajuste

de um modelo. A forma da verdadeira rela¸c˜ao entre resposta e fatores nem sempre

é conhecida e, assim, a alternativa é utilizar uma aproxima¸cão. Muitos problemas

podem ser adequadamente resolvidos ajustando-se um polinˆomio de baixa ordem.

O modelo de m´edias apresentado em (1) ´e um modelo geral para um

experimento em delineamento inteiramente casualizado comt tratamentos, cada um

comni repeti¸cões (i= 1,2, . . . , t). A única suposi¸cão inicial deste modelo é a de

adi-tividade entre a consequˆencia dos tratamentos e o componente aleat´orio. Associado

ao ajuste do modelo temos a an´alise de variˆancia que, de forma sucinta, pode ser

descrita como segue.

Observado osn resultados da vari´avel resposta y, a variabilidade total

presente (SQtotal) pode ser decomposta em duas partes: uma devido a efeitos de

tratamentos (SQtrat), comt−1 graus de liberdade, e a outra devido a variabilidade

aleat´oria (SQres), com n − t graus de liberdade. Sob as suposi¸c˜oes E(εij) = 0,

V(εij) = σ2 para i = 1, . . . , t ej = 1, . . . , ni,com∑ti=1ni = n e E(εij · εij′) =

0 (para j _̸= j′

) ´e sabido que s2 ₌ SQres

n₋t ´e uma estimativa n˜ao viciada de σ

2_.

Na literatura essa estimativa ´e chamada de estimativa do erro puro. Quando os

tratamentos são estruturados (fatorial) é mais apropriado reescrever a expressão em

(1) em componentes que representam efeitos principais e intera¸c˜oes entre os fatores.

(31)

e x2 com J n´ıveis, temos

yij =µij +εij =µ+αi+θj +γij+εij (4)

em que µé a média geral, αi é o efeito do i-ésimo n´ıvel do fator x1 (i = 1, . . . , I),

θj é o efeito doj-ésimo n´ıvel do fatorx2 (j = 1, . . . , J) e γij é o efeito da intera¸cão

entre o n´ıvel i dex1 e j dex2. Note que, neste caso,t=I×J.

Similarmente ao modelo anterior, a an´alise de variˆancia associada

re-sulta da decomposi¸c˜ao daSQtotal em variabilidade devido aos efeitos principais dex1

S(Qx1) comI−1 graus de liberdade, variabilidade devido aos efeitos principais dex2

(SQx2) com J−1 graus de liberdade, variabilidade devido aos efeitos de intera¸c˜oes

de x1x2 (SQx1x2) com (I −1)×(J −1) graus de liberdade e variabilidade devido

aos res´ıduos (SQres) com n−I ×J graus de liberdade, desde que pelo menos um

tratamento seja repetido. A variabilidade devido ao modelo completo ´e a soma das

variabilidades dos efeitos descritos (SQmod = SQx1 +SQx2 +SQx1x2), que, neste

caso, se iguala `a variabilidade de tratamentos descrita acima.

A estimativa de σ2 _{é idêntica à estimativa não viciada do modelo}

apre-sentado em (1), ent˜ao s2 = SQres

n₋I_×J. A estima¸c˜ao dos efeitos no modelo pode

ser obtida pelo Método de M´ınimos Quadrados dos erros cujas solu¸cões únicas são

obtidas após definir restri¸cões apropriadas sobre os parâmetros. Para mais de dois

fatores, o modelo ´e estendido acrescentando intera¸c˜oes de ordens superiores, entre

trˆes fatores, quatro fatores, ou mais.

Quando o experimento envolve repeti¸c˜oes de pelo menos um

trata-mento ´e poss´ıvel obter estimativa de erro puro. Por´em, uma desvantagem da

estru-tura fatorial é que o número de tratamentos cresce muito rápido quando aumentamos

o n´umero de fatores e nem sempre ´e poss´ıvel usar o fatorial completo e/ou repetir

tratamentos. Nestes casos, costuma-se utilizar os graus de liberdade das intera¸c˜oes

de alta ordem, consideradas n˜ao relevantes, para obter uma estimativa da

variabi-lidade do erro, estimativa esta denotada por s2

p. O ´ındice p ´e utilizado para deixar

claro que esta ´e uma estimativa do tipo pooled, ou seja, que agrupa a variabilidade

(32)

19

(2012), esta estimativa ´e viciada para σ2_.

Para fatores quantitativos temos interesse em simplificarµi do modelo

em (1) por uma superf´ıcie que, em geral, ´e aproximada por um polinˆomio de baixa

ordem. Assim,

µi =f′(xi)β i= 1, . . . , t, (5)

em que f é uma fun¸cão que expande xi = (x1i, x2i, . . . , xki)′ num vetor de dimensão

p de acordo com os termos do polinˆomio que se deseja ajustar e β ´e o vetor de

parâmetros do modelo de dimensão p (p < t). Usualmente, os elementos de β são o intercepto, os efeitos de algumas potências baixas dos x’s e intera¸cões. O modelo

de primeira ordem inclui intercepto e efeitos lineares. O modelo de segunda ordem

inclui intercepto, efeitos lineares, efeitos quadr´aticos e intera¸c˜oes lineares dos fatores

dois-a-dois. Estes modelos s˜ao os utilizados nos estudos de superf´ıcies de resposta,

sendo que o modelo de segunda ordem ´e inclusive chamado de modelo de superf´ıcie

de resposta. Qualquer modelo polinomial pode ser escrito na forma matricial do

modelo de regress˜ao dado por

Y =Xβ+ε (6)

em que Yé o vetor de respostas de dimensão n,X, com dimensãon_×p, é a matriz

de delineamento definida pelo modelo e pelo delineamento e ε ´e o vetor de erros

aleatórios de dimensão n. Note que cada linha de X é dada por f′ (xi).

Para ajustar um modelo de regress˜ao aos dados observados, basta

es-timar o vetor de parâmetros β. O problema é encontrar β tal queXβ seja próximo

de Y. Pelo M´etodo de M´ınimos Quadrados (MQ), encontramos β tal que a fun¸c˜ao

ε′

ε = (Y ₋Xβ)′

(Y ₋Xβ) ´e minimizada. Ao resolver este problema, obtemos a

solu¸c˜ao explicita dada por

ˆ

β = (X′

X)−1_X′

Y. (7)

Sob as condi¸c˜oes de Gauss-Markov, isto ´e, E(ε) = 0 e V(ε) = σ2_I_,

(33)

m´ınima e n˜ao viciado, pois E( ˆβ) = β. Temos tamb´em queV( ˆβ) = (X′

X)−1_σ2_{. Sob}

o conhecimento da distribui¸cão de probabilidade dos erros, o método de estima¸cão

preferido em Estat´ıstica ´e o de M´axima Verossimilhan¸ca (MV). No caso de

normali-dade dos erros (Draper & Smith, 1998; Faraway, 2004), ou seja, ε _∼N(0;Iσ2_{), este}

m´etodo produz os mesmos estimadores de β que o m´etodo de M´ınimos Quadrados

dos erros.

Realizar testes de hipóteses sobre os parâmetros do modelo é

extrema-mente ´util para as inferˆencias sobre os efeitos dos fatores e para a escolha do modelo

adequado. Para isso, considerando a normalidade dos erros, temos as hip´oteses

H0 : β1 = 0;β2 = 0;. . .;βp = 0

H1 : βj ̸= 0 para pelo menos um j,

que podem ser testadas pelo teste F da An´alise de Variˆancia (ANOVA) cuja

es-tat´ıstica do teste sob H0, ´e

F =

SQmod

p₋1

SQres

n₋p

∼F(p−1;n−p). (8)

Se o valor obtido para a estat´ıstica F for maior do que o valor do quantil de ordem

(1₋α) da distribui¸c˜ao F com p₋1 e n₋p graus de liberdade no numerador e no

denominador, respectivamente, ent˜ao rejeitamosH0 ao n´ıvel de α% de significˆancia.

Este teste ´e dito ser global, ou seja, testa a nulidade dos coeficientes de todas as

regressoras no modelo. Se H0 for rejeitada, temos evidˆencia de que pelo menos um

dos fatores ´e ´util para explicar Y linearmente.

Sob normalidade, temos tamb´em ˆβ _∼ N(β; (X′

X)−1_σ2_). _{O erro}

padrão de cada estimador ˆβj é σ√cjj, em que cjj é o j-ésimo elemento da

diago-nal de M−1 _{= (}_X′

X)−1_{, em que}_M _{tem dimens˜oes} _p_×_p _{e ´e chamada de matriz de}

informa¸cão. Então, as hipóteses

H0 : βj = 0

(34)

21

podem ser testadas pelo teste t dado por

T = βˆj−βj

s√cjj ∼

tn−p. (9)

Se o valor absoluto obtido para a estat´ısticaT for maior do que o valor do quantil de

ordem (1₋α/2) da distribui¸c˜ao tcom n₋pgraus de liberdade, ent˜ao rejeitamosH0

ao n´ıvel de 100_·α% de significˆancia. Este teste t´e dito ser individual ou parcial, ou

seja, testa a contribui¸cão daj-ésima variável regressora em particular após considerar

a contribui¸c˜ao de todas as outras no modelo.

Construir intervalos de confian¸ca (IC) e regi˜oes de confian¸ca para β ´e uma maneira de expressar a incerteza em nossas estimativas.

Podemos considerar individualmente cada parˆametro, o que leva ao IC

para βj com 100·(1−α)% de confian¸ca tendo a forma geral

ˆ

βj ± |t(α/2;n−p)|s√cjj. (10)

Quanto mais amplo o intervalo, maior a imprecis˜ao da estimativa. Note

que fixadosnep, a imprecisão só é reduzida diminuindo-se o valor√cjj, que depende

da matriz X′_X_.

No entanto, se constru´ırmos intervalos desse tipo para cada um dos p

parâmetros, o n´ıvel de confian¸ca não é (1₋α), mas sim próximo a (1₋α)p_{. Para}

contornar esta quest˜ao, podemos obter uma regi˜ao de confian¸ca conjunta para os p

parˆametros, formada pelo elips´oide, satisfazendo

( ˆβ₋β)′

X′

X( ˆβ₋β)

ps2 < F(1−α;p;n−p). (11)

Para o caso bidimensional e tridimensional é poss´ıvel visualiza¸cão gráfica do elipsóide.

Quanto maior o volume do elips´oide, maior a imprecis˜ao das estimativas. Note que

o volume do elips´oide depende da matriz X′

X.

Uma vez ajustado um modelo que se adequa aos dados, ´e poss´ıvel

utiliz´a-lo para predizer valores da resposta em qualquer ponto da regi˜ao de interesse.

(35)

em que

H=X(X′

X)−1_X′

(12)

é chamada de matriz de proje¸cão ou popularmente de matriz chapéu (hat) e é uma

matriz que projeta Y no espa¸co formado pelas colunas de X. A matriz H tem

dimensõesn_×n, é uma matriz simétrica (H=H′

), idempotente (H2 ₌_H_{), singular}

(_|H_|= 0), seu posto é igual ao seu tra¸co que é igual a p e a soma dos elementos de uma linha ou de uma coluna é 1.

2.3 Delineamentos ´

otimos de experimentos

A teoria de delineamentos ´otimos de experimentos foi formalizada por

Kiefer (1959) com o objetivo de buscar delineamentos que maximizem a informa¸c˜ao

a partir da otimiza¸c˜ao de propriedades ligadas aos estimadores de interesse.

De-lineamentos ´otimos s˜ao deDe-lineamentos experimentais baseados em um determinado

critério e são ótimos apenas para um modelo estat´ıstico espec´ıfico. O objetivo de

uma busca por um delineamento ótimo ou quase-ótimo é escolher n pontos de um

conjunto de N pontos poss´ıveis, chamados pontos candidatos (conjunto de todas as

poss´ıveis combina¸c˜oes dos n´ıveis dos fatores), de forma que alguma fun¸c˜ao da matriz

de informa¸cãoX′_X_{seja ótima, ou seja, buscar um delineamento ótimo significa} bus-car uma combina¸cão dentro da região experimental χ que otimize a fun¸cão critério.

Essa fun¸cão é definida através de um critério de otimalidade que são descritos na

pr´oxima se¸c˜ao.

2.3.1 Crit´erios de otimalidade

Os crit´erios de otimalidade, tamb´em originalmente chamados de

critérios alfabéticos de otimalidade (Kiefer, 1959; Atkinson et al., 2007) são, quase

sempre, estabelecidos por uma fun¸c˜ao da matriz de informa¸c˜ao M=X′

X ou de sua

inversaM−1 _{= (}_X′

X)−1_{, que é proporcional à matriz de covariâncias dos parâmetros}

(36)

23

simplicidade das express˜oes. Seja Ξ o conjunto de todos os poss´ıveis delineamentos

para um determinado experimento. Os crit´erios mais populares s˜ao:

A-otimalidade: Foi introduzido por Chernoff (1953) e ´e definido como max

X∈Ξ

1

tr_{(X′_X₎−1_} (13)

Usando a fun¸c˜ao crit´erio em (13), minimizamos o tra¸co da inversa da matriz de

informa¸cão, o que é equivalente a minimizar a variância média das estimativas

dos parˆametros do modelo ajustado. Esse crit´erio pode ser generalizado para

max

X∈Ξ

1

tr_{W(X′_X₎−1_}, (14)

em que W ´e uma matriz diagonal de pesos que podem ser atribu´ıdos aos

parˆametros de acordo com prioridades. Servem tamb´em para equilibrar a busca

quando as escalas relativas aos parˆametros s˜ao diferentes.

D-otimalidade: Wald (1943) introduziu este critério que tem sido considerado o mais importante e mais popular para constru¸cão de delineamentos ótimos. O

critério D, também conhecido como Critério do Determinante, é definido como

max

X∈Ξ {|X ′

X_|}1/p (15)

no qual maximizamos o determinante da matriz de informa¸c˜ao ou

minimi-zamos o determinante da inversa da matriz de informa¸c˜ao. A interpreta¸c˜ao

para este crit´erio ´e que, ao minimizar o determinante da inversa da matriz de

informa¸c˜ao, estamos minimizando a variˆancia generalizada dos estimadores dos

parˆametros e, dessa forma, minimizamos o volume do elips´oide de confian¸ca

dos p parˆametros, conforme Express˜ao (11).

DS-otimalidade: O crit´erio Ds ´e assim chamado por enfatizar o interesse na

es-tima¸c˜ao de um subconjunto de s parˆametros do vetor β (s < p). Seja

(37)

o vetor de (p₋s) parâmetros de perturba¸cão sem interesse primário. A matriz

de informa¸c˜ao de β pode ser escrita em blocos, como:

M=   M11 M12 M′ 12 M22   (16)

e sua inversa como

V=

 

V11 V12 V′

12 V22



 (17)

na qual V11 é a matriz de variância-covariância dos estimadores de θ₁. Por Atkinson et al. (2007), temos que V11 = (M11₋M12M−1

22M

′

12)

−1 _{e, portanto,}

para obter ˆθ₁ t˜ao preciso quanto poss´ıvel devemos obter X tal que max

X∈Ξ {|M11−CM22C

′

|}1/s (18)

em que Cé a solu¸cão da equa¸cãoCM22 =M12.

E-otimalidade: Foi introduzido por Ehrenfeld (1955) e ´e definido como max

X∈Ξ λmin(X ′

X). (19)

O crit´erio baseia-se em encontrar o delineamento que maximiza o menor

autovalor de (X′

X)−1_, _λ

min. O objetivo da E-otimalidade ´e minimizar a

variância máxima entre todas as poss´ıveis combina¸cões lineares normalizadas

das estimativas dos parˆametros, ou seja, minimizar a variˆancia do contraste

ou efeito mais impreciso do experimento.

G-otimalidade: O critério G consiste em determinar o delineamento para o qual a variância da previsão menos precisa, em toda a região experimental χ, será

m´ınima. A letra G do critério indica otimalidade global. Este critério é definido

como

min

X∈Ξ maxx∈χ

{

f(x)′ (X′

X)−1_f₍_x₎}

(38)

25

I-otimalidade: Este critério minimiza a variância média da resposta predita. Ele

tamb´em ´e chamado de Q-otimalidade, Iv-otimalidade ou V-otimalidade. O

crit´erioI-otimalidade ´e definido como

min

X∈Ξ

∫

x∈χ

f(x)′ (X′

X)−1

f(x)dx (21)

Uma forma de analisar os dados de um experimento ´e atrav´es de

in-tervalos ou regiões de confian¸ca e testes de hipóteses sobre os parâmetros do

mo-delo. Assim, o experimento deve ser planejado para garantir que esses procedimentos

serão tão informativos quanto poss´ıvel. Reconsiderando as expressões originais dos

critérios, nota-se que, para que as interpreta¸cões relacionadas com a inferência

este-jam de acordo, são necessárias algumas adapta¸cões nas expressões dos critérios. Estas

adapta¸c˜oes aos crit´erios, restringindo-se aos delineamentos inteiramente

aleatoriza-dos e aleatorizaaleatoriza-dos em blocos em modelos lineares, foram propostas por Gilmour &

Trinca (2012). Esses crit´erios modificados maximizam o poder dos testes de hip´oteses

e podem ser obtidos a partir de intervalos ou regi˜oes de confian¸ca.

Como visto, a justificativa da D-otimalidade ´e que este crit´erio

mini-miza o volume do elips´oide de confian¸ca dos p parˆametros. Draper & Smith (1998)

mostram que o volume ´e proporcional a_|X′

X_|−1/2_{. De fato, o volume ´e proporcional}

a

(F(1−α;p;d))p/2|X′X|−1/2, (22)

em que d ´e o n´umero de graus de liberdade para erro puro permitido pelo

deline-amento e F(1−α;p;d) ´e o quantil de ordem 1−α da distribui¸c˜ao F com p graus de

liberdade no numerador e d graus de liberdade no denominador. Ent˜ao o crit´erioD

minimizaria o volume se todos os delineamentos apresentassem o mesmo n´umero de

graus de liberdade para estima¸c˜ao de erro. Assim, o crit´erio DP ajustado para os

graus de liberdade (a letra “P” refere-se a erro puro) deve obter X tal que

max

X∈Ξ

{|X′

X_|}1/p

F(1−α;p;d)

(39)

Do mesmo modo, o crit´erio (DP)S para um subconjunto com s

parˆametros deve obter X tal que max

X∈Ξ

{|M11₋CM22C′ |}1/s

F(1−α;s;d)

. (24)

Em rela¸cão ao critério A, a modifica¸cão considera a média dos

qua-drados dos comprimentos dos intervalos de confian¸ca dos parˆametros, originando o

crit´erio AP, que deve obter X tal que max

X∈Ξ

1

F(1−α;1;d)tr{W(X′X)−1}

. (25)

em que W est´a definido na Equa¸c˜ao 13.

2.3.2 Crit´erios compostos

Na prática, os critérios de otimalidade apresentados na Se¸cão 2.3.1

foram desenvolvidos para atender os objetivos do pesquisador nas fases posteriores

ao planejamento de experimento. H´a casos em que o pesquisador necessitar´a de

mais de um crit´erio para encontrar o delineamento adequado para seu experimento.

Assim, os critérios compostos oferecem flexibilidade e eficácia para a constru¸cão de

delineamentos multiobjetivos, podendo englobar mais de um crit´erio de otimalidade,

cada um com peso refletindo a importˆancia relativa de cada objetivo do experimento

ou do pesquisador.

Gilmour & Trinca (2012) destacaram os seguintes procedimentos que,

em geral, s˜ao aplicados na an´alise dos resultados de um experimento de superf´ıcie

de resposta:

1. Teste F global sobre os efeitos dos tratamentos, para o qual devemos usar

(DP)S-otimalidade;

2. Teste t para efeitos individuais, para o qual devemos usar AP-otimalidade,

possivelmente na vers˜ao ponderada;

3. Estima¸c˜ao por ponto dos efeitos individuais, para o qual devemos usar A

(40)

27

4. Verificar a falta de ajuste do modelo simplificado e, se apropriado, inclus˜ao

de alguns termos de alta ordem no polinômio. A eficiência com rela¸cão ao

uso dos recursos experimentais, referida como eficiˆencia em termos de graus de

liberdade por Daniel (1976) foi utilizada neste quesito.

Desta forma, Gilmour & Trinca (2012) propuseram a fun¸c˜ao crit´erio

composta pelas propriedades a seguir:

X′Q0X

1

p−1 _crit´erio _D_,

1

tr_{W(X′_Q0X₎−1_} crit´erio A,

(

n₋d)

graus de liberdade,

X′Q0X

1

p−1

F(1−α1;p−1;d)

crit´erio DP,

1

F(1−α2;1;d)tr{W(X

′_Q0_X₎−1_} crit´erio AP.

em que Q0 =I− _n111′, de forma que o crit´erio considera o intercepto

do modelo como parâmetro de perturba¸cão e sem prioridade de estima¸cão.

Ao reunir as cinco propriedades listadas, Gilmour & Trinca (2012)

obtiveram a fun¸c˜ao crit´erio composta dada por

X′Q0X

κ1+κ4

p−1 (_n₋_d)κ3

[

F(1−α1;p−1;d)

]κ4[

F(1−α2;1;d)

]κ5[

tr_{W(X′_Q0X₎−1_}]κ2+κ5, (26) em que κ= (κ1, κ2, κ3, κ4, κ5) ´e vetor de pesos de prioridade de cada propriedade e

d ´e o n´umero de graus de liberdade de erro puro.

2.3.3 Algoritmo de troca

Uma maneira poss´ıvel de construir delineamentos ótimos é através da

(41)

de observa¸c˜oes, o modelo a ser utilizado e o crit´erio de otimalidade com seus pesos,

devemos construir todos os poss´ıveis delineamentos distintos e calcular o valor do

crit´erio para cada delineamento. Por´em, a quantidade de delineamentos distintos

depende do número de tratamentos e do número de observa¸cões do experimento.

Uma situa¸c˜ao hipot´etica em que temos 5 fatores com 3 n´ıveis cada um e um

expe-rimento com 24 observa¸c˜oes, geraria (35₎24_≈₁_,₈_×₁₀57 _{delineamentos, incluindo-se}

permuta¸cões entre linhas, ou seja, é inviável construir todos estes delineamentos para

verificar qual ´e o melhor (embora delineamentos distintos possam ter propriedades

equivalentes). Então, é preciso fazer uso de método inteligente e sistemático para

constru¸cão de delineamentos ótimos, como o algoritmo de troca, que é o método de

busca mais utilizado para construir delineamentos ´otimos exatos.

A ideia original do algoritmo de troca ´e de Fedorov (1972). Este

al-goritmo é um método heur´ıstico para buscar delineamentos D-ótimos, ou seja, um

procedimento para encontrar uma boa solu¸cão, não necessariamente a solu¸cão ótima

em rela¸cão ao critério D. Para iniciar a busca, é constru´ıdo, aleatoriamente ou não,

um delineamento inicial X n˜ao singular (_|X′_X

| >0). A matriz de informa¸cão X′_X e o valor do critério são calculados a partir do delineamento inicial. Uma das linhas

do delineamento ´e trocada por uma linha do conjunto de todos os poss´ıveis pontos

candidatos para o delineamento, formando um novo delineamento X1 com as

mes-mas dimensões de X. Seja f(xi) o ponto que é retirado da matriz de delineamento e f(x) o ponto adicionado. Neste novo delineamento, a matriz de informa¸cãoX′

1X1 e o

valor do critério são calculados novamente. Faz-se uma compara¸cão entre os valores

do crit´erio de ambos os delineamentos, escolhendo o melhor. Assim, come¸ca uma

nova itera¸cão até que ∆(xi,x), chamado de fun¸cão de Fedorov, seja menor queϵ, um

número pequeno e positivo. Esta fun¸cão é dada por

∆(xi,x) = f′

(x)M−1_f₍_x₎

−f′

(xi)M−1_f₍_xi_{) +}(

f′

(x)M−1_f₍_xi₎)2

−(

f′

(x)M−1_f₍_x₎) (

f′

(xi)M−1_f₍_xi₎)

.

(27)

Esse procedimento é repetido para um número pré-determinado de delineamentos

(42)

29

global e n˜ao apenas um ´otimo local.

Muitas vers˜oes modificadas do algoritmo de troca original de Fedorov

(1972) foram desenvolvidas e as mais conhecidas est˜ao descritas em Miller & Nguyen

(1992). Entre elas est˜ao as vers˜oes do algoritmo de troca de Mitchell (1974), Cook

& Nachtsheim (1980) e Atkinson & Donev (1989).

Mitchell (1974) generalizou o algoritmo de troca de Fedorov para

per-mitir “excurs˜oes”. Em cada itera¸c˜ao, h pontos podem ser adicionados no

delinea-mento com n pontos e h pontos s˜ao removidos dos (n+h) pontos do delineamento.

Ele chamou este algoritmo modificado de DETMAX. Quando h = 1, DETMAX se

torna o algoritmo de troca original. Quando h ´e grande, o tempo computacional

gasto ´e maior.

O algoritmo de Fedorov modificado por Cook & Nachtsheim (1980) foi

chamado de MFEA. Ele calcula a mesma quantidade de ∆’s em cada passo, mas

troca cada ponto f(xi) no delineamento pelo ponto candidato f(x) que maximiza

∆(xi,x). Este procedimento é, geralmente, tão confiável quanto o algoritmo de Fedorov original em encontrar o delineamento ótimo, mas pode ser até duas vezes

mais r´apido.

No KL-EA (KL-exchange algorithm), proposto por Atkinson &

Do-nev (1989), um ponto f(xk), com k _≤ K _≤ n, do delineamento e um ponto f(xl), com l _≤ L _≤ N, dos candidatos s˜ao trocados se ∆(xk,xl) for m´aximo. K

corres-ponde a K pontos do delineamento com menor f′

(xk)M−1_f₍_xk_{), que ´e a variˆancia}

de predi¸c˜ao do ponto k. L corresponde a L pontos dos N pontos candidatos com

maior f′

(xl)M−1_f₍_xl_{). Dessa forma, ´e escolhido retirar os pontos de maior variˆancia}

de predi¸cão e inserir os pontos de menor variância de predi¸cão. O processo de troca

para quando ∆(xk,xl) ´e menor que um n´umero escolhido pequeno e positivo. Quando

K =n e L=N, o KL-EA torna-se o algoritmo de troca original de Fedorov.

Para a busca de delineamentos utilizando os demais crit´erios de

otimali-dade, os algoritmos de troca de Cook & Nachtsheim (1989) e de Meyer & Nachtsheim

(43)

trabalho. Estes algoritmos s˜ao vers˜oes modificadas do algoritmo de troca de Fedorov

(1972) e s˜ao chamados de algoritmo de troca por ponto (point-exchange) e algoritmo

de troca por coordenada (Coordinate-Exchange), respectivamente.

Seguem os passos do algoritmo de troca por ponto implementado.

Passo 1: Definir o modelo, o número k de fatores, o número n de observa¸cões do experimento, os n´ıveis de cada fator, os vetores de pesosW(critério A ponde-rado) eκ (critério composto) e o número v de tentativas do algoritmo.

Passo 2: Criar a matriz de candidatos com todos os pontos xi poss´ıveis.

Passo 3: Criar um delineamento inicial (n˜ao singular) aleatoriamente.

Passo 4: Calcular M,_|M_|,M−1 _{e o valor do crit´erio composto para o delineamento}

inicial.

Passo 5: Realizar uma troca por ponto (linha), ou seja, fixa-se uma linha da matriz

X e troca-a por um ponto do conjunto candidato.

Passo 6: Atualizar _|M_| e M−1

pelas Equa¸c˜oes (41), (43) e (44) e calcular o valor

do crit´erio para este delineamento.

Passo 7: Se o valor do critério deste novo delineamento for maior do que o valor do critério do delineamento anterior, faz a troca efetivamente, senão, volta

ao delineamento anterior. Retornar ao Passo 5 enquanto as trocas estiverem

produzindo melhores valores no crit´erio do delineamento.

Passo 8: O delineamento encontrado é armazenado e uma nova busca é feita (re-tornar aoPasso 3) para que o valor do critério encontrado não seja um ótimo local. O retorno ao Passo 3é feito v vezes.

Para a vers˜ao do algoritmo de troca por coordenada, devemos

(44)

3 METODOLOGIA

Este trabalho foi iniciado com o estudo dos novos crit´erios de

otimali-dade formulados por Gilmour & Trinca (2012) e com a an´alise do algoritmo de troca

de Fedorov (1972) e suas vers˜oes modificadas ao longo do tempo para a constru¸c˜ao

de delineamentos ´otimos. Posteriormente, duas vers˜oes do algoritmo de troca foram

implementadas em linguagem C juntamente com um novo crit´erio para dar robustez

a perda de observa¸c˜oes.

3.1 Robustez a perda de observa¸

c˜

oes

Um problema comum na pesquisa estat´ıstica experimental ´e o impacto

nos resultados da an´alise estat´ıstica quando ocorre perda de observa¸c˜oes durante a

experimenta¸c˜ao. Se num experimento existir um grupo de observa¸c˜oes mais

influen-tes na an´alise que outros e se, por algum motivo alheio, algumas destas observa¸c˜oes

forem perdidas, as consequˆencias para a an´alise dos resultados do experimento

po-dem ser drásticas, chegando até à impossibilidade de ajuste do modelo pré-definido

devido a não estimabilidade de alguns parâmetros. Mesmo não havendo perda de

observa¸cões, a presen¸ca de observa¸cões influentes no ajuste do modelo é indesejada,

j´a que estimativas comandadas por alguns poucos pontos levantam suspeitas sobre

o modelo ajustado.

Na literatura não há um critério de otimalidade que dê robustez a um

experimento em rela¸cão a perda de observa¸cões. A nossa proposta é buscar um

deli-neamento ´otimo, incluindo no crit´erio de otimalidade uma propriedade para prevenir

(45)

razo-avelmente simples de influˆencia ´e dada pelos elementos da diagonal da matriz H, os

hii’s (i= 1, . . . , n), conforme a Equa¸c˜ao (12), pois estes elementos medem a influˆencia

de cada observa¸c˜ao no ajuste do modelo. De acordo com as propriedades da

ma-triz H, o delineamento ideal, segundo este critério, apresentaria todos os elementos iguais a p/n, já que são n elementos na diagonal e a soma deles é p. Assim,

explo-ramos minimizar∑n

i=1(hii−p/n)2, que significa minimizar a variabilidade dos hii’s,

tornando-os pr´oximos dep/n, e assim, minimizando a heterogeneidade da influˆencia

de cada observa¸cão do experimento. Este critério será chamado de H-otimalidade

em referˆencia `a matriz H.

Combinando as quatro propriedades consideradas por Gilmour &

Trinca (2012) e reproduzidas na se¸cão 2.3.2, o critério D pela sua importância e

o crit´erio H proposto nesta pesquisa, cada um associado a um peso de prioridade

de an´alise dado pelo vetor κ= (κ1, κ2, κ3, κ4, κ5, κ6)′, propomos o novo crit´erio

com-posto

X′Q0X

κ1+κ4

p−1 (_n₋_d)κ3

[

F(1−α1;p−1;d)

]κ4[

F(1−α2;1;d)

]κ5[

tr_{W(X′_Q0X₎−1_}]κ2+κ5[∑n

i=1(hii−p/n)2+δ

]κ₂6 ,

(28)

em queQ0 =I−_n111′, de forma que o crit´erio considera o intercepto do modelo como

parâmetro de perturba¸cão e sem prioridade de estima¸cão eδ foi fixado em 10−6 _para

evitar problemas num´ericos no caso de encontrar o delineamento ideal em rela¸c˜ao ao

crit´erio H.

3.2 Implementa¸c˜

ao do algoritmo de troca

Como foi visto na Equa¸cão (28), é necessário calcular o determinante e

a inversa da matriz de informa¸c˜ao para obter o valor do crit´erio do delineamento que

estamos buscando. Sabe-se que a eficiˆencia computacional destes c´alculos depende

da dimens˜ao da matriz. No caso, a matriz de informa¸c˜ao, M=X′

X, tem dimens˜ao

p_×p. Se o modelo escolhido tiver muitos parˆametros, ou seja, se p for grande, o