ROBUSTOS
Marcelo Andrade da Silva
Disserta¸c˜ao apresentada `a Universidade Es-tadual Paulista “J´ulio de Mesquita Filho” para a obten¸c˜ao do t´ıtulo de Mestre em Bio-metria.
BOTUCATU S˜ao Paulo - Brasil
CRIT´ERIOS COMPOSTOS PARA DELINEAMENTOS ´OTIMOS ROBUSTOS
Marcelo Andrade da Silva
Orientadora: Prof.a Dr.a Luzia Aparecida Trinca
Disserta¸c˜ao apresentada `a Universidade Es-tadual Paulista “J´ulio de Mesquita Filho” para a obten¸c˜ao do t´ıtulo de Mestre em Bio-metria.
BOTUCATU S˜ao Paulo - Brasil
FICHA CATALOGR ´AFICA ELABORADA PELA SEC¸ ˜AO T´EC. AQUIS. TRATAMENTO DA INFORM. DIVIS ˜AO DE BIBLIOTECA E DOCUMENTAC¸ ˜AO - CAMPUS DE BOTUCATU - UNESP BIBLIOTEC ´ARIA RESPONS ´AVEL: ROSEMEIRE APARECIDA VICENTE - CRB 8/5651
Silva, Marcelo Andrade.
Crit´erio composto para delineamentos ´otimos robustos / Marcelo Andrade da Silva. - Botucatu, 2014
Disserta¸c˜ao (mestrado) - Universidade Estadual Paulista, Instituto de Biociˆencias de Botucatu
Orientador: Luzia Aparecida Trinca Capes: 10202072
1. Biometria. 2. Planejamento experimental. 3. Programa¸c˜ao heur´ıstica. 4. Estat´ıstica matem´atica. 5. Programa¸c˜ao (Matem´atica).
Dedicat´
oria
Dedico aos meus pais
Ronaldo e Sonia
e tamb´em a minha
A Deus, por sua bondade, miseric´ordia e pelo seu infinito amor.
A minha fam´ılia, que deu suporte e insentivo para a realiza¸c˜ao deste
mestrado e a minha amada noiva, Raquel, pelo apoio, compreens˜ao e carinho.
A minha orientadora, professora Luzia Aparecida Trinca, pelo exemplo
de profissionalismo, pela paciˆencia, pelo tempo dedicado neste trabalho, pelos
con-selhos, entre muitas outras coisas, que foram fundamentais para o desenvolvimento
desta pesquisa.
A Universidade Estadual Paulista, Unesp, e ao Departamento de
Bio-estat´ıstica do Instituto de Biociˆencias de Botucatu pela estrutura, suporte t´ecnico e
secretaria.
Ao Programa de P´os-Gradua¸c˜ao em Biometria pela oportunidade dada
e confian¸ca depositada em mim para a realiza¸c˜ao do mestrado.
A Coordena¸c˜ao de Aperfei¸coamento de Pessoal de N´ıvel Superior,
CA-PES, pelo apoio financeiro durante o mestrado.
A todas as pessoas que direta ou indiretamente contribu´ıram para o
Sum´
ario
P´agina
LISTA DE FIGURAS vii
LISTA DE TABELAS viii
RESUMO ix
SUMMARY xi
1 INTRODUC¸ ˜AO 1
2 CONCEITOS B ´ASICOS E REVIS ˜AO DE
LITERATURA 5
2.1 Experimentos . . . 5
2.1.1 Trˆes princ´ıpios da experimenta¸c˜ao . . . 7
2.1.2 Experimentos fatoriais . . . 8
2.1.3 Propriedades de delineamento . . . 15
2.2 Modelo linear . . . 17
2.3 Delineamentos ´otimos de experimentos . . . 22
2.3.1 Crit´erios de otimalidade . . . 22
2.3.2 Crit´erios compostos . . . 26
2.3.3 Algoritmo de troca . . . 28
3.2 Implementa¸c˜ao do algoritmo de troca . . . 33
3.2.1 Atualiza¸c˜ao do determinante e da matriz inversa . . . 36
3.2.2 Algoritmo de troca por ponto e troca por coordenada . . . 37
4 RESULTADOS E DISCUSS ˜AO 38 4.1 Exemplo 1 (n= 16;k= 3;p= 10) . . . 40
4.2 Exemplo 2 (n= 24;k= 4;p= 11) . . . 44
4.3 Exemplo 3 (n= 24;k= 4;p= 15) . . . 45
4.4 Exemplo 4 (n= 36;k= 4;p= 15) . . . 50
5 CONCLUS ˜AO 54
Lista de Figuras
P´agina
1 Representa¸c˜ao esquem´atica de um experimento. . . 6
2 Representa¸c˜ao geom´etrica de um experimento fatorial 23 completo. . . . 12
3 Representa¸c˜ao geom´etrica de um experimento fatorial completo, DCC e
DBB para k= 3. . . 15
4 Comportamento da eficiˆencia de delineamentos ´otimos com a varia¸c˜ao no
peso da propriedade DP. . . 39
P´agina
1 Formas de codifica¸c˜ao dos n´ıveis dos fatores e tratamentos em um
deli-neamento fatorial 23. . . . 11
2 Subconjuntos para 3 fatores . . . 14
3 Delineamentos com modelo com efeitos principais, quadr´aticos e
in-tera¸c˜oes 2 a 2 (n= 16;k = 3;p= 10) . . . 42
4 Eficiˆencia do DCC e DBB comparado com um delineamento ´otimo . . . 44
5 Delineamentos com modelo com efeitos lineares e intera¸c˜oes 2 a 2 (n =
24;k = 4;p= 11) . . . 46
6 Delineamentos utilizando crit´erios unidimensionais na busca com modelo
com efeitos principais, quadr´aticos e intera¸c˜oes 2 a 2 (n= 24;k = 4;p= 15) 48
7 Delineamentos utilizando crit´erios compostos na busca com modelo com
efeitos principais, quadr´aticos e intera¸c˜oes 2 a 2 (n= 24;k = 4;p= 15) . 49
8 Eficiˆencia dos delineamentos apresentados em Ahmad & Gilmour (2010) 51
9 Delineamentos com modelo com efeitos principais, quadr´aticos e
CRIT´ERIOS COMPOSTOS PARA DELINEAMENTOS ´OTIMOS ROBUSTOS
Autor: MARCELO ANDRADE DA SILVA
Orientadora: Prof.a Dr.a LUZIA APARECIDA TRINCA
RESUMO
Neste trabalho propomos a incorpora¸c˜ao de uma propriedade
relacio-nada a robustez de delineamentos frente a perda de observa¸c˜oes em experimentos
fatoriais, a qual denominamos crit´erio H, na express˜ao de um crit´erio composto.
Para a otimiza¸c˜ao, implementamos duas vers˜oes modificadas do algoritmo de troca
de Fedorov (1972), que ´e um m´etodo heur´ıstico para encontrar delineamentos ´otimos
ou quase ´otimos exatos. Apresentamos quatro exemplos para examinar a
perfor-mance de delineamentos constru´ıdos com o novo crit´erio composto, os exemplos 1,
3 e 4 visam o modelo de segunda ordem completo e o exemplo 2 visa o modelo
de segunda ordem sem os efeitos quadr´aticos. Nos exemplos 1 e 3, para preservar
bom desempenho em outras propriedades, a eficiˆencia H n˜ao foi alta. Os resultados
obtidos no exemplo 2 mostraram grande contribui¸c˜ao do uso da propriedade H no
Em geral, o novo crit´erio composto produziu delineamentos mais
atra-tivos que os DP-´otimos de Gilmour & Trinca (2012), com valores deleverages mais
homogˆeneos, e portanto mais robustos `a perda de observa¸c˜oes. Produziu tamb´em
delineamentos com melhores propriedades do que os delineamentos constru´ıdos por
COMPOUND CRITERIA FOR ROBUST OPTIMUM DESIGNS
Author: MARCELO ANDRADE DA SILVA
Adviser: Prof.a Dr.a LUZIA APARECIDA TRINCA
SUMMARY
In this work we propose the use of a robustness measure to missing
data to construct designs for factorial experiments. The robustness property is
de-noted the H criterion and it is added to a compound design criterion expression.
Two versions of the modified exchange algorithm of Fedorov (1972) were
implemen-ted computationally for the search of exact optimum designs. Four examples are
presented, examples 1, 3 and 4 consider the full second-order model and example 2
considers second-order model excluding the quadratic effects. The examples 1 and
3, in order to preserve good efficiency with respect to other properties, their H
effi-ciency is not high. The results for example 2 showed good performance of the new
compound criterion since it produced designs high by efficient for all other properties.
In general, the new compound criterion produced more attractive
de-signs than the DP criterion of Gilmour & Trinca (2012) since their leverages were
designs were also more attractive than those constructed by subsets as in Ahmad &
1
INTRODUC
¸ ˜
AO
Nas ´areas biotecnol´ogicas, industriais, farmacˆeuticas, agr´ıcolas, entre
outras, muitas vezes ´e necess´ario obter informa¸c˜oes sobre produtos e processos
em-piricamente. Pessoas envolvidas com o problema em quest˜ao precisam planejar e
executar experimentos, coletar os resultados e analis´a-los. Experimentos s˜ao estudos
controlados com altera¸c˜oes deliberadas que s˜ao realizados para resolver problemas
de fabrica¸c˜ao ou produ¸c˜ao de material inerte ou biol´ogico, decidir entre diferentes
produtos ou metodologias, entender a influˆencia de determinados fatores, entre
ou-tros. Esta tarefa torna-se cada vez mais complexa e deve ser executada com muito
cuidado e aten¸c˜ao na medida que se intensifica a base tecnol´ogica dos produtos.
A teoria de delineamento de experimentos (em inglˆes, Design of
Expe-riments) inclui um conjunto de conceitos, princ´ıpios e metodologias para se planejar
pesquisas experimentais, buscando atender basicamente dois grandes objetivos: a
maior precis˜ao estat´ıstica poss´ıvel na resposta e o menor custo poss´ıvel na execu¸c˜ao
do experimento. Os primeiros registros de experimentos planejados datam da
se-gunda metade do s´eculo XIX no contexto de fertiliza¸c˜ao do solo e sele¸c˜ao de
va-riedades de importˆancia agr´ıcola na Inglaterra. A formaliza¸c˜ao e justificativas dos
princ´ıpios que validam os resultados experimentais surgiram com os valiosos
tra-balhos de Sir Ronald A. Fisher, matem´atico, estat´ıstico e geneticista, na primeira
metade do s´eculo XX, tanto para as pesquisas experimentais quanto para a ´area de
m´etodos estat´ısticos em geral.
A ´area de delineamentos ´otimos de experimentos teve grande impulso
com o trabalho de Kiefer (1959), que estruturou uma teoria de constru¸c˜ao de
parˆametros do modelo, recebendo o nome de Teoria de Delineamentos ´Otimos.
Kie-fer generalizou e formalizou matematicamente um problema que j´a havia permeado
a bibliografia com casos particulares (Student, 1917; Smith, 1918; Student, 1918
apud Atkinson & Bailey, 2001). A falta de recursos computacionais fez com que a aplica¸c˜ao desta teoria acontecesse apenas a partir de 1970.
A teoria de delineamentos ´otimos presume que a fun¸c˜ao matem´atica
(modelo) que relaciona a vari´avel resposta e os fatores ´e conhecida e apenas seus
parˆametros s˜ao desconhecidos. Os tratamentos e suas repeti¸c˜oes a serem utilizados
no experimento s˜ao escolhidos de forma a fornecerem o m´aximo de informa¸c˜ao sobre
os parˆametros desconhecidos. A formula¸c˜ao pode ser em dois contextos: assint´otico
e exato. No assint´otico, faz-se buscas em espa¸cos cont´ınuos, cuja otimalidade ´e
garantida para n, o tamanho do experimento, tendendo a ∞, em que o n´umero das
repeti¸c˜oes de tratamentos s˜ao traduzidos para pesos assumindo valores entre 0 e 1 que
integram a unidade. Os delineamentos obtidos s˜ao chamados de te´oricos, cont´ınuos
ou aproximados. No contexto exato, faz-se buscas em espa¸cos discretos, para n
finito e inteiro, no qual o n´umero de repeti¸c˜oes tamb´em ´e restrito ao conjunto dos
inteiros, cuja soma totaliza n. Os delineamentos obtidos s˜ao chamados de exatos ou
discretos. Este trabalho se restringe ao contexto exato. Para o modelo linear cl´assico
(Y =Xβ+ε), um delineamento ´otimo especifica a matriz de delineamento,X, de tal forma que alguma fun¸c˜ao de interesse deX′
Xseja otimizada. Essas fun¸c˜oes refletem os objetivos do experimento e s˜ao chamadas “fun¸c˜oes crit´erio”. Crit´erios compostos
de otimalidade incorporam m´ultiplos objetivos, de acordo com as necessidades do
pesquisador nas fases posteriores ao planejamento de experimento. ´
E consenso que a pesquisa experimental envolve v´arias etapas
impor-tantes sintetizadas a seguir.
Conhecimento da problem´atica: o planejamento para um experimento bem su-cedido requer a avalia¸c˜ao e utiliza¸c˜ao de toda a informa¸c˜ao pr´evia sobre o
3
Escolha de um modelo: delineamentos ´otimos experimentais dependem do mo-delo que relaciona a vari´avel resposta aos fatores. E preciso considerar o´
princ´ıpio da parsimˆonia na escolha de um modelo: simplicidade e utilidade
do modelo.
Delineamento do experimento: a escolha do delineamento ´e fundamental para que os aspectos de interesse do pesquisador sejam otimizados e, nas fases
pos-teriores ao planejamento de experimentos, venha atender os objetivos da
pes-quisa.
Condu¸c˜ao do experimento: o pesquisador deve acompanhar e conduzir o expe-rimento cuidadosamente para assegurar o cumpexpe-rimento ao plano estabelecido
previamente. Deve ser dado particular aten¸c˜ao `a precis˜ao e `a acur´acia dos
processos de mensura¸c˜ao.
An´alise dos dados: quase sempre ´e necess´ario uma investiga¸c˜ao preliminar gr´afica e uma an´alise estat´ıstica mais formal produzindo estimativas dos parˆametros
e intervalos de confian¸ca associados.
A experimenta¸c˜ao ´e iterativa. As etapas apresentadas sugerem um caminho direto
a partir da formula¸c˜ao do problema at´e a solu¸c˜ao. No entanto, em cada etapa, o
pesquisador pode ter que reconsiderar as decis˜oes tomadas em fases anteriores da
investiga¸c˜ao. Problemas que surgem em est´agios intermedi´arios podem adicionar `a
eventual compreens˜ao do problema.
Na pr´atica, durante a execu¸c˜ao do experimento pode ocorrer perda de
observa¸c˜oes devido a situa¸c˜oes inesperadas. Observa¸c˜oes perdidas podem produzir
estimativas tendenciosas, ou seja, resultados distorcidos, ou at´e mesmo n˜ao permitir
a estimabilidade de alguns parˆametros do modelo pr´e-definido. Observa¸c˜oes que
desempenham papel muito influente no ajuste do modelo tamb´em n˜ao s˜ao desejadas
na modelagem estat´ıstica em geral. Delineamentos robustos `a perda de observa¸c˜oes
s˜ao atraentes, j´a que s˜ao mais confi´aveis para o pesquisador. A teoria de modelos
neste quesito deve apresentar homogeneidade nos valores de tais medidas. Dessa
forma, propomos um crit´erio de otimalidade com o objetivo de buscar delineamentos
formados por tratamentos que n˜ao se destacam em termos de influˆencia.
Na literatura, o m´etodo de busca mais conhecido e usado para
cons-truir delineamentos ´otimos exatos ´e o algoritmo de troca (exchange). Proposto por
Fedorov (1972), este m´etodo ´e uma heur´ıstica de otimiza¸c˜ao que consiste em, a partir
de um delineamento inicial, realizar trocas, substituindo seus pontos por pontos
can-didatos at´e a melhora no valor do crit´erio cessar. Usualmente, a implementa¸c˜ao do
algoritmo de troca ´e realizada em software estat´ısticos, como, por exemplo, R Core
Team (2013) ou SAS/IML de SAS Institute Inc. (2007), por´em, para
experimen-tos com n´umero de fatores e n´ıveis elevados, exige-se uma eficiˆencia computacional
alta. Por este motivo a implementa¸c˜ao deste m´etodo foi feita em linguagem C.
Exis-tem tamb´em procedimentos autom´aticos para constru¸c˜ao de delineamentos ´otimos
utilizando crit´erios usuais como o PROC OPTEX/SAS e o pacote algdesign no R.
Este trabalho est´a dividido da seguinte forma: no Cap´ıtulo 2 s˜ao
abordados alguns fundamentos b´asicos de experimentos, experimentos fatoriais,
es-tima¸c˜ao de parˆametros para modelos lineares, a teoria de delineamentos ´otimos de
experimentos e uma revis˜ao de algumas vers˜oes do algoritmo de troca que h´a na
literatura; no Cap´ıtulo 3 ´e apresentada a proposta de um novo crit´erio de
otima-lidade, a utiliza¸c˜ao de crit´erios compostos para a busca de delineamentos ´otimos e
detalhes dos algoritmos implementados neste trabalho; os resultados s˜ao
apresenta-dos no Cap´ıtulo 4 atrav´es de quatro exemplos e as conclus˜oes deste trabalho est˜ao
2
CONCEITOS B ´
ASICOS E REVIS ˜
AO DE
LITERATURA
2.1
Experimentos
Experimentos s˜ao realizados por pesquisadores em praticamente todas
as ´areas do conhecimento com o objetivo de investigar as rela¸c˜oes de causa e efeito
de uma determinada situa¸c˜ao de interesse. Literalmente, um experimento ´e um teste
que envolve uma altera¸c˜ao deliberada e uma leitura das consequˆencias. Mais
formal-mente, podemos definir um experimento como um teste ou uma sucess˜ao de testes
em que as altera¸c˜oes propositais s˜ao feitas nas chamadas vari´aveis independentes ou
fatores em condi¸c˜oes experimentais adequadas, para que possamos observar e
iden-tificar quais vari´aveis independentes ou fatores causam as mudan¸cas nas vari´aveis
respostas, as consequˆencias.
A Figura 1 ´e uma representa¸c˜ao em esquema de um experimento. O
processo consiste em medir os valores das h respostas, denotadas por y1, . . . , yh.
Estas vari´aveis s˜ao dependentes dos k fatores u1, . . . , uk, cujos valores s˜ao
previa-mente prescritos pelo delineamento experimental. Os valores das respostas podem
tamb´em depender de r vari´aveis concomitantes z1, . . . , zr que podem, ou n˜ao, ser
conhecidos pelo pesquisador. A rela¸c˜ao entre os fatores u’s e as respostas medidas
y’s ´e modificada pela presen¸ca de outros fatores desconhecidos e/ou de importˆancia
pouco relevante considerados erros aleat´orios, representados porε’s. Tal modifica¸c˜ao
´e suposta ser aditiva e, ent˜ao, matematicamente, podemos escrever
Figura 1 - Representa¸c˜ao esquem´atica de um experimento.
em que µi ´e a esperan¸ca de Yij, ou seja, da resposta aleat´oria quando o tratamento
ui = (u1, . . . , uk)′´e aplicado naj-´esima unidade parai= 1,2, . . . , tej = 1,2, . . . , ni,
com ∑t
i=1ni =n.
Em todo experimento, a unidade experimental deve estar identificada.
A unidade experimental ´e a por¸c˜ao do material experimental para a qual o tratamento
´e atribu´ıdo e aplicado. Para ilustrar este conceito, vamos imaginar, por exemplo,
que se alguns tipos de drogas s˜ao testados em um grupo de pessoas e cada pessoa
´e alocada aleatoriamente `a determinada droga, ent˜ao cada pessoa ´e uma unidade
experimental. Se, por outro lado, alguns tipos de pomadas forem testados em cada
bra¸co, sendo que cada bra¸co ´e alocado aleatoriamente ao tipo de pomada, ent˜ao cada
bra¸co ser´a uma unidade experimental.
Para o ˆexito de um experimento, ´e essencial planej´a-lo. Escolher
cor-retamente quais fatores e seus respectivos n´ıveis, a unidade experimental, o n´umero
de observa¸c˜oes e repeti¸c˜oes de cada tratamento, a forma de controle de
variabili-dade ex´ogena e a forma de aleatoriza¸c˜ao para distribuir os tratamentos s˜ao itens que
7
plano dado ao experimento, o desenho do experimento, o esquema montado para que
seja entendido tecnicamente a realiza¸c˜ao do experimento.
2.1.1 Trˆes princ´ıpios da experimenta¸c˜ao
Os princ´ıpios b´asicos da experimenta¸c˜ao foram introduzidos ou pelo
menos formalizados nos trabalhos pioneiros de Fisher (1925), Fisher (1926) e Fisher
(1935) e s˜ao apresentados e explicados nos v´arios livros cl´assicos escritos por autores
consagrados na ´area, como Kempthorne (1952), Cochran & Cox (1957), Cox (1958),
Montgomery (2001), Box et al. (2005), Hinkelmann & Kempthorne (2005), Atkinson
et al. (2007), Bailey (2008), Hinkelmann & Kempthorne (2008), Wu & Hamada
(2009), entre outros.
Para assegurar a legitimidade da an´alise estat´ıstica dos resultados
ex-perimentais e aumentar sua precis˜ao, temos que planejar o experimento atentando
para trˆes princ´ıpios b´asicos que s˜ao cruciais para qualquer experimento.
O primeiro princ´ıpio ´e da repeti¸c˜ao. Todo tratamento (ou pelo menos
alguns deles) devem ser aplicados a v´arias unidades experimentais, criando repeti¸c˜oes
dos tratamentos. Estas repeti¸c˜oes nos permitem estimar o erro aleat´orio
experimen-tal.
Para garantir a validade da an´alise dos resultados, temos o segundo
princ´ıpio, que ´e a aleatoriza¸c˜ao. Este princ´ıpio elimina qualquer subjetividade que
possa existir na distribui¸c˜ao dos tratamentos `as unidades experimentais, levando
a estimativas n˜ao viciadas dos efeitos dos tratamentos e da variabilidade do erro
experimental. Al´em do mais, o processo de aleatoriza¸c˜ao gera uma popula¸c˜ao de
experimentos que poderiam ser realizados, embora na pr´atica apenas um ´e realizado,
garantindo a validade dos testes realizados na an´alise dos resultados. Essa validade
n˜ao depende de suposi¸c˜oes fortes ou complicadas sobre o processo de gera¸c˜ao dos
dados, depende apenas do processo de aleatoriza¸c˜ao (Mead et al., 2012).
A redu¸c˜ao do erro experimental ´e um dos principais objetivos na
local. A aplica¸c˜ao deste princ´ıpio pode ser via padroniza¸c˜ao das condi¸c˜oes externas
do experimento, tornando-as homogˆeneas ou via blocagem. A blocagem consiste em
dividir o conjunto total de unidades experimentais em subconjuntos chamados
blo-cos, de tal forma que cada bloco contenha unidades experimentais t˜ao homogˆeneas
quanto poss´ıvel. Desta forma, a compara¸c˜ao de tratamentos fica mais equilibrada,
eliminando o efeito causado pelas diferen¸cas entre as unidades experimentais. A
blocagem ´e determinada pelas condi¸c˜oes experimentais e pelos requisitos para a
sen-sibilidade desejada do experimento, por´em uma quantidade grande de blocos num
experimento ir´a torn´a-lo mais complexo para execut´a-lo e para analisar seus
resul-tados.
2.1.2 Experimentos fatoriais
A investiga¸c˜ao dos efeitos de dois ou mais fatores ´e alvo de estudo em
muitos experimentos nas ´areas biotecnol´ogicas, industriais, agr´ıcolas, entre outras.
Em um experimento fatorial, cada unidade experimental recebe uma combina¸c˜ao de
n´ıveis dos k fatores, chamada tratamento. Estes experimentos foram introduzidos
na d´ecada de 1930 com trabalhos de Fisher (1935) e Yates (1937) no contexto de
experimentos agronˆomicos.
O termo experimento fatorial aplica-se `a estrutura de tratamento
uti-lizada e n˜ao ao delineamento. Dessa forma, podemos ter um experimento fatorial
em delineamentos inteiramente aleatorizados, em delineamentos aleatorizados em
blocos, em delineamentos em linhas, colunas e outras estruturas. Por´em, nesta
pes-quisa ser´a utilizado experimentos nos quais o pespes-quisador pode controlar as condi¸c˜oes
experimentais, mantendo-as homogˆeneas, ou seja, delineamentos inteiramente
alea-torizados.
Em um experimento fatorial completo h´a pelo menos uma unidade
ex-perimental para cada poss´ıvel combina¸c˜ao de n´ıveis dos fatores. Por exemplo, na
agricultura ´e poss´ıvel estudar a influˆencia das combina¸c˜oes dos diferentes n´ıveis dos
concen-9
tra¸c˜ao de nitrato de pot´assio (10 ml, 20 ml e 30 ml) na germina¸c˜ao de sementes
de melancia. Os n´ıveis dos fatores irriga¸c˜ao e luminosidade podem ser classificados
como qualitativos, enquanto os n´ıveis do fator nitrato de pot´assio s˜ao
quantitati-vos. Um tratamento consiste em uma combina¸c˜ao dos n´ıveis de cada fator. Como
temos trˆes n´ıveis de irriga¸c˜ao, trˆes n´ıveis de luminosidade e trˆes n´ıveis de nitrato
de pot´assio, h´a, ent˜ao, 3×3×3 = 33 = 27 diferentes tratamentos que devem ser
testados para que este experimento seja completo. Nesta representa¸c˜ao, a base se
refere ao n´umero de n´ıveis e o expoente ao n´umero de fatores. Fisher reconheceu e
explicou as vantagens de se variar mais de um fator num mesmo experimento. Al´em
de mais econˆomico do que executar experimentos separados, um para cada fator, o
fatorial permite estima¸c˜ao, al´em dos efeitos principais, das intera¸c˜oes entre os
fato-res. Dizemos que dois fatores interagem quando o efeito de um deles ´e modificado
pela altera¸c˜ao nos n´ıveis do outro fator.
Para efeito de exemplifica¸c˜ao, vamos considerar k fatores, cada um
com 2 n´ıveis, ou seja, o fatorial 2k. Sob a suposi¸c˜ao de que as observa¸c˜oes s˜ao n˜ao
correlacionados e tˆem variˆancias iguais, estes tratamentos fornecem estimativas dos
efeitos com variˆancia m´ınima independentes da m´edia e dos 2k−1 efeitos:
k efeitos principais,
k(k−1)
2 efeitos de intera¸c˜oes de dois fatores,
k(k−1)(k−2)
2·3 efeitos de intera¸c˜oes de trˆes fatores,
...
k(k−1)(k−1)·...·(k−h−1)
h! efeitos de intera¸c˜oes deh fatores,
...
1 efeito de intera¸c˜oes de k fatores,
Por exemplo, em um delineamento fatorial 24 completo, 16 efeitos
po-dem ser estimados: a m´edia, 4 efeitos principais, 6 intera¸c˜oes de dois fatores, 4
Fatores quantitativos assumem valores (n´ıveis) em intervalos denotados
por ui,min ≤ ui ≤ ui,max, (i = 1, . . . , k), usualmente em escalas e/ou unidades de
medidas distintas. A fim de auxiliar a aprecia¸c˜ao do plano experimental e os c´alculos
de an´alise e interpreta¸c˜ao dos resultados experimentais, ´e conveniente padronizar ou
codificar os n´ıveis de todos os fatores numa mesma escala, em geral, no intervalo
[−1; 1]. Para a codifica¸c˜ao, o c´alculo ´e definido por
xi =
ui−ui0
∆i
(i= 1, . . . , k) (2)
em que
ui0 =
ui,min+ui,max
2 e ∆i =ui,max−ui0 =ui0−ui,min
Muitas vezes ´e desej´avel retornar aos valores originais dos fatores,
espe-cialmente para uso posterior dos resultados. O c´alculo para reverter a transforma¸c˜ao
(2) ´e dado por
ui =ui0+xi∆i (i= 1, . . . , k) (3)
Al´em desta forma de codifica¸c˜ao, existem outras formas utilizadas para
exibir os n´ıveis dos fatores de um delineamento fatorial 2k. A Tabela 1 apresenta um exemplo de quatro formas de codifica¸c˜ao para um experimento fatorial 23.
A Codifica¸c˜ao 1 apresentada na Tabela 1 ´e gerada pela Equa¸c˜ao (2),
por´em, como este exemplo refere-se a um fatorial com 3 fatores e cada um com 2
n´ıveis, ´e ´obvio que estes n´ıveis seriam −1 e 1. Uma outra forma de apresentar ´e
apenas citar que estamos nos referindo ao n´ıvel “baixo” ou ao n´ıvel “alto” do fator
(Codifica¸c˜ao 2). A Codifica¸c˜ao 3 apresenta os sinais “+” e “−” respectivamente no
lugar de “1” e “−1” visto na Codifica¸c˜ao 1. A Codifica¸c˜ao 4 mostra que um fator
est´a no n´ıvel alto atrav´es da letra min´uscula deste fator e, caso este fator estiver no
n´ıvel baixo, esta situa¸c˜ao ´e mostrada pela ausˆencia da letra que representa o fator.
Quando todos os fatores estiverem no n´ıvel baixo, o tratamento ´e representado pelo
s´ımbolo “(1)”.
Quando os fatores s˜ao quantitativos, o delineamento experimental pode
11
Tabela 1. Formas de codifica¸c˜ao dos n´ıveis dos fatores e tratamentos em um
deline-amento fatorial 23.
Codifica¸c˜ao 1 Codifica¸c˜ao 2 Codifica¸c˜ao 3 Codifica¸c˜ao 4
X1 X2 X3
1 1 1
1 1 −1
1 −1 1
1 −1 −1
−1 1 1 −1 1 −1 −1 −1 1 −1 −1 −1
X1 X2 X3
Alto Alto Alto
Alto Alto Baixo
Alto Baixo Alto
Alto Baixo Baixo
Baixo Alto Alto
Baixo Alto Baixo
Baixo Baixo Alto
Baixo Baixo Baixo
X1 X2 X3
+ + + + + − + − + + − − − + + − + − − − + − − −
x1x2x3
x1x2
x1x3
x1
x2x3
x2
x3
(1)
ponto cujas coordenadas s˜ao os n´ıveis de cada fator. No exemplo de um experimento
fatorial 23 completo, temos 8 v´ertices e a representa¸c˜ao geom´etrica segue na Figura
2. O cubo formado constitui a regi˜ao experimental. Para k >3, a regi˜ao ´e formada
por um hiper-cubo. ´
E f´acil perceber que aumentando o n´umero de fatores e n´ıveis, o n´umero
de tratamentos cresce drasticamente. Se inclu´ıssemos mais 2 fatores no exemplo da
melancia, cada um com 3 n´ıveis, ent˜ao passar´ıamos a ter 35 = 243 tratamentos
distintos. Muitas vezes ´e invi´avel testar e avaliar um grande n´umero de tratamentos
por motivos financeiros, de tempo ou porque o material experimental ´e limitado,
sendo necess´ario manter um equil´ıbrio entre o volume de informa¸c˜ao obtido e o
custo envolvido para o experimento. Dessa forma, s˜ao necess´arios m´etodos para
planejar experimentos utilizando apenas fra¸c˜oes dos poss´ıveis tratamentos de fatorial
completo, o que permite reduzir o n´umero de observa¸c˜oes e, consequentemente, o
custo de realiza¸c˜ao do experimento.
Figura 2 - Representa¸c˜ao geom´etrica de um experimento fatorial 23 completo.
apareceram ap´os a dissemina¸c˜ao dos fatoriais. Finney (1945), motivado pelos
ar-gumentos de que, na pr´atica, intera¸c˜oes entre v´arios fatores n˜ao s˜ao considerados
relevantes, propˆos m´etodos para a sele¸c˜ao de fra¸c˜oes do fatorial completo. Tais
fra¸c˜oes receberam o nome de regulares. Elas s˜ao obtidas escolhendo-se contrastes ou
efeitos que s˜ao deliberadamente confundidos ou insepar´aveis de outros. Em geral,
escolhem-se intera¸c˜oes de alta ordem para a determina¸c˜ao da fra¸c˜ao a ser utilizada.
Uma vez escolhida a fra¸c˜ao, fica determinado um padr˜ao de confundimentos entre
os demais efeitos levando ao conceito de Resolu¸c˜ao. Box & Hunter (1961a) e Box &
Hunter (1961b) classificaram as fra¸c˜oes ´uteis dos fatoriais 2k em Resolu¸c˜ao III,IV,
V e V I. Por exemplo, numa fra¸c˜ao com Resolu¸c˜ao III, efeitos principais est˜ao, no
m´aximo, confundidos com intera¸c˜oes de dois fatores, ou seja, n˜ao h´a confundimento
entre os efeitos principais. J´a a fra¸c˜ao com Resolu¸c˜ao IV, efeitos principais n˜ao
s˜ao confundidos com intera¸c˜oes de dois fatores, mas intera¸c˜oes de dois fatores est˜ao
confundidos entre si. Na Resolu¸c˜aoV, efeitos principais s´o podem estar confundidos
com intera¸c˜oes de ordens superiores a 3 e as intera¸c˜oes duplas n˜ao s˜ao
confundi-das entre si. Estes conceitos e m´etodos para sele¸c˜ao de fra¸c˜oes est˜ao didaticamente
descritos em Box & Hunter (1961a), Box & Hunter (1961b) e Montgomery (2001).
13
na pr´atica, pois exige que o n´umero de unidades experimentais para fatoriais 2k seja
potˆencia de base 2. Seu uso ´e mais comum nas fases iniciais da pesquisa na qual se faz
uma triagem dos fatores importantes no processo de interesse. Uma vez selecionados
os fatores potenciais, outro experimento ´e realizado, em geral, utilizando-se mais
que dois n´ıveis de cada fator, possibilitando o ajuste de modelos mais completos
e a estima¸c˜ao de combina¸c˜ao dos n´ıveis que otimiza alguma resposta de interesse.
Esta ´area de investiga¸c˜ao recebe o nome de M´etodos de Superf´ıcie de Resposta,
na qual faz-se extenso uso de ajuste de polinˆomios para aproximar a rela¸c˜ao entre
vari´aveis respostas e os fatores. Desta forma, o desenvolvimento de m´etodos para
sele¸c˜ao do conjunto de combina¸c˜oes do fatorial, que agora ´e, no m´ınimo, do tipo
3k ´e considerado importante. Com esta estrutura de tratamento mais complexa, a
metodologia para sele¸c˜ao de fra¸c˜oes ´e bem mais complicada e restritiva. Grandes
avan¸cos se deram com o trabalho de Box & Wilson (1951), que introduziram o
Delineamento Central Composto (DCC) e Box & Behnken (1960), com o popular
Delineamento Box-Behnken (DBB), ambos possibilitando grande redu¸c˜ao no n´umero
de tratamentos utilizados. Outras ideias surgiram com Draper (1985) que propˆos o
DCC de tamanho menor que o DCC padr˜ao. Tais alternativas foram estendidas para
outros delineamentos mais flex´ıveis e/ou eficientes com os delineamentos formados
por subconjuntos de 3k de Hoke (1974) e Gilmour (2006).
Para fornecer uma ideia sobre como s˜ao formados o DCC, o DBB e
subsets em geral, vamos usar a nota¸c˜ao de subconjuntos de pontos do fatorial 3k
de Gilmour (2006). Seja Sr o subconjunto de tratamentos tais que cada um dos r
(r ≤ k) fatores aparecem nos n´ıveis extremos e k−r s˜ao fixados em 0. Assim, o
subconjunto formado pelos 2k tratamentos ´e denotado por S
k, o tratamento que se
refere ao ponto central da regi˜ao experimental ´eS0 (todos os fatores fixados em zero)
e assim por diante. Por exemplo, para k = 3, S2 s˜ao os pontos m´edios das arestas
do cubo e S1 s˜ao os pontos centrais das faces. Tais pontos podem estar deslocados
para pertencer `a superf´ıcie da esfera no caso da regi˜ao experimental ser esf´erica. A
Tabela 2: Subconjuntos para 3 fatores
S3 S2 S1 S0
−1 −1 −1
1 −1 −1
−1 1 −1
1 1 −1
−1 −1 1
1 −1 1
−1 1 1
1 1 1
−α2 −α2 0
α2 −α2 0
−α2 α2 0
α2 α2 0
−α2 0 −α2
α2 0 −α2
−α2 0 α2
α2 0 α2
0 −α2 −α2
0 α2 −α2
0 −α2 α2
0 α2 α2
−α1 0 0
α1 0 0
0 −α1 0
0 α1 0
0 0 −α1
0 0 α1
0 0 0
Assim, o DCC ´e formado pelo subconjuntoSk(parte fatorial) acrescido
de S1 (pontos axiais) e algumas repeti¸c˜oes de S0 (ponto central). O DCC mais
econˆomico (small DCC) de Draper (1985) utiliza uma fra¸c˜ao regular ao inv´es do
Sk completo. O DBB combina o 2k com um delineamento em blocos incompletos
para tratamentos n˜ao estruturados. Em cada bloco os tratamentos presentes s˜ao
substitu´ıdos por n´ıveis−αi ou +αi, comi= 1,2 e os tratamentos ausentes s˜ao fixados
em 0. Por exemplo, para k = 3, o DBB ´e formado pelo subconjunto S2 acrescido
de algumas repeti¸c˜oes de S0. A Figura 3 mostra a representa¸c˜ao geom´etrica de um
experimento fatorial completo, DCC e DBB para 3 fatores.
Os m´etodos de constru¸c˜ao de delineamentos ´otimos cuja origem data
da d´ecada de 1940 (Wald, 1943; Chernoff, 1953; Kiefer, 1959) s˜ao alternativas muito
mais flex´ıveis e capazes de lidar com qualquer estrutura imposta pela pr´atica. No
contexto de experimentos fatoriais, a constru¸c˜ao de um delineamento ´otimo consiste
na sele¸c˜ao do subconjunto de tratamentos que otimiza alguma propriedade de
inte-resse relacionada `a an´alise estat´ıstica dos resultados experimentais. Essa metodologia
15
Figura 3 - Representa¸c˜ao geom´etrica de um experimento fatorial completo, DCC e
DBB para k = 3.
2.1.3 Propriedades de delineamento
Segundo Box & Draper (1975) e Box & Draper (1987), o delineamento
de um experimento deve:
1. Produzir dados informativos em toda a regi˜ao de interesse, sendo que essa
regi˜ao n˜ao necessariamente coincida com a regi˜ao do delineamento (cuboidal,
esf´erico, entre outros).
2. Assegurar que a resposta estimada ˆy(x) seja t˜ao pr´oxima quanto poss´ıvel do seu valor esperadoE(Y(x)) em x.
3. Permitir, se necess´ario, detectar poss´ıvel falta de ajuste.
4. Permitir estima¸c˜ao de transforma¸c˜oes da resposta e dos fatores experimentais
quantitativos.
5. Permitir que experimentos sejam realizados em blocos.
Por exemplo, um delineamento de segunda ordem ´e constru´ıdo ap´os an´alise de
um experimento inicial de primeira ordem.
7. Fornecer uma estimativa n˜ao viciada de erro aleat´orio.
8. Ser robusto a presen¸ca de observa¸c˜oes estranhas e ser robustos a viola¸c˜oes das
suposi¸c˜oes do modelo normal usual.
9. Requerer um n´umero m´ınimo de ensaios experimentais.
10. Fornecer padr˜oes de dados simples que permitem visualiza¸c˜ao imediata.
11. Resultar em c´alculos simples.
12. Ser robusto a erros de medidas nas vari´aveis experimentais.
13. N˜ao requerer um n´umero impratic´avel de n´ıveis dos fatores.
14. Permitir um controle para manter a suposi¸c˜ao de “variˆancia constante”.
Obviamente, a relevˆancia dos 14 pontos acima ´e relativa `as
cir-cunstˆancias de cada caso. Por exemplo, a propriedade 11, que requer simplicidade
nos c´alculos, n˜ao ´e muito importante se houver software dispon´ıvel, desde que seja
poss´ıvel verificar que todos os dados de entrada foram inseridos corretamente no
computador.
V´arias destas propriedades est˜ao relacionadas com ortogonalidade
en-tre os efeitos e/ou balanceamento, que foram consideradas importantes e ainda hoje,
se poss´ıvel, s˜ao desejadas, conforme destacado em Atkinson et al. (2007), que tamb´em
cita a propriedade de rotacionalidade para experimentos de superf´ıcie de resposta.
Um delineamento rotacional ´e aquele cujas variˆancias das respostas preditas depende
apenas da distˆancia do ponto ao centro da regi˜ao experimental, ou seja, independe
da dire¸c˜ao do ponto.
A ortogonalidade ´e uma propriedade ´util e desej´avel para um
17
´e poss´ıvel analisar de forma simples as m´edias de tratamentos para efeito de
com-para¸c˜ao e tamb´em realizar uma ´unica an´alise de variˆancia, com a soma de quadrados
sendo calculada facilmente. Muitos dos delineamentos cl´assicos existentes e mais
usa-dos s˜ao ortogonais, mas se a ortogonalidade n˜ao pode ser alcan¸cada, a procura por
um experimento balanceado (mesmo n´umero de repeti¸c˜oes para cada tratamento) ´e
frequente.
2.2
Modelo linear
O objetivo de um experimento ´e esclarecer o comportamento de um
sistema e estimar efeitos dos fatores experimentais, o que geralmente envolve o ajuste
de um modelo. A forma da verdadeira rela¸c˜ao entre resposta e fatores nem sempre
´e conhecida e, assim, a alternativa ´e utilizar uma aproxima¸c˜ao. Muitos problemas
podem ser adequadamente resolvidos ajustando-se um polinˆomio de baixa ordem.
O modelo de m´edias apresentado em (1) ´e um modelo geral para um
experimento em delineamento inteiramente casualizado comt tratamentos, cada um
comni repeti¸c˜oes (i= 1,2, . . . , t). A ´unica suposi¸c˜ao inicial deste modelo ´e a de
adi-tividade entre a consequˆencia dos tratamentos e o componente aleat´orio. Associado
ao ajuste do modelo temos a an´alise de variˆancia que, de forma sucinta, pode ser
descrita como segue.
Observado osn resultados da vari´avel resposta y, a variabilidade total
presente (SQtotal) pode ser decomposta em duas partes: uma devido a efeitos de
tratamentos (SQtrat), comt−1 graus de liberdade, e a outra devido a variabilidade
aleat´oria (SQres), com n − t graus de liberdade. Sob as suposi¸c˜oes E(εij) = 0,
V(εij) = σ2 para i = 1, . . . , t ej = 1, . . . , ni,com∑ti=1ni = n e E(εij · εij′) =
0 (para j ̸= j′
) ´e sabido que s2 = SQres
n−t ´e uma estimativa n˜ao viciada de σ
2.
Na literatura essa estimativa ´e chamada de estimativa do erro puro. Quando os
tratamentos s˜ao estruturados (fatorial) ´e mais apropriado reescrever a express˜ao em
(1) em componentes que representam efeitos principais e intera¸c˜oes entre os fatores.
e x2 com J n´ıveis, temos
yij =µij +εij =µ+αi+θj +γij+εij (4)
em que µ´e a m´edia geral, αi ´e o efeito do i-´esimo n´ıvel do fator x1 (i = 1, . . . , I),
θj ´e o efeito doj-´esimo n´ıvel do fatorx2 (j = 1, . . . , J) e γij ´e o efeito da intera¸c˜ao
entre o n´ıvel i dex1 e j dex2. Note que, neste caso,t=I×J.
Similarmente ao modelo anterior, a an´alise de variˆancia associada
re-sulta da decomposi¸c˜ao daSQtotal em variabilidade devido aos efeitos principais dex1
S(Qx1) comI−1 graus de liberdade, variabilidade devido aos efeitos principais dex2
(SQx2) com J−1 graus de liberdade, variabilidade devido aos efeitos de intera¸c˜oes
de x1x2 (SQx1x2) com (I −1)×(J −1) graus de liberdade e variabilidade devido
aos res´ıduos (SQres) com n−I ×J graus de liberdade, desde que pelo menos um
tratamento seja repetido. A variabilidade devido ao modelo completo ´e a soma das
variabilidades dos efeitos descritos (SQmod = SQx1 +SQx2 +SQx1x2), que, neste
caso, se iguala `a variabilidade de tratamentos descrita acima.
A estimativa de σ2 ´e idˆentica `a estimativa n˜ao viciada do modelo
apre-sentado em (1), ent˜ao s2 = SQres
n−I×J. A estima¸c˜ao dos efeitos no modelo pode
ser obtida pelo M´etodo de M´ınimos Quadrados dos erros cujas solu¸c˜oes ´unicas s˜ao
obtidas ap´os definir restri¸c˜oes apropriadas sobre os parˆametros. Para mais de dois
fatores, o modelo ´e estendido acrescentando intera¸c˜oes de ordens superiores, entre
trˆes fatores, quatro fatores, ou mais.
Quando o experimento envolve repeti¸c˜oes de pelo menos um
trata-mento ´e poss´ıvel obter estimativa de erro puro. Por´em, uma desvantagem da
estru-tura fatorial ´e que o n´umero de tratamentos cresce muito r´apido quando aumentamos
o n´umero de fatores e nem sempre ´e poss´ıvel usar o fatorial completo e/ou repetir
tratamentos. Nestes casos, costuma-se utilizar os graus de liberdade das intera¸c˜oes
de alta ordem, consideradas n˜ao relevantes, para obter uma estimativa da
variabi-lidade do erro, estimativa esta denotada por s2
p. O ´ındice p ´e utilizado para deixar
claro que esta ´e uma estimativa do tipo pooled, ou seja, que agrupa a variabilidade
19
(2012), esta estimativa ´e viciada para σ2.
Para fatores quantitativos temos interesse em simplificarµi do modelo
em (1) por uma superf´ıcie que, em geral, ´e aproximada por um polinˆomio de baixa
ordem. Assim,
µi =f′(xi)β i= 1, . . . , t, (5)
em que f ´e uma fun¸c˜ao que expande xi = (x1i, x2i, . . . , xki)′ num vetor de dimens˜ao
p de acordo com os termos do polinˆomio que se deseja ajustar e β ´e o vetor de
parˆametros do modelo de dimens˜ao p (p < t). Usualmente, os elementos de β s˜ao o intercepto, os efeitos de algumas potˆencias baixas dos x’s e intera¸c˜oes. O modelo
de primeira ordem inclui intercepto e efeitos lineares. O modelo de segunda ordem
inclui intercepto, efeitos lineares, efeitos quadr´aticos e intera¸c˜oes lineares dos fatores
dois-a-dois. Estes modelos s˜ao os utilizados nos estudos de superf´ıcies de resposta,
sendo que o modelo de segunda ordem ´e inclusive chamado de modelo de superf´ıcie
de resposta. Qualquer modelo polinomial pode ser escrito na forma matricial do
modelo de regress˜ao dado por
Y =Xβ+ε (6)
em que Y´e o vetor de respostas de dimens˜ao n,X, com dimens˜aon×p, ´e a matriz
de delineamento definida pelo modelo e pelo delineamento e ε ´e o vetor de erros
aleat´orios de dimens˜ao n. Note que cada linha de X ´e dada por f′ (xi).
Para ajustar um modelo de regress˜ao aos dados observados, basta
es-timar o vetor de parˆametros β. O problema ´e encontrar β tal queXβ seja pr´oximo
de Y. Pelo M´etodo de M´ınimos Quadrados (MQ), encontramos β tal que a fun¸c˜ao
ε′
ε = (Y −Xβ)′
(Y −Xβ) ´e minimizada. Ao resolver este problema, obtemos a
solu¸c˜ao explicita dada por
ˆ
β = (X′
X)−1X′
Y. (7)
Sob as condi¸c˜oes de Gauss-Markov, isto ´e, E(ε) = 0 e V(ε) = σ2I,
m´ınima e n˜ao viciado, pois E( ˆβ) = β. Temos tamb´em queV( ˆβ) = (X′
X)−1σ2. Sob
o conhecimento da distribui¸c˜ao de probabilidade dos erros, o m´etodo de estima¸c˜ao
preferido em Estat´ıstica ´e o de M´axima Verossimilhan¸ca (MV). No caso de
normali-dade dos erros (Draper & Smith, 1998; Faraway, 2004), ou seja, ε ∼N(0;Iσ2), este
m´etodo produz os mesmos estimadores de β que o m´etodo de M´ınimos Quadrados
dos erros.
Realizar testes de hip´oteses sobre os parˆametros do modelo ´e
extrema-mente ´util para as inferˆencias sobre os efeitos dos fatores e para a escolha do modelo
adequado. Para isso, considerando a normalidade dos erros, temos as hip´oteses
H0 : β1 = 0;β2 = 0;. . .;βp = 0
H1 : βj ̸= 0 para pelo menos um j,
que podem ser testadas pelo teste F da An´alise de Variˆancia (ANOVA) cuja
es-tat´ıstica do teste sob H0, ´e
F =
SQmod
p−1
SQres
n−p
∼F(p−1;n−p). (8)
Se o valor obtido para a estat´ıstica F for maior do que o valor do quantil de ordem
(1−α) da distribui¸c˜ao F com p−1 e n−p graus de liberdade no numerador e no
denominador, respectivamente, ent˜ao rejeitamosH0 ao n´ıvel de α% de significˆancia.
Este teste ´e dito ser global, ou seja, testa a nulidade dos coeficientes de todas as
regressoras no modelo. Se H0 for rejeitada, temos evidˆencia de que pelo menos um
dos fatores ´e ´util para explicar Y linearmente.
Sob normalidade, temos tamb´em ˆβ ∼ N(β; (X′
X)−1σ2). O erro
padr˜ao de cada estimador ˆβj ´e σ√cjj, em que cjj ´e o j-´esimo elemento da
diago-nal de M−1 = (X′
X)−1, em queM tem dimens˜oes p×p e ´e chamada de matriz de
informa¸c˜ao. Ent˜ao, as hip´oteses
H0 : βj = 0
21
podem ser testadas pelo teste t dado por
T = βˆj−βj
s√cjj ∼
tn−p. (9)
Se o valor absoluto obtido para a estat´ısticaT for maior do que o valor do quantil de
ordem (1−α/2) da distribui¸c˜ao tcom n−pgraus de liberdade, ent˜ao rejeitamosH0
ao n´ıvel de 100·α% de significˆancia. Este teste t´e dito ser individual ou parcial, ou
seja, testa a contribui¸c˜ao daj-´esima vari´avel regressora em particular ap´os considerar
a contribui¸c˜ao de todas as outras no modelo.
Construir intervalos de confian¸ca (IC) e regi˜oes de confian¸ca para β ´e uma maneira de expressar a incerteza em nossas estimativas.
Podemos considerar individualmente cada parˆametro, o que leva ao IC
para βj com 100·(1−α)% de confian¸ca tendo a forma geral
ˆ
βj ± |t(α/2;n−p)|s√cjj. (10)
Quanto mais amplo o intervalo, maior a imprecis˜ao da estimativa. Note
que fixadosnep, a imprecis˜ao s´o ´e reduzida diminuindo-se o valor√cjj, que depende
da matriz X′X.
No entanto, se constru´ırmos intervalos desse tipo para cada um dos p
parˆametros, o n´ıvel de confian¸ca n˜ao ´e (1−α), mas sim pr´oximo a (1−α)p. Para
contornar esta quest˜ao, podemos obter uma regi˜ao de confian¸ca conjunta para os p
parˆametros, formada pelo elips´oide, satisfazendo
( ˆβ−β)′
X′
X( ˆβ−β)
ps2 < F(1−α;p;n−p). (11)
Para o caso bidimensional e tridimensional ´e poss´ıvel visualiza¸c˜ao gr´afica do elips´oide.
Quanto maior o volume do elips´oide, maior a imprecis˜ao das estimativas. Note que
o volume do elips´oide depende da matriz X′
X.
Uma vez ajustado um modelo que se adequa aos dados, ´e poss´ıvel
utiliz´a-lo para predizer valores da resposta em qualquer ponto da regi˜ao de interesse.
em que
H=X(X′
X)−1X′
(12)
´e chamada de matriz de proje¸c˜ao ou popularmente de matriz chap´eu (hat) e ´e uma
matriz que projeta Y no espa¸co formado pelas colunas de X. A matriz H tem
dimens˜oesn×n, ´e uma matriz sim´etrica (H=H′
), idempotente (H2 =H), singular
(|H|= 0), seu posto ´e igual ao seu tra¸co que ´e igual a p e a soma dos elementos de uma linha ou de uma coluna ´e 1.
2.3
Delineamentos ´
otimos de experimentos
A teoria de delineamentos ´otimos de experimentos foi formalizada por
Kiefer (1959) com o objetivo de buscar delineamentos que maximizem a informa¸c˜ao
a partir da otimiza¸c˜ao de propriedades ligadas aos estimadores de interesse.
De-lineamentos ´otimos s˜ao deDe-lineamentos experimentais baseados em um determinado
crit´erio e s˜ao ´otimos apenas para um modelo estat´ıstico espec´ıfico. O objetivo de
uma busca por um delineamento ´otimo ou quase-´otimo ´e escolher n pontos de um
conjunto de N pontos poss´ıveis, chamados pontos candidatos (conjunto de todas as
poss´ıveis combina¸c˜oes dos n´ıveis dos fatores), de forma que alguma fun¸c˜ao da matriz
de informa¸c˜aoX′Xseja ´otima, ou seja, buscar um delineamento ´otimo significa bus-car uma combina¸c˜ao dentro da regi˜ao experimental χ que otimize a fun¸c˜ao crit´erio.
Essa fun¸c˜ao ´e definida atrav´es de um crit´erio de otimalidade que s˜ao descritos na
pr´oxima se¸c˜ao.
2.3.1 Crit´erios de otimalidade
Os crit´erios de otimalidade, tamb´em originalmente chamados de
crit´erios alfab´eticos de otimalidade (Kiefer, 1959; Atkinson et al., 2007) s˜ao, quase
sempre, estabelecidos por uma fun¸c˜ao da matriz de informa¸c˜ao M=X′
X ou de sua
inversaM−1 = (X′
X)−1, que ´e proporcional `a matriz de covariˆancias dos parˆametros
23
simplicidade das express˜oes. Seja Ξ o conjunto de todos os poss´ıveis delineamentos
para um determinado experimento. Os crit´erios mais populares s˜ao:
A-otimalidade: Foi introduzido por Chernoff (1953) e ´e definido como max
X∈Ξ
1
tr{(X′X)−1} (13)
Usando a fun¸c˜ao crit´erio em (13), minimizamos o tra¸co da inversa da matriz de
informa¸c˜ao, o que ´e equivalente a minimizar a variˆancia m´edia das estimativas
dos parˆametros do modelo ajustado. Esse crit´erio pode ser generalizado para
max
X∈Ξ
1
tr{W(X′X)−1}, (14)
em que W ´e uma matriz diagonal de pesos que podem ser atribu´ıdos aos
parˆametros de acordo com prioridades. Servem tamb´em para equilibrar a busca
quando as escalas relativas aos parˆametros s˜ao diferentes.
D-otimalidade: Wald (1943) introduziu este crit´erio que tem sido considerado o mais importante e mais popular para constru¸c˜ao de delineamentos ´otimos. O
crit´erio D, tamb´em conhecido como Crit´erio do Determinante, ´e definido como
max
X∈Ξ {|X ′
X|}1/p (15)
no qual maximizamos o determinante da matriz de informa¸c˜ao ou
minimi-zamos o determinante da inversa da matriz de informa¸c˜ao. A interpreta¸c˜ao
para este crit´erio ´e que, ao minimizar o determinante da inversa da matriz de
informa¸c˜ao, estamos minimizando a variˆancia generalizada dos estimadores dos
parˆametros e, dessa forma, minimizamos o volume do elips´oide de confian¸ca
dos p parˆametros, conforme Express˜ao (11).
DS-otimalidade: O crit´erio Ds ´e assim chamado por enfatizar o interesse na
es-tima¸c˜ao de um subconjunto de s parˆametros do vetor β (s < p). Seja
o vetor de (p−s) parˆametros de perturba¸c˜ao sem interesse prim´ario. A matriz
de informa¸c˜ao de β pode ser escrita em blocos, como:
M= M11 M12 M′ 12 M22 (16)
e sua inversa como
V=
V11 V12 V′
12 V22
(17)
na qual V11 ´e a matriz de variˆancia-covariˆancia dos estimadores de θ1. Por Atkinson et al. (2007), temos que V11 = (M11−M12M−1
22M
′
12)
−1 e, portanto,
para obter ˆθ1 t˜ao preciso quanto poss´ıvel devemos obter X tal que max
X∈Ξ {|M11−CM22C
′
|}1/s (18)
em que C´e a solu¸c˜ao da equa¸c˜aoCM22 =M12.
E-otimalidade: Foi introduzido por Ehrenfeld (1955) e ´e definido como max
X∈Ξ λmin(X ′
X). (19)
O crit´erio baseia-se em encontrar o delineamento que maximiza o menor
autovalor de (X′
X)−1, λ
min. O objetivo da E-otimalidade ´e minimizar a
variˆancia m´axima entre todas as poss´ıveis combina¸c˜oes lineares normalizadas
das estimativas dos parˆametros, ou seja, minimizar a variˆancia do contraste
ou efeito mais impreciso do experimento.
G-otimalidade: O crit´erio G consiste em determinar o delineamento para o qual a variˆancia da previs˜ao menos precisa, em toda a regi˜ao experimental χ, ser´a
m´ınima. A letra G do crit´erio indica otimalidade global. Este crit´erio ´e definido
como
min
X∈Ξ maxx∈χ
{
f(x)′ (X′
X)−1f(x)}
25
I-otimalidade: Este crit´erio minimiza a variˆancia m´edia da resposta predita. Ele
tamb´em ´e chamado de Q-otimalidade, Iv-otimalidade ou V-otimalidade. O
crit´erioI-otimalidade ´e definido como
min
X∈Ξ
∫
x∈χ
f(x)′ (X′
X)−1
f(x)dx (21)
Uma forma de analisar os dados de um experimento ´e atrav´es de
in-tervalos ou regi˜oes de confian¸ca e testes de hip´oteses sobre os parˆametros do
mo-delo. Assim, o experimento deve ser planejado para garantir que esses procedimentos
ser˜ao t˜ao informativos quanto poss´ıvel. Reconsiderando as express˜oes originais dos
crit´erios, nota-se que, para que as interpreta¸c˜oes relacionadas com a inferˆencia
este-jam de acordo, s˜ao necess´arias algumas adapta¸c˜oes nas express˜oes dos crit´erios. Estas
adapta¸c˜oes aos crit´erios, restringindo-se aos delineamentos inteiramente
aleatoriza-dos e aleatorizaaleatoriza-dos em blocos em modelos lineares, foram propostas por Gilmour &
Trinca (2012). Esses crit´erios modificados maximizam o poder dos testes de hip´oteses
e podem ser obtidos a partir de intervalos ou regi˜oes de confian¸ca.
Como visto, a justificativa da D-otimalidade ´e que este crit´erio
mini-miza o volume do elips´oide de confian¸ca dos p parˆametros. Draper & Smith (1998)
mostram que o volume ´e proporcional a|X′
X|−1/2. De fato, o volume ´e proporcional
a
(F(1−α;p;d))p/2|X′X|−1/2, (22)
em que d ´e o n´umero de graus de liberdade para erro puro permitido pelo
deline-amento e F(1−α;p;d) ´e o quantil de ordem 1−α da distribui¸c˜ao F com p graus de
liberdade no numerador e d graus de liberdade no denominador. Ent˜ao o crit´erioD
minimizaria o volume se todos os delineamentos apresentassem o mesmo n´umero de
graus de liberdade para estima¸c˜ao de erro. Assim, o crit´erio DP ajustado para os
graus de liberdade (a letra “P” refere-se a erro puro) deve obter X tal que
max
X∈Ξ
{|X′
X|}1/p
F(1−α;p;d)
Do mesmo modo, o crit´erio (DP)S para um subconjunto com s
parˆametros deve obter X tal que max
X∈Ξ
{|M11−CM22C′ |}1/s
F(1−α;s;d)
. (24)
Em rela¸c˜ao ao crit´erio A, a modifica¸c˜ao considera a m´edia dos
qua-drados dos comprimentos dos intervalos de confian¸ca dos parˆametros, originando o
crit´erio AP, que deve obter X tal que max
X∈Ξ
1
F(1−α;1;d)tr{W(X′X)−1}
. (25)
em que W est´a definido na Equa¸c˜ao 13.
2.3.2 Crit´erios compostos
Na pr´atica, os crit´erios de otimalidade apresentados na Se¸c˜ao 2.3.1
foram desenvolvidos para atender os objetivos do pesquisador nas fases posteriores
ao planejamento de experimento. H´a casos em que o pesquisador necessitar´a de
mais de um crit´erio para encontrar o delineamento adequado para seu experimento.
Assim, os crit´erios compostos oferecem flexibilidade e efic´acia para a constru¸c˜ao de
delineamentos multiobjetivos, podendo englobar mais de um crit´erio de otimalidade,
cada um com peso refletindo a importˆancia relativa de cada objetivo do experimento
ou do pesquisador.
Gilmour & Trinca (2012) destacaram os seguintes procedimentos que,
em geral, s˜ao aplicados na an´alise dos resultados de um experimento de superf´ıcie
de resposta:
1. Teste F global sobre os efeitos dos tratamentos, para o qual devemos usar
(DP)S-otimalidade;
2. Teste t para efeitos individuais, para o qual devemos usar AP-otimalidade,
possivelmente na vers˜ao ponderada;
3. Estima¸c˜ao por ponto dos efeitos individuais, para o qual devemos usar A
27
4. Verificar a falta de ajuste do modelo simplificado e, se apropriado, inclus˜ao
de alguns termos de alta ordem no polinˆomio. A eficiˆencia com rela¸c˜ao ao
uso dos recursos experimentais, referida como eficiˆencia em termos de graus de
liberdade por Daniel (1976) foi utilizada neste quesito.
Desta forma, Gilmour & Trinca (2012) propuseram a fun¸c˜ao crit´erio
composta pelas propriedades a seguir:
X′Q0X
1
p−1 crit´erio D,
1
tr{W(X′Q0X)−1} crit´erio A,
(
n−d)
graus de liberdade,
X′Q0X
1
p−1
F(1−α1;p−1;d)
crit´erio DP,
1
F(1−α2;1;d)tr{W(X
′Q0X)−1} crit´erio AP.
em que Q0 =I− n111′, de forma que o crit´erio considera o intercepto
do modelo como parˆametro de perturba¸c˜ao e sem prioridade de estima¸c˜ao.
Ao reunir as cinco propriedades listadas, Gilmour & Trinca (2012)
obtiveram a fun¸c˜ao crit´erio composta dada por
X′Q0X
κ1+κ4
p−1 (n−d)κ3
[
F(1−α1;p−1;d)
]κ4[
F(1−α2;1;d)
]κ5[
tr{W(X′Q0X)−1}]κ2+κ5, (26) em que κ= (κ1, κ2, κ3, κ4, κ5) ´e vetor de pesos de prioridade de cada propriedade e
d ´e o n´umero de graus de liberdade de erro puro.
2.3.3 Algoritmo de troca
Uma maneira poss´ıvel de construir delineamentos ´otimos ´e atrav´es da
de observa¸c˜oes, o modelo a ser utilizado e o crit´erio de otimalidade com seus pesos,
devemos construir todos os poss´ıveis delineamentos distintos e calcular o valor do
crit´erio para cada delineamento. Por´em, a quantidade de delineamentos distintos
depende do n´umero de tratamentos e do n´umero de observa¸c˜oes do experimento.
Uma situa¸c˜ao hipot´etica em que temos 5 fatores com 3 n´ıveis cada um e um
expe-rimento com 24 observa¸c˜oes, geraria (35)24≈1,8×1057 delineamentos, incluindo-se
permuta¸c˜oes entre linhas, ou seja, ´e invi´avel construir todos estes delineamentos para
verificar qual ´e o melhor (embora delineamentos distintos possam ter propriedades
equivalentes). Ent˜ao, ´e preciso fazer uso de m´etodo inteligente e sistem´atico para
constru¸c˜ao de delineamentos ´otimos, como o algoritmo de troca, que ´e o m´etodo de
busca mais utilizado para construir delineamentos ´otimos exatos.
A ideia original do algoritmo de troca ´e de Fedorov (1972). Este
al-goritmo ´e um m´etodo heur´ıstico para buscar delineamentos D-´otimos, ou seja, um
procedimento para encontrar uma boa solu¸c˜ao, n˜ao necessariamente a solu¸c˜ao ´otima
em rela¸c˜ao ao crit´erio D. Para iniciar a busca, ´e constru´ıdo, aleatoriamente ou n˜ao,
um delineamento inicial X n˜ao singular (|X′X
| >0). A matriz de informa¸c˜ao X′X e o valor do crit´erio s˜ao calculados a partir do delineamento inicial. Uma das linhas
do delineamento ´e trocada por uma linha do conjunto de todos os poss´ıveis pontos
candidatos para o delineamento, formando um novo delineamento X1 com as
mes-mas dimens˜oes de X. Seja f(xi) o ponto que ´e retirado da matriz de delineamento e f(x) o ponto adicionado. Neste novo delineamento, a matriz de informa¸c˜aoX′
1X1 e o
valor do crit´erio s˜ao calculados novamente. Faz-se uma compara¸c˜ao entre os valores
do crit´erio de ambos os delineamentos, escolhendo o melhor. Assim, come¸ca uma
nova itera¸c˜ao at´e que ∆(xi,x), chamado de fun¸c˜ao de Fedorov, seja menor queϵ, um
n´umero pequeno e positivo. Esta fun¸c˜ao ´e dada por
∆(xi,x) = f′
(x)M−1f(x)
−f′
(xi)M−1f(xi) +(
f′
(x)M−1f(xi))2
−(
f′
(x)M−1f(x)) (
f′
(xi)M−1f(xi))
.
(27)
Esse procedimento ´e repetido para um n´umero pr´e-determinado de delineamentos
29
global e n˜ao apenas um ´otimo local.
Muitas vers˜oes modificadas do algoritmo de troca original de Fedorov
(1972) foram desenvolvidas e as mais conhecidas est˜ao descritas em Miller & Nguyen
(1992). Entre elas est˜ao as vers˜oes do algoritmo de troca de Mitchell (1974), Cook
& Nachtsheim (1980) e Atkinson & Donev (1989).
Mitchell (1974) generalizou o algoritmo de troca de Fedorov para
per-mitir “excurs˜oes”. Em cada itera¸c˜ao, h pontos podem ser adicionados no
delinea-mento com n pontos e h pontos s˜ao removidos dos (n+h) pontos do delineamento.
Ele chamou este algoritmo modificado de DETMAX. Quando h = 1, DETMAX se
torna o algoritmo de troca original. Quando h ´e grande, o tempo computacional
gasto ´e maior.
O algoritmo de Fedorov modificado por Cook & Nachtsheim (1980) foi
chamado de MFEA. Ele calcula a mesma quantidade de ∆’s em cada passo, mas
troca cada ponto f(xi) no delineamento pelo ponto candidato f(x) que maximiza
∆(xi,x). Este procedimento ´e, geralmente, t˜ao confi´avel quanto o algoritmo de Fedorov original em encontrar o delineamento ´otimo, mas pode ser at´e duas vezes
mais r´apido.
No KL-EA (KL-exchange algorithm), proposto por Atkinson &
Do-nev (1989), um ponto f(xk), com k ≤ K ≤ n, do delineamento e um ponto f(xl), com l ≤ L ≤ N, dos candidatos s˜ao trocados se ∆(xk,xl) for m´aximo. K
corres-ponde a K pontos do delineamento com menor f′
(xk)M−1f(xk), que ´e a variˆancia
de predi¸c˜ao do ponto k. L corresponde a L pontos dos N pontos candidatos com
maior f′
(xl)M−1f(xl). Dessa forma, ´e escolhido retirar os pontos de maior variˆancia
de predi¸c˜ao e inserir os pontos de menor variˆancia de predi¸c˜ao. O processo de troca
para quando ∆(xk,xl) ´e menor que um n´umero escolhido pequeno e positivo. Quando
K =n e L=N, o KL-EA torna-se o algoritmo de troca original de Fedorov.
Para a busca de delineamentos utilizando os demais crit´erios de
otimali-dade, os algoritmos de troca de Cook & Nachtsheim (1989) e de Meyer & Nachtsheim
trabalho. Estes algoritmos s˜ao vers˜oes modificadas do algoritmo de troca de Fedorov
(1972) e s˜ao chamados de algoritmo de troca por ponto (point-exchange) e algoritmo
de troca por coordenada (Coordinate-Exchange), respectivamente.
Seguem os passos do algoritmo de troca por ponto implementado.
Passo 1: Definir o modelo, o n´umero k de fatores, o n´umero n de observa¸c˜oes do experimento, os n´ıveis de cada fator, os vetores de pesosW(crit´erio A ponde-rado) eκ (crit´erio composto) e o n´umero v de tentativas do algoritmo.
Passo 2: Criar a matriz de candidatos com todos os pontos xi poss´ıveis.
Passo 3: Criar um delineamento inicial (n˜ao singular) aleatoriamente.
Passo 4: Calcular M,|M|,M−1 e o valor do crit´erio composto para o delineamento
inicial.
Passo 5: Realizar uma troca por ponto (linha), ou seja, fixa-se uma linha da matriz
X e troca-a por um ponto do conjunto candidato.
Passo 6: Atualizar |M| e M−1
pelas Equa¸c˜oes (41), (43) e (44) e calcular o valor
do crit´erio para este delineamento.
Passo 7: Se o valor do crit´erio deste novo delineamento for maior do que o valor do crit´erio do delineamento anterior, faz a troca efetivamente, sen˜ao, volta
ao delineamento anterior. Retornar ao Passo 5 enquanto as trocas estiverem
produzindo melhores valores no crit´erio do delineamento.
Passo 8: O delineamento encontrado ´e armazenado e uma nova busca ´e feita (re-tornar aoPasso 3) para que o valor do crit´erio encontrado n˜ao seja um ´otimo local. O retorno ao Passo 3´e feito v vezes.
Para a vers˜ao do algoritmo de troca por coordenada, devemos
3
METODOLOGIA
Este trabalho foi iniciado com o estudo dos novos crit´erios de
otimali-dade formulados por Gilmour & Trinca (2012) e com a an´alise do algoritmo de troca
de Fedorov (1972) e suas vers˜oes modificadas ao longo do tempo para a constru¸c˜ao
de delineamentos ´otimos. Posteriormente, duas vers˜oes do algoritmo de troca foram
implementadas em linguagem C juntamente com um novo crit´erio para dar robustez
a perda de observa¸c˜oes.
3.1
Robustez a perda de observa¸
c˜
oes
Um problema comum na pesquisa estat´ıstica experimental ´e o impacto
nos resultados da an´alise estat´ıstica quando ocorre perda de observa¸c˜oes durante a
experimenta¸c˜ao. Se num experimento existir um grupo de observa¸c˜oes mais
influen-tes na an´alise que outros e se, por algum motivo alheio, algumas destas observa¸c˜oes
forem perdidas, as consequˆencias para a an´alise dos resultados do experimento
po-dem ser dr´asticas, chegando at´e `a impossibilidade de ajuste do modelo pr´e-definido
devido a n˜ao estimabilidade de alguns parˆametros. Mesmo n˜ao havendo perda de
observa¸c˜oes, a presen¸ca de observa¸c˜oes influentes no ajuste do modelo ´e indesejada,
j´a que estimativas comandadas por alguns poucos pontos levantam suspeitas sobre
o modelo ajustado.
Na literatura n˜ao h´a um crit´erio de otimalidade que dˆe robustez a um
experimento em rela¸c˜ao a perda de observa¸c˜oes. A nossa proposta ´e buscar um
deli-neamento ´otimo, incluindo no crit´erio de otimalidade uma propriedade para prevenir
razo-avelmente simples de influˆencia ´e dada pelos elementos da diagonal da matriz H, os
hii’s (i= 1, . . . , n), conforme a Equa¸c˜ao (12), pois estes elementos medem a influˆencia
de cada observa¸c˜ao no ajuste do modelo. De acordo com as propriedades da
ma-triz H, o delineamento ideal, segundo este crit´erio, apresentaria todos os elementos iguais a p/n, j´a que s˜ao n elementos na diagonal e a soma deles ´e p. Assim,
explo-ramos minimizar∑n
i=1(hii−p/n)2, que significa minimizar a variabilidade dos hii’s,
tornando-os pr´oximos dep/n, e assim, minimizando a heterogeneidade da influˆencia
de cada observa¸c˜ao do experimento. Este crit´erio ser´a chamado de H-otimalidade
em referˆencia `a matriz H.
Combinando as quatro propriedades consideradas por Gilmour &
Trinca (2012) e reproduzidas na se¸c˜ao 2.3.2, o crit´erio D pela sua importˆancia e
o crit´erio H proposto nesta pesquisa, cada um associado a um peso de prioridade
de an´alise dado pelo vetor κ= (κ1, κ2, κ3, κ4, κ5, κ6)′, propomos o novo crit´erio
com-posto
X′Q0X
κ1+κ4
p−1 (n−d)κ3
[
F(1−α1;p−1;d)
]κ4[
F(1−α2;1;d)
]κ5[
tr{W(X′Q0X)−1}]κ2+κ5[∑n
i=1(hii−p/n)2+δ
]κ26 ,
(28)
em queQ0 =I−n111′, de forma que o crit´erio considera o intercepto do modelo como
parˆametro de perturba¸c˜ao e sem prioridade de estima¸c˜ao eδ foi fixado em 10−6 para
evitar problemas num´ericos no caso de encontrar o delineamento ideal em rela¸c˜ao ao
crit´erio H.
3.2
Implementa¸c˜
ao do algoritmo de troca
Como foi visto na Equa¸c˜ao (28), ´e necess´ario calcular o determinante e
a inversa da matriz de informa¸c˜ao para obter o valor do crit´erio do delineamento que
estamos buscando. Sabe-se que a eficiˆencia computacional destes c´alculos depende
da dimens˜ao da matriz. No caso, a matriz de informa¸c˜ao, M=X′
X, tem dimens˜ao
p×p. Se o modelo escolhido tiver muitos parˆametros, ou seja, se p for grande, o