DIMENSIONAMENTO DE AMOSTRAS - ANOVA - 1 ou MAIS FATORES
18 de maio de 2014
INTRODU ¸ C˜ AO
Importˆancia
Prote¸c˜ao contra erros dos tipos I e II;
Estimativas de interesse devem ser precisas.
Situa¸c˜oes de uso: estudos observacionais e experimentais.
Finalidade
Amostras devem ser grandes o suficiente para que diferen¸cas importantes (em termos pr´aticos) sejam detectadas com alta probabilidade;
Amostras n˜ao devem ser exageradamente grandes de modo que o custo para obtˆe-las seja alto e diferen¸cas de pouca importˆancia pr´atica sejam estatisticamente significantes com alta probabilidade.
Suposi¸c˜oes
Caso univariado;
Vamos considerar o mesmo tamanho de amostra para cada tratamento.
Consequˆencias
Os tratamentos tˆem a mesma importˆancia;
Quando o interesse ´e comparar todas as m´edias, duas a duas, a precis˜ao das compara¸c˜oes ´e maximizada;
Certos desvios das suposi¸c˜oes associadas ao modelo de ANOVA causam menos problemas.
Procedimento: controle das probabilidades dos erros de tipo I e de tipo II.
Planos utilizados: completamente casualizados.
PODER DO TESTE F - PLANOS COM 1 FATOR FIXO
Poder: probabilidade de rejeitar a hip´otese nula quando ela ´e falsa.
Poder do teste F:1−β=P[F∗> F(1−α;r−1, n−r)|φ,] onde
β: probabilidade do erro tipo II;
α: probabilidade do erro tipo I;
r: n´umero de n´ıveis do fator;
n: tamanho total da amostra;
φ: parˆametro de n˜ao-centralidade (medida do quanto as m´edias
populacionaisµi da vari´avel resposta sob os tratamentos s˜ao diferentes).
Temos
φ= 1 σ
r P ni (µi−µ)2 r
e
µ=
P ni µi
n .
Quando n1 =. . .=nr=m temosn=mr,
φ= 1 σ
rmP
(µi−µ)2 r e
µ= P µi
r .
A Tabela B.11 de Neter et al. (1996) fornece valores de 1−β. Para um fator fixo, temosν1=r−1 e ν2=r(m−1).As entradas da tabela s˜ao ν1,ν2,α eφ.
Coment´arios
Parar,ni eα fixos, v´arias combina¸c˜oes dosµi conduzem ao mesmo valor deφ e, consequentemente, ao mesmo valor de1−β.
PODER DO TESTE F - PLANOS COM 1 FATOR FIXO
Quanto maior φ, maior1−β e menorβ, mantidoα fixo. Quanto menorα, menor1−β e maior β, mantidoφfixo. Observar que esta ´e uma justificativa para o uso deα= 0,05 ou 0,10 ao inv´es de 0,01.
Valores de 1−β paraν1 = 1 n˜ao est˜ao reproduzidos na Tabela B.11, pois este caso corresponde `a compara¸c˜ao de duas m´edias
populacionais. Neste caso, o teste F corresponde ao testetbilateral e valores de 1−β s˜ao obtidos da Tabela B.5 de Neter et al. (1996), utilizando-se o parˆametro de n˜ao-centralidade
δ = |µ1−µ2| σ
q 1 n1 +n1
2
e graus de liberdade iguais a n1+n2−2.
Tabela B.11: tentativa e erro Tabela B.12
O tamanho da amostra para cada tratamento ´e o mesmo;
Todos os fatores s˜ao fixos.
Planos com um fator
∆: menor intervalo entre as m´edias da vari´avel resposta sob os n´ıveis do fator para o qual ´e importante detectar diferen¸cas entre os µi com grande probabilidade.
Entradas da Tabela B.12
∆/σ (o valor de∆´e expresso em m´ultiplos do desvio padr˜ao), r, α e 1−β.
Dimensionamento da amostra - Controle de α e β
Observa¸c˜ao: O valor de σ pode ser estimado a partir de um experimento piloto (σˆ=√
QM R, supondo que o modelo ´e homoced´astico). Uma estimativa deσ pode tamb´em ser obtida a partir de alguma informa¸c˜ao sobre a amplitude dos valores da vari´avel resposta. Temos que
ˆ
σ = amplitude/6.
Coment´arios
1. A Tabela B.12 baseia-se emφ(parˆametro de n˜ao-centralidade).
Exemplo:
Caso µ1 µ2 µ3 µ4 P
(µi−µ)2
1 24 27 25 26 5,00
2 25 25 26 23 4,75
3 25 25 25 28 6,75
4 25 25 26,5 23,5 4,50
µ= 25
P (µi−µ)2 varia em cada caso, ou seja, φvaria em cada caso.
P (µi−µ)2 assume o menor valor no Caso 4.
E poss´ıvel mostrar que, fixado´ ∆,P
(µi−µ)2 ´e minimizada quando todos os µi, exceto dois deles, s˜ao iguais aµ e estes dois s˜ao igualmente
espa¸cados de µ. Neste caso, min X
(µi−µ)2= (∆/2)2+ (−∆/2)2+ 0 +. . .+ 0 = ∆2/2. (1) Embora 1−β varie comφ, o uso de (1) na constru¸c˜ao da Tabela B.12 assegura que o poder ´e pelo menos1−β para qualquer combina¸c˜ao dos µi, fixado ∆(lembrar que quanto maiorφmaior ´e1−β).
Dimensionamento da amostra - Controle de α e β
2. Consideremosr = 3,α= 0,05 eβ = 0,10.Da Tabela B.12 temos
∆/σ m
1,0 27
1,5 13
2,0 8
2,5 6
Quanto menor for o valor de ∆/σ maior ´e sua influˆencia sobre m.
3. Consideremosr = 5,α= 0,05, β = 0,10e ∆ = 3.Da Tabela B.12 temos
σ ∆/σ m
1 3,0 5
2 1,5 10
3 1,0 32
Quanto maior σ maiorm.
4. O valor dem pode ser obtido no pacote MINITAB, por exemplo.
5. Conv´em publicar tabelas com v´arios pares (σ, m) para cada valor de ∆.
Aplica¸c˜ ao
Consulta realizada no Centro de Estat´ıstica Aplicada - CEA do IME-USPem 17/08/2004
T´ıtulo: Potencial antioxidante e caracter´ısticas f´ısico-qu´ımicas do tomate orgˆanico em compara¸c˜ao ao convencional.
Institui¸c˜ao: Faculdade de Sa´ude P´ublica - USP
Objetivo: Avaliar a caracter´ıstica antioxidante de tomates orgˆanicos e convencionais preparados de 5 maneiras distintas. Para essa avalia¸c˜ao ser˜ao utilizados trˆes solventes diferentes: et´ereo, aquoso e alco´olico.
Descri¸c˜ao do Estudo: Ser˜ao coletados tomates cultivados de forma convencional e de forma orgˆanica. As unidades amostrais nas quais ser˜ao medidas a atividade antioxidante ser˜ao obtidas a partir de lotes de 20 kg de tomates. A partir de cada lote s˜ao preparados os 5 produtos em quest˜ao e cada um deles ´e dilu´ıdo nos solventes aquoso, et´ereo e alco´olico para a coleta das informa¸c˜oes sobre a atividade antioxidante. Ao menos dois lotes de cada tipo de cultivo devem ser analisados, visto que com um n´umero menor n˜ao haveria variabilidade suficiente para serem realizadas as compara¸c˜oes desejadas.
Deseja-se avaliar os efeitos dos seguintes fatores na atividade antioxidante:
1. Tipo de Cultivo (TC): 2 n´ıveis;
2. Produtos (P): 5 n´ıveis;
3. Tipos de solventes (TS): 3 n´ıveis.
Aplica¸c˜ ao
Dimensionamento Amostral
H´a interesse na obten¸c˜ao do n´umero de lotes necess´arios para que se consiga detectar, com um n´ıvel de significˆancia α e um poder 1−β, uma diferen¸ca ∆ = 10(% - unidade de medida da atividade antioxidante) entre as atividades antioxidantes m´edias do mesmo produto obtido de tomates do mesmo tipo de cultivo e submetidos a solventes diferentes.
m: n´umero de lotes para cada tipo de cultivo r: n´umero de n´ıveis do fator TS (r= 3) ˆ
σ: estimativa do desvio padr˜ao da atividade antioxidante
∆: diferen¸ca que se espera encontrar entre as m´edias da atividade antioxidante sob dois dos solventes(∆ = 10)
α: n´ıvel de significˆancia global(α= 0,05)
Tabela 2. Valores dem
β α σˆ ∆ m
0,05 0,05 5% 10% 9
0,1 0,05 5% 10% 8
0,05 0,05 10% 10% 32 0,1 0,05 10% 10% 27
Planos com dois fatores
Fatores: C (c n´ıveis) e D (dn´ıveis)
Caso 1. Escolher o fator mais importante e dimensionar a amostra supondo que temos um plano com um fator. Vamos supor que o fator C seja o mais importante. O tamanho da amostram obtido pela Tabela B.12 ´e o n´umero de unidades experimentais para cada n´ıvel de C. Assim, o tamanho da amostra para cada tratamento ´e dado por m/d (ver tabela abaixo).
D/C C1 C2 . . . Cc
D1 m/d m/d . . . m/d D2 m/d m/d . . . m/d ... ... ... ... ... Dd m/d m/d . . . m/d
m m . . . m
O uso da Tabela B.12 neste caso ´e apropriado desde quec(m−1)>20.
Caso 2. Se n˜ao sabemos qual o fator mais importante, dimensionamos o n´umero de unidades experimentais para cada tratamento usando primeiro o fator C e depois o fator D, respeitando quec(m−1)>20e
d(m−1)>20. Se os tamanhos das amostras diferem muito, a escolha do valor final deve ser discutido com o pesquisador.
Trˆes Fatores: C, D e Frepetir o procedimento como para dois fatores.
No Caso 1, se o fator C ´e o mais importante, temos a restri¸c˜ao d(m−1);
no Caso 2, temos as restri¸c˜oesc(m−1)>20(para o fator C), d(m−1)>20 (para o fator D) ef(m−1)para o fator F.
Aplica¸c˜ ao 1 - Consulta CEA em 17/08/2004
T´ıtulo: Potencial antioxidante e caracter´ısticas f´ısico-qu´ımicas do tomate orgˆanico em compara¸c˜ao ao convencional.
Institui¸c˜ao: Faculdade de Sa´ude P´ublica - USP
Objetivo: Avaliar a caracter´ıstica antioxidante de tomates orgˆanicos e convencionais preparados de 5 maneiras distintas. Para essa avalia¸c˜ao ser˜ao utilizados trˆes solventes diferentes: et´ereo, aquoso e alco´olico.
Descri¸c˜ao do Estudo: Ser˜ao coletados tomates cultivados de forma convencional e de forma orgˆanica. As unidades amostrais nas quais ser˜ao medidas a atividade antioxidante ser˜ao obtidas a partir de lotes de 20 kg de tomates. A partir de cada lote s˜ao preparados os 5 produtos em quest˜ao e cada um deles ´e dilu´ıdo nos solventes aquoso, et´ereo e alco´olico para a coleta das informa¸c˜oes sobre a atividade antioxidante. Ao menos dois lotes de cada tipo de cultivo devem ser analisados, visto que com um n´umero menor n˜ao haveria variabilidade suficiente para serem realizadas as compara¸c˜oes desejadas.
Deseja-se avaliar os efeitos dos seguintes fatores na atividade antioxidante:
1. Tipo de Cultivo (TC): 2 n´ıveis;
2. Produtos (P): 5 n´ıveis;
3. Tipos de solventes (TS): 3 n´ıveis.
Aplica¸c˜ ao 1
Dimensionamento Amostral
H´a interesse na obten¸c˜ao do n´umero de lotes necess´arios para que se consiga detectar, com um n´ıvel de significˆancia α e um poder 1−β, uma diferen¸ca ∆ = 10(% - unidade de medida da atividade antioxidante) entre as atividades antioxidantes m´edias do mesmo produto obtido de tomates do mesmo tipo de cultivo e submetidos a solventes diferentes.
m: n´umero de lotes para cada tipo de cultivo a: n´umero de n´ıveis do fator TS (a= 3) ˆ
σ: estimativa do desvio padr˜ao da atividade antioxidante
∆: diferen¸ca que se espera encontrar entre as m´edias da atividade antioxidante sob dois dos solventes(∆ = 10)
α: n´ıvel de significˆancia global(α= 0,05)
Tabela 2. Valores dem
β α σˆ ∆ m
0,05 0,05 5% 10% 9
0,1 0,05 5% 10% 8
0,05 0,05 10% 10% 32 0,1 0,05 10% 10% 27
Aplica¸c˜ ao 2 - Consulta CEA em 06/11/2001
T´ıtulo: Estudoin vitro da integridade da membrana plaquet´aria humana quando submetida `a criopreserva¸c˜ao e descongelamento.
Institui¸c˜ao: Faculdade de Medicina - USP Introdu¸c˜ao.
Pacientes submetidos `a transfus˜ao de plaquetas desenvolvem anticorpos que diminuem a vida m´edia das plaquetas transfundidas.
Alternativa: Criopreserva¸c˜ao de concentrados de plaquetas do pr´oprio indiv´ıduo. No entanto, as plaquetas sofrem dano celular durante a
criopreserva¸c˜ao, apresentando uma redu¸c˜ao funcional. Assim, ´e importante desenvolver t´ecnicas de criopreserva¸c˜ao que mantenham a viabilidade, atividade e capacidade funcional das plaquetas p´os-descongelamento.
laboratorial dos concentrados plaquet´arios criopreservados e descongelados.
Descri¸c˜ao do Estudo.
Foram utilizadas 10 al´ıquotas de concentrado plaquet´ario de cada paciente, com 20ml cada. Uma das al´ıquotas (Al´ıquota 10) n˜ao foi criopreservada (controle). As demais 9 al´ıquotas foram criopreservadas cada uma em uma de 9 solu¸c˜oes obtidas combinando trˆes n´ıveis de um agente crioprotetor (DMSO) com trˆes estabilizadores de citoesqueleto.
Temos ent˜ao 9 tratamentos.
Todas as al´ıquotas criopreservadas foram descongeladas e analisadas 3 meses ap´os o congelamento, a fim de se avaliar a a¸c˜ao das solu¸c˜oes utilizadas sobre a integridade da membrana plaquet´aria (vari´aveis resposta:
citometria de fluxo (%), teste de agrega¸c˜ao plaquet´aria (%), etc.).
Para a an´alise dos dados foi indicado um modelo de medidas repetidas.
Aplica¸c˜ ao 2
Dimensionamento Amostral
Para o dimensionamento da amostra considerou-se um fator fixo com 10 n´ıveis (9 solu¸c˜oes criopreservantes mais o controle).
Como n˜ao havia uma amostra piloto, foi considerado o desvio padr˜ao da vari´avel teste de agrega¸c˜ao plaquet´aria (maior desvio padr˜ao). Segundo a literatura ele ´e igual a 24%.
Fixados α= 0,05 e1−β= 0,95, foram obtidos os tamanhos de amostras apresentados na Tabela 3.
Tabela 3. Valores dem
∆ ∆/σ N´umero de Pacientes
24 1,00 48
30 1,25 31
36 1,50 22
42 1,75 17
48 2,00 13
60 2,50 9
72 3,00 7
Aplica¸c˜ ao 3 - Consulta CEA em 10/09/2002
T´ıtulo: Influˆencia de algumas substˆancias associadas `a escova¸c˜ao dental na integridade superficial de diferentes materiais indicados para restaurar les˜oes cervicais n˜ao-cariosas.
Institui¸c˜ao: Faculdade de Odontologia - USP
Objetivo: Verificar de que maneira as bebidas ´acidas ou alco´olicas associadas `a escova¸c˜ao dental afetam diferentes tipos de materiais restauradores, com o intuito de identificar o mais resistente.
rugosidade (µm), peso (g) e perfil (mm). Em seguida, as amostras foram imersas nas solu¸c˜oes coca-cola, whisky, suco de lim˜ao e ´agua deionizada por 60 dias a 37oC. Ap´os o per´ıodo de imers˜ao as trˆes vari´aveis resposta foram avaliadas novamente. Temos dois fatores cruzados (8 tratamentos) e um fator com dois n´ıveis de medidas repetidas.
Aplica¸c˜ ao 3
Dimensionamento Amostral
A maior variabilidade encontrada foi para a diferen¸ca entre os valores da vari´avel rugosidade quando as amostras foram constru´ıdas com o Material 1 e imersas no whisky (desvio padr˜ao igual a 0,581µm).
Foram fixados∆ = 1µm (diferen¸ca esperada entre as m´edias da rugosidade antes e depois do tratamento ser aplicado ), α= 0,05 e β = 0,05.
Como dimensionar a amostra?