Aula 9 Planejamento e Análise de Experimentos

(1)

Aula 9 –Planejamento e Análise de

Experimentos

Professores

Miguel Antonio Sovierzoski, Dr.

[email protected];

Vicente Machado Neto, Dr.

(2)

Porque usar um teste não paramétrico

Muitos procedimentos exigem que determinadas condições sejam atendidas pela(s) populações sob investigação. Por exemplo, a análise de variância com um fator requer amostras de populações distribuídas normalmente com variâncias iguais. No entanto, existem muitas situações onde estas suposições não são satisfeitas. Consequentemente, procedimentos não paramétricos foram desenvolvidos que requerem poucas ou nenhuma suposição sobre a população sob investigação.

(3)

Desvantagens de testes não paramétricos

Testes não paramétricos:

· São globalmente menos poderosos do que testes

correspondentes, projetados para uso em dados provenientes de uma distribuição específica. Assim, você está menos preparado para rejeitar a hipótese nula quando ela é falsa.

· Com frequência exigem que você modifique as hipóteses. Por exemplo, muitos teste não paramétricos referentes ao centro de população são testes sobre a mediana ao invés de média. O teste não responde a mesma pergunta como o procedimento paramétrico correspondente.

Quando existe uma escolha entre usar um procedimento paramétrico ou não paramétrico e você está razoavelmente certo de que as suposições para o procedimento paramétrico foram satisfeitas, a seguir, use o procedimento paramétrico.

(4)

Use o intervalo de confiança e procedimentos de teste Wilcoxon para 1 amostra (também chamado de teste de Wilcoxon de 1 amostra de amplitude assinada) para fazer inferências sobre uma mediana da população, com base em dados de uma amostra aleatória.

Por exemplo, você pode determinar:

· Se os custos de alimentação semanal para famílias de quatro pessoas com orçamentos intermediários é inferior à média nacional de US $92

· Se a média de idade dos cidadãos norte-americanos aumentou nos últimos anos

Use o teste de Wilcoxon de 1 amostra quando você é incapaz de assumir a distribuição de uma população a partir da qual a amostra foi criada, mas que pode assumir que a distribuição é simétrica . Isto é uma alternativa não paramétrica para procedimentos de teste Z para uma amostra e teste t para uma amostra .

(5)

Intervalo de Confiança

A mediana da amostra é uma estimativa da mediana desconhecida da população. O intervalo de confiança é uma amplitude de valores prováveis para a mediana da população com base nos dados da amostra. Você pode escolher qualquer nível alfa que for maior que 0% e menor que 100%. O nível a de 0,05 é comumente usado.

(6)

Exercicio

Deseja-se testar se o tempo de ação de um antiácido é igual ou menor do que 12 minutos.

Foram obtidos por experimentação os tempos de ação ao lado em minutos:

Testes de Wilcoxon para 1 amostra

Time 10,9 15,0 11,9 8,8 8,2 14,8 9,2 8,8 16,0 15,2 15,9 9,2 9,2 7,7 8,0 12,5

(7)

Exercicio

Fazendo-se um teste de normalidade sobre os tempo de ação do antiácido observa-se que os dados não obedecem a uma distribuição normal, p valor =0,014 descarta a hipótese H0 de normalidade.

Testes de Wilcoxon para 1 amostra

Time 10,9 15,0 11,9 8,8 8,2 14,8 9,2 8,8 16,0 15,2 15,9 9,2 9,2 7,7 8,0 12,5

(8)

Exercício

Testes de Wilcoxon para 1 amostra

Time 10,9 15,0 11,9 8,8 8,2 14,8 9,2 8,8 16,0 15,2 15,9 9,2 9,2 7,7 8,0 12,5

(9)

Intervalo de Confiança

Interpretação

O intervalo de confiança indica que você pode estar 94,8% confiante que a mediana da população está entre 9,20 e 12,60. Devido a singularidade da estatística de teste de Wilcoxon, você raramente consegue a confiança especificada. Em vez disso, o Minitab oferece o valor mais próximo (confiança alcançada ).

(10)

Teste de hipótese

Interpretação

A estatística Wilcoxon é 53,0 o teste indica um p valor de 0,453, portanto não se pode excluir a hipótese H0 de que o tempo seja igual a 12 minutos.

(11)

Exercício

Testes de Wilcoxon para 1 amostra

Time 10,9 15,0 11,9 8,8 8,2 14,8 9,2 8,8 16,0 15,2 15,9 9,2 9,2 7,7 8,0 12,5

(12)

Teste da mediana

Interpretação

Para os dados de antiácido:

· Com base na amostra, você quer saber se o antiácido recém desenvolvido alivia a dor em menos de 12 minutos. A hipótese é H0: mediana = 12,00 e H1: mediana<12,00

· A estatística Wilcoxon é 53,0 e o valor p associado é 0,227. O valor p é maior que 0,05, neste caso você não pode rejeitar H0 e conclui que o antiácido não alivia a dor significativamente mais rápido que 12 minutos.

(13)

Intervalo de Confiança

Usar o intervalo de confiança e procedimentos de teste de Mann-Whitney para duas amostras (também chamado de posto de duas amostras ou soma do posto de teste Wilcoxon de duas amostras) para fazer inferências sobre a diferença entre duas medianas de população com base em dados de duas amostras independentes, aleatórias.

Por exemplo, você pode determinar se

· O tempo de embalagem das duas máquinas de embalagem é o mesmo

· O tempo de alívio é o mesmo para dois analgésicos Suposições:

· As amostras são criadas aleatoriamente, cujas distribuições têm a mesma forma

· As duas amostras aleatórias são independentes

O teste de Mann-Whitney é uma alternativa não paramétrica ao teste t para duas amostras com variâncias de amostras combinadas.

(14)

A diferença entre as medianas da amostra é uma estimativa da diferença correspondente entre as medianas da população desconhecidas. O intervalo de confiança é uma amplitude aleatória de valores possíveis para a diferença nas medianas da população com base nos dados da amostra. Devido à singularidade da estatística do teste de Mann-Whitney para 2 amostras, você raramente poderá alcançar o intervalo de confiança especificado. Em vez disso, o Minitab fornece o valor mais perto.

(15)

Exemplo

Um departamento da rodovia estadual usa duas marcas de tinta para traçar faixas nas estradas. Um funcionário da rodovia quer saber se existe uma diferença entre as duas marcas de tinta. Para avaliar o problema, o funcionário registra o número de meses que as faixas aplicadas com cada marca de tinta duram na rodovia.

Teste de Mann-Whitney

Brand A Brand B 35,6 37,2 37,0 39,7 34,9 37,2 36,0 38,8 36,6 37,7 36,1 36,4 35,8 37,5 34,9 40,5 38,8 38,2 36,5 37,5 34,9

(16)

Exemplo

Teste de Mann-Whitney

Brand A Brand B 35,6 37,2 37,0 39,7 34,9 37,2 36,0 38,8 36,6 37,7 36,1 36,4 35,8 37,5 34,9 40,5 38,8 38,2 36,5 37,5 34,9

Como a hipótese H0 de normalidade não pode ser descartada para as duas marcas de tinta, pode-se fazer um teste “t” de hipótese.

(17)

Exemplo

Teste de Mann-Whitney

Brand A Brand B 35,6 37,2 37,0 39,7 34,9 37,2 36,0 38,8 36,6 37,7 36,1 36,4 35,8 37,5 34,9 40,5 38,8 38,2 36,5 37,5 34,9

Fazendo-se um teste “t” de hipóteses considerando-se variâncias iguais descartamos a hipótese de igualdade entre as marcas.

Observe-se que no teste “t” testamos as médias e em um teste não paramétrico testamos as medianas.

(18)

Exemplo

Testando agora por Mann-Whitney

Teste de Mann-Whitney

Brand A Brand B 35,6 37,2 37,0 39,7 34,9 37,2 36,0 38,8 36,6 37,7 36,1 36,4 35,8 37,5 34,9 40,5 38,8 38,2 36,5 37,5 34,9

(19)

Exemplo

Interpretação

Para os dados da tinta:

· Com base na sua amostra, você quer saber se o tempo que as faixas de tinta duram na rodovia é o mesmo para as duas marcas. A hipótese é H0: η1 = η2 e H1: η1 não é = η2.

· A estatística de Mann-Whitney é 76,5 e o valor-p associado é 0,0019. Como o valor-p é menor do que 0,05, você deve rejeitar H0 e concluir que os tempos da mediana são significativamente diferentes.

(20)

Exemplo

Interpretação

Para os dados de pintura, o intervalo de confiança lhe diz que você pode ter 95,5% de confiança de que a diferença entre as duas medianas da população é maior do que ou igual a –3.000 e menor ou igual a –0,901. Como 0 não está dentro do intervalo de confiança, você pode rejeitar H0 com 95,5% de confiança, e concluir que as duas medianas não são iguais.

(21)

Use o teste de Kruskal-Wallis para fazer inferências sobre a igualdade de medianas para duas ou mais populações com base nos dados de amostras independentes, aleatórias.

Ao usar o teste de Kruskal-Wallis você poderia, por exemplo, comparar:

· Salários de advogados empregados por corporações em três principais cidades

· Quantidades de leite produzidas por gado leiteiro alimentado com quatro dietas diferentes

Para usar o teste de Kruskal-Wallis:

· As amostras devem ser de populações cujas funções de distribuição têm a mesma forma e suas variâncias são iguais.

· As amostras devem ser aleatórias e independentes

· Cada amostra deve consistir em cinco ou mais medições

(22)

O teste de Kruskal-Wallis, como o teste de mediana de Mood, é uma alternativa não paramétrica à análise de variância com um fator (para o qual supomos que as populações que estão sendo amostradas também são normalmente distribuídas ).

Contudo, o teste de Kruskal-Wallis é mais poderoso do que o teste da mediana de Mood para dados de diversas distribuições, incluindo dados da distribuição normal, mas é menos robusto contra outliers .

(23)

Exemplo

Uma administradora de saúde quer comparar leitos desocupados de três hospitais localizados na mesma cidade. Ela seleciona aleatoriamente 11 dias diferentes dos registros de cada hospital e lista o número de leitos desocupados para cada dia.

Use a tabela de estatísticas individuais para avaliar as seguintes propriedades dos seus dados:

· N - o número de observações de cada nível do fator. · global - número total de observações.

· Mediana - mediana das observações de cada tratamento, que fornece uma estimativa das medianas da população para cada nível. · Atribuir postos Médio - estatística que classifica os níveis de dados e é usada para determinar a estatística de Kruskal-Wallis.

(24)

Exemplo

Teste de Kruskal-Wallis

Beds Hospital 6 1 37 1 3 1 17 1 11 1 30 1 15 1 16 1 29 1 25 1 5 1 34 2 28 2 41 2 13 2 40 2 31 2 9 2 32 2 39 2 27 2 31 2 13 3 35 3 19 3 4 3 29 3 0 3 7 3 5 3 33 3 17 3 24 3

(25)

Teste de normalidade dos dados

Teste de Kruskal-Wallis

Beds Hospital 6 1 37 1 3 1 17 1 11 1 30 1 15 1 16 1 29 1 25 1 5 1 34 2 28 2 41 2 13 2 40 2 31 2 9 2 32 2 39 2 27 2 31 2 13 3 35 3 19 3 4 3 29 3 0 3 7 3 5 3 33 3 17 3 24 3

Como os p valores para deram todos maiores do que 0,05, não se pode descartar a hipótese H0 de normalidade dos dados.

(26)

Teste ANOVA

Teste de Kruskal-Wallis

Testando pelo ANOVA observa-se que há diferença entre as taxas de ocupação dos leitos dos três hospitais. 3 2 1 40 35 30 25 20 15 10 Hospital Be ds

Interval Plot of Beds vs Hospital

95% CI for the Mean

(27)

Teste de igualdade de medianas de Kruskal-Wallis

Teste de Kruskal-Wallis

Beds Hospital 6 1 37 1 3 1 17 1 11 1 30 1 15 1 16 1 29 1 25 1 5 1 34 2 28 2 41 2 13 2 40 2 31 2 9 2 32 2 39 2 27 2 31 2 13 3 35 3 19 3 4 3 29 3 0 3 7 3 5 3 33 3 17 3 24 3

(28)

Teste de igualdade de medianas de Kruskal-Wallis

(29)

Para os dados de leitos, você quer determinar se não existe diferença no número de leitos ocupados em três hospitais. As hipóteses são:

· H0: Não existe diferença nas medianas das populações

· H1: Existe uma diferença entre pelo menos duas medianas da população

(30)

Os resultados das análises de dados de leitos indicam que:

· O número da mediana de leitos desocupados é o menor no hospital 1 (16,00) e o maior no hospital 2 (31,00).

· Dois hospitais tem leitos ocupados entre (14,0 e 13,7) próximo ao posto médio (17,0) enquanto o posto do hospital 2 é 23,3, que pode indicar que a taxa de ocupação do hospital 2 é diferente dos outros dois. O posto médio ou Ave Rank é calculado pelo teste de Kruskal Wallis.

(31)

O teste de Kruskal-Wallis fornece duas estatísticas que você pode usar para conduzir um teste de tratamento de efeitos: a estatística de Friedman (S ) e o valor-p (P ). A estatística de Friedman não é muito informativa por si, mas ela é usada para determinar o valor-p.

(32)

Teste de Kruskal-Wallis

Se P for menor do que ou igual ao nível alfa predeterminado, um ou mais tratamentos têm efeitos significativos (isto é, dois ou mais medianas de tratamento são diferentes).

· Se P for maior do que o nível alfa predeterminado, nenhum dos efeitos do tratamento são significativos (isto é, as medianas de tratamento são todas iguais).

Se os resultados do teste de Kruskal-Wallis indicam diferenças significativas do tratamento, você pode examinar as estatísticas individuais para aprender mais sobre as diferenças.

(33)

Teste de Kruskal-Wallis

A estatística de Kruskal-Wallis para os dados de leitos é 7,05 e o valor-p é 0,029 (ambos os valores são os mesmos quando eles são ajustados para empates. Como o valor-p é bastante pequeno (menor do que 0,05), o teste é significativo. Desta forma, você pode concluir que o número de leitos desocupados difere nos três hospitais.

(34)

Teste de mediana de Mood

Use o teste de Mood para a mediana (também chamado de um teste de mediana ou escores de sinal) para fazer inferências sobre a igualdade de medianas para duas ou mais populações, com base em dados de amostras aleatórias, independentes.

Por exemplo, usando o teste de Mood para a mediana, você pode comparar:

· Quanto tempo leva um ser humano para se recuperar os tipos comuns de virus influenza (Victoria A, Texas, Rússia)

(35)

Teste de mediana de Mood

Para usar o teste da Mood para a mediana:

· As amostras devem ser de populações cujas funções de distribuição têm a mesma forma e suas variâncias são iguais

· As amostras devem ser aleatórias e independentes

O teste de Mood para a mediana é uma alternativa não paramétrica para uma análise unidirecional de variância (da qual assumimos que as populações que estão sendo amostradas também são normalmente distribuídas ).

O teste de Mood para a mediana é robusto contra outliers e erros nos dados e é particularmente apropriado nos estágios preliminares da análise. O teste de Mood para a mediana é mais robusto do que é o teste de Kruskal-Wallis contra outliers, mas é menos poderoso para dados de diversas distribuições, incluindo a normal.

(36)

Teste de mediana de Mood

Exemplo

Um grupo ambiental quer determinar se as alterações de temperatura na água do mar, perto de uma usina nuclear terão um efeito significativo sobre a vida animal na região. O grupo divide aleatoriamente 25 amostras de uma certa espécie de peixe em 4 grupos e os coloca em ambientes separados de simulação de oceano, que são idênticos em todos os sentidos, exceto pela temperatura da água. Seis meses depois, eles pesam os peixes. Weight Temp 22 38 18 38 22 38 24 38 16 38 18 38 19 38 15 42 21 42 26 42 16 42 25 42 17 42 14 46 28 46 21 46 19 46 24 46 23 46 17 50 18 50 13 50 20 50 21 50 18 50

(37)

Teste de mediana de Mood

Exemplo - Teste de igualdade de medianas

O teste de Mood para a mediana fornece duas estatísticas que você pode usar para conduzir um teste da igualdade das medianas da população a estatística Qui-Quadrado e o valor-p (P ). A estatística qui-quadrado não é muito informativa por si, mas ela é usada para determinar o valor-p. Este valor informa se o nível das medianas são significativamente diferentes entre si:

· Se P é menor ou igual ao nível alfa predeterminado, duas ou mais medianas são significativamente diferentes.

· Se P é maior que o nível alfa predeterminado, as medianas não são significativamente diferentes.

Se o teste de Mood para a mediana não indicar diferenças significativas, examine as estatísticas individuais e intervalos de confiança para saber mais sobre as diferenças.

(38)

Teste de mediana de Mood

(39)

Teste de mediana de Mood

Exemplo - Teste de igualdade de medianas

Os dados qui-quadrados para os peixes são de 1,44 e o valor p é de 0,697. Porque o valor-p é muito grande (maior que o comum nível alfa de 0,05), o teste não é significativo. Assim, você não pode concluir que as mudanças na temperatura afetam os pesos dos peixes.

(40)

Teste de mediana de Mood

Exemplo - Teste de Intervalos de Confiança

O Minitab apresenta intervalos de confiança de 95% para cada nível do fator. Quando o valor-p na tabela de análise de variância indica uma diferença entre as medianas de nível do fator, você pode usar a tabela de intervalos de confiança individuais para explorar as diferenças:

(41)

Teste de mediana de Mood

· O sinal * entre parênteses representa a mediana de amostra para cada nível de fator.

· Cada conjunto de parênteses inclui um intervalo de confiança de 95% da mediana da população. Você pode ter 95% de confiança de que a mediana da população para cada grupo está dentro de cada intervalo correspondente. · Se os intervalos para duas medianas não estão sobrepostos, então as medianas da população são diferentes.

(42)

Teste de mediana de Mood

Nos resultados do peso dos peixes, os intervalos para todas as medianas se sobrepõem, sugerindo que as medianas de população não diferem entre os grupos.

(43)

Teste de mediana de Mood

Use a tabela individual para avaliar as seguintes propriedades dos dados:

N<= - O número de observações em cada nível que são menores ou iguais a mediana geral.

N>= - O número de observações em cada nível que são maiores do que a mediana geral.

Median – A mediana de cada nível.

Q3-Q1 – A amplitude interquartílica para cada nível. Como a variância indica a dispersão dos dados. O teste de Mood’s assume amplitudes iguais. Caso as amplitudes se diferenciam muito, pode-se querer testar a igualdade.

(44)

Teste de mediana de Mood

Relação entre tipo de virus e tempo de internação. Dados no arquivo excel virus_x_tempo_internacao.

(45)

Teste de mediana de Mood

Relação entre tipo de virus e tempo de internação. Dados no arquivo excel virus_x_tempo_internacao.

(46)

Teste de Friedman

Use o teste de Friedman para fazer inferências sobre os efeitos do tratamento em um experimento com blocos aleatórios.

Por exemplo, você pode:

· Determinar a eficácia dos três tratamentos usando um design de bloco aleatorizado (cada tratamento é aleatoriamente atribuído a cada paciente no experimento).

· Compare a popularidade de quatro carros domésticos pequenos em uma cidade (cada entrevistado é solicitado a classificar os quatro tipos de carros).

(47)

Teste de Friedman

Para usar o teste de Friedman,

· As respostas de cada combinação de tratamento de bloco devem ser de populações cujas funções de distribuição têm a mesma forma e variâncias iguais.

· Os tratamentos devem ser aleatoriamente atribuídos a unidades experimentais dentro dos blocos

· Cada combinação de bloco de tratamento deve ter exatamente uma observação não faltante

O teste de Friedman é uma alternativa não paramétrica à análise de variância com dois fatores (para os quais também supomos que a resposta é normalmente distribuída para cada combinação de tratamento de bloco).

Os resultados empíricos mostram que a análise é adequada se ambos o números de blocos ou o número de tratamentos no design do bloco aleatorizado exceder 5.

(48)

Teste de Friedman

Exemplo - Teste de Hipóteses

Uma empresa de marketing quer comparar a eficácia relativa dos três modos diferentes de publicidade: publicidade por mala direta, jornal e revista. A empresa conduziu um experimento de bloco aleatorizado . Para 12 clientes, a empresa de marketing usou todos os 3 modos durante um período de 1 ano e registrou a resposta da porcentagem do ano para cada tipo de publicidade.

Response Company Advtype 7,2 1 direct-mail 9,4 2 direct-mail 4,3 3 direct-mail 11,3 4 direct-mail 3,3 5 direct-mail 4,2 6 direct-mail 5,9 7 direct-mail 6,2 8 direct-mail 4,3 9 direct-mail 10,0 10 direct-mail 2,2 11 direct-mail 6,3 12 direct-mail 10,1 1 magazine 8,2 2 magazine 5,1 3 magazine 6,5 4 magazine 8,7 5 magazine 6,0 6 magazine 12,3 7 magazine 11,1 8 magazine 6,0 9 magazine 12,1 10 magazine 6,3 11 magazine 4,3 12 magazine 15,7 1 newspaper 18,3 2 newspaper 11,2 3 newspaper 19,0 4 newspaper 9,2 5 newspaper 10,5 6 newspaper 8,7 7 newspaper 14,3 8 newspaper 3,1 9 newspaper 18,8 10 newspaper 5,7 11 newspaper 20,2 12 newspaper

(49)

Teste de Friedman

Para os dados de publicidade, você quer determinar se não existe diferença nos três modos de publicidade. As hipóteses são:

O teste de Friedman fornece duas estatísticas que você pode usar para conduzir um teste de tratamento de efeitos: a estatística de Friedman (S ) e o valor-p (P ). A estatística de Friedman não é muito informativa por si, mas ela é usada para determinar o valor-p.

(50)

Teste de Friedman

· Se P for menor do que ou igual ao nível alfa predeterminado, um ou mais tratamentos têm efeitos significativos (isto é, dois ou mais medianas de tratamento são diferentes).

· Se P for maior do que o nível alfa predeterminado, nenhum dos efeitos do tratamento são significativos (isto é, todas as medianas de tratamento são iguais).

Se os resultados do teste de Friedman indicam efeitos significativos do tratamento, você pode examinar as estatísticas individuais para aprender mais sobre elas.

(51)

Teste de Friedman

(52)

Teste de Friedman

Exemplo - Teste de Hipóteses Interpretação

A estatística de Friedman para os dados de publicidade é 10,67 e o valor-p é 0,005. Como o valor-p é bem pequeno (menor do que o nível a comum de 0,05), o teste é significativo; desta forma, você conclui que pelo menos um dos três modos de publicidade têm um efeito diferente.

(53)

Teste de Friedman

(54)

Teste de Friedman

Use a tabela de estatísticas individuais para avaliar as seguintes propriedades dos seus dados:

· N - o número de observações de cada tratamento (o número de blocos)

· Mediana Est - mediana das observações de cada tratamento, que fornece uma estimativa das medianas da população para cada tratamento

· Soma dos postos - Soma dos postos de tratamento, quando tratados dentro de cada bloco, que pode servir como uma medida do tamanho relativo das medianas de tratamento e são usadas no cálculo da estatística de teste

(55)

Teste de Friedman

Os resultados da análise de dados de publicidade indicam que:

· A resposta da mediana é a menor para publicidade por mala direta (6,10) e a maior para publicidade por jornal (13,30).

· _{As respostas da} mediana para mala direta (6,10) e revista (8,15) estão perto da

mediana global

(9,183), enquanto a resposta da mediana para publicidade por jornal (13,30) é bem diferente ( a maior). A publicidade por jornal pode ser preferível.