• Nenhum resultado encontrado

CONCEITOS BÁSICOS DOS TESTES DE HIPÓTESE

No documento APOSTILA CURSO DE NUTRIÇÃO (páginas 37-46)

EXERCÍCIO SOBRE FREQÜÊNCIAS E MEDIDAS DE TENDÊNCIA CENTRAL 1) A tabela abaixo representa a temperatura de crianças (em o C) de uma amostra de 140 pacientes em

CONCEITOS BÁSICOS DOS TESTES DE HIPÓTESE

Tudo que estudamos até agora é a fundamentação para as inferências estatísticas, o qual é o processo pelo qual tiramos conclusões sobre uma população a partir de resultados observados em uma amostra.

A ―força‖ de uma inferência está relacionada com: a) o tamanho da amostra;

b) a variabilidade do fenômeno em estudo;

c) a variação amostral do resultado médio (VARIÂNCIA E DESVIO PADRÃO. Para se realizar uma inferência, geralmente, são testadas hipóteses.

Considere o seguinte exemplo:

A proporção de recém-nascidos com defeito ou doença séria é 3%. Imagine que um médico suspeita que esta proporção aumentou. Para estabelecer se esta suspeita é procedente, é preciso fazer um teste estatístico.

Elaboração das hipóteses: H0 = hipótese de nulidade :

____________________________________________________________________________________

H1 = hipótese alternativa :

____________________________________________________________________________________

Mas, a hipótese alternativa pode assumir uma das seguintes formas seguintes: a) H1 : 

b) H1: c) H1: 

A escolha de a ou b define um teste unicaudal, onde interessam apenas os afastamentos em uma dada direção. A escolha de c define um teste bicaudal onde interessam os afastamentos de X em relação a  em ambas as direções.

A estatística envolve métodos para o planejamento e condução de um estudo, descrição de dados coletados e para tomada de decisões, predições ou inferências sobre os fenômenos representados pelos dados.

A qualidade dos resultados de um estudo depende basicamente do planejamento e condução do estudo e da análise dos dados. Os métodos estatísticos para análise de dados podem ser classificados como métodos descritivos (Estatística descritiva) e métodos inferenciais (Estatística inferencial ou indutiva).

A Estatística descritiva foi vista no primeiro bimestre deste curso, a qual consiste de técnicas numéricas e gráficas para resumir a informação de um conjunto de dados de modo a torná-lo de mais fácil compreensão e interpretação, sem perder muito da informação original dos dados.

A Estatística inferencial, objeto de estudo deste segundo bimestre, consiste de procedimentos para fazer generalizações sobre as características de uma população a partir da informação contida na amostra. Antes de realizar qualquer inferência é preciso conhecer bem o conjunto de dados. Portanto, uma análise descritiva deve sempre preceder a uma análise inferencial.

A Estatística inferencial consiste de uma série de testes que verificam os padrões de uma certa população, tendo como base uma amostra representativa da mesma. Os testes estatísticos podem ser divididos em dois grandes grupos, conforme fundamentem ou não os seus cálculos na premissa de que a distribuição de freqüências dos erros amostrais é normal, as variâncias são homogêneas, os efeitos dos fatores de variação são aditivos e os erros independentes. Se tudo isso ocorrer, é muito provável que a amostra seja aceitavelmente simétrica, terá com certeza apenas um ponto máximo, centrado no intervalo de classe onde está a média da distribuição, e o seu histograma de freqüências terá um contorno que seguirá aproximadamente o desenho em forma de sino da curva normal. O cumprimento desses requisitos condiciona pois a primeira escolha do pesquisador, uma vez que, se forem preenchidos, ele poderá utilizar a estatística paramétrica, cujos testes são em geral mais poderosos do que os da estatística não-paramétrica, e conseqüentemente devem ter a preferência do investigador, quando o seu emprego for permitido.

Os termos paramétrico e não-paramétrico referem-se à média e ao desvio-padrão, que são os parâmetros que definem as populações que apresentam distribuição normal. É importante reafirmar este conceito, porque tem se visto muitas vezes artigos científicos, além de trabalhos e teses acadêmicas, em que se usaram testes não-paramétricos, mas os resultados eram apresentados em termos de média ± desvio-padrão da distribuição, ou então em termos de média ± erro-padrão da média, erro este que é também um valor calculado em função do desvio-padrão da amostra.

A afirmação anterior é de extrema importância, já que de qualquer conjunto de valores numéricos pode-se calcular a média, porém, desvio-padrão, somente as curvas normais o possuem, uma vez que, por definição, "desvio-padrão é o ponto de inflexão da curva normal" — e de mais nenhuma outra. São eles em número de dois e simétricos em relação à média da distribuição. Portanto, curvas assimétricas jamais podem ter desvio-padrão porque, mesmo que tenham pontos de inflexão, como os possuem muitas outras curvas matemáticas, eles dificilmente seriam simétricos em relação à média. Enfim, mesmo que distribuições experimentais possam apresentar alguma assimetria, esta deve manter- se dentro de certos limites, aceitáveis em termos estatísticos — e aceitáveis porque atribuídos à variação casual determinada pelos erros não-controlados de amostragem, ou seja, à variação do acaso, típica das variáveis e amostras chamadas aleatórias.

Qualquer que seja a opção do pesquisador, a essa altura de sua investigação científica ele se acha diante de mais um dilema: qual, dentre os muitos testes estatísticos existentes em ambas as categorias acima citadas, seria o mais apropriado, no caso específico de seu trabalho, ou do modelo matemático de seus ensaios? Que elementos desse modelo matemático condicionariam a opção por um ou outro desses testes?

Em geral a resposta está contida no próprio modelo experimental de cada pesquisa. Os detalhes adicionais que devem orientar a escolha do teste são:

a) a existência ou não de vinculação entre dois ou mais fatores de variação, ou seja, os dados são dependentes ou não entre si;

b) o número de componentes da amostra, que vão ser comparados.

De fato, seja qual for o tipo de estatística escolhida, paramétrica ou não-paramétrica, há testes especificamente destinados a amostras em que há independência entre os fatores de variação, e outros para amostras em que existe vinculação ou dependência entre eles (Ex. teste t para amostras independentes e teste t para amostras pareadas).

Da mesma forma, o número de comparações a serem realizadas pelo teste é também importante, porque há testes elaborados para comparar apenas duas amostras, e há outros destinados a comparações múltiplas, entendendo-se como múltiplas um número de comparações superior a dois.

O diagrama abaixo esquematiza as subdivisões dos testes estatísticos, listando os mais comumente utilizados na prática:

Alguns desses testes usam números como variável, outros usam sinais + e – , outros usam valores fixos, como 1 e 0, e outros ainda utilizam freqüências. Esses testes evidentemente estão todos incluídos no grupo dos testes não-paramétricos, simplesmente porque não usam os parâmetros média e desvio-padrão em seus cálculos.

Uma vez realizados os testes adequados, estes dão o seu parecer, sob a forma de um valor numérico, apresentado (conforme o teste) como valor de F (análise de variância), de t (teste t, de Student), U (Mann-Whitney), Q (teste de Cochran), ² (letra grega qui, testes diversos, que usam o chamado qui-quadrado), z (McNemar e Wilcoxon), H (Kruskal-Wallis), ou  (letra grega rho, utilizada nos testes de correlação, que serão focalizados mais adiante, neste texto).

Seja como for, o valor numérico calculado pelo teste deve ser confrontado com valores críticos, que constam em tabelas apropriadas a cada teste. Essas tabelas geralmente associam dois parâmetros, que permitem localizar o valor crítico tabelado: nível de probabilidades (usualmente 5 % [= 0,05], ou 1 % [ = 0,01]), e o número de graus de liberdade das amostras comparadas. Valores menores que o tabelado indicam que ele não pode ser considerado diferente do que se obteria se as amostras comparadas fossem iguais. Enfim, estaria configurado o que se chama de não-significância estatística, ou de aceitação da hipótese zero, ou de nulidade (H0).

Porém, se o valor calculado for igual ou maior que o tabelado, aceita-se a chamada hipótese alternativa (H1), ou seja, a hipótese de que as amostras comparadas não podem ser consideradas iguais, pois o valor calculado supera aquele que se deveria esperar, caso fossem iguais. Isso quer dizer que pode eventualmente haver alguma diferença, mas esta não deve ultrapassar determinados limites, dentro dos quais essa diferença decorre apenas da variação natural do acaso, típica da variação entre as repetições do ensaio.

No caso de o valor calculado ser maior do que o valor tabelado, diz-se que há significância estatística, que pode ser ao nível de 5 %, se o valor calculado for maior que o valor tabelado para 5 %, porém menor que o tabelado para 1 %. Ou ao nível de 1 %, caso o valor calculado seja igual ou maior que o valor tabelado para 1 %.

O teste t é utilizado para comparar duas populações, ou duas amostras. Existem dois tipos de aplicações:

 Teste t para observações independentes

 Teste t para observações pareadas Teste t para observações independentes

Se a variável em análise tem distribuição normal, aplica-se o teste t para comparar duas médias. Quais são as etapas de um teste t para observações independentes???

1o – Estabelecer as hipóteses

2o – Estabelecer o nível de significância Por exemplo:  = 0,05 ou 5%

3o – Indicar as médias dos dois grupos

X1 : média do grupo 1 X2 : média do grupo 2 4o – Indicar a variância de cada grupo

S12 = variância do grupo 1 S22 = variância do grupo 2 5o – Calcular a variância ponderada através da fórmula

S2 = (n-1) S12 + (n-1) S22 n1 + n2 – 2

onde:

n1 = é o número de elementos do grupo 1 n2 = é o número de elementos do grupo 2 6o – Calcular o valor de t, definido por

t = X2 - X1_______ S2 (1/n1 + 1/n2)

EXERCÍCIOS

1) Em uma empresa foi observado que alguns trabalhadores de um determinado setor estavam faltando muito. Constatou-se que 36 estavam acima do peso, o que causava alguns problemas que afetavam à regularidade dos trabalhadores. Estes foram então divididos em 2 grupos de 18 e levados a participar de programas de redução de peso. O 1º grupo (grupo 1) optou por mudar os hábitos alimentares e aumentar os exercícios. Já o 2º grupo (grupo 2) optou por tomar medicamentos redutores de apetite.

Abaixo há os valores da perda de peso dos integrantes após 2 anos do início do tratamento. Formule as hipóteses e explique o resultado obtido, utilizando o nível de significância ( ) igual a 5 %.

Tab. 1 – Perda de peso (em Kg) dos integrantes dos grupos 1 e 2 de tratamento

Grupo 1 Grupo 2 8,0 5,5 7,0 6,0 8,5 3,2 6,2 3,0 8,1 8,0 5,2 5,0 7,5 6,8 4,9 4,9 5,0 4,8 7,0 3,8 8,5 8,4 6,2 7,1 4,4 3,2 4,5 3,0 7,8 8,0 5,0 7,1 7,0 3,2 8,5 3,0 6,2 6,0

Para proceder ao teste t é pr é preciso:

a) estabelecer as hipóteses calcular:

b) a média de cada grupo c) a variância de cada grupo d) a variância ponderada e) o valor de

Após estes cálculos, é preciso:

f) comparar o valor calculado de t com o valor da tabela g) finalizar com a conclusão

2) Foram coletados dados sobre a média de sobrevida de 20 pessoas, sendo 11 da Noruega e 9 da Colônia Witmarsun, Paraná, Brasil. As médias e demais medidas de variabilidade estão tabuladas na Tabela 2.

Tabela 2 – Médias, variâncias e desvios-padrão da sobrevida de 9 pessoas do Brasil e 11 pessoas da Noruega.

Pontos Média Desvio-padrão Variância

Brasil 75,2 10,3 106,09

Noruega 85,7 14,5 210,25

Formule as hipóteses e explique a resposta, ao nível de significância de 10%.

Resp =t calc = 1,83 e t tab= 1,73 t calc > t tab. rejeita-se a Ho e aceita-se a H1: a média de sobrevida de

brasileiros e noruegueses é diferente, ou seja, brasileiros tem uma menor sobrevida do que os canadenses, ao nível de significância de 10% e 18 graus de liberdade.

3) A Tabela 3 apresenta o tamanho da amostra, a média e a variância dos pesos de CPU’s de duas empresas, A e B. Formule suas hipóteses, ao nível de significância de 1%.

Tabela 3 – Tamanho da amostra, média e variância de pesos (Kg) de CPU’s de duas empresas.

Empresa n x S2

A 14 3,253 0,261 B 13 3,130 0,265

Resposta S2p = 0,2629 t calc = 0,623 e t tab = 2,79 t calc.< t tab. aceita-se a Ho: a média dos pesos

Teste t para observações pareadas

Muitas vezes para estudar o efeito de um tratamento, comparam-se pares de indivíduos.

 Experimentos com controle e tratamento

 Dois lados de um mesmo indivíduos (tratamento contra cárie na arcada dentária)

 Observação de indivíduos em tempos diferentes (duas observações do mesmo indivíduo) Quais são as etapas de um teste t para observações pareadas???

1o – Estabelecer as hipóteses Ho: hipótese nula

H1: hipótese alternativa

2o – Estabelecer o nível de significância Por exemplo:  = 0,05 ou 5%

3o – Calcular a diferença entre os pares de observação d = x2 – x1 4o – Calcular a média das diferenças

d = d n 5o - variância das diferenças

S2 = d2 – (d)2/n n - 1 6o – Calcular o valor de t

t = d S2/n

Que está associado a n-1 graus de liberdade.

7o – Comparar o valor calculado de t com o valor da tabela, ao nível de significância estabelecido e com (n –1) graus de liberdade. Toda vez que o valor calculado de t, em valor absoluto, for igual ou maior do que o valor da tabela, conclui-se que as médias não são iguais, ao nível de significância estabelecido.

EXERCÍCIOS

4) Continuando o Exercício 1, após 2 anos do resultado obtido pelo tratamento descrito acima, o pesquisador responsável resolveu fazer mais um acompanhamento dos integrantes de cada grupo. Assim, convocou os participantes e relatou a perda de peso destes em relação à situação inicial, antes do tratamento descrito acima. Explique o que aconteceu com os diferentes grupos analisados após tal período de 4 anos. Formule as hipóteses e explique o resultado obtido, utilizando o nível de significância ( ) igual a 5 %.

Tab. 4 – Perda de peso (em Kg) dos integrantes dos grupos 1 e 2 após 4 anos do início do tratamento

preciso:

a) estabelecer as hipóteses calcular:

b) as diferenças entre os valores observados antes e depois da dieta; c) a média das diferenças; (d = - 3,333)

d) a variância das diferenças; (s = 25) e) o valor de t; (- 2,0)

e por fim:

f) Comparar o valor calculado de t (2,0) com o valor da tabela (3,36)

Grupo 1 5,0 5,5 3,6 3,0 7,0 5,0 6,0 5,2 4,5 3,0 8,0 7,0 2,5 3,3 7,1 6,5 2,0 3,0 6,5 Grupo 2 4,0 5,5 2,2 1,0 7,0 5,0 6,0 3,9 1,8 2,8 5,4 5,1 3,0 1,0 6,0 4,1 2,2 1,0 5,0

5. A primeira coluna da Tabela 5 apresenta dados de pressão exercida em um grupo de êmbolos de um aparelho de ginástica antes do processo de lubrificação. A segunda coluna representa os valores de pressão após a lubrificação dos mesmos. Teste a hipótese de que o uso de lubrificantes não tem efeito sobre a pressão exercida sobre os êmbolos. ( = 5%)

Tabela 5 – Pressão exercida sobre um grupo de êmbolos segundo o uso de lubrificantes (J)

Uso de lubrificantes Antes Depois 111 109 119 113 121 120 113 117 116 108 126 120 128 122 123 124 122 115 121 112

Resposta:d = - 4; S2 = 18,22; t calculado =- 2,96; t tabelado = 2,26 t calc > t tab

6. Consideremos os dados sobre batimento de pulso numa amostra de 10 estudantes de Ciências da Computação, do sexo masculino, onde a média foi de 67,9 e o desvio padrão de 1,66 batidas por minuto.

Um ano depois, foi calculada a média dos batimentos de pulso dos mesmos estudantes e obteve- se a média de 73,1 batidas por minuto e desvio padrão de 2,56. Os valores de batimentos de pulso deste ano é igual à média encontrada no ano anterior? ( = 10%) Obs: os dados brutos coletados estão na Tabela III.

Tabela 6 – Quantidade de batimentos de pulso numa amostra de 10 estudantes de Ciências da Computação, do sexo masculino, nos anos de 2000 e 2001.

2000 65 69 70 68 66 67 67 68 69 70

2001 70 74 75 72 73 78 72 74 69 74

Resposta: d = 5,2; S2 = 7,51; t calculado =6,00; t tabelado = 1,83 t calc > t tab são diferentes, rejeita-se a Ho: as médias dos dados de batimento de pulso numa amostra de 10 estudantes de Ciências da Computação, do sexo masculino, são diferentes.

No documento APOSTILA CURSO DE NUTRIÇÃO (páginas 37-46)

Documentos relacionados