• Nenhum resultado encontrado

Stela Adami Vayego DEST/UFPR

N/A
N/A
Protected

Academic year: 2021

Share "Stela Adami Vayego DEST/UFPR"

Copied!
5
0
0

Texto

(1)

Testes de hipóteses não paramétricos

Os métodos não-paramétricos fazem poucas suposições sobre a natureza das distribuições dos dados. Não exige que as distribuições nas populações sejam normais, nem são baseados em parâmetros (estimadores) da população. Os testes não-paramétricos são denominados métodos de distribuição livre (free distribution).

Vantagens: As técnicas não-paramétricas têm diversas vantagens sobre os métodos paramétricos de inferência

estatística. Uma delas é que não incorporam todas as suposições restritivas características dos testes paramétricos, nem exigem que as populações sejam normalmente distribuídas. Os testes não paramétricos, em geral, exigem apenas que a variável em estudo seja ordenável, podendo ser aplicado também para variáveis semiquantitativas e qualitativas. Além disso, por tratarem de ordenações em vez de valores reais das observações, os testes paramétricos podem ser realizados de modo relativamente rápido para pequenas amostras. O uso de postos torna as técnicas não-paramétricas menos sensíveis aos erros de medidas do que os testes paramétricos, permitindo assim o uso de ordinais em vez de dados contínuos.

Desvantagens: Se as suposições básicas de um teste paramétrico são satisfeitas, os testes não-paramétricos

são menos poderosos do que a técnica paramétrica correspondente, o que significa que, se a hipótese nula for falsa, o teste não-paramétrico exigirá uma amostra maior para fornecer evidências suficientes para rejeitá-la. Além disso, hipóteses testadas por testes não-paramétricos tendem a ser menos específicas do que as testadas por testes tradicionais. Como contam com ordenações em vez de valores das observações, os testes não paramétricos não usam toda informação disponível sobre a distribuição. Finalmente, se uma grande proporção de observações são empatadas os desvios-padrão, superestimam os valores da estatística de teste, e correções precisam ser adicionadas aos cálculos.

11.1. Teste de aderência (Qui-quadrado)

útil para verificar se a distribuição das freqüências observadas dos dados se ajusta a um modelo teórico pré-determinado;

recomendado para amostras grandes ( n > 50 ) e tem por finalidade comparar se as freqüências observadas na amostra estão próximas das freqüências esperadas para um modelo de probabilidade proposto (normal, binomial, poisson, etc);

se as freqüências esperadas não diferirem estatisticamente das freqüências observadas, pode-se inferir que a característica em estudo da população seguem a distribuição proposta; de outra maneira, possui distribuição diversa.

O teste que mede a eficiência do ajuste da distribuição, ou seja, o quanto a freqüência observada está próxima da freqüência esperada, daí o nome de aderência, é o teste de Qui-quadrado



2

.

As hipóteses a serem testadas são:

H0 : As freqüências observadas não diferem das freqüências esperadas em relação à distribuição proposta, ou

seja, a característica em estudo da população segue a distribuição proposta. vs

HA : As freqüências observadas diferem das freqüências esperadas em relação à distribuição proposta,ou seja, a

(2)

A estatística de teste, que tem distribuição de Qui-quadrado com v = k – p – 1 graus de liberdade (sendo k = ao número de classes da distribuição de freqüência e p = ao número de parâmetros estimados ), supondo H0

verdadeira, é dada por:

2

=

[

Oi

−E

i

2

E

i

]

,

onde

Oi : freqüências observadas na i-ésima classe;

Ei = n . pi : freqüências esperadas na i-ésima classe, supondo H0 verdadeira, sendo pi é a probabilidade de

ocorrência na classe considerada.

A hipótese nula (H0), será rejeitada, ao nível de significância estipulado, quando

obs2

 

2v ; , caso

contrário, não rejeita-se H0.

Exemplo 1: Na geração F2 de um experimento genético com tomates, foram encontrados 3629 frutos vermelhos e

1175 amarelos. É estatisticamente possível aceitar este resultado como compatível com a hipótese de controle genético por dois alelos com dominância completa?

Relembrando Genética: Dominância Completa (exemplo 1) Ausência de Dominância (exemplo 2) Ausência de Dominância

(exemplo pelagem em camundongos)

alelo A = vermelho alelo a = amarelo Pais = Aa x Aa

Progênie = ¼ AA; ¼ Aa, ¼ Aa; ¼ aa Fenótipo = ¾ vermelho e ¼ amarelo (3:1)

alelo A = vermelho alelo a = braco Pais = Aa x Aa

Progênie = ¼ AA; ¼ Aa, ¼ Aa; ¼ aa Fenótipo = ¼ vermelho, ½ rosilho e ¼ amarelo (1:2:1)

alelo A = pelagem amarela alelo a = pelagem aguti Pais = Aa x Aa

Progênie = ¼ AA (letal); ¼ Aa, ¼ Aa; ¼ aa Fenótipo = 2/3 amarela e 1/3 aguti (2:1)

Resolução:

OA = 3629 (freq. Observada de tomates vermelhos), Oa = 1175 (freq. Observada de tomates amarelos), n = 4804

EA = 4804x0,75 = 3603 (freq. esperada de tomates vermelhos) e

Ea = 4804x0,25 = 1201 (freq. esperada de tomates amarelos)

Portanto:

2

=

O

A

E

A

2

E

A

O

a

E

a

2

E

a =

=

3629−3603

2

3603

1175−1201

2

1201

= 0,75 não significativo.

Exemplo 2. Na raça bovina Shorthorn, o cruzamento de um touro com pelagem vermelha com uma vaca de

pelagem branca, produz descendentes com pelagem rosilha (o rosilho é heterozigoto entre o vermelho e branco). Considere que a cor da pelagem seja controlada por dois alelos que apresentam ausência de dominância. Numa contagem de 400 animais, desta raça, observou-se 108 vermelhos, 244 rosilhos e 48 de brancos. Esses resultados são compatíveis com a hipótese genotípica de 1:2:1?

Resolução:

OA = 108 (freq. Observada de animais vermelhos), OR = 244 (freq. Observada de animais rosilhos) Oa = 48 (freq.

Observada de animais brancos), n = 400

(3)

EA = 400x0,25 = 100 (freq. esperada de animais vermelhos)

ER = 400x0,50 = 200 (freq. esperada de animais rosilhos) e

Ea = 400x0,25 = 100 (freq. esperada de animais brancos)

Portanto:

2

=

O

A

E

A

2

E

A

O

R

E

R

2

E

R

O

a

E

a

2

E

a =

=

108−100

2

100

244−200

2

200

48−100

2

100

= 37,36 significativo.

Exemplo 3. Verificar se a população apresentando as frequências genotípicas: AA = 72, Aa = 1104, aa = 24,está

em equilíbrio de Hardy-Weinberg. Considerando p = 0,52 e q = 0,48.

Resolução: OAA = 72, Oaa = 1104, Oaa = 24 EAA = 1200x0,27 = 324, EAa = 1200x0,50 = 600, Eaa = 1200x0,23 = 276 Portanto:

2

=

O

AA

E

AA

2

E

A

O

Aa

E

Aa

2

E

Aa

O

aa

E

aa

2

E

aa =

=

72−324 

2

324

1104−600

2

600

24−276

2

276

= 849, 44 significativo.

(4)

G1 G2 8 10 3 3 0 0 21 20 4 4 0 0 10 6 30 26 8 7 1 0 40 35 17 14 6 1 7 4 18 19 1 0 4 5 95 90 8 0 7 5 2 0 38 36 24 27 5 7 57 56 15 11 60 52 10 8 7 4 15 16

11.4. Teste U de Mann Whitney para duas amostras independentes

Alternativa para o teste t.

Para grandes amostras procedimento é:

considerar n1 como o tamanho amostral do menor grupo e n2 o tamanho amostral do maior grupo (se

n

1

diferente de n

2) e n = n1 + n2;

atribuir postos à distribuição conjunta dos valores dos dois grupos. Estes postos irão de 1 até n se não ocorrerem empates. No caso de ocorrência de empates, utilizar a média dos postos;

calcular a soma dos postos nos dois grupos (R1 e R2);

calcular as estatísticas U1 e U2, dadas por:

U

1

=

n

1

n

2

n

1

n

1

1

2

R

1e

U

2

=

n

1

n

2

n

1

n

1

1

2

R

2;

denomina-se U como o menor valor entre U1 e U2;

para grande amostras (pelo menos 10 em cada grupo), a estatística do teste U tem distribuição aproximadamente normal com média

U

=

n

1

n

2

2

e desvio padrão

U

=

n

1

n

2

n

1

n

2

1

12

, de modo que

Z =

U −

U

U ~N(0; 1);

calcular o valor de Z e verificar sua significância.

Exemplo 11.6: A avaliação clínica de pacientes submetidos a cirurgia foi feita considerando a variável estado

geral do paciente, que pode assumir os valores: 1(péssimo), 2(ruim), 3(regular), 4(bom) e 5(ótimo). Para comparar dois tipos de cirurgia, 40 pacientes homogêneos quanto à gravidade da doença e outros possíveis fatores interferentes (idade, sexo) foram utilizados, sendo 20 aleatoriamente designados a cada grupo. Um dos pacientes de G1 não foi avaliado. Foram obtidos os dados apresentados na tabela a seguir.

(5)

G1 G2 1 1 1 1 2 1 2 2 2 3 2 3 2 3 3 3 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 5 3 5 5 5 5 5 5

Referências

Documentos relacionados

Portanto não deveria ser estranho, para um estudioso de Peirce, aceitar o convite de subir no “bote do musement ” e imaginar que os conceitos da Ética, que valem

A maneira expositiva das manifestações patológicas evidencia a formação de fissuras devido a movimentação térmica das paredes, Figura 9, que não foram dimensionadas com

A Lei Federal nº 11.738/2008 instituiu um piso mínimo para os professores do País, de R$ 975,00 para 40 horas (R$ 475,00 para 20 horas), devendo ser, a partir de 2010, o

Nome do produto obrigatório Nome da variedade opcional Método de elaboração opcional Conteúdo da garrafa obrigatório % de álcool em volume obrigatório MARCA MARCA MARCA.. Vinho

Em relação aos óbitos perinatais reduzíveis por atenção ao RN, as GERES I e II apresentaram tendência significativa de redução dos percentuais de óbitos,

Vamos escrever juntos uma lista de desejos para as férias do verão, o professor deve ajudar os alunos a encontrarem dez coisas que eles desejam muito fazer na hora de aproveitar

É o único relógio a dispor de três funções de viagem di- ferentes: fuso principal completo (hora, minutos, segun- dos, data, dia/noite), segundo fuso horário geográfico

Em conseqüência da minha presença a várias sessões recentes, durante as quais os Srs. Crookes e Varley dirigiram uma fraca corrente elétrica através do corpo