• Nenhum resultado encontrado

CAPÍTULO I A TEORIA DA ATIVIDADE E A GÊNESE INSTRUMENTAL

2.9. Tipos de erros

Sempre que se decide rejeitar H0 em determinado nível de significância, há a chance de

tomar a decisão errada. Assim, dois possíveis tipos de erros podem ocorrer quando se realiza um teste estatístico para aceitar um e rejeitar H0. Pode-se rejeitar a hipótese H0,

quando ela é verdadeira (Erro Tipo I), ou aceitar H0, quando ela é falsa (Erro Tipo II).

A probabilidade de se cometer o Erro Tipo I é α. A probabilidade de se cometer o Erro Tipo II é β. O Quadro 4 sintetiza os possíveis tipos de erros.

Quadro 4. Tipos de erros na análise de hipótese (MARTINS; THEÓPHILO, 2009)

De acordo com o Quadro 4, o Erro Tipo I só pode ser cometido quando se rejeita

H0, enquanto o Erro Tipo II pode ocorrer quando se aceita H0. O pesquisador deve

tomar a decisão desejada com relação aos dois tipos de erros. A redução dos erros pode ser obtida pelo aumento do tamanho da amostra. Para o mesmo tamanho de amostra, a probabilidade de ocorrer o Erro Tipo II aumenta à medida que diminui a probabilidade de Erro Tipo I, e vice-versa.

A fim de exemplificar o conceito dos erros no Teste de Hipóteses, considera-sea curva normal que se deseja testar. O Teste consiste em verificar, por amostra, se a média da população atende ao caso (testar diferença, valor inferior ou valor superior a uma referência para a média), para certo nível de significância.

Realidade

H0 verdadeira H0 falsa

Decisão

Aceitar H0 Decisão correta

(1- α)

Erro tipo II – probabilidade β

Rejeitar H0 Erro tipo I –

probabilidade α

Decisão correta (1- β)

Em estatística um resultado é significante e, portanto, tem significância

estatística, se for improvável que tenha ocorrido por acaso (que em probabilidade é tratado pelo conceito de chance), se determinada hipótese nula for verdadeira, mas não improvável, caso a hipótese base seja falsa. Portanto a diferença é suficientemente grande para ser generalizada para as populações das quais as amostras foram derivadas. Desse modo, estatisticamente significativo não significa necessariamente importante em sua essência; tampouco indica algo a respeito do tamanho da diferença na população. Em amostras grandes, uma diferença pequena pode ser estatisticamente significativa; em amostras pequenas, uma diferença grande pode ser consequência de um erro amostral.

Para determinar se uma diferença amostral obtida é estatisticamente significativa – se é o resultado da diferença de população real e não apenas erro amostral – é costume estabelecer um nível de significância. Nível de significância é a probabilidade de rejeitar a hipótese nula quando ela é efetivamente verdadeira (Erro). No caso é o nível de significância que representa a probabilidade de Erro Tipo I, ou seja, é a probabilidade de rejeitaruma hipótese verdadeira e aceitar a hipótese alternativa. Assim, a partir de se define o valor crítico e a região (a área) de probabilidades para rejeição de H0.

Quando uma probabilidade é um valor no limiar ou dentro da região crítica, ele é denominado valor-p. Em resumo, o nível de significância de um resultado é chamado de

e não deve ser confundido com o valor p.

O valor p é definido como a probabilidade de se obter uma estatística de teste igual àquela observada em uma amostra ou mais extrema que ela, assumindo verdadeira a hipótese nula.

Ao testar hipóteses, um pesquisador decide com antecedência o valor alfa. Essa escolha é feita pela ponderação das implicações dos Erros Tipo I e Tipo II ou é simplesmente feita por convenção, isto é, = 0.05 (5%). Por exemplo, pode-se escolher um nível de significância de 5% e calcular um valor crítico de um parâmetro (por exemplo, a média) de modo que a probabilidade de ela exceder esse valor, dada a verdade da hipótese nula, seja 5%. Se o valor estatístico calculado (ou seja, o nível de

5% de significância anteriormente escolhido) exceder o valor crítico, então é significante “ao nível de 5%”.

Se o nível de significância (ex: 5% anteriormente dado) é menor, o valor é menos provavelmente um extremo em relação ao valor crítico. Desse modo, um resultado que é “significante no nível de 1%” é mais significante do que um resultado que é significante “no nível de 5%”. No entanto um teste no nível de 1% é mais susceptível de padecer do Erro Tipo II do que um teste de 5% e por isso terá menos poder estatístico.

Ao divisar um Teste de Hipóteses, o pesquisador deve tentar maximizar o poder de dada à significância, mas ultimamente tem de reconhecer que o melhor resultado que se pode obter é um compromisso entre significância e poder, em outras palavras, entre os Erros de Tipo I e Tipo II. A Figura 7 mostra esses conceitos e, para tanto, vai ser considerada a distribuição normal para avaliar as probabilidades de H0 e H1.

Figura 7. Distribuição normal para nível de significância bilateral em 5%

A Figura 7 representa uma curva para a distribuição de probabilidade normal, sendo o eixo horizontal valores de Z. O teste z é um teste estatístico capaz de determinar a média populacional. Ele pode ser usado: (1) quando a população for normal e “s”

(desvio padrão amostral) for conhecido ou (2) quando o tamanho da amostra, “n”, é de pelo menos 30.

A Figura 7 exemplifica o teste de hipótese em nível de significância de 5%, isto é, rejeita-se a hipótese nula se uma diferença amostral obtida ocorrer ao acaso menos de 5 vezes em 100. A área sombreada representa a probabilidade máxima de H0 ocorrer –

faixa de aceitação de H0 e de variação amostral – para = 0.05 (5%). No caso, o valor

de 95% sob a curva é delimitado pela distância de ± 1.96 desvio padrão a partir da média. O valor de 1.96 é denominado de valor crítico e é obtido a partir de uma tabela da curva normal Z. Para este caso o teste é bilateral, pois se avaliam ambas as extremidades da curva – região de rejeição – cujo somatório de áreas delimita o valor de 5% (área de 2.5% – /2 – em cada extremidade). Em teste unilateral, à esquerda ou à direita, o valor é o total de 5% em uma única extremidade, e isso depende da escolha do pesquisador.

Obtendo o valor de Z calculado (Zcalc) que excede 1.96 (isto é, z > 1.96 ou z < - 1.96), considera-se que ele é estatisticamente significativo, pois o valor de z dentro dessas áreas leva a rejeitar a hipótese nula. O Zcalc é obtido pela equação:

n s x Zcalc µ − = _ média da amostra

média esperada da população

desvio padrão da amostra tamanho da amostra

Em seguida, consulta- se a tabela da curva normal para o Z, correspondente ao caso da Figura 7, e o valor é de z = ± 2.12. Este é o valor-p e encontra-se dentro da região bilateral de 2.5% bilateral , ou seja, na área de rejeição, portanto se rejeita H0 se

Zcalc < Z /2 ou se Zcalc > Z /2.

Em estatística, a potência de um Teste de Hipóteses (STEVENSON, 1981) é a probabilidade de não cometer um Erro do Tipo II. Sendo β a probabilidade de cometer

um Erro do Tipo II, ou seja, a probabilidade de não rejeitar a hipótese nula quando esta é falsa, a potência do teste é dada por 1 – β. À medida que se diminui o nível de significância de um teste, diminui-se a sua potência. Para fins de cálculo da probabilidade de tal ocorrência, é preciso observar como a quantidade de uma distribuição de probabilidade amostral intercepta a região de aceitação. A Figura 8 exemplifica a potência de um Teste de Hipóteses.

Figura 8. Erro do Tipo II na função normal

A Figura 8 ilustra o teste de diferença de duas médias independentes (dois grupos) com base na curva normal, apresentando a probabilidade do Erro do Tipo II (β) para o valor crítico (Zcalc) de 1.66691. O eixo horizontal é o valor crítico e o vertical a probabilidade para a função normal. O teste é bilateral, ou seja, a probabilidade do Erro Tipo I (α) é distribuída em cada extremidade da curva (α/2). A figura foi obtida por meio do software Gpower 3.1, para um teste de tamanho amostral de 36 elementos para cada amostra. Neste caso, a probabilidade β é de 0.765353 e a potência (1-β) de 0.2534647.

O tamanho de um Erro Tipo II depende de quanto é falsa H0. Se for ligeiramente

falsa, a probabilidade de cometer um Erro do Tipo II é muito maior do que quando H0 é

muito falsa (isto é, o valor verdadeiro e o valor suposto são muito diferentes). No caso da Figura 8, quanto mais afastadas (deslocadas) estão as curvas uma da outra, mais significante é a diferença das médias, ou seja, a rejeição de H0.

A pesquisa utilizou do Teste de Hipótese para avaliar se, estatisticamente, houve mudanças ocorridas entre as frequências das TDIC disponibilizadas pelo professor entre pares de disciplinas consecutivas, ou seja, entre D1 e D2 e entre D2 e D3. Também foi calculada potência, que permitiu verificar qual o percentual de semelhanças ou diferenças de TDIC disponibilizadas pelo professor entre os mesmos pares de disciplinas. O Teste de Hipótese possibilitou observar o processo de adaptação e acomodação nos usos das TDIC pelo professor, sendo utilizado em conjunto com a função qui-quadrado.