Distribuição t de Student
Introdução
Quando o desvio padrão da população não é conhecido (o que é o caso, geralmente), usa-se o desvio padrão da amostra como estimativa, substituindo-usa-se
σ
x por Sx nas esquaçõespara intervalos de confiança e erros. Isto não acarreta maiores dificuldades, pois o desvio padrão amostral dá uma aproximação bastante razoável do verdadeiro valor, na maioria dos casos.
Pelo Teorema do Limite Central, temos que:
o Se a população sob amostragem tem distribuição normal, a distribuição das médias amostrais também será normal para todos os tamanhos de amostra. o Se a população básica é não-normal, a distribuição de médias amostrais será
aproximadamente normal para grandes amostras.
Pelo Teorema do Limite Central descrito acima, sabemos que, quando o tamanho da amostra é superior a 30, a distribuição das médias é aproximadamente normal. Todavia, para amostras de 30 ou menos observações, a aproximação normal não é adequada. Devemos então usar a distribuição t de Student, que é a distribuição correta quando se usa Sx.
A Distribuição t de Student
A distribuição t de Student, desenvolvida por William Sealy Gosset, é uma distribuição de probabilidade estatística.
O único parâmetro v que a define e caracteriza a sua forma é o número de graus de liberdade (ϕ).
O conceito de grau de liberdade tem alguma importância, mas não é dos mais simples de entender. Tentemos, então, através de um exemplo, das uma idéia do seu significado. Admitamos que a média de um conjunto de n=4 valores deve ser igual a 5. Para que isso aconteça, teremos que ter Σxi = 20. Se tivermos três valores já definidos, o quarto valor
deverá obrigatoriamente ser tal que a soma dos quatro valores, no final, seja igual a 20. Portanto, temos liberdade para escolher três dos quatro valores, mas o quarto valor não.
O mesmo ocorre em qualquer conjunto de dados amostrais. Quanto maior for esse parâmetro, mais próxima da normal ela será.
Em relação à distribuição do t-Student, a título meramente informativo, temos que, se Z for uma variável normal-padrão e Y uma distribuição qui-quadrado com
ϕ
graus de liberdade, então a variável aleatóriaϕ
Y
Z
Vale ressaltar que a distribuição t-Student se aproxima da normal quando aumenta o número de graus de liberdade.
A distribuição t é uma distribuição de probabilidade teórica. É simétrica, tem a forma de um sino semelhante à curva normal padrão, porém com caudas mais largas, ou seja, uma simulação da t de Student pode gerar valores mais extremos que uma simulação da normal.
Parâmetros da distribuição t de Student
Os parâmetros são os seguintes:
Média: E(t)=μ=0
Variância:
V(t)
=
σ
2=
2
−
ϕ
ϕ
,
ϕ>2
Desvio Padrão:
σ(t) =
2
−
ϕ
ϕ
Quando desejamos especificar que uma variável aleatória segue uma distribuição t de Student com
ϕ
graus de liberdade, usamos a notação:t ~ tϕ
Para ilustrar o uso da tabela da Figura 1, observe que as áreas
α
são os cabeçalhos das colunas e os graus de liberdadeϕ
são dados na coluna esquerda. Assim, o valor com 10 graus de liberdade, tendo uma área (probabilidade) de 0,05 para a direita é dada por:t10 = 1,81246
Podemos representar esse valor utilizando o enunciado de probabilidade, conforme segue:
P (t10 > 1,81246) = 5%
Na Figura 1, observe que, para uma área
α
igual a 2,5%, temos: P (t10 < 2,22814) = 1- 2,5% = 1-0,025 = 0,975 = 97,5% Uma vez que a distribuição t é simétrica em relação a zero, temos também que:
o P (t10 < -1,81246) = 5%
o P (t10 > -1,81246) = 95%
o P (t10 > -2,22814) = 97,5%
Figura 1
A tabela t de Student é apresentada a seguir:
t de Student
ϕ
0,4 0,25 0,1 0,05 0,03 0,025 0,02 0,01 0,005 1 0,3249 1,0000 3,0777 6,3138 10,5789 12,7062 15,8945 31,8205 63,6567 2 0,2887 0,8165 1,8856 2,9200 3,8964 4,3027 4,8487 6,9646 9,9248 3 0,2767 0,7649 1,6377 2,3534 2,9505 3,1824 3,4819 4,5407 5,8409 4 0,2707 0,7407 1,5332 2,1318 2,6008 2,7764 2,9985 3,7469 4,6041 5 0,2672 0,7267 1,4759 2,0150 2,4216 2,5706 2,7565 3,3649 4,0321 6 0,2648 0,7176 1,4398 1,9432 2,3133 2,4469 2,6122 3,1427 3,7074 7 0,2632 0,7111 1,4149 1,8946 2,2409 2,3646 2,5168 2,9980 3,4995 8 0,2619 0,7064 1,3968 1,8595 2,1892 2,3060 2,4490 2,8965 3,3554 9 0,2610 0,7027 1,3830 1,8331 2,1504 2,2622 2,3984 2,8214 3,2498 10 0,2602 0,6998 1,3722 1,8125 2,1202 2,2281 2,3593 2,7638 3,1693 11 0,2596 0,6974 1,3634 1,7959 2,0961 2,2010 2,3281 2,7181 3,1058 12 0,2590 0,6955 1,3562 1,7823 2,0764 2,1788 2,3027 2,6810 3,0545 13 0,2586 0,6938 1,3502 1,7709 2,0600 2,1604 2,2816 2,6503 3,0123 14 0,2582 0,6924 1,3450 1,7613 2,0462 2,1448 2,2638 2,6245 2,9768 15 0,2579 0,6912 1,3406 1,7531 2,0343 2,1314 2,2485 2,6025 2,9467 16 0,2576 0,6901 1,3368 1,7459 2,0240 2,1199 2,2354 2,5835 2,9208 17 0,2573 0,6892 1,3334 1,7396 2,0150 2,1098 2,2238 2,5669 2,8982 18 0,2571 0,6884 1,3304 1,7341 2,0071 2,1009 2,2137 2,5524 2,8784 19 0,2569 0,6876 1,3277 1,7291 2,0000 2,0930 2,2047 2,5395 2,8609 20 0,2567 0,6870 1,3253 1,7247 1,9937 2,0860 2,1967 2,5280 2,8453 21 0,2566 0,6864 1,3232 1,7207 1,9880 2,0796 2,1894 2,5176 2,8314 22 0,2564 0,6858 1,3212 1,7171 1,9829 2,0739 2,1829 2,5083 2,8188 23 0,2563 0,6853 1,3195 1,7139 1,9782 2,0687 2,1770 2,4999 2,8073 24 0,2562 0,6848 1,3178 1,7109 1,9740 2,0639 2,1715 2,4922 2,7969 25 0,2561 0,6844 1,3163 1,7081 1,9701 2,0595 2,1666 2,4851 2,7874 26 0,2560 0,6840 1,3150 1,7056 1,9665 2,0555 2,1620 2,4786 2,7787 27 0,2559 0,6837 1,3137 1,7033 1,9632 2,0518 2,1578 2,4727 2,7707 28 0,2558 0,6834 1,3125 1,7011 1,9601 2,0484 2,1539 2,4671 2,7633 29 0,2557 0,6830 1,3114 1,6991 1,9573 2,0452 2,1503 2,4620 2,7564 30 0,2556 0,6828 1,3104 1,6973 1,9546 2,0423 2,1470 2,4573 2,7500 31 0,2555 0,6825 1,3095 1,6955 1,9522 2,0395 2,1438 2,4528 2,7440 32 0,2555 0,6822 1,3086 1,6939 1,9499 2,0369 2,1409 2,4487 2,7385 33 0,2554 0,6820 1,3077 1,6924 1,9477 2,0345 2,1382 2,4448 2,7333 34 0,2553 0,6818 1,3070 1,6909 1,9457 2,0322 2,1356 2,4411 2,7284 35 0,2553 0,6816 1,3062 1,6896 1,9438 2,0301 2,1332 2,4377 2,7238 36 0,2552 0,6814 1,3055 1,6883 1,9419 2,0281 2,1309 2,4345 2,7195 37 0,2552 0,6812 1,3049 1,6871 1,9402 2,0262 2,1287 2,4314 2,7154 38 0,2551 0,6810 1,3042 1,6860 1,9386 2,0244 2,1267 2,4286 2,7116 39 0,2551 0,6808 1,3036 1,6849 1,9371 2,0227 2,1247 2,4258 2,7079Exemplos de aplicação:
1. Determine:
a. P (t11 < -1,3634) = ?
• Observando a linha dada por
ϕ
=11, procuramos o valor 1,3634. A partir desse valor, buscamos o título da coluna e encontramos 0,1 ou 10%. Mas observe que 10% é a área à direita de t = 1,3634. Entretanto, como o gráfico da distribuição t de Student é simétrico, a área à esquerda do valor -1,3634 também será 10%. Portanto, a resposta para esse exercício é 10%.b. 1º e 3º Quartis de uma distribuição t13.
• Começando pelo 1º Quartil, observe que esta medida separa um grupo em duas partes: a parte à esquerda com 25% e a parte à direita com 75%. Na tabela, como a área dada é sempre à direita da medida, deveríamos procurar a coluna cujo título é 75%. Não temos essa coluna. Entretanto, como o gráfico é simétrico em relação à média, teremos a seguinte situação:
25%
25%
-Q
1Q1
Observe que, se calcularmos o valor de –Q1, teremos automaticamente o
valor de Q1. A área à esquerda de Q1 é 0,25=25%, logo a área à direita de
–Q1 também é 0,25=25%. Se entrarmos na tabela com a linha igual a 13
(graus de liberdade) e com o valor da coluna 0,25, teremos o valor de –Q1
que é 0,6938. Portanto, o valor de Q1 é -0,6938.
Agora observe que, no caso de Q3, a distribuição fica com 75% à
esquerda de Q3 e com 25% à direita, que é a mesma área de –Q1 obtida no item anterior. Logo, o valor de Q3 é o mesmo de –Q1, ou seja, temos que Q3 = 0,6938.
c. t de forma que P (t16 > t) = 25%
• Observando a linha dada por