Centro Federal de Educa¸c˜ao Tecnol´ogica Celso Suckow da Fonseca – CEFET/RJ Disciplina: Estat´ıstica
Prof. Anna Regina Corbo
CAP´ITULO 1: Introdu¸c˜ao `a Estat´ıstica
1 Modelos Matem´ aticos
Para muitos fenˆomenos de interesse geral s˜ao constru´ıdos modelos matem´aticos, sempre com base na premissa:
CAUSA =⇒ EFEITO
Estes modelos podem ser divididos pelo seu tipo de natureza:
Determin´ıstica: sem incerteza.
Probabil´ıstica: com incerteza.
1.1 Modelos Determin´ısticos
Se o experimento ´e realizado sempre sob as mesmas condi¸c˜oes, os resultados ser˜ao sempre os mesmos.
Exemplo: Circuito El´etricoi= V R
1.2 Modelos Probabil´ısticos
As condi¸c˜oes do experimento definem o comportamento do resultado, isto ´e, mesmo reali- zando o experimento sob as mesmas condi¸c˜oes os resultados ser˜ao diferentes.
Exemplo: Tr´afego Telefˆonico
Quantos cabos s˜ao necess´arios para garantir que todas as liga¸c˜oes entre os terminais A e B sejam efetuadas?
Se n= 200⇒100% das liga¸c˜oes ser˜ao completadas;
Se n200⇒99% ou 95% das liga¸c˜oes ser˜ao completadas, o que ´e aceit´avel.
2 Estat´ıstica Descritiva
O objetivo ´e descrever dados atrav´es de gr´aficos, tabelas, medidas num´ericas etc.
2.1 Conceitos B´asicos
Popula¸c˜ao: cole¸c˜ao de todos os elementos cujas caracter´ısticas desejamos estudar.
Amostra: subconjunto de elementos cujas caracter´ısticas ser˜ao medidas.
Exemplo: Popula¸c˜ao: Eleitores do RJ
Amostra: 650 eleitores
Caracter´ıstica (ou Vari´avel): percentual que pretende votar no candidatoX.
2.2 T´ecnicas de descri¸c˜ao gr´afica
Para descrever graficamente um conjunto de dados ´e necess´ario verificar a frequˆencia dos valores existentes na vari´avel.
Frequˆencia fi ´e o n´umero de vezes que um valor i foi observado em uma vari´avel. ´E f´acil perceber que
k
X
i=1
fi =n
onde k ´e o n´umero de diferentes valores existentes na vari´avel den amostras.
Frequˆencia relativa pi ´e a propor¸c˜ao de um dado valori numa vari´avel, ou seja, pi = fi
n =⇒
k
X
i=1
pi =
k
X
i=1
fi n = 1
Exemplo 1: Candidatos `a p´os-gradua¸c˜ao Tabela de Frequˆencias
fi pi
Engenheiros 38 0,281 Economistas 30 0,222 Administradores 35 0,259 Contadores 32 0,238
TOTAL 135 1,000
Histograma
Exemplo 2: Diˆametro de pe¸cas produzidas por uma m´aquina, em mil´ımetros.
21,5 21,4 21,8 21,5 21,6 21,7 21,6 21,4 21,2 21,7 21,3 21,5 21,7 21,4 21,4 21,5 21,9 21,6 21,3 21,5 21,4 21,5 21,6 21,9 21,5
Exerc´ıcio: Construir a Tabela de frequˆencias com fi, pi e as frequˆencias acumuladas Fi, Pi e seu respectivo histograma.
Distribui¸c˜ao dos dados em Classes de Frequˆencia
O n´umero m´aximo para a quantidade de classes de frequˆencia ´e √
n. Deste modo, para o exemplo 2, podemos ter:
Classes fi Fi pi Pi
21,2 ` 21,4 3 3 0,12 0,12 21,4 ` 21,6 12 15 0,48 0,60 21,6 ` 21,8 7 22 0,28 0,88 21,8 ` 22,0 3 25 0,12 1,00 Amplitude h do intervalo : 0,2.
2.3 Medidas Num´ericas
2.3.1 Medidas de Posi¸c˜ao
Servem para localizar a distribui¸c˜ao de frequˆencias de uma vari´avel.
a) M´edia x¯
Sejaxi, onde i= 1,2,3,· · · , n, o conjunto de dados. A m´edia aritm´etica ¯x´e dada por:
¯ x=
n
X
i=1
xi n
Se os dados estiverem dispostos numa tabela de frequˆencias com k linhas, ent˜ao
¯ x=
k
X
i=1
xi·fi
n (1)
Se os dados estiverem distribu´ıdos em classes de frequˆencia, definimos a m´edia substi- tuindo xi em (1) pelo ponto m´edio de cada classe.
A m´edia ´e uma medida pouco robusta com rela¸c˜ao a erros de media¸c˜ao, no entanto ´e muito pr´atica em sua utiliza¸c˜ao.
Exemplo: C´alculo da m´edia
Classes fi xi xifi Fi 39,5 ` 44,5 3 42 126 3 44,5 ` 49,5 8 47 376 11 49,5 ` 54,5 16 52 832 27 54,5 ` 59,5 12 57 689 39 59,5 ` 64,5 7 62 434 46 64,5 ` 69,5 3 67 201 49 69,5 ` 74,5 1 72 72 50
Total 50 2725
¯ x=
Pk
i=1xi·fi
n = 2725
50 = 54,5X
b) Mediana Md
E uma estat´ıstica de ordem, que determina centralidade.´
Considere a amostra x1, x2,· · · , xn. Ordenamos a amostra de tal modo que x(1) →menor elemento;
x(2) →segundo menor elemento;
...
x(n)→ maior elemento;
A mediana ´e a amostra do meio e ´e definida matematicamente por:
Md=
x(n+12 ) , se n ´e ´ımpar x(n2) +x(n2 + 1)
2 , se n ´e par Exemplo: xi ={2,3,7,5,5,9,4}
x(1) = 2; x(2) = 3;x(3) = 4; x(4) = 5;x(5) = 5; x(6) = 7; x(7) = 9.
Md=x(7+12 ) =x(4) = 5X
A mediana caracteriza melhor que a m´edia o centro de um conjunto de dados pois n˜ao considera, em seu c´alculo, valores extremos.
c) Moda Mo
E a observa¸c˜´ ao mais frequente, indicando a regi˜ao das “m´aximas frequˆencias”.
2.3.2 Medidas de Dispers˜ao
Complemento das medidas de posi¸c˜ao: indicam o quanto os dados est˜ao espalhados em torno da regi˜ao central. Indica a varia¸c˜ao dos dados.
a) Variˆancia s2
s2 = Pn
i=1(xi−x)¯ 2 n−1
Se os dados estiverem dispostos numa tabela de frequˆencias, ent˜ao:
s2 = Pn
i=1(xi−x)¯ 2·fi n−1 Exemplo: xi ={15,12,10,17,16}
xi xi−x¯ (xi−x)¯ 2
15 1 1
12 -2 4
10 -4 16
17 3 9
16 2 4
Total 34
¯
x= 14; n = 5.
s2 = Pn
i=1(xi−x)¯ 2 n−1 = 34
5 = 8,5X b) Desvio-padr˜ao s
s=√ s2
Ou seja, o desvio-padr˜ao ´e a raiz quadrada da variˆancia. Serve para expressar a varia¸c˜ao dos dados na mesma unidade da vari´avel em quest˜ao. Observe que o desvio-padr˜ao n˜ao ´e uma medida de erro e sim uma medida da dispers˜ao espacial dos dados ao redor da m´edia.
c) Coeficiente de Varia¸c˜ao Cv
E uma medida de varia¸c˜´ ao adimensional (percentual).
Cv = s
¯
x = desvio-padr˜ao m´edia Exemplo: No exemplo anterior
¯ x= 14
s2 = 8,5→s≈2,91
Cv = s
¯
x = 2,91
14 = 0,208 = 20,8%X