ESTATÍSTICA I
Professora Kelly Alonso
INTRODUÇÃO, TABELAS E GRÁFICOS
www.vep.uff.br
– senha: est12011
est1uff@hotmail.com
– senha: est1eng
Email: kellyalonso@uol.com.br
2
Bibliografia Sugerida
LARSON e FARBER. Estatística Aplicada. São Paulo: Pearson, 2004. MORETTIN, L.G. Estatística Básica. São Paulo: Makron Books, 1999.
MONTGOMERY D. C., RUNGER, G. C., HUBELE, N.F. Estatística Aplicada à Engenharia. Rio de Janeiro: LTC, 2004.
MOORE, D.S. Introdução e Prática da Estatística. Rio de Janeiro: LTC, 2002. SPIEGEL, M.R. Estatística. Coleção Schaum. São Paulo: Makron Books, 2004.
MEYER, P.L. Probabilidade – Aplicações à Estatística. Rio de Janeiro: LTC, 1983.
3
Conteúdo Programático
• Introdução à Estatística • Variáveis • Tabelas e gráficos • Distribuições de frequência • Medidas de posição • Medidas de dispersão • Probabilidade • Distribuições • Distrbuição normal4
Critérios para avaliação
•
Frequência
5
Objetivo do Curso
–
Apresentar a Estatística no contexto do dia-a-dia;
– Espera-se que o estudante ao término do curso esteja
apto para delinear e analisar os seus dados.
6
O que é ESTATÍSTICA?
Ciência que trata do delineamento, colheita,
organização, sumarização, apresentação e análise de
dados, bem como, na obtenção de conclusões válidas
e tomada de decisões em diversos campos, a saber,
engenharias, campo da saúde, biologia, farmácia,
biofísica etc.
Estatística
é
o
estudo
das
populações, das variações e dos
métodos de redução de dados. (R. A.
Fisher)
8
Conceitos básicos
Variáveis
São características observadas em indivíduos ou
conjunto de resultados possíveis de um fenômeno.
Quando a variável é não-numérica, ou seja,
seus valores são expressos por atributos,
denomina-se variável qualitativa.
Exemplos de variável qualitativa a) Sexo
b) Religião
c) Cor de olhos d) Faixa etária
9
Quando a variável é numérica, ou seja, seus
valores são resultantes de uma contagem ou
mensuração, denomina-se variável quantitativa.
Conceitos básicos
Variáveis
Exemplos de variável quantitativa a) Peso dos órgãos
b) Idade
c) Número de filhos d) Altura
10
•
Discreta
: seus valores são expressos geralmente
através de números inteiros não negativos.
•
Contínua
: seus valores formam um intervalo de
números reais e que resultam, normalmente, de uma
mensuração.
Conceitos básicos
Após a apuração, há necessidade dos dados
serem dispostos de uma forma ordenada, quando
possível, e resumida, a fim de auxiliar o pesquisador
na sua análise e facilitar a compreensão das
conclusões apresentadas ao leitor. Os dados podem
estão serem apresentados na forma de tabelas,
contendo séries estatísticas.
13
Denominamos série estatística toda tabela
que apresenta a distribuição de um conjunto de
dados estatísticos em função da época, do local ou
da espécie.
Uma tabela estatística deve conter o
número, o título, o corpo e o rodapé (fonte, notas
e notas específicas).
14
Componentes mais importantes de uma tabela:
Título – explica o que a tabela contém
Corpo – formado pelo cabeçalho, pela coluna indicadora e pelas linhas e
colunas de dados:
Cabeçalho – especifica o conteúdo das colunas
Tabelas
título
cabeçalho
coluna indicadora
coluna de dados
corpo
19
Algumas coletas com muitos dados não favorecem a elaboração de tabelas detalhadas.
Nesses casos, é mais interessante agrupar os valores em determinados intervalos que apresentam a mesma amplitude.
frequência relativa
(porcentagem)
21
frequência
frequência
relativa
22
frequência
relativa
23
Exemplo: Em uma olimpíada estudantil, com alunos do ensino fundamental, foi medida a altura de cada um dos participantes, encontrando-se os seguintes valores, em centímetros.
152 155 167 176 155 156 166 178 153 162 155 160 155 160 162 158 178 162 152 160 163 161 155 160 164 158 179 162 160 167 151 150 152 174 167 156 154 166 162 152 156 152 171 161 170 157 151 153 172 157
Para fazermos a distribuição de freqüência, procedemos da seguinte forma: 1º passo Organizamos todas as medidas em ordem crescente ou decrescente.
Essa relação, assim organizada, chama-se rol.
150 152 154 155 157 160 162 163 167 174
151 152 155 156 158 160 162 164 167 176
151 152 155 156 158 160 162 166 170 178
152 153 155 156 160 161 162 166 171 178
152 153 155 157 160 161 162 167 172 179
24
2º passo Notamos que a menor estatura é 150cm e a maior é 179cm.
Assim, a variação é de 179cm – 150cm = 29cm. Esse valor é chamado de
amplitude total (H).
3º passo Agrupamos os valores em intervalos de classe.
Podemos considerar, por exemplo, a classe de 150 ( inclusive ) à 154 (exclusive). Em símbolos, é denotada por 150 | 154. Nesse caso, 150 é o limite inferior e 154 é o limite superior da classe.
A diferença entre o limite inferior e o limite superior é igual à amplitude da
classe (h).
Adotando-se a amplitude da classe igual a h = 4, teremos oito classes. Construímos, então, uma tabela de freqüências com classes.
4º passo Determinar o Ponto médio de cada classe: a metade de cada intervalo considerado. PM1= (150 + 154)/2 = 152.
5º passo Somar a freqüência total das classes e determinar a freqüência relativa fR(i)= f(i)/ftotal
26
Como definir o número de classes?
-
poucas
: perde-se muita informação
-
muitas
: pode-se ter pormenores desnecessários
O número adequado de classes é
definido pelo
pesquisador.
Na escolha, é conveniente usar extremos de classes fáceis
de trabalhar.
27 "Regra de Sturges":
n
I
nº de classes
3 |---| 5
3
6 |---| 11
4
12 |---| 22
5
23 |---| 46
6
47 |---| 90
7
91 |---| 181
8
182 |---| 362
9
Obs: Qualquer regra para determinação do nº de classes da tabela não nos levam a uma decisão final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado à natureza dos dados.
EXERCÍCIO
O exame de quarenta pacientes de um hospital constatou o seguinte número de leucócitos (glóbulos brancos) por mm3.
Com esses dados, construir uma tabela de freqüências absoluta, relativa e acumulada, considerando a amplitude da classe igual a 2000 (h = 2000 ).
8900 6800 5800 4000 3100 2600 2000 1600 8300 6100 5700 3900 3100 2500 2000 1500 7200 5900 4500 3500 2900 2400 1900 1400 7100 5900 4200 3400 2900 2400 1900 1300 6900 5800 4100 3200 2800 2100 1900 1100 1º passo) Rol
2º passo) Amplitude Total H = 8900 – 1100 H = 7800
3º passo) Agrupamento em intervalos de classe h = 2000
100 10 20 25 45 Frequência relativa (%) -40 36 28 18 Frequência acumulada 4 7100 |-- 9100 Frequência absoluta Leucócitos/ mm3 40 Total 8 5100 |-- 7100 10 3100 |-- 5100 18 1100 |-- 3100
31
Dados estatísticos podem ser representados tanto por tabelas e por quadros de distribuição por freqüência quanto por gráficos. O uso gráfico para representar uma situação estatística pode muitas vezes expor melhor visualmente do que uma tabela estatística, porém o seu uso deve ser feito com bastante cautela, utilizando o gráfico adequado em cada situação, veja alguns casos:
• Gráfico de Colunas - é um tipo de gráfico muito utilizado em diversas situações, indica quantidades, porcentagens e de fácil comparação entre suas variáveis.
32
Gráficos em setores - Este gráfico é construído com base em um
círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total.
33
Histograma – é um gráfico construído no plano cartesiano por retângulos em número igual ao número de classes da distribuição. Cada classe é representada por uma coluna de altura correspondente a sua freqüência. A área de cada coluna é proporcional à freqüência da classe que representa. Logo, a área de todo histograma é proporcional à soma total das freqüências.
35
Representações
Histograma – é um gráfico construído no plano cartesiano por retângulos em número igual ao número de classes da distribuição. Cada classe é representada por uma coluna de altura correspondente a sua freqüência. A área de cada coluna é proporcional à freqüência da classe que representa. Logo, a área de todo histograma é proporcional à soma total das freqüências.
36
Representações
Polígono de freqüência – é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição.
37
Representações
Polígono de freqüência acumulada ou ogiva – é traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe.
38
Fontes de Consulta para elaboração desta aula
LARSON e FARBER. Estatística Aplicada. São Paulo: Pearson, 2004. MORETTIN, L.G. Estatística Básica. São Paulo: Makron Books, 1999.
MONTGOMERY D. C., RUNGER, G. C., HUBELE, N.F. Estatística Aplicada à Engenharia. Rio de Janeiro: LTC, 2004.
MOORE, D.S. Introdução e Prática da Estatística. Rio de Janeiro: LTC, 2002.