Gráfico em linha ou curva
Este tipo de gráfico se utiliza da linha poligonal para
representar a série estatística no sistema de
coordenadas cartesianas.
Exemplo:
Receita do complexo soja
Ano Receita
(em milhões de dólares)
1995 3,8
1996 4,5
1997 5,7
1998 4,8
1999 3,8
2000 4,2
2001 5,3
2002 6,0
2003 8,1
2004 10,0
2005 9,1
Fonte: O Estado de S. Paulo, 7/12/2005
Gráfico em colunas ou barras
É a representação de uma série por meio de
retângulos dispostos verticalmente (colunas) ou
horizontalmente (barras). Quando em colunas, os
retângulos têm a mesma base e as alturas são
proporcionais aos respectivos dados. Quando em barras,
os retângulos têm a mesma altura e os comprimentos
são proporcionais aos respectivos dados.
Exemplo utilizando os dados acima:
Gráfico de colunas:
Gráfico de barras:
Atividade: Faça um gráfico em linha, um gráfico de
colunas e um gráfico de barras para a seguinte
distribuição de frequência:
Vendas bimestrais da empresa W
Mês Venda (em milhares de reais)
Janeiro 600
Fevereiro 780
Março 250
Abril 420
Maio 390
Junho 280
..
3,8 4,5
5,7 4,8
4,2 5,3
6 8,1
10 9,1
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Receita do complexo de soja
0 2 4 6 8 10 12
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Receita do complexo de soja
(em milhões de dólares)
0 5 10 15
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Gráfico de colunas ou em barras múltiplas
Este tipo de gráfico é geralmente empregado quando
queremos representar, simultaneamente, dois ou mais
fenômenos estudados com o propósito de comparação.
Vendas por Região
Exercício 11 – Lista 2.
Exercício 6 – Lista 3.
Histograma
O histograma é uma representação gráfica muito
semelhante ao gráfico de barras verticais. Em geral, ele
é usado para representar os valores assumidos por uma
variável quantitativa quando estes estão agrupados em
classes de intervalos.
É formado por um conjunto de retângulos
justapostos, cujas bases se localizam sobre o eixo
horizontal, de tal modo que seus pontos médios
coincidam com os pontos médios dos intervalos de
classes.
As larguras dos retângulos são iguais às amplitudes
dos intervalos de classe. As alturas dos retângulos
devem ser proporcionais às frequências das classes.
Exemplo: A altura de oitenta alunos de uma escola
de ensino médio está distribuída de acordo com a tabela
a seguir:
Altura
(centimetros) Absoluta (frequência
(frequência
Relativa)
(porcentagem)
4
12
18
26
10
8
2
Total
Seguem dois exemplos de histograma para a
distribuição de frequência:
Alturas dos alunos de uma escoa de ensino médio
Exercício 8 – Lista 2.
0 1 2 3 4 5 6 7 8 9
Geladeira
Fogão
Microondas
Cafeteira
4 12
18 26
10 8
2
Medidas de centralidade e variabilidade
Vamos estabelecer medidas representativas para os
dados, medidas que resumam como se distribuem os
valores de uma variável quantitativa. Para isso, será
necessário estabelecer um valor médio ou central e
outro valor que indique o grau de variabilidade (em
torno do valor central) dos dados da variável em
estudo.
Como valores centrais, vamos estudar:
Média aritmética
Mediana
Moda
Como medida de variabilidade, vamos estudar:
Variância
Desvio padrão
Média Aritmética ̅ : É o quociente da divisão da
soma dos valores da variável pelo número deles.
̅ ∑
Onde:
̅ é a média aritmética os valores da variável
o número de valores
A média aritmética é utilizada quando desejamos
obter a medida de posição de maior estabilidade.
Dados não agrupados: Quando desejamos conhecer a média dos dados não agrupados,
determinamos a média aritmética simples.
Exemplo: Os valores seguintes referem-se às notas
obtidas por um aluno em oito disciplinas de um exame
vestibular:
Vamos calcular a média aritmética desses valores:
̅ ∑
Qual é o significado desse valor?
̅
Caso o aluno apresentasse a mesma nota
(desempenho) em todas as disciplinas, ela deveria ser
5,75 a fim de que fosse obtida a pontuação total de 46
pontos, equivalente à soma dos pontos efetivamente
obtidos nessas oito provas.
Exemplo: Sabendo que a produção leiteira diária da
vaca A, durante uma semana, foi de 10, 14, 13, 15, 16,
18 e 12 litros, qual é a média de produção diária para a
vaca A nesta semana?
Dados agrupados sem intervalos de classe: Como as frequências são números indicadores da
intensidade de cada valor da variável, elas funcionam
como fatores de ponderação, o que nos leva a calcular
a média aritmética ponderada, dada por
̅ ∑ ∑
Exemplo: Em uma drogaria trabalham 20 funcionários e
seus salários estão representados a seguir:
Número de funcionários Salário (em reais)
8 980
10 1600
2 2100
Qual é o salário médio dos funcionários nessa drogaria?
̅ ∑ ∑ ∑
̅
*Se todos os funcionários recebessem o mesmo salário,
este seria de R$ 1402,00.
Exercício 21 – Lista 4.
Moda : Denominamos moda o valor que
ocorre com maior frequência em uma série de valores.
Por exemplo, o salário modal dos empregados de uma
indústria é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa
indústria. A moda é utilizada quando desejamos obter
uma medida rápida e aproximada de posição.
Dados não agrupados: Quando lidamos com valores não agrupados, basta procurar o valor que mais
se repete.
Exemplo:
a) A série de dados 3, 4, 6, 6, 6, 6, 6, 8, 9, 9, 10 tem
moda igual a 6.
b) A série de dados 1, 2, 4, 6, 8, 12, 15, 19, 20, 25 não
apresenta moda (amodal)
c) A série de dados 10, 11, 12, 12, 12, 13, 15, 16, 16,
16, 17, 19 tem duas modas:12 e 16 (bimodal).
Dados agrupados sem intervalos de classe: Para dados agrupados, a moda é dada pelo valor da
variável de maior frequência.
Exemplo: Considerando os salários dos funcionários da
drogaria:
Número de funcionários Salário (em reais)
8 980
10 1600
2 2100
A maior frequência é , que corresponde ao
salário de R$ 1600,00.
Logo .
Mediana ou : A mediana de um conjunto
de valores ordenados segundo uma ordem de
grandeza, é o valor situado de tal forma no conjunto
que o separa em dois subconjuntos de mesmo número
de elementos.
Dados não agrupados: Sejam
os valores ordenados de uma variável . A mediana
desse conjunto de valores é definida como vemos:
{
( )
( ) ( )
A definição garante que a mediana seja um valor
central que divide o conjunto de dados em duas partes
com o mesmo número de elementos. Em uma parte,
todos os elementos são menores que ou iguais à
mediana; na outra parte, todos os elementos são
maiores que ou iguais à mediana.
Exemplo: O controle de qualidade de uma indústria
forneceu o seguinte número de peças defeituosas (por
lote de 100 unidade):
Vamos determinar a mediana do número de peças
defeituosas. Para isso, ordenamos esses valores:
Como é ímpar, temos
isto é, a mediana é igual a observação de .
Assim .
Podemos observar que há cinco valores menores que
ou iguais a 5 e cinco valores maiores que ou iguais a 5:
1 3 4 4 5 5 6 6 8 9 10
Exemplo: Dada a série de valores, encontre sua
mediana:
Ordenando os valores:
Como é par, temos
Onde é a observação e a observação de .
Assim .
Dados agrupados sem intervalos de classe: Identificamos a frequência cumulada crescente
imediatamente superior à metade da soma das
frequências. A mediana será aquele valor
correspondente a tal frequência acumulada.
Exemplo: Encontre a mediana para a distribuição:
Idade
Número de jovens
15 15 15
16 27 42
17 23 65
18 16 81
19 11 92
20 8 100
∑
∑
A menor frequência acumulada que supera esse valor
é
, que corresponde a
.
Portanto
.
Observação: Quando
∑
a mediana será dada por
isto é, a mediana será dada pela média aritmética
entre o valor da variável correspondente a essa
frequência acumudada e o seguinte.
Exemplo: Calcule a mediana para:
22 2 2
24 4 6
25 2 8
26 3 11
28 2 13
29 3 16
∑
Temos:
∑
Logo
Medidas de Dispersão
Suponha que um professor esteja interessado em
comparar o desempenho de suas diferentes turmas de
um mesmo curso de inglês. Para isso, considerou a
média final dos cinco alunos de cada uma de suas
quatro turmas.
Turma A:
Turma B:
Turma C:
Turma D:
Calcule a média aritmética das notas:
Restringindo nossa análise a apenas esse valor,
̅
,
concluímos que as turmas apresentam desempenho
médio igual.
Isso não é suficiente, pois esse valor esconde
informações em relação à
homogeneidade ou
heterogeneidade
do desempenho dos alunos de uma
mesma turma. Daí a necessidade de se definir uma
medida que revele o
grau de variabilidade
das notas
de uma turma, a fim de que a análise não fique
comprometida.
Variância
e
Desvio Padrão
: A variância
e o desvio padrão
levam em consideração a
totalidade dos valores da variável em estudo, o que faz
delas índices de variabilidade bastante estáveis e os
mais empregados.
A variância se baseia nos desvios em torno da média
aritmética, determinando a média aritmética dos
quadrados dos desvios, representada por
∑
̅
Sendo a variância calculada a partir dos quadrados
dos desvios, ela é um número em unidade quadrada
em relação à variável em questão, por isso imaginou-se
uma nova medida, denominada desvio padrão, definida
como a raiz quadrada da variância e representada por
√∑
̅
A fórmula dada para o cálclo do descio é de fácil
compreensão, mas não é a mais ideal para o uso, pois,
em geral, a média aritmética é um número fracionário,
o que torna pouco prático o cálculo das quantiddes
̅ . Essa fórmula também não é muito precisa, pois quando a média não é exata, tem que ser
arredondada, cada desvio fica afetado ligeiramente do
erro, devido a esse arredondamento.
Logo, podemos escrever a fórmula do seguinte
modo:
√∑ (∑ )
Dados não agrupados: Exemplo:
Calcule a variância e o desvio padrão para o conjunto
de valores
A maneira mais prática para se obter o desvio padrão é
formar uma tabela com duas colunas, uma para e
outra para :
40 1600
45 2025
48 2304
52 2704
54 2916
62 3844
70 4900
∑ ∑
Variância :
(
)
Portanto
Desvio padrão :
√
Então
Dados agrupados sem intervalos de classe: Como, neste caso, temos a presença de frequências,
devemos levá-las em consideração
√∑ ∑ (∑ ∑ )
Exemplo:
Considere a tabela de valores, calcule a variância e o
desvio padrão:
0 2
1 6
2 12
3 7
4 3
∑
Para facilitar, abriremos uma coluna para , outra
para e outra para , logo:
0 2 0 0 0
1 6 1 6 6
2 12 4 24 48
3 7 9 21 63
4 3 16 12 48
∑ ∑ ∑
Variância :
( )
Desvio Padrão :
√
Portanto