Estatística Aplicada
Curso: Técnico em Informática
Professor: Ivan Santos Email: isantosmn@gmail.com
Gráficos Estatísticos
•
A Estatística faz uso de recursos numéricos e
visuais para representar os fenômenos.
•
O gráfico é usado para ilustrar ou ressaltar um
fenômeno através de uma imagem, o que o
torna de mais fácil compreensão.
•
Sabe-se que a leitura de um gráfico é mais fácil
do que de uma tabela.
•
É um método de representação de dados
Gráficos Estatísticos
•
Requisitos Fundamentais de um Gráfico:
Gráficos estatísticos
•
Finalidades dos Gráficos:
– Apresentar os dados de modo agradável e claro – Poupar tempo e esforço na análise
– Dispor os dados de modo a focalizar as comparações num
relance
– Tornar claros os fatos que possam ser objetos de confusão – Olhando um gráfico você pode ter uma visão mais geral
do que ocorre com sua variável na sua empresa, sem precisar ficar observando sequências de números
Gráficos estatísticos
•
Tipos de Gráficos:
Gráficos estatísticos
•
Gráficos de Reclame:
–
São os destinados ao grande público. São de fácil
interpretação. Representam todas as séries
estatísticas.
–
Tipos de Gráficos de Reclame:
• Linear;• Colunas; • Barras;
Gráficos estatísticos
• 1)Gráfico Linear ou de Linha:
– É a representação das informações por meio de uma linha. É usado
para representar séries temporais.
– Exemplo:
Gráficos estatísticos
• 2)Gráfico de Colunas:
– É representado por retângulos dispostos verticalmente. É usado quando a variável tem
muitos resultados e cada um com poucas letras.
– Exemplo:
Gráficos estatísticos
• Gráfico de Barras:
– É representado por retângulos dispostos horizontalmente. É usado
quando a variável tem muitos resultados e cada um com muitas letras.
– Exemplo:
Gráficos estatísticos
• 4)Gráfico de Setores ou “Pizza”:
– A variável é apresentada em um círculo, onde cada resultado da mesma é uma
fatia da ‘pizza’; cada fatia da ‘pizza’ tem tamanho proporcional ao valor relativo que o seu resultado representa em relação ao total.
– A variável deve ter poucos resultados, no máximo cinco categorias. – Exemplo:
Gráficos estatísticos
•
Interpretações de Gráficos de Reclame:
–
A interpretação de gráfico de reclame se dá
verificando os máximos e mínimos, bem como as
mudanças bruscas.
–
Tratando-se de série temporal e respectivo gráfico
de linha, observa-se principalmente a tendência
secular do fenômeno, se crescente ou
Gráficos estatísticos
•
Gráfico de Análise:
–
São gráficos destinados a um público
especializado.
–
São gráficos exclusivos de distribuição de
frequência.
•
Tipos de Gráficos de Análise:
–
Histograma;
Gráficos estatísticos
•
Interpretação de Gráfico de Análise:
–
A forma da distribuição apresentada pelo gráfico é
Gráficos estatísticos
•
Histogramas
–
Histograma é uma representação gráfica de uma
tabela de distribuição de freqüências.
–
Desenhamos um par de eixos cartesianos e no eixo
horizontal (abscissas) colocamos os valores da
variável em estudo e no eixo vertical (ordenadas)
colocamos os valores das freqüências.
–
O histograma tanto pode ser representado para as
Gráficos estatísticos
•
Histograma de frequência acumulada (ou
ogiva) é a representação gráfica do
comportamento da frequência acumulada.
•
Na figura abaixo a ogiva é mostrada em
Gráficos estatísticos
•
Diagrama de Pareto
–
Diagrama de Pareto é um
gráfico de barras
que
ordena as frequências das ocorrências, da maior para
a menor, permitindo a priorização dos problemas.
–
Mostra ainda a curva de porcentagens acumuladas.
–
Sua maior utilidade é a de permitir uma fácil
Gráficos estatísticos
• Como construir um diagrama de Pareto
– 1. Realize uma reunião com a equipe para selecionar o tópico a ser avaliado.
Por exemplo, podemos avaliar tipos de defeitos, custo de manutenção por equipamento, entre outros.
– 2. Selecione um padrão de comparação com unidade de medida. Geralmente,
utilizamos o custo ou frequência de ocorrência como medida de comparação.
– 3. Especifique o período de tempo em que os dados serão coletados.
Exemplo: Uma semana, um mês.
– 4. Elabore uma planilha de dados, com as seguintes colunas: Categorias,
Quantidade de ocorrências (totais individuais), Totais acumulados, Porcentagens, Porcentagens acumuladas.
– 5. Colete os dados necessários para cada categoria. Exemplo: Defeito A
ocorreu X vezes ou defeito C custou Y.
– 6. Preencha a planilha de dados, listando as categorias em ordem decrescente
Gráficos estatísticos
• Como construir um diagrama de Pareto–7. Marque o eixo vertical no lado esquerdo com a escala de zero até o total da coluna Quantidade da planilha de dados. Identifique o nome da variável representada neste eixo e a unidade de medida utilizada, caso seja necessário.
–8. Marque o eixo vertical do lado direito com uma escala de zero até 100%. Identifique este eixo como "Porcentagem acumulada"(%).
–9. Liste as categorias da esquerda para direita no eixo horizontal em ordem decrescente de frequência ou custo. Os itens de menor importância podem ser combinados na
categoria Outros, que é colocada no extremo direito do eixo, com a última barra.
–10. Identifique cada intervalo do eixo horizontal escrevendo os nomes das categorias, na mesma ordem em que eles aparecem na planilha de dados.
–11. Construa um gráfico de barras utilizando a escala do eixo vertical do lado esquerdo.
Para construir um gráfico de barras, acima de cada categoria, basta desenhar um retângulo cuja a altura representa a frequência ou custo daquela categoria.
–12. Construa a curva de Pareto marcando os valores da porcentagem acumulada acima e no centro ou lado direito do intervalo de cada categoria, e ligue os pontos por
Gráficos estatísticos
• Exemplo:
–Uma indústria de calculadoras eletrônicas, preocupada com vários defeitos que
um de seus produtos vem apresentando, fez um levantamento e constatou os seguintes problemas:
•A: Defeito na cobertura plástica;
•B: Defeito no teclado;
•C: Defeito na fonte de energia;
•D: Soldas soltas;
•E: Defeito na placa da unidade de processamento;
•F: Defeito no visor;
•G: Outros.
• Este é um típico exemplo de dados qualitativos nominais. Nesta situação, para
Gráficos estatísticos
•
Exemplo:
Tipo de Problemas (T) Frequência
A 10
B 20
C 55
D 80
E 25
F 3
Gráficos estatísticos
•
Exemplo:
Freqüência Freq. Acumulada Porcentagem Porc. Acumalada
D 80 80 40 40
C 55 135 27,5 67,5
E 25 160 12,5 80
B 20 180 10 90
Outros 10 190 5 95
Gráficos estatísticos
•
Exemplo:
D C E B
Gráficos estatísticos
•
Exemplo - Diagrama de Pareto relativo a
custos:
–
Na construção do gráfico de Pareto podemos
utilizar como medida de comparação a
frequência de ocorrência do atributo ou o
custo associado a este atributo.
–
A seguir, apresentamos um exemplo de um
Gráficos estatísticos
• Em uma empresa de cartão de identificação, contabilizamos
os defeitos nos cartões com medida de comparação baseada no custo.
Principais defeitos Nº de embalagens defeituosas Custo por unidade defeituosa Custo do defeito
Números trocados 28 0,05 1,4
Caracteres errados 28 0,05 1,4
Amassado 4 1 4
Perfurado 3 0,05 0,15
Impressão ilegível 2 0,05 0,1
Rasgado 2 1 2
Outros 1 0,05 0,05
Gráficos estatísticos
• Ordenando os defeitos pelos seus custos, temos o seguinte
diagrama
Principais defeitos Custo do defeito
Amassado 4
Rasgado 2
Números trocados 1,4 Caracteres errados 1,4 Perfurado 0,15 Impressão ilegível 0,1
Gráficos estatísticos
• O gráfico de Pareto correspondente, relativo aos custos é
Gráficos estatísticos
•
Histograma
– Para variáveis quantitativas contínuas os valores
observados devem ser tabulados em intervalos de classes
– Consiste de retângulos contíguos com área igual a
frequência relativa da respectiva faixa, tendo como base as faixas de valores da variável.
– A altura de cada retângulo é chamada de densidade de
Gráficos estatísticos
Peso Ni Fi Densidade (Fi/10)
40|--50 8 0,16 0,016
50|--60 22 0,44 0,044
60|--70 8 0,16 0,016
70|--80 6 0,12 0,012
80|--90 5 0,10 0,010
90|--100 1 0,02 0,002
Gráficos estatísticos
•
Histograma
–
Atenção para tamanho das faixas (amplitudes) que
podem ser variáveis
–
Fica mais difícil entender o comportamento dos
valores
–
Em cima dos retângulos colocar a frequência
Gráficos estatísticos
•
2) Polígono de Frequência:
–
É uma linha poligonal que é resultado de
interligação de pontos que representam os valores
de cada classe, isto é, os pontos médios de cada
subintervalo do intervalo total. Também como o
histograma, representa uma distribuição de
Gráficos estatísticos
•
Construção dos Gráficos:
–
Todos os gráficos podem ser facilmente
Gráficos estatísticos
•
Início rápido: criar gráficos com seus dados em uma
planilha
– Selecione os dados que deseja incluir no gráfico.
Gráficos estatísticos
•
Na guia
Inserir
, no grupo
Gráficos
, clique no tipo de
gráfico que deseja usar e clique em um subtipo de
gráfico.
•
Dica
Para ver todos os tipos de gráfico disponíveis,
clique em para iniciar a caixa de diálogo
Inserir
Gráficos estatísticos
•
Quando você posiciona o ponteiro do mouse sobre
Gráficos estatísticos
•
Use as
Ferramentas de Gráfico
para adicionar
elementos como títulos e rótulos de dados e para
alterar o design, layout ou formato de seu gráfico.
•
Dica
Se você não conseguir ver as
Ferramentas
Gráficos estatísticos
• Exercícios Propostos
1. O que é um gráfico?
2. Cite 2 finalidades de se construir um gráfico? 3. Quais são gráficos de reclame?
4. Cite os tipos mais usuais de gráficos de reclame.
5. Qual o gráfico mais indicado para se representar uma série temporal? 6. Como se interpreta um gráfico de reclame?
7. Quando usamos o gráfico de colunas? 8. Quando usamos o gráfico de barras?
9. Que gráfico relaciona a proporção que cada categoria de uma variável representa em relação ao total?
10.Quando usamos o gráfico de ‘pizza’? 11.O que é um gráfico de análise?
12.Quais os tipos mais usuais de gráfico de análise?
Medidas de Resumo
•
Mensuração x Medida
–
Mensuração resulta em medida
–
Medida é valor, número resultante do processo de
mensuração
Medidas de Resumo
• Níveis de medida
1. Nominal – Apesar de expresso em números é apenas um nome. Ex. Cpf, Num. telefone
2. Ordinal – quando os itens podem ser colocados em ordem de grandeza. As notas escolares são um bom exemplo desse nível.
3. Intervalar - Aqui, faz sentido quantificar. Não possui um valor nulo. Escalas termométricas são um bom exemplo.
Medidas de Resumo
•
Divisão das medidas
a) medidas de tendência central (média, moda e
mediana);
b) medidas de dispersão (desvio-padrão e
coeficiente de variação);
c) medidas de posição (quartis, decis e percentis).
•
Como a finalidade dessas medidas é resumir
as informações, essas medidas são chamadas
Medidas de Resumo
•
A média, por exemplo, é um valor que resume
as informações de um conjunto maior de
dados
•
Por exemplo, “quando um jornalista diz na TV
Medidas de Tendência Central
•
A média é a mais importante das medidas
estatísticas.
•
A média é um valor típico de um conjunto de
dados que tende a se localizar em um ponto
central.
•
Vários tipos de médias podem ser defini
-dos, sendo as mais comuns a média
Medidas de Tendência Central
•
Média Aritmética
–
Para se calcular a média aritmética , ou
simplesmente média, de um conjunto depende do
tipo de dados. Para dados não-agrupados é
Medidas de Tendência Central
•
Ex. Considere as aprovações na disciplina de
matemática do professor João, de uma
turma, nos últimos anos, representadas na
série histórica abaixo:
•
Pergunta-se: qual a média aritmética dos aprovados
Medidas de Tendência Central
• Você notou que não existe o número 36,4 no conjunto de
dados? Quando isso acontece, dizemos que a média não tem existência concreta.
• O que esse valor significa?
• Significa que, considerando todas as grandezas, dentro
Medidas de Tendência Central
•
Média aritmética para dados agrupados.
–
Os dados agrupados podem se apresentar sem
Medidas de Tendência Central
• Vamos calcular a média aritmética para dados agrupados sem
Medidas de Tendência Central
• O levantamento foi realizado em 34 famílias, todas com 4 filhos. • Dessa forma, as frequências são indicadoras da intensidade de
cada valor da variável número de meninos.
• Esse é um caso de ponderação, o que nos leva a calcular a média aritmética ponderada, porque cada variável possui intensidade
Medidas de Tendência Central
• O modo mais prático para calcular uma média ponderada é
Medidas de Tendência Central
•
A média de 2,3 nos indica que as famílias
têm em média 2 meninos e 2 meninas,
Medidas de Tendência Central
•
Calcule a média aritmética simples em cada
um dos seguintes casos:
a) 1 ; 2 ; 3 ; 4 ; 5 ; 6 ; 7 ; 8 ; 9
b) 1,5 ; 2,9 ; 2,9 ; 5,9 ; 6,7 ; 12,3
c) 54, 74, 21, 01, 12, 33, 03, 76, 40, 56, 89, 102, 04
d) 87, 45, 12, 120, 107, 05, 34, 02, 09, 01, 19, 29, 22,
Medidas de Tendência Central
•
Calcule a média dos acidentes de trânsito,
Medidas de Tendência Central
•
Média aritmética para dados agrupados
com
intervalos de classes
•
Todos os valores incluídos num certo intervalo
de classe são considerados coincidentes com o
ponto médio do intervalo
•
Para o cálculo da média aritmética ponderada,
Medidas de Tendência Central
• A Tabela 26, acima, mostra a distribuição de frequência do
professor Paulo, acrescentando, apenas, o ponto médio dos intervalos de classe (xi) e a ponderação, isto é, o produto dos pontos médios pela frequência (xi fi). Bem, sabemos,
portanto, que:
• Logo, utilizando a Fórmula 2 para o cálculo da média
Medidas de Tendência Central
• Bem, a média das notas do professor sendo 5,5, indica que
Medidas de Tendência Central
•
Calcule a média de idade de funcionários com
Medidas de Tendência Central
•
Calcule o tempo de permanência médio dos
Medidas de Tendência Central
•
Mediana
–
Em um conjunto ordenado, o ponto central
que divide esse conjunto em dois subconjuntos
com o mesmo número de elementos chama-se
mediana.
–
Aqui, diferentemente da média (que nos fornece
Medidas de Tendência Central
•
Mediana
–
Exemplo:
• Vamos considerar o conjunto dos números:
– 3, 4, 4, 5, 6, 8, 8, 8, 10
• Quem está no meio do conjunto? • Quais os elementos antes de 6? • E depois de 6?
–
Observe que temos a mesma quantidade de elementos
Medidas de Tendência Central
•
Mediana
–
Para dados não agrupados, como no exemplo acima,
calcula-se a mediana de duas maneiras:
1) quando os dados forem de número ímpar, basta
encontrar o ponto central, isto é, encontrar o valor que antes dele e depois dele, tenham o mesmo número de elementos;
Conceitos básicos
•
Método prático para o cálculo da Mediana
–
Se a série dada tiver número ímpar de termos:
• O valor mediano será o termo de ordem dado pelafórmula: ( n + 1 ) / 2
• Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1,
Conceitos básicos
•
Método prático para o cálculo da Mediana
–
Se a série dada tiver número ímpar de termos:
• O valor mediano será o termo de ordem dado pelafórmula: ( n + 1 ) / 2
• Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1,
2, 5 }
Conceitos básicos
•
Método prático para o cálculo da Mediana
–
Se a série dada tiver número ímpar de termos:
• O valor mediano será o termo de ordem dado pelafórmula: ( n + 1 ) / 2
• Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1,
2, 5 }
• 1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
• n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o
5º elemento da série ordenada será a mediana
Conceitos básicos
•
Se a série dada tiver número par de termos:
– O valor mediano será o termo de ordem dado pela fórmula: [( n/2 ) +
( n/2+ 1 )] / 2
– Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos
pelo valor correspondente.
Conceitos básicos
•
Se a série dada tiver número par de termos:
– O valor mediano será o termo de ordem dado pela fórmula: [( n/2 ) +
( n/2+ 1 )] / 2
– Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos
pelo valor correspondente.
– Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } – 1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
– n = 10 logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2 = [( 5 + 6)] / 2
Conceitos básicos
•
Se a série dada tiver número par de termos:
– O valor mediano será o termo de ordem dado pela fórmula: [( n/2 ) +
( n/2+ 1 )] / 2
– Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos
pelo valor correspondente.
– Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } – 1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
– n = 10 logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2 = [( 5 + 6)] / 2
será na realidade (5º termo+ 6º termo) / 2
– 5º termo = 2 e 6º termo = 3
– A mediana será = (2+3) / 2 ou seja, Md = 2,5. A mediana no exemplo
Conceitos básicos
• Observe que a média é muito diferente da mediana.
• Média significa que os dados do conjunto se concentram em
torno desse número, isto é, “o problema da média é que ela é afetada pelos grandes valores” (PEREIRA, 2004, p. 19)
• Com o cálculo da mediana (md) igual a 3, podemos afirmar
que metade dos valores está abaixo de 3 e, portanto, são muito baixos.
• Embora ambas as medidas sejam de tendência central
(ou seja, representem pontos que tendem para o centro dos dados), no nosso caso, os valores do conjunto estão mais
próximos de 3 do que de 2,5, não concorda?
• Por isso dizemos que a média leva em conta os valores e a
Conceitos básicos
•
Demonstre através de cálculos a posição da
mediana nos dados informados:
a) 54, 74, 21, 01, 12, 33, 03, 76, 40, 56, 89, 102, 04
b) 87, 45, 12, 120, 107, 05, 34, 02, 09, 01, 19, 29, 22, 17
c) 25, 74, 65, 12, 33, 03, 76, 40, 56
Conceitos básicos
•
Moda
– valor
que
ocorre
com
maior
frequência dentro de um conjunto de
números.
•
Exemplo: 10,2; 10,5;
10,4
; 10,1;
10,4
Moda: valor mais provável
4
,
10
ˆ
Conceitos básicos
• A moda é facilmente reconhecida basta procurar o valor que mais se repete.
• Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros
• Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda • A série é “amodal”
• Em outros casos, pode haver dois ou mais valores de
concentração. Então, a série tem dois ou mais valores modais • Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas
modas: 4 e 7
Conceitos básicos
• Uma vez agrupados os dados, é possível determinar
imediatamente a moda: basta fixar o valor da variável de maior frequência
• Ex: Qual a temperatura mais comum medida no mês abaixo?
Conceitos básicos
•
Indique a moda em cada um dos conjuntos de
valores:
a) 54, 33, 04, 33, 12, 33, 04, 33, 40, 56, 33, 56, 04
b) 87, 45, 12, 45, 107, 05, 34, 45, 09, 01, 19, 29,
22, 87
c) 25, 74, 03, 12, 33, 03, 03, 40, 25
Dados agrupados
-
Para dados agrupados sem intervalos de
classe, é possível determinar imediatamente
a moda, como nos exemplos acima.
-
Mas, por exemplo, a Tabela a seguir, indica
que a moda é 3. Por quê? Porque o valor que
mais se repete é aquele que possui maior
Dados agrupados
- No caso de dados agrupados sem intervalos de classe, a seguir,
podemos utilizar um recurso que nos auxilia a calcular a mediana: a coluna de freqüências acumuladas (Fi).
- Freqüência acumulada nada mais é do que a soma das freqüências
de cada variável.
- Observe que para a variável “0 menino”, temos freqüência 2, logo, a
freqüência acumulada é 2;
- para a variável “1 menino”, temos freqüência 6, logo, a freqüência acumulada
é 8, pois, 2 (freqüência acumulada anterior) + 6 (freqüência simples);
- para a variável “2 meninos”, temos freqüência simples igual a 10, logo, a
freqüência acumulada será 8 (anterior) + 10 = 18; e assim sucessivamente.
Dados agrupados
-
Para o cálculo da mediana, aplicamos a
Fórmula 3.
-
O resultado indica que a mediana será um dos
valores da coluna da esquerda (0, 1, 2, 3 ou 4)
correspondente à frequência acumulada
Dados agrupados
-
Solução:
-
Pela Fórmula 3, a mediana é 17. Na Tabela existe
freqüência acumulada 17? Não. Caso existisse,
aquela seria a linha em que se encontraria a
mediana. Mas, no caso de não existir, como proceder?
Simples, veja:
-
As freqüências acumuladas são 2, 8, 18, 30 e 34. Qual
Dados agrupados
- O número 17, conseguido com a Fórmula 3, indica que a mediana pertence à linha em que
esse número se encontra. Mas como não há freqüência acumulada 17, como não é
possível encontrar diretamente 17 na freqüência acumulada, então, consideramos a freqüência acumulada imediatamente superior. Nesse caso, essa freqüência é o 18.
Destacamos a linha mediana, isto é, a linha onde a nossa mediana procurada se encontra.
Dados agrupados
-
Logo, o total de meninos é 0 + 16 + 6 + 20 + 36 = 78 ( ∑ =
78).
-
A mediana encontrada foi 2, isso significa que as famílias
que possuem dois meninos dividem nosso conjunto de
78 meninos ao meio: metade desses meninos estão nas
famílias com nenhum filho, com um filho e com dois
filhos;
-
A outra metade é composta de famílias com dois
meninos, com três meninos e famílias com quatro
meninos.
-
Agora ficou mais claro que a mediana divide nosso
Exercícios
Um dentista anotou o número de clientes
atendidos por dia, durante um período de 30
dias, e obteve os seguintes dados:
Exercícios
Numa caixinha de fósforo, vem grafada a seguinte informação: “contém 40 palitos”.
Para verificar esta informação, foram adquiridas 60 caixinhas de fósforos e foi feita uma contagem do número de palitos contidos em cada uma delas. Os resultados obtidos foram: