PROBABILIDADE
PROF. ÁTILA
DESCRIÇÃO DE DADOS
Aula 01
Apostila Estatística Descritiva – Ana Farias Capítulo 1
Introdução
• A estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
• Áreas
• Estatística Descritiva
• Probabilidade
• A estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
• Áreas
• Estatística Descritiva
• Probabilidade
Introdução
• A estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
• Áreas
• Estatística Descritiva
• Probabilidade
• A estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
• Áreas
• Estatística Descritiva
• Probabilidade
População e amostra
ExemploUm grande banco, querendo lançar um novo produto, precisa conhecer o perfil socioeconômico dos seus clientes.
População de interesse: clientes de todas as agências
do banco.
População: é o conjunto de elementos para os quais
se deseja estudar determinada característica.
Amostragem Aleatória Simples
• Todo subconjunto de tamanho 𝑛 tem a mesma
chance de se tornar a amostra selecionada. O processo de amostragem aleatória simples pode ser com ou sem reposição
Tipos de amostragem
Amostragem Aleatória Estatificada
• A população é dividida em estratos, que são subconjuntos da população mutuamente exclusivos e exaustivos e de cada estrato extrai-se uma amostra aleatória simples.
Nas pesquisas estatísticas, as características sobre as quais queremos obter informação são chamadas variáveis.
Tipos de Variáveis
• Levantamento sobre alguns aspectos socioeconômicos dos empregados da seção de orçamentos de uma companhia.
dos elementos.
• Variáveis quantitativas: medem características
dos elementos.
Tipos de Variáveis
• Variáveis qualitativas: uma qualidade do elemento
em questão.
• Nominal: não é possível ordenar.
• Ordinal: permite ordenar.
em questão.
• Nominal: não é possível ordenar.
(Ex.: bairro de procedência; Estado civil)
• Ordinal: permite ordenar.
(Ex.: grau de instrução)
Tipos de Variáveis
• Variáveis quantitativas: números resultantes de
uma contagem ou mensuração.
• Discretas: pertencem a um conjunto enumerável ou finito.
• Contínuas: pertencem a um conjunto infinito
uma contagem ou mensuração.
• Discretas: pertencem a um conjunto enumerável ou finito.
(Ex. n° filhos; idade)
• Cotínuas: pertencem a um conjunto infinito
(Ex.: Salário)
Distribuição de frequências
• Frequência: o número de realizações de uma
variável.
• Distribuição de frequência: Dispor em uma tabela,
as frequências das realizações da variável, para se ter uma ideia global sobre estas.
A direção de uma empresa está estudando a possibilidade de fazer um seguro saúde para seus funcionários e respectivos familiares. Para isso, ela faz um levantamento de seus 500 funcionários, obtendo informação sobre sexo, estado civil, idade, número de filhos e salário.
Variáveis qualitativas
Gênero Frequência Frequência relativa Masculino 270 54 % Feminino 230 46 % Total 500 100 % 𝑓𝑟𝑒𝑞 𝑡𝑜𝑡𝑎𝑙
Gênero Frequência Frequência relativa
Masculino 270 54 %
Feminino 230 46 %
Variáveis qualitativas
Estado civil Frequência Frequência relativa Solteiro 125 25 % Casado 280 56 % Divorciado 85 17 % Viúvo 10 2 % Total 500 100 %frequência (absoluta ou relativa) da classe 0 50 100 150 200 250 300
Solteiro Casado Divorciado Viúvo
Estado Civil Estado civil Frequênci a Solteiro 125 Casado 280 Divorciado 85 Viúvo 10 Total 500
Variáveis qualitativas
• Gráfico de setores: a frequência de cada categoria é
representada pelo tamanho do setor.
Estado Civil
Solteiro Casado Divorciado Viúvo
Estado civil Frequência relativa Solteiro 25 % Casado 56 % Divorciado 17 % Viúvo 2 % Total 100 %
Número de filhos Frequência Frequência relativa (%) 0 120 24 1 95 19 2 90 18 3 95 19 4 35 7 5 30 6 6 20 4 7 15 3 Total 500 100
Variáveis quantitativas discretas
• E se a empresa queira limitar seu projeto para funcionários com até 4 filhos?
• Frequência Acumulada: quantas ocorrências
correspondem a valores menores ou iguais a esse valor.
Número de filhos
Frequência simples Frequência acumulada absoluta Frequência relativa (%) absoluta Frequência relativa (%) 0 120 24 120 24 1 95 19 215 43 2 90 18 305 61 3 95 19 400 80 4 35 7 435 87 5 30 6 465 93 6 20 4 485 97 7 15 3 500 100 Total 500 100 -- --
Variáveis quantitativas discretas
• Gráfico de colunas 0 20 40 60 80 100 120 140 0 1 2 3 4 5 6 7 número de filhos• Gráfico de setores
Não é muito usado nesse caso por não ser possível retratar a escala dos dados.
Variáveis quantitativas discretas
Variável idade:
• Quantitativa discreta;
• Grande variação de valores;
• Desnecessário retratar todas as idades;
Idade Frequência simples Frequência acumulada absoluta Frequência relativa (%) absoluta Frequência relativa (%) 19 – 23 1 0,2 1 0,2 24 – 28 23 4,6 24 4,8 29 – 33 103 20,6 127 25,4 34 – 38 246 49,2 373 74,6 39 – 43 52 10,4 425 85,0 44 – 48 50 10,0 475 95,0 49 - 53 25 5,0 500 100,0 Total 500 100 -- --
Variáveis quantitativas contínuas
• Distribuição de frequências agrupadas em classes.
• Todos os elementos devem pertencer a alguma classe.
• As classes não podem ter interseção.
Construindo distribuição com todos intervalos mesmo tamanho:
• 𝑘: número de intervalos desejados.
• Δ: primeiro número múltiplo de 𝑛 maior que Δ𝑡𝑜𝑡𝑎𝑙
tamanho do intervalo
=
Δ
Variáveis quantitativas contínuas
Exemplo:
Suponha que dentre os 500 funcionários da nossa empresa, o menor salário seja 2800 e o maior salário seja de 12400. Agrupe os dados em cinco classes.
Exemplo:
Suponha que dentre os 500 funcionários da nossa empresa, o menor salário seja 2800 e o maior salário seja de 12400. Agrupe os dados em cinco classes.
Variáveis quantitativas contínuas
Salário
(reais)
Frequência simples Frequência
acumulada absoluta Frequência relativa (%) absoluta Frequência relativa (%) 2800 ⊢ 4800 87 17,4 87 17,4 4800 ⊢ 6800 203 40,6 290 58 6800 ⊢ 8800 170 34 460 92 8800 ⊢ 10800 30 6 490 98 10800 ⊢ 12800 10 2 500 100,0
Histograma
• Retângulos contíguos, com bases sobre eixo horizontal.
• Escala definida de acordo com as classes.
Distribuição de frequências
Variáveis quantitativas contínuas
Histograma
Histograma
Altura da coluna ℎ = 𝑓
Distribuição de frequências
Variáveis quantitativas contínuas
Histograma de área unitária
• Altura da coluna ℎ = 𝑓𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎
𝛥
• Área da coluna: 𝑓𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 • Área total: 1
Polígono de frequência
Gráfico de linha obtido quando são unidos por uma
poligonal os pontos correspondentes às frequências das diversas classes, centrados nos respectivos pontos
Distribuição de frequências
Variáveis quantitativas contínuas
Ogiva de frequência
• Gráfico de linha que representa a distribuição das frequências acumuladas. Os pontos plotados são (limite superior ; frequência acumulada)
Distribuição de frequências
Variáveis quantitativas contínuas
Para o Departamento Financeiro da empresa analisada na apostila, obteve-se a seguinte informação sobre o sexo dos 23 funcionários:
M F F M M M F F M M M M M F M M F F M M M F F
Construa uma tabela de frequências para esses dados, bem como os gráficos de colunas e de setores.
Exercícios
1.6.5.
Os dados da Tabela são de empresas de hardware de computadores em uma amostra retirada de um banco de dados do sindicato da categoria.
(a) Construa distribuições de frequências usando
5 classes para as variáveis “Lucro anual” e “Clientes cadastrados”.
(b) Construa um histograma e o respectivo
polígono de frequências para cada distribuição do item (a).
Exercícios
1.6.6.Com o objetivo de pedir aumento de salários, o sindicato dos empregados de uma empresa de grande porte coletou uma amostra aleatória (assuma que a amostra represente bem a população) com 20% dos funcionários, obtendo os dados apresentados no polígono de frequências da Figura.
(a) Construa uma distribuição de frequências completa
para estes dados.