Distribuição de Frequências
Conceitos fundamentais
População – conjunto de indivíduos, elementos ou objectos que apresentam uma ou mais características (atributos) em comum.
Amostra – subconjunto da população que deve ser representativa da mesma.
Características ou atributos – estes podem ser:
Qualitativos – se as suas diferentes modalidades não são mensuráveis, isto é não podem ser expressos em números;
Quantitativos – se as suas diferentes modalidades são mensuráveis, isto é, po-dem ser expressos em números;
Dicotómicos – quando tomam apenas dois valores possíveis.
Variável – Símbolo que representa determinada característica da população ou da amostra. As variáveis podem ser
Discretas – tomam um número finito ou infinito numerável de valores; Contínuas – tomam um número infinito não numerável de valores.
Distribuição de frequências de variáveis discretas
Conjunto de todos os valores de uma variável e das frequências absolutas ou relativas correspondentes.
Dimensão da população – N Dimensão da amostra – n
Valores de uma variável - X1, X2,X3,, Xp
Frequência absoluta - F i
Frequência relativa - fi =F Ni ; fi =F ni
Frequências absolutas acumuladas – cum F i
Distribuição de frequências de variáveis contínuas
Número de classes – K – que pode ser determinado da seguinte forma: 5 para 25 e para 25
K = n< K ≈ n n≥ ou 1 3.22 log
K = + n
o número de classes deve ser 4< <K 14 e nenhuma classe deverá ter frequência nula, e as classes são da forma
[
l l i, s[
Amplitude das classes – max min
i X X R a K K − = =
Ponto médio da classe –
2 i s i l l C = + Frequência normalizada – hi =F ai i
Medidas de Localização
Média Aritmética
População - µ Amostra - X Dados Desagregados 1 N i i X N =∑
n X n i i∑
=1 Dados Agregados∑
∑
= = = k i i i k i i i f X N F X 1 1∑
∑
= = = k i i i k i i i f X n F X 1 1Dados Agregados em classes
∑
∑
= = = k i i i k i i i f C N F C 1 1∑
∑
= = = k i i i k i i i f C n F C 1 1Média Geométrica
Dados Desagregados 1 1Dados Agregados em classes
∑
= i i i C f 1 log log antMédia Harmónica
Dados Agregados 1 1 1 1 1 N N i i i i i i N F f X X = = =∑
∑
Mediana
• Dados Discretos 1 2 2 ; se n par 2 1 ; se n impar 2 n n obs obs Me n obs + + = + • Dados Contínuos Frequências absolutas( )
(
)
( )
( )
2 cum 1 N F Me Me li Me a Me F Me − − = + × Frequências relativas( )
(
)
( )
( )
0, 5 cum 1f Me Me li Me a Me f Me − − = + × com:( )
li Me - limite inferior da classe mediana
(
)
(
)
cum 1 ; cum 1F Me− f Me− - frequência acumulada absoluta e relativa da classe anterior à classe mediana
( ) ( )
;F Me f Me - frequência absoluta e relativa da classe à classe mediana
( )
a Me - amplitude da classe mediana
Moda
Frequências absolutas
( )
(
)
(
)
(
)
i( )
o o i i o i i o i i o i o a M M a F M a F M a F M l M × + + − + + = 1 1 1( )
o i Ml limite inferior da classe modal
(
o −1)
i i M a Ffrequência absoluta normalizada da classe anterior à classe modal
(
o +1)
i i M a Ffrequência absoluta normalizada da classe posterior à classe modal
( )
oi M
a amplitude da classe modal
Percentil
p relativo à percentagem x é dado por:( )
( )
(
)
a( )
P P f P f x P l P i i i i × − − + = Cum 1 com:( )
Pli - limite inferior da classe onde se situa o percentil
(
1)
Cum fi P− - frequência relativa acumulada da classe anterior à classe
onde se situa o percentil
( )
Pfi
- frequência relativa da classe onde se situa o percentil
( )
Pai
- amplitude da classe onde se situa o percentil
Dados Desagregados 1 i i X N µ = −
∑
Dados Agregados∑
−µ = i K i i X f 1Dados Agregados em classes
∑
−µ= i K i i C f 1
Variância
População - σ2 Amostra - S2 Dados Desagregados(
)
2 2 2 1 1 N N i i i i X X N N µ µ = = − = −∑
∑
(
)
2 2 2 1 1 n n i i i i X X X X n n = = − = −∑
∑
Dados Agregados(
)
2 2 2 i i i i f X −µ = f X −µ∑
∑
(
)
2 2 2 i i i i f X −X = f X −X∑
∑
Dados Agregados em classes(
)
2 2 2 i i i i f C −µ = f C −µ∑
∑
(
)
2 1 2 1 2 2 X C f X C f s k i i i k i i i − = − =∑
∑
= =Desvio padrão
População Amostra 2 σ = + σ 2 S = + SCoeficiente de variação
População Amostra 100 CV σ µ = × CV S 100 X = × Me Mo= = µ ⇒ Distribuição Simétrica Me Mo≤ ≤µ ⇒ Distribuição assimétrica positiva ou enviesada à esquerda
Me Mo≥
≥
Medidas de Concentração
Índice de Gini
(
)
1 1 1 1 1 1 1 1 Cum Cum 1 ; , n n i i i i i i i i i n n i i i i i i p q q F Y IG p q F Y p p − − = = − − = = − =∑
= −∑
= =∑
∑
∑
∑
, i iY F - Característica e frequência absoluta para cada classe i.
Medidas de Assimetria
Grau de Assimetria
População Amostra(
)
3 Me G µ σ − = G 3 X(
Me)
S − =Coeficiente de Pearson
1 Mo G µ σ − = se: 1 0G < ⇒ distribuição assimétrica negativa
1 0
G = ⇒ distribuição simétrica
1 0
G > ⇒ distribuição assimétrica positiva
3 1 2 3 1 2 Q Q Me G Q Q + − = −