• Nenhum resultado encontrado

Análise de Informação Económica e Empresarial

N/A
N/A
Protected

Academic year: 2021

Share "Análise de Informação Económica e Empresarial"

Copied!
12
0
0

Texto

(1)

Análise de Informação Económica e Empresarial

Aula 7: Redução de Dados: Medidas de Dispersão e Concentração

(2)

Aula 7: Redução de Dados: Medidas de

Dispersão e Concentração

(3)

Sumário

Conceitos Fundamentais

Dispersão

Intervalo de Variação (Amplitude Total) e Intervalo de Variação Interquartil (Q3-Q1) Dispersão Absoluta: Desvio Absoluto Médio, Desvio Padrão e Variância

Dispersão Relativa: Coeficiente de Variação Concentração

Coeficiente de Gini e Curva de Lorenz

Diagrama de extremos e quartis ou Gráfico caixa e bigodes

Tópicos

1. Medidas de Dispersão e de Concentração

2. Intervalo de Variação (Amplitude Total) e Intervalo de Variação Interquartil (Q3-Q1) 3. Dispersão Absoluta: Desvio Absoluto Médio, Desvio Padrão e Variância

4. Dispersão Relativa: Coeficiente de Variação 5. Coeficiente de Gini

6. Curva de Lorenz

Exercício de consolidação: Utilizar a base de dados de notas e calcular média aritmética, máximo, mínimo, 3º quartil, 1º quartil, amplitude total, intervalo de variação interquartil, desvio absoluto médio, desvio padrão, variância e coeficiente de variação

Exercício de aplicação: exercício de aplicação de medidas de concentração.

Bibliografia: Reis, Elizabeth (2005) Estatística Descritiva, Lisboa: Edições Sílabo, 6ª edição - Cap 5. Medidas de Dispersão e Concentração, pp 97-117

(4)

Medidas de dispersão

➢ Temos os dados:

𝑋

1

, 𝑋

2

, 𝑋

3

, … , 𝑋

𝑛

Calculámos valores que representavam toda a distribuição – as medidas de localização...

Até que ponto as medidas de localização calculadas são uma boa representação dos dados? Quão distintos são os elementos da população?

Necessitamos de uma medida da heterogeneidade dos valores!

➢ Medidas de dispersão: indicadores da heterogeneidade

As medidas de dispersão absolutas – na unidade da variável

• Amplitude total e amplitude interquartil

• Desvio absoluto médio, desvio padrão e variância

As medidas de dispersão relativas

• Intervalo interquartil relativo

• Coeficiente de variação

(5)

Medidas de dispersão

➢ Medidas de dispersão com base em medidas de posição

Amplitude total ou Intervalo de variação

𝑅

𝑥

= max 𝑋

𝑖

− min 𝑋

𝑖

= 𝑋

𝑚𝑎𝑥

− 𝑋

𝑚𝑖𝑛

• Características do intervalo de variação

Facilidade de cálculo

Muito sensível aos valores extremos

Não tem em conta valores intermédios

Sensibilidade à dimensão da população ou da amostra

Amplitude Interquartis ou Intervalo de variação interquartil 𝐼𝑄 = 𝑄

3

− 𝑄

1

• Características do intervalo de variação interquartil

Menor sensibilidade aos valores extremos

Não toma em consideração todos os valores da coleção

(6)

Medidas de dispersão

Diagrama de extremos e quartis

Avaliação da localização e dispersão a partir de medidas de posição

max

min

mediana 3º quartil

1º quartil

(7)

Medidas de dispersão

Medidas de dispersão com base em todas as observações

Medir o afastamento entre todas as observações

Desvio absoluto médio

Dados não agrupados:

𝐷𝑀

𝑥

=

σ𝑖=1

𝑛 𝑥𝑖− ҧ𝑥

𝑛

=

σ𝑖=1

𝑛 𝑥𝑖−𝜇 𝑛

Dados agrupados/classificados:

𝐷𝑀

𝑥

=

σ𝑖=1𝑛 𝑛𝑖 𝑣𝑖− ҧ𝑥

𝑛

= σ

𝑖=1𝑛

𝑓

𝑖

𝑣

𝑖

− ҧ𝑥

(ou 𝐶𝑖 em vez 𝑣𝑖)

(8)

Medidas de dispersão

Medidas de dispersão com base em todas as observações

Medem o afastamento entre todas as observações.

Desvio-Padrão

Dados não agrupados:

𝑠

𝑥

= 𝜎

𝑥

=

σ𝑖=1𝑛 (𝑥𝑖− ҧ𝑥)2

𝑛

Dados agrupados/classificados:

𝑠

𝑥

= 𝜎

𝑥

=

σ𝑖=1

𝑛 𝑛𝑖(𝑣𝑖− ҧ𝑥)2

𝑛

= σ

𝑖=1𝑛

𝑓

𝑖

(𝑣

𝑖

− ҧ𝑥)

2

Variância

Dados não agrupados: 𝑠𝑥2 = 𝜎𝑥2 = σ𝑖=1

𝑛 (𝑥𝑖− ҧ𝑥)2 𝑛

Dados agrupados/classificados: 𝑠𝑥2 = 𝜎𝑥2 = σ𝑖=1

𝑛 𝑛𝑖(𝑣𝑖− ҧ𝑥)2

𝑛 = σ𝑖=1𝑛 𝑓𝑖(𝑣𝑖 − ҧ𝑥)2

(9)

Medidas de dispersão

Medidas de dispersão relativa

Permitem comparar distribuições com medidas de localização distintas.

Intervalo interquartil relativo

𝐼𝑄𝑅 = 𝑄3−𝑄1

𝑄2

Coeficiente de variação

𝐶𝑉𝑥 = 𝑠𝑥

ҧ𝑥 = 𝜎𝑥

𝜇

(10)

Medidas de concentração

Medidas de concentração

Como se reparte, entre os elementos da população, o valor total de uma característica ordenável e somável (ex: vendas, rendimento, etc.)

Ideia:

1. Avaliar qual a proporção dessa característica que cada elemento da população detém.

2. Temos elevada concentração se poucos elementos da população detiverem uma elevada proporção do total.

Índice de Gini - uma forma de medir a concentração

𝐼𝐺 = σ𝑖=1𝑛−1(𝑐𝑢𝑚 𝑓𝑖 − 𝑐𝑢𝑚 𝑦𝑖)

σ𝑖=1𝑛−1𝑐𝑢𝑚 𝑓𝑖 = σ𝑖=1𝑛−1(𝑝𝑖 − 𝑞𝑖) σ𝑖=1𝑛−1𝑝𝑖

Proporção da população

Proporção da variável

𝑝𝑖 = cum 𝑓𝑖 , 𝑞𝑖= cum 𝑦𝑖

(11)

Medidas de Concentração

Exemplo: rendimento de 8 trabalhadores

Rendimento (𝒀𝒊)

𝑭𝒊 Rendimento

Acumulado (cum 𝒀𝒊)

População Acumulada

(cum 𝑭𝒊)

% de rendimento

(cum 𝒚𝒊)

% de população

(cum 𝒇𝒊)

120 1 120 1 0,060 0,125

150 1 270 2 0,135 0,250

180 1 450 3 0,225 0,375

200 1 650 4 0,325 0,500

250 1 900 5 0,450 0,625

260 1 1160 6 0,580 0,750

300 1 1460 7 0,730 0,875

540 1 2000 8 1,000 1,000

2000 8

(12)

Medidas de Concentração

Representação gráfica: a curva de Lorenz

proporção acum.

população 𝒄𝒖𝒎 𝒇𝒊 proporção

acum.

variável 𝒄𝒖𝒎 𝒚𝒊

0

1

1

Referências

Documentos relacionados

Trabalho empírico; Pesquisa; Palavras-chave; Informação quantitativa; Informação documental Ferramentas de pesquisa; Avaliação de resultados; Fontes de

Este presente artigo é o resultado de um estudo de caso que buscou apresentar o surgimento da atividade turística dentro da favela de Paraisópolis, uma

Changes in the gut microbiota appears to be a key element in the pathogenesis of hepatic and gastrointestinal disorders, including non-alcoholic fatty liver disease, alcoholic

Assim, a estrutura dúplex é metaestável, sendo obtida na temperatura ambiente após resfriamento que impeça as transformações de fase, particularmente de ferrita em sigma, como

As key results, we found that: the triceps brachii muscle acts in the elbow extension and in moving the humerus head forward; the biceps brachii, pectoralis major and deltoid

Afinal de contas, tanto uma quanto a outra são ferramentas essenciais para a compreensão da realidade, além de ser o principal motivo da re- pulsa pela matemática, uma vez que é

Effects of the bite splint 15-day treatment termination in patients with temporomandibular disorder with a clinical history of sleep bruxism: a longitudinal single-cohort

Desse modo, a escola e a mídia são significadas como um lugar de consolidação de imagens sobre a língua, através do ensino de língua portuguesa, estabilizando-as a