• Nenhum resultado encontrado

2-DistFrequencias

N/A
N/A
Protected

Academic year: 2021

Share "2-DistFrequencias"

Copied!
24
0
0

Texto

(1)

Estatística Aplicada à Gestão

Prof. Eduardo B. M. Barbosa

Faculdade de Tecnologia de Guaratinguetá – Fatec

Guaratinguetá 2018

(2)

Sumário

• Organização dos Dados • ROL

• Distribuições de Frequências • Dados Qualitativos • Dados Quantitativos

• Frequências (Absoluta, Relativa e Acumulada)

• Diagramas

• Histogramas

• Polígono de Frequência • Ogiva

(3)

Organização dos Dados

Ao realizar um estudo estatístico, um pesquisador deve reunir dados da(s) variável(is) de interesse

• Para descrever situações, chegar a conclusões ou fazer estimativas a respeito dos eventos, o pesquisador deve organizar os dados (em tabelas) e apresenta-los de maneira conveniente

Por exemplo, um pesquisador deseja estudar o tempo (em segundos) que 50 funcionários de uma empresa gastam no preenchimento de um formulário

49 57 38 73 81 74 59 76 65 69 54 56 69 68 78 65 85 49 69 61 48 81 68 37 43 78 82 43 64 67 52 56 81 77 79 85 40 85 59 80 60 71 57 61 69 61 83 90 87 74

(4)

Organização dos Dados (cont.)

Os dados como descritos originalmente são chamados dados brutos (dados na forma em que foram coletados, sem nenhum tratamento)

• Geralmente, pouca ou nenhuma informação pode ser extraída, sendo necessário organiza-los

A organização numérica mais simples é chamada ROL

• Ordenação dos dados em ordem crescente ou decrescente

37 38 40 43 43 48 49 49 52 54 56 56 56 57 57 59 59 59 60 61 61 61 64 65 67 68 68 69 69 69 71 73 74 74 76 77 78 78 79 80 81 81 81 82 83 85 85 85 87 90

2. Qual a amplitude (H) dos dados?

H = Xmax − Xmin 3. Quais os tempos mais frequentes?

(5)

Organização dos Dados (cont.)

4. É possível organizar os dados de maneira mais eficiente, tal que se possa extrair mais informações? > d = c(37, 48, 56, 59, 61, 68, ..., 80, 83, 90) > table(d) 37 38 40 43 48 49 52 54 56 57 59 ... 1 1 1 2 1 2 1 1 3 2 3 ...

Software R

Valor 37 38 40 43 48 49 52 54 56 57 59 Freq. 1 1 1 2 1 2 1 1 3 2 3 Valor 60 61 64 65 67 68 69 71 73 74 76 Freq. 1 3 1 1 1 2 3 1 1 2 1 Valor 77 78 79 80 81 82 83 85 87 90 Freq. 1 2 1 1 3 1 1 3 1 1

(6)

Distribuições de Frequências

Distribuições de frequências são tabelas que organizam os dados brutos em classes com as suas frequências correspondentes

• Classes são os intervalos nos quais os valores da variável analisada (os dados!) são agrupados • Quantitativas (numéricas) ou categorias qualitativas

• Frequência da classe (número de observações contidas em cada classe)

Tempo (s) Contagem Frequência abs. (n)

37 |− 45 ///// 5 45 |− 53 //// 4 53 |− 61 ////////// 10 61 |− 69 //////// 8 69 |− 77 //////// 8 77 |− 85 ////////// 10 85 |− 93 ///// 5 Total ΣΣΣ) 50

(7)

Distribuições de Frequências (cont.)

Detalhes técnicos

• Número de classes (k) • Limites das classes

• Limite inferior (l) • Limite superior (u) • Amplitude da classe (h) • Ponto médio (xi)

Tempo (s) Contagem Frequência abs. (n)

37 |− 45 ///// 5 45 |− 53 //// 4 53 |− 61 ////////// 10 61 |− 69 //////// 8 69 |− 77 //////// 8 77 |− 85 ////////// 10 85 |− 93 ///// 5 Total ΣΣΣ) 50

(8)

Distribuições de Frequências (cont.)

Observe abaixo amostras do tipo sanguíneo de 25 soldados do exército.

A A A AB O

O O B AB B

B B O A O

A O O O AB

AB A A O A

• Qual a variável em estudo e sua natureza?

• Qual o tipo sanguíneo aparece com mais frequência?

• Como organizar os dados de maneira mais eficiente, tal que se possa extrair mais informações?

(9)

Distribuições de Frequências (cont.)

Procedimento para criação de distribuições de frequências para variáveis qualitativas (nominais ou ordinais)

1. Construir uma tabela com a seguinte estrutura

Variável | Freq. Abs. | Freq. Rel.

, em que Variável corresponde à variável observada, Freq. Abs. é a frequência absoluta (número de repetições) e Freq. Rel. é a proporção das observações em relação ao número total de observações

2. Listar os valores da variável sem repetição (preencher a coluna Variável)

3. Contar o número de vezes que cada valor da variável se repete (preencher a coluna Freq. Abs.)

4. Dividir cada valor da coluna Freq. Abs. pelo número total de dados observados e preencher a coluna Freq. Relativa

(10)

Distribuições de Frequências (cont.)

Frequência Absoluta

=

n

i

n

• OBS: 1. 2. Porcentagem = fi × 100

Frequência Relativa

n

n

f

i

=

i

1

=

f

i • , em que k = 1, 2, 3, ..., n • , em que k = 1, 2, 3, ..., n

Frequência Acumulada

=

=

k i i k

n

N

1

=

=

k i i k

f

F

1

(11)

Distribuições de Frequências (cont.)

Abaixo são apresentadas os conceitos de 25 alunos do curso de matemática. Construa a distribuição de frequências correspondente A B B B C A D B C D B D E C D A C E C C C C C D E

• Qual a variável em estudo e sua natureza?

• Faça uma breve análise dos dados. (Dica: Qual a nota mais frequente? E a menos frequente? Quantos alunos com notas A, B e C?)

(12)

Distribuições de Frequências (cont.)

O procedimento anterior também pode ser aplicado para dados quantitativos (discretos!)

• Somente se, H < 10

Por exemplo, construa a distribuição de frequência para as idades de 30 trainees de uma empresa

23 24 22 22 21 24 22 23 23 22 25 25 23 22 21 21 21 22 24 24 23 21 22 22 22 24 25 25 22 21 Breve análise

• Natureza dos dados: quantitativos discretos • Xmin = 21; Xmax = 25

(13)

Distribuições de Frequências (cont.)

O número de chamadas recebidas pelo SAC (Serviço de Atendimento ao Consumidor) de uma grande empresa foi registrado durante 30 dias. Construa a distribuição de frequências correspondente

0 1 0 1 0 2 2 0 0 3 1 2 1 0 4 5 3 2 2 0 3 0 3 0 2 2 3 5 4 1

• Qual a variável em estudo e sua natureza? • Qual a média de chamadas recebidas por dia? • Faça uma breve análise dos dados.

(14)

Distribuições de Frequências (cont.)

Quando a amplitude (H) das observações é grande, os dados devem ser agrupados em classes (com mais de uma unidade de largura) nas distribuições de frequências

• Dados discretos (Somente se H > 10) • Dados contínuos

Seja os dados do exemplo inicial (tempo para preenchimento de um formulário), em ROL crescente

37 38 40 43 43 48 49 49 52 54 56 56 56 57 57 59 59 59 60 61 61 61 64 65 67 68 68 69 69 69 71 73 74 74 76 77 78 78 79 80 81 81 81 82 83 85 85 85 87 90 Breve análise

• Natureza dos dados: quantitativos discretos • Xmin = 37; Xmax = 90; H = 53

(15)

Distribuições de Frequências (cont.)

Procedimento para criação de distribuições de frequências agrupadas por intervalos de classes para variáveis quantitativas

1. Calcular a amplitude total dos dados (H)

H = 90 – 37 = 53

2. Calcular o número de classes (k)

k = ≈≈≈≈ 7

3. Calcular a amplitude dos intervalos de classes (h)

h = ≈≈≈≈ 8

4. Iniciar o preenchimento da tabela a partir do menor valor observado e incrementar o valor de h

Procedimento

50

7

53

(16)

Distribuições de Frequências (cont.)

Por exemplo, abaixo são apresentados dados da estatura (em cm) de 40 estudantes de uma universidade. Construa a distribuição de frequências correspondente.

130 131 132 134 135 137 138 140 141 141 143 151 152 153 154 155 155 155 158 158 161 164 164 165 165 167 168 169 169 170 171 172 173 174 175 176 178 179 179 189 Procedimento Resultado • Xmin = • Xmax = • H = • k = • h =

Estatura (cm) Frequência abs. (n)

130 |− ___ ___ |− ___ ___ |− ___ ___ |− ___ ___ |− ___ ___ |− ___ Total 40

(17)

Distribuições de Frequências (cont.)

Construa a distribuição de frequências para as idades de 50 funcionários de uma empresa:

18 18 18 19 19 19 19 20 20 21 21 21 21 21 21 21 21 22 22 22 23 23 23 23 24 25 25 25 25 27 29 30 32 33 35 40 40 40 45 45 50 51 51 52 55 60 60 62 65 65

• Qual a variável em estudo e sua natureza? • Qual a idade média dos funcionários?

• Faça uma breve análise dos dados.

(18)

Distribuições de Frequências (cont.)

> d = c(18, 18, 18, 19, 19, 19, 19, 20, 20, 21, ...) # observacoes > k = round(sqrt(length(d)), 0) # num. linhas

> xmin = min(range(d)) # menor valor obs. > xmax = max(range(d)) # maior valor obs. > H = xmax – xmin # amplitude das obs.

> h = round(H / k) # amplitude do intervalo de classe > interval = seq(xmin, (xmax+incr), by = h) # intervalos

> d.cut = cut(d, interval, right = FALSE) > d.freq = table(d.cut)

d.cut

[18,25) [25,32) [32,39) [39,46) [46,53) [53,60) [60,67) 25 7 3 5 4 1 5

(19)

Diagramas

Após organizar os dados em distribuições de frequências, eles podem ser apresentados na forma de gráficos

Objetivos

• Transmitir a informação de forma ilustrativa

• Facilitar a compreensão dos dados (principalmente, para quem não tem ou tem pouco conhecimento estatístico)

• Despertar a atenção dos espectadores

• Discutir um problema, reforçar um ponto crítico ou resumir os dados • Descobrir tendências ou padrões ao longo do tempo

Gráficos mais comuns

• Histograma

• Polígono de frequências • Ogiva

(20)

Histogramas

Gráficos de barras contíguas, com a base proporcional aos intervalos de classes e área de cada retângulo proporcional à respectiva frequência

• Dados contínuos

Tempo (s) Frequência abs. (n)

37 |− 45 5 45 |− 53 4 53 |− 61 10 61 |− 69 8 69 |− 77 8 77 |− 85 10 85 |− 93 5 Total 50

> hist(d, main = "Histograma", xlab = "Tempo (s)", ylab = "Freq. abs.", las = 1, breaks = c(seq(xmin, xmax+h, by = h)), right = FALSE)

(21)

Polígono de Frequências

Gráficos de linhas, em que as frequências são marcadas sobre os pontos médios dos intervalos de classes

• Pontos extremos: pontos médios anterior à primeira e posterior à última

OBS.: eixo das abscissas é estendido!

Tempo (s) Frequência abs. (n)

37 |− 45 5 45 |− 53 4 53 |− 61 10 61 |− 69 8 69 |− 77 8 77 |− 85 10 85 |− 93 5 Total 50

(22)

Ogiva

Gráficos de linhas, que representa as frequências acumuladas de uma distribuição de frequências

• Limite inferior da primeira classe é 0 (zero!)

• Preenchimento das frequências acumuladas (limites superiores das classes)

0 + 5 = 5 5 Abaixo de 45 45 10 Abaixo de 85 50 5 8 8 10 4 0 Frequência abs. (n) Tempo (s) Frequência acm. (N) Abaixo de 37 0 Abaixo de 53 5 + 4 = 9 Abaixo de 61 9 + 10 = 19 Abaixo de 69 19 + 8 = 27 Abaixo de 77 35 Abaixo de 93 50 Total

(23)

--Outros Gráficos – Barras

Representa os dados usando barras verticais ou horizontais cujas alturas ou comprimentos correspondem as frequências dos dados

• Adequado para dados quantitativos (discretos) ou qualitativos (nominal ou ordinal)

5 1 30 2 2 5 7 9 Frequência abs. (n) Núm. Chamadas 0 2 3 4 5 Total

(24)

Outros Gráficos – Setores

Um gráfico de setores (ou pizza) é um círculo que é dividido em setores de acordo com o percentual das frequências em cada categoria

• Adequado para dados qualitativos (nominal ou ordinal)

25 9 4 4 8 Frequência abs. (n) 0,16 AB 1 0,36 0,16 0,32 Frequência rel. (f) Tipo Sanguíneo A B O Total

Referências

Documentos relacionados

Este trabalho apresenta um modelo matemático para representação de um tecido em função da aplicação de forças e sua interação com elementos sólidos não deformáveis visando

For additional support to design options the structural analysis of the Vila Fria bridge was carried out using a 3D structural numerical model using the finite element method by

(1983) verificaram que a seleção aos cinco anos foi tão eficiente quanto aos 20 anos para os caracteres de crescimento em P. taeda, principalmente para altura, que foi usada

A assistência da equipe de enfermagem para a pessoa portadora de Diabetes Mellitus deve ser desenvolvida para um processo de educação em saúde que contribua para que a

considerado sujeito de direito, pois era propriedade do dominus. O trabalho escravo continuava no tempo, de modo indefinido, mais precisamente enquanto o escravo vivesse ou deixasse

O segundo Beneficiário será designado pelo Segurado na Proposta de Adesão, podendo ser substituído a qualquer tempo, mediante solicitação formal assinada pelo próprio Segurado, para

Se você tiver, no mínimo, três anos de vinculação ao Plano, terá direito ao Benefício Proporcional Diferido (BPD), que consiste em manter o saldo de Conta de

Os casos não previstos neste regulamento serão resolvidos em primeira instância pela coorde- nação do Prêmio Morena de Criação Publicitária e, em segunda instância, pelo