Ministério da Educação
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Câmpus Curitiba
Diretoria de Graduação e Educação Profissional Departamento Acadêmico de Estatística
Disciplina: Probabilidade e Estatística (MA70H) ─ Profª Silvana Heidemann Rocha Estudante: ____________________________________________ Código: ______________
APRESENTAÇÃO DE DADOS PARA VARIÁVEL QUANTITATIVA 1 TABELA E GRÁFICO PARA VARIÁVEL QUANTITATIVA DISCRETA
• Tabela de distribuição de frequências, com os dados não agrupados em classes • Histograma de haste
2 TABELA E GRÁFICOS PARA VARIÁVEL QUANTITATIVA CONTÍNUA
• Tabela de distribuição de frequências, com os dados agrupados em classes o Elementos de uma tabela de distribuição de frequências, com 𝑘 classes:
▪ Variável (𝑋), cuja amostra é representada por 𝑋: 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑛 e a amplitude amostral (𝐴𝐴𝑋) é calculada por 𝐴𝐴𝑋 = 𝑚á𝑥{𝑥1, 𝑥2, … , 𝑥𝑛} − 𝑚í𝑛{𝑥1, 𝑥2, … , 𝑥𝑛}
▪ Tamanho da amostra (𝑛)
▪ Classe de frequências (𝑖), com 𝑖 = 1, 2, 3, … , 𝑘 ▪ Limites de classe
✓ Limite inferior (𝑙𝑖) ✓ Limite superior (𝐿𝑖)
▪ Amplitude de classe ou intervalo de classe (ℎ𝑖) , com ℎ𝑖 = 𝐿𝑖 − 𝑙𝑖 ▪ Amplitude total da distribuição (𝐴𝑇), com 𝐴𝑇 = 𝐿𝑘− 𝑙1
▪ Ponto médio de classe (
𝑥
𝑖), com𝑥
𝑖=
𝐿𝑖+𝑙𝑖 2▪ Frequência simples ou absoluta de classe (𝑛𝑖), com ∑𝑘𝑖=1𝑛𝑖 = 𝑛. ▪ Frequência relativa de classe (𝑓𝑟𝑖), com 𝑓𝑟𝑖 =𝑛𝑖
𝑛 e ∑ 𝑓𝑟𝑖 = 1 𝑘
𝑖=1
▪ Frequência acumulada de classe (𝐹𝑖), com 𝐹𝑗 = ∑𝑗𝑖=1𝑛𝑖
▪ Frequência relativa acumulada de classe (𝐹𝑟𝑖), com 𝐹𝑟𝑗 = ∑𝑗𝑖=1𝑓𝑟𝑖
▪ Densidade de frequência relativa de classe (𝛥𝑖), com 𝛥𝑖 =𝑓𝑟𝑖
ℎ𝑖
• Histograma de frequência simples ou histograma de frequência absoluta • Histograma de frequência relativa
• Histograma de densidade de frequência relativa: obrigatório para distribuição de frequências com amplitudes diferentes para as classes
• Histograma de frequência acumulada
• Histograma de frequência relativa acumulada
• Polígono de frequência (absoluta, relativa, acumulada, relativa acumulada) • Polígono de densidade de frequência relativa
• Curva polida
3 DIAGRAMA DE CAIXA (BOX PLOT): usado para visualizar eventuais assimetria e pontos discrepantes, nos dados.
4 DIAGRAMA RAMO-E-FOLHAS: usado para preservar os dados originais, organizados em rol 5 OBSERVAÇÕES SOBRE TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS, COM DADOS
AGRUPADOS EM CLASSE
• Usualmente, é recomendado que uma tabela de distribuição de frequências, com dados agrupados em classe, apresente de 4 a 20 classes.
• Numa tabela de distribuição de frequências, com dados agrupados em classe: o não pode haver classe com frequência nula;
o numa mesma classe, só podem ser agrupados elementos semelhantes entre si, de modo que o ponto médio da respectiva classe represente realmente todos os elementos agrupados naquela classe;
o o número de classes, 𝑘, é calculado por chute inicial e as fórmulas mais comuns são:
𝑘 = √𝑛 , para 𝑛 ≤ 400, e 𝑘 = 1 + 3,3 log 𝑛 (fórmula de Sturges) o a amplitude de classe é calculada por chute inicial por meio da fórmula ℎ𝑖 =𝐴𝐴𝑋
𝑘 , com
𝐴𝐴𝑋 = 𝑚á𝑥{𝑥1, 𝑥2, … , 𝑥𝑛} − 𝑚í𝑛{𝑥1, 𝑥2, … , 𝑥𝑛}, isto é, 𝐴𝐴𝑋 é a amplitude amostral;
o as amplitudes de classe não precisam ser todas iguais; o mais importante é que nenhuma classe tenha frequência nula, pois, ao se tentar ajustar uma curva de densidade de probabilidade ao histograma de densidade de frequência relativa, mediante testes de aderência ou de ajustamento, são realizadas divisões pela frequência simples de cada classe;
o em geral, o limite inferior da primeira classe, 𝑙1 , é igual ao menor valor observado na amostra, mas isso não é obrigatório; o mais importante é que o ponto médio de cada classe realmente represente os dados agrupados naquela classe.
• Quando uma variável discreta apresentar uma quantidade grande de resultados de forma que a tabela de distribuição de frequências tenha muitas linhas, pode-se agrupar os resultados em intervalos de classe, tal como feito para variáveis contínuas.
Tabela genérica para dados agrupados em classe Classe (𝑖) Variável (𝑋) Frequência simples (𝑛𝑖) Ponto médio (𝑥𝑖) Frequência relativa (𝑓𝑟𝑖) Frequência acumulada (𝐹𝑖) Frequência relativa acumulada (𝐹𝑟𝑖) Densidade de frequência relativa (∆𝑖) 1 𝑙1 𝐿1 𝑛1 𝑥1 𝑓𝑟1 𝐹1 𝐹𝑟1 ∆1 2 𝑙2 𝐿2 𝑛2 𝑥2 𝑓𝑟2 𝐹2 𝐹𝑟2 ∆2 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝑘 𝑙𝑘 𝐿𝑘 𝑛𝑘 𝑥𝑘 𝑓𝑟𝑘 𝐹𝑘 𝐹𝑟𝑘 ∆𝑘 Total 𝑛 1,000 Fonte: A autora. EXERCÍCIOS
1) Preencha a tabela abaixo:
Peça de automóvel da fábrica Carro Popular, segundo o diâmetro, em centímetros – Almirante Tamandaré – Agosto/2018 Classe (𝑖) Diâmetro, em cm (𝑋) Nº de peças (𝑛𝑖) Ponto médio (𝑥𝑖) Frequência relativa (𝑓𝑟𝑖) Frequência acumulada (𝐹𝑖) Frequência relativa acumulada (𝐹𝑟𝑖) Densidade de frequência relativa (∆𝑖) 1 20 30 4 2 30 50 8 3 50 100 12 4 100 120 6 Total 30
Fonte: Dados fictícios.
a) Esboce o histograma de frequência, o histograma de frequência relativa e o histograma de densidade de frequência relativa. Qual deles representa adequadamente os dados? Justifique.
b) Esboce o polígono de frequência, o polígono de frequência relativa e o polígono de densidade de frequência relativa, sobre o respectivo histograma do exercício 2. Após, esboce a respectiva curva polida.
c) Esboce o histograma de frequência relativa acumulada e, sobre ele, o respectivo polígono de frequência relativa acumulada. Após, esboce a respectiva curva polida.
02) Considere o quadro abaixo:
Perfil de 30 chefes de família do Bairro Alto – Curitiba - 2002
Nº Estado
civil Sexo Religião
Nº de filhos Região de procedência Salário mensal, em salários mínimos Escolaridade Idade, em anos 01 Solteiro M Católica - Interior 4,5 Fundamental 26
02 Casado F Católica 2 Interior 4,7 Fundamental 28
03 Solteiro F Católica 1 Interior 3,2 Fundamental 30
04 Solteiro M Católica 3 Capital 6,3 Média 45
05 Casado M Espírita 2 Capital 6,4 Média 42
06 Casado M Espírita 3 Capital 7,1 Média 36
07 Casado M Católica 4 Capital 7,2 Média 41
08 Solteiro M Africana 2 Interior 5,1 Fundamental 45
09 Casado M Africana - Interior 3,7 Fundamental 26
10 Casado M Africana 3 Outro Estado 4,2 Fundamental 25 11 Casado F Africana - Outro Estado 16,2 Superior 28 12 Casado F Evangélica 2 Outro Estado 15,9 Superior 29 13 Divorciado M Evangélica 1 Capital 17,3 Superior 35
14 Viúvo M Evangélica 1 Capital 5,1 Fundamental 37
15 Casado M Católica 1 Interior 4,6 Fundamental 45
16 Casado F Africana 2 Outro Estado 8,4 Fundamental 42 17 Divorciado M Evangélica 2 Outro Estado 9,0 Média 43 18 Divorciado F Católica 3 Capital 3,6 Fundamental 40
19 Viúvo F Católica 2 Interior 3,2 Fundamental 42
20 Solteiro M Católica 1 Outro Estado 6,3 Fundamental 31 21 Divorciado F Espírita 1 Outro Estado 18,4 Média 33
22 Casado M Espírita 1 Capital 3,4 Fundamental 29
23 Casado M Católica 2 Capital 9,1 Superior 29
24 Viúvo F Evangélica 2 Capital 19,1 Superior 45
25 Viúvo M Africana 3 Interior 5,0 Fundamental 34
26 Divorciado M Africana - Interior 3,6 Fundamental 30 27 Divorciado F Católica - Interior 2,6 Fundamental 45 28 Solteiro F Evangélica 3 Capital 10,1 Superior 46 29 Casado F Evangélica 2 Outro Estado 5,6 Fundamental 40
30 Casado M Católica 2 Outro Estado 6,3 Média 36
Fonte: Dados fictícios.
a) Classifique todas as variáveis que aparecem no quadro e identifique as respectivas escalas de medição.
6 MEDIDAS ESTATÍSTICAS PARA UM CONJUNTO DE DADOS QUANTITATIVOS
Das medidas estatísticas, abaixo, é preciso verificar quais delas são adequadas à escala da variável em questão.
• Medidas de posição, separatrizes ou quantis1 • Mediana (Me ou
𝑥̃)
• Tercil (T) • Quartil (Q) • Decil (D)
• Percentil ou centil (P) • Medidas de tendência central
• Médias2
▪ Média aritmética (
𝑥̅
): simples, ponderada ▪ Média geométrica (𝑥
̅𝑔): simples, ponderada
▪ Média harmônica (
𝑥
̅ℎ): simples, ponderada
▪ Média de Potência (ou momentos): absoluta, centrada; simples, ponderada • Mediana (
𝑥̃)
• Moda (Mo)
• Medidas de dispersão ou de variabilidade • Amplitude total (AT)
• Desvio médio absoluto (DMA) • Variância ▪ Populacional (𝜎2) ▪ Amostral (s2) • Desvio-padrão ▪ Populacional (𝜎) ▪ Amostral (s) • Coeficiente de variação (CV) ▪ Populacional ▪ Amostral
• Medidas de forma: assimetria3 e curtose4
• Momentos5 : Momentos absolutos, momentos centrados, momentos conjuntos
1 Quando os dados estão discretizados, há vários métodos para calcular os quantis e, geralmente, os resultados obtidos são diferentes, de método para método. Aqui, para dados discretizados, o cálculo dos quantis será feito pelo método mais básico. Quando os dados estão agrupados em classe, o cálculo dos quantis pode ser feito a partir da tabela de distribuição de frequências ou pelo histograma de densidade de frequência relativa, supondo os dados estarem distribuídos uniformemente dentro de cada classe.
2 Nas engenharias, na maioria das vezes, os levantamentos de dados envolvem variáveis quantitativas contínuas, para as quais o adequado é a média aritmética, geralmente. Por isso, nesta disciplina, serão trabalhadas fórmulas obtidas a partir da média aritmética. Os conceitos, definições e aplicações dos outros tipos de média podem ser encontrados em MILONE, G. Estatística geral e aplicada. São Paulo: Thomson Learning, 2006; em PEDROSA, A. C., GAMA, S. M. Introdução computacional à probabilidade e estatística com Excel. 3. ed. Porto-PT: Porto, 2016.
3 Para os interessados em conhecer um pouco mais sobre assimetria, vide MILONE, G. Estatística geral e
aplicada. São Paulo: Thomson Learning, 2006.
4 Idem 5 Ibidem.
7 CONCEITOS OU DEFINIÇÕES SOBRE MEDIDAS ESTATÍSTICAS
7.1 MEDIDAS DE POSIÇÃO, SEPARATRIZES OU QUANTIS PARA UM CONJUNTO CONTÍNUO Seja 𝑋: 𝑥(1), 𝑥(2), 𝑥(3), … , 𝑥(𝑛) um conjunto de dados quantitativos, ordenados, para uma variável 𝑋. Os conceitos referentes às medidas de posição "mediana", "tercil",
"quartil", "decil" e "percentil", para um conjunto contínuo, estão representados abaixo, respectivamente. Essas medidas são denominadas genericamente por "quantil". Dos quantis, os mais comuns são a mediana, os quartis e os percentis.
7.2 MÉDIA ARITMÉTICA SIMPLES (MÉDIA ARITMÉTICA OU MÉDIA, simplesmente)
7.2.1 Média Populacional
Seja 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑁 um conjunto de dados quantitativos para uma variável 𝑋, levantados por meio de um recenseamento. A média aritmética populacional de 𝑋, denotada por 𝜇𝑋, é dada por
𝜇
𝑋=
∑ 𝑥𝑖𝑁 𝑖=1
𝑁
=
𝑥1+𝑥2+⋯+𝑥𝑁
𝑁 .
Para dados agrupados em k classes:
𝜇
𝑋=
∑ 𝑥𝑖∙𝑁𝑖𝑘 𝑖=1
𝑁
=
𝑥1∙𝑁1+𝑥2∙𝑁2+⋯+𝑥𝑘∙𝑁𝑘
𝑁
,
onde𝑥
𝑖 é o ponto médio da classe𝑖
e
𝑁
𝑖é a frequência absoluta da classe
𝑖
, com𝑖
= 1, 2, ..., k. T1 T0 T2 T3 3 1 das observações 3 1 3 1 Q0 Q1 Q2 Q3 Q4 25% das observações 25% 25% 25% D0 D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 1% P50 P90 P10 P0 P100 P99 Mín Mediana (x~) Máx 50% das observações 50% ... ... ... ...7.2.2 Média Amostral
Seja 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑛 um conjunto de dados quantitativos para a variável 𝑋, levantados por meio de amostragem. A média aritmética amostral de 𝑋, denotada por
𝑥̅
, é dada por𝑥̅
=
∑ 𝑥𝑖𝑛 𝑖=1
𝑛
=
𝑥1+𝑥2+⋯+𝑥𝑛
𝑛 .
Para dados agrupados em k classes:
𝑥̅
=
∑ 𝑥𝑖∙𝑛𝑖 𝑘𝑖=1
𝑛
=
𝑥1∙𝑛1+𝑥2∙𝑛2+⋯+𝑥𝑘∙𝑛𝑘
𝑛
,
onde𝑥
𝑖 é o ponto médio da classe𝑖
e𝑛
𝑖é a frequência absoluta da classe
𝑖
, com𝑖
= 1, 2, ..., k.7.3 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE 7.3.1 Amplitude Amostral
Seja 𝑋: 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑛 um conjunto de dados quantitativos, amostrais, para
uma variável 𝑋. A amplitude amostral de 𝑋, denotada por 𝐴𝐴𝑋, é dada por 𝐴𝐴𝑋 = 𝑚á𝑥(𝑋) − 𝑚í𝑛(𝑋), onde 𝑚á𝑥(𝑋) e 𝑚í𝑛(𝑋) são os valores máximo e mínimo de
𝑋, respectivamente.
7.3.2 Desvio Médio Absoluto
Seja 𝑋: 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑛 um conjunto de dados quantitativos, amostrais, para a variável 𝑋. O desvio médio absoluto de 𝑋, denotado por 𝐷𝑀𝐴(𝑋), é dado por:
𝐷𝑀𝐴(𝑋) = ∑ |𝑥𝑖−𝑥̅| 𝑛 𝑖=1 𝑛
=
|𝑥1−𝑥̅|+|𝑥2−𝑥̅|+⋯+|𝑥𝑛−𝑥̅| 𝑛,
com𝑥̅ =
∑𝑛𝑖=1𝑥𝑖 𝑛 7.3.3 Variância a) Variância PopulacionalSeja
𝑋: 𝑥
1, 𝑥
2, 𝑥
3, … , 𝑥
𝑁 um conjunto de dados quantitativos populacionais, para a variável𝑋
. A variância populacional de𝑋
, denotada por𝜎
𝑋2 ou por𝜎
2, é dada por:𝜎
𝑋2=
∑ (𝑥𝑖−𝜇𝑋) 2 𝑁 𝑖=1 𝑁=
(𝑥1−𝜇𝑋)2+(𝑥2−𝜇𝑋)2+⋯+(𝑥𝑁−𝜇𝑋)2 𝑁 , com𝜇
𝑋=
∑𝑁𝑖=1𝑥𝑖 𝑁Para dados agrupados em k classes:
𝜎
𝑋2=
∑ (𝑥𝑖−𝜇𝑋) 2∙𝑁 𝑖 𝑘 𝑖=1 𝑁=
(𝑥1−𝜇𝑋)2∙∙𝑁1 + (𝑥2−𝜇𝑋)2∙𝑁2 + …+ (𝑥𝑁−𝜇𝑋)2∙𝑁𝑘 𝑁,
onde𝑥
𝑖 é o ponto médio da classe𝑖
e𝑁
𝑖é a frequência absoluta da classe
𝑖
, com𝑖
= 1, 2, ..., k.b) Variância Amostral
Seja
𝑋: 𝑥
1, 𝑥
2, 𝑥
3, … , 𝑥
𝑛 um conjunto de dados quantitativos, amostrais, para a variável 𝑋. A variância amostral de 𝑋, denotada por𝑠
𝑋2 ou por𝑠
2, é dada por:𝑠
𝑋2=
∑ (𝑥𝑖−𝑥̅) 2 𝑛 𝑖=1 𝑛−1=
(𝑥1−𝑥̅)2+(𝑥2−𝑥̅)2+⋯+(𝑥𝑛−𝑥̅)2 𝑛−1 , com𝑥̅
=
∑𝑛𝑖=1𝑥𝑖 𝑛Para dados agrupados em k classes:
𝑠
𝑋2=
∑ (𝑥𝑖−𝑥̅) 2∙𝑛 𝑖 𝑘 𝑖=1 𝑛−1=
(𝑥1−𝑥̅)2∙𝑛1+(𝑥2−𝑥̅)2∙𝑛2+⋯+(𝑥𝑛−𝑥̅)2∙𝑛𝑘 𝑛−1,
onde𝑥
𝑖 é oponto médio da classe
𝑖
e𝑛
𝑖é a frequência absoluta da classe
𝑖
, com𝑖
= 1, 2, ...,k.
7.3.4 Desvio-padrão
Calcula-se extraindo a raiz quadrada da variância.
a) Desvio-padrão populacional da variável 𝑋, denotado por
𝜎
𝑋 ou por𝜎
:𝜎
𝑋= √
𝜎
𝑋2 = √∑ (𝑥𝑖−𝜇𝑋) 2 𝑁 𝑖=1 𝑁 , com𝜇
𝑋=
∑𝑁𝑖=1𝑥𝑖 𝑁Para dados agrupados em k classes:
𝜎
𝑋=
√
∑ (𝑥𝑖−𝜇𝑋) 2∙𝑁 𝑖 𝑘 𝑖=1 𝑁=
√
(𝑥1−𝜇𝑋)2∙∙𝑁1 + (𝑥2−𝜇𝑋)2∙𝑁2 + …+ (𝑥𝑁−𝜇𝑋)2∙𝑁𝑘 𝑁,
onde
𝑥
𝑖 é o ponto médio da classe𝑖
e𝑁
𝑖é a frequência absoluta da classe
𝑖
, com𝑖
= 1, 2, ..., k.b) Desvio-padrão amostral da variável 𝑋, denotado por
𝑠
𝑋 ou por𝑠:
𝑠
𝑋= √
𝑠
𝑋2= √
∑ (𝑥𝑖−𝑥̅ ) 2 𝑛 𝑖=1 𝑛−1 , com𝑥̅ =
∑𝑛𝑖=1𝑥𝑖 𝑛Para dados agrupados em k classes:
𝑠
𝑋=
√
∑ (𝑥𝑖−𝑥̅)2∙𝑛𝑖 𝑘 𝑖=1 𝑛−1=
√
(𝑥1−𝑥̅)2∙𝑛1+(𝑥2−𝑥̅)2∙𝑛2+⋯+(𝑥𝑛−𝑥̅)2∙𝑛𝑘 𝑛−1,
onde𝑥
𝑖 é o7.3.5 Coeficiente de Variação
Relativiza o desvio-padrão em relação à média do conjunto de dados.
a) Coeficiente de variação populacional da variável 𝑋, denotado por
𝐶𝑉
𝑋 :𝐶𝑉𝑋 =𝜎𝑋
𝜇𝑋 . 100% , onde 𝜎𝑋 e 𝜇𝑋 são o desvio-padrão populacional e a média
populacional da variável 𝑋, respectivamente.
b) Coeficiente de variação amostral da variável 𝑋, denotado por
𝐶𝑉
𝑋:𝐶𝑉𝑋 = 𝑠𝑋
𝑥̅ . 100% , onde
𝑠
𝑋 e𝑥̅
são o desvio-padrão amostral e a médiaamostral da variável 𝑋, respectivamente.
7.3.6 Escore Padronizado Z, Escore Z ou Z-escore
É uma medida que quantifica, em desvios-padrões, o desvio entre cada valor de uma variável e a média dessa variável.
a) Z-escore populacional
Seja
𝑋: 𝑥
1, 𝑥
2, 𝑥
3, … , 𝑥
𝑁 um conjunto de dados quantitativos, populacionais, para a variável𝑋
, com média𝜇
𝑋 e desvio-padrão𝜎
𝑋. O Z-escore, denotado por Z, é calculado para cada valor de𝑋
da seguinte forma:𝑍 =
𝑋 − 𝜇
𝑋𝜎
𝑋 Assim, tem-se:𝑧
1=
𝑥1−𝜇𝑋 𝜎𝑋, 𝑧
2=
𝑥2−𝜇𝑋 𝜎𝑋, … , 𝑧
𝑁=
𝑥𝑁−𝜇𝑋 𝜎𝑋 e, portanto:𝑍: 𝑧
1, 𝑧
2, 𝑧
3, … , 𝑧
𝑁 b) Z-escore estimadoSeja
𝑋: 𝑥
1, 𝑥
2, 𝑥
3, … , 𝑥
𝑛 um conjunto de dados quantitativos, amostrais, para a variável𝑋,
com média𝑥̅
e desvio-padrão𝑠
𝑋. O Z-escore estimado, denotado por𝑍̂
, é calculado para cada valor de𝑋
da seguinte forma:𝑍̂
=
𝑋 − 𝜇
̂
𝑋𝜎
̂
𝑋=
𝑋 − 𝑥
̅
EXERCÍCIOS
1) Considere os conjuntos de dados amostrais X: 2, 25, 17, 5, 40 e Y: 3, 12, 10, 29, 12, 3, sendo X e Y duas variáveis em escala de razão. Para resumir descritivamente esses conjuntos de dados, calcule e interprete as respectivas medidas estatísticas solicitadas: a)
𝑛
𝑋; 𝑛
𝑌 b) 𝐴𝐴𝑋 ; 𝐴𝐴𝑌 c)𝑥
̃ ; 𝑦
̃
d)𝑥
̅
;𝑦
̅
e) 𝑀𝑜𝑋 ; 𝑀𝑜𝑌 f) 𝑄1,𝑋 ; 𝑄1,𝑌 g) 𝑄3,𝑋 ; 𝑄3,𝑌 h) 𝑠𝑋2
; 𝑠
𝑌2 i)𝑠
𝑋; 𝑠
𝑌 j) 𝐶𝑉𝑋 ; 𝐶𝑉𝑌 k) 𝐴𝑆𝑋 ; 𝐴𝑆𝑌l) P10 m) P90
2) Represente os conjuntos de dados do exercício 1, em um único diagrama de pontos. Em qual deles a variabilidade dos dados é maior? Justifique sua resposta.
3) Para cada conjunto de dados do exercício 1, construa um diagrama ramo-e-folhas e um diagrama box-plot. Pelo box-plot, verifique se há pontos discrepantes em X e em Y.
4) Os valores abaixo representam uma amostra do consumo mensal de energia elétrica de uma residência, de abril de 2012 a março de 2013, em kwh. Calcular as seguintes medidas estatísticas: mínimo, máximo, amplitude amostral, primeiro quartil, terceiro quartil, consumo médio, consumo mediano, variância, desvio-padrão e coeficiente de variação, e construir os respectivos diagrama ramo-e-folhas e o diagrama box-plot:
145; 183; 179; 220; 204; 146; 170; 208; 180; 151; 201; 198
5) O Teorema de Chebyshev afirma que para qualquer conjunto de dados, ao menos 75% dos valores estão dentro de dois desvios-padrão a contar da média, para baixo ou para cima, não importando a forma da distribuição. Dessa forma, considera-se usuais os valores cujos escores padronizados estão entre –2 e 2, e incomuns os valores com escore padronizado inferior a –2 ou superior a 2. Baseado nisso, justifique se, no exercício anterior 4), há valores incomuns.
6) Calcule a variância, o desvio-padrão e o coeficiente de variação dos dados do exercício 4, caso fossem uma população e não uma amostra.
7) O rol abaixo apresenta o consumo de água, em m3, correspondente a uma amostra de contas da empresa de saneamento Água para Todos e Todas:
10 12 15 16 17 20 21 21 23 26 30 36 41 47 54 10 13 15 16 17 20 21 22 23 27 31 36 45 48 54 11 13 15 17 18 20 21 22 23 27 31 36 46 49 56 12 13 15 17 18 20 21 22 24 28 31 38 46 51 56 12 14 16 17 19 20 21 22 24 29 33 40 46 53 59
Fonte: Dados fictícios.
a) Identifique a variável e sua unidade de medida. Classifique a variável. b) Faça uma tabela com os resultados de todos os itens abaixo:
• A quantidade de dados; • O mínimo; • O máximo; • A amplitude; • O primeiro quartil • O terceiro quartil
• A média aritmética simples (ou, simplesmente, média) • A moda
• A mediana • A variância • O desvio-padrão
• O coeficiente de variação.
c) (Pesquise e indique a fonte de referência) Conceitue "assimetria" e "curtose" em Estatística. Indique pelo menos uma fórmula para calcular a assimetria e uma para calcular a curtose de um conjunto de dados.
d) Calcule a assimetria e a curtose referente a esse rol.
e) Construa um gráfico ramo-e-folhas correspondente ao rol. Não esqueça de explicitar a unidade das folhas, nem o título completo e a fonte;
f) Construa um gráfico box-plot correspondente ao rol. Não esqueça de colocar o título completo para o gráfico e a fonte;
g) Construa uma tabela de frequência para dados agrupados em classe. Não esqueça de colocar o título completo na tabela e a fonte;
h) Construa o histograma de densidade de frequência relativa correspondente à tabela do item g. Não esqueça do título completo e da fonte.
8) Em um grupo de voluntários para o teste de degustação de um novo refrigerante a ser lançado comercialmente, foram observadas as seguintes idades, em anos completos, organizadas em rol:
14 15 15 16 17 19 23 27
15 15 16 17 17 20 23 28
15 15 16 17 19 22 25 31
Construa uma tabela com as medidas estatísticas que descrevem esse conjunto de dados e o respectivo gráfico box-plot.
9) Um comerciante atacadista vende determinado produto em sacas que deveriam conter 16,50 kg. A pesagem de uma amostra de 400 sacas revelou os resultados representados na tabela abaixo: i Massa (kg) Nº de sacas xi fri Fi Fri 𝜟𝒊 14,55 ⎯ 15,55 2 15,55 ⎯ 16,25 40 16,25 ⎯ 16,75 123 16,75 ⎯ 17,05 155 17,05 ⎯ 18,00 80 Total 400
Fonte: Dados fictícios.
a) Preencha a tabela dada.
b) Esboce o histograma de densidade de frequência relativa e, sobre ele, o respectivo polígono e a curva polida.
c) Esboce o histograma de frequência relativa acumulada e, sobre ele, o respectivo polígono e a curva polida.
d) Determine e interprete as medidas estatísticas, abaixo, usadas para resumir descritivamente o conjunto de dados. Não se esqueça de colocar a respectiva unidade de medida, em cada valor calculado. Obtenha as medidas, abaixo, manualmente; por meio de calculadora científica, usando as funções estatísticas, naquilo que for possível; por uma planilha eletrônica; por um software estatístico:
• a amplitude total da distribuição;
• o peso médio, o peso mediano e a moda bruta, por saca; • a variância, o desvio-padrão e o coeficiente de variação;
• o primeiro quartil, o terceiro quartil, o décimo percentil e o nonagésimo percentil; • um coeficiente de assimetria e um coeficiente de curtose.
e) Classifique essa distribuição de frequências, quanto à assimetria e quanto à curtose f) Abaixo de qual peso encontram-se 70% das sacas?
g) Acima de qual peso encontram-se as 100 sacas mais pesadas?
h) O peso médio por saca é uma boa medida de tendência central para representar essa distribuição de frequências? Justifique.
10) Considere o conjunto de dados populacionais de uma variável X, representado por
𝑋: 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑁. Usando propriedades de somatório, mostre que a variância populacional de 𝑋, dada por
𝜎
𝑋2=
∑ (𝑥𝑖−𝜇𝑋)2 𝑁
𝑖=1
𝑁 , pode ser escrita mais convenientemente 6 por
𝜎
𝑋2=
∑ 𝑥𝑖 2 𝑁 𝑖=1 𝑁− 𝜇
𝑋 2, com𝜇
𝑋=
∑𝑁𝑖=1𝑥𝑖 𝑁 .11) Considere o conjunto de dados amostrais de uma variável X, representado por
𝑋: 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑛. Usando propriedades de somatório, mostre que a variância amostral de
X, dada por
𝑠
𝑋2=
∑ (𝑥𝑖−𝑥̅)2 𝑛
𝑖=1
𝑛−1 , pode ser escrita mais convenientemente
7 por
𝑠
𝑋2=
∑𝑛𝑖=1𝑥𝑖2 𝑛−1−
(∑𝑛𝑖=1𝑥𝑖) 2 𝑛(𝑛−1),
com𝑥̅
=
∑𝑛𝑖=1𝑥𝑖 𝑛.
12) Abaixo, está representada uma tabela genérica de distribuição de frequências, com intervalos de classe, para uma variável X. Nesse caso, a variância amostral é dada por:
𝑠
𝑋2=
∑ (𝑥𝑖−𝑥̅) 2 ∙ 𝑛 𝑖 𝑘 𝑖=1 𝑛−1=
(𝑥1−𝑥̅)2 ∙ 𝑛1+(𝑥2−𝑥̅)2 ∙ 𝑛2+⋯+(𝑥𝑘−𝑥̅)2 ∙ 𝑛𝑘 𝑛−1Use propriedades de somatório para demonstrar que:
𝑠
𝑋2=
∑ (𝑥𝑖−𝑥̅)2 ∙ 𝑛𝑖 𝑘 𝑖=1 𝑛−1=
∑𝑘𝑖=1 𝑥𝑖2𝑥̅∙𝑛𝑖 𝑛−1−
(∑𝑘𝑖=1 𝑥𝑖∙𝑛𝑖)2 𝑛(𝑛−1) , onde:𝑛
𝑖 é a frequência absoluta a𝑖
-ésima classe,𝑛
é o tamanho da amostra, com 𝑛 =∑𝑘𝑖=1𝑛𝑖,𝑘 é o número de classes da distribuição de frequências,
𝑥
𝑖 é o ponto médio da𝑖
-ésima classe.6 O uso da fórmula que representa a definição de variância ocasiona perda de casas decimais, caso a média não seja um valor inteiro ou um decimal finito. Essa outra fórmula diminui os erros decorrentes de arredondamento. 7 Idem.
Tabela genérica: 𝑖 X 𝑛𝑖 𝑥𝑖 1 𝑙1 ⎯ 𝐿1 𝑛1 𝑥1 2 𝑙2 ⎯ 𝐿2 𝑛2 𝑥2 ⋮ ⋮ ⋮ ⋮ 𝑘 𝑙𝑘 ⎯ 𝐿𝑘 𝑛𝑘 𝑥𝑘 Total 𝑛
13) Considere o conjunto de dados populacionais de uma variável X, representado por
𝑋: 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑁. O que acontece com a média populacional
𝜇
𝑋=
∑ 𝑥𝑖 𝑁 𝑖=1 𝑁 e com a variância populacional𝜎
𝑋2=
∑ 𝑥𝑖 2 𝑁 𝑖=1 𝑁− 𝜇
𝑋 2, quando:a) Soma-se uma constante real não nula c, a cada valor de X ? b) Multiplica-se cada valor de X por uma constante real não nula c?
14) Considere o conjunto de dados populacionais de uma variável X, representado por
𝑋: 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑁, cuja média populacional e variância populacional são dadas por
𝜇
𝑋=
∑𝑁𝑖=1𝑥𝑖 𝑁e
𝜎
𝑋 2=
∑𝑁𝑖=1(𝑥𝑖−𝜇𝑋)2 𝑁=
∑𝑁𝑖=1𝑥𝑖2 𝑁− 𝜇
𝑋2, respectivamente. Ainda, considere as variáveis 𝑌 e 𝑍, tais que, 𝑌: 𝑥1+ 𝑐, 𝑥2+ 𝑐, 𝑥3+ 𝑐, … , 𝑥𝑁 + 𝑐 e 𝑍: 𝑐𝑥1, 𝑐𝑥2, 𝑐𝑥3, … , 𝑐𝑥𝑁, com 𝑐 ∈ 𝑅+∗, sendo 𝑅 o conjunto dos números reais. Prove que:
a)
𝜇
𝑌= 𝜇
𝑋+ 𝑐
b)𝜎
𝑌2= 𝜎
𝑋2c)
𝜇
𝑍= 𝑐𝜇
𝑋d)
𝜎
𝑍2= 𝑐
2𝜎
𝑋215) Assinale V para verdadeiro e F para falso. Justifique as sentenças falsas:
( ) Na prática, a média será tanto mais representativa do conjunto de dados quanto menor for o valor do seu coeficiente de variação.
(...) Uma curva simétrica possui a moda maior que a mediana e que a média.
(...) Numa distribuição de frequências em que a variável só apresenta um valor constante,
n vezes, o desvio-padrão será 1.
(...) Se, numa distribuição de frequências, 50% dos dados situam-se até a média, pode-se dizer que essa distribuição é simétrica.
(...) Se todos os elementos de um conjunto de dados populacionais forem multiplicados por uma constante real não nula, a média não se alterará e a variância ficará multiplicada por essa constante.
(...) Em qualquer distribuição de frequências, a mediana sempre será igual a média aritmética entre o primeiro e o terceiro quartis.
16) Num processo de amostragem, peças de um mesmo tipo foram inspecionadas, tendo sido coletados dados referentes ao número de defeitos por peça. Os resultados foram os seguintes: 5, 6, 4, 8, 7, 5, 10, 5, 5, 7, 7, 7, 10, 10, 5, 5, 4, 3, 6, 4.
a) Identifique a variável, classifique-a, identifique sua unidade de medida e sua escala de medida.
b) Construa uma tabela de distribuição de frequências e o histograma adequado para a variável, levando em conta a classificação dela.
EXEMPLO DE EXERCÍCIO COM DADOS QUANTITATIVOS CONTÍNUOS AGRUPADOS EM CLASSE
Uma amostra de 200 latas de alumínio de dois milímetros de espessura foi submetida a um teste de pressão e os valores das cargas axiais foram tabelados da seguinte forma:
Cargas axiais, em quilos (kg), de latas de alumínio de dois milímetros de espessura Curitiba – Fevereiro/2018
Carga axial (kg) Nº de latas
100⎯ 104 5 104⎯ 108 15 108⎯ 112 40 112⎯ 116 45 116⎯ 120 50 120⎯ 124 30 124⎯ 128 15 Total 200
Fonte: Dados fictícios.
Nota: Carga axial de uma lata é o peso máximo suportado por seus lados e é medida usando uma placa para
aplicar uma pressão crescente ao topo da lata, até que ela ceda.
a) Elabore uma tabela contendo os pontos médios de classe, as amplitudes de classe, as frequências relativas, as frequências acumuladas, as frequências relativas acumuladas e as densidades de frequências relativas;
b) Calcule a amplitude total da distribuição dos dados; c) Calcule a moda bruta;
d) Calcule a carga axial média; e) Calcule a variância;
g) Calcule o coeficiente de variação;
h) Calcule a carga axial mediana e interprete-a; i) Calcule o primeiro quartil e interprete-o; j) Calcule o terceiro quartil e interprete-o; k) Calcule o décimo percentil e interprete-o; l) Calcule o nonagésimo percentil e interprete-o;
m) Esboce o histograma de densidade de frequência relativa e, sobre ele, o polígono de densidade de frequência relativa e a respectiva curva polida.
n) Calcule pelo menos um coeficiente de assimetria. Compare esses coeficientes com o histograma de densidade, o polígono de densidade e a curva polida do item m) e classifique a distribuição quanto à assimetria.
o) Calcule pelo menos um coeficiente de curtose. Compare esses coeficientes com o histograma de densidade, o polígono de densidade e a curva polida do item m) e classifique a distribuição quanto à curtose.
p) A média é suficiente para representar esse conjunto de dados? Justifique.
q) A carga axial média é uma boa medida de tendência central para representar essa distribuição de frequências?
Solução a)
Classe (𝑖) Carga axial (kg) (X) Nº de latas (𝑛𝑖) Ponto médio (𝑥𝑖) Amplitude de classe (ℎ𝑖) Frequência relativa (𝑓𝑟𝑖) Frequência acumulada (𝐹𝑖) Frequência relativa acumulada (𝐹𝑟𝑖) Densidade de frequência relativa (∆𝑖) 1 100⎯ 104 5 102 4 0,025 5 0,025 0,00625 2 104⎯ 108 15 106 4 0,075 20 0,100 0,01875 3 108⎯ 112 40 110 4 0,200 60 0,300 0,05000 4 112⎯ 116 45 114 4 0,225 105 0,525 0,05625 5 116⎯ 120 50 118 4 0,250 155 0,775 0,06250 6 120⎯ 124 30 122 4 0,150 185 0,925 0,03750 7 124⎯ 128 15 126 4 0,075 200 1,000 0,01875 Total 200 1,000 b) Amplitude total: AT = 128 – 100 = 28 kg c) Moda bruta: Mo = 118 kg d) Média:
𝑥̅
= 102∙5+106∙15+110∙40+114∙45+118∙50+122∙30+126∙15 200=
23080 200 = 115,4 𝑘𝑔 e) Variância:𝑠
𝑋2 = (102−115,4) 2∙5+(106−115,4)2∙15+(110−115,4)2∙40+⋯+(126−115,4)2∙15 200−1=
6808 199≅
34,2111 𝑘𝑔 2 f) Desvio-padrão: 𝑆𝑋= √
6808 199≅
5,85 kg g) Coeficiente de variação: 𝐶𝑉𝑋≅
5,85 115,4≅
0,051 = 5,1%h) Mediana (
𝑥̃
)Fórmula para calcular a mediana para dados agrupados em classe:
𝑥̃ = 𝑙
𝑀𝑒𝑑+ (
𝐿𝑀𝑒𝑑−𝑙𝑀𝑒𝑑𝑛𝑀𝑒𝑑
) ∙ (
𝑛2
− 𝐹
𝑎𝑛𝑡.𝑀𝑒𝑑)
onde:
𝑙
𝑀𝑒𝑑 é o limite inferior da classe da mediana𝐿
𝑀𝑒𝑑 é o limite superior da classe da mediana𝑛
𝑀𝑒𝑑 é a frequência absoluta da classe da mediana𝑛
é o tamanho da amostra𝐹
𝑎𝑛𝑡.𝑀𝑒𝑑 é a frequência acumulada da classe anterior à classe da medianaNo exemplo dado, tem-se: Mediana:
𝑥
(2002 )
= 𝑥
(100)é o valor de X que está na 100ª posição, portanto, na 4ª classe (ver tabela do item a, coluna frequência acumulada)
Logo,
𝑥̃
= 112+ (
116−11245
) ∙ (
200
2
− 60) ≅
115,56 kgInterpretação da mediana, no contexto do problema:
i) Primeiro Quartil (Q1)
Fórmula para calcular o primeiro quartil para dados agrupados em classe:
𝑄
1=
𝑙
𝑄1+ (
𝐿𝑄1−𝑙𝑄1𝑛𝑄1
) ∙ (
𝑛4
− 𝐹
𝑎𝑛𝑡.𝑄1)
onde:
𝑙
𝑄1 é o limite inferior da classe do primeiro quartil𝐿
𝑄1 é o limite superior da classe do primeiro quartil𝑛
𝑄1 é a frequência absoluta da classe do primeiro quartil𝑛
é o tamanho da amostra𝐹
𝑎𝑛𝑡.𝑄1 é a frequência acumulada da classe anterior à classe do primeiro quartilNo exemplo dado, tem-se: Primeiro quartil:
𝑥
(2004 )
= 𝑥
(50)é o valor de X que está na 50ª posição, portanto, na 3ª classe (ver tabela do item a, coluna frequência acumulada)
Logo,
𝑄
1= 108+ (
112−10840
) ∙ (
200
4
− 20) =
111 kgInterpretação do primeiro quartil, no contexto do problema:
j) Terceiro Quartil (Q3)
Fórmula para calcular o terceiro quartil para dados agrupados em classe:
𝑄
3=
𝑙
𝑄3+ (
𝐿𝑄3−𝑙𝑄3𝑛𝑄3
) ∙ (
3𝑛4
− 𝐹
𝑎𝑛𝑡.𝑄3)
onde:
𝑙
𝑄3 é o limite inferior da classe do terceiro quartil𝐿
𝑄3 é o limite superior da classe do terceiro quartil𝑛
𝑄3 é a frequência absoluta da classe do terceiro quartil𝑛
é o tamanho da amostra𝐹
𝑎𝑛𝑡.𝑄3 é a frequência acumulada da classe anterior à classe do terceiro quartilNo exemplo dado, tem-se: Terceiro quartil:
𝑥
(3∙2004 )
= 𝑥
(150) é o valor de X que está na 150ª posição, portanto, na 5ª classe (ver tabela do item a, coluna frequênciaacumulada) Logo,
𝑄
3 = 116+ (
120−116 50) ∙ (
3∙200 4− 105) =
119,6 kgInterpretação do terceiro quartil, no contexto do problema:
k) Décimo Percentil (P10)
Fórmula para calcular o décimo percentil para dados agrupados em classe:
𝑃
10=
𝑙
𝑃10+ (
𝐿𝑃10−𝑙𝑃10𝑛𝑃10
) ∙ (
10𝑛100
− 𝐹
𝑎𝑛𝑡.𝑃10)
onde:
𝑙
𝑃10 é o limite inferior da classe do décimo percentil𝐿
𝑃10 é o limite superior da classe do décimo percentil𝑛
𝑃10 é a frequência absoluta da classe do décimo percentil𝑛
é o tamanho da amostra𝐹
𝑎𝑛𝑡.𝑃10 é a frequência acumulada da classe anterior à classe do décimo percentilNo exemplo dado, tem-se: Décimo percentil:
𝑥
(10∙200100 )
= 𝑥
(20) é o valor de X que está na 20ª posição, portanto, na 2ª classe (ver tabela do item a, coluna frequência acumulada)Como a frequência acumulada da 2ª classe é 20, então o elemento que está na 20ª posição da distribuição é o limite superior da 2ª classe. Assim,
𝑃
10=
108 kg.Caso queira usar a fórmula, tem-se:
𝑃
10 = 104+ (
108−10415
) ∙ (
10∙200
100
− 5) =
108 kgInterpretação do décimo percentil, no contexto do problema:
l) Nonagésimo Percentil (P90)
Fórmula para calcular o nonagésimo percentil para dados agrupados em classe:
𝑃
90=
𝑙
𝑃90+ (
𝐿𝑃90−𝑙𝑃90𝑛𝑃90
) ∙ (
90𝑛100
− 𝐹
𝑎𝑛𝑡.𝑃90)
onde:
𝑙
𝑃90 é o limite inferior da classe do nonagésimo percentil𝐿
𝑃90 é o limite superior da classe do nonagésimo percentil𝑛
𝑃90 é a frequência absoluta da classe do nonagésimo percentil𝑛
é o tamanho da amostra𝐹
𝑎𝑛𝑡.𝑃90 é a frequência acumulada da classe anterior à classe do nonagésimo percentilNo exemplo dado, tem-se: Nonagésimo percentil:
𝑥
(90∙200100 )
= 𝑥
(180) é o valor de X que está na 180ª posição, portanto, na 6ª classe (ver tabela do item a, coluna frequênciaacumulada) Logo,
𝑃
90 = 120+ (
124−120 30) ∙ (
90∙200 100− 155) ≅
123,3 kgInterpretação do nonagésimo percentil, no contexto do problema:
m) Histograma de densidade, polígono de densidade e curva polida
Comandos do software estatístico R
Carga<-rep(c(102,106,110,114,118,122,126), c(5,15,40,45,50,30,15)) Carga
hist(Carga, freq=F, right=F, breaks=c(100,104,108,112,116,120,124,128), xaxt="n", xlab="Carga axial, em kg", ylab="Densidade", main=" ") axis(1, seq(100,128,4)) PtMed<-c(100,102, 106, 110, 114, 118, 122, 126, 128) PtMed Densid<-c(0, 0.00625, 0.01875, 0.05, 0.05625, 0.06250, 0.0375, 0.01875, 0) Densid par(new=T)
plot(PtMed, Densid, type="l", col="blue", xaxt="n", yaxt="n", main=" ", xlab=" ", ylab=" ") CurvaPolida<-density(Carga)
CurvaPolida par(new=T)
Gráfico 1 – Histograma de densidade, polígono de densidade e curva polida para cargas axiais, em quilos, de latas de alumínio de dois milímetros de espessura - Curitiba – Fevereiro/2018
Fonte: Autoria própria, baseada em dados fictícios.
Nota: Carga axial de uma lata é o peso máximo suportado por seus lados e é medida usando uma placa para aplicar uma pressão crescente ao topo da lata, atéque ela ceda
n) Coeficientes de Assimetria (As)
𝐴𝑠 =
1 𝑛∑
(
𝑘 𝑖=1 𝑥𝑖−𝑥̅ 𝑠)
3∙ 𝑛
𝑖=
1 200(
(102−115,4)3∙5 + (106−115,4)3∙15 + (110−115,4)3∙40 + … + (126−115,4)3∙15 5,853) ≅
−3542,4 40040,33≅
-0,08847𝐴𝑠 =
3(𝑥̅ − 𝑥̃)
𝑠
=
3(115,4 − 115,56)
5,85
≅ −0,082
𝐴𝑠 =
𝑥̅ − 𝑀𝑜
𝑠
=
115,4 − 118
5,85
≅ −0,444
𝐴𝑠 =
𝑄
1+ 𝑄
3− 2𝑥̃
𝑄
3− 𝑄
1=
111 + 119,6 − 2 ∙ 115,56
119,6 − 111
≅ −0,060
Comandos do software estatístico R
Carga<-rep(c(102,106,110,114,118,122,126), c(5,15,40,45,50,30,15)) Carga
install.packages("e1071") require(e1071)
skewness(Carga, type = 1) # R calculou o valor de
−
0.08918325skewness(Carga, type = 2) # R calculou o valor de
−
0.08985859skewness(Carga, type = 3) # R calculou o valor de
−
0.08851521Interpretação da assimetria
Como quase todos os coeficientes de assimetria teve |𝐴𝑠| ≤ 0,15, a assimetria é baixa ou fraca.
Como As < 0, ou seja, a assimetria é negativa, então a curva é enviesada à esquerda, o que pode ser constatado no item m, pois a cauda
o) Coeficientes de Curtose (K) 𝐾 =1 𝑛∑( 𝑘 𝑖=1 𝑥𝑖− 𝑥̅ 𝑠 ) 4∙ 𝑛 𝑖 − 3 =
1
200
( (102 − 115,4
)4∙ 5 +
(106 − 115,4
)4∙ 15 +
(110 − 115,4
)4∙ 40 + … +
(126 − 115,4
)4∙ 15
5,85
4 )− 3 ⇒
K ≅ 561087 234235,9− 3
≅ 2,40 – 3 ≅ – 0,6046𝐾 =
𝑄
3− 𝑄
12(𝑃
90− 𝑃
10)
=
119,6 − 111
2(123,3 − 108)
≅ 0,281Comandos do software estatístico R
Carga<-rep(c(102,106,110,114,118,122,126), c(5,15,40,45,50,30,15)) Carga
install.packages("e1071") # não é necessário instalar o pacote novamente, caso ele tenha sido instalado require(e1071)
> kurtosis(Carga, type=1) # R calculou o valor de –0.5788531
> kurtosis(Carga, type=2) # R calculou o valor de –0.5629787
> kurtosis(Carga, type=3) # R calculou o valor de –0.603004
Interpretação da Curtose
Como
𝐾 =
𝑄3−𝑄12(𝑃90−𝑃10) ≅ 0,281 > 0,263, a distribuição (ou a curva polida) é platicúrtica.
p) A média não é suficiente para representar esse conjunto de dados de forma resumida, pois várias outras medidas estatísticas são necessárias, tais como, desvio-padrão, coeficiente de variação, mediana, moda, quartis, coeficientes de assimetria e coeficientes de curtose.
q) As latas rompem-se com uma carga axial média de 115,4 kg, com uma carga axial mediana de 115,56 kg, com um desvio-padrão de 5,58 kg, com coeficiente de variação de 5,1% e com coeficiente de assimetria baixo (menor de 0,15). Como a média e a mediana são próximas, o coeficiente de variação é baixo e a assimetria é fraca pode-se concluir que a média representa bem o respectivo conjunto de dados.