Disciplina: Probabilidade e Estatística (MA70H) Profª Silvana Heidemann Rocha Estudante: Código: APRESENTAÇÃO DE DADOS PARA VARIÁVEL QUANTITATIVA

(1)

Ministério da Educação

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Câmpus Curitiba

Diretoria de Graduação e Educação Profissional Departamento Acadêmico de Estatística

Disciplina: Probabilidade e Estatística (MA70H) ─ Profª Silvana Heidemann Rocha Estudante: ____________________________________________ Código: ______________

APRESENTAÇÃO DE DADOS PARA VARIÁVEL QUANTITATIVA 1 TABELA E GRÁFICO PARA VARIÁVEL QUANTITATIVA DISCRETA

• Tabela de distribuição de frequências, com os dados não agrupados em classes • Histograma de haste

2 TABELA E GRÁFICOS PARA VARIÁVEL QUANTITATIVA CONTÍNUA

• Tabela de distribuição de frequências, com os dados agrupados em classes o Elementos de uma tabela de distribuição de frequências, com 𝑘 classes:

▪ Variável (𝑋), cuja amostra é representada por 𝑋: 𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑛 e a amplitude amostral (𝐴𝐴_𝑋) é calculada por 𝐴𝐴_𝑋 = 𝑚á𝑥{𝑥₁, 𝑥₂, … , 𝑥_𝑛} − 𝑚í𝑛{𝑥₁, 𝑥₂, … , 𝑥_𝑛}

▪ Tamanho da amostra (𝑛)

▪ Classe de frequências (𝑖), com 𝑖 = 1, 2, 3, … , 𝑘 ▪ Limites de classe

✓ Limite inferior (𝑙_𝑖) ✓ Limite superior (𝐿_𝑖)

▪ Amplitude de classe ou intervalo de classe (ℎ𝑖) , com ℎ𝑖 = 𝐿𝑖 − 𝑙𝑖 ▪ Amplitude total da distribuição (𝐴𝑇), com 𝐴𝑇 = 𝐿_𝑘− 𝑙₁

▪ Ponto médio de classe (

𝑥

_𝑖), com

𝑥

_𝑖

=

𝐿𝑖+𝑙𝑖 2

▪ Frequência simples ou absoluta de classe (𝑛_𝑖), com ∑𝑘_𝑖=1𝑛_𝑖 = 𝑛. ▪ Frequência relativa de classe (𝑓𝑟_𝑖), com 𝑓𝑟_𝑖 =𝑛𝑖

𝑛 e ∑ 𝑓𝑟𝑖 = 1 𝑘

𝑖=1

▪ Frequência acumulada de classe (𝐹_𝑖), com 𝐹_𝑗 = ∑𝑗_𝑖=1𝑛_𝑖

▪ Frequência relativa acumulada de classe (𝐹𝑟𝑖), com 𝐹𝑟𝑗 = ∑𝑗𝑖=1𝑓𝑟𝑖

▪ Densidade de frequência relativa de classe (𝛥_𝑖), com 𝛥_𝑖 =𝑓𝑟𝑖

ℎ𝑖

• Histograma de frequência simples ou histograma de frequência absoluta • Histograma de frequência relativa

• Histograma de densidade de frequência relativa: obrigatório para distribuição de frequências com amplitudes diferentes para as classes

(2)

• Histograma de frequência acumulada

• Histograma de frequência relativa acumulada

• Polígono de frequência (absoluta, relativa, acumulada, relativa acumulada) • Polígono de densidade de frequência relativa

• Curva polida

3 DIAGRAMA DE CAIXA (BOX PLOT): usado para visualizar eventuais assimetria e pontos discrepantes, nos dados.

4 DIAGRAMA RAMO-E-FOLHAS: usado para preservar os dados originais, organizados em rol 5 OBSERVAÇÕES SOBRE TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS, COM DADOS

AGRUPADOS EM CLASSE

• Usualmente, é recomendado que uma tabela de distribuição de frequências, com dados agrupados em classe, apresente de 4 a 20 classes.

• Numa tabela de distribuição de frequências, com dados agrupados em classe: o não pode haver classe com frequência nula;

o numa mesma classe, só podem ser agrupados elementos semelhantes entre si, de modo que o ponto médio da respectiva classe represente realmente todos os elementos agrupados naquela classe;

o o número de classes, 𝑘, é calculado por chute inicial e as fórmulas mais comuns são:

𝑘 = √𝑛 , para 𝑛 ≤ 400, e 𝑘 = 1 + 3,3 log 𝑛 (fórmula de Sturges) o a amplitude de classe é calculada por chute inicial por meio da fórmula ℎ_𝑖 =𝐴𝐴𝑋

𝑘 , com

𝐴𝐴_𝑋 = 𝑚á𝑥{𝑥₁, 𝑥₂, … , 𝑥_𝑛} − 𝑚í𝑛{𝑥₁, 𝑥₂, … , 𝑥_𝑛}, isto é, 𝐴𝐴_𝑋 é a amplitude amostral;

o as amplitudes de classe não precisam ser todas iguais; o mais importante é que nenhuma classe tenha frequência nula, pois, ao se tentar ajustar uma curva de densidade de probabilidade ao histograma de densidade de frequência relativa, mediante testes de aderência ou de ajustamento, são realizadas divisões pela frequência simples de cada classe;

o em geral, o limite inferior da primeira classe, 𝑙₁ , é igual ao menor valor observado na amostra, mas isso não é obrigatório; o mais importante é que o ponto médio de cada classe realmente represente os dados agrupados naquela classe.

• Quando uma variável discreta apresentar uma quantidade grande de resultados de forma que a tabela de distribuição de frequências tenha muitas linhas, pode-se agrupar os resultados em intervalos de classe, tal como feito para variáveis contínuas.

(3)

Tabela genérica para dados agrupados em classe Classe (𝑖) Variável (𝑋) Frequência simples (𝑛_𝑖) Ponto médio (𝑥_𝑖) Frequência relativa (𝑓𝑟_𝑖) Frequência acumulada (𝐹_𝑖) Frequência relativa acumulada (𝐹𝑟_𝑖) Densidade de frequência relativa (∆_𝑖) 1 𝑙₁𝐿₁ 𝑛₁ 𝑥₁ 𝑓𝑟₁ 𝐹₁ 𝐹𝑟₁ ∆₁ 2 𝑙₂𝐿₂ 𝑛₂ 𝑥₂ 𝑓𝑟₂ 𝐹₂ 𝐹𝑟₂ ∆₂ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝑘 𝑙_𝑘𝐿_𝑘 𝑛_𝑘 𝑥_𝑘 𝑓𝑟_𝑘 𝐹_𝑘 𝐹𝑟_𝑘 ∆_𝑘 Total 𝑛 1,000 Fonte: A autora. EXERCÍCIOS

1) Preencha a tabela abaixo:

Peça de automóvel da fábrica Carro Popular, segundo o diâmetro, em centímetros – Almirante Tamandaré – Agosto/2018 Classe (𝑖) Diâmetro, em cm (𝑋) Nº de peças (𝑛𝑖) Ponto médio (𝑥𝑖) Frequência relativa (𝑓𝑟𝑖) Frequência acumulada (𝐹𝑖) Frequência relativa acumulada (𝐹𝑟𝑖) Densidade de frequência relativa (∆𝑖) 1 20 30 4 2 30 50 8 3 50 100 12 4 100 120 6 Total 30

Fonte: Dados fictícios.

a) Esboce o histograma de frequência, o histograma de frequência relativa e o histograma de densidade de frequência relativa. Qual deles representa adequadamente os dados? Justifique.

b) Esboce o polígono de frequência, o polígono de frequência relativa e o polígono de densidade de frequência relativa, sobre o respectivo histograma do exercício 2. Após, esboce a respectiva curva polida.

c) Esboce o histograma de frequência relativa acumulada e, sobre ele, o respectivo polígono de frequência relativa acumulada. Após, esboce a respectiva curva polida.

(4)

02) Considere o quadro abaixo:

Perfil de 30 chefes de família do Bairro Alto – Curitiba - 2002

Nº Estado

civil Sexo Religião

Nº de filhos Região de procedência Salário mensal, em salários mínimos Escolaridade Idade, em anos 01 Solteiro M Católica - Interior 4,5 Fundamental 26

02 Casado F Católica 2 Interior 4,7 Fundamental 28

03 Solteiro F Católica 1 Interior 3,2 Fundamental 30

04 Solteiro M Católica 3 Capital 6,3 Média 45

05 Casado M Espírita 2 Capital 6,4 Média 42

06 Casado M Espírita 3 Capital 7,1 Média 36

07 Casado M Católica 4 Capital 7,2 Média 41

08 Solteiro M Africana 2 Interior 5,1 Fundamental 45

09 Casado M Africana - Interior 3,7 Fundamental 26

10 Casado M Africana 3 Outro Estado 4,2 Fundamental 25 11 Casado F Africana - Outro Estado 16,2 Superior 28 12 Casado F Evangélica 2 Outro Estado 15,9 Superior 29 13 Divorciado M Evangélica 1 Capital 17,3 Superior 35

14 Viúvo M Evangélica 1 Capital 5,1 Fundamental 37

15 Casado M Católica 1 Interior 4,6 Fundamental 45

16 Casado F Africana 2 Outro Estado 8,4 Fundamental 42 17 Divorciado M Evangélica 2 Outro Estado 9,0 Média 43 18 Divorciado F Católica 3 Capital 3,6 Fundamental 40

19 Viúvo F Católica 2 Interior 3,2 Fundamental 42

20 Solteiro M Católica 1 Outro Estado 6,3 Fundamental 31 21 Divorciado F Espírita 1 Outro Estado 18,4 Média 33

22 Casado M Espírita 1 Capital 3,4 Fundamental 29

23 Casado M Católica 2 Capital 9,1 Superior 29

24 Viúvo F Evangélica 2 Capital 19,1 Superior 45

25 Viúvo M Africana 3 Interior 5,0 Fundamental 34

26 Divorciado M Africana - Interior 3,6 Fundamental 30 27 Divorciado F Católica - Interior 2,6 Fundamental 45 28 Solteiro F Evangélica 3 Capital 10,1 Superior 46 29 Casado F Evangélica 2 Outro Estado 5,6 Fundamental 40

30 Casado M Católica 2 Outro Estado 6,3 Média 36

Fonte: Dados fictícios.

a) Classifique todas as variáveis que aparecem no quadro e identifique as respectivas escalas de medição.

(5)

6 MEDIDAS ESTATÍSTICAS PARA UM CONJUNTO DE DADOS QUANTITATIVOS

Das medidas estatísticas, abaixo, é preciso verificar quais delas são adequadas à escala da variável em questão.

• Medidas de posição, separatrizes ou quantis1 • Mediana (Me ou

𝑥̃)

• Tercil (T) • Quartil (Q) • Decil (D)

• Percentil ou centil (P) • Medidas de tendência central

• Médias2

▪ Média aritmética (

𝑥̅

): simples, ponderada ▪ Média geométrica (

𝑥

̅

𝑔): simples, ponderada

▪ Média harmônica (

𝑥

̅

ℎ): simples, ponderada

▪ Média de Potência (ou momentos): absoluta, centrada; simples, ponderada • Mediana (

𝑥̃)

• Moda (Mo)

• Medidas de dispersão ou de variabilidade • Amplitude total (AT)

• Desvio médio absoluto (DMA) • Variância ▪ Populacional (𝜎2₎ ▪ Amostral (s2₎ • Desvio-padrão ▪ Populacional (𝜎) ▪ Amostral (s) • Coeficiente de variação (CV) ▪ Populacional ▪ Amostral

• Medidas de forma: assimetria3_{e curtose}4

• Momentos5_:_{Momentos absolutos, momentos centrados, momentos conjuntos}

1_{Quando os dados estão discretizados, há vários métodos para calcular os quantis e, geralmente, os resultados} obtidos são diferentes, de método para método. Aqui, para dados discretizados, o cálculo dos quantis será feito pelo método mais básico. Quando os dados estão agrupados em classe, o cálculo dos quantis pode ser feito a partir da tabela de distribuição de frequências ou pelo histograma de densidade de frequência relativa, supondo os dados estarem distribuídos uniformemente dentro de cada classe.

2_{Nas engenharias, na maioria das vezes, os levantamentos de dados envolvem variáveis quantitativas} contínuas, para as quais o adequado é a média aritmética, geralmente. Por isso, nesta disciplina, serão trabalhadas fórmulas obtidas a partir da média aritmética. Os conceitos, definições e aplicações dos outros tipos de média podem ser encontrados em MILONE, G. Estatística geral e aplicada. São Paulo: Thomson Learning, 2006; em PEDROSA, A. C., GAMA, S. M. Introdução computacional à probabilidade e estatística com Excel. 3. ed. Porto-PT: Porto, 2016.

3_{Para os interessados em conhecer um pouco mais sobre assimetria, vide MILONE, G. Estatística geral e}

aplicada. São Paulo: Thomson Learning, 2006.

4_Idem 5_Ibidem.

(6)

7 CONCEITOS OU DEFINIÇÕES SOBRE MEDIDAS ESTATÍSTICAS

7.1 MEDIDAS DE POSIÇÃO, SEPARATRIZES OU QUANTIS PARA UM CONJUNTO CONTÍNUO Seja 𝑋: 𝑥₍₁₎, 𝑥₍₂₎, 𝑥₍₃₎, … , 𝑥_(𝑛) um conjunto de dados quantitativos, ordenados, para uma variável 𝑋. Os conceitos referentes às medidas de posição "mediana", "tercil",

"quartil", "decil" e "percentil", para um conjunto contínuo, estão representados abaixo, respectivamente. Essas medidas são denominadas genericamente por "quantil". Dos quantis, os mais comuns são a mediana, os quartis e os percentis.

7.2 MÉDIA ARITMÉTICA SIMPLES (MÉDIA ARITMÉTICA OU MÉDIA, simplesmente)

7.2.1 Média Populacional

Seja 𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑁 um conjunto de dados quantitativos para uma variável 𝑋, levantados por meio de um recenseamento. A média aritmética populacional de 𝑋, denotada por 𝜇_𝑋, é dada por

𝜇

_𝑋

=

∑ 𝑥𝑖

𝑁 𝑖=1

𝑁

=

𝑥₁+𝑥₂+⋯+𝑥_𝑁

𝑁 .

Para dados agrupados em k classes:

𝜇

_𝑋

=

∑ 𝑥𝑖∙𝑁𝑖

𝑘 𝑖=1

𝑁

=

𝑥_1∙𝑁₁+𝑥_2∙𝑁₂+⋯+𝑥_𝑘∙𝑁_𝑘

𝑁

,

onde

𝑥

𝑖 é o ponto médio da classe

𝑖

e

𝑁

_𝑖

é a frequência absoluta da classe

𝑖

, com

𝑖

= 1, 2, ..., k. T1 T0 T2 T3 3 1 das observações 3 1 3 1 Q0 Q1 Q2 Q3 Q4 25% das observações 25% 25% 25% D0 D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 1% P50 P90 P10 P0 P100 P99 Mín _{Mediana (}_x~₎ Máx 50% das observações 50% ... _... ... ...

(7)

7.2.2 Média Amostral

Seja 𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑛 um conjunto de dados quantitativos para a variável 𝑋, levantados por meio de amostragem. A média aritmética amostral de 𝑋, denotada por

𝑥̅

, é dada por

𝑥̅

=

∑ 𝑥𝑖

𝑛 𝑖=1

𝑛

=

𝑥₁+𝑥₂+⋯+𝑥_𝑛

𝑛 .

𝑥̅

=

∑ 𝑥𝑖∙𝑛𝑖 𝑘

𝑖=1

𝑛

=

𝑥_1∙𝑛₁+𝑥_2∙𝑛₂+⋯+𝑥_𝑘∙𝑛_𝑘

𝑛

,

onde

𝑥

𝑖 é o ponto médio da classe

𝑖

e

𝑛

_𝑖

𝑖

, com

𝑖

= 1, 2, ..., k.

7.3 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE 7.3.1 Amplitude Amostral

Seja 𝑋: 𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑛 um conjunto de dados quantitativos, amostrais, para

uma variável 𝑋. A amplitude amostral de 𝑋, denotada por 𝐴𝐴𝑋, é dada por 𝐴𝐴𝑋 = 𝑚á𝑥(𝑋) − 𝑚í𝑛(𝑋), onde 𝑚á𝑥(𝑋) e 𝑚í𝑛(𝑋) são os valores máximo e mínimo de

𝑋, respectivamente.

7.3.2 Desvio Médio Absoluto

Seja 𝑋: 𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑛 um conjunto de dados quantitativos, amostrais, para a variável 𝑋. O desvio médio absoluto de 𝑋, denotado por 𝐷𝑀𝐴(𝑋), é dado por:

𝐷𝑀𝐴(𝑋) = ∑ |𝑥𝑖−𝑥̅| 𝑛 𝑖=1 𝑛

=

|𝑥1−𝑥̅|+|𝑥2−𝑥̅|+⋯+|𝑥𝑛−𝑥̅| 𝑛

,

com

𝑥̅ =

∑𝑛_𝑖=1𝑥_𝑖 𝑛 7.3.3 Variância a) Variância Populacional

Seja

𝑋: 𝑥

₁

, 𝑥

₂

, 𝑥

₃

, … , 𝑥

_𝑁 um conjunto de dados quantitativos populacionais, para a variável

𝑋

. A variância populacional de

𝑋

, denotada por

𝜎

_𝑋2 ou por

𝜎

2, é dada por:

𝜎

_𝑋2

=

∑ (𝑥𝑖−𝜇𝑋) 2 𝑁 𝑖=1 𝑁

=

(𝑥₁−𝜇_𝑋)2+(𝑥₂−𝜇_𝑋)2+⋯+(𝑥_𝑁−𝜇_𝑋)2 𝑁 , com

𝜇

𝑋

=

∑𝑁_𝑖=1𝑥_𝑖 𝑁

𝜎

_𝑋2

=

∑ (𝑥𝑖−𝜇𝑋) 2_∙𝑁 𝑖 𝑘 𝑖=1 𝑁

=

(𝑥₁−𝜇_𝑋)2∙∙𝑁₁ + (𝑥₂−𝜇_𝑋)2∙𝑁₂ + …+ (𝑥_𝑁−𝜇_𝑋)2∙𝑁_𝑘 𝑁

,

onde

𝑥

_𝑖 é o ponto médio da classe

𝑖

e

𝑁

_𝑖

𝑖

, com

𝑖

= 1, 2, ..., k.

(8)

b) Variância Amostral

Seja

𝑋: 𝑥

₁

, 𝑥

₂

, 𝑥

₃

, … , 𝑥

_𝑛 um conjunto de dados quantitativos, amostrais, para a variável 𝑋. A variância amostral de 𝑋, denotada por

𝑠

_𝑋2 ou por

𝑠

2, é dada por:

𝑠

_𝑋2

=

∑ (𝑥𝑖−𝑥̅) 2 𝑛 𝑖=1 𝑛−1

=

(𝑥₁−𝑥̅)2+(𝑥₂−𝑥̅)2+⋯+(𝑥_𝑛−𝑥̅)2 𝑛−1 , com

𝑥̅

=

∑𝑛_𝑖=1𝑥_𝑖 𝑛

𝑠

_𝑋2

=

∑ (𝑥𝑖−𝑥̅) 2_∙𝑛 𝑖 𝑘 𝑖=1 𝑛−1

=

(𝑥₁−𝑥̅)2∙𝑛₁+(𝑥₂−𝑥̅)2∙𝑛₂+⋯+(𝑥_𝑛−𝑥̅)2∙𝑛_𝑘 𝑛−1

,

onde

𝑥

𝑖 é o

ponto médio da classe

𝑖

e

𝑛

_𝑖

𝑖

, com

𝑖

= 1, 2, ...,

k.

7.3.4 Desvio-padrão

Calcula-se extraindo a raiz quadrada da variância.

a) Desvio-padrão populacional da variável 𝑋, denotado por

𝜎

_𝑋 ou por

𝜎

:

𝜎

_𝑋

= √

𝜎

_𝑋2 = √∑ (𝑥𝑖−𝜇𝑋) 2 𝑁 𝑖=1 𝑁 , com

𝜇

𝑋

=

∑𝑁_𝑖=1𝑥_𝑖 𝑁

𝜎

_𝑋

=

√

∑ (𝑥𝑖−𝜇𝑋) 2_∙𝑁 𝑖 𝑘 𝑖=1 𝑁

=

√

(𝑥₁−𝜇_𝑋)2∙∙𝑁₁ + (𝑥₂−𝜇_𝑋)2∙𝑁₂ + …+ (𝑥_𝑁−𝜇_𝑋)2∙𝑁_𝑘 𝑁

,

onde

𝑥

_𝑖 é o ponto médio da classe

𝑖

e

𝑁

_𝑖

𝑖

, com

𝑖

= 1, 2, ..., k.

b) Desvio-padrão amostral da variável 𝑋, denotado por

𝑠

_𝑋 ou por

𝑠:

𝑠

_𝑋

= √

𝑠

_𝑋2

= √

∑ (𝑥𝑖−𝑥̅ ) 2 𝑛 𝑖=1 𝑛−1 , com

𝑥̅ =

𝑠

_𝑋

=

√

∑ (𝑥𝑖−𝑥̅)2∙𝑛𝑖 𝑘 𝑖=1 𝑛−1

=

√

(𝑥₁−𝑥̅)2∙𝑛₁+(𝑥₂−𝑥̅)2∙𝑛₂+⋯+(𝑥_𝑛−𝑥̅)2∙𝑛_𝑘 𝑛−1

,

onde

𝑥

𝑖 é o

(9)

7.3.5 Coeficiente de Variação

Relativiza o desvio-padrão em relação à média do conjunto de dados.

a) Coeficiente de variação populacional da variável 𝑋, denotado por

𝐶𝑉

_𝑋 :

𝐶𝑉_𝑋 =𝜎𝑋

𝜇_𝑋 . 100% , onde 𝜎𝑋 e 𝜇𝑋 são o desvio-padrão populacional e a média

populacional da variável 𝑋, respectivamente.

b) Coeficiente de variação amostral da variável 𝑋, denotado por

𝐶𝑉

_𝑋:

𝐶𝑉_𝑋 = 𝑠𝑋

𝑥̅ . 100% , onde

𝑠

𝑋 e

𝑥̅

são o desvio-padrão amostral e a média

amostral da variável 𝑋, respectivamente.

7.3.6 Escore Padronizado Z, Escore Z ou Z-escore

É uma medida que quantifica, em desvios-padrões, o desvio entre cada valor de uma variável e a média dessa variável.

a) Z-escore populacional

Seja

𝑋: 𝑥

₁

, 𝑥

₂

, 𝑥

₃

, … , 𝑥

_𝑁 um conjunto de dados quantitativos, populacionais, para a variável

𝑋

, com média

𝜇

_𝑋 e desvio-padrão

𝜎

_𝑋. O Z-escore, denotado por Z, é calculado para cada valor de

𝑋

da seguinte forma:

𝑍 =

𝑋 − 𝜇

𝑋

𝜎

_𝑋 Assim, tem-se:

𝑧

₁

=

𝑥1−𝜇𝑋 𝜎_𝑋

, 𝑧

2

=

𝑥₂−𝜇_𝑋 𝜎_𝑋

, … , 𝑧

𝑁

=

𝑥_𝑁−𝜇_𝑋 𝜎_𝑋 e, portanto:

𝑍: 𝑧

₁

, 𝑧

₂

, 𝑧

₃

, … , 𝑧

_𝑁 b) Z-escore estimado

Seja

𝑋: 𝑥

₁

, 𝑥

₂

, 𝑥

₃

, … , 𝑥

_𝑛 um conjunto de dados quantitativos, amostrais, para a variável

𝑋,

com média

𝑥̅

e desvio-padrão

𝑠

_𝑋. O Z-escore estimado, denotado por

𝑍̂

, é calculado para cada valor de

𝑋

da seguinte forma:

𝑍̂

=

𝑋 − 𝜇

̂

𝑋

𝜎

̂

_𝑋

=

𝑋 − 𝑥

̅

(10)

EXERCÍCIOS

1) Considere os conjuntos de dados amostrais X: 2, 25, 17, 5, 40 e Y: 3, 12, 10, 29, 12, 3, sendo X e Y duas variáveis em escala de razão. Para resumir descritivamente esses conjuntos de dados, calcule e interprete as respectivas medidas estatísticas solicitadas: a)

𝑛

_𝑋

; 𝑛

_𝑌 b) 𝐴𝐴_𝑋 ; 𝐴𝐴_𝑌 c)

𝑥

̃ ; 𝑦

̃

d)

𝑥

̅

;

𝑦

̅

e) 𝑀𝑜_𝑋 ; 𝑀𝑜_𝑌 f) 𝑄_1,𝑋 ; 𝑄_1,𝑌 g) 𝑄_3,𝑋 ; 𝑄_3,𝑌 h) 𝑠_𝑋2

; 𝑠

_𝑌2 i)

𝑠

_𝑋

; 𝑠

_𝑌 j) 𝐶𝑉_𝑋 ; 𝐶𝑉_𝑌 k) 𝐴𝑆_𝑋 ; 𝐴𝑆_𝑌

l) P10 m) P90

2) Represente os conjuntos de dados do exercício 1, em um único diagrama de pontos. Em qual deles a variabilidade dos dados é maior? Justifique sua resposta.

3) Para cada conjunto de dados do exercício 1, construa um diagrama ramo-e-folhas e um diagrama box-plot. Pelo box-plot, verifique se há pontos discrepantes em X e em Y.

4) Os valores abaixo representam uma amostra do consumo mensal de energia elétrica de uma residência, de abril de 2012 a março de 2013, em kwh. Calcular as seguintes medidas estatísticas: mínimo, máximo, amplitude amostral, primeiro quartil, terceiro quartil, consumo médio, consumo mediano, variância, desvio-padrão e coeficiente de variação, e construir os respectivos diagrama ramo-e-folhas e o diagrama box-plot:

145; 183; 179; 220; 204; 146; 170; 208; 180; 151; 201; 198

5) O Teorema de Chebyshev afirma que para qualquer conjunto de dados, ao menos 75% dos valores estão dentro de dois desvios-padrão a contar da média, para baixo ou para cima, não importando a forma da distribuição. Dessa forma, considera-se usuais os valores cujos escores padronizados estão entre –2 e 2, e incomuns os valores com escore padronizado inferior a –2 ou superior a 2. Baseado nisso, justifique se, no exercício anterior 4), há valores incomuns.

6) Calcule a variância, o desvio-padrão e o coeficiente de variação dos dados do exercício 4, caso fossem uma população e não uma amostra.

(11)

7) O rol abaixo apresenta o consumo de água, em m3_{, correspondente a uma amostra de} contas da empresa de saneamento Água para Todos e Todas:

10 12 15 16 17 20 21 21 23 26 30 36 41 47 54 10 13 15 16 17 20 21 22 23 27 31 36 45 48 54 11 13 15 17 18 20 21 22 23 27 31 36 46 49 56 12 13 15 17 18 20 21 22 24 28 31 38 46 51 56 12 14 16 17 19 20 21 22 24 29 33 40 46 53 59

a) Identifique a variável e sua unidade de medida. Classifique a variável. b) Faça uma tabela com os resultados de todos os itens abaixo:

• A quantidade de dados; • O mínimo; • O máximo; • A amplitude; • O primeiro quartil • O terceiro quartil

• A média aritmética simples (ou, simplesmente, média) • A moda

• A mediana • A variância • O desvio-padrão

• O coeficiente de variação.

c) (Pesquise e indique a fonte de referência) Conceitue "assimetria" e "curtose" em Estatística. Indique pelo menos uma fórmula para calcular a assimetria e uma para calcular a curtose de um conjunto de dados.

d) Calcule a assimetria e a curtose referente a esse rol.

e) Construa um gráfico ramo-e-folhas correspondente ao rol. Não esqueça de explicitar a unidade das folhas, nem o título completo e a fonte;

f) Construa um gráfico box-plot correspondente ao rol. Não esqueça de colocar o título completo para o gráfico e a fonte;

g) Construa uma tabela de frequência para dados agrupados em classe. Não esqueça de colocar o título completo na tabela e a fonte;

h) Construa o histograma de densidade de frequência relativa correspondente à tabela do item g. Não esqueça do título completo e da fonte.

(12)

8) Em um grupo de voluntários para o teste de degustação de um novo refrigerante a ser lançado comercialmente, foram observadas as seguintes idades, em anos completos, organizadas em rol:

14 15 15 16 17 19 23 27

15 15 16 17 17 20 23 28

15 15 16 17 19 22 25 31

Construa uma tabela com as medidas estatísticas que descrevem esse conjunto de dados e o respectivo gráfico box-plot.

9) Um comerciante atacadista vende determinado produto em sacas que deveriam conter 16,50 kg. A pesagem de uma amostra de 400 sacas revelou os resultados representados na tabela abaixo: i Massa (kg) Nº de sacas xi fri Fi Fri 𝜟𝒊 14,55 ⎯ 15,55 2 15,55 ⎯ 16,25 40 16,25 ⎯ 16,75 123 16,75 ⎯ 17,05 155 17,05 ⎯ 18,00 80 Total 400

a) Preencha a tabela dada.

b) Esboce o histograma de densidade de frequência relativa e, sobre ele, o respectivo polígono e a curva polida.

c) Esboce o histograma de frequência relativa acumulada e, sobre ele, o respectivo polígono e a curva polida.

d) Determine e interprete as medidas estatísticas, abaixo, usadas para resumir descritivamente o conjunto de dados. Não se esqueça de colocar a respectiva unidade de medida, em cada valor calculado. Obtenha as medidas, abaixo, manualmente; por meio de calculadora científica, usando as funções estatísticas, naquilo que for possível; por uma planilha eletrônica; por um software estatístico:

• a amplitude total da distribuição;

• o peso médio, o peso mediano e a moda bruta, por saca; • a variância, o desvio-padrão e o coeficiente de variação;

• o primeiro quartil, o terceiro quartil, o décimo percentil e o nonagésimo percentil; • um coeficiente de assimetria e um coeficiente de curtose.

(13)

e) Classifique essa distribuição de frequências, quanto à assimetria e quanto à curtose f) Abaixo de qual peso encontram-se 70% das sacas?

g) Acima de qual peso encontram-se as 100 sacas mais pesadas?

h) O peso médio por saca é uma boa medida de tendência central para representar essa distribuição de frequências? Justifique.

10) Considere o conjunto de dados populacionais de uma variável X, representado por

𝑋: 𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑁. Usando propriedades de somatório, mostre que a variância populacional de 𝑋, dada por

𝜎

_𝑋2

=

∑ (𝑥𝑖−𝜇𝑋)

2 𝑁

𝑖=1

𝑁 , pode ser escrita mais convenientemente 6 por

𝜎

_𝑋2

=

∑ 𝑥𝑖 2 𝑁 𝑖=1 𝑁

− 𝜇

𝑋 2_{, com}

_𝜇

𝑋

=

∑𝑁_𝑖=1𝑥_𝑖 𝑁 .

11) Considere o conjunto de dados amostrais de uma variável X, representado por

𝑋: 𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑛. Usando propriedades de somatório, mostre que a variância amostral de

X, dada por

𝑠

_𝑋2

=

∑ (𝑥𝑖−𝑥̅)

2 𝑛

𝑖=1

𝑛−1 , pode ser escrita mais convenientemente

7_por

_𝑠

𝑋2

=

∑𝑛_𝑖=1𝑥_𝑖2 𝑛−1

−

(∑𝑛𝑖=1𝑥𝑖) 2 𝑛(𝑛−1)

,

com

𝑥̅

=

.

12) Abaixo, está representada uma tabela genérica de distribuição de frequências, com intervalos de classe, para uma variável X. Nesse caso, a variância amostral é dada por:

𝑠

_𝑋2

=

∑ (𝑥𝑖−𝑥̅) 2_{∙ 𝑛} 𝑖 𝑘 𝑖=1 𝑛−1

=

(𝑥₁−𝑥̅)2 ∙ 𝑛₁+(𝑥₂−𝑥̅)2 ∙ 𝑛₂+⋯+(𝑥_𝑘−𝑥̅)2 ∙ 𝑛_𝑘 𝑛−1

Use propriedades de somatório para demonstrar que:

𝑠

_𝑋2

=

∑ (𝑥𝑖−𝑥̅)2 ∙ 𝑛𝑖 𝑘 𝑖=1 𝑛−1

=

∑𝑘_𝑖=1 𝑥_𝑖2𝑥̅∙𝑛_𝑖 𝑛−1

−

(∑𝑘_𝑖=1 𝑥_𝑖∙𝑛_𝑖)2 𝑛(𝑛−1) , onde:

𝑛

_𝑖 é a frequência absoluta a

𝑖

-ésima classe,

𝑛

é o tamanho da amostra, com 𝑛 =∑𝑘_𝑖=1𝑛_𝑖,

𝑘 é o número de classes da distribuição de frequências,

𝑥

_𝑖 é o ponto médio da

𝑖

-ésima classe.

6_{O uso da fórmula que representa a definição de variância ocasiona perda de casas decimais, caso a média não} seja um valor inteiro ou um decimal finito. Essa outra fórmula diminui os erros decorrentes de arredondamento. 7_Idem.

(14)

Tabela genérica: 𝑖 X 𝑛𝑖 𝑥𝑖 1 𝑙₁⎯ 𝐿₁ 𝑛₁ 𝑥₁ 2 𝑙₂⎯ 𝐿₂ 𝑛₂ 𝑥₂ ⋮ ⋮ ⋮ ⋮ 𝑘 𝑙_𝑘⎯ 𝐿_𝑘 𝑛_𝑘 𝑥_𝑘 Total 𝑛

𝑋: 𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑁. O que acontece com a média populacional

𝜇

_𝑋

=

∑ 𝑥𝑖 𝑁 𝑖=1 𝑁 e com a variância populacional

𝜎

_𝑋2

=

∑ 𝑥𝑖 2 𝑁 𝑖=1 𝑁

− 𝜇

𝑋 2_{, quando:}

a) Soma-se uma constante real não nula c, a cada valor de X ? b) Multiplica-se cada valor de X por uma constante real não nula c?

𝑋: 𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑁, cuja média populacional e variância populacional são dadas por

𝜇

_𝑋

=

∑𝑁𝑖=1𝑥𝑖 𝑁

e

𝜎

𝑋 2

₌

∑𝑁𝑖=1(𝑥𝑖−𝜇𝑋)2 𝑁

=

∑𝑁_𝑖=1𝑥_𝑖2 𝑁

− 𝜇

𝑋

2_{, respectivamente. Ainda, considere as} variáveis 𝑌 e 𝑍, tais que, 𝑌: 𝑥₁+ 𝑐, 𝑥₂+ 𝑐, 𝑥₃+ 𝑐, … , 𝑥_𝑁 + 𝑐 e 𝑍: 𝑐𝑥₁, 𝑐𝑥₂, 𝑐𝑥₃, … , 𝑐𝑥_𝑁, com 𝑐 ∈ 𝑅₊∗_{, sendo 𝑅 o conjunto dos números reais. Prove que:}

a)

𝜇

_𝑌

= 𝜇

_𝑋

+ 𝑐

b)

𝜎

_𝑌2

= 𝜎

_𝑋2

c)

𝜇

_𝑍

= 𝑐𝜇

_𝑋

d)

𝜎

_𝑍2

= 𝑐

2

𝜎

_𝑋2

15) Assinale V para verdadeiro e F para falso. Justifique as sentenças falsas:

( ) Na prática, a média será tanto mais representativa do conjunto de dados quanto menor for o valor do seu coeficiente de variação.

(...) Uma curva simétrica possui a moda maior que a mediana e que a média.

(...) Numa distribuição de frequências em que a variável só apresenta um valor constante,

n vezes, o desvio-padrão será 1.

(...) Se, numa distribuição de frequências, 50% dos dados situam-se até a média, pode-se dizer que essa distribuição é simétrica.

(...) Se todos os elementos de um conjunto de dados populacionais forem multiplicados por uma constante real não nula, a média não se alterará e a variância ficará multiplicada por essa constante.

(...) Em qualquer distribuição de frequências, a mediana sempre será igual a média aritmética entre o primeiro e o terceiro quartis.

(15)

16) Num processo de amostragem, peças de um mesmo tipo foram inspecionadas, tendo sido coletados dados referentes ao número de defeitos por peça. Os resultados foram os seguintes: 5, 6, 4, 8, 7, 5, 10, 5, 5, 7, 7, 7, 10, 10, 5, 5, 4, 3, 6, 4.

a) Identifique a variável, classifique-a, identifique sua unidade de medida e sua escala de medida.

b) Construa uma tabela de distribuição de frequências e o histograma adequado para a variável, levando em conta a classificação dela.

EXEMPLO DE EXERCÍCIO COM DADOS QUANTITATIVOS CONTÍNUOS AGRUPADOS EM CLASSE

Uma amostra de 200 latas de alumínio de dois milímetros de espessura foi submetida a um teste de pressão e os valores das cargas axiais foram tabelados da seguinte forma:

Cargas axiais, em quilos (kg), de latas de alumínio de dois milímetros de espessura Curitiba – Fevereiro/2018

Carga axial (kg) Nº de latas

100⎯ 104 5 104⎯ 108 15 108⎯ 112 40 112⎯ 116 45 116⎯ 120 50 120⎯ 124 30 124⎯ 128 15 Total 200

Fonte: Dados fictícios.

Nota: Carga axial de uma lata é o peso máximo suportado por seus lados e é medida usando uma placa para

aplicar uma pressão crescente ao topo da lata, até que ela ceda.

a) Elabore uma tabela contendo os pontos médios de classe, as amplitudes de classe, as frequências relativas, as frequências acumuladas, as frequências relativas acumuladas e as densidades de frequências relativas;

b) Calcule a amplitude total da distribuição dos dados; c) Calcule a moda bruta;

d) Calcule a carga axial média; e) Calcule a variância;

(16)

g) Calcule o coeficiente de variação;

h) Calcule a carga axial mediana e interprete-a; i) Calcule o primeiro quartil e interprete-o; j) Calcule o terceiro quartil e interprete-o; k) Calcule o décimo percentil e interprete-o; l) Calcule o nonagésimo percentil e interprete-o;

m) Esboce o histograma de densidade de frequência relativa e, sobre ele, o polígono de densidade de frequência relativa e a respectiva curva polida.

n) Calcule pelo menos um coeficiente de assimetria. Compare esses coeficientes com o histograma de densidade, o polígono de densidade e a curva polida do item m) e classifique a distribuição quanto à assimetria.

o) Calcule pelo menos um coeficiente de curtose. Compare esses coeficientes com o histograma de densidade, o polígono de densidade e a curva polida do item m) e classifique a distribuição quanto à curtose.

p) A média é suficiente para representar esse conjunto de dados? Justifique.

q) A carga axial média é uma boa medida de tendência central para representar essa distribuição de frequências?

(17)

Solução a)

Classe (𝑖) Carga axial (kg) (X) Nº de latas (𝑛𝑖) Ponto médio (𝑥𝑖) Amplitude de classe (ℎ_𝑖) Frequência relativa (𝑓𝑟𝑖) Frequência acumulada (𝐹_𝑖) Frequência relativa acumulada (𝐹𝑟_𝑖) Densidade de frequência relativa (∆_𝑖) 1 100⎯ 104 5 102 4 0,025 5 0,025 0,00625 2 104⎯ 108 15 106 4 0,075 20 0,100 0,01875 3 108⎯ 112 40 110 4 0,200 60 0,300 0,05000 4 112⎯ 116 45 114 4 0,225 105 0,525 0,05625 5 116⎯ 120 50 118 4 0,250 155 0,775 0,06250 6 120⎯ 124 30 122 4 0,150 185 0,925 0,03750 7 124⎯ 128 15 126 4 0,075 200 1,000 0,01875 Total 200 1,000 b) Amplitude total: AT = 128 – 100 = 28 kg c) Moda bruta: Mo = 118 kg d) Média:

𝑥̅

= 102∙5+106∙15+110∙40+114∙45+118∙50+122∙30+126∙15 200

=

23080 200 = 115,4 𝑘𝑔 e) Variância:

𝑠

_𝑋2 = (102−115,4) 2_{∙5+(106−115,4)}2_{∙15+(110−115,4)}2_{∙40+⋯+(126−115,4)}2_∙15 200−1

=

6808 199

≅

34,2111 𝑘𝑔 2 f) Desvio-padrão: 𝑆_𝑋

= √

6808 199

≅

5,85 kg g) Coeficiente de variação: 𝐶𝑉_𝑋

≅

5,85 115,4

≅

0,051 = 5,1%

(18)

h) Mediana (

𝑥̃

)

Fórmula para calcular a mediana para dados agrupados em classe:

𝑥̃ = 𝑙

_𝑀𝑒𝑑

+ (

𝐿𝑀𝑒𝑑−𝑙𝑀𝑒𝑑

𝑛_𝑀𝑒𝑑

) ∙ (

𝑛

2

− 𝐹

𝑎𝑛𝑡.𝑀𝑒𝑑

)

onde:

𝑙

_𝑀𝑒𝑑 é o limite inferior da classe da mediana

𝐿

_𝑀𝑒𝑑 é o limite superior da classe da mediana

𝑛

_𝑀𝑒𝑑 é a frequência absoluta da classe da mediana

𝑛

é o tamanho da amostra

𝐹

_{𝑎𝑛𝑡.𝑀𝑒𝑑} é a frequência acumulada da classe anterior à classe da mediana

No exemplo dado, tem-se: Mediana:

𝑥

₍200

2 )

= 𝑥

₍₁₀₀₎

é o valor de X que está na 100ª posição, portanto, na 4ª classe (ver tabela do item a, coluna frequência acumulada)

Logo,

𝑥̃

= 112

+ (

116−112

45

) ∙ (

200

2

− 60) ≅

115,56 kg

Interpretação da mediana, no contexto do problema:

(19)

i) Primeiro Quartil (Q1)

Fórmula para calcular o primeiro quartil para dados agrupados em classe:

𝑄

₁

=

𝑙

_𝑄₁

+ (

𝐿𝑄1−𝑙𝑄1

𝑛_𝑄1

) ∙ (

𝑛

4

− 𝐹

𝑎𝑛𝑡.𝑄1

)

onde:

𝑙

_𝑄₁ é o limite inferior da classe do primeiro quartil

𝐿

_𝑄₁ é o limite superior da classe do primeiro quartil

𝑛

_𝑄₁ é a frequência absoluta da classe do primeiro quartil

𝑛

𝐹

_{𝑎𝑛𝑡.𝑄}₁ é a frequência acumulada da classe anterior à classe do primeiro quartil

No exemplo dado, tem-se: Primeiro quartil:

𝑥

₍200

4 )

= 𝑥

₍₅₀₎

é o valor de X que está na 50ª posição, portanto, na 3ª classe (ver tabela do item a, coluna frequência acumulada)

Logo,

𝑄

₁= 108

+ (

112−108

40

) ∙ (

200

4

− 20) =

111 kg

Interpretação do primeiro quartil, no contexto do problema:

(20)

j) Terceiro Quartil (Q3)

Fórmula para calcular o terceiro quartil para dados agrupados em classe:

𝑄

₃

=

𝑙

_𝑄₃

+ (

𝐿𝑄3−𝑙𝑄3

𝑛_𝑄3

) ∙ (

3𝑛

4

− 𝐹

𝑎𝑛𝑡.𝑄3

)

onde:

𝑙

_𝑄₃ é o limite inferior da classe do terceiro quartil

𝐿

_𝑄₃ é o limite superior da classe do terceiro quartil

𝑛

_𝑄₃ é a frequência absoluta da classe do terceiro quartil

𝑛

𝐹

_{𝑎𝑛𝑡.𝑄}₃ é a frequência acumulada da classe anterior à classe do terceiro quartil

No exemplo dado, tem-se: Terceiro quartil:

𝑥

₍3∙200

4 )

= 𝑥

₍₁₅₀₎ é o valor de X que está na 150ª posição, portanto, na 5ª classe (ver tabela do item a, coluna frequência

acumulada) Logo,

𝑄

₃ = 116

+ (

120−116 50

) ∙ (

3∙200 4

− 105) =

119,6 kg

Interpretação do terceiro quartil, no contexto do problema:

(21)

k) Décimo Percentil (P10)

Fórmula para calcular o décimo percentil para dados agrupados em classe:

𝑃

₁₀

=

𝑙

_𝑃₁₀

+ (

𝐿𝑃10−𝑙𝑃10

𝑛_𝑃10

) ∙ (

10𝑛

100

− 𝐹

𝑎𝑛𝑡.𝑃10

)

onde:

𝑙

_𝑃₁₀ é o limite inferior da classe do décimo percentil

𝐿

_𝑃₁₀ é o limite superior da classe do décimo percentil

𝑛

_𝑃₁₀ é a frequência absoluta da classe do décimo percentil

𝑛

𝐹

_{𝑎𝑛𝑡.𝑃}₁₀ é a frequência acumulada da classe anterior à classe do décimo percentil

No exemplo dado, tem-se: Décimo percentil:

𝑥

₍10∙200

100 )

= 𝑥

₍₂₀₎ é o valor de X que está na 20ª posição, portanto, na 2ª classe (ver tabela do item a, coluna frequência acumulada)

Como a frequência acumulada da 2ª classe é 20, então o elemento que está na 20ª posição da distribuição é o limite superior da 2ª classe. Assim,

𝑃

₁₀

=

108 kg.

Caso queira usar a fórmula, tem-se:

𝑃

₁₀ = 104

+ (

108−104

15

) ∙ (

10∙200

100

− 5) =

108 kg

Interpretação do décimo percentil, no contexto do problema:

(22)

l) Nonagésimo Percentil (P90)

Fórmula para calcular o nonagésimo percentil para dados agrupados em classe:

𝑃

₉₀

=

𝑙

_𝑃₉₀

+ (

𝐿𝑃90−𝑙𝑃90

𝑛_𝑃90

) ∙ (

90𝑛

100

− 𝐹

𝑎𝑛𝑡.𝑃90

)

onde:

𝑙

_𝑃₉₀ é o limite inferior da classe do nonagésimo percentil

𝐿

_𝑃₉₀ é o limite superior da classe do nonagésimo percentil

𝑛

_𝑃₉₀ é a frequência absoluta da classe do nonagésimo percentil

𝑛

𝐹

_{𝑎𝑛𝑡.𝑃}₉₀ é a frequência acumulada da classe anterior à classe do nonagésimo percentil

No exemplo dado, tem-se: Nonagésimo percentil:

𝑥

₍90∙200

100 )

= 𝑥

₍₁₈₀₎ é o valor de X que está na 180ª posição, portanto, na 6ª classe (ver tabela do item a, coluna frequência

acumulada) Logo,

𝑃

₉₀ = 120

+ (

124−120 30

) ∙ (

90∙200 100

− 155) ≅

123,3 kg

Interpretação do nonagésimo percentil, no contexto do problema:

(23)

m) Histograma de densidade, polígono de densidade e curva polida

Comandos do software estatístico R

Carga<-rep(c(102,106,110,114,118,122,126), c(5,15,40,45,50,30,15)) Carga

hist(Carga, freq=F, right=F, breaks=c(100,104,108,112,116,120,124,128), xaxt="n", xlab="Carga axial, em kg", ylab="Densidade", main=" ") axis(1, seq(100,128,4)) PtMed<-c(100,102, 106, 110, 114, 118, 122, 126, 128) PtMed Densid<-c(0, 0.00625, 0.01875, 0.05, 0.05625, 0.06250, 0.0375, 0.01875, 0) Densid par(new=T)

plot(PtMed, Densid, type="l", col="blue", xaxt="n", yaxt="n", main=" ", xlab=" ", ylab=" ") CurvaPolida<-density(Carga)

CurvaPolida par(new=T)

(24)

Gráfico 1 – Histograma de densidade, polígono de densidade e curva polida para cargas axiais, em quilos, de latas de alumínio de dois milímetros de espessura - Curitiba – Fevereiro/2018

Fonte: Autoria própria, baseada em dados fictícios.

Nota: Carga axial de uma lata é o peso máximo suportado por seus lados e é medida usando uma placa para aplicar uma pressão crescente ao topo da lata, atéque ela ceda

(25)

n) Coeficientes de Assimetria (As)

𝐴𝑠 =

1 𝑛

∑

(

𝑘 𝑖=1 𝑥_𝑖−𝑥̅ 𝑠

)

3

_{∙ 𝑛}

𝑖

=

1 200

(

(102−115,4)3∙5 + (106−115,4)3∙15 + (110−115,4)3∙40 + … + (126−115,4)3∙15 5,853

) ≅

−3542,4 40040,33

≅

-0,08847

𝐴𝑠 =

3(𝑥̅ − 𝑥̃)

𝑠

=

3(115,4 − 115,56)

5,85

≅ −0,082

𝐴𝑠 =

𝑥̅ − 𝑀𝑜

𝑠

=

115,4 − 118

5,85

≅ −0,444

𝐴𝑠 =

𝑄

1

+ 𝑄

3

− 2𝑥̃

𝑄

₃

− 𝑄

₁

=

111 + 119,6 − 2 ∙ 115,56

119,6 − 111

≅ −0,060

Comandos do software estatístico R

install.packages("e1071") require(e1071)

skewness(Carga, type = 1) # R calculou o valor de

−

0.08918325

−

0.08985859

−

0.08851521

Interpretação da assimetria

Como quase todos os coeficientes de assimetria teve |𝐴𝑠| ≤ 0,15, a assimetria é baixa ou fraca.

Como As < 0, ou seja, a assimetria é negativa, então a curva é enviesada à esquerda, o que pode ser constatado no item m, pois a cauda

(26)

o) Coeficientes de Curtose (K) 𝐾 =1 𝑛∑( 𝑘 𝑖=1 𝑥𝑖− 𝑥̅ 𝑠 ) 4_{∙ 𝑛} 𝑖 − 3 =

1

200

( (

102 − 115,4

)4

∙ 5 +

(

106 − 115,4

)4

∙ 15 +

(

110 − 115,4

)4

∙ 40 + … +

(

126 − 115,4

)4

∙ 15

5,85

4 )

− 3 ⇒

K ≅ 561087 234235,9

− 3

≅ 2,40 – 3 ≅ – 0,6046

𝐾 =

𝑄

3

− 𝑄

1

2(𝑃

₉₀

− 𝑃

₁₀

)

=

119,6 − 111

2(123,3 − 108)

≅ 0,281

Comandos do software estatístico R

install.packages("e1071") # não é necessário instalar o pacote novamente, caso ele tenha sido instalado require(e1071)

> kurtosis(Carga, type=1) # R calculou o valor de –0.5788531

Interpretação da Curtose

Como

𝐾 =

𝑄3−𝑄1

2(𝑃90−𝑃10) ≅ 0,281 > 0,263, a distribuição (ou a curva polida) é platicúrtica.

(27)

p) A média não é suficiente para representar esse conjunto de dados de forma resumida, pois várias outras medidas estatísticas são necessárias, tais como, desvio-padrão, coeficiente de variação, mediana, moda, quartis, coeficientes de assimetria e coeficientes de curtose.

q) As latas rompem-se com uma carga axial média de 115,4 kg, com uma carga axial mediana de 115,56 kg, com um desvio-padrão de 5,58 kg, com coeficiente de variação de 5,1% e com coeficiente de assimetria baixo (menor de 0,15). Como a média e a mediana são próximas, o coeficiente de variação é baixo e a assimetria é fraca pode-se concluir que a média representa bem o respectivo conjunto de dados.