• Nenhum resultado encontrado

ANÁLISE DE DADOS: DÉCIMA LISTA DE EXERCÍCIOS

N/A
N/A
Protected

Academic year: 2021

Share "ANÁLISE DE DADOS: DÉCIMA LISTA DE EXERCÍCIOS"

Copied!
6
0
0

Texto

(1)

ANÁLISE DE DADOS: DÉCIMA LISTA DE EXERCÍCIOS

Humberto José Bortolossi

AMPLITUDES E AMPLITUDES INTERQUARTÍLICAS

[47] Para o conjunto de dados (3, –5, 7, 4, 8, 2, 8, –3, –6), (a) calcule sua amplitude e (b) calcule sua amplitude interquartílica (veja o Exercício [33]).

[48] Para o conjunto de dados (–3.8, –7.3, –4.5, 8.3, 8.3, –9.1, –3.8, 13.2), (a) calcule sua amplitude e (b) calcule sua amplitude interquartílica (veja o Exercício [34]).

[49] Uma companhia imobiliária vendeu N = 341 casas no último ano. O resumo dos cinco números para os preços de venda é dado por Min = US$97.000,00, Q1 = US$ 115.000,00, M = US$143.000,00, Q3 = US$156.000,00 e Max = US$249.000,00. (a) Calcule a amplitude interquartílica para os preços de venda. (b) Quantas casas foram vendidas por um preço entre US$115.000,00 e US$156.000,00 (inclusive)? Nota: se você acredita que não existem dados suficientes para dar uma resposta exata, dê sua resposta na forma “pelo menos ...” ou “no máximo ...”.

[50] Este exercício se refere aos salários iniciais dos formandos em agronomia e engenharia da Universidade Estadual da Tasmânia discutidos nos Exercícios [45] e [46]. (a) Estime a amplitude dos salários iniciais dos formandos em agronomia e engenharia. (b) Estime a amplitude interquartílica dos salários iniciais em agronomia e engenharia. (c) Existem 612 formandos em engenharia. Determine quantos salários iniciais dos formandos em engenharia estavam entre Q1 = US$35.000,00 e Q3 = US$43.500,00 (inclusive). Nota: se você acredita que não existem dados suficientes para dar uma resposta exata, dê sua resposta na forma “pelo menos ...” ou “no máximo ...”.

Para os Exercícios [51] e [54], você deve usar a seguinte definição de um outlier: um outlier é qualquer dado cujo valor está acima do terceiro quartil por mais de 1,5 vezes o IQR (outlier > Q3 + 1,5 IQR) ou abaixo do primeiro quartil mais do que 1.5 vezes o IQR (outlier < Q1 – 1,5 IQR). Nota: não existe uma definição universalmente aceita para um outlier: esta é uma entre as várias definições (critério de Chauvenet, critério de Peirce, teste de Grubbs, teste Q de Dixon, ASTM) usadas por estatísticos.

[51] Suponha que a definição precedente de outlier seja aplicada aos conjuntos de dados do Exemplo 14.16. (a) Complete corretamente o espaço em branco: qualquer pontuação maior do que ou igual a _____ é um

outlier. (b) Complete corretamente o espaço em branco: qualquer pontuação menor do que ou igual a _____

é um outlier. (c) Calcule os outliers (se é que eles existem) do conjunto de dados do Exemplo 14.16.

[52] Usando a definição precedente, calcular os outliers (se é que eles existem) dos dados da distribuição das idades dos bombeiros da cidade de Cleansburg (Exercícios [30] e [37]). Dica: faça o Exercício [37] primeiro.

[53] A distribuição das alturas (em polegadas) dos homens norte-americanos com 18 anos tem primeiro quartil Q1 = 67 polegadas e terceiro quartil Q3 = 71 polegadas. Usando a definição precedente, determine quais alturas correspondem a outliers.

[54] A distribuição das alturas (em polegadas) das mulheres norte-americanas com 18 anos tem primeiro quartil Q1 = 62,5 polegadas e terceiro quartil Q3 = 66 polegadas. Usando a definição precedente, determine quais alturas correspondem a outliers.

(2)

DESVIOS PADRÕES

O propósito dos Exercícios [55] a [58] é praticar o cálculo dos desvios padrões usando a definição. Certamente o cálculo dos desvios padrões com lápis e papel não é a maneira como ele é normalmente feito na prática: uma boa calculadora ou um software pode fazer este cálculo mais rapidamente e com mais precisão. O ponto aqui é que calcular alguns desvios padrões com lápis e papel irá lhe ajudar a entender o conceito um pouco melhor. Se você usar uma calculadora ou um computador para responder a estes exercícios, então você estará se desviando do propósito.

[55] Calcule o desvio padrão de cada um dos seguintes conjuntos de dados. (a) (5, 5,5 , 5). (b) (0, 5, 5, 10). (c) (0, 10, 10, 20).

[56] Calcule o desvio padrão de cada um dos seguintes conjuntos de dados. (a) (3, 3, 3, 3). (b) (0, 6, 6, 8). (c) (–6, 0, 0, 18).

[57] Calcule o desvio padrão de cada um dos seguintes conjuntos de dados. (a) (0, 1, 2, 3, 4, 5, 6, 7, 8, 9). (b) (1, 2, 3, 4, 5, 6, 7, 8, 9, 10). (c) (6, 7, 8, 9, 10, 11, 12, 13, 14, 15).

[58] Calcule o desvio padrão de cada um dos seguintes conjuntos de dados. (a) (–3, –2, –1, 0, 1, 2, 3). (b) (–2, –1, 0, 1, 2, 3, 4). (c) (0, 1, 2, 3, 4, 5, 6, 7).

OUTROS EXERCÍCIOS

A moda. A moda de um conjunto de dados é o dado que ocorre com maios frequência. Quando existem

vários dados (ou categorias de dados) com a mesma maior frequência, cada um deles é uma moda. Por outro lado, se todos os dados possuem a mesma frequência, ao invés de dizer que cada dado é uma moda, é usual dizer que o conjunto de dados não possui moda (ou que ele é amodal).

Nos Exercícios [59] a [64] você deve calcular a moda ou modas dos conjuntos de dados apresentados. Se não existe moda, sua resposta deve explicar o motivo.

[59] Calcula a moda do conjunto de dados na Tabela 14-13 (Exercícios [05] e [06]). [60] Calcule a moda do conjunto de dados na Tabela 14-19 (Exercício [30]).

[61] Calcule a moda do conjunto de dados apresentado na Figura 14-20. Se não existe moda, sua resposta deve explicar o motivo.

Figura 14-20

[62] Calcule a moda do conjunto de dados apresentado na Figura 14-21. Se não existe moda, sua resposta deve explicar o motivo.

(3)

Figura 14-21

[63] Calcule a moda do conjunto de dados apresentado na Figura 14-22. Se não existe moda, sua resposta deve explicar o motivo.

Figura 14-22

[64] Calcule a moda do conjunto de dados apresentado na Figura 14-23. Se não existe moda, sua resposta deve explicar o motivo.

Figura 14-22

EXERCÍCIOS INTERMEDIÁRIOS

[65] A média de Mike nos primeiros cinco exames de economia foi igual a 88. Qual deve ser a nota de Mike no próximo exame para que sua média seja igual a 90?

[66] A média de Sarah em física foi de 93 pontos. Sua média foi calculada a partir de quatro exames, cada um com peso 1 valendo 100 pontos e um exame final com peso 2 valendo 200 pontos. Qual é a menor pontuação possível que Sarah poderia ter obtido no primeiro exame?

(4)

[67] Em 2006, a mediana dos resultados do teste SAT foi a média entre d732.872 e d732.873, onde d1 ≤ d2 ≤ ... ≤

dN representam os resultados do teste ordenados da menor para a maior pontuação. Determine o número N de estudantes que fizeram o teste SAT em 2006.

[68] Em 2004, o terceiro quartil dos resultados do teste SAT foi d1.064.256, onde d1 ≤ d2 ≤ ... ≤ dN representam

os resultados do teste ordenados da menor para a maior pontuação. Determine o número N de estudantes que fizeram o teste SAT em 2004.

[69] (a) Dê um exemplo de 10 números cuja média seja menor do que a mediana. (b) Dê um exemplo de 10 números cuja mediana seja menor do que a média. (c) Dê um exemplo de 10 números cuja média seja menor do que o primeiro quartil. (d) Dê um exemplo de 10 números cuja média seja maior do que o terceiro quartil. [70] Suponha que a média de 10 números seja igual a 7,5 e que o menor deles seja igual a Min = 3. (a) Qual é o menor valor possível de Max? (b) Qual é o maior valor possível de Max?

[71] Este exercício se refere à folha de pagamento dos times da Primeira Divisão da Liga de Beisebol em 2008, conforme a Figura 14-24 (Este é a Figura 14-18 nos Exercícios [21] e [22]). Usando as informações da figura, pode-se determinar que a mediana da folha de pagamento de 2008 está entre US$70.000.000,00 e US$80.000.000,00. Explique como.

[72] Um conjunto de dados é denominado constante se todos os dados são iguais. Explique por que qualquer conjunto de dados com desvio padrão igual a zero deve ser constante.

Os Exercícios [73] e [74] referem-se a histogramas com intervalos de classe de tamanhos diferentes. Ao desenhar tais histogramas, as colunas devem ser desenhadas de modo que as frequências ou percentagens são proporcionais às áreas da coluna. A Figura 14-25 ilustra isto.

(5)

Se a coluna sobre o intervalo de classe 1 representa 10% da população, então a coluna sobre o intervalo de classe 2, também representando 10% da população, deve ter um terço da altura, uma vez que o seu intervalo de classe é três vezes mais largo (Figura 14-25).

[73] Se a altura da coluna sobre o intervalo de classe 20–30 é igual a uma unidade e se esta coluna representa 25% da população, então (a) Qual deve ser a altura da coluna sobre o intervalo de classe 30–35 se 50% da população está neste intervalo de classe? (b) Qual deve ser a altura da coluna sobre o intervalo de classe 35–45 se 10% da população está neste intervalo de classe? (c) Qual deve ser a altura da coluna sobre o intervalo de classe 45–60 se 15% da população está neste intervalo de classe?

[74] Duzentos cidadãos fizeram um teste de aptidão física e eles foram classificados de acordo com o tempo que levaram para caminhar uma milha. Estas classificações e as frequências associadas estão descritas na Tabela 14-22. Desenhe um histograma para estes dados com base nas categorias definidas pelas classificações na tabela.

[75] (Paradoxo de Simpson) A mídia acusou a Universidade Estadual da Tasmânia de discriminar mulheres no seu processo de admissão para os programas de pós-graduação em arquitetura e engenharia. O Jornal da Tasmânia afirma que “68% de todos os homens que se inscreveram nos programas de pós-graduação em arquitetura ou engenharia foram admitidos, enquanto que apenas 51% das mulheres que se inscreveram para os mesmos programas foram admitidas”. Os dados estão indicados na Tabela 14-23.

(a) Qual é a percentagem de homens que se inscreveram em arquitetura que foram admitidos? Qual é a percentagem de mulheres que se inscreveram na mesma escola que foram admitidas? (b) Qual é a percentagem de homens que se inscreveram em engenharia que foram admitidos? Qual é a percentagem de mulheres que se inscreveram na mesma escola que foram admitidas? (c) Como o Jornal da Tasmânia obteve os números que apresentou em sua reportagem? (d) Explique como é possível que os resultados em (a) e (b) e a afirmação do Jornal da Tasmânia estejam todos corretos.

[76] O que acontecerá com o resumo dos cinco números para o conjunto de dados do Exemplo 14.16 se (a) dois pontos forem acrescentados a cada pontuação? (b) 10% for acrescentado a cada pontuação (isto é, cada pontuação é multiplicada por 1,1)?

[77] Seja A a média do conjunto de dados (x1, x2, x3, ..., xN). (a) Calcule a média do conjunto de dados

(x1 + c, x2 + c, x3 + c, ..., xN + c). (b) Use os resultados do Item (a) para explicar por que a média de (x1 – A,

x2 – A, x3 – A, ..., xN – A) é zero. Nota: o conjunto de dados (x1 – A, x2 – A, x3 – A, ..., xN – A) representa

o conjunto de desvios em relação a média.

[78] Seja M a mediana do conjunto de dados (x1, x2, x3, ..., xN). Calcule a mediana do conjunto de dados

(x1 + c, x2 + c, x3 + c, ..., xN + c). Explique sua resposta.

(6)

[79] Explique por que os conjuntos de dados (x1, x2, x3, ..., xN) e (x1 + c, x2 + c, x3 + c, ..., xN + c) possuem

(a) a mesma amplitude e (b) o mesmo desvio padrão. Dica: tente resolver os Exercícios [57] e [58] primeiro.

EXERCÍCIOS AVANÇADOS

[80] Considere um conjunto de dados de 10 números com Min = 2, Max = 12 e média A = 7. Seja σ o desvio padrão deste conjunto. (a) Qual é o menor valor possível para σ? (b) Qual é o maior valor possível para σ? [81] Mostre que o desvio padrão de qualquer conjunto de números é sempre menor do que ou igual à amplitude estes números.

[82] Mostre que se (x1, x2, x3, ..., xN) é um conjunto de dados com média A e desvio padrão σ, então σ N1/2 ≥

|xi – A| para todo i. (b) Use o Item (a) para mostrar que todo dado é maior do que ou igual a A – σ N1/2 e é

menor do que ou igual a A + σ N1/2, isto é, todo dado x é tal que A – σ N1/2 ≤ x ≤ A + σ N1/2 .

[83] (a) Dados dois números A e σ > 0, encontre dois outros números (expressos em termos de A e σ) cuja média é A e cujo desvio padrão é σ. (b) Encontre três números igualmente espaçados cuja média é A e cujo desvio padrão é σ. (c) Generalize o resultado anterior encontrando N números igualmente espaçados cuja média é A e cujo desvio padrão é σ. Dica: considere os casos em que N é par e N é ímpar separadamente. [84] Mostre que se A é média e M é a mediana do conjunto de dados (1, 2, 3, ..., N), então A = M para todos os valores de N.

[85] Mostre que se A é média e M é a mediana de um conjunto de dados consistindo dos primeiros N termos de uma progressão aritmética, então A = M.

[86] Suponha que a média dos números x1, x2, x3, ..., xN seja igual a A e que a variância desses mesmos

números seja igual a V. Suponha também que a média dos números (x1)2, (x2)2, (x3)2, ..., (xN)2 seja igual a B.

Mostre que V = B – A2. Em outras palavras, para qualquer conjunto de dados, se calcularmos a média dos valores dos dados ao quadrado e subtrairmos o quadrado da média dos valores, obtemos a variância.

[87] Suponha que o desvio padrão do conjunto de dados (x1, x2, x3, ..., xN) seja igual a σ. Explique por que

o desvio padrão do conjunto de dados (a x1, a x2, a x3, ..., a xN) é igual a a σ, onde a é uma constante

positiva.

[88] Usando que 12 + 22 + 32 + ... + N2 = N (N + 1) (2 N + 1)/6, (a) calcule o desvio padrão do conjunto de dados (1, 2, 3, ..., 98, 99) (dica: use o Exercício [85]), (b) calcule o desvio padrão do conjunto de dados (1, 2, 3, ..., N).

[89] (a) Calcule o desvio padrão do conjunto de dados (315, 316, ..., 412, 413). Dica: use os Exercícios [79] (b) e [88]. (b) Calcule o desvio padrão do conjunto de dados (k + 1, k + 2, ..., k + N).

[90] Teorema de Chebyshev. O matemático russo P. L. Chebyshev (1821-1894) mostrou que para qualquer conjunto de dados e para qualquer constante k maior do que 1, pelo menos 1 – (1/k2) dos dados deve estar entre k desvios padrões em cada lado da média A. Por exemplo, quando k = 2, o teorema nos diz que 1 – 1/4 = 3/4 (isto é, 75%) dos dados deve estar entre dois desvios padrões de cada lado de A (isto é, entre A – 2 σ e

A + 2 σ). (a) Usando o teorema de Chebyshev, qual é a percentagem de dados que deve estar entre três

desvios padrões de cada lado da média? (b) Quantos desvios padrões em cada lado da média devemos considerar a fim de garantir a inclusão de 99% dos dados? (c) Suponha que a média de um conjunto de dados seja igual a A. Explique por que não existe um número k de desvios padrões para o qual podemos ter certeza de que 100% dos dados estão entre k desvios padrões em cada lado da média A.

ATIVIDADE ELETRÔNICA (OBRIGATÓRIA)

[01] Preencha os campos da “Aula 10” da planilha eletrônica “Análise de Livros Didáticos” do Google Drive, informando: (a) A coleção que você analisou define o que é uma moda em Estatística? Em caso afirmativo, qual é a definição dada? (b) A coleção que você analisou discute outliers? Em caso afirmativo, qual é a definição dada? A coleção apresenta exemplos?

Referências

Documentos relacionados

Nota: apresentação dos resultados das escolas que inscreveram 50 ou mais candidatos no VESTIBULAR.. Fonte: Comissão Permanente

O comportamento da estabilidade de cor das resinas compostas foi influenciado pela substância de imersão, e as soluções que tiveram maiores alterações foram o vinho tinto

Assim, a estrutura dúplex é metaestável, sendo obtida na temperatura ambiente após resfriamento que impeça as transformações de fase, particularmente de ferrita em sigma, como

No sentido de reverter tal situação, a realização deste trabalho elaborado na disciplina de Prática enquanto Componente Curricular V (PeCC V), buscou proporcionar as

Os casos não previstos neste regulamento serão resolvidos em primeira instância pela coorde- nação do Prêmio Morena de Criação Publicitária e, em segunda instância, pelo

Embora apresente gastos por aluno (Tabela 5) um pouco acima dos gastos apresentados pela DMU Ariquemes (Tabela 4), os resultados foram mais satisfatórios nas taxas de

No adensamento manual, a primeira camada deve ser atravessada em toda a sua espessura, quando adensada com a haste, evitando-se golpear a base do molde. Os golpes devem

™ Sustentabilidade financeira do projeto medido pelo peso dos novos capitais próprios para financiamento do projeto, sobre as despesas elegíveis.. Aviso