• Nenhum resultado encontrado

ERROS E CONCLUSÕES CORRETAS NO TESTE DE HIPÓTESE

N/A
N/A
Protected

Academic year: 2021

Share "ERROS E CONCLUSÕES CORRETAS NO TESTE DE HIPÓTESE"

Copied!
33
0
0

Texto

(1)

1. O gerente do Danvers-Hilton Resort Hotel estabeleceu que a quantia média gasta pelos hóspedes em um fim de semana é de U$ 400 ou menos. Um membro do corpo de funcionários de contabilidade do hotel notou que as despesas totais para os hóspedes de fim de semana têm aumentado nos últimos meses. O contador usará uma amostra de contas de hóspedes de fim de semana para testar a afirmação do gerente.

(a) Que hipóteses devem ser usadas para testar a afirmação do gerente? Explique: H0: μ ≥ 400 H0: μ ≤ 400 H0: μ = 400

H1: μ < 400 H1: μ > 400 H1: μ ≠ 400 (b) Que conclusão é apropriada quando H0 não pode ser rejeitada? (c) Que conclusão é apropriada quando H0 pode ser rejeitada?

2. O gerente de uma revenda de automóveis está considerando um novo plano de bônus concebido para aumentar o volume de vendas. Atualmente, o volume de vendas é de 14 automóveis por mês. O gerente quer realizar uma pesquisa para ver se o novo plano de bônus aumentará o volume de vendas. Para coletar dados sobre o plano, uma amostra do pessoal de vendas terá permissão de realizar vendas sob o novo plano de bônus por um período de um mês.

(a) Desenvolva as hipóteses nula e alternativa apropriadas para essa pesquisa. (b) Comente a conclusão quando H0 não pode ser rejeitada.

(c) Comente a conclusão quando H0 pode ser rejeitada.

3. Uma operação de linha de produção foi programada para colocar 320 mg de detergente em pó em cada caixa de papelão. Uma amostra de caixas de papelão é periodicamente selecionada e pesada para determinar se está ocorrendo subenchimento ou sobreenchimento. Se os dados da amostra levarem à conclusão de subenchimento ou sobreenchimento, a linha de produção será paralisada e calibrada para se obter o enchimento apropriado das caixas.

(a) Formule as hipóteses nula e alternativa que auxiliarão a decisão de paralisar e calibrar a linha de produção.

(b) Comente a conclusão quando H0 não pode ser rejeitada. (c) Comente a conclusão quando H0 pode ser rejeitada.

ERROS E CONCLUSÕES CORRETAS NO TESTE DE HIPÓTESE

Condição da população

H0 verdadeiro H0 falso Não rejeitar H0 Conclusão Correta Erro do Tipo II

Decisão

Rejeitar H0 Erro do tipo I Conclusão Correta PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL

FACULDADE DE MATEMÁTICA – DEPTº DE ESTATÍSTICA DISCIPLINA: PROBABILIDADE E ESTATISTICA

PROFª VERA CAMPEZATTO 1º SEMESTRE/2007

(2)

NOTAS E COMENTÁRIOS

Muitas aplicações de teste de hipóteses têm um objetivo de tomada de decisão. A conclusão rejeitar H0 fornece o suporte estatístico para concluir que H1 é verdadeiro e tomar a decisão apropriada, seja ela qual for. A declaração “não rejeitar H0 “ embora não conclusiva, freqüentemente força os gerentes a se comportarem como se H0 fosse verdadeiro. Nesse caso, os gerentes precisam estar cientes do fato de que tal comportamento pode resultar num erro do Tipo II.

4. Os americanos gastam uma média de 8,6 minutos por dia lendo jornais (USA Today, 10 de abril de 1995). Um pesquisador acredita que os indivíduos nas posições de gerência gastam mais do que o tempo médio nacional por dia lendo jornais. Uma amostra dos indivíduos em posições de gerenciamento será selecionada pelo pesquisador. Os dados sobre os tempos de leitura dos jornais serão usados para testar as seguintes hipóteses nula e alternativa.

H0: μ ≤ 8,6 H1: μ > 8,6

(a) Qual é o erro do tipo I ? Quais são as conseqüências de se cometer esse erro? (b) Qual é o erro do tipo II ? Quais são as conseqüências de se cometer esse erro?

5. O pessoal de vendas da Carpetland tem tido vendas de US$ 8 000 por semana, em média. Paulo Ferreira, o vice presidente da empresa, propôs um plano de compensação com novos incentivos de vendas. Paulo espera que os resultados de um período de vendas experimental lhe possibilite concluir que o plano de compensação aumenta as vendas médias por vendedor.

(a) Desenvolva as apropriadas hipóteses nula e alternativa. Qual é o erro do tipo I nessa situação? Quais são as conseqüências de se cometer esse erro?

(b) Qual é o erro do tipo II nessa situação? Quais são as conseqüências de se cometer esse erro?

6. Uma linha de produção opera com um peso médio de enchimento de 16 ml por recipiente. O sobre-enchimento e o subenchimento são problemas sérios e a linha de produção deve ser paralisada se qualquer um dos dois ocorrer. De dados passados sabe-se que σ = 0,8 ml. Um inspetor de controle de qualidade amostra 30 itens a cada duas horas e nesse momento toma a decisão de paralisar a linha de produção para calibragem ou não.

(a) Com um nível de significância de 0,05, qual a regra de decisão?

(b) Se uma média de amostra igual a 16,32 ml for encontrada, que atitude você recomendaria?

(c) Se a média amostral obtida for de 15,82 ml, que atitude você recomendaria? (d) Qual é o valor p para os itens (b) e (c)?

(3)

7. Um fabricante de conservas anuncia que o conteúdo líquido das latas de seu produto é, em média, de 2.000 gramas, com desvio padrão de 40 gramas. A fiscalização de pesos e medidas investigou uma amostra aleatória de 64 latas, verificando média de 1.990 gramas. Fixado o nível de significância de 0,05, deverá o fabricante ser multado por efetuar a venda abaixo do especificado? R: zc=-2,00; Rej. H0.

ETAPAS DO TESTE DE HIPÓTESES

Resumo das etapas aplicadas a qualquer teste de hipóteses: I. Determinar as hipóteses nula e alternativa apropriadas. II. Selecionar a estatística de teste que será utilizada. III. Especificar o nível de significância α para o teste.

IV. Usar o nível de significância para estabelecer uma regra de decisão que levará à rejeição ou não de H0.

V. Coletar os dados amostrais e calcular a estatística de teste.

VI. Comparar o valor da estatística do teste com o(s) valor(es) crítico(s) especificado(s) na regra de decisão para determinar se H0 deve ser rejeitado ou não; ou calcular o valor p, baseado na estatística de teste. Comparar o valor p com α, para determinar se H0 deve ser rejeitado ou não.

VII. Concluir, baseado na decisão tomada.

NOTAS E COMENTÁRIOS

O valor p, o nível de significância observado, é uma medida da plausibilidade dos resultados da amostra quando a hipótese nula é assumida como verdadeira. Quanto menor o valor p, menos provável é que os resultados da amostra venham de uma população onde a hipótese nula é verdadeira. A maioria dos softwares estatísticos fornece o valor p associado a um teste de hipóteses. O usuário pode então comparar o valor p ao nível de significância α e tirar conclusão do teste de hipóteses sem se referir a uma tabela estatística.

8. Uma linha de montagem de automóveis opera a um tempo médio de conclusão de 2,2 minutos. Devido ao efeito do tempo de conclusão tanto na operação de montagem precedente como na subseqüente, é importante manter o tempo médio de conclusão em 2,2 minutos. Uma amostra aleatória de 45 montagens mostra um tempo médio de conclusão de 2,39 minutos, com um desvio padrão de 0,20 minutos. Use um nível de significância de 0,02 e teste se a operação está cumprindo seu tempo médio de conclusão de 2,2 minutos. R: tc=6,37; Rej. H0.

9. Admita que, em certa cidade, a variável aplicação em caderneta de população tenha média de 420 unidades monetárias, com desvio padrão de 100 unidades monetárias. Com a atual crise nacional, acredita-se que esta situação tenha se alterado. Para testar tal hipótese, tomou-se uma amostra de 100 depositantes, que acusou uma média de 415 u.m. Usando α=5%, pode-se concluir que houve alteração? R: zc=-0,5; Não rej. H0.

(4)

10. Em média, estima-se que uma dona de casa com marido e duas crianças trabalhe 55 horas ou menos por semana em atividades relacionadas com o lar. As horas trabalhadas durante uma semana para uma amostra de 8 donas de casa são: 58, 52, 64, 63, 59, 62, 62 e 55. Use α = 0,05 para testar H0: μ ≤ 55 H1 : μ > 55. Qual sua conclusão sobre o número médio de horas trabalhadas por semana? O que você pode dizer do p?

One-Sample T: C1 Test of mu = 55 vs mu > 55

Variable N Mean StDev SE Mean C1 8 59.38 4.21 1.49 Variable 95.0% Lower Bound T P C1 56.56 2.94 0.011

11. A floricultura de Jane se especializou em jardinagem com projetos-padrões para as áreas residenciais. O custo de mão de obra associado a um determinada proposta de jardinagem está baseado no número de plantações de árvores, arbustos, etc, a serem usados no projeto. Para propósitos de estimativas de custos, os gerentes usam duas horas como tempo de mão de obra para se plantar uma árvore de tamanho médio e um desvio padrão de 0,5 hora. Os tempos reais de uma amostra de 10 plantações durante o mês passado são apresentados a seguir (tempos em horas).

1,9 1,7 2,8 2,4 2,6 2,5 2,8 3,2 1,6 2,5

Usando α=0,05, teste se o tempo médio de plantações de uma árvore excede 2 horas. Qual é sua conclusão e que recomendações você consideraria fazer aos gerentes? One-Sample Z: C1

Test of mu = 2 vs mu > 2 The assumed sigma = 0,5

Variable N Mean StDev SE Mean 95,0% Lower Bound Z P C1 10 2,400 0,516 0,158 2,140 2,53 0,006

12. Um fabricante de lâmpadas afirma que a duração média de seu produto é de 500 horas. Acreditando que a média seja inferior à anunciada, um comprador selecionou uma amostra de 10 lâmpadas, que acusou média de 490 horas, com desvio padrão de 12 horas. Realize o teste, com α=5%. Suponha população Normal. R: tc=-2,64; Rej. H0. Test of mu = 500 vs < 500

95% Upper

N Mean StDev SE Mean Bound T P 10 490,000 12,000 3,795 496,956 -2,64 0,014

13. Um projeto de investimento está sendo avaliado pelo método pay-back. Uma situação envolvendo cenários futuros forneceu os seguintes tempos de retorno do investimento ( em anos) : 2,8 – 4,3 – 3,7 – 6,4 – 3,2 – 4,1 – 4,4 – 4,6 - 5,2 – 3,9. Teste ao nível de 5%, a hipótese de que a média de retorno seja superior a 4 anos. R. tc=0,8; Não rej Ho.

(5)

One-Sample T: C1 Test of mu = 4 vs mu > 4

Variable N Mean StDev SE Mean 95.0% Lower Bound T P C1 10 4.260 1.018 0.322 3.670 0.81 0.220

14. A Filpis com o objetivo de testar a vida média de suas lâmpadas fluorescentes analisou a durabilidade de 600 lâmpadas, obtendo a seguinte distribuição de freqüências. Acreditando que suas lâmpadas apresentam uma durabilidade superior a 1000 horas, teste esta suposição adotando uma significância de 5% e admitindo a normalidade da população. R. tc = 11,29; Rej. Ho.

Tempo de duração (h) Nº de lâmpadas 400 |⎯⎯ 600 24 600 |⎯⎯ 800 66 800 |⎯⎯ 1000 105 1000 |⎯⎯ 1200 145 1200 |⎯⎯ 1400 129 1400 |⎯⎯ 1600 82 1600 |⎯⎯ 1800 49 Total 600

15. A indústria ABC - S/A, fabricante de um determinado equipamento eletrônico, procedeu a substituição de certo componente importado pelo similar nacional. Um comprador da referida indústria supõe que tal substituição tenha diminuído a duração do produto que antes era anunciada como sendo, em média de 200 horas. Para julgar sua suposição, o comprador testou uma amostra de 10 unidades, verificando média de 197 horas, e desvio-padrão de 6,32 horas. Fixando o nível de significância em 0,05, e sabendo que o tempo de duração é normalmente distribuído, estabeleça a conclusão alcançada pelo comprador. R. t= - 1,51 Não Rej. Ho

16. Uma fábrica de cigarros anuncia que seu produto apresenta um conteúdo médio de nicotina de 26 mg por cigarro, com desvio padrão de 3mg. Um laboratório resolve testar esta afirmação, porque há suspeita que na realidade o conteúdo de nicotina é superior ao mencionado pela indústria. Realiza 6 análises e obtém os seguintes índices de nicotina por cigarro: 27 - 24 - 21 - 25 - 26 - 22. Qual a conclusão obtida, adotando-se um nível de significância de 1%?

One-Sample Z: C1 Test of mu = 26 vs mu > 26 The assumed sigma = 3

Variable N Mean StDev SE Mean C1 6 24.17 2.32 1.22 Variable 99.0% Lower Bound Z P C1 21.32 -1.50 0.933

(6)

17. Certa organização médica afirma que um novo medicamento é de qualidade superior ao até então existente, que é 80% eficaz na cura de determinada doença. Examinada uma amostra de 300 pessoas que sofriam da doença, constatou-se que 249 ficaram curadas com o novo medicamento. Fixado o nível de significância em 5%, teste a afirmação da organização. R. z= 1,304 Não rej. Ho

Test and CI for One Proportion Test of p = 0.8 vs p > 0.8

Exact

Sample X N Sample p 95.0% Lower Bound P-Value 1 249 300 0.830000 0.790257 0.108

18. Um consumidor de certo produto denunciou seu fabricante afirmando que este coloca no mercado uma quantidade de unidades defeituosas que supera 20% da quantidade total. Uma investigação foi conduzida com uma amostra aleatória de 50 unidades, das quais 28% acusaram defeito. Você diria que a investigação fundamenta a denuncia? Use 10% de significância. R. z = 1,41 Rej. Ho

19. Os produtores de um programa de televisão acham que devem modificá-lo caso sua assistência regular seja inferior a um quarto dos possuidores de aparelhos de TV. Uma pesquisa foi feita em 400 domicílios, selecionados aleatoriamente, mostrando que em 80 o programa era assistido regularmente. Qual deve ser a decisão dos produtores, com 3% de significância? R. z = - 2,301 Rej. Ho

20. Uma agência de viagens tem um tradicional plano de férias que é oferecido a todos os possíveis clientes que procuram a agência. O índice de respostas positivas é historicamente 20%. Este ano, uma amostra aleatória de 50 potenciais clientes mostrou que 15 adquiriam o plano de férias. Teste ao nível de 6% a hipótese de que o percentual de respostas positivas tenha aumentado este ano. R. z=1.77 Rej. Ho

21. Um banco de investimento calcula que 20% dos empréstimos são concedidos a pequenas empresas. Com a finalidade de aumentar esta percentagem, o governo resolveu subsidiar os juros para este tipo de empresa. Após algum tempo de vigência desta política, o banco amostrou ao acaso 40 projetos de financiamento e verificou que 12 deles se destinavam a pequenas empresas. Teste ao nível de 1% a hipótese de que a política tenha sido bem sucedida. R: 1,58; Não rej. Ho

Test and CI for One Proportion

Test of p = 0,2 vs p > 0,2

99%

Lower Exact Sample X N Sample p Bound P-Value 1 12 40 0,300000 0,146552 0,088

(7)

22. Um fabricante produz dois tipos de pneus: A, cuja duração apresenta um desvio-padrão de 2.500 milhas, e B, que apresenta um desvio-padrão de 3.000 milhas. Um táxi testou 50 pneus do tipo A, obtendo duração média de 24.000 milhas, e 40 pneus do tipo B, obtendo duração média de 26.000 milhas. Testar, ao nível de 5% de significância, se existe diferença na duração média dos pneus. Admita populações normais. R. Z=-3,38; Rej. Ho

23. Uma amostra de 100 lâmpadas elétricas produzidas pela fábrica A indica uma vida média

de 1190 horas, com desvio padrão de 90 horas. Uma amostra de 75 lâmpadas produzidas pela fábrica B indica uma vida média de 1230 horas, com desvio padrão de 120 h. Admitindo que as variâncias populacionais sejam equivalentes, podemos concluir que a duração média das lâmpadas da marca B supera em mais de 50 horas a duração média das lâmpadas da marca A, com α=5%?

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean 1 75 1230 120 14 2 100 1190,0 90,0 9,0

Difference = mu (1) - mu (2) Estimate for difference: 40,0000

95% lower bound for difference: 13,7545

T-Test of difference = 50 (vs >): T-Value = -0,63 P-Value = 0,735 DF = 173 Both use Pooled StDev = 103,8980

24. Uma operação de montagem em um processo de fabricação requer cerca de um mês de treino para que um empregado novo possa atingir o nível desejado de eficiência máxima. Sugeriu-se um novo método de treinamento e um teste foi realizado, visando comparar os dois métodos. Sabe-se, por experiência anterior, que as variâncias populacionais, referente à eficiência dos métodos antigo e novo são, respectivamente, 21,2 e 20,2. Dois grupos de novos empregados foram treinados durante três semanas, segundo cada método. O tempo necessário, em minutos, para que cada novo empregado conseguisse montar as peças de um dispositivo, foi anotado e está expresso logo abaixo. Verifique se o método novo é mais eficiente que o antigo, com α=5%.

Mét.Antigo 35 37 28 41 44 35 31 34 32 Mét.Novo 37 29 25 34 40 27 32 31 35 Teste-z: duas amostras para médias

Variável 1 Variável 2 Média 35,22222 32,22222 Variância conhecida 21,2 20,2

Observações 9 9

Hipótese da dif. de média 0

z 1,398757

P(Z<=z) uni-caudal 0,080943 z crítico uni-caudal 1,644853

(8)

P(Z<=z) bi-caudal 0,161886 z crítico bi-caudal 1,959961

25. Uma operação de montagem em um processo de fabricação requer cerca de um mês de treino para que um empregado novo possa atingir o nível desejado de eficiência máxima. Sugeriu-se um novo método de treinamento e um teste foi realizado, visando comparar o método antigo com o novo. Dois grupos de novos empregados foram treinados durante três semanas, segundo o método novo e o antigo, respectivamente. O tempo necessário, em minutos, para que cada novo empregado conseguisse montar as peças de um dispositivo, foi anotado e corresponde aos tempos do exercício anterior.

(a) Será que estes dados permitem suficiente evidência, ao nível de 5%, de que a média de rendimento do novo processo de três semanas é melhor (exige menos tempo) do que o método antigo, que levava um mês ? Quais as suposições que devem ser feitas? (b) Por que neste caso seria inconveniente usar o teste para dados emparelhados?

Teste-t: duas amostras em par para médias Teste-F: duas amostras para variâncias Variável 1 Variável 2

Média 35.222222 32.222222 Variável 1 Variável 2

Variância 24.444444 23.194444 Média 35.222222 32.222222 Observações 9 9 Variância 24.444444 23.194444 Corr. de Pearson 0.7063657 Observações 9 9

Hipótese da dif. de média 0 gl 8 8

gl 8 F 1.0538922

Stat t 2.4053512 P(F<=f) uni-caudal 0.4713208 P(T<=t) uni-caudal 0.0214088 F crítico uni-caudal 3.4381031 t crítico uni-caudal 1.8595483

P(T<=t) bi-caudal 0.0428177 t crítico bi-caudal 2.3060056

Teste-t: duas amostras presumindo variâncias equivalentes Teste-t: duas amostras presumindo variâncias diferentes

Variável 1 Variável 2 Variável 1 Variável 2

Média 35.222222 32.222222 Média 35.222222 32.222222 Variância 24.444444 23.194444 Variância 24.444444 23.194444

Observações 9 9 Observações 9 9

Variância agrupada 23.819444 Hipótese da dif. de média 0

Hipótese da dif. de média 0 gl 16

gl 16 Stat t 1.3039523

Stat t 1.3039523 P(T<=t) uni-caudal 0.1053494 P(T<=t) uni-caudal 0.1053494 t crítico uni-caudal 1.7458842 t crítico uni-caudal 1.7458842 P(T<=t) bi-caudal 0.2106988 P(T<=t) bi-caudal 0.2106988 t crítico bi-caudal 2.1199048 t crítico bi-caudal 2.1199048

(9)

26. Uma amostra de 100 lâmpadas da marca A acusou uma vida média de 1.190 horas, e desvio-padrão de 90 horas. Uma amostra de 75 lâmpadas da marca B acusou uma vida média de 1.230 horas e desvio-padrão de 120 horas. Fixando α=0,05, pode-se admitir que a vida média B é superior à vida média de A? Admita populações normais e variâncias populações desconhecidas mas supostamente iguais. R. t = - 2,52 Rej. Ho

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean 1 100 1190,0 90,0 9,0 2 75 1230 120 14

Difference = mu (1) - mu (2) Estimate for difference: -40,0000

95% upper bound for difference: -13,7545

T-Test of difference = 0 (vs <): T-Value = -2,52 P-Value = 0,006 DF = 173

27. Uma amostra casual de 30 crianças do pré-primário montou um quebra-cabeças, gastando um tempo médio de 3,2 minutos, com desvio padrão de 30 segundos. Outras 30 crianças, também tomadas aleatoriamente, tendo a mesma situação escolar, fizeram a mesma tarefa, depois de assistir um filme de curta metragem sobre a resolução de quebra-cabeças. Gastaram, em média, 2,8 minutos, com desvio padrão de 30 segundos. O filme causa rapidez na execução da tarefa? Use α=1%. Admita populações normais com variâncias populacionais desconhecidas, equivalentes. R: 3,098, Rej. Ho

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean 1 30 3,200 0,500 0,091 2 30 2,800 0,500 0,091

Difference = mu (1) - mu (2) Estimate for difference: 0,400000

99% lower bound for difference: 0,091145

T-Test of difference = 0 (vs >): T-Value = 3,10 P-Value = 0,001 DF = 58 Both use Pooled StDev = 0,5000

28. Deseja-se determinar se há menor variabilidade no revestimento a ouro feito pela companhia 1 do que no revestimento feito pela companhia 2. Se as amostras independentes acusaram s12 = 0,001089 ( com base em n1 = 20 ) e s22 = 0,003721 ( com base em n2 = 18), teste hipótese nula que as variâncias populacionais são iguais contra a alternativa que são diferentes. R. F = 3,42 Rej. Ho

Considerando S2/S2 > 1 Test for Equal Variances

95% Bonferroni confidence intervals for standard deviations

Sample N Lower StDev Upper 1 18 0,0440201 0,061 0,0974310 2 20 0,0241768 0,033 0,0511268

F-Test (normal distribution)

(10)

Alterando a ordem do quociente das variâncias:

Test for Equal Variances

95% Bonferroni confidence intervals for standard deviations

Sample N Lower StDev Upper 1 20 0,0241768 0,033 0,0511268 2 18 0,0440201 0,061 0,0974310

F-Test (normal distribution)

Test statistic = 0,29; p-value = 0,011

29. As forças em libras, necessárias para romper a adesão de dois tipos de cola são dadas abaixo. Embora as duas marcas de cola sejam bastante semelhantes, paira alguma dúvida sobre se realmente

σ

12 =

σ

22. Ao nível de significância de 5%, teste a hipótese nula de que as variâncias das populações correspondentes são iguais.

Cola 1 25.3 19.2 21.1 27.6 16.9 30.1 17.8 22.9 27.2 18.2 Cola 2 26.9 22.5 21.8 23.6 19.8 21.6 18.7 22.2

25,3 26,9 Teste-F: duas amostras para variâncias 19,2 22,5 21,1 21,8 Variável 1 Variável 2 27,6 23,6 Média 22,63 22,1375 16,9 19,8 Variância 22,05344 6,09125 30,1 21,6 Observações 10 8 17,8 18,7 gl 9 7 22,9 22,2 F 3,620512 27,2 P(F<=f) uni-caudal 0,051913 18,2 F crítico uni-caudal 3,676675

Test for Equal Variances: C1; C2

95% Bonferroni confidence intervals for standard deviations

N Lower StDev Upper C1 10 3,07183 4,69611 9,45634 C2 8 1,54404 2,46805 5,65302

F-Test (normal distribution)

Test statistic = 3,62; p-value = 0,104

30. Uma fábrica de pneumáticos fez um estudo comparativo entre motoristas homens e mulheres com respeito a durabilidade dos pneumáticos por ela fabricados. Teste, usando um nível de significância de 5% e diga a conclusão que o fabricante pode tirar com base nos resultados ( em Km rodado) apresentados a seguir. Em quais as suposições que você se baseou?

(11)

Motorista homem Motorista mulher 20200 27400 23400 32400 22600 30100 27600 32200 16100 30600 21000 28900 26300 29300 22500 24900 18000 27800 19100 34500 23200 23700

Teste-F: duas amostras para variâncias Teste-t: duas amostras presumindo variâncias equivalentes

Variável 1 Variável 2 Variável 1 Variável 2

Média 21975 29810 Média 21975 29810

Variância 10927500 7796556 Variância 10927500 7796556

Observações 12 10 Observações 12 10

gl 11 9 Variância agrupada 9518575 F 1,40158 Hipótese da dif. de média 0

P(F<=f) uni-caudal 0,311187 gl 20

F crítico uni-caudal 3,102485 Stat t -5,93106 P(T<=t) uni-caudal 4,21E-06 t crítico uni-caudal 1,724718 P(T<=t) bi-caudal 8,43E-06 t crítico bi-caudal 2,085962 Teste-t: duas amostras presumindo variâncias

diferentes variâncias diferentes Variável 1 Variável 2 Média 21975 29810 Variância 10927500 7796555,556 Observações 12 10 Hipótese da diferença de média 0 gl 20 Stat t -6,02642 P(T<=t) uni-caudal 3,42E-06 t crítico uni-caudal 1,724718 P(T<=t) bi-caudal 6,84E-06 t crítico bi-caudal 2,085962

31. Uma companhia distribuidora tem por hipótese que uma chamada telefônica é mais eficiente que uma carta para acelerar s cobrança de contas atrasadas. Esta companhia fez uma experiência usando duas amostras e obteve os resultados da tabela abaixo. Analisando os resultados e sabendo-se que as variâncias populacionais são 4,6 e 4,1 respectivamente no que se refere ao número de dias de pagamento por carta e por

(12)

chamada telefônica, dê uma sugestão a respeito da tomada de decisão mais viável para a companhia, baseado nos resultados dos testes elaborados via Excel que se encontram abaixo. Justifique o teste utilizado baseado nas suposições que foram feitas. Adote α =5%.(Não esqueça de elaborar as hipóteses estatísticas)

Método utilizado Nº de dias até o pagamento

Carta 10 8 9 11 11 14 10

Chamada telefônica 7 4 5 4 8 6 9

Teste-F: duas amostras para variâncias

10 7 Variável 1 Variável 2 8 4 Média 10,42857 6,142857 9 5 Variância 3,619048 3,809524 11 4 Observações 7 7 11 8 gl 6 6 14 6 F 0,95 10 9 P(F<=f) uni-caudal 0,475972 F crítico uni-caudal 0,233435

Teste-t: duas amostras em par para médias Teste-t: duas amostras presumindo variâncias equivalentes

Variável 1 Variável 2 Variável 1 Variável 2

Média 10,42857 6,142857 Média 10,42857 6,142857 Variância 3,619048 3,809524 Variância 3,619048 3,809524

Observações 7 7 Observações 7 7

Correlação de Pearson 0,205196 Variância agrupada 3,714286 Hipótese da dif. de média 0 Hipótese da dif. de média 0

gl 6 gl 12

Stat t 4,666283 Stat t 4,160251

P(T<=t) uni-caudal 0,001722 P(T<=t) uni-caudal 0,000661 t crítico uni-caudal 1,943181 t crítico uni-caudal 1,782287 P(T<=t) bi-caudal 0,003445 P(T<=t) bi-caudal 0,001322 t crítico bi-caudal 2,446914 t crítico bi-caudal 2,178813 Teste-t: duas amostras presumindo variâncias diferentes Teste-z: duas amostras para médias

Variável 1 Variável 2 Variável 1 Variável 2

Média 10,42857 6,142857 Média 10,42857 6,142857 Variância 3,619048 3,809524 Variância conhecida 4,6 4,1

Observações 7 7 Observações 7 7

Hipótese da dif. de média 0 Hipótese da dif. de média 0

gl 12 z 3,844259

Stat t 4,160251 P(Z<=z) uni-caudal 6,05E-05 P(T<=t) uni-caudal 0,000661 z crítico uni-caudal 1,644853 t crítico uni-caudal 1,782287 P(Z<=z) bi-caudal 0,000121 P(T<=t) bi-caudal 0,001322 z crítico bi-caudal 1,959961 t crítico bi-caudal 2,178813

32. Para verificar a eficiência de um cartaz na estimulação à compra de determinado produto 7 pares de lojas foram formados, cada par tendo as mesmas características quanto à localização, ao tamanho e ao volume geral das vendas. Isso feito, o cartaz foi colocado numa das lojas do par, não o sendo em sua correspondente, tendo o processo sido repetido para os 7 pares. Abaixo aparecem as vendas semanais do produto durante

(13)

a experimentação, expressas em média de observação conduzida por dois meses. Analise os dados e conclua, a 5%, sobre o potencial do cartaz na indução à compra do produto. Admita normalidade. R. t = 3,59 Rej. Ho

Par 1 2 3 4 5 6 7

Com cartaz 16 24 18 14 26 17 29 Sem cartaz 13 18 14 16 19 12 22

Teste-t: duas amostras em par para médias

Variável 1 Variável 2 Média 20,57143 16,28571 Variância 32,61905 12,90476

Observações 7 7

Hipótese da diferença de média 0 gl 6 Stat t 3,602883 P(T<=t) uni-caudal 0,005664 t crítico uni-caudal 1,943181 P(T<=t) bi-caudal 0,011327 t crítico bi-caudal 2,446914

33. A distribuição abaixo representa os batimentos cardíacos de oito estudantes, escolhidos ao acaso, antes e após esforço físico programado. Teste, ao nível de significância de 5%, a probabilidade desta alteração de freqüência ocorrer ao acaso.

Antes 80 76 84 72 68 76 64 88 Depois 88 96 100 92 88 92 80 104

80 88 Teste-t: duas amostras em par para médias

76 96 Variável 1 Variável 2

84 100 Média 76 92,5

72 92 Variância 64 56,85714

68 88 Observações 8 8

76 92 Correlação de Pearson 0,8715 64 80 Hipótese da diferença de média 0

88 104 gl 7 Stat t -11,7729 P(T<=t) uni-caudal 3,61E-06 t crítico uni-caudal 1,894578 P(T<=t) bi-caudal 7,23E-06 t crítico bi-caudal 2,364623

34. Um engarrafador de vinho tem duas máquinas funcionando e necessita que a quantidade média de vinho por garrafa que sai da máquina A seja maior do que a da máquina B .Para verificar se realmente isto está ocorrendo colheu duas amostra de 5 garrafas, uma de cada máquina e mediu a quantidade de vinho . Os resultados encontram-se na tabela abaixo. Utilizando os resultados dos testes elaborados via Excel que se encontram

(14)

abaixo, decida qual a conclusão do engarrafador utilizando um nível de significäncia de 5% Justifique o teste utilizado baseado nas suposições que foram feitas.

Máquina A 990 995 998 1 004 1 000 Máquina B 975 990 1 002 980 985

Teste-F: duas amostras para variâncias

A B Variável 1 Variável 2 990 975 Média 997.4 986.4 995 990 Variância 27.8 107.3 998 1002 Observações 5 5 1004 980 gl 4 4 1000 985 F 0.259087 P(F<=f) uni-caudal 0.109602 F crítico uni-caudal 0.156538 Teste-t: duas amostras presumindo variâncias equivalentes

Variável 1 Variável 2 Teste-t: duas amostras presumindo variâncias diferentes Média 997.4 986.4 Variável 1 Variável 2

Variância 27.8 107.3 Média 997.4 986.4

Observações 5 5 Variância 27.8 107.3

Variância agrupada 67.55 Observações 5 5

Hipótese da dif. de média 0 Hipótese da dif. de média 0

gl 8 gl 6

Stat t 2.116167 Stat t 2.116167 P(T<=t) uni-caudal 0.033613 P(T<=t) uni-caudal 0.03935 t crítico uni-caudal 1.859548 t crítico uni-caudal 1.943181 P(T<=t) bi-caudal 0.067225 P(T<=t) bi-caudal 0.078699 t crítico bi-caudal 2.306006 t crítico bi-caudal 2.446914 Teste-t: duas amostras em par para médias Teste-z: duas amostras para médias

Variável 1 Variável 2 Variável 1 Variável 2

Média 997.4 986.4 Média 997.4 986.4

Variância 27.8 107.3 Variância conhecida 27.8 107.3

Observações 5 5 Observações 5 5

Correlação de Pearson 0.179434 Hipótese da dif. de média 0

Hipótese da dif. de média 0 z 2.116167

gl 4 P(Z<=z) uni-caudal 0.017165 Stat t 2.288689 z crítico uni-caudal 1.644853 P(T<=t) uni-caudal 0.041989 P(Z<=z) bi-caudal 0.03433 t crítico uni-caudal 2.131846 z crítico bi-caudal 1.959961 P(T<=t) bi-caudal 0.083978

t crítico bi-caudal 2.776451

35. Duas empresas de setores diferentes apresentam historicamente variação salarial de 10 u. m. e 8 u. m., respectivamente, como desvios-padrão. Devido a antecipações salariais concedidas espontaneamente pelas empresas, os salários variam independentemente, mas acredita-se que a diferença das médias salariais destas empresas não ocorra. Verifique se está expectativa é correta ao nível de significância

(15)

de 5%, se amostras de 30 elementos de cada empresa, forneceram respectivamente os salários conforme tabela abaixo:

Salários da Empresa A (u.m.) Salários da Empresa B (u.m.)

93 78 90 96 88 75 93 86 90 81 101 91 89 81 78 82 80 103 91 96 76 106 84 78 103 82 88 98 99 85 94 106 80 73 99 97 85 92 90 88 87 86 83 87 86 81 69 87 91 89 75 90 85 109 77 82 92 101 91 95

Teste-z: duas amostras para médias

Variável 1 Variável 2

Média 87,56667 89,36667 Variância conhecida 100 64

Observações 30 30

Hipótese da diferença de média 0 z -0,76986 P(Z<=z) uni-caudal 0,220692 z crítico uni-caudal 1,644853 P(Z<=z) bi-caudal 0,441383 z crítico bi-caudal 1,959961

36. As amostras aleatórias seguintes, são medidas da capacidade de gerar calor (em milhões de calorias por tonelada) de amostras de carvão de duas minas. Ao nível de 5% de significância, teste se a diferença entre as médias das duas populações é significativa? Quais as suposições que você fez? Justifique-as.

(16)

Mina 2 7.510 7.690 7.720 8.070 7.660 Baseado nos resultados dos testes elaborados via Excel que se encontram abaixo. Justifique o teste utilizado baseado nas suposições que foram feitas. Adote α =5%.(Não esqueça de elaborar as hipóteses estatísticas)

Teste-F: duas amostras para variâncias Teste-t: duas amostras presumindo variâncias diferentes

Variável 1 Variável 2 Variável 1 Variável 2

Média 8360 7730 Média 8360 7730

Variância 383450 42650 Variância 383450 42650

Observações 5 5 Observações 5 5

gl 4 4 Hipótese da diferença de média 0

F 8,990621 gl 5

P(F<=f) uni-caudal 0,028051 Stat t 2,158091 F crítico uni-cauda 6,388234 P(T<=t) uni-caudal 0,041694 t crítico uni-caudal 2,015049 P(T<=t) bi-caudal 0,083388 t crítico bi-caudal 2,570578

Teste-t: duas amostras presumindo variâncias equivalentes

Variável 1 Variável 2

Média 8360 7730

Variância 383450 42650

Observações 5 5

Variância agrupada 213050 Hipótese da diferença de média 0 gl 8 Stat t 2,158091 P(T<=t) uni-caudal 0,031488 t crítico uni-caudal 1,859548 P(T<=t) bi-caudal 0,062976 t crítico bi-caudal 2,306006

37. Perguntou-se a 100 eleitores paulistas e a 100 eleitores gaúchos se votariam no candidato Sr. HONESTO caso ele fosse candidato à presidência nas próximas eleições. Enquanto 40 paulistas confirmaram seu apoio ao Sr. HONESTO , apenas 30 gaúchos mostraram simpatia pôr ele. Pode-se afirmar que o apoio paulista é muito mais significativo do que o gaúcho? Use α = 0,01.

Test and CI for Two Proportions Sample X N Sample p

1 40 100 0.400000 2 30 100 0.300000 Estimate for p(1) - p(2): 0.1

99% lower bound for p(1) - p(2): -0.0560562

(17)

38. Para direcionar a propaganda de um produto, uma agência consultou 80 homens selecionados ao acaso e verificou que 28 haviam comprado o produto. Uma amostra casual de 100 mulheres mostrou que 40 haviam comprado o produto. Teste, α=5%, se não há diferença entre a proporção de homens e de mulheres que adquiriram o produto. Test and CI for Two Proportions

Sample X N Sample p 1 28 80 0,350000 2 40 100 0,400000 Estimate for p(1) - p(2): -0,05

95% CI for p(1) - p(2): (-0,191928; 0,0919283)

Test for p(1) - p(2) = 0 (vs not = 0): Z = -0,69 P-Value = 0,492

39. Para verificar se o uso do cigarro aumenta a incidência de doenças pulmonares, foram selecionados ao acaso 150 indivíduos fumantes e verificou-se que 24 apresentaram algum tipo de doença pulmonar, em um período de 5 anos. Outro grupo, de 180 não fumantes selecionados ao acaso, apresentou, no mesmo período, 12 com algum tipo de doença pulmonar. Teste, ao nível de 5%.

Test and CI for Two Proportions Sample X N Sample p 1 24 150 0,160000 2 12 180 0,066667

Estimate for p(1) - p(2): 0,0933333 95% lower bound for p(1) - p(2): 0,0353729

Test for p(1) - p(2) = 0 (vs > 0): Z = 2,71 P-Value = 0,003

40. Um assessor de um candidato a governador afirma que a proporção de votos favoráveis no interior do Estado é maior que na capital com o objetivo de direcionar melhor sua campanha pela televisão, o candidato encomendou uma pesquisa na capital e outra no interior do Estado, obtendo os dados da tabela abaixo. Teste a afirmação, com α=0,05.

Número de entrevistados Número de votos favoráveis

Capital 100 40

Interior 200 90

Test and CI for Two Proportions Sample X N Sample p 1 40 100 0,400000 2 90 200 0,450000 Estimate for p(1) - p(2): -0,05

95% upper bound for p(1) - p(2): 0,0492039

Test for p(1) - p(2) = 0 (vs < 0): Z = -0,83 P-Value = 0,204

41. Um partido afirma que a porcentagem de votos masculinos a seu favor será de 10% a mais do que a porcentagem de votos femininos. Numa pesquisa feita entre 400 homens, 170 votariam no partido, enquanto que, entre 625 mulheres, 194 lhe seriam favoráveis. A afirmação do partido é aceitável ou não, com α=5%. R: 0,48; Não rej. Ho.

(18)

42. A tabela abaixo fornece o número de estudantes aprovados e reprovados em um exame aplicado a duas turmas. Usando 5% de significância, pode-se afirmar que existe associação entre a aprovação e a turma a que o aluno pertence?

Aprovados Reprovados

Turma A 72 17

Turma B 64 23

Chi-Square Test

Expected counts are printed below observed counts C1 C2 Total 1 72 17 89 68,77 20,23 2 64 23 87 67,23 19,77 Total 136 40 176 Chi-Sq = 0,151 + 0,515 + 0,155 + 0,527 = 1,348 DF = 1, P-Value = 0,246

43. A fim de analisar a aceitação de um programa de televisão, 250 telespectadores foram entrevistados em cada uma de quatro cidades, apresentado os dados a seguir. Com 5% de significância, pode-se concluir que a opinião depende da cidade?

Cidade A Cidade B Cidade C Cidade D

Favorável 120 125 85 90

Desfavorável 130 125 165 160 Chi-Square Test

Expected counts are printed below observed counts C1 C2 C3 C4 Total 1 120 125 85 90 420 105,00 105,00 105,00 105,00 2 130 125 165 160 580 145,00 145,00 145,00 145,00 Total 250 250 250 250 1000 Chi-Sq = 2,143 + 3,810 + 3,810 + 2,143 + 1,552 + 2,759 + 2,759 + 1,552 = 20,525 DF = 3, P-Value = 0,000

44. Uma pesquisa foi feita entre 150 universitários de Engenharia, com o objetivo de verificar se existe associação entre as especializações oferecidas pela universidade (Engenharia Mecânica, Elétrica e Civil) e a opinião dos alunos referente à importância de certa disciplina. Usando dados a seguir, verifique se é possível concluir que haja relacionamento entre a especialidade e a opinião, com 5% de significância.

Mecânica Elétrica Civil

Muito importante 30 25 35

(19)

Chi-Square Test

Expected counts are printed below observed counts C1 C2 C3 Total 1 30 25 35 90 36,00 24,00 30,00 2 30 15 15 60 24,00 16,00 20,00 Total 60 40 50 150 Chi-Sq = 1,000 + 0,042 + 0,833 + 1,500 + 0,062 + 1,250 = 4,687 DF = 2, P-Value = 0,096 CORRELAÇÃO E REGRESSÃO

45. Um agricultor plantou um pé de feijão no quintal de sua casa, anotando semanalmente sua altura.

Idade (sem) 1 2 3 4 5 6 7 8 9

Altura ( cm) 5 12 16 22 34 38 41 45 50

(a) Determine o coeficiente de correlação linear de Pearson e interprete o resultado; (b) Faça os testes de significância, ao nível de 5%, a correlação e a regressão.

(c) Obtido resultado significativo em b),determine a equação da reta de regressão que define o crescimento do pé de feijão;

(d) a época em que o dito pé de feijão terá 60 cm de altura; R. 10,35266 (e) a altura que o pé de feijão tinha com 3,5 semanas de vida. R. 20,5972

RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.988651 R-Quadrado 0.9774307 Erro padrão 2.5580561

Observações 9

Coeficientes Erro padrão Stat t valor-P Inferior 95.0% Superior 95.0% Interseção 0.4722222 1.8583846 0.2541036 0.806718 -3.922156 4.8666005 Variável X 1 5.75 0.3302436 17.411389 5.071E-07 4.9690985 6.5309015 Altura do pé de feijão y = 5.75x + 0.4722 R2 = 0.9774 0 10 20 30 40 50 60 0 2 4 6 8 10 Idade (sem ) Altura (cm )

(20)

20 46. A tabela a seguir apresenta o tempo médio de treino de um grupo de atletas e os

respectivos pontos num teste de aptidão física.

Atleta A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11

Tempo 5 3 4 1 6 8 10 9 7 2 11 Pontos 30 25 27 15 38 45 51 47 41 19 55

(a) Represente estes dados graficamente.

(b) Calcule o coeficiente de correlação linear de Pearson e interprete o resultado;

(c) Determine a equação que permita estimar o número de pontos em função do tempo de treino.

(d) Se julgar significativo, encontre o número de pontos para um atleta que não treine e para um que treine 8 h.

(e) Faça os testes de significância, ao nível de 5%, para a correlação e regressão.

(f) Verifique se podemos eliminar a possibilidade da reta teórica passar pela origem (Ho:α=0), ao nível de significância de 5%.

Tempo(X) Pontos(Y) RESUMO DOS RESULTADOS

5 30 3 25 Estatística de regressão 4 27 R múltiplo 0,995457 1 15 R-Quadrado 0,990935 6 38 R-quadrado ajustado 0,989928 8 45 Erro padrão 1,340511 10 51 Observações 11 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 11,67273 0,866868 13,4654 2,87E-07 9,711734 13,63372

Variável X 1 4,009091 0,127813 31,36692 1,67E-10 3,719958 4,298224

47. Os dados abaixo relacionam as vendas e os lucros da Brazil’s Ghost (milhões de dólares).

Ano 83 84 85 86 87 88 89 90 91 92 93 94

Vendas 24,6 27,6 37,4 46,6 68,6 73,5 83,9 73,2 90,0 88,7 91,9 98,3 Lucros 1,8 2,2 3,0 3,5 5,1 5,5 6,8 5,5 7,0 6,5 7,0 8,0 (a) Represente estes pontos num diagrama de dispersão.

(b) Encontre o coeficiente de correlação entre Vendas e Lucros. R: 0,994412

(c) Determine uma reta de regressão pelo método dos mínimos quadrados para fazer o ajustamento destes pontos.

(d) Ache o coeficiente de determinação.

(e) Faça os testes de significância, ao nível de 5%, para a correlação e a regressão.

(f) Teste se a reta de regressão passa pela origem, utilizando os resultados encontrados no Excel. Exercício 3 y = 0.0782x - 0.0809 R2 = 0.9889 y = 0.0002x2 + 0.0536x + 0.5257 R2 = 0.991 2.00 4.00 6.00 8.00 10.00 Lucr o Te m po de tr e ino x pontos no te s te y = 4 .0 0 9 1 x + 1 1 .6 7 3 R2 = 0 .9 9 0 9 0 2 0 4 0 6 0 0 5 1 0 1 5 T e m p o (h o r as d iár ias ) Nº de pontos obtidos

(21)

RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.9944124 R-Quadrado 0.9888561 Erro padrão 0.22893 Observações 12 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção -0.0809212 0.1878882 -0.4306882 0.6758303 -0.4995623 0.3377198 Variável X 1 0.0781687 0.0026241 29.788425 4.249E-11 0.0723217 0.0840156

48. Os comerciantes da “Boca” costumam ser consultados, por telefone, por clientes interessados na venda ou troca de seus veículos. Cansados de informar simplesmente que o preço só podia ser definido vistoriando o veículo, decidiram que ao menos uma estimativa devia ser dada. Por exemplo, com base na quilometragem do veículo no momento da consulta. Para tanto, tabularam a quilometragem (em 1000 km) e os preços de venda (em $1000) de 13 unidades diferentes. Obtiveram os seguintes valores:

Km 35 10 25 50 30 15 70 40 55 20 45 65 60 Preço 5,0 7,1 5,9 3,7 5,7 6,7 2,3 4,4 3,6 6,5 4,3 2,8 3,0 (a) Represente graficamente estes pontos.

(b) Calcule o coeficiente de correlação linear de Pearson.

(c) Ajuste os dados através de uma reta de mínimos quadrados. ( modelo linear ). (d) Ajuste os dados através de uma parábola ( modelo quadrático).

(e) Determine o coeficiente de explicação para a reta. (f) Determine o coeficiente de explicação para a parábola. (g) Qual é o melhor modelo ajustante, neste caso?

RESUMO DOS RESULTADOS

Estatística de regressão Coeficientes Erro padrão Stat t valor-P Inferior

95.0% Superior 95.0% R múltiplo 0.9959822 Interseção 7.9406593 0.0972176 81.679231 1.154E-16 7.7266847 8.154634 R-Quadrado 0.9919805 Variável X 1 -0.0812088 0.0022015 -36.887178 7.009E-13 -0.0860544 -0.0763632 Erro padrão 0.1485023

Preço de acordo com a quilom etragem

y = -0.0812x + 7.9407 R2 = 0.992 y = 0.0001x2 - 0.0913x + 8.098 R2 = 0.9926 0 1 2 3 4 5 6 7 8 0 20 40 60 80 Quilom etragem (km ) Preço ($1.000)

(22)

Observações 13

49. A administração de um banco desejava estabelecer um critério objetivo para avaliar a eficiência de seus gerentes. Para isso, levantou para cada um dos subdistritos onde possui agência , dados a respeito do depósito médio mensal ( em 1.000 dólares ) por agência , e o número de estabelecimentos comerciais existentes nesses subdistritos, obtendo os seguintes dados:

Subdistritos

A B C D E F G H

Número 16 30 35 70 80 90 120 160

Depósito 14 16 19 30 35 31 33 35

(a) calcule o coeficiente de correlação linear e o coeficiente de explicação; (b) ajuste uma reta de mínimos quadrados;

(c) ajuste uma parábola de mínimos quadrados e determine r2.

(d) faça os testes de significância, ao nível de 1%, para a correlação e a regressão.

Nº Estab. Depósito 16 14 30 16 35 19 70 30 80 35 90 31 120 33 160 35 RESUMO DOS RESULTADOS

Estatística de regressão R múltiplo 0.8718843 R-Quadrado 0.7601822 Erro padrão 4.6538744

Observações 8

Coeficientes Erro padrão Stat t valor-P Inferior 95.0% Superior 95.0% Interseção 14.801792 3.1713164 4.6673967 0.0034407 7.0418544 22.561729 Variável X 1 0.1573805 0.0360875 4.3610769 0.0047649 0.0690774 0.2456835

50. A tabela abaixo mostra o volume de vendas ( em 1000 unidades) e os gastos promocionais (em R$ 100.000,00 )

Vendas 80 90 95 95 100 110 115 110 120 130 Promoção 2 4 5 6 8 10 10 12 12 15 (a) Represente graficamente estes pontos;

(b) Calcule o coeficiente de correlação de Pearson. Interprete o resultado.

(c) Você acha conveniente estimar a reta de regressão, baseado no resultado obtido anteriormente? Por que?

(d) Determine os coeficientes da reta de regressão e interprete-os.

(e) Para gastos promocionais de R$ 1.300.000,00 qual o provável volume de vendas? Exercício 5 y = 0.1574x + 14.802 R2 = 0.7602 y = -0.0017x2 + 0.4514x + 6.0058 R2 = 0.9426 0 10 20 30 40 50 0 50 100 150 200 Nº de estabelecimentos Depósito

(23)

(f) Para vendas de 98.000 unidades qual os gastos promocionais que devem ser feitos? (g) Poderíamos, utilizando este modelo de regressão efetuar uma previsão de gastos

promocionais para uma provável venda de 200 000 unidades? Explique sua resposta.

RESUMO DOS RESULTADOS

Estatística de regressão Coeficientes Erro padrão Stat t valor-P Inf. 95.0% Sup. 95.0% R múltiplo 0.9733019 Interseção 74.350394 2.7719816 26.822109 4.018E-09 67.958189 80.742599 R-Quadrado 0.9473166 Variável X 1 3.5892388 0.2992586 11.993768 2.152E-06 2.8991467 4.279331

Erro padrão 3.6943598

Observações 10

51. Para uma amostra de 10 tomadores de empréstimos em uma companhia financeira, o coeficiente de correlação entre a renda familiar e débitos a descoberto de curto prazo, foi calculado em r = + 0,50. Testar a hipótese de que não existe correlação entre as duas variáveis para toda a população de tomadores de empréstimos, usando um nível de significância de 5%. R. t = 1,632 Não rej Ho

52. Uma pesquisa do Ibope com os fabricantes e consumidores de Cactus-Cola procurou determinar as quantidades que seriam produzidas e consumidas a cada nível de preço. Com tais dados, apresentados na tabela a seguir , determine as equações das curvas de oferta e demanda através de funções quadráticas.

Preço 8 7 6 5 4 3 2 1 0 Demanda 0,0 3,1 4,8 5,8 6,6 7,5 8,3 8,9 9,5 Oferta 10,1 9,6 8,8 8,0 6,8 5,0 2,3 0,0 0,0 Preço Demanda 8 0.0 7 3.1 6 4.8 5 5.8 4 6.6 3 7.5 2 8.3 1 8.9 V o lu m e d e ve n d as , d e aco r d o co m p r o m o ção y = 3.5892x + 74.35 R2 = 0.9473 0 20 40 60 80 100 120 140 0 5 10 15 20 Pr o m o ção V e n d as Preço x Demanda y = -0,1222x2 - 0,0908x + 9,1885 R2 = 0,9819 0,0 2,0 4,0 6,0 8,0 1 0,0 0 2 4 6 8 P re ç o1 0 D e manda

(24)

0 9.5 Preço Oferta 8 10.1 7 9.6 6 8.8 5 8.0 4 6.8 3 5.0 2 2.3 1 0.0 0 0.0

53. A DesPeZa de Propaganda garantiu à Kaloy que suas vendas seriam maiores se ela promovesse melhor seus produtos. Para atestar a confiança na sua afirmativa, a DPZ sujeitou-se a um contrato de risco, segundo o qual só seria remunerada se a sua afirmativa fosse experimentalmente confirmada. Para tanto, diversas verbas foram investidas durante um ano, acompanhando as vendas correspondentes. Os dados obtidos foram os seguintes ( valores em milhares de dólares) :

Mês Verba(X) Vendas (Y) Mês Verba(X) Vendas (Y)

jan. 15,7 225,9 jul. 22,6 260,0 fev. 17,9 237,0 ago. 23,2 265,6 mar. 20,4 245,7 set. 24,2 266,5 abr. 20,7 250,0 out. 24,8 268,5 maio 21,0 251,5 nov. 25,1 273,0 jun. 22,0 254,5 dez. 26,5 274,0

(a) Ajuste ao dados através do modelo linear. (b) Ajuste os dados através da função potência.

(c) Qual duas funções acima é a melhor função ajustante?

54. Determine a melhor equação de ajustamento do consumo total (em kg) de matéria-prima (c) de uma indústria em função das quantidades produzidas (unidades) de um produto, nos tamanhos grande (g) e pequeno (p).

c 145 210 193 229 195 270 300 p 151 221 215 247 243 257 290 g 70 91 92 122 149 160 185 Exercício 9 y = 4,7321x + 151,87 R2 = 0,982 y = 76,41x 0,3919 R2 = 0,9832 200 220 240 260 280 300 10 15 20 25 30 verba ve nd as Preço x Oferta y = -0,1037x2 + 2,2494x - 1,0255 R2 = 0,9737 -5,0 0,0 5,0 10,0 15,0 0 2 4 6 8 10 Preço Oferta

(25)

55. A Kaloy vem sendo assediada pela DesPeZa para incrementar sua publicidade institucional, tanto em termos de verba quanto de meio de divulgação. Segundo a DesPeZa, isso terá significativa influência em suas vendas. Para ratificar suas afirmativas, apresentou à Kaloy os seguintes resultados obtidos por outro cliente. Ajuste os dados através de um polinômio linear. R: Y=3,9695 + 2,5542X1 + 2,9015X2; r2=0,9983. Gastos Vendas TV Rádio 17 3 2 30 5 4 32 6 5 48 9 7 55 11 8 60 13 8 72 15 10 80 17 11 90 20 13 115 25 15 120 28 16 131 30 17 145 34 19

56. Os argumentos e dados apresentados pela DesPeZa convenceram os diretores da Kaloy. Mas, dadas as características próprias dos seus consumidores, decidiram dividir a verba de publicidade pelos diversos veículos da imprensa televisada, falada e escrita. Depois de um ano, as verbas produziram os seguintes resultados, em dezenas de milhares de dólares. Ajuste os dados através de um polinômio linear.

Gastos Realizados Gastos Realizados

Vendas TV Rádio Revistas Vendas TV Rádio Revistas

17 3 2 1,5 72 15 10 2,7 30 5 4 1,5 80 17 11 2,9 32 6 5 1,8 90 20 13 3,1 48 9 7 2,1 115 25 15 3,3 55 11 8 2,1 120 28 16 3,4 60 13 8 2,4 131 30 17 4,8 y = 0,7718x + 61,993 R2 = 0,846 y = 3,0751x0,8018 R2 = 0,8603 y = -0,004x2 + 2,5556x - 129,91 R2 = 0,9028 0 50 100 150 200 250 300 350 0 100 200 300 400

Consumo total de matéria prima

Quna t. pr o d .t a m a n h o ( P )

Consumo tamanho grande (kg) x quantidade produzida y = 0,7024x - 30,594 R2 = 0,7423 y = 0,001x2 + 0,2597x + 17,034 R2 = 0,746 y = 32,387e0,0059x R2 = 0,7335 0 50 100 150 200 0 100 200 300 400 Consumo Q u an ti d ae produz ida ( G )

(26)

Estatística de regressão R múltiplo 0,998927409

R-Quadrado 0,997855968

R-quadrado ajustado 0,997051957

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 3,450297175 3,244994784 1,0632674 0,3186995 -4,032679055 10,93327341 Variável X 1 2,605124615 0,609707203 4,272747 0,0027141 1,199136375 4,011112856 Variável X 2 2,752853158 1,028530203 2,6764923 0,0280782 0,381056724 5,124649592 Variável X 3 0,478885682 2,153772231 0,2223474 0,8296149 -4,487725201 5,445496564 Estatística de regressão R múltiplo 0,998920777 R-Quadrado 0,997842719 R-quadrado ajustado 0,997363323 Erro padrão 1,921516772 Observações 12

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 4,017403134 1,897275041 2,1174595 0,0632983 -0,274534461 8,309340728 Variável X 1 2,663476874 0,520462358 5,1175207 0,0006301 1,486108326 3,840845422 Variável X 2 2,733089408 0,969060089 2,8203508 0,0200355 0,540921517 4,925257299

57. A Butler Trucking Company, uma companhia de transporte do sul da Califórnia tem seus maiores negócios envolvendo entregas na região. Para desenvolver melhores hábitos de trabalho, os gerentes supõem que o modelo de regressão linear simples poderia ser usado para descrever a relação entre o tempo total de viagem (Y) e a quilometragem percorrida (X1). Foi selecionada uma amostra aleatória simples de 10 tarefas de entrega, que forneceu os dados da tabela abaixo.

Tarefa X1: Quilometragem X2: Número de entregas Y: Tempo de entrega

1 100 4 9,3 2 50 3 4,8 3 100 4 8,9 4 100 2 6,5 5 50 2 4,2 6 80 2 6,2 7 75 3 7,4 8 65 4 6,0 9 90 3 7,6 10 90 2 6,1

(a) Determine o grau de correlação linear entre Y e X1 .

(b) Teste se o tempo de viagem está relacionado linearmente com a quilometragem percorrida, com um nível de significância de 5%.

(27)

(c) Qual o percentual da variabilidade do tempo de viagem que pode ser explicado pelo efeito linear da quilometragem percorrida?

(d) Utilize o modelo de regressão linear simples para descrever a relação entre Y e X1 . (e) Interprete o coeficiente b da reta de regressão.

(f) A equação linear estimada forneceu um bom ajuste? Explique.

(g) Ajuste uma parábola. A equação estimada forneceu um bom ajuste? Explique.

(h) Os gerentes resolveram acrescentar outra variável independente para explicar alguma variabilidade remanescente na variável dependente. Acharam que o número de entregas também poderia contribuir para o tempo de viagem. Considerando o número de entregas como X2 , determine a equação de regressão linear.

(i) Interprete os coeficientes da equação obtida no item anterior. RESUMO DOS RESULTADOS

Estatística de regressão R múltiplo 0,814905707 R-Quadrado 0,664071312 Erro padrão 1,001791873 Observações 10

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 1,273913043 1,400744525 0,909454 0,389687 -1,956211712 4,504037799 Variável X 1 0,067826087 0,017055637 3,976755 0,00408 0,028495691 0,107156483 RESUMO DOS RESULTADOS

Estatística de regressão

R múltiplo 0,950678166 R-Quadrado 0,903788975 Erro padrão 0,573142152

Observações 10

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção -0,868701467 0,951547725 -0,91294 0,391634 -3,118752683 1,38134975 Variável X 1 0,061134599 0,009888495 6,182397 0,000453 0,037752041 0,084517156 Variável X 2 0,923425367 0,221113461 4,176251 0,004157 0,400575489 1,446275244

58. Pretendendo estudar a relação entre o tempo necessário a um consumidor para optar(Y) e o número de produtos substituídos alternativos(X) expostos a ele, foi observada uma amostra aleatória de 15 consumidores, da qual resultaram os seguintes dados:

Y 5 8 8 7 9 7 9 8 9 10 10 11 10 12 9 X 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 (a) Estime o coeficiente de correlação linear de Pearson; R. 0.7091

(28)

(c) Interprete os valores dos coeficientes encontrados para a reta;

(d) Estime e interprete o coeficiente de determinação entre X e Y. R. 0.5028

59. Os dados da tabela abaixo foram obtidos em um estudo da relação entre a resistência (ohms) e o tempo de falha (minutos) de certos resistores sobrecarregados.

(a) Calcule r e determine que percentagens da variação no tempo de falha é causado por diferenças na resistência?

(b) Teste ao nível de significância de 5%, a hipótese nula de ausência de correlação. Resistência (X) Tempo de falha (Y)

48 45 28 25 33 39 40 45 36 36 39 35 46 36 40 45 30 34 42 39 44 51 48 41 39 38 34 32 47 45

RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,7040345 R-Quadrado 0,4956646 Erro padrão 4,8122807

Observações 15

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 10,724146 8,0260203 1,3361723 0,2044119 -6,6150134 28,063305 Variável X 1 0,7157202 0,2002338 3,5744228 0,0033939 0,2831415 1,1482989

60. A tabela abaixo apresenta os valores referentes a idade ( em anos) de oito atletas e as respectivas distâncias (km) percorridas em determinado tempo:

Idade 18 17 20 19 18 22 21 20 Distância 20 17 10 24 23 31 32 28 (a) Determine o coeficiente de correlação linear de Pearson;

(29)

(b) Ajuste os dados através de uma reta de mínimos quadrados (modelo linear); (c) Ajuste os dados através de uma parábola (modelo polinomial grau 2); (d) Qual a melhor função ajustante? Por que?

(e) Faça o teste de significância, a α=5%, para a regressão linear. Identifique as hipóteses, a decisão e a conclusão.

(f) Refaça a análise, eliminando a observação do atleta que está com comportamento diferente dos demais. O que aconteceu?

RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.5559634 R-Quadrado 0.3090953 Erro padrão 6.657226

Observações 8

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção -24.27673 29.027779 -0.8363275 0.4350066 -95.305199 46.75174 Variável X 1 2.4465409 1.4932748 1.6383729 0.152457 -1.2073736 6.1004553

Distância, segundo a idade do atleta

y = 2,9853x - 32,574 R2 = 0,921 y = -0,3864x2 + 18,073x - 178,75 R2 = 0,9509 0 5 10 15 20 25 30 35 0 5 10 15 20 25 Idade D istânci a

RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,959684841 R-Quadrado 0,920994994 R-quadrado ajustado 0,905193992 Erro padrão 1,72353945 Observações 7 Distância, segundo a idade dos atletas

y = 2.4465x - 24.277 R2 = 0.3091 y = 0.5425x2 - 18.692x + 180.27 R2 = 0.3423 0 5 10 15 20 25 30 35 0 5 10 15 20 25 Idade Di st ânci a

(30)

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção -32,57352941 7,569216362 -4,30342 0,00769 -52,03078771 -13,11627112 Variável X 1 2,985294118 0,391021641 7,634601 0,000613 1,980142632 3,990445603

61. Desejando-se verificar se existe correlação entre volume de uma carga e o tempo gasto para acondicioná-la investigou-se nove pedidos de mercadorias, medindo-se as duas variáveis de interesse. Os dados obtidos foram:

Tempo (Y) 64 108 110 133 144 152 180 196 231 Volume (X) 48 72 63 82 88 109 112 123 140 (a) Determine o coeficiente de correlação linear de Pearson;

(b) Ajuste os dados através de uma reta de mínimos quadrados (modelo linear); (c) Ajuste os dados através de uma parábola (modelo polinomial grau 2); (d) Qual a melhor função ajustante? Por que?

(e) Faça o teste de significância, a α=5%, para a regressão linear.

Tem po para acondicionar caixas

y = 1,6521x - 7,2021 R2 = 0,9613 y = 0,001x2 + 1,4646x + 0,7988 R2 = 0,9615 0 50 100 150 200 250 0 20 40 60 80 100 120 140 160 Volume Tempo

RESUMO DOS RESULTADOS

Estatística de regressão

R múltiplo 0.9804374

R-Quadrado 0.9612575

Erro padrão 10.66533

Observações 9

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção -7,20214 12,18863 -0,59089 0,57317 -36,02365627 21,61937024 Variável X 1 1,652114 0,125362 13,17877 3,38E-06 1,355680641 1,948547046

62. Abaixo você encontra uma lista de situações de pesquisa. Para cada uma indique se o apropriado é uma análise de correlação ou uma de regressão. Justifique sua indicação: (a) A quantidade procurada da carne gado depende do preço da carne de porco? (b) O objetivo é estimar o tempo necessário à consecução de certa tarefa usando para

tanto o tempo de treinamento do executor.

(c) O preço de uma reforma depende dos valores dos artigos usados no acabamento? (d) Estime o número de milhas que um pneu radial possa rodar antes de ser substituído;

(31)

(e) Deseja-se prever quanto tempo será necessário para uma pessoa completar determinada tarefa, com base no número de semanas de treinamento;

(f) Decida se o número de semanas de treinamento é uma variável importante para avaliar o tempo necessário para realizar uma tarefa.

63. Uma cadeia de supermercados financiou um estudo dos gastos realizados por família de 4 pessoas com renda mensal líquida entre 8 e 20 salários mínimos. A pesquisa levou à seguinte equação Y= - 1,2+0,4X, onde Y representa a despesa mensal estimada com mercadorias (através do modelo) e X a renda mensal líquida expressa salários mínimos. (a) Estime a despesa mensal de uma família com renda de 15 salários mínimos.

(b) Se uma família com as características da pesquisa, efetuou um gasto mensal de 6,2 salários mínimos, qual seria a estimativa de sua renda mensal?

(c) Um dos vice presidentes da firma ficou intrigado com o fato da equação aparentemente sugerir que uma família com renda de 3 salários mínimos não gaste nada em mercadorias. Qual a explicação?

(d) Explique por que a equação acima não poderia ser usada nos seguintes casos: - estimar despesas com mercadorias para famílias de cinco pessoas;

- estimar despesas com mercadorias para famílias com renda de 20 a 35 s.m.

64. Uma equipe de engenheiros consultores estabeleceu a seguinte relação para a quilometragem urbana de carros americanos de seis cilindros no âmbito de peso de 1500 a3000/b (motorista com 150/b): Yc = 30 – 0.002X onde Y = estimativa de milhas por galão; X = peso do carro. Estime a quilometragem para um carro que pese:

(a) 2000/b (b) 1500/b (c) 2500/b

65. Determine uma equação preditora do montante de seguro em função da renda anual, com base nos seguintes dados:

Seguro (X) 10 12 15 10 15 20 30 5 40 50 40

Renda Anual (Y) 20 25 26 18 16 17 32 13 38 40 42

RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.911868052 R-Quadrado 0.831503345 Erro padrão 4.502672786

Observações 11

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 11.95712 2.518117 4.748436 0.001046 6.260738 17.6535 Variável X 1 0.62944 0.094449 6.664347 9.22E-05 0.415782 0.843098

(32)

66. Considere a amostra de 10 famílias, dada na tabela abaixo, de um certo bairro de Porto Alegre, referentes ao ganho mensal (s.m.) e o número de filhos.

(a) Represente estes dados graficamente.

(b) Calcule e interprete o coeficiente de correlação linear de Pearson; R. 0.7974 (c) Calcule o coeficiente de determinação e interprete o resultado;

(d) Determine a equação para estimar o número de filhos em função da renda mensal da família. R.

(e) Se julgar significativo, determine o número de filhos para uma família com renda de 5 salários mínimo.

Ganho mensal (s.m.) (X) Nº de filhos (Y)

10 3 12 3 8 2 15 3 7 1 9 1 16 4 11 2 14 3 10 3

67. Determine uma equação que descreva a relação entre freqüência de acidentes e o nível de esforço preventivo (educacional) com base nos dados abaixo:

Homens/hora por mês p/educação (X) 200 500 450 800 900 150 300 600 Acidentes por milhão de homens/hora (Y) 7,0 6,4 5,2 4,0 3,1 8,0 6,5 4,4 RESUMO DOS RESULTADOS

Estatística de regressão R múltiplo 0.95310228 R-Quadrado 0.90840395 Erro padrão 0.54665539

Observações 8

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 8.44306569 0.419036 20.14879 9.71E-07 7.417721 9.46841 Variável X -0.0058832 0.000763 -7.71395 0.000249 -0.00775 -0.00402

68. Refaça o exercício anterior utilizando “acidentes/mês” como variável X e “nível educacional” como Y. Compare a equação resultante com a obtida anteriormente:

RESUMO DOS RESULTADOS

Estatística de regressão

R múltiplo 0.95310228

R-Quadrado 0.90840395

Erro padrão 88.5602161

Observações 8

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 1348.31418 115.9013 11.63329 2.43E-05 1064.714 1631.915 Variável X 1 -154.40613 20.01648 -7.71395 0.000249 -203.385 -105.428

(33)

69. A tabela abaixo apresenta o número de semanas de experiência em colocar fios em pequenos componentes eletrônicos e o número de componentes rejeitados, durante a última semana, para 12 trabalhadores aleatoriamente selecionados.

Trabalhador Semanas de experiência (X) Quantidade de rejeitados (Y)

1 7 26 2 9 20 3 6 28 4 14 16 5 8 23 6 12 18 7 10 24 8 4 26 9 2 38 10 11 22 11 1 32 12 8 25

(a) Determinar a equação de regressão para predizer o nº de componentes rejeitados, dado o nº de semanas de experiência. R. Y= 35.365 – 1.387 X

(b) Estimar o número de componentes rejeitados para um empregado com 3 semanas de experiência. Por que o valor não coincide com o da tabela?

Referências

Documentos relacionados