Resumo dos Procedimentos dos Testes de Hipóteses para Uma Amostra
Curva CO Hipótese
CritériosParâmetroApêndiceparade Caso
Hipótese EstatísticaGráficoNulaCurvaCORejeiçãoAlternativaVIde Teste 1.
H'o: I.l.
=
H): I.l. "" I.l.odIJ-o=
IZol >II.l. -a,bx Zal2-l.l.ol/<TI.l.o Zo= ---
<T2conhecida H):d=
I.l. > IJ-o(I.l. -zo>c,<T/"IhtZaI.l.o)/<TdH): IJ-
<
IJ-oZo
<
-Zad
=
(I.l.o -c,dI.l.)/<T 2.Ho: I.l.
=
H):IJ-oIJ- "" IJ-ox - I.l.o[told =>II.l. -ta/2,n-1e,f 1J-01/<T to
=---.
<T2desconhecida H):dIJ- >to>= (IJ- -ta,n-)g,IJ-ohs/"IhtI.l.o)/<TH): IJ-
<
IJ-oto
<
-ta,n-) d=
(IJ-o -g, h I.l.)/<T 3.Ho: <T2
=
H):<TÕ2><T2 ""Ài,j=(n2<TÕ<T/<To- l)s2XÕ= Xo Xa/2,n-1 <TÕ ou 2
<
Xo2 X)-a/2,n-) H): <T2> <TÕ 2>k, IÀ =2 <T/<To Xo Xa,n-) H( <T2<
<TÕ 2m,n<
À =2 <T/<To Xo XI-a,n-) 4.Ho: P =H):p""poPoIZol >xZa/2- npo
Zo
=
Ynpo(l - Po) H):p>pozo> ZaH): p <Po
Resumo dos Procedimentos para Intervalo de Confiança para Uma Amostra Estimativa
Caso
Tipo de ProblemaPontual 1.
Média JJ.,com variância 0"2conhecida x
2.
Média JJ.de uma distribuição normal com x
variância 0"2desconhecida
3.
Variância 0"2de uma distribuição normal s2
4.
Proporção ou parâmetro de uma
p
distribuição binomial p Intervalo Bilateral de
Confiança de 100(1 - a)% x - Zaf20"/v/;z :S JJ. :S x
+
Zaf20"/v/;z x - taf2.n _Is/v/;z :S JJ. :S x+
taf2.n -1 s/v/;z (112- l)s2 :S 0"2:s ~ - l)s2 Xa/2,n-I
Xj-af2,n-j AJp(l
-
fi) AJfi(l
- p)
p - Zaf2· 11 :SP :SP+
Zaf2Estatística Aplicada e
Probabilidade para
Estatística Aplicada e
Probabilidade para
Engenheiros
Segunda Edição
Douglas C. Montgomery
Arizona State University
George C. Runger
Arizona State University
Tradução:
Profa. Verôniea Calado, D. Se.
Praf. Adjunto - Departamento deEngenharia Química EscoladeQuímica/UFR]LTC
No interesse de difusão da cultura e do conhecimento, os autores e os editores envidaram o máximo esforço para localizar os detentores dos direitos au~orais de qualquer material utilizado, dispondo-se a possíveis acertos posteriores caso, inadvertidamente, a identificação de algum deles tenha sido omitida.
U
Vooo
3&973
LJApplied Statistics and Probability for Engineers, 2nd edition
Copyright © 1999 John Wiley
&
Sons, Jnc.All rights reserved. Authorized translation from the English language edition published by John Wiley
&
Sons, Jnc.Direitos exclusivos para a língua portuguesa Copyright © 2003 by
LTC - Livros Técnicos e Científicos Editora S.A.
Travessa do Ouvidor, 11
Rio de Janeiro, RJ - CEP 20040-040 Tel.: 21-3970-9480
Fax: 21-2221-3202 Itc@ltceditora.com.br www.1tceditora.com.br
Para:
Meredith, Neil, Colin
eCheryl
Taylor, George, Elisa
e
Rebecca
Prefácio
A indústria americana* tem de continuar a melhorar a
qualida-de qualida-de seus produtos e serviços se quiser continuar a competir
efetivamente nos mercados interno e externo. Uma porção signi-ficante desse esforço de melhoria da qualidade será comandada por engenheiros e cientistas, porque esses são os indivíduos que projetam e desenvolvem novos produtos e sistemas e processos dé fabricação, sendo também aqueles que melhoram os sistemas existentes. Métodos estatísticos são uma importante ferramenta
nessas atividades, porque eles provêem os engenheiros com
métodos descritivos e analíticos para lidar com a variabilidade nos dados observados.
Este é um livro introdutório para um primeiro curso em esta-tística aplicada e probabilidade para estudantes de graduação em engenharia e ciências físicas ou químicas. Enquanto muitos dos
métodos que apresentamos são fundamentais para análise
esta-tística em outras disciplinas, tais como negócios ou gestão, as ciências da vida e as ciências sociais, elegemos focalizar o
públi-co voltado para engenharia. Acreditamos que essa abordagem
servirá melhor aos estudantes de engenharia e os permitirá con-centrar-se nas muitas aplicações de estatística nessas disciplinas. Trabalhamos arduamente de modo a assegurar que todos os nos-sos exemplos e exercícios estivessem baseados em engenharia e,
em quase todos os casos, usamos exemplos de dados reais -
to-mados de fonte publicada ou baseados em nossas experiências como consultores.
Acreditamos que os engenheiros de todas as áreas deveriam
cursar estatística. Infelizmente, por causa de outras necessidades, muitos engenheiros fazem apenas um curso de estatística. Escre-vemos este livro de modo que ele pudesse ser usado para um único curso, embora tenhamos fornecido material suficiente para dois cursos, na esperança de que mais estudantes de engenharia
ve-jam as aplicações importantes de estatística em seus trabalhos
diários e façam um segundo curso. Acreditamos que este livro
também sirva como uma referência útil. .
ORGANIZAÇÃO
DO
LIVRO
Mantivemos o nível relativamente modesto de matemática,
usa-do na primeira edição. Percebemos que os estudantes de engenha-ria, que tenham completado um ou dois seme_stresde cálculo, não terão dificuldade em ler quase todo o texto. E nossa intenção dar
ao leitor não a teoria matemática, mas um entendimento da
me-todologia e como aplicá-la. Fizemos um certo número de melho-rias nesta edição, incluindo a reorganização de algum material e reescrevendo grandes porções de vários capítulos.
O Capo 1 é uma introdução ao campo da estatística e como
os 'engenheiros usam a metodologia estatística como parte do
*Isto va'le não só para os EUA, como de resto para todos os países de economia aberta. (N.R.)
processo de solucionar problemas de engenharia. Discutimos e
ilustramos métodos simples para resumir e descrever dados. Este capítulo introduz também o leitor em algumas aplicações de
es-tatística em engenharia, incluindo a construção de modelos
empíricos, o planejamento de experimentos em engenharia e o
monitoramento de processos de fabricação. Estes tópicos serão
discutidos em mais detalhes nos capítulos subseqüentes. O Capo
2 continua a apresentação da descrição de dados e foca os
dia-gramas de ramo e folhas, os histodia-gramas, os diadia-gramas de caixa e vários tipos de gráficos de séries temporais.
Os Caps. 3, 4, 5 e 6 cobrem os conceitos básicos de probabi-lidade, variáveis aleatórias contínuas e discretas, valores
espera-dos, distribuições conjuntas de probabilidade e de
independên-cia. Demos um tratamento razoavelmente completo desses
tó-picos, porém evitamos muitos dos detalhes matemáticos ou mais teóricos.
O Capo 7 começa o tratamento da inferência estatística com
estimação de parâmetros. Este capítulo introduz também os con-ceitos de amostragem aleatória, algumas das importantes propri-edades dos estimadores, o método da máxima verossimilhança, distribuições amostrais e o teorema central do limite.
Introduzi-mos também o bootstrap como uma técnica para encontrar o
erro-padrão de uma estimativa.
Os Caps. 8 e 9 discutem a inferência estatística para uma única
amostra e para duas amostras respectivamente. O material foi
extensivamente reescrito e reorganizado. Teste de hipóteses e
intervalos de confiança para médias, variâncias e proporções são
apresentados, juntamente com informações detalhadas e
exem-plos de métodos para determinar os tamanhos apropriados das amostras. Queremos que os estudantes se tornem familiarizados com o modo como essas técnicas são usadas para resolver pro-blemas de engenharia do mundo real e conseguir algum enten-dimento dos conceitos por trás deles. Damos um
desenvolvimen-to lógico e heurístico dos procedimendesenvolvimen-tos, em vez de um
desen-volvimento teórico formal.
Os Caps. 10 e 11 apresentam a regressão linear simples e
múltipla. Usamos álgebra matricial em todo o material de
regres-são múltipla (Cap. 11), porque, bem francamente, é a única
maneira fácil de entender os conceitos apresentados. Apresen-tações de aritmética escalar para regressão múltipla são, na
me-lhor das hipóteses, inconvenientes e notamos que os alunos de
graduação em engenharia estão expostos à bastante álgebra
matricial para entender a apresentação deste material.
Os Caps. 12 e 13 lidam com experimentos com um único fator
e com múltiplos fatores respectivamente. Enfatizam-se as noções
de aleatoriedade, blocagem, planejamentos fatoriais, interações,
análise gráfica dos dados e planejamentos fatoriais fracionários.
O Capo 14 fornece uma breve introdução aos métodos e aplica-ções de estatística não paramétrica. O Capo 15 introduz o leitor
no controle estatístico da qualidade, enfatizando as cartas de
nii
PREFÁCIOEm adição à coleção usual de tabelas e gráficos estatísticos,
fornecemos também algum material técnico complementar nos
Apêndices. Esse material inclui uma introdução a funções gera-doras de momentos, à mudança de técnicas de variáveis, a
per-mutações e métodos de contagem, ao desenvolvimento das
dis-tribuições te F, à estimação de Bayes e ao princípio da ra:ão de
verossimilhança. Esse material pode ser de interesse para
al-guns professores e estudanres e o temos fornecido como uma re-ferência.
Cada capítulo tem uma coleção extensiva de exercícios, in-cluindo exercícios de final de seção, que enfatizam o material daquela seção, exercícios suplementares no fim do capítulo, que cobrem o escopo dos tópicos do capírulo, e exercícios para
ex-pandir a mente, que freqüentemente requerem que o estudante
estenda de algum modo o material texto ou o aplique em uma nova situação.
USANDO O LIVRO
Este é um livro-texto muito flexível, porque as idéias dos profes-sores variam muito acerca do que deveria estar em um primeiro curso de estatística para engenheiros, assim como as habilidades
de diferentes grupos de estudantes. Conseqüentemente,
hesita-mos em dar um número demasiado de conselhos, explicarehesita-mos porém como usamos o livro.
Acreditamos que um primeiro curso de estatística para
enge-nheiros deveria ser principalmente um curso de estatística
aplica-da e não um curso de probabiliaplica-dade. Em nosso curso de um
se-mestre, cobrimos todo o Capo 1 e o 2 (em três ou quatro aulas), revisamos o material de probabilidade, colocando mais ênfase na distribuição normal (seis a oito aulas), discutimos a maior parte dos Caps. 8 e 9 sobre intervalos de confiança e testes (dez au-las), introduzimos os modelos de regressão do Capo 10 (quatro
aulas), damos uma introdução ao planejamento de
experimen-tos dos Caps. 12 e 13 (seis aulas) e apresentamos os conceitos
básicos de controle estatístico de processo, incluindo as cartas de controle Shewart do Capo 15 (seis aulas). Isso nos deixa cerca de três a quatro períodos para exames e revisão. Vamos enfatizar que a finalidade deste curso é introduzir os engenheiros no modo
como a estatística pode ser usada para resolver problemas de
engenharia do mundo real e não para afugentar os estudantes
menos agraciados matematicamente. Este não é um curso
"in-fantil de matemática-estatística", que é tão freqüentemente dado
a engenheiros.
Se houver disponibilidade de um segundo semestre, então é
possível cobrir o livro inteiro, incluindo algum material dos apên-dices, se apropriado para os estudantes. Seria possível também
designar e trabalhar, na aula, muitos dos problemas propostos
para reforçar o entendimento dos conceitos. Obviamente,
regres-são múltipla e mais planejamento de experimentos seriam os
tópicos mais importantes em um segundo curso.
USANDO O COMPUTADOR
Na prática, engenheiros usam computadores para aplicar méto-dos estatísticos com a finalidade de resolver problemas. Logo,
recomendamos fortemente que o computador seja integrado na
aula. Através de todo o livro, apresentamos saídas do Minitab e SAS como exemplos típicos do que pode ser feito com pacotes estatísticos modernos. Para ensinar, usamos não somente esses pacotes como outros, tais como EXCEL, ST ATGRAPHICS, DESIGN-EASE, JMP e SPSS. Não saturamos o livro com exem-plos de muitos pacotes diferentes, porque a forma como o pro-fessor integra o pacote em sala de aula é muito mais importante do que qual pacote é usado. Todos os dados no texto estão dis-poníveis na forma eletrônica. Em alguns capítulos, há problemas que sentimos que deveriam ser trabalhados usando pacote no computador. Marcamos esses problemas com um símbolo espe-cial na margem.
Em nossas próprias aulas, levamos um notebook PC e um mostrador de cristal líquido, para quase todas as aulas, e
mostra-mos como a técnica é implementada no computador, tão logo
ela seja discutida em classe. Muitos pacotes estatísticos oferecem, a baixo custo, versões para estudantes, que podem comprar sua própria cópia ou usar os produtos disponíveis nas redes locais de
computadores. Percebemos que isso melhorou grande mente o
andamento do curso e o entendimento do material por parte do
estudante.
AGRADECIMENTOS
Gostaríamos de expressar nossa gratidão a muitas organizações
e indivíduos que contribuíram para este livro. Muitos
professo-res que usaram a primeira edição forneceram excelentes suges-tões que incorporamos nesta revisão. Somos também gratos ao DI. Smiley Cheng pela permissão para adaptar muitas das
tabe-las estatísticas de seu excelente livro (com Dr. James Fu),
Statistical Tables for Classroom and Exam Roam. Somos gratos
também a John Wiley and Sons, Prentice Hall, o Instirute of
Mathematical Statistics e os editores da Biometrics por nos
per-mitirem usar o material com direitos autorais.
Douglas C. Montgomery
George C. Runger
Sumário
CAPÍTULO 1
o
Papel da Estatística
na Engenharia
1
1.1 O Método de Engenharia e oJulgamento Estatístico 1
1.1.1 Engenharia e Resolução de Problemas
1.1.2 Julgamento Estatístico 5
1.2 Coletando Dados de Engenharia 6
1.3 Modelos Mecanísticos e Empíricos 7
1.4 Planejando Investigações Experimentais 8
1.5 Observando Processos ao Longo do Tempo 10
Exercícios Suplementares 13
Exercícios para Expandir a Mente 13
CAPÍTULO 2
Sumário e Apresentação
de Dados
14
2.1 Importância do Sumário e Apresentação
de Dados 14
2.2 Diagramas de Ramo e Folhas 14
2.3 Distribuições de Freqüência e
Histogramas 18
2.4 Diagrama de Caixa (Box Plot) 20
2.5 Gráficos Seqüenciais de Tempo 22
Exercícios Suplementares 24
Exercícios para Expandir a Mente 26
CAPÍTULO
3
Probabilidade
27
3.1 Espaços Amostrais e Eventos 27
3.1.1 Introdução 27 3.1.2 EspaçosAmostrais 28 3.1.3 Eventos 29 3.2 Interpretações de Probabilidade 33 3.2.1 Introdução 33 3.2.2 Axiomas de Probabilidade 35 3.3 Regras de Adição 37 3.4 Probabilidade Condicional 39 3.5 Regras da Multiplicação e da Probabilidade Total 42 3.5.1 Regra da Multiplicação 42 3.5.2 Regra da Probabilidade Total 42
3.6 Independência 44
3.7 T eorema de Bayes 47
3.8 Variáveis Aleatórias 48
Exercícios Suplementares 49
Exercícios para Expandir a Mente 50
CAPÍTULO 4
Variáveis Aleatórias Discretas e
Distribuições de Probabilidades
51
4.1 Variáveis Aleatórias Discretas 51
4.2 Distribuições de Probabilidades e Funções de
Probabilidade 52
4.3 Funções de Distribuição Cumulativa 54
4.4 Média e Variância de uma Variável
Aleatória Discreta 55
4.5 Distribuição Uniforme Discreta 57
4.6 Distribuição Binomial 58
4.7 Distribuições Geométrica e Binomial Negativa 62
4.7.1 Distribuição Geométrica 62
4.7.2 Distribuição Binomial Negativa 63
4.8 Distribuição Hipergeométrica 65
4.9 Distribuição de Poisson 68
Exercícios Suplementares 71
Exercícios para Expandir a Mente
n
CAPÍTULO
5
Variáveis Aleatórias Contínuas e
Distribuições de Probabilidade
73
5.1 Variáveis Aleatórias Contínuas 73
5.2 Distribuições de Probabilidades e Funções
Densidade de Probabilidade 73
5.3 Funções de Distribuição Cumulativa 76
5.4 Média e Variância de uma Variável
Aleatória Contínua 77
5.5 Distribuição Uniforme Contínua 78
5.6 Distribuição Normal 79
5.7 Gráficos de Probabilidade 85
5.8 Aproximações das Distribuições Binomial e de
Poisson pela Normal 87
5.9 Distribuição Exponencial 89
5.10 Distribuições de Erlang e Gama 93
5.10.1 Distribuição de Erlang 93 5.10.2 Distribuição Gama 94
5.11 Distribuição de Weibull 95
Exercícios Suplementares 96
Exercícios para Expandir a Mente 97
CAPÍTULO
6
Distribuições de Probabilidades
Conjuntas
98
6.1 Duas Variáveis Aleatórias Discretas 98
6.1.1 Distribuições de Probabilidades Conjuntas 98 6.1.2 Distribuições de Probabilidades Marginais 99
X SUMÁRIO
6.1.3 Distribuições de Probabilidades Condicionais 100 6.1.4 Independência 101
6.2 Múltiplas Variáveis Aleatórias Discretas 104
6.2.1 Distribuições de Probabilidades Conjumas 104 6.2.2 Distribuição Multinomial de Probabilidades 105
6.3 Duas Variáveis Aleatórias Contínuas 107
6.3.1 Distribuições de Probabilidades Conjuntas 107 6.3.2 Distribuições de Probabilidades Marginais 108 6.3.3 Distribuições de Probabilidades Condicionais 109 6.3.4 Independência 111
6.4 Múltiplas Variáveis Aleatórias Contínuas 113
6.5 Covariância e Correlação 115
6.6 Distribuição Normal Bidimensional 118
6.7 Combinações Lineares de Variáveis Aleatórias 120
6.8 Desigualdade de Chebyshev 122
Exercícios Suplementares 123
Exercícios para Expandir a Mente 124
CAPíTULO 7
Estimação de Parâmetros
126
7.1 Inferência Estatística 126
7.2 Amostragem Aleatória 127
7.3 Propriedades de Estimadores 128
7.3.1 EstimadoresNão Tendenciosos 128 7.3.2 Variância de um Estimador 129
7.3.3 Erro·Padrão: Reportando uma Estimativa 130 7.3.4 Estimativa Bootstrap do Erro·Padrão 130 7.3.5 Erro Médio Quadrático de um Estimador 131
7.4 Método da Máxima Verossimilhança 132
7.5 Distribuições Amostrais 136
7.6 Distribuições Amostrais das Médias 136
7.7 Introdução a Intervalos de Confiança 139
Exercícios Suplementares 140
Exercícios para Expandir a Mente 140
CAPíTULO 8
Inferência Estatística para uma
Única Amostra
142
8.1 Teste de Hipóteses 142
8.1.1 Hipóteses Estatísticas 142
8.1.2 Testes de Hipóteses Estatísticas 143 8.1.3 Hipóteses Unilaterais e Bilaterais 147
8.1.4 Procedimento Geral para Testes de Hipóteses 148
8.2 Inferência sobre a Média de uma População com
Variância Conhecida 149
8.2.1 Testes de Hipóteses para a Média 149 8.2.2 Valorespnos Testes de Hipóteses 150 8.2.3 O Erro Tipo II e a Escolha do
Tamanho da Amostra 150
8.2.4 Teste para Amostras Grandes 152 8.2.5 Alguns Comemários Práticos sobre
Testes de Hipóteses 152
8.2.6 Intervalo de Confiança para a Média 153 8.2.7 Método Geral para Deduzir um
Intervalo de Confiança 155
8.2.8 Intervalos de Confiança Bootstrap 155
8.3 Inferência sobre a Média de uma População com
Variância Desconhecida 157
8.3.1 Testes de Hipóteses para a Média 157 8.3.2 Valorppara um Testet 159
8.3.3 Solução Computacional 159 8.3.4 Escolha do Tamanho da Amostra 160 8.3.5 Intervalo de Confiança na Média 161
8.4 Inferência sobre a Variância de uma
População Normal 163
8.4.1 Testes de Hipóteses para a Variância de uma
População Normal 163
8.4.2 Erro[3e Escolha do Tamanho da Amostra 164 8.4.3 Intervalo de Confiança para a Variância de uma
População Normal 164
8.5 Inferência sobre a Proporção de uma População 166
8.5.1 Testes de Hipóteses para uma
Proporção Binomial 166
8.5.2 Erro Tipo II e Escolha do Tamanho da Amostra 166 8.5.3 Intervalo de Confiança para uma
Proporção Binomial 167
8.6 Tabela com Resumo dos Procedimentos de Inferência
sobre uma Única Amostra 169
8.7 Testando a Adequação do Ajuste 169
8.8 Testes da Tabela de Contingência 172
Exercícios Suplementares 174
Exercícios para Expandir a Mente 177
CAPíTULO 9
Inferência Estatística para
Duas Amostras
179
9.1 Introdução 179
9.2 Inferência sobre uma Diferença nas Médias com
Variâncias Conhecidas 179
9.2.1 Testes de Hipóteses para uma Diferença nas Médias
com Variâncias Conhecidas 180
9.2.2 Escolha do Tamanho da Amostra 181 9.2.3 Identificando Causa e Efeito 182
9.2.4 Intervalo de Confiança para uma Diferença nas Médias
com Variâncias Conhecid~s 182
9.3 Inferência sobre a Diferença nas Médias de Duas Distribuições Normais com Variações
Desconhecidas 185
9.3.1 Testes de Hipóteses para a Diferença nas Médias, com
Variâncias Desconhecidas 185
9.3.2 Escolha do Tamanho da Amostra 187 9.3.3 Intervalo de Confiança para a
Diferença nas Médias 187
9.3.4 Solução Computacional 189
9 .4 Teste tEmparelhado 191
9.5 Inferências sobre as Variâncias de
Duas Populações Normais 195
9.5.1 Testes de Hipótesespara a Razãode DuasVariâncias 195 9.5.2 Erro ~ e Escolha do Tamanho da Amostra 197 9.5.3 Intervalo de Confiança para a Razão de
Duas Variâncias 197
9.6.1 Teste para Amostras Grandes, Considerando Ho:Pl
=
P2 1989.6.2 Erro13e Escolha do Tamanho da Amostra 199
9.6.3 Intervalo de Confiança paraPl - P2 200
9.7 Tabela com o Resumo dos Procedimentos de Inferência
sobre Duas Amostras 201
Exercícios Suplementares 201
Exercícios para Expandir a Mente 204
CAPíTULO 10
Regressão Linear Simples
e Correlação
205
10.1 Modelos Empíricos 205
10.2 Regressão Linear Simples 207
10.3 Propriedades dos Estimadores de Mínimos Quadrados e
Estimação de cr 211
10,4 Abusos Comuns na Regressão 212
10.5 Testes de Hipóteses na Regressão Linear Simples 213
10.5.1 Uso de Testest 213
10.5.2 Análise de Variância: Uma Abordagem para Testar a Significância da Regressã~ 214
10.6 Intervalos de Confiança 216
10.6.1 Intervalos de Confiança para a Inclinação
e a Interseção 216
10.6.2 Intervalo de Confiança para a Resposta Média 217
10.7 Previsão de Novas Observações 218
10.8 Cálculo da Adequação do Modelo de Regressão 219
10.8.1 Análise Residual 219
10.8.2 Coeficiente de Determinação(R2) 221
10.8.3 Falta de Ajuste 221
10.9 Transformações para uma Linha Reta 224
10.lOCorrelação 224
Exercícios Suplementares 22 7
Exercícios para Expandir a Mente 229
CAPíTULO 11
Regressão Linear Múltipla
230
11.1 Modelo da Regressão Linear Múltipla 230
11.2 Estimação de Parâmetros pelo Método dos Mínimos
Quadrados 232
11.3 Abordagem Matricial para a Regressão Linear
Múltipla 233
11.4 Propriedades dos Estimadores de Mínimos
Quadrados e Estimação de cr 240
11.5 Testes de Hipóteses para a Regressão
Linear Múltipla 241
11.5.1 Teste para Significância da Regressão 241
11.5.2 Teste para os Coeficientes Individuais de Regressãoe
Subconjuntos de Coeficientes 242
11.6 Intervalos de Confiança para a Regressão
Linear Múltipla 245
11.6.1 Intervalos de Confiança para os Coeficientes Individuais de Regressão 245
11.6.2 Intervalo de Confiança para a Resposta Média 245
11.7 Predição de Novas Observações 246
11.8 Medidas da Adequação do Modelo 247
SUMÁRIO
xi
11.8.1 Coeficiente de Determinação Múltipla(R2) 247
11.8.2 Análise Residual 248
11.8.3 Observações Influentes 249
11.9 Modelos de Regressão Polinomial 251
11.10 Variáveis Indicativas 252
11.11 Seleção de Variáveis na Regressão Múltipla 255
11.11.1 Problema de Construir o Modelo 255
11.11.2 Procedimentos Computacionais para a
Seleção de Variáveis 255
11.11.3 Saída Computacional para a
Regressão em Etapas 260
11.12 Multicolinearidade 263
Exercícios Suplementares 264
Exercícios para Expandir a Mente 266
CAPíTULO 12
Planej amento e Análise de
Experimentos com um Único Fator:
A Análise de Variância
268
12.1 A Estratégia de Experimentação 268
12.2 Experimento Completamente Aleatorizado
com um Único Fator 269
12.2.1 Um Exemplo 269
12.2.2 A Análise de Variância 270
12.2.3 Saída Computacional 273
12.2.4 Análise Residual e Verificação do Modelo 275
12.3 Testes para Médias Individuais de Tratamento 278
12.3.1 Comparação Gráfica das Médias 278
12.3.2 Contrastes Ortogonais 278
12.3.3 Método de Fisher da Mínima
Diferença Significativa 279
12,4 Modelo com Efeitos Aleatórios 281
12.5 Planejamento Aleatorizado com
Blocos Completos 284
12.5.1 Planejamento e Análise Estatística 284
12.5.2 Testes para as Médias Individuais
dos Tratamentos 287
12.5.3 Análise Residual e Verificação do Modelo 288
12.5.4 Planejamento Aleatorizado com Blocos Completos
e com Fatores Aleatórios 288
12.6 Determinação do Tamanho da Amostra em
Experimentos com um Único Fator 290
12.6.1 O Caso dos Efeitos Fixos 290
12.6.2 O Caso dos Efeitos Aleatórios 291
Exercícios Suplementares 292
Exercícios para Expandir a Mente 293
CAPíTULO 13
Planejamento de Experimentos
com Vários Fatores
295
13.1 Introdução 295
13.2 Algumas Aplicações das Técnicas de
Planejamento de Experimentos 295
13.3 Experimentos Fatoriais 297
13.4 Experimentos Fatoriais com Dois Fatores 299
xii
SUMÁRIO13,4.2 Verificação da Adequação do Modelo 303
13,4.3 Saída Computacional 303
13,4,4 Uma Observação por Célula 303
13,4.5 Fatores Aleatórios 304
13.5 Experimentos Fatoriais Gerais 306
13.6 Planejamento Fatorial 2k 309
13.6.1 Planejamento 22 310
13.6.2 Planejamento 2k parak ~ 3 Fatores 313
13.6.3 Réplica Única do Planejamento2k 318
13.6,4 Adição de Pontos Centrais a um
Planejamento 2k 320
13.7 Blocagem e Superposição no Planejamento 2k 323
13.8 Replicação Fracionária do Planejamento 2k 327
13.8.1 Uma Meia Fração do Planejamento 2k 327
13.8.2 Frações Menores: O Fatorial Fracionário2k-p 331
13.9 Métodos e Planejamentos de Superfície
de Resposta 336
13.9.1 Método da Ascendente de Maior Inclinação
(Steepest Ascent) 337
13.9.2 Análise de uma Superfície de Resposta de
Segunda Ordem 339
Exercícios Suplementares 343
Exercícios para Expandir a Mente 346
CAPíTULO 14
Estatística Não Paramétrica
347
14.1 Introdução 347
14.2 Teste dos Sinais 348
14.2.1 Descrição do Teste 348
14.2.2 Teste dos Sinais para Amostras Emparelhadas 350
14.2.3 Erro Tipo II para o Teste dos Sinais 350
14.2,4 Comparação com o Testet 351
14.3 Teste de Wilcoxon do Posto com Sinais 352
14.3.1 Descrição do Teste 353
14.3.2 Aproximação para Amostras Grandes 353
14.3.3 Observações Emparelhadas 353
14.3,4 Comparações com o Testet 354
14.4 Teste de Wilcoxon da Soma :1osPostos 355
14,4.1 Descrição do Teste 355
14,4.2 Aproximação para Amostras Grandes 356
14,4.3 Comparação com o Testet 356
14.5 Métodos Não Paramétricos na Análise
de Variância 357
14.5.1 Teste de Kruskal-Wallis 357
14.5.2 Transformação de Posto 358
Exercícios Suplementares 358
Exercícios para Expandir a Mente 359
CAPíTULO 15
Controle Estatístico da
Qualidade
360
15.1 Melhoria e Estatística da Qualidade 360
15.2 Controle Estatístico da Qualidade 361
15.3 Controle Estatístico de Processo 361
15.4 Introdução aos Gráficos de Controle 361
15,4.1 Princípios Básicos 361
15,4.2 Projeto de um Gráfico de Controle 364
15,4.3 Subgrupos Racionais 364
15,4,4 Análise de Padrões de Comportamento para
Gráficos de Controle 365
15.5 Gráficos de Controle X e R 367
15.6 Gráficos de Controle para Medidas
Individuais 371
15.7 Capacidade de Processo 374
15.8 Gráficos de Controle para Atributos 377
15.8.1 Gráfico P (Gráfico de Controle para Proporções 377
15.8.2 GráficoU(Gráfico de Controle para
Defeitos por Unidade) 378
15.9 Desempenho do Gráfico de Controle 380
15.10 Gráfico de Controle da Soma
Cumulativa 382
15.11 Outras Ferramentas para Resolver
Problemas de CEP 386
15.12 Implementando o CEP 388
Exercícios Suplementares 389
Exercícios para Expandir a Mente 391
AP~NDICES
393
A Tabelas e Gráficos Estatísticos 395
B Material Técnico Suplementar 426
I Técnicas de Contagem 426
II Função Geradora de Momento 429
III Funções de Variáveis Aleatórias 432
IV Desenvolvimento das Distribuições
te F 436
V Abordagem Bayesiana para Estimação 437
VI Testes da Razão da Verossimilhança 439
VII Fatores Aleatórios em Experimentos
Fatoriais 440
C Bibliografia 445
D Respostas dos Exercícios Selecionados 447
o
Papel da Estatística
na Engenharia
ESQUEMA DO CAPÍTULO
1.1
o
MÉTODO DE ENGENHARIA E O JULGAMENTOESTATÍSTICO
1.1.1 Engenharia e Resolução de Problemas 1.1.2 Julgamento Estatístico
1.2 COLETANDO DADOS EM ENGENHARIA
1.1 O MÉTODO DE ENGENHARIA E O
JULGAMENTO
ESTATÍSTICO
1.1.1 Engenharia e Resolução
de Problemas
Um engenheiro é alguém que resolve problemas de interesse da sociedade, pela aplicação eficiente de princípios científicos. Os
engenheiros executam isso através do refmamento do produto
ou processos existentes, ou pelo projeto de um novo produto, ou
processo que encontre as necessidades dos consumidores. O
método de engenharia ou científico é a abordagem para
for-mular e resolver esses problemas. As etapas no método de en-genharia são dadas a seguir:
1. Desenvolver uma descrição clara e concisa do problema. 2. Identificar, no mínimo tentar, os fatores importantes que
afetam esse problema ou que possam desempenhar um
papel em sua solução.
3. Propor um modelo para o problema, usando conhecimento científico ou de engenharia do fenômeno estudado. Esta-belecer limitações ou suposições do modelo.
4. Conduzir experimentos apropriados e coletar dados para
testar ou validar o modelo-tentativa ou conclusões feitas
nas etapas 2 e 3.
5. Refinar o modelo, com base nos dados observados.
1.3 MODELOS MECANICISTAS E EMPÍRICOS 1.4 PLANEJANDO INVESTIGAÇÕES
EXPERIMENTAIS
1.5 OBSERVANDO PROCESSOS AO LONGO DO TEMPO
6. Manipular o modelo de modo a ajudar o desenvolvimento da solução do problema.
7. Conduzir um experimento apropriado para confirmar que a solução proposta para o problema é efetiva e eficiente. 8. Tirar conclusões ou fazer recomendações baseadas na
so-lução do problema.
As etapas no método de engenharia são mostradas na Fig. 1.1. Note que o método de engenharia caracteriza uma forte relação recíproca entre o problema, os fatores que podem influenciar sua solução, um modelo do fenômeno e a experiência para verificar a adequação do modelo e da solução proposta para o problema. As etapas 2-4, na Fig. 1.1, são colocadas em um retângulo, in-dicando que vários ciclos ou iterações dessas etapas podem ser
requeridos para obter a solução final. Conseqüentemente,
en-genheiros têm de saber como planejar, eficientemente, os
expe-rimentos, coletar dados, analisar e interpretar os dados e enten-der como os dados observados estão relacionados ao modelo que eles propuseram para o problema sob estudo.
O campo da estatística lida com a coleta, a apresentação, a
análise e o uso dos dados para tomar decisões, resolver proble-mas e planejar produtos e processos. Devido a muitos aspectos da prática de engenharia envolverem o trabalho com dados, ob-viamente algum conhecimento de estatística é importante para
qualquer engenheiro. Especificamente, técnicas estatísticas
produ-2 OPAPEL DA ESTATÍSTICA NA ENGENHARIA
Definição
Se as n observações em uma amostra forem denotadas por XI' X2, ... , X,,, então, a média da amostra será
12,6
+
12,9+ ... +
13,1 8EXEMPLO 1.1
A média da amostra da força de remoção para as oito observa-ções coletadas nos protótipos dos conectores é
8
2:
Xi X=
Xl+
Xl+ ...
Xn=
;=
I
n
8 (1.1) n2:
Xi ;=1n
x
=
XI+
Xl+ ... +
Xn nA Fig. 1.2 apresenta um diagrama de pontos desses dados.
O diagrama de pontos é um gráfico muito útil para exibir um pe-queno conjunto de dados, isto é, cerca de 20 observações. Esse gráfico nos permitirá ver facilmente duas características dos
da-dos; a localização ou o meio, e o espalhamento ou a
variabili-dade. Quando o número de observações é pequeno, geralmente é dificil identificar qualquer padrão específico na variabilidade, embora o diagrama de pontos seja uma maneira conveniente de ver quaisquer características incomuns nos dados.
Podemos também descrever numericamente as
característi-cas dos dados. Por exemplo, podemos caracterizar a
localiza-ção ou tendência central nos dados através da média aritmética comum. Porque quase sempre pensamos em nossos dados como
sendo uma amostra, referir-nos-emos à média arítmética como
a média da amostra. tos e sistemas, melhorando os projetos existentes e planejando,
desenvolvendo e melhorando os processos de produção.
Métodos estatísticos são usados para nos ajudar a entender
a variabilidade. Por variabilidade, queremos dizer que
sucessi-vas observações de um sistema ou fenômeno não produzem exa-tamente o mesmo resultado. Todos nós encontramos
variabili-dade em nosso dia-a-dia e o julgamento estatístico pode nos dar
uma maneira útil para incorporar essa variabilidade em nossos
processos de tomada de decisão. Por exemplo, considere o de-sempenho de consumo de gasolina de seu carro. Você sempre consegue o mesmo desempenho de consumo em cada tanque de
combustível? Naturalmente, não -na verdade, algumas vezes o
desempenho varia consideravelmente. Essa variabilidade
obser-vada no consumo de gasolina depende de muitos fatores, tais
como o tipo de estrada mais usada recentemente (cidade ou
es-trada), as mudanças na condição do veÍCulo ao longo do tempo (que poderiam incluir fatores como desgaste do pneu ou com-pressão do motor ou desgaste da válvula), a marca e/ou número
de octanagem da gasolina usada, ou mesmo, possivelmente, as
condições climáticas. Esses fatores representam fontes
poten-ciais de variabilidade no sistema. A Estatística nos fornece uma
estrutura para descrever essa variabilidade e para aprender
so-bre quais fontes potenciais de variabilidade são mais importan-tes ou quais têm o maior impacto no desempenho de consumo de gasolina.
Encontramos também variabilidade em problemas de
enge-nharia. Por exemplo, suponha que um engenheiro esteja proje-tando um conector de náilon para ser usado em uma aplicação
automotiva. O engenheiro está considerando estabelecer como
especificação do projeto uma espessura de parede de 3/32 pole-gada, mas está, de algum modo, inseguro acerca do efeito dessa decisão na força de remoção do conector. Se a força de remoção for muito baixa, o conector pode falhar quando ele for instalado no motor. Oito unidades do protótipo são produzidas e suas for-ças de remoção são medidas, resultando nos seguintes dados (em libras-pé): 12,6; 12,9; 13,4; 12,3; 13,6; 13,5; 12,6; 13,1. Como antecipamos, nem todos os protótipos têm a mesma força de re-moção.
<-A média da amostra é o valor médio de todas as observações do conjunto de dados. Geralmente, esses dados são uma amos-tra de observações que foi selecionada a partir de alguma po-pulação grande de observações. Aqui, a popo-pulação deve
consis-Uma interpretação fisica da média da amostra como uma
medida da localização é mostrada na Fig. 1.3, que é um diagrama de pontos dos dados da força de remoção. Note que a média da
amostra x
=
13,0 pode ser pensada como um "ponto debalan-ço". Ou seja, se cada observação representar 1 libra de massa
colocada no ponto no eixoX, então o fulcro localizado em
x
equilibraria exatamente esse sistema de pesos.
Força de remoção I 15 14 13,0 104 8 13
•
•
•
•
••
••
12Fig. 1.1 O método de solução de um problema.
Fig. 1.2 Diagrama de pontos dos dados da força de remoção, quando a espessura da parede for 3/32 polegada.
o
PAPEL DA EsTA TfsTICA NA ENGENHARIA3
Definição
Fig. 1.3 A média da amostra como um ponto de equilibrio para um sistema de pesos.
SeXI, X2, ..• , Xn for uma amostra de n observações, então a
variância da amostra será
tir em todos os conectores que serão vendidos aos consumido-res. Algumas vezes, existe uma população física real, tal como uma porção de pastilhas de silício produzidas em uma fábrica de
semicondutores. Podemos pensar também em calcular o valor
médio de todas as observações em uma população. Essa média é
chamada de média populacional, sendo denotada pela letra
gre-gafL(mi).
Quando houver um número finito de observações (isto é,N)
na população, então a média populacional será
Xi Xi -(Xi -X X)2 1 12,6 -0,40,16 2 12,9 -0,10,01 3 13,4 0,160,4 4 12,3 -0,70,49 5 13,6 0,360,6 6 13,5 0,250,5 7 12,6 -0,40,16 8 13,1 0,010,1
--
1"04,0 1,60--
--
0,0assim, a variância da amostra é
Tabela 1.1 Cálculo dos Termos para a Variância e Desvio-Padrão da Amostra
2 1,60 1,60 02286 (l'b ,)2
s
=
8 _ 1=
-7-
=,
I
ras- pee o desvio-padrão da amostra é
EXEMPLO 1.2
A Tabela 1.1 apresenta as quantidades necessárias para
cal-cular a variância e o desvio-padrão da amostra para os dados
da força de remoção. Esses dados são graficados na Fig. 1.4. O numerador de S2é
8
L
(Xi - x)2=
1,60i=1
s
=
v'0,2286=
0,48 libras-pédados da força de remoção do conector. Quanto maior a variabi-lidade nos dados da força de remoção, maior será o valor
absolu-to de alguns dos desvios Xi - X. Uma vez que os desvios Xi - X
somarão zero, temos de usar uma medida de variabilidade que
transforme os desvios negativos em quantidades não negativas.
Elevar ao quadrado os desvios é uma abordagem usada na
variância da amostra. Conseqüentemente, se S2for pequeno,
ha-verá, relativamente, pouca variabilidade nos dados; porém, se S2 for grande, a variabilidade será relativamente grande.
(1.2) (1.3) N
L
Xi i=1f..L=--
N nL
(Xi - X)2 S2=
_i=_I _n - 1
i;
13•
L
•
•
•
•
••
I I 12Força de remoção À1415A média da amostra, X, é uma estimativa razoável da média
populacional, fL. Logo, o engenheiro durante o projeto do
conector usando uma espessura de parede de 3/32 polegada con-cluiria, com base nos dados, que uma estimativa da força de re-moção média seria 13,0 libras-pé.
Nos capítulos seguintes, discutiremos modelos para popula-ções infinitas e isso nos levará a urna defmição mais geral de
média populacional, fL.Muitos problemas importantes de
enge-nharia envolvem fazer referências ou tomar decisões sobre uma média populacional.
Embora a média da amostra seja útil, ela não transmite toda a informação acerca de uma amostra de dados. A variabilidade
ou dispersão nos dados pode ser descrita pela variância ou o
desvio-padrão da amostra.
o
desvio-padrão da amostra, s, é a raiz quadradapositi-va da positi-variânci<;lda amostra. o oo o X o o o o
12 13 14 15
As unidades de medidas para a variância da amostra são o quadrado das unidades originais da variável. Assim, se x for medido em libras-pé, as unidades para a variância da amostra serão (libras-pé)2. O desvio-padrão tem uma propriedade desejá-vel de variabilidade de medida nas unidades originais da variádesejá-vel
de interesse,
x.
Como a Variância da Amostra Mede a Variabilidade?
Para ver como a variância da amostra mede a dispersão ou a
va-riabilidade, veja a Fig. 1.4 que mostra os desvios Xi - X para os
Fig. 1.4 Como a variância da amostra mede a variabilidade através dos desvios Xi - x.
4
OPAPEL DA EsTATÍSTICA NA ENGENHARIAEXEMPLOl.3
Calcularemos a variância e o desvio-padrão da amostra,
usan-do o métousan-do usan-do atalho, Eq.
IA.
A fórmula fornecen Il
2:
X?+
n:x2 - 2:X2:
Xii=1 i=1
n - 1
Note que a Eq.
IA
requer que se calcule o quadrado de cadaXi'levando-se, então, ao quadrado a soma deXi' subtraindo
('i,xY/n
de
I
x;, e finalmente dividindo por n - I. Algumas vezes, isso échamado de método abreviado para cálculo deS2 (ou s).
n
e,já que
x
=
(l/n) iI,
Xi' essa última equação se reduz a= 1
(±
X.)2 ±X?- i=1 I (104) 2 i=1n
s
=---n -1
(1.6) r=
máx(xi) - mín(xi)Uma definição mais geral da variância cr será dada adiante.
Observamos, previamente, que a média da amostra poderia ser
usada como uma estimativa da média populacional. Similarmen-te, a variância da amostra é uma estimativa da variância da po-pulação.
Note que o divisor da variância da amostra é o tamanho da
amostra menos um(n - I), enquanto para a variância da
popula-ção, o divisor é o tamanho
N
da população. Se soubéssemos ovalor verdadeiro da média populacional ]L, então poderíamos
encontrar a variância da amostra como a média dos quadrados
dos desvios das observações da amostra em tomo de ]L.Na
prá-tica, o valor de]Lquase nunca é conhecido e, dessa forma, a soma
dos quadrados dos desvios em tomo da média
x
da amostra temde ser usada. No entanto, as observações Xi tendem a ser mais
próximas de seu valor médio,
x,
do que a média populacional, ]L.Por conseguinte, para compensar isso, usamos n - 1 como o
divisor em vez de n. Se usássemos n como o divisor na variância da amostra, obteríamos uma medida de variabilidade que seria, em média, consistentemente menor que a variância verdadeira cr da população.
Uma outra maneira de pensar acerca disso é considerar a
va-riância S2da amostra, como estando baseada em n - I graus de
liberdade. O termo graus de liberdade resulta do fato de que n
desvios Xl -
x,
X2 -x, ...,
Xn -x
sempre somam zero e,as-sim, especificar os valores de quaisquer n - I dessas
quantida-des determina automaticamente aquele restante. Isso foi
ilus-trado na Tabela 1.1. Dessa forma, somente n - I dos n desvios,
Xi -
x,
estão livremente determinados.Além da variância e do desvio-padrão da amostra, a amplitu-de da amostra, ou a diferença entre a maior e a menor observa-ção, é uma medida útil de variabilidade. A amplitude da amostra é definida como segue.
Definição
Se as n observações em uma amostra forem denotadas por
XI'X2, ... ,x," então a amplitude da amostra será
13536 _ (104f , 8 7 Il
2:
(X?+
:x2 - 2ix;) i=1n-n
2:
(xi-:xi
2 i=1 S =---n -I
( n )2 n2:
Xi2:x?-
i=1 2 i= I n S =---n -1
Cômputo de
52O cômputo deS2requer o cálculo de
x,
n subtrações e nopera-ções de elevar ao quadrado e somar. Se as observaopera-ções originais
ou os desvios Xi -
x
não forem inteiros, pode ser tediosotraba-lhar com os desvios Xi - X e vários decimais podem ter de ser
carregados para assegurar a exatidão numérica. Uma fórmula computacional mais eficiente para a variância da amostra é obti-da como segue:
e
s
=
VO,2286=
0,48 libras-péEsses resultados concordam exatamente com aqueles obtidos previamente.
=
1,;0=
0,2286 (libras-pé)2 Para os dados da força de remoção, a amplitude da amostra ér
=
13,6 - 12,3=
1,3. Geralmente, à medida que a variabilidadenos dados da amostra aumenta, a amplitude da amostra
au-menta.
A amplitude da amostra é fácil de calcular, mas ignora toda a informação contida nos dados entre os valores maior e menor.
Por exemplo, as duas amostras 1,3,5,8 e 9 e 1,5,5,5,9 têm a
mesma amplitude (r
=
8). Entretanto, o desvio-padrão daprimei-ra amostprimei-ra éSI
=
3,35, enquanto o desvio-padrão da segundaamostra éS2
=
2,83. A variabilidade é realmente menor nasegun-da amostra.
Algumas vezes, quando o tamanho da amostra for pequeno,
isto é, n
<
8 ou 10, a perda de informação associada com aampli-tude não é muito séria. Por exemplo, a ampliampli-tude é largamente utilizada em controle estatístico da qualidade, onde tamanhos de amostra de 4 ou 5 são razoavelmente comuns. Discutiremos algumas dessas aplicações no Capo 15.
A média, a varíância e o desvio-padrão da amostra e o diagra-ma de pontos são simples, ainda que efetivas diagra-maneiras de resu-(1.5)
N
2:
(xi - f.L)20'2
=
_i=_1 _N
Análoga à variância da amostra S2,existe uma medida de
vari-abilidade na população chamada de variância da população. Usa-remos a letra grega cr (sigma ao quadrado) para denotar a variância
da população. A raiz quadrada positiva de
cr,
ouCJ', denotará odesvio-padrão da população. Quando a população for finita e
con-sistir em
N
valores, podemos definir a variância da populaçãoo
PAPEL DA EsTATÍSTICA NA ENGENHARIA 5mir os dados. Outros métodos para descrever os dados serão apresentados no Capo 2.
Os engenheiros estão freqüentemente interessados em desen-volver um modelo do sistema ou processo que gerou os dados.
Esses modelos envolvem conceitos de probabilidade que serão
introduzidos no Capo 3. Veremos que a noção de uma
distribui-ção de probabilidade, como um modelo que descreve a
varia-bilidade em um sistema ou processo, é muito importante no
ambiente de engenharia. Os Caps. 4-6 explorarão esses concei-tos em detalhes.
1.1.2 Julgamento Estatístico
A necessidade de um julgamento estatístico aparece freqüente-mente na solução de problemas de engenharia. Considere o en-genheiro projetando o conector. A partir de testes em protótipo, ele sabe que uma estimativa razoável da força média de remo-ção seria 13,0 lb-ft. Entretanto, ele pensa que esse valor pode ser muito baixo para a aplícação pretendida; assim, ele decide considerar um projeto alternativo com uma espessura maior de parede, 1/8 polegada. Oito protótipos desse projeto são constru-ídos e as medidas observadas da força de remoção são: 12,9; 13,7;
12,8; 13,9; 14,2; 13,2; 13,5 e 13,1. A média e o desvio-padrão
da amostra são 13,4 e 0,50, respectivamente. Resultados para
ambas as amostras são graficados como diagrama de pontos na Fig. 1.5. Esse gráfico e os cálculos precedentes dão a impressão de que o aumento da espessura da parede levou a um aumento na força de remoção. No entanto, há algumas questões óbvias a perguntar. Por exemplo, como sabemos que uma outra amostra de protótipos não dará resultados diferentes? A amostra de oito
protótipos é adequada para fornecer resultados confiáveis? Se
usarmos .os resultados obtidos dos testes até agora para concluir
que aumentando a espessura da parede aumenta a resistência,
quais os riscos que estão associados com essa decisão? Por exem-plo, será possível que o aumento aparente na força de remoção observada nos protótipos mais espessos seja apenas devido à variabilidade aparente no sistema e que o aumento da espessura da parte (e seu custo) realmente não afete a força de remoção?
Freqüentemente, as leis fisicas (tais como a lei de Ohm e a
lei de gás ideal) são aplicadas para ajudar no projeto de
produ-tos e processos. Estamos familiarizados com esse raciocínio a
partir de leis gerais para casos especiais. Porém, também é im-portante raciocinar a partir de uma série específica de medidas para casos mais gerais para responder às questões prévias. Esse argumento é a partir de uma amostra (tal como os oito
conec-tores) para uma população (tal como os conectores que serão
vendidos aos consumidores). O raciocínio é referido como
inferência estatística. Ver Fig. 1.6. Historicamente, medidas
foram obtidas de uma amostra de pessoas e generalizadas para
uma população, mantendo-se a terminologia. Claramente, o
raciocínio baseado nas medidas de alguns objetos para medidas em todos os objetos pode resultar em erros (chamados de erros de amostragem). No entanto, se a amostra for selecionada ade-quadamente, esses riscos poderão ser quantificados e um tama-nho apropriado de amostra pode ser determinado.
• =f2polegada o= ~ polegada
Fig. 1.6 Inferência estatistica é um tipo de raciocínio.
População futura ? Tempo. 1- - - - - - , I I I I I I I I I I , J Estudo analítico Estudo enumerativo 1- - - , I I População I ? :
(:::)
:!_-~---j
xl' X2"'" xn.Em alguns casos, a amostra é realmente selecionada a
par-tir da população. A amostra é um subconjunto da população.
Por exemplo, uma amostra de três pastilhas pode ser
selecio-nada de um lote de produção de pastilhas na fabricação de
semicondutores. Baseado nos dados da amostra, queremos
concluir alguma coisa a respeito do lote. Por exemplo, a média
das medidas de resistividade na amostra (:X) não é esperada
para igualar exatamente à média das medidas de resistividade
no lote (f.L). Entretanto, se :x for alta, devemos estar
preocu-pados com que f.L seja muito alta. A inferência estatística é a
partir de :x para f.L.
Em outros casos, a população não existe ainda, mas deve ser pensada como futuras réplicas dos objetos na amostra. Para
res-ponder às questões prévias, os oito protótipos dos conectores
têm de ser representantivos, de certo modo, daqueles que serão
vendidos aos consumidores. Geralmente, os oito conectores são
vistos como uma amostra da população de conectores que serão vendidos aos consumidores. Claramente, essa análise requer al-guma noção de estabilidade como uma suposição adicional. Por exemplo, deve ser considerado que as fontes de variabilidade na fabricação de protótipos (tais como temperatura, pressão e tem-po de cura) são as mesmas que aquelas para os conectores que serão vendidos aos consumidores.
O exemplo de pastilhas a partir de lotes é chamado de estudo
enumerador. Uma amostra é usada para fazer uma inferência à
população da qual a amostra é selecionada. O exemplo do conector é chamado de estudo analítico. Uma amostra é usada para fazer uma inferência a uma população futura. As análises estatísticas são geralmente as mesmas em ambos os casos, porém um estudo analítico requer, claramente, uma suposição de estabilidade. Ver Fig.1.7. I 15 o • 00 00 o o o
•
••
•
••
I 13 14 Força de remoção•
126
OPAPEL DA ESTATÍSTICA NA ENGENHARIA1.2 COLETANDO DADOS DE ENGENHARIA
Na seção prévia, ilustramos alguns métodos simples para resu-mir dados. No ambiente de engenharia, os dados são quase sem-pre uma amostra que foi selecionada a partir de algumapopula-ção. Geralmente, esses dados são coletados em uma das duas
maneiras a seguir.
A primeira maneira pela qual os engenheiros freqüentemente
coletam dados é a partir de um estudo observacional. Nessa
situ-ação, o processo ou sistema que está sendo estudado pode ser
observado somente pelo engenheiro e os dados são obtidos à
medida que se tomam disponíveis. Por exemplo, suponha que um engenheiro esteja avaliando o desempenho de um processo de fabricação de componentes plásticos através da injeção em
mol-de. Pode-se observar o processo, selecionar componentes à
medida que são fabricados e medir importantes características de interesse, tais como a espessura da parede, o encolhimento ou a resistência da peça. O engenheiro pode medir também e registrar
as variáveis de processo potencialmente importantes, tais como
a temperatura do molde, o conteúdo de umidade da
matéria-pri-ma e o tempo do ciclo. Freqüentemente, em um estudo
observa-dor, o engenheiro está interessado em usar os dados para cons-truir um modelo do sistema ou processo. Esses modelos são freqüentemente chamados de modelos empíricos, sendo introdu-zidos e ilustrados em maiores detalhes na próxima seção. Uma outra maneira é que os dados observados são obtidos através da análise de dados históricos do sistema ou processo. Por
exem-plo, na fabricação de semicondutores, é razoavelmente comum
manter registros extensos de cada batelada ou lote de pastilhas que foi produzido. Esses registros incluiriam dados de teste de
características fisicas e elétricas das pastilhas, assim como as
condições de processamento sob as quais cada batelada de
pas-tilhas foi produzida. Se aparecerem questões relativas a uma
mudança em uma importante característica elétrica, a história do processo pode ser estudada em um esforço para determinar o ponto no tempo onde a mudança ocorreu e para ganhar algum
discernimento em relação às variáveis do processo que devem
ser responsáveis pela mudança. Freqüentemente, esses estudos
envolvem um conjunto muito grande de dados e requerem um firme domínio dos princípios estatísticos, se o engenheiro quiser alcançar o sucesso.
A segunda maneira pela qual os dados de engenharia são
ob-tidos é através de um experimento planejado. Em um
experi-mento planejado, o engenheiro faz varíações propositais nas va-riáveis controláveis de alguns sistemas ou processos, observa os dados de saída do sistema resultante e, então, faz uma inferência ou decisão sobre as variáveis que são responsáveis pelas
mudan-ças observadas no desempenho de saída. O exemplo do conector de plástico na seção prévia ilustrou um experimento planejado; ou seja, uma mudança deliberada foi feita na espessura da pade do conector, com o objetivo pade padescobrir se uma força pade
re-moção maior poderia ser ou não obtida. O planejamento de
ex-perimentos tem um papel muito importante no projeto e desen-volvimento de engenharia e na melhoria dos processos de fabri-cação. Geralmente, quando produtos e processos são planejados e desenvolvidos com experimentos planejados, eles têm melhor desempenho, mais alta confiabilidade e menores custos globais.
Experimentos planejados também desempenham um papel
crucial na redução do tempo de condução de um projeto de en-genharia e do desenvolvimento de atividades. Na Seção 1.4, ilus-traremos vários tipos de experimentos planejados para o exem-plo do conector.
Na Seção 1.1, introduzimos os conceitos de estudos
enumeradores e analíticos. A maioria dos problemas de
enge-nharia envolve os estudos analíticos. Os dados provenientes de observação e os dados provenientes de experimentos planejados podem ser obtidos em ambos os tipos de estudos, mas freqüen-temente eles envolvem estudos analíticos; isto é, a inferência ou decisão da análise é sobre como o sistema ou o processo se de-sempenhará no futuro.
A habilidade de pensar e analisar, estatisticamente, os dados
amostrais nos capacitará a responder questões sobre o sistema ou o processo em estudo. Por exemplo, considere o problema a respeito da escolha da espessura da parede do conector de nái-lon. Uma abordagem que poderia ser usada na resolução desse problema é comparar as médias da força de remoção para 3/32
polegada, JkJI32,e para 1/8 polegada, J.LU8,usando a técnica de teste
estatístico de hipóteses. Os Caps. 8 e 9 discutirão o teste de hi-póteses e outras técnicas relacionadas. Em geral, uma hipótese é uma afirmação sobre algum aspecto do sistema em que tenha-mos interesse. Por exemplo, o engenheiro pode estar interessa-do em saber se a força média de remoção de 3/32 polegada ex-cede a carga máxima típica a ser encontrada nessa aplicação, ou seja, 12,75 libras-pé. Assim sendo, estaríamos interessados em
testar o teste de hipóteses em que a resistência média J.L3132
exce-deria 12,75 libras-pé. Isso é chamado de problema de teste de hipóteses com uma única amostra. O Capo 8 apresentará
técni-cas para esse tipo de problema. Alternativamente, o engenheiro
pode estar interessado em testar a hipótese de que um aumento da espessura da parede de 3/32 para 1/8 de polegada resulta em um aumento da força média de remoção. Claramente, esse é um exemplo de estudo analítico e também um exemplo de um pro-blema envolvendo teste de hipóteses para duas amostras. Pro-blemas desse tipo serão discutidos no Capo 9.
---EXERCÍCIOS
PARA AS SEÇÕES 1.1 E
1.2---1.1. Foram feitas oito medidas do diâmetro interno de anéis de pis- 7099; 6930; 6992; 7518; 7100; 6935; 7518; 7013; 6800; 7041 tão forjados de um motor de um automóvel. Os dados (em mm) e 6890. Calcule a média e o desvio-padrão da amostra. Cons-são: 74,001; 74,003; 74,015; 74,000; 74,005; 74,002; 74,005 e trua um diagrama de pontos dos dados.
74,004. Calcule a média e o desvio-padrão da amostra, construa 1.4. Um artigo no Journal o/ Structural Engineering (Vol. 115, um diagrama de pontos e comente os dados. 1989) descreve um experimento para testar a resistência resul-1.2. Em Applied Li/e Data Analysis (Wiley, 1982), Wayne Nelson tante em tubos circulares com calotas soldadas nas
extremida-apresenta o tempo de esgotamento de um fluido isolante entre des. Os primeiros resultados (em kN) são: 96; 96; 102; 102; 102; eletrodos a 34 kV. Os tempos, em minutos, são: 0,19; 0,78; 104; 104; 108; 126; 126; 128; 128; 140; 156; 160; 160; 164 e 0,96; 1,31; 2,78; 3,16; 4,15; 4,67; 4,85; 6,50; 7,35; 8,01; 8,27; 170. Calcule a média e o desvio-padrão da amostra. Construa 12,06; 31,75; 32,52; 33,91; 36,71 e 72,89. Calcule a média e um diagrama de pontos dos dados.
o desvio-padrão da amostra. 1.5. Um artigo em Human Factors (junho de 1989) apresentou da-1.3. A edição de janeiro de 1990 de Arizona Trend contém um su- dos sobre a acomodação visual (uma função do movimento do plemento descrevendo os 12 "melhores" campos de golfe do olho), reconhecendo um padrão de mancha em um vídeo CRT estado. Os comprimentos desses campos emjardas são: 6981; de alta resolução. Os dados são: 36,45; 67,90; 38,77; 42,18;
o
PAPEL DA EsTATÍSTlCA NA ENGENHARIA 71.6.
26,72; 50,77; 39,30 e 49,71. Calcule a média e o desvio- 1.7. padrão da amostra. Construa um diagrama de pontos dos
dados. 1.8.
Os seguintes dados são medidas de intensidade solar direta (watts/m2), em dias diferentes, em uma localização no sul da Espanha: 562; 869;708;775;775;704; 809; 856;655; 806; 878; 909; 918; 558; 768; 870; 918; 940; 946; 661; 820; 898; 935; 952; 957; 693; 835; 905; 939; 955; 960; 498; 653; 730 e 753. Calcule a média e o desvio-padrão da amostra.
Para cada um dos Exercícios 1.1 a 1.6, discuta se os dados resul-tam de um estudo observado ou de um experimento planejado. A edição de 22 de abril de 1991 de Aviation Week and Space Technology reporta que, durante uma operação de guerra no deserto, pilotos da força aérea americana (F-117A) realizaram
1270 vôos de combate, com um total de 6905 horas. Qual foi a duração média de uma missão F -117 A durante essa opera-ção? Por que o parâmetro que você calculou foi a média po-pu1aciona1 ?
1.3 MODELOS MECANICISTAS
E EMPÍRICOS
em que aforma da função f
é
desconhecida. Talvez, um modelo de trabalho pudesse ser desenvolvido a partir de uma expansão em série de Taylor, considerando apenas o termo de primeira ordem, produzindo assim um modelo da formaMn
=
130+
131V+
!32C+
!33T (1.10)sendo f3's os parâmetros desconhecidos. Agora, assim como na lei de Ohm, esse modelo não descreverá exatamente o fenômeno, de modo que devemos considerar outras fontes de variabilidade Os modelos desempenham um importante papel na análise de praticamente todos os problemas de engenharia. Muito da edu-cação formal de engenheiros envolve o aprendizado sobre os modelos relevantes a campos e a técnicas específicos para apli-car esses modelos na formulação e solução de problemas. Como um simples exemplo, suponha que estejamos medindo a corren-te em um fio fino de cobre. Nosso modelo para esse fenômeno pode ser a lei de Ohm
Corrente
=
voltagem/resistência(1.11)
Tabela 1.2 Dados sobre a Resistência de Tração da Cola no Arame Resistência Comprimento Número da àTração do Arame Altura do Molde Observação y XI X,
I
9,95250 2 24,458110 3 31,7511120 4 35,0010550 5 25,028295 6 16,864200 7 14,382375 8 9,60252 9 24,359100 10 27,503008 11 17,084124 12 37,0011400 13 41,9512500 14 11,663602 15 21,652054 16 17,894004 17 69,0020600 18 10,305851 19 34,9310540 20 46,5915250 21 44,8815290 22 54,1216510 23 56,6317590 24 22,131006 25 21,154005Esse é o modelo que usaremos para relacionar o peso molecular às outras três variáveis. Esse tipo é chamado modelo empírico; ou seja, ele usa a nossa engenharia e o conhecimento científico do fenôme-no, porém não é diretamente desenvolvido a partir de nosso conheci-mento teórico ou dos primeiros princípios do mecanismo básico. Com o objetivo de ilustrar essas idéias com um exemplo espe-cífico, considere os dados na Tabela 1.2. Essa tabela contém da-dos das três variáveis, que foram coletados em uma planta de fa-bricação de semicondutores. Nessa planta, o semicondutor [mal é um arame colado a uma estrutura. As variáveis reportadas são a resistência à tração (uma medida da quantidade de força requerida para romper a cola), o comprimento do arame e a altura da matriz. Gostariamos de encontrar um modelo relacionando a resistência à tração, ao comprimento do arame e à altura da matriz. Infelizmente, não há mecanismo fisico que possamos facilmente aplicar aqui. Por conseguinte, não parece provável que a aborda-gem de modelo mecanicista possa ser usada com sucesso. Note que esse é um exemplo de um estudo observador (ver Seção 1.2). que possam afetar o peso molecular. Desse modo, adicionamos um outro termo ao modelo resultando
(1.9) (1.8) (1. 7)
1= E/R
I=E/R+E Mn=
I(V,
C, T)sendo Eum termo adicionado ao modelo para considerar o fato de que os valores observados da corrente não seguem perfeita-mente o modelo mecanicista. Podemos pensar Ecomo sendo um termo que inclui os efeitos de todas as fontes não modeladas de variabilidade que afetam esse sistema.
Algumas vezes, os engenheiros trabalham com problemas para os quais não há modelo mecanicista simples ou bem enten-dido, que explique o fenômeno. Por exemplo, suponha que este-jamos interessados no peso molecular médio (Mil) de um polímero. Agora, sabemos que Mil está relacionado à viscosi-dade (V) do material e também depende da quantidade de catalisador (C) e da temperatura (1)no reator de polimerização, quando o material é fabricado. A relação entre Mil e essas variá-veis é
Chamamos esse tipo de modelo mecanístico, porque ele é construído a partir de nosso conhecimento do mecanismo fisico básico, que relaciona essas variáveis. No entanto, se fizermos esse processo de medição mais de uma vez, talvez em tempos dife-rentes, ou mesmo em dias diferentes, a con"ente observada po-derá diferir levemente por causa de pequenas mudanças ou vari-ações em fatores que não estejam perfeitamente controlados, tais como mudanças na temperatura ambiente, flutuações no desem-penho do medidor, pequenas impurezas presentes em diferentes localizações do fio e impulsos na voltagem. Logo, um modelo mais realista da corrente observada pode ser