LIVRO_Estatística Aplicada e Probabilidade para Engenheiros - Montgomery, Douglas - Cap. 1-2 - 2a Ed.

(1)

(2)

Resumo dos Procedimentos dos Testes de Hipóteses para Uma Amostra

Curva CO Hipótese

CritériosParâmetroApêndiceparade Caso

Hipótese EstatísticaGráficoNulaCurvaCORejeiçãoAlternativaVIde Teste 1.

H'o: I.l.

=

H): I.l. "" I.l.odIJ-o

=

IZol >II.l. -_a,bx Zal2-l.l.ol/<TI.l.o Zo

= ---

_<T2_conhecida H):d

=

I.l. > IJ-o(I.l. -zo>_c,<T/"IhtZaI.l.o)/<Td

H): IJ-

<

IJ-o

Zo

<

-Za

d

=

(I.l.o -c,dI.l.)/<T 2.

Ho: I.l.

=

H):IJ-oIJ- "" IJ-ox - I.l.o

[told =>II.l. -ta/2,n-1e,f 1J-01/<T to

=---.

<T2desconhecida H):dIJ- >to>= (IJ- -ta,n-)g,IJ-ohs/"IhtI.l.o)/<T

H): IJ-

<

IJ-o

to

<

-ta,n-) d

=

(IJ-o -g, h I.l.)/<T 3.

Ho: <T2

=

H):<TÕ2><T2 ""Ài,j=(n2<TÕ<T/<To- l)s2

XÕ= Xo Xa/2,n-1 <TÕ ou 2

<

Xo2 X)-a/2,n-) H): <T2> <TÕ 2>k, I_À ₌2 _<T/<To Xo Xa,n-) H( <T2

<

<TÕ 2m,n

<

_À ₌2 _<T/<To Xo XI-a,n-) 4.

Ho: P =H):p""poPo_{IZol >}x_Za/2- npo

Zo

=

Ynpo(l - Po) H):p>pozo> Za

H): p <Po

(3)

Resumo dos Procedimentos para Intervalo de Confiança para Uma Amostra Estimativa

Caso

Tipo de ProblemaPontual 1.

Média JJ.,com variância 0"2conhecida x

2.

Média JJ.de uma distribuição normal com _x

variância 0"2desconhecida

3.

Variância 0"2de uma distribuição normal s2

4.

Proporção ou parâmetro de uma

p

distribuição binomial p Intervalo Bilateral de

Confiança de 100(1 - a)% x - Zaf20"/v/;z :S JJ. :S x

+

Zaf20"/v/;z x - taf2.n _Is/v/;z :S JJ. :S x

+

taf2.n -1 s/v/;z (112- l)s2 :S 0"2:s ~ - l)s2 Xa/2,n-

I

Xj-af2,n-j A

Jp(l

-

fi) A

Jfi(l

- p)

p - Zaf2· 11 :SP :SP

+

Zaf2

(4)

Estatística Aplicada e

Probabilidade para

(5)

Estatística Aplicada e

Probabilidade para

Engenheiros

Segunda Edição

Douglas C. Montgomery

Arizona State University

George C. Runger

Arizona State University

Tradução:

Profa. Verôniea Calado, D. Se.

Praf. Adjunto - Departamento deEngenharia Química EscoladeQuímica/UFR]

LTC

(6)

No interesse de difusão da cultura e do conhecimento, os autores e os editores envidaram o máximo esforço para localizar os detentores dos direitos au~orais de qualquer material utilizado, dispondo-se a possíveis acertos posteriores caso, inadvertidamente, a identificação de algum deles tenha sido omitida.

U

Vooo

3&973

LJ

Applied Statistics and Probability for Engineers, 2nd edition

&

Sons, Jnc.

&

Sons, Jnc.

LTC - Livros Técnicos e Científicos Editora S.A.

Travessa do Ouvidor, 11

Rio de Janeiro, RJ - CEP 20040-040 Tel.: 21-3970-9480

Fax: 21-2221-3202 Itc@ltceditora.com.br www.1tceditora.com.br

(7)

Para:

Meredith, Neil, Colin

e

Cheryl

Taylor, George, Elisa

e

Rebecca

(8)

Prefácio

A indústria americana* tem de continuar a melhorar a

qualida-de qualida-de seus produtos e serviços se quiser continuar a competir

efetivamente nos mercados interno e externo. Uma porção signi-ficante desse esforço de melhoria da qualidade será comandada por engenheiros e cientistas, porque esses são os indivíduos que projetam e desenvolvem novos produtos e sistemas e processos dé fabricação, sendo também aqueles que melhoram os sistemas existentes. Métodos estatísticos são uma importante ferramenta

nessas atividades, porque eles provêem os engenheiros com

métodos descritivos e analíticos para lidar com a variabilidade nos dados observados.

Este é um livro introdutório para um primeiro curso em esta-tística aplicada e probabilidade para estudantes de graduação em engenharia e ciências físicas ou químicas. Enquanto muitos dos

métodos que apresentamos são fundamentais para análise

esta-tística em outras disciplinas, tais como negócios ou gestão, as ciências da vida e as ciências sociais, elegemos focalizar o

públi-co voltado para engenharia. Acreditamos que essa abordagem

servirá melhor aos estudantes de engenharia e os permitirá con-centrar-se nas muitas aplicações de estatística nessas disciplinas. Trabalhamos arduamente de modo a assegurar que todos os nos-sos exemplos e exercícios estivessem baseados em engenharia e,

em quase todos os casos, usamos exemplos de dados reais -

to-mados de fonte publicada ou baseados em nossas experiências como consultores.

Acreditamos que os engenheiros de todas as áreas deveriam

cursar estatística. Infelizmente, por causa de outras necessidades, muitos engenheiros fazem apenas um curso de estatística. Escre-vemos este livro de modo que ele pudesse ser usado para um único curso, embora tenhamos fornecido material suficiente para dois cursos, na esperança de que mais estudantes de engenharia

ve-jam as aplicações importantes de estatística em seus trabalhos

diários e façam um segundo curso. Acreditamos que este livro

também sirva como uma referência útil. .

ORGANIZAÇÃO

DO

LIVRO

Mantivemos o nível relativamente modesto de matemática,

usa-do na primeira edição. Percebemos que os estudantes de engenha-ria, que tenham completado um ou dois seme_stresde cálculo, não terão dificuldade em ler quase todo o texto. E nossa intenção dar

ao leitor não a teoria matemática, mas um entendimento da

me-todologia e como aplicá-la. Fizemos um certo número de melho-rias nesta edição, incluindo a reorganização de algum material e reescrevendo grandes porções de vários capítulos.

O Capo 1 é uma introdução ao campo da estatística e como

os 'engenheiros usam a metodologia estatística como parte do

*Isto va'le não só para os EUA, como de resto para todos os países de economia aberta. (N.R.)

processo de solucionar problemas de engenharia. Discutimos e

ilustramos métodos simples para resumir e descrever dados. Este capítulo introduz também o leitor em algumas aplicações de

es-tatística em engenharia, incluindo a construção de modelos

empíricos, o planejamento de experimentos em engenharia e o

monitoramento de processos de fabricação. Estes tópicos serão

discutidos em mais detalhes nos capítulos subseqüentes. O Capo

2 continua a apresentação da descrição de dados e foca os

dia-gramas de ramo e folhas, os histodia-gramas, os diadia-gramas de caixa e vários tipos de gráficos de séries temporais.

Os Caps. 3, 4, 5 e 6 cobrem os conceitos básicos de probabi-lidade, variáveis aleatórias contínuas e discretas, valores

espera-dos, distribuições conjuntas de probabilidade e de

independên-cia. Demos um tratamento razoavelmente completo desses

tó-picos, porém evitamos muitos dos detalhes matemáticos ou mais teóricos.

O Capo 7 começa o tratamento da inferência estatística com

estimação de parâmetros. Este capítulo introduz também os con-ceitos de amostragem aleatória, algumas das importantes propri-edades dos estimadores, o método da máxima verossimilhança, distribuições amostrais e o teorema central do limite.

Introduzi-mos também o bootstrap como uma técnica para encontrar o

erro-padrão de uma estimativa.

Os Caps. 8 e 9 discutem a inferência estatística para uma única

amostra e para duas amostras respectivamente. O material foi

extensivamente reescrito e reorganizado. Teste de hipóteses e

intervalos de confiança para médias, variâncias e proporções são

apresentados, juntamente com informações detalhadas e

exem-plos de métodos para determinar os tamanhos apropriados das amostras. Queremos que os estudantes se tornem familiarizados com o modo como essas técnicas são usadas para resolver pro-blemas de engenharia do mundo real e conseguir algum enten-dimento dos conceitos por trás deles. Damos um

desenvolvimen-to lógico e heurístico dos procedimendesenvolvimen-tos, em vez de um

desen-volvimento teórico formal.

Os Caps. 10 e 11 apresentam a regressão linear simples e

múltipla. Usamos álgebra matricial em todo o material de

regres-são múltipla (Cap. 11), porque, bem francamente, é a única

maneira fácil de entender os conceitos apresentados. Apresen-tações de aritmética escalar para regressão múltipla são, na

me-lhor das hipóteses, inconvenientes e notamos que os alunos de

graduação em engenharia estão expostos à bastante álgebra

matricial para entender a apresentação deste material.

Os Caps. 12 e 13 lidam com experimentos com um único fator

e com múltiplos fatores respectivamente. Enfatizam-se as noções

de aleatoriedade, blocagem, planejamentos fatoriais, interações,

análise gráfica dos dados e planejamentos fatoriais fracionários.

O Capo 14 fornece uma breve introdução aos métodos e aplica-ções de estatística não paramétrica. O Capo 15 introduz o leitor

no controle estatístico da qualidade, enfatizando as cartas de

(9)

nii

PREFÁCIO

Em adição à coleção usual de tabelas e gráficos estatísticos,

fornecemos também algum material técnico complementar nos

Apêndices. Esse material inclui uma introdução a funções gera-doras de momentos, à mudança de técnicas de variáveis, a

per-mutações e métodos de contagem, ao desenvolvimento das

dis-tribuições te F, à estimação de Bayes e ao princípio da ra:ão de

verossimilhança. Esse material pode ser de interesse para

al-guns professores e estudanres e o temos fornecido como uma re-ferência.

Cada capítulo tem uma coleção extensiva de exercícios, in-cluindo exercícios de final de seção, que enfatizam o material daquela seção, exercícios suplementares no fim do capítulo, que cobrem o escopo dos tópicos do capírulo, e exercícios para

ex-pandir a mente, que freqüentemente requerem que o estudante

estenda de algum modo o material texto ou o aplique em uma nova situação.

USANDO O LIVRO

Este é um livro-texto muito flexível, porque as idéias dos profes-sores variam muito acerca do que deveria estar em um primeiro curso de estatística para engenheiros, assim como as habilidades

de diferentes grupos de estudantes. Conseqüentemente,

hesita-mos em dar um número demasiado de conselhos, explicarehesita-mos porém como usamos o livro.

Acreditamos que um primeiro curso de estatística para

enge-nheiros deveria ser principalmente um curso de estatística

aplica-da e não um curso de probabiliaplica-dade. Em nosso curso de um

se-mestre, cobrimos todo o Capo 1 e o 2 (em três ou quatro aulas), revisamos o material de probabilidade, colocando mais ênfase na distribuição normal (seis a oito aulas), discutimos a maior parte dos Caps. 8 e 9 sobre intervalos de confiança e testes (dez au-las), introduzimos os modelos de regressão do Capo 10 (quatro

aulas), damos uma introdução ao planejamento de

experimen-tos dos Caps. 12 e 13 (seis aulas) e apresentamos os conceitos

básicos de controle estatístico de processo, incluindo as cartas de controle Shewart do Capo 15 (seis aulas). Isso nos deixa cerca de três a quatro períodos para exames e revisão. Vamos enfatizar que a finalidade deste curso é introduzir os engenheiros no modo

como a estatística pode ser usada para resolver problemas de

engenharia do mundo real e não para afugentar os estudantes

menos agraciados matematicamente. Este não é um curso

"in-fantil de matemática-estatística", que é tão freqüentemente dado

a engenheiros.

Se houver disponibilidade de um segundo semestre, então é

possível cobrir o livro inteiro, incluindo algum material dos apên-dices, se apropriado para os estudantes. Seria possível também

designar e trabalhar, na aula, muitos dos problemas propostos

para reforçar o entendimento dos conceitos. Obviamente,

regres-são múltipla e mais planejamento de experimentos seriam os

tópicos mais importantes em um segundo curso.

USANDO O COMPUTADOR

Na prática, engenheiros usam computadores para aplicar méto-dos estatísticos com a finalidade de resolver problemas. Logo,

recomendamos fortemente que o computador seja integrado na

aula. Através de todo o livro, apresentamos saídas do Minitab e SAS como exemplos típicos do que pode ser feito com pacotes estatísticos modernos. Para ensinar, usamos não somente esses pacotes como outros, tais como EXCEL, ST ATGRAPHICS, DESIGN-EASE, JMP e SPSS. Não saturamos o livro com exem-plos de muitos pacotes diferentes, porque a forma como o pro-fessor integra o pacote em sala de aula é muito mais importante do que qual pacote é usado. Todos os dados no texto estão dis-poníveis na forma eletrônica. Em alguns capítulos, há problemas que sentimos que deveriam ser trabalhados usando pacote no computador. Marcamos esses problemas com um símbolo espe-cial na margem.

Em nossas próprias aulas, levamos um notebook PC e um mostrador de cristal líquido, para quase todas as aulas, e

mostra-mos como a técnica é implementada no computador, tão logo

ela seja discutida em classe. Muitos pacotes estatísticos oferecem, a baixo custo, versões para estudantes, que podem comprar sua própria cópia ou usar os produtos disponíveis nas redes locais de

computadores. Percebemos que isso melhorou grande mente o

andamento do curso e o entendimento do material por parte do

estudante.

AGRADECIMENTOS

Gostaríamos de expressar nossa gratidão a muitas organizações

e indivíduos que contribuíram para este livro. Muitos

professo-res que usaram a primeira edição forneceram excelentes suges-tões que incorporamos nesta revisão. Somos também gratos ao DI. Smiley Cheng pela permissão para adaptar muitas das

tabe-las estatísticas de seu excelente livro (com Dr. James Fu),

Statistical Tables for Classroom and Exam Roam. Somos gratos

também a John Wiley and Sons, Prentice Hall, o Instirute of

Mathematical Statistics e os editores da Biometrics por nos

per-mitirem usar o material com direitos autorais.

Douglas C. Montgomery

George C. Runger

(10)

Sumário

CAPÍTULO 1

o

Papel da Estatística

na Engenharia

1

1.1 O Método de Engenharia e o

Julgamento Estatístico 1

1.1.1 Engenharia e Resolução de Problemas

1.1.2 Julgamento Estatístico 5

1.2 Coletando Dados de Engenharia 6

1.3 Modelos Mecanísticos e Empíricos 7

1.4 Planejando Investigações Experimentais 8

1.5 Observando Processos ao Longo do Tempo 10

Exercícios Suplementares 13

Exercícios para Expandir a Mente 13

CAPÍTULO 2

Sumário e Apresentação

de Dados

14

2.1 Importância do Sumário e Apresentação

de Dados 14

2.2 Diagramas de Ramo e Folhas 14

2.3 Distribuições de Freqüência e

Histogramas 18

2.4 Diagrama de Caixa (Box Plot) 20

2.5 Gráficos Seqüenciais de Tempo 22

CAPÍTULO

3 Probabilidade

27

3.1 Espaços Amostrais e Eventos 27

3.1.1 Introdução 27 3.1.2 EspaçosAmostrais 28 3.1.3 Eventos 29 3.2 Interpretações de Probabilidade 33 3.2.1 Introdução 33 3.2.2 Axiomas de Probabilidade 35 3.3 Regras de Adição 37 3.4 Probabilidade Condicional 39 3.5 Regras da Multiplicação e da Probabilidade Total 42 3.5.1 Regra da Multiplicação 42 3.5.2 Regra da Probabilidade Total 42

3.6 Independência 44

3.7 T eorema de Bayes 47

3.8 Variáveis Aleatórias 48

CAPÍTULO 4

Variáveis Aleatórias Discretas e

Distribuições de Probabilidades

51

4.1 Variáveis Aleatórias Discretas 51

4.2 Distribuições de Probabilidades e Funções de

Probabilidade 52

4.3 Funções de Distribuição Cumulativa 54

4.4 Média e Variância de uma Variável

Aleatória Discreta 55

4.5 Distribuição Uniforme Discreta 57

4.6 Distribuição Binomial 58

4.7 Distribuições Geométrica e Binomial Negativa 62

4.7.1 Distribuição Geométrica 62

4.7.2 Distribuição Binomial Negativa 63

4.8 Distribuição Hipergeométrica 65

4.9 Distribuição de Poisson 68

Exercícios para Expandir a Mente

n

CAPÍTULO

5 Variáveis Aleatórias Contínuas e

Distribuições de Probabilidade

73

5.1 Variáveis Aleatórias Contínuas 73

5.2 Distribuições de Probabilidades e Funções

Densidade de Probabilidade 73

5.3 Funções de Distribuição Cumulativa 76

5.4 Média e Variância de uma Variável

Aleatória Contínua 77

5.5 Distribuição Uniforme Contínua 78

5.6 Distribuição Normal 79

5.7 Gráficos de Probabilidade 85

5.8 Aproximações das Distribuições Binomial e de

Poisson pela Normal 87

5.9 Distribuição Exponencial 89

5.10 Distribuições de Erlang e Gama 93

5.10.1 Distribuição de Erlang 93 5.10.2 Distribuição Gama 94

5.11 Distribuição de Weibull 95

CAPÍTULO

6 Distribuições de Probabilidades

Conjuntas

98

6.1 Duas Variáveis Aleatórias Discretas 98

6.1.1 Distribuições de Probabilidades Conjuntas 98 6.1.2 Distribuições de Probabilidades Marginais 99

(11)

X SUMÁRIO

6.1.3 Distribuições de Probabilidades Condicionais 100 6.1.4 Independência 101

6.2 Múltiplas Variáveis Aleatórias Discretas 104

6.2.1 Distribuições de Probabilidades Conjumas 104 6.2.2 Distribuição Multinomial de Probabilidades 105

6.3 Duas Variáveis Aleatórias Contínuas 107

6.3.1 Distribuições de Probabilidades Conjuntas 107 6.3.2 Distribuições de Probabilidades Marginais 108 6.3.3 Distribuições de Probabilidades Condicionais 109 6.3.4 Independência 111

6.4 Múltiplas Variáveis Aleatórias Contínuas 113

6.5 Covariância e Correlação 115

6.6 Distribuição Normal Bidimensional 118

6.7 Combinações Lineares de Variáveis Aleatórias 120

6.8 Desigualdade de Chebyshev 122

CAPíTULO 7

Estimação de Parâmetros

126

7.1 Inferência Estatística 126

7.2 Amostragem Aleatória 127

7.3 Propriedades de Estimadores 128

7.3.1 EstimadoresNão Tendenciosos 128 7.3.2 Variância de um Estimador 129

7.3.3 Erro·Padrão: Reportando uma Estimativa 130 7.3.4 Estimativa Bootstrap do Erro·Padrão 130 7.3.5 Erro Médio Quadrático de um Estimador 131

7.4 Método da Máxima Verossimilhança 132

7.5 Distribuições Amostrais 136

7.6 Distribuições Amostrais das Médias 136

7.7 Introdução a Intervalos de Confiança 139

CAPíTULO 8

Inferência Estatística para uma

Única Amostra

142

8.1 Teste de Hipóteses 142

8.1.1 Hipóteses Estatísticas 142

8.1.2 Testes de Hipóteses Estatísticas 143 8.1.3 Hipóteses Unilaterais e Bilaterais 147

8.1.4 Procedimento Geral para Testes de Hipóteses 148

8.2 Inferência sobre a Média de uma População com

Variância Conhecida 149

8.2.1 Testes de Hipóteses para a Média 149 8.2.2 Valorespnos Testes de Hipóteses 150 8.2.3 O Erro Tipo II e a Escolha do

Tamanho da Amostra 150

8.2.4 Teste para Amostras Grandes 152 8.2.5 Alguns Comemários Práticos sobre

Testes de Hipóteses 152

8.2.6 Intervalo de Confiança para a Média 153 8.2.7 Método Geral para Deduzir um

Intervalo de Confiança 155

8.2.8 Intervalos de Confiança Bootstrap 155

8.3 Inferência sobre a Média de uma População com

Variância Desconhecida 157

8.3.1 Testes de Hipóteses para a Média 157 8.3.2 Valorppara um Testet 159

8.3.3 Solução Computacional 159 8.3.4 Escolha do Tamanho da Amostra 160 8.3.5 Intervalo de Confiança na Média 161

8.4 Inferência sobre a Variância de uma

População Normal 163

8.4.1 Testes de Hipóteses para a Variância de uma

8.4.2 Erro[3e Escolha do Tamanho da Amostra 164 8.4.3 Intervalo de Confiança para a Variância de uma

8.5 Inferência sobre a Proporção de uma População 166

8.5.1 Testes de Hipóteses para uma

Proporção Binomial 166

8.5.2 Erro Tipo II e Escolha do Tamanho da Amostra 166 8.5.3 Intervalo de Confiança para uma

Proporção Binomial 167

8.6 Tabela com Resumo dos Procedimentos de Inferência

sobre uma Única Amostra 169

8.7 Testando a Adequação do Ajuste 169

8.8 Testes da Tabela de Contingência 172

CAPíTULO 9

Inferência Estatística para

Duas Amostras

179

9.1 Introdução 179

9.2 Inferência sobre uma Diferença nas Médias com

Variâncias Conhecidas 179

9.2.1 Testes de Hipóteses para uma Diferença nas Médias

com Variâncias Conhecidas 180

9.2.2 Escolha do Tamanho da Amostra 181 9.2.3 Identificando Causa e Efeito 182

9.2.4 Intervalo de Confiança para uma Diferença nas Médias

com Variâncias Conhecid~s 182

9.3 Inferência sobre a Diferença nas Médias de Duas Distribuições Normais com Variações

Desconhecidas 185

9.3.1 Testes de Hipóteses para a Diferença nas Médias, com

Variâncias Desconhecidas 185

9.3.2 Escolha do Tamanho da Amostra 187 9.3.3 Intervalo de Confiança para a

Diferença nas Médias 187

9.3.4 Solução Computacional 189

9 .4 Teste tEmparelhado 191

9.5 Inferências sobre as Variâncias de

Duas Populações Normais 195

9.5.1 Testes de Hipótesespara a Razãode DuasVariâncias 195 9.5.2 Erro ~ e Escolha do Tamanho da Amostra 197 9.5.3 Intervalo de Confiança para a Razão de

Duas Variâncias 197

(12)

9.6.1 Teste para Amostras Grandes, Considerando Ho:Pl

=

P2 198

9.6.2 Erro13e Escolha do Tamanho da Amostra 199

9.6.3 Intervalo de Confiança paraPl - P2 200

9.7 Tabela com o Resumo dos Procedimentos de Inferência

sobre Duas Amostras 201

CAPíTULO 10

Regressão Linear Simples

e Correlação

205

10.1 Modelos Empíricos 205

10.2 Regressão Linear Simples 207

10.3 Propriedades dos Estimadores de Mínimos Quadrados e

Estimação de cr 211

10,4 Abusos Comuns na Regressão 212

10.5 Testes de Hipóteses na Regressão Linear Simples 213

10.5.1 Uso de Testest 213

10.5.2 Análise de Variância: Uma Abordagem para Testar a Significância da Regressã~ 214

10.6 Intervalos de Confiança 216

10.6.1 Intervalos de Confiança para a Inclinação

e a Interseção 216

10.6.2 Intervalo de Confiança para a Resposta Média 217

10.7 Previsão de Novas Observações 218

10.8 Cálculo da Adequação do Modelo de Regressão 219

10.8.1 Análise Residual 219

10.8.2 Coeficiente de Determinação(R2) 221

10.8.3 Falta de Ajuste 221

10.9 Transformações para uma Linha Reta 224

10.lOCorrelação 224

Exercícios Suplementares 22 7

CAPíTULO 11

Regressão Linear Múltipla

230

11.1 Modelo da Regressão Linear Múltipla 230

11.2 Estimação de Parâmetros pelo Método dos Mínimos

Quadrados 232

11.3 Abordagem Matricial para a Regressão Linear

Múltipla 233

11.4 Propriedades dos Estimadores de Mínimos

Quadrados e Estimação de cr 240

11.5 Testes de Hipóteses para a Regressão

Linear Múltipla 241

11.5.1 Teste para Significância da Regressão 241

11.5.2 Teste para os Coeficientes Individuais de Regressãoe

Subconjuntos de Coeficientes 242

11.6 Intervalos de Confiança para a Regressão

Linear Múltipla 245

11.6.1 Intervalos de Confiança para os Coeficientes Individuais de Regressão 245

11.6.2 Intervalo de Confiança para a Resposta Média 245

11.7 Predição de Novas Observações 246

11.8 Medidas da Adequação do Modelo 247

SUMÁRIO

xi

11.8.1 Coeficiente de Determinação Múltipla(R2) 247

11.8.2 Análise Residual 248

11.8.3 Observações Influentes 249

11.9 Modelos de Regressão Polinomial 251

11.10 Variáveis Indicativas 252

11.11 Seleção de Variáveis na Regressão Múltipla 255

11.11.1 Problema de Construir o Modelo 255

11.11.2 Procedimentos Computacionais para a

Seleção de Variáveis 255

11.11.3 Saída Computacional para a

Regressão em Etapas 260

11.12 Multicolinearidade 263

CAPíTULO 12

Planej amento e Análise de

Experimentos com um Único Fator:

A Análise de Variância

268

12.1 A Estratégia de Experimentação 268

12.2 Experimento Completamente Aleatorizado

com um Único Fator 269

12.2.1 Um Exemplo 269

12.2.2 A Análise de Variância 270

12.2.3 Saída Computacional 273

12.2.4 Análise Residual e Verificação do Modelo 275

12.3 Testes para Médias Individuais de Tratamento 278

12.3.1 Comparação Gráfica das Médias 278

12.3.2 Contrastes Ortogonais 278

12.3.3 Método de Fisher da Mínima

Diferença Significativa 279

12,4 Modelo com Efeitos Aleatórios 281

12.5 Planejamento Aleatorizado com

Blocos Completos 284

12.5.1 Planejamento e Análise Estatística 284

12.5.2 Testes para as Médias Individuais

dos Tratamentos 287

12.5.3 Análise Residual e Verificação do Modelo 288

12.5.4 Planejamento Aleatorizado com Blocos Completos

e com Fatores Aleatórios 288

12.6 Determinação do Tamanho da Amostra em

Experimentos com um Único Fator 290

12.6.1 O Caso dos Efeitos Fixos 290

12.6.2 O Caso dos Efeitos Aleatórios 291

CAPíTULO 13

Planejamento de Experimentos

com Vários Fatores

295

13.2 Algumas Aplicações das Técnicas de

Planejamento de Experimentos 295

13.3 Experimentos Fatoriais 297

13.4 Experimentos Fatoriais com Dois Fatores 299

(13)

xii

SUMÁRIO

13,4.2 Verificação da Adequação do Modelo 303

13,4.3 Saída Computacional 303

13,4,4 Uma Observação por Célula 303

13,4.5 Fatores Aleatórios 304

13.5 Experimentos Fatoriais Gerais 306

13.6 Planejamento Fatorial 2k 309

13.6.1 Planejamento 22 310

13.6.2 Planejamento 2k parak ~ 3 Fatores 313

13.6.3 Réplica Única do Planejamento2k 318

13.6,4 Adição de Pontos Centrais a um

Planejamento 2k 320

13.7 Blocagem e Superposição no Planejamento 2k 323

13.8 Replicação Fracionária do Planejamento 2k 327

13.8.1 Uma Meia Fração do Planejamento 2k 327

13.8.2 Frações Menores: O Fatorial Fracionário2k-p 331

13.9 Métodos e Planejamentos de Superfície

de Resposta 336

13.9.1 Método da Ascendente de Maior Inclinação

(Steepest Ascent) 337

13.9.2 Análise de uma Superfície de Resposta de

Segunda Ordem 339

CAPíTULO 14

Estatística Não Paramétrica

347

14.2 Teste dos Sinais 348

14.2.1 Descrição do Teste 348

14.2.2 Teste dos Sinais para Amostras Emparelhadas 350

14.2.3 Erro Tipo II para o Teste dos Sinais 350

14.2,4 Comparação com o Testet 351

14.3 Teste de Wilcoxon do Posto com Sinais 352

14.3.1 Descrição do Teste 353

14.3.2 Aproximação para Amostras Grandes 353

14.3.3 Observações Emparelhadas 353

14.3,4 Comparações com o Testet 354

14.4 Teste de Wilcoxon da Soma :1osPostos 355

14,4.1 Descrição do Teste 355

14,4.2 Aproximação para Amostras Grandes 356

14,4.3 Comparação com o Testet 356

14.5 Métodos Não Paramétricos na Análise

de Variância 357

14.5.1 Teste de Kruskal-Wallis 357

14.5.2 Transformação de Posto 358

CAPíTULO 15

Controle Estatístico da

Qualidade

360

15.1 Melhoria e Estatística da Qualidade 360

15.2 Controle Estatístico da Qualidade 361

15.3 Controle Estatístico de Processo 361

15.4 Introdução aos Gráficos de Controle 361

15,4.1 Princípios Básicos 361

15,4.2 Projeto de um Gráfico de Controle 364

15,4.3 Subgrupos Racionais 364

15,4,4 Análise de Padrões de Comportamento para

Gráficos de Controle 365

15.5 Gráficos de Controle X e R 367

15.6 Gráficos de Controle para Medidas

Individuais 371

15.7 Capacidade de Processo 374

15.8 Gráficos de Controle para Atributos 377

15.8.1 Gráfico P (Gráfico de Controle para Proporções 377

15.8.2 GráficoU(Gráfico de Controle para

Defeitos por Unidade) 378

15.9 Desempenho do Gráfico de Controle 380

15.10 Gráfico de Controle da Soma

Cumulativa 382

15.11 Outras Ferramentas para Resolver

Problemas de CEP 386

15.12 Implementando o CEP 388

AP~NDICES

393

A Tabelas e Gráficos Estatísticos 395

B Material Técnico Suplementar 426

I Técnicas de Contagem 426

II Função Geradora de Momento 429

III Funções de Variáveis Aleatórias 432

IV Desenvolvimento das Distribuições

te F 436

V Abordagem Bayesiana para Estimação 437

VI Testes da Razão da Verossimilhança 439

VII Fatores Aleatórios em Experimentos

Fatoriais 440

C Bibliografia 445

D Respostas dos Exercícios Selecionados 447

(14)

o

Papel da Estatística

na Engenharia

ESQUEMA DO CAPÍTULO

1.1

o

MÉTODO DE ENGENHARIA E O JULGAMENTO

ESTATÍSTICO

1.1.1 Engenharia e Resolução de Problemas 1.1.2 Julgamento Estatístico

1.2 COLETANDO DADOS EM ENGENHARIA

1.1 O MÉTODO DE ENGENHARIA E O

JULGAMENTO

ESTATÍSTICO

1.1.1 Engenharia e Resolução

de Problemas

Um engenheiro é alguém que resolve problemas de interesse da sociedade, pela aplicação eficiente de princípios científicos. Os

engenheiros executam isso através do refmamento do produto

ou processos existentes, ou pelo projeto de um novo produto, ou

processo que encontre as necessidades dos consumidores. O

método de engenharia ou científico é a abordagem para

for-mular e resolver esses problemas. As etapas no método de en-genharia são dadas a seguir:

1. Desenvolver uma descrição clara e concisa do problema. 2. Identificar, no mínimo tentar, os fatores importantes que

afetam esse problema ou que possam desempenhar um

papel em sua solução.

3. Propor um modelo para o problema, usando conhecimento científico ou de engenharia do fenômeno estudado. Esta-belecer limitações ou suposições do modelo.

4. Conduzir experimentos apropriados e coletar dados para

testar ou validar o modelo-tentativa ou conclusões feitas

nas etapas 2 e 3.

5. Refinar o modelo, com base nos dados observados.

1.3 MODELOS MECANICISTAS E EMPÍRICOS 1.4 PLANEJANDO INVESTIGAÇÕES

EXPERIMENTAIS

1.5 OBSERVANDO PROCESSOS AO LONGO DO TEMPO

6. Manipular o modelo de modo a ajudar o desenvolvimento da solução do problema.

7. Conduzir um experimento apropriado para confirmar que a solução proposta para o problema é efetiva e eficiente. 8. Tirar conclusões ou fazer recomendações baseadas na

so-lução do problema.

As etapas no método de engenharia são mostradas na Fig. 1.1. Note que o método de engenharia caracteriza uma forte relação recíproca entre o problema, os fatores que podem influenciar sua solução, um modelo do fenômeno e a experiência para verificar a adequação do modelo e da solução proposta para o problema. As etapas 2-4, na Fig. 1.1, são colocadas em um retângulo, in-dicando que vários ciclos ou iterações dessas etapas podem ser

requeridos para obter a solução final. Conseqüentemente,

en-genheiros têm de saber como planejar, eficientemente, os

expe-rimentos, coletar dados, analisar e interpretar os dados e enten-der como os dados observados estão relacionados ao modelo que eles propuseram para o problema sob estudo.

O campo da estatística lida com a coleta, a apresentação, a

análise e o uso dos dados para tomar decisões, resolver proble-mas e planejar produtos e processos. Devido a muitos aspectos da prática de engenharia envolverem o trabalho com dados, ob-viamente algum conhecimento de estatística é importante para

qualquer engenheiro. Especificamente, técnicas estatísticas

(15)

produ-2 OPAPEL DA ESTATÍSTICA NA ENGENHARIA

Definição

Se as n observações em uma amostra forem denotadas por XI' X2, ... , X,,, então, a média da amostra será

12,6

+

12,9

+ ... +

13,1 8

EXEMPLO 1.1

A média da amostra da força de remoção para as oito observa-ções coletadas nos protótipos dos conectores é

8

2:

Xi X

=

Xl

+

Xl

+ ...

Xn

=

;=

I

n

8 (1.1) n

2:

Xi ;=1

n

x

=

XI

+

Xl

+ ... +

Xn n

A Fig. 1.2 apresenta um diagrama de pontos desses dados.

O diagrama de pontos é um gráfico muito útil para exibir um pe-queno conjunto de dados, isto é, cerca de 20 observações. Esse gráfico nos permitirá ver facilmente duas características dos

da-dos; a localização ou o meio, e o espalhamento ou a

variabili-dade. Quando o número de observações é pequeno, geralmente é dificil identificar qualquer padrão específico na variabilidade, embora o diagrama de pontos seja uma maneira conveniente de ver quaisquer características incomuns nos dados.

Podemos também descrever numericamente as

característi-cas dos dados. Por exemplo, podemos caracterizar a

localiza-ção ou tendência central nos dados através da média aritmética comum. Porque quase sempre pensamos em nossos dados como

sendo uma amostra, referir-nos-emos à média arítmética como

a média da amostra. tos e sistemas, melhorando os projetos existentes e planejando,

desenvolvendo e melhorando os processos de produção.

Métodos estatísticos são usados para nos ajudar a entender

a variabilidade. Por variabilidade, queremos dizer que

sucessi-vas observações de um sistema ou fenômeno não produzem exa-tamente o mesmo resultado. Todos nós encontramos

variabili-dade em nosso dia-a-dia e o julgamento estatístico pode nos dar

uma maneira útil para incorporar essa variabilidade em nossos

processos de tomada de decisão. Por exemplo, considere o de-sempenho de consumo de gasolina de seu carro. Você sempre consegue o mesmo desempenho de consumo em cada tanque de

combustível? Naturalmente, não -na verdade, algumas vezes o

desempenho varia consideravelmente. Essa variabilidade

obser-vada no consumo de gasolina depende de muitos fatores, tais

como o tipo de estrada mais usada recentemente (cidade ou

es-trada), as mudanças na condição do veÍCulo ao longo do tempo (que poderiam incluir fatores como desgaste do pneu ou com-pressão do motor ou desgaste da válvula), a marca e/ou número

de octanagem da gasolina usada, ou mesmo, possivelmente, as

condições climáticas. Esses fatores representam fontes

poten-ciais de variabilidade no sistema. A Estatística nos fornece uma

estrutura para descrever essa variabilidade e para aprender

so-bre quais fontes potenciais de variabilidade são mais importan-tes ou quais têm o maior impacto no desempenho de consumo de gasolina.

Encontramos também variabilidade em problemas de

enge-nharia. Por exemplo, suponha que um engenheiro esteja proje-tando um conector de náilon para ser usado em uma aplicação

automotiva. O engenheiro está considerando estabelecer como

especificação do projeto uma espessura de parede de 3/32 pole-gada, mas está, de algum modo, inseguro acerca do efeito dessa decisão na força de remoção do conector. Se a força de remoção for muito baixa, o conector pode falhar quando ele for instalado no motor. Oito unidades do protótipo são produzidas e suas for-ças de remoção são medidas, resultando nos seguintes dados (em libras-pé): 12,6; 12,9; 13,4; 12,3; 13,6; 13,5; 12,6; 13,1. Como antecipamos, nem todos os protótipos têm a mesma força de re-moção.

<-A média da amostra é o valor médio de todas as observações do conjunto de dados. Geralmente, esses dados são uma amos-tra de observações que foi selecionada a partir de alguma po-pulação grande de observações. Aqui, a popo-pulação deve

consis-Uma interpretação fisica da média da amostra como uma

medida da localização é mostrada na Fig. 1.3, que é um diagrama de pontos dos dados da força de remoção. Note que a média da

amostra x

=

13,0 pode ser pensada como um "ponto de

balan-ço". Ou seja, se cada observação representar 1 libra de massa

colocada no ponto no eixoX, então o fulcro localizado em

x

equilibraria exatamente esse sistema de pesos.

Força de remoção I 15 14 13,0 104 8 13

•

• ••

12

Fig. 1.1 O método de solução de um problema.

Fig. 1.2 Diagrama de pontos dos dados da força de remoção, quando a espessura da parede for 3/32 polegada.

(16)

o

PAPEL DA EsTA TfsTICA NA ENGENHARIA

3

Definição

Fig. 1.3 A média da amostra como um ponto de equilibrio para um sistema de pesos.

SeXI, X2, ..• , Xn for uma amostra de n observações, então a

variância da amostra será

tir em todos os conectores que serão vendidos aos consumido-res. Algumas vezes, existe uma população física real, tal como uma porção de pastilhas de silício produzidas em uma fábrica de

semicondutores. Podemos pensar também em calcular o valor

médio de todas as observações em uma população. Essa média é

chamada de média populacional, sendo denotada pela letra

gre-gafL(mi).

Quando houver um número finito de observações (isto é,N)

na população, então a média populacional será

Xi Xi -(Xi -X X)2 1 12,6 -0,40,16 2 12,9 -0,10,01 3 13,4 0,160,4 4 12,3 -0,70,49 5 13,6 0,360,6 6 13,5 0,250,5 7 12,6 -0,40,16 8 13,1 0,010,1

--

1"04,0 1,60

--

0,0

assim, a variância da amostra é

Tabela 1.1 Cálculo dos Termos para a Variância e Desvio-Padrão da Amostra

2 1,60 1,60 02286 (l'b ,)2

s

=

8 _ 1

=

-7-

=,

I

ras- pe

e o desvio-padrão da amostra é

EXEMPLO 1.2

A Tabela 1.1 apresenta as quantidades necessárias para

cal-cular a variância e o desvio-padrão da amostra para os dados

da força de remoção. Esses dados são graficados na Fig. 1.4. O numerador de S2é

8

L

(Xi - x)2

=

1,60

i=1

s

=

v'0,2286

=

0,48 libras-pé

dados da força de remoção do conector. Quanto maior a variabi-lidade nos dados da força de remoção, maior será o valor

absolu-to de alguns dos desvios Xi - X. Uma vez que os desvios Xi - X

somarão zero, temos de usar uma medida de variabilidade que

transforme os desvios negativos em quantidades não negativas.

Elevar ao quadrado os desvios é uma abordagem usada na

variância da amostra. Conseqüentemente, se S2for pequeno,

ha-verá, relativamente, pouca variabilidade nos dados; porém, se S2 for grande, a variabilidade será relativamente grande.

(1.2) (1.3) N

L

Xi i=1

f..L=--

_N n

L

(Xi - X)2 S2

=

_i=_I _

n - 1

i;

13

• L

•

• ••

I I 12_{Força de remoção} À1415

A média da amostra, X, é uma estimativa razoável da média

populacional, fL. Logo, o engenheiro durante o projeto do

conector usando uma espessura de parede de 3/32 polegada con-cluiria, com base nos dados, que uma estimativa da força de re-moção média seria 13,0 libras-pé.

Nos capítulos seguintes, discutiremos modelos para popula-ções infinitas e isso nos levará a urna defmição mais geral de

média populacional, fL.Muitos problemas importantes de

enge-nharia envolvem fazer referências ou tomar decisões sobre uma média populacional.

Embora a média da amostra seja útil, ela não transmite toda a informação acerca de uma amostra de dados. A variabilidade

ou dispersão nos dados pode ser descrita pela variância ou o

desvio-padrão da amostra.

o

desvio-padrão da amostra, s, é a raiz quadrada

positi-va da positi-variânci<;lda amostra. o oo o X o o o o

12 13 14 15

As unidades de medidas para a variância da amostra são o quadrado das unidades originais da variável. Assim, se x for medido em libras-pé, as unidades para a variância da amostra serão (libras-pé)2. O desvio-padrão tem uma propriedade desejá-vel de variabilidade de medida nas unidades originais da variádesejá-vel

de interesse,

x.

Como a Variância da Amostra Mede a Variabilidade?

Para ver como a variância da amostra mede a dispersão ou a

va-riabilidade, veja a Fig. 1.4 que mostra os desvios Xi - X para os

Fig. 1.4 Como a variância da amostra mede a variabilidade através dos desvios Xi - x.

(17)

4

OPAPEL DA EsTATÍSTICA NA ENGENHARIA

EXEMPLOl.3

Calcularemos a variância e o desvio-padrão da amostra,

usan-do o métousan-do usan-do atalho, Eq.

IA.

A fórmula fornece

n Il

2:

X?

+

n:x2 - 2:X

2:

Xi

i=1 i=1

n - 1

Note que a Eq.

IA

requer que se calcule o quadrado de cadaXi'

levando-se, então, ao quadrado a soma deXi' subtraindo

('i,xY/n

de

I

x;, e finalmente dividindo por n - I. Algumas vezes, isso é

chamado de método abreviado para cálculo deS2 (ou s).

n

e,já que

x

=

(l/n) _i

I,

Xi' essa última equação se reduz a

= 1

(±

X.)2 ±X?- i=1 I (104) 2 i=1

n

s

=---n -

1

(1.6) r

=

máx(xi) - mín(xi)

Uma definição mais geral da variância cr será dada adiante.

Observamos, previamente, que a média da amostra poderia ser

usada como uma estimativa da média populacional. Similarmen-te, a variância da amostra é uma estimativa da variância da po-pulação.

Note que o divisor da variância da amostra é o tamanho da

amostra menos um(n - I), enquanto para a variância da

popula-ção, o divisor é o tamanho

N

da população. Se soubéssemos o

valor verdadeiro da média populacional ]L, então poderíamos

encontrar a variância da amostra como a média dos quadrados

dos desvios das observações da amostra em tomo de ]L.Na

prá-tica, o valor de]Lquase nunca é conhecido e, dessa forma, a soma

dos quadrados dos desvios em tomo da média

x

da amostra tem

de ser usada. No entanto, as observações Xi tendem a ser mais

próximas de seu valor médio,

x,

do que a média populacional, ]L.

Por conseguinte, para compensar isso, usamos n - 1 como o

divisor em vez de n. Se usássemos n como o divisor na variância da amostra, obteríamos uma medida de variabilidade que seria, em média, consistentemente menor que a variância verdadeira cr da população.

Uma outra maneira de pensar acerca disso é considerar a

va-riância S2da amostra, como estando baseada em n - I graus de

liberdade. O termo graus de liberdade resulta do fato de que n

desvios Xl -

x,

X2 -

x, ...,

Xn -

x

sempre somam zero e,

as-sim, especificar os valores de quaisquer n - I dessas

quantida-des determina automaticamente aquele restante. Isso foi

ilus-trado na Tabela 1.1. Dessa forma, somente n - I dos n desvios,

Xi -

x,

estão livremente determinados.

Além da variância e do desvio-padrão da amostra, a amplitu-de da amostra, ou a diferença entre a maior e a menor observa-ção, é uma medida útil de variabilidade. A amplitude da amostra é definida como segue.

Definição

Se as n observações em uma amostra forem denotadas por

XI'X2, ... ,x," então a amplitude da amostra será

13536 _ (104f , 8 7 Il

2:

(X?

+

:x2 - 2ix;) i=1

n-n

2:

(xi

-:xi

2 i=1 S

=---n -

I

( n )2 n

2:

Xi

2:x?-

i=1 2 i= I n S

=---n -

1 Cômputo de

52

O cômputo deS2requer o cálculo de

x,

n subtrações e n

opera-ções de elevar ao quadrado e somar. Se as observaopera-ções originais

ou os desvios Xi -

x

não forem inteiros, pode ser tedioso

traba-lhar com os desvios Xi - X e vários decimais podem ter de ser

carregados para assegurar a exatidão numérica. Uma fórmula computacional mais eficiente para a variância da amostra é obti-da como segue:

e

s

=

VO,2286

=

0,48 libras-pé

Esses resultados concordam exatamente com aqueles obtidos previamente.

=

1,;0

=

0,2286 (libras-pé)2 Para os dados da força de remoção, a amplitude da amostra é

r

=

13,6 - 12,3

=

1,3. Geralmente, à medida que a variabilidade

nos dados da amostra aumenta, a amplitude da amostra

au-menta.

A amplitude da amostra é fácil de calcular, mas ignora toda a informação contida nos dados entre os valores maior e menor.

Por exemplo, as duas amostras 1,3,5,8 e 9 e 1,5,5,5,9 têm a

mesma amplitude (r

=

8). Entretanto, o desvio-padrão da

primei-ra amostprimei-ra éSI

=

3,35, enquanto o desvio-padrão da segunda

amostra éS2

=

2,83. A variabilidade é realmente menor na

segun-da amostra.

Algumas vezes, quando o tamanho da amostra for pequeno,

isto é, n

<

8 ou 10, a perda de informação associada com a

ampli-tude não é muito séria. Por exemplo, a ampliampli-tude é largamente utilizada em controle estatístico da qualidade, onde tamanhos de amostra de 4 ou 5 são razoavelmente comuns. Discutiremos algumas dessas aplicações no Capo 15.

A média, a varíância e o desvio-padrão da amostra e o diagra-ma de pontos são simples, ainda que efetivas diagra-maneiras de resu-(1.5)

N

2:

(xi - f.L)2

0'2

=

_i=_1 _

N

Análoga à variância da amostra S2,existe uma medida de

vari-abilidade na população chamada de variância da população. Usa-remos a letra grega cr (sigma ao quadrado) para denotar a variância

da população. A raiz quadrada positiva de

cr,

ouCJ', denotará o

desvio-padrão da população. Quando a população for finita e

con-sistir em

N

valores, podemos definir a variância da população

(18)

o

PAPEL DA EsTATÍSTICA NA ENGENHARIA 5

mir os dados. Outros métodos para descrever os dados serão apresentados no Capo 2.

Os engenheiros estão freqüentemente interessados em desen-volver um modelo do sistema ou processo que gerou os dados.

Esses modelos envolvem conceitos de probabilidade que serão

introduzidos no Capo 3. Veremos que a noção de uma

distribui-ção de probabilidade, como um modelo que descreve a

varia-bilidade em um sistema ou processo, é muito importante no

ambiente de engenharia. Os Caps. 4-6 explorarão esses concei-tos em detalhes.

1.1.2 Julgamento Estatístico

A necessidade de um julgamento estatístico aparece freqüente-mente na solução de problemas de engenharia. Considere o en-genheiro projetando o conector. A partir de testes em protótipo, ele sabe que uma estimativa razoável da força média de remo-ção seria 13,0 lb-ft. Entretanto, ele pensa que esse valor pode ser muito baixo para a aplícação pretendida; assim, ele decide considerar um projeto alternativo com uma espessura maior de parede, 1/8 polegada. Oito protótipos desse projeto são constru-ídos e as medidas observadas da força de remoção são: 12,9; 13,7;

12,8; 13,9; 14,2; 13,2; 13,5 e 13,1. A média e o desvio-padrão

da amostra são 13,4 e 0,50, respectivamente. Resultados para

ambas as amostras são graficados como diagrama de pontos na Fig. 1.5. Esse gráfico e os cálculos precedentes dão a impressão de que o aumento da espessura da parede levou a um aumento na força de remoção. No entanto, há algumas questões óbvias a perguntar. Por exemplo, como sabemos que uma outra amostra de protótipos não dará resultados diferentes? A amostra de oito

protótipos é adequada para fornecer resultados confiáveis? Se

usarmos .os resultados obtidos dos testes até agora para concluir

que aumentando a espessura da parede aumenta a resistência,

quais os riscos que estão associados com essa decisão? Por exem-plo, será possível que o aumento aparente na força de remoção observada nos protótipos mais espessos seja apenas devido à variabilidade aparente no sistema e que o aumento da espessura da parte (e seu custo) realmente não afete a força de remoção?

Freqüentemente, as leis fisicas (tais como a lei de Ohm e a

lei de gás ideal) são aplicadas para ajudar no projeto de

produ-tos e processos. Estamos familiarizados com esse raciocínio a

partir de leis gerais para casos especiais. Porém, também é im-portante raciocinar a partir de uma série específica de medidas para casos mais gerais para responder às questões prévias. Esse argumento é a partir de uma amostra (tal como os oito

conec-tores) para uma população (tal como os conectores que serão

vendidos aos consumidores). O raciocínio é referido como

inferência estatística. Ver Fig. 1.6. Historicamente, medidas

foram obtidas de uma amostra de pessoas e generalizadas para

uma população, mantendo-se a terminologia. Claramente, o

raciocínio baseado nas medidas de alguns objetos para medidas em todos os objetos pode resultar em erros (chamados de erros de amostragem). No entanto, se a amostra for selecionada ade-quadamente, esses riscos poderão ser quantificados e um tama-nho apropriado de amostra pode ser determinado.

• =f2polegada o= ~ polegada

Fig. 1.6 Inferência estatistica é um tipo de raciocínio.

População futura ? Tempo. 1- - - - - - , I I I I I I I I I I , J Estudo analítico Estudo enumerativo 1- - - , I I População I ? :

(:::)

:

!_-~---j

xl' X2"'" xn.

Em alguns casos, a amostra é realmente selecionada a

par-tir da população. A amostra é um subconjunto da população.

Por exemplo, uma amostra de três pastilhas pode ser

selecio-nada de um lote de produção de pastilhas na fabricação de

semicondutores. Baseado nos dados da amostra, queremos

concluir alguma coisa a respeito do lote. Por exemplo, a média

das medidas de resistividade na amostra (:X) não é esperada

para igualar exatamente à média das medidas de resistividade

no lote (f.L). Entretanto, se :x for alta, devemos estar

preocu-pados com que f.L seja muito alta. A inferência estatística é a

partir de :x para f.L.

Em outros casos, a população não existe ainda, mas deve ser pensada como futuras réplicas dos objetos na amostra. Para

res-ponder às questões prévias, os oito protótipos dos conectores

têm de ser representantivos, de certo modo, daqueles que serão

vendidos aos consumidores. Geralmente, os oito conectores são

vistos como uma amostra da população de conectores que serão vendidos aos consumidores. Claramente, essa análise requer al-guma noção de estabilidade como uma suposição adicional. Por exemplo, deve ser considerado que as fontes de variabilidade na fabricação de protótipos (tais como temperatura, pressão e tem-po de cura) são as mesmas que aquelas para os conectores que serão vendidos aos consumidores.

O exemplo de pastilhas a partir de lotes é chamado de estudo

enumerador. Uma amostra é usada para fazer uma inferência à

população da qual a amostra é selecionada. O exemplo do conector é chamado de estudo analítico. Uma amostra é usada para fazer uma inferência a uma população futura. As análises estatísticas são geralmente as mesmas em ambos os casos, porém um estudo analítico requer, claramente, uma suposição de estabilidade. Ver Fig.1.7. I 15 o • 00 00 o o o

• ••

I 13 14 Força de remoção

•

12

(19)

6

OPAPEL DA ESTATÍSTICA NA ENGENHARIA

1.2 COLETANDO DADOS DE ENGENHARIA

Na seção prévia, ilustramos alguns métodos simples para resu-mir dados. No ambiente de engenharia, os dados são quase sem-pre uma amostra que foi selecionada a partir de alguma

popula-ção. Geralmente, esses dados são coletados em uma das duas

maneiras a seguir.

A primeira maneira pela qual os engenheiros freqüentemente

coletam dados é a partir de um estudo observacional. Nessa

situ-ação, o processo ou sistema que está sendo estudado pode ser

observado somente pelo engenheiro e os dados são obtidos à

medida que se tomam disponíveis. Por exemplo, suponha que um engenheiro esteja avaliando o desempenho de um processo de fabricação de componentes plásticos através da injeção em

mol-de. Pode-se observar o processo, selecionar componentes à

medida que são fabricados e medir importantes características de interesse, tais como a espessura da parede, o encolhimento ou a resistência da peça. O engenheiro pode medir também e registrar

as variáveis de processo potencialmente importantes, tais como

a temperatura do molde, o conteúdo de umidade da

matéria-pri-ma e o tempo do ciclo. Freqüentemente, em um estudo

observa-dor, o engenheiro está interessado em usar os dados para cons-truir um modelo do sistema ou processo. Esses modelos são freqüentemente chamados de modelos empíricos, sendo introdu-zidos e ilustrados em maiores detalhes na próxima seção. Uma outra maneira é que os dados observados são obtidos através da análise de dados históricos do sistema ou processo. Por

exem-plo, na fabricação de semicondutores, é razoavelmente comum

manter registros extensos de cada batelada ou lote de pastilhas que foi produzido. Esses registros incluiriam dados de teste de

características fisicas e elétricas das pastilhas, assim como as

condições de processamento sob as quais cada batelada de

pas-tilhas foi produzida. Se aparecerem questões relativas a uma

mudança em uma importante característica elétrica, a história do processo pode ser estudada em um esforço para determinar o ponto no tempo onde a mudança ocorreu e para ganhar algum

discernimento em relação às variáveis do processo que devem

ser responsáveis pela mudança. Freqüentemente, esses estudos

envolvem um conjunto muito grande de dados e requerem um firme domínio dos princípios estatísticos, se o engenheiro quiser alcançar o sucesso.

A segunda maneira pela qual os dados de engenharia são

ob-tidos é através de um experimento planejado. Em um

experi-mento planejado, o engenheiro faz varíações propositais nas va-riáveis controláveis de alguns sistemas ou processos, observa os dados de saída do sistema resultante e, então, faz uma inferência ou decisão sobre as variáveis que são responsáveis pelas

mudan-ças observadas no desempenho de saída. O exemplo do conector de plástico na seção prévia ilustrou um experimento planejado; ou seja, uma mudança deliberada foi feita na espessura da pade do conector, com o objetivo pade padescobrir se uma força pade

re-moção maior poderia ser ou não obtida. O planejamento de

ex-perimentos tem um papel muito importante no projeto e desen-volvimento de engenharia e na melhoria dos processos de fabri-cação. Geralmente, quando produtos e processos são planejados e desenvolvidos com experimentos planejados, eles têm melhor desempenho, mais alta confiabilidade e menores custos globais.

Experimentos planejados também desempenham um papel

crucial na redução do tempo de condução de um projeto de en-genharia e do desenvolvimento de atividades. Na Seção 1.4, ilus-traremos vários tipos de experimentos planejados para o exem-plo do conector.

Na Seção 1.1, introduzimos os conceitos de estudos

enumeradores e analíticos. A maioria dos problemas de

enge-nharia envolve os estudos analíticos. Os dados provenientes de observação e os dados provenientes de experimentos planejados podem ser obtidos em ambos os tipos de estudos, mas freqüen-temente eles envolvem estudos analíticos; isto é, a inferência ou decisão da análise é sobre como o sistema ou o processo se de-sempenhará no futuro.

A habilidade de pensar e analisar, estatisticamente, os dados

amostrais nos capacitará a responder questões sobre o sistema ou o processo em estudo. Por exemplo, considere o problema a respeito da escolha da espessura da parede do conector de nái-lon. Uma abordagem que poderia ser usada na resolução desse problema é comparar as médias da força de remoção para 3/32

polegada, JkJI32,e para 1/8 polegada, J.LU8,usando a técnica de teste

estatístico de hipóteses. Os Caps. 8 e 9 discutirão o teste de hi-póteses e outras técnicas relacionadas. Em geral, uma hipótese é uma afirmação sobre algum aspecto do sistema em que tenha-mos interesse. Por exemplo, o engenheiro pode estar interessa-do em saber se a força média de remoção de 3/32 polegada ex-cede a carga máxima típica a ser encontrada nessa aplicação, ou seja, 12,75 libras-pé. Assim sendo, estaríamos interessados em

testar o teste de hipóteses em que a resistência média J.L3132

exce-deria 12,75 libras-pé. Isso é chamado de problema de teste de hipóteses com uma única amostra. O Capo 8 apresentará

técni-cas para esse tipo de problema. Alternativamente, o engenheiro

pode estar interessado em testar a hipótese de que um aumento da espessura da parede de 3/32 para 1/8 de polegada resulta em um aumento da força média de remoção. Claramente, esse é um exemplo de estudo analítico e também um exemplo de um pro-blema envolvendo teste de hipóteses para duas amostras. Pro-blemas desse tipo serão discutidos no Capo 9.

---EXERCÍCIOS

PARA AS SEÇÕES 1.1 E

1.2---1.1. Foram feitas oito medidas do diâmetro interno de anéis de pis- 7099; 6930; 6992; 7518; 7100; 6935; 7518; 7013; 6800; 7041 tão forjados de um motor de um automóvel. Os dados (em mm) e 6890. Calcule a média e o desvio-padrão da amostra. Cons-são: 74,001; 74,003; 74,015; 74,000; 74,005; 74,002; 74,005 e trua um diagrama de pontos dos dados.

74,004. Calcule a média e o desvio-padrão da amostra, construa 1.4. Um artigo no Journal o/ Structural Engineering (Vol. 115, um diagrama de pontos e comente os dados. 1989) descreve um experimento para testar a resistência resul-1.2. Em Applied Li/e Data Analysis (Wiley, 1982), Wayne Nelson tante em tubos circulares com calotas soldadas nas

extremida-apresenta o tempo de esgotamento de um fluido isolante entre des. Os primeiros resultados (em kN) são: 96; 96; 102; 102; 102; eletrodos a 34 kV. Os tempos, em minutos, são: 0,19; 0,78; 104; 104; 108; 126; 126; 128; 128; 140; 156; 160; 160; 164 e 0,96; 1,31; 2,78; 3,16; 4,15; 4,67; 4,85; 6,50; 7,35; 8,01; 8,27; 170. Calcule a média e o desvio-padrão da amostra. Construa 12,06; 31,75; 32,52; 33,91; 36,71 e 72,89. Calcule a média e um diagrama de pontos dos dados.

o desvio-padrão da amostra. 1.5. Um artigo em Human Factors (junho de 1989) apresentou da-1.3. A edição de janeiro de 1990 de Arizona Trend contém um su- dos sobre a acomodação visual (uma função do movimento do plemento descrevendo os 12 "melhores" campos de golfe do olho), reconhecendo um padrão de mancha em um vídeo CRT estado. Os comprimentos desses campos emjardas são: 6981; de alta resolução. Os dados são: 36,45; 67,90; 38,77; 42,18;

(20)

o

PAPEL DA EsTATÍSTlCA NA ENGENHARIA 7

1.6.

26,72; 50,77; 39,30 e 49,71. Calcule a média e o desvio- 1.7. padrão da amostra. Construa um diagrama de pontos dos

dados. 1.8.

Os seguintes dados são medidas de intensidade solar direta (watts/m2), em dias diferentes, em uma localização no sul da Espanha: 562; 869;708;775;775;704; 809; 856;655; 806; 878; 909; 918; 558; 768; 870; 918; 940; 946; 661; 820; 898; 935; 952; 957; 693; 835; 905; 939; 955; 960; 498; 653; 730 e 753. Calcule a média e o desvio-padrão da amostra.

Para cada um dos Exercícios 1.1 a 1.6, discuta se os dados resul-tam de um estudo observado ou de um experimento planejado. A edição de 22 de abril de 1991 de Aviation Week and Space Technology reporta que, durante uma operação de guerra no deserto, pilotos da força aérea americana (F-117A) realizaram

1270 vôos de combate, com um total de 6905 horas. Qual foi a duração média de uma missão F -117 A durante essa opera-ção? Por que o parâmetro que você calculou foi a média po-pu1aciona1 ?

1.3 MODELOS MECANICISTAS

E EMPÍRICOS

em que aforma da função f

é

desconhecida. Talvez, um modelo de trabalho pudesse ser desenvolvido a partir de uma expansão em série de Taylor, considerando apenas o termo de primeira ordem, produzindo assim um modelo da forma

Mn

=

130

+

131V

+

!32C

+

!33T (1.10)

sendo f3's os parâmetros desconhecidos. Agora, assim como na lei de Ohm, esse modelo não descreverá exatamente o fenômeno, de modo que devemos considerar outras fontes de variabilidade Os modelos desempenham um importante papel na análise de praticamente todos os problemas de engenharia. Muito da edu-cação formal de engenheiros envolve o aprendizado sobre os modelos relevantes a campos e a técnicas específicos para apli-car esses modelos na formulação e solução de problemas. Como um simples exemplo, suponha que estejamos medindo a corren-te em um fio fino de cobre. Nosso modelo para esse fenômeno pode ser a lei de Ohm

Corrente

=

voltagem/resistência

(1.11)

Tabela 1.2 Dados sobre a Resistência de Tração da Cola no Arame Resistência Comprimento Número da àTração do Arame Altura do Molde Observação y XI X,

I

9,95250 2 24,458110 3 31,7511120 4 35,0010550 5 25,028295 6 16,864200 7 14,382375 8 9,60252 9 24,359100 10 27,503008 11 17,084124 12 37,0011400 13 41,9512500 14 11,663602 15 21,652054 16 17,894004 17 69,0020600 18 10,305851 19 34,9310540 20 46,5915250 21 44,8815290 22 54,1216510 23 56,6317590 24 22,131006 25 21,154005

Esse é o modelo que usaremos para relacionar o peso molecular às outras três variáveis. Esse tipo é chamado modelo empírico; ou seja, ele usa a nossa engenharia e o conhecimento científico do fenôme-no, porém não é diretamente desenvolvido a partir de nosso conheci-mento teórico ou dos primeiros princípios do mecanismo básico. Com o objetivo de ilustrar essas idéias com um exemplo espe-cífico, considere os dados na Tabela 1.2. Essa tabela contém da-dos das três variáveis, que foram coletados em uma planta de fa-bricação de semicondutores. Nessa planta, o semicondutor [mal é um arame colado a uma estrutura. As variáveis reportadas são a resistência à tração (uma medida da quantidade de força requerida para romper a cola), o comprimento do arame e a altura da matriz. Gostariamos de encontrar um modelo relacionando a resistência à tração, ao comprimento do arame e à altura da matriz. Infelizmente, não há mecanismo fisico que possamos facilmente aplicar aqui. Por conseguinte, não parece provável que a aborda-gem de modelo mecanicista possa ser usada com sucesso. Note que esse é um exemplo de um estudo observador (ver Seção 1.2). que possam afetar o peso molecular. Desse modo, adicionamos um outro termo ao modelo resultando

(1.9) (1.8) (1. 7)

1= E/R

I=E/R+E Mn

=

I(V,

C, T)

sendo Eum termo adicionado ao modelo para considerar o fato de que os valores observados da corrente não seguem perfeita-mente o modelo mecanicista. Podemos pensar Ecomo sendo um termo que inclui os efeitos de todas as fontes não modeladas de variabilidade que afetam esse sistema.

Algumas vezes, os engenheiros trabalham com problemas para os quais não há modelo mecanicista simples ou bem enten-dido, que explique o fenômeno. Por exemplo, suponha que este-jamos interessados no peso molecular médio (Mil) de um polímero. Agora, sabemos que Mil está relacionado à viscosi-dade (V) do material e também depende da quantidade de catalisador (C) e da temperatura (1)no reator de polimerização, quando o material é fabricado. A relação entre Mil e essas variá-veis é

Chamamos esse tipo de modelo mecanístico, porque ele é construído a partir de nosso conhecimento do mecanismo fisico básico, que relaciona essas variáveis. No entanto, se fizermos esse processo de medição mais de uma vez, talvez em tempos dife-rentes, ou mesmo em dias diferentes, a con"ente observada po-derá diferir levemente por causa de pequenas mudanças ou vari-ações em fatores que não estejam perfeitamente controlados, tais como mudanças na temperatura ambiente, flutuações no desem-penho do medidor, pequenas impurezas presentes em diferentes localizações do fio e impulsos na voltagem. Logo, um modelo mais realista da corrente observada pode ser