• Nenhum resultado encontrado

Estatística Descritiva

N/A
N/A
Protected

Academic year: 2021

Share "Estatística Descritiva"

Copied!
15
0
0

Texto

(1)

Estatística Descritiva

Caso em estudo

Humidade relativa média diária (%) e temperatura do ar média diária (ºC) medidas na estação meteorológica de S. Brás de Alportel nos primeiros 168 dias do ano de 2007.

(dados do Sistema Nacional de Informação dos Recursos Hídricos-SNIRH).

Ficheiro de dados do SPSS:

S. Brás_Temp_HR.sav

Amostra do dados, para exemplificar a criação do ficheiro no SPSS

Data Humidade

relativa média diária (%)

Temperatura do ar média diária

(ºC)

1 01-JAN-2007

09:00 74,3 13,4

2 02-JAN-2007

09:00 77,7 13,4

3 03-JAN-2007

09:00 68,5 12,9

4 04-JAN-2007

09:00 64,7 13,5

5 05-JAN-2007

09:00 69,2 12,6

6 06-JAN-2007

09:00 79,4 12,5

7 07-JAN-2007

09:00 86,0 11,4

8 08-JAN-2007

09:00 83,8 11,5

9 09-JAN-2007

09:00 77,7 10,0

10 10-JAN-2007

09:00 84,9 10,4

11 12-JAN-2007

09:00 69,9 11,2

Roteiro do trabalho a realizar, com o auxílio do SPSS

1. Colocar os dados da temperatura por ordem crescente [Data>Sort Cases...], e obter o relatório [Analyze>Reports>Case Summaries...].

2. Obter a distribuição de frequências para a humidade relativa e a temperatura [Analyze>Descriptive Statistics>Frequencies...].

3. Obter o histograma para: (i) a humidade relativa, com 7 classes de intervalo I=10%, l 1 =30, L 7 =100 e (ii) a temperatura, com 9 classes de intervalo I=3ºC, c 1 =3,0, c 9 =27. Pedir o ajustamento da curva normal aos histogramas [Graphs>Legacy Dialogs>Histogram ...].

4. A partir dos histogramas obtidos em 3., construir as distribuições de frequências das duas variáveis.

5. Obter os valores das medidas de tendência central (média, mediana, moda), medidas de dispersão (amplitude, variância, desvio-padrão), medidas de forma (assimetria, curtose) e os quartis (1º, 2º e 3º) de ambas as variáveis [Analyze>Descriptive Statistics>Frequencies...].

6. Fazer uma análise exploratória completa para as duas variáveis, que inclua todo

o tipo de medidas descritivas, testes da normalidade de distribuição, diagrama de

caule-e-folha e diagnóstico de “outliers” [Analyze>Descriptive Statistics>Explore...].

(2)

7. Obter o diagrama de dispersão humidade relativa vs. temperatura, com a respectiva recta de regressão linear [Graphs>Legacy Dialogs>Scatter/Dot ...].

8. Pedir um relatório com a listagem só dos datas em que a temperatura excedeu os 18ºC. [Data>Select Cases>If condition is satisfied...; Analyze>Reports>Case Summaries...]

9. Seleccionar uma amostra aleatória de 20 dias dos 168 dias abrangidos pelo estudo, e pedir depois um relatório com a respectiva listagem [Data>Select Cases>Random sample of cases...; Analyze>Reports>Case Summaries...]

Roteiro do trabalho a realizar, com a calculadora:

Para a amostra de 11 observações acima, obtenha:

1. Obter os valores da média, mediana, quartis, desvio inter-quartis, variância, desvio-padrão e coeficiente de variação das duas variáveis.

2. Construir o diagrama de caixa-e-bigodes.

(3)

Distribuições de Probabilidade

1. Seja Z uma variável aleatória com distribuição normal padrão. Calcule as seguintes probabilidades:

a) P ( Z ≥ 2,53 ). [0,00570]

b) P ( 0 ≤ Z ≤ 2,53 ). [0,49430]

c) P ( -2,53 ≤ Z ≤ 2,53 ). [0,98860]

d) P ( Z ≤ -0,42 ). [0,3372]

e) P ( -1,37 ≤ Z ≤ 2,50 ). [0,90849]

f) P ( Z ≥ 1,576 ). [0,0575]

2. Em cada uma das alíneas seguintes, determine o valor da constante c que torna a proposição de probabilidade verdadeira:

a) P ( Z ≥ c ) = 0,0256. [1,95]

b) P ( Z ≤ c ) = 0,0197. [–2,06]

c) P ( 0 ≤ Z ≤ c ) = 0,3078. [+0,87 ou -0,87]

d) P ( -c ≤ Z ≤ +c ) = 0,8354. [1,39]

e) P (c ≤ | Z | ) = 0,016. [2,41]

3. O recipiente plástico usado por um fabricante para comercializar um determinado fertilizante líquido foi planeado para conter um volume de 15 litros de líquido. Suponha que a variável que representa a capacidade real de um recipiente deste tipo é normalmente distribuída, com uma média igual a 15 litros e um desvio padrão de 0,2 litros.

a) Qual a probabilidade de um recipiente escolhido ao acaso ter, no máximo, uma capacidade de 14,6 litros? [0,0228]

b) Qual a probabilidade de um recipiente escolhido ao acaso ter uma capacidade compreendida entre 14,7 e 15,1 litros? [0,6247]

c) Qual o valor da variável tal que 33% dos recipientes têm uma capacidade que lhe é igual ou inferior? [14,912 litros]

d) Admita que se conseguem fertilizar 250 vasos com cada litro de fertilizante líquido. Calcule qual a probabilidade de se poderem fertilizar 3700 vasos com uma única embalagem do produto. [0,8413]

4. Suponha que a variável que traduz o nível de glucose no sangue (em jejum) de uma certa população humana segue uma lei normal com média 106 mg/100 ml e um desvio-padrão de 8 mg/100 ml.

a) Calcule a probabilidade de um indivíduo aleatoriamente seleccionado desta população ter um valor de glucose inferior a 120 mg/100 ml . [0.9599]

b) Calcule a probabilidade de um indivíduo aleatoriamente seleccionado desta população ter um valor de glucose entre 98 mg/100 ml e 116 mg/100 ml . [0.7357]

c) Calcule o valor da variável aleatória tal que 25% dos indivíduos da população têm um nível sanguíneo de glucose que lhe é inferior. [100.6 mg/100 ml]

d) Imagine que ao estudar uma amostra de indivíduos aleatoriamente

seleccionados da população encontrou um índivíduo com um teor de

glucose superior a 130 mg/100 ml. Acha que isso consitui preocupação em

(4)

relação à situação da população relativamente à variável em estudo?

Explique com base na probabilidade de isto ocorrer de forma natural [não;

é um evento bastante raro, com P=0.00135]

5. Determine os quartis de uma:

a) distribuição normal “standard” . [Q 1 =-0.67, Q 2 =0.00, Q 3 =0.67]

b) distribuição normal com µ=220 e σ=25 . [Q 1 =203.25, Q 2 =220, Q 3 =236.75]

6. Utilize as tabelas das distribuições t de Student (*) para determinar os valores de:

a) t 0,05 (8). [1,860]

b) t 0,10 (15). [1,341]

c) t 0,025 (12). [2,179]

d) t 0,001 (150). [3,090]

e) o 90º percentil da distribuição t com 22 graus de liberdade. [1,321]

f) o P 10 da distribuição t com 22 graus de liberdade. [–1,321]

g) o valor de t tal que P [-t ≤ t (25) ≤ +t ]=0,95. [2,060]

h) o valor de t tal que P [ t (20) ≥ t ]=0,10. [1,325]

i) o valor de t tal que P [ t (16) ≥ -t ]=0,95. [1,746]

j) P ( | t | > 3,435 ) na distribuição t com 26 graus de liberdade. [0,002]

(*) Leia as probabilidades na linha indicadora inferior da tabela.

7. Utilize as tabelas das distribuições F de Snedecor para determinar os valores de:

a) F 0,05 (5, 8). [3,69]

b) F 0,10 (10, 9). [2,42]

c) P [ F (30, 30) ≥ 2,07 ]. [0,025]

d) P [ F (6, 4) ≤ 6,16 ]. [0,95]

e) o 99º percentil da distribuição F com 10 graus de liberdade no numerador e 12 graus de liberdade no denominador. [4,30]

f) o P 95 da distribuição F com 20 graus de liberdade no numerador e um número infinito graus de liberdade no denominador. [1,57]

g) P [ 3,30 ≤ F (10, 5) ≤ 13,62 ]. [0,095]

(5)

Testes de Hipóteses

Caso em estudo nº 1

No quadro abaixo figuram as diferenças entre o peso real e o peso ideal (kg) numa amostra de 20 indivíduos. O médico suspeita que o peso real na população excede em mais de 10 kg o peso ideal.

diferença entre o peso real e o peso ideal (kg)

1 13,61

2 12,25

3 6,80

4 10,89

5 19,96

6 10,43

7 15,88

8 12,25

9 9,07

10 9,07

11 11,79

12 14,06

13 8,62

14 8,62

15 9,07

16 7,26

17 15,88

18 21,32

19 6,35

20 21,32

1. Realize no SPSS o teste apropriado para averiguar se há evidência suficiente nestes dados para se concluir que o peso médio dos indivíduos daquela população excede em 10 kg o peso ideal. [Analyze>Compare Means>One-Sample T test...].

a) Quais são as hipóteses do teste? O teste é uni- ou bilateral?

b) Qual é o valor amostral do estatístico t de Student? Qual é o valor de probabilidade que lhe está associado? [t=2.150; p=0.045/2]

c) Qual a conclusão a tirar do estudo?

d) Quais são os limites de confiança do intervalo de confiança da diferença média? Que conclusão se tira (justificar) deste intervalo sobre o teste de hipóteses? [0,0590;4,3900]

e) Acha o teste suficientemente conclusivo ou recomendaria um aumento do tamanho da amostra? Justifique.

2. Realize agora o teste sem recorrer ao SPSS (calculadora electrónica).

Caso em estudo nº 2

O cortisol é uma hormona que afecta a disposição e a concentração das pessoas.

Mediram-se as concentrações de cortisol na saliva de pessoas que se levantam cedo e

tarde. O estudo tinha como finalidade averiguar se a concentração da hormona é inferior

nas pessoas que se levantam mais cedo.

(6)

hora de despertar cortisol na saliva

1 cedo 190

2 cedo 192

3 cedo 211

4 cedo 203

5 cedo 177

6 cedo 203

7 cedo 195

8 cedo 252

9 cedo 162

10 cedo 229

11 cedo 175

12 cedo 189

13 tarde 203

14 tarde 273

15 tarde 253

16 tarde 314

17 tarde 239

18 tarde 253

19 tarde 265

20 tarde 254

21 tarde 237

22 tarde 268

23 tarde 268

24 tarde 163

25 tarde 258

1. Utilize o SPSS para realizar o teste de hipóteses apropriado para dar resposta à questão de interesse. [Analyze>Compare Means>Independent- Samples T test...].

a) Quais são as hipóteses do teste? O teste é uni- ou bilateral?

b) Trata-se de um caso de variâncias homogéneas ou não-homogéneas?

c) Qual é o valor amostral do estatístico t de Student? Qual é o valor de probabilidade que lhe está associado? [t= -4,154; p= 0,00038/2]

d) Qual a conclusão a tirar do estudo?

e) Quais são os limites de confiança do intervalo de confiança da diferença das médias? Que conclusão se tira (justificar) deste intervalo sobre o teste de hipóteses? [-77,417;-25,942]

2. Realize agora o teste sem recorrer ao SPSS (calculadora electrónica).

Caso em estudo nº 3

Empreendeu-se um estudo para determinar os efeitos das chuvas ácidas e de

outros poluentes industriais na qualidade da água dos lagos de uma região. Colheram-se

amostras de 10 lagos situados numa área fortemente industrializada e de 8 lagos

localizados numa área de floresta primitiva. Obtiveram-se os seguintes valores para o

pH da água:

(7)

localização dos lagos pH da água

1 Área industrializada 6,9

2 Área industrializada 6,2

3 Área industrializada 6,3

4 Área industrializada 5,9

5 Área industrializada 6,0

6 Área industrializada 7,0

7 Área industrializada 6,5

8 Área industrializada 6,6

9 Área industrializada 5,5

10 Área industrializada 7,3

11 Área Florestal 7,0

12 Área Florestal 6,9

13 Área Florestal 6,7

14 Área Florestal 7,1

15 Área Florestal 6,8

16 Área Florestal 7,1

17 Área Florestal 7,0

18 Área Florestal 7,2

1. Utilize o SPSS para realizar um teste t para a hipótese segundo a qual os valores médios do pH das águas dos lagos das duas áreas são idênticos, contra a alternativa de o das dos lagos situados na área industrializada ser inferior ao das dos lagos das regiões florestais intactas.

[Analyze>Compare Means>Independent-Samples T test...].

a) Quais são as hipóteses do teste? O teste é uni- ou bilateral?

b) Trata-se de um caso de variâncias homogéneas ou não-homogéneas?

c) Qual é o valor amostral do estatístico t de Student? Qual é o valor de probabilidade que lhe está associado? [t= -3,015; p= 0,012/2]

d) Qual a conclusão a tirar do estudo?

e) Quais são os limites de confiança do intervalo de confiança da diferença das médias? Que conclusão se tira (justificar) deste intervalo sobre o teste de hipóteses? [-0,9602;-0,1498]

f) Chegaria uma conclusão idêntica no teste se ignorasse a diferença de variâncias existente entre as duas populações?

2. Realize agora o teste sem recorrer ao SPSS (calculadora electrónica).

Caso em estudo nº 4

No quadro abaixo figuram as contagens de células CD4 no sangue de 20 indivíduos seropositos no início e um ano após o tratamento com uma nova droga antiviral. As CD4 fazem parte do sistema imunitário humano e costumam morrer por efeito do HIV.

1. Realize no SPSS o teste apropriado para tirar uma conclusão sobre se a droga antiviral é ou não eficaz na reposição dos níveis de células CD4 no sangue. [Analyze>Compare Means>Paired-Samples T test...].

a) Quais são as hipóteses do teste? O teste é uni- ou bilateral?

b) Qual é o valor amostral do estatístico t de Student? Qual é o valor de probabilidade que lhe está associado? [t= -4,491; p= 0,00025/2]

c) Qual a conclusão a tirar do estudo?

(8)

d) Quais são os limites de confiança do intervalo de confiança da diferença das médias? Que conclusão se tira (justificar) deste intervalo sobre o teste de hipóteses? [-1,18019; -,42981]

2. Realize agora o teste sem recorrer ao SPSS (calculadora electrónica).

% de células CD4 no início da experiência

% de células CD4 1 ano após tratamento com a

droga

1 2,1 2,47

2 4,4 4,61

3 3,4 5,26

4 2,5 3,02

5 4,0 6,36

6 5,1 5,93

7 3,8 3,93

8 3,4 4,09

9 4,1 4,88

10 3,4 3,81

11 4,2 4,74

12 3,6 3,29

13 3,4 5,55

14 1,9 2,82

15 2,6 4,23

16 3,0 3,23

17 2,5 2,56

18 3,0 4,31

19 2,7 4,37

20 3,0 2,40

(9)

Análise de Variância

Caso em estudo nº 1

Fez-se um estudo destinado a comparar os efeitos de seis inóculos de bactérias fixadoras de azoto sobre o teor de N presente em plantas de trevo vermelho. Cinco dos inóculos (3DOk1, 3DOk4, 3DOk5, 3DOk7 e 3DOk13) eram culturas de Rhizobium trifolii, que é característico do trevo vermelho, e o sexto era uma cultura compósita de 5 linhagens de Rhizobium meliloti, típico da luzerna. Cinco plantas da espécie foram, de forma aleatória, inoculadas com cada um dos 6 inóculos (tratamentos). A experiência foi realizada numa estufa com condições controladas, usando o delineamento experimental completamente casualizado, com 5 vasos (réplicas) por tratamento. A variável medida foi o teor de N em mg planta -1 .

inóculo aplicado

teor de azoto (mg/planta)

1 3DOk1 29,4

2 3DOk1 32,6

3 3DOk1 27,0

4 3DOk1 32,1

5 3DOk1 33,0

6 3DOk5 22,8

7 3DOk5 23,8

8 3DOk5 25,0

9 3DOk5 25,2

10 3DOk5 21,3

11 3DOk4 17,0

12 3DOk4 19,4

13 3DOk4 19,1

14 3DOk4 11,9

15 3DOk4 15,8

16 3DOk7 20,7

17 3DOk7 22,0

18 3DOk7 20,5

19 3DOk7 19,8

20 3DOk7 22,5

21 3DOk13 16,3

22 3DOk13 16,4

23 3DOk13 11,8

24 3DOk13 11,6

25 3DOk13 14,2

26 Compósita 14,3

27 Compósita 19,4

28 Compósita 19,1

29 Compósita 14,9

30 Compósita 20,8

2. Realize no SPSS uma ANOVA ao nível α=0,05 para testar a hipótese da

igualdade das médias dos 6 tratamentos (inóculos).

(10)

f) Enuncie as hipóteses estatísticas a testar, e verifique no SPSS se os dados cumprem as premissas do método de Análise de Variância.

(Aparecem dados atípicos em algum dos grupos experimentais? As populações a comparar são normalmente distribuídas? Há grandes diferenças entre elas no tocante à variabilidade da variável de resposta?). [Analyze>Compare Means>One-Way ANOVA...].

g) Há evidência nos dados para se concluir a existência de diferenças significativas entre os teores médios de N alcançados pela utilização dos seis inóculos? Explique. [F= 32,324; p= 0,000]

h) Se fôr caso disso, realize testes pós-ANOVA para comparar os tratamentos do ensaio (Teste de Duncan, Teste S-N-K e Teste de Tukey), e redija as conclusões deste estudo. Compare os resultados a que se chegou com a utilização dos diferentes tipos de testes.

Teste de Duncan 3Dok13 (14,060)

3Dok4 (16,640)

Compósita (17,700)

3Dok7 (21,100)

3Dok5 (23,620)

3Dok1 (30,820)

Teste S-N-K 3Dok13 (14,060)

3Dok4 (16,640)

Compósita (17,700)

3Dok7 (21,100)

3Dok5 (23,620)

3Dok1 (30,820)

Teste de Tukey 3Dok13 (14,060)

3Dok4 (16,640)

Compósita (17,700)

3Dok7 (21,100)

3DOk5 (23,620)

3DOk1 (30,820)

i) Apresente as conclusões a que se chegou num gráfico de barras média/desvio-padrão, em que figurem os resultados de um dos testes pós-ANOVA.

2. Repita o exercício 1. utilizando apenas a calculadora electrónica.

Caso em estudo nº 2

Apresentam-se abaixo os dados de um estudo sobre tráfego automóvel e poluição atmosférica, no decurso do qual a concentração de um dado poluente (em mg/m3) foi medida em em quatro datas diferentes (Outubro de 1975 e Janeiro, Maio e Setembro de 1976) e em cinco locais de uma cidade (A, B, C, D e E). Para cada local, foram recolhidas e analisadas três amostras de ar em cada uma das quatro datas. O investigador estava particularmente interessado em esclarecer se havia motivos para se acreditar na existência de uma interacção significativa locais x datas.

2. Realize no SPSS a ANOVA deste ensaio factorial duplo [Analyze>General Linear Model>Univariate...], orientando o seu trabalho pelos seguintes tópicos:

f) verificação da premissa da homogeneidade das variâncias;

g) conclusões da ANOVA; [Há diferenças significativas entre os locais:

F= 184,641; p=0,000. Há diferenças significativas entre as dats: F=

159,163; p=0,000. A interacção locais x datas é estatisticamente significativa: F= 16,417; p=0,000]

h) gráficos de perfil de resposta e discussão da interacção;

(11)

i) resultados do Teste S-N-K para cada um dos factores principais, se fôr caso disso; [locais: E<D<B<A<C; datas: Setembro 1976<Maio 1976<Outubro 1975<Janeiro 1976]

j) Desmontagem da interacção (ANOVAS a um critério para comparar os níveis de um factor em cada um dos níveis do outro factor).

2. Repita o exercício 1. utilizando apenas a calculadora electrónica.

local data concentração no ar (mg/m3) 1 local

A Outubro 1975 76

2 local

A Outubro 1975 72

3 local

A Outubro 1975 79

4 local

A Janeiro 1976 82

5 local

A Janeiro 1976 81

6 local

A Janeiro 1976 84

7 local

A Maio 1976 68

8 local

A Maio 1976 64

9 local

A Maio 1976 68

10 local A

Setembro

1976 63

11 local A

Setembro

1976 65

12 local A

Setembro

1976 62

13 local

B Outubro 1975 67

14 local

B Outubro 1975 69

15 local

B Outubro 1975 66

16 local

B Janeiro 1976 69

17 local

B Janeiro 1976 65

18 local

B Janeiro 1976 66

19 local

B Maio 1976 59

20 local

B Maio 1976 55

21 local

B Maio 1976 58

22 local B

Setembro

1976 56

23 local B

Setembro

1976 53

24 local B

Setembro

1976 57

25 local

C Outubro 1975 81

26 local

C Outubro 1975 78

27 local

C Outubro 1975 83

28 local

C Janeiro 1976 96

29 local

C Janeiro 1976 91

30 local

C Janeiro 1976 95

31 local

C Maio 1976 67

32 local

C Maio 1976 64

33 local

C Maio 1976 62

34 local C

Setembro

1976 64

35 local C

Setembro

1976 66

36 local C

Setembro

1976 59

37 local

D Outubro 1975 56

38 local

D Outubro 1975 52

39 local

D Outubro 1975 54

40 local

D Janeiro 1976 59

41 local

D Janeiro 1976 54

42 local

D Janeiro 1976 60

43 local

D Maio 1976 54

44 local

D Maio 1976 51

45 local

D Maio 1976 59

46 local D

Setembro

1976 58

47 local D

Setembro

1976 54

48 local D

Setembro

1976 56

49 local

E Outubro 1975 51

50 local

E Outubro 1975 48

51 local

E Outubro 1975 53

52 local

E Janeiro 1976 70

53 local

E Janeiro 1976 75

54 local

E Janeiro 1976 68

55 local

E Maio 1976 42

56 local

E Maio 1976 47

57 local

E Maio 1976 39

58 local E

Setembro

1976 40

59 local E

Setembro

1976 35

60 local E

Setembro

1976 37

(12)

Caso em estudo nº 3

Realizou-se um ensaio em estufa destinado a comparar o crescimento em altura de quatro genótipos (A, B, C e D) de uma espécie ornamental. Havendo razões para acreditar que as condições ambientais, em especial as de iluminação, não eram aceitavelmente uniformes na estufa, resolveu-se considerar as seis bancadas existentes como blocos, e colocar um vaso com uma planta de cada um dos quatro genótipos em cada uma das bancadas. Os valores das alturas das plantas, em centímetros, obtidos ao fim do período experimental constam da tabela seguinte:

genótipo da ornamental bloco altura da planta (cm)

1 genótipo A 1 18,8

2 genótipo A 2 16,7

3 genótipo A 3 17,7

4 genótipo A 4 18,2

5 genótipo A 5 18,3

6 genótipo A 6 17,5

7 genótipo B 1 21,9

8 genótipo B 2 19,8

9 genótipo B 3 21,0

10 genótipo B 4 21,4

11 genótipo B 5 22,1

12 genótipo B 6 20,8

13 genótipo C 1 16,4

14 genótipo C 2 15,4

15 genótipo C 3 14,8

16 genótipo C 4 15,6

17 genótipo C 5 16,4

18 genótipo C 6 14,6

19 genótipo D 1 14,7

20 genótipo D 2 13,5

21 genótipo D 3 12,8

22 genótipo D 4 13,7

23 genótipo D 5 14,6

24 genótipo D 6 12,9

2. Realize no SPSS a ANOVA (α=0,001) deste ensaio em Blocos Completos Casualizados [Analyze>General Linear Model>Univariate...], orientando o seu trabalho pelos seguintes tópicos:

g) conclusões da ANOVA; [blocos: F= 13,924; p=0,000; genótipos: F=

424,254; p=0,000]

h) comparação das médias dos genótipos pelo teste S-N-K; [genótipos:

D<C<A<B]

i) valores do coeficiente de determinação e do quadrado médio residual da ANOVA em Blocos; [QM erro = 0,147; CD=0,989]

3. Realize no SPSS a ANOVA (α=0,001) deste ensaio, assumindo que se

tratava de um Delineamento Completamente Casualizado (isto é,

(13)

ignorando a sua real organização em blocos [Analyze>General Linear Model>Univariate...], orientando o seu trabalho pelos seguintes tópicos:

a) conclusões da ANOVA; genótipos: F= 100,276; p=0,000]

b) comparação das médias dos genótipos pelo teste S-N-K; [genótipos:

D<C<A<B]

c) valores do coeficiente de determinação e do quadrado médio residual da ANOVA em DCC; [QM erro = 0,621; CD=0, ,938]

3. Compare os valores encontrados em 1.c) e 2.c), e discuta se a inclusão do factor blocos foi vantajosa ou prejudicial para a precisão da análise.

[A inclusão do factor Blocos aumentou a precisão da análise estatística

dos resultados do ensaio: o quadrado médio do erro diminuiu cerca de

quatro vezes e o coeficiente de determinação aumentou 5%.]

(14)

Regressão & Correlação

Caso em estudo

No quadro abaixo figuram as percentagens dos quatro principais constituintes e a quantidade de calor libertado durante o fabrico em 13 amostras de cimento Portland:

aluminato tricálcico (%)

silicato tricálcico (%)

alumino-ferrite tricálcica (%)

silicato dicálcico (%)

calor libertado no fabrico (cal/g de cimento)

1 7 26 6 60 78,5

2 1 29 15 52 74,3

3 11 56 8 20 104,3

4 11 31 8 47 87,6

5 7 52 6 33 95,9

6 11 55 9 22 109,2

7 3 71 17 6 102,7

8 1 31 22 44 72,5

9 2 54 18 22 93,1

10 21 47 4 26 115,9

11 1 40 23 34 83,8

12 11 66 9 12 113,3

13 10 68 8 12 109,4

3. Utilize o SPSS para estabelecer os coeficientes de correlação de Pearson entre o calor libertado durante o fabrico do cimento e as percentagens dos seus principais componentes [Analyze>Correlate>Bivariate...]. Comente os resultados.

aluminato tricálcico (%)

silicato tricálcico (%)

alumino-ferrite tricálcica (%)

silicato dicálcico (%) Coeficiente de

Correlação ,731(**) ,816(**) -,535 -,821(**)

calor libertado no fabrico (cal/g de cimento)

Significância ,005 ,001 ,060 ,001

** Correlação significativa ao nível 0.01.

4. Utilize o SPSS para estabelecer as rectas de regressão linear simples entre o calor libertado e as percentagens de cada um dos quatro principais constituintes [Analyze>Regression>Linear...]. Para cada uma das quatro regressões, refira-se aos seguintes aspectos:

j) equação da recta de regressão; [Analyze>Compare Means>One-Way ANOVA...].

k) significância (isto é, adequação) do modelo de regressão;

l) valor e significado de R ao quadrado.

Equação R

2

Significância

Calor libertado=81,479+1,869. aluminato tricálcico 0,564 0,005 Calor libertado=57,424+0,789. silicato tricálcico 0,666 0,001 Calor libertado=110,203-1,256. alumino-ferrite tricálcica 0,286 0,060 Calor libertado=117,568-0,738. silicato dicálcico 0,675 0,001

3. Repita os exercício 1. e 2. utilizando apenas a calculadora electrónica.

4. Ajuste, com o SPSS, um modelo de regressão linear múltipla para

predizer o calor libertado, usando as percentagens de cada um dos

(15)

quatro principais constituintes como variáveis preditoras. Utilize o método “stepwise” e comente os resultados obtidos.

Equação R

2

Significância

Calor libertado=103,097-0,614. silicato dicálcico+1,440. aluminato tricálcico 0,972 0,000

Referências

Documentos relacionados

Tendo presente os objectivos e as questões de investigação propostas é possível colocar as seguintes hipótese de análise: Existe uma procura regional evidente

O livro proporciona reflexões sobre a ampla linha de pesquisa Processos Criativos, com uma amostra de nomes, tanto já históricos quanto emergentes, que convergem na opção

113 e 114 do Regimento Interno submete à apreciação desta Casa Legislativa com aprovação dos nobres Edis, requer que conste na ata dos trabalhos desta Sessão, para fins de

Devido às alterações anatômicas-funcionais inerentes ao procedimento cirúrgico, pacientes obesos submetidos ao BGYR apresentam risco de agravamento de deficiências

Nesse contexto, o presente estudo se propôs a investigar o processamento atencional na segunda infância e sua relação com o tipo de escola, analisando o desempenho

Objetivos: Proporcionar ao acadêmico as principais técnicas de estatística descritiva, inferencial e modelagem para análise de dados experimentais. Ampliação de escala. Introdução

Tabela 15 - Estatística descritiva da área poligonal oclusal relativa (%) de M1 dos três grupos medievais ……… 42 Tabela 16 - Significância das diferenças entre os

Esta empresa tem o processamento de sua folha de pagamento terceirizada, dessa forma, os seus controles internos para esta atividade se concentram nos controles de entradas das