Laborat´
orio de Ciˆ
encias - Aula 2
Departamento de Estat´ıstica
O que ´
e uma Vari´
avel?
Damos o nome de vari´avel `a uma determinada caracter´ıstica a ser pesquisada em um estudo ou experimento
Usualmente, as vari´aveis s˜ao representadas por letras mai´usculas, como X , Y , Z , · · ·
Para cada observa¸c˜ao, a vari´avel assume um ´unico valor dos que podem ser a ela atribu´ıdos
Exemplos:
Vari´avel: Sexo dos alunos da disciplina de Laborat´orio de Ciˆencias
Respostas poss´ıveis: Masculino e Feminino
Tipos de Vari´
aveis
Vari´aveis qualitativas: representam atributos ou qualidades
Nominal: sem ordem natural Ordinal: com ordem natural
Vari´aveis quantitativas: s˜ao de natureza num´erica
Discreta: resultante de contagens Cont´ınua: proveniente de mensura¸c˜ao
Exemplos de Tipos de Vari´
aveis
Qualitativa Nominal Sexo Tipo de instrumento Ordinal Escolaridade Condi¸c˜ao ambiental QuantitativaDiscreta N´umero de filhos N´umero de medi¸c˜oes Cont´ınua Altura
Vari´
aveis (Lei de Ohm)
Obs X Y W Z 1 1,0 0,25 4,00 digital 2 2,0 0,55 3,64 digital 3 3,0 0,85 3,53 digital 4 4,0 1,20 3,33 digital 5 5,0 1,40 3,57 digital 6 1,0 0,40 2,50 anal´ogico 7 2,0 0,65 3,08 anal´ogico 8 3,0 0,90 3,33 anal´ogico 9 4,0 1,15 3,48 anal´ogico 10 5,0 1,50 3,33 anal´ogico Onde X : Tens˜ao (V ) Y : Corrente (A) W : Resistˆencia (Ω) Z : Tipo de instrumentoObjetivo do Estudo: Rela¸c˜
ao entre Vari´
aveis Quantitativas
Em diversas ´areas de conhecimento, ´e comum o interesse em relacionar vari´aveis quantitativas
Buscamos encontrar e mensurar o tipo de rela¸c˜ao entre duas vari´aveis, objetivando ajustar um modelo que explique uma tendˆencia apresentada pelas vari´aveis
Por exemplo, podemos querer estudar a rela¸c˜ao entre a altura dos pais e a altura dos filhos
A estat´ıstica oferece ferramentas que permitem o estudo entre duas ou mais vari´aveis aleat´orias
Ferramentas Estat´ısticas
Correla¸c˜ao: um valor que varia de -1 a 1 e fornece um indicativo da rela¸c˜ao entre duas vari´aveis aleat´orias
Regress˜ao: utilizada para relacionar duas vari´aveis por meio de um modelo, busca fornecer estimativas para determinada vari´avel com base em uma outra vari´avel
Exemplo: Lei de Ohm
A partir das informa¸c˜oes das medi¸c˜oes da Turma 01
apresentadas na tabela anterior, desejamos estudar a rela¸c˜ao que existe entre as medi¸c˜oes de tens˜ao el´etrica (X) e corrente el´etrica (Y)
O interesse final ´e saber se ´e poss´ıvel obter um valor de corrente el´etrica conhecendo somente a tens˜ao el´etrica que foi passada por determinado material (grafite, neste caso)
Vari´
aveis (Lei de Ohm)
Obs X Y 1 1,0 0,25 2 2,0 0,55 3 3,0 0,85 4 4,0 1,20 5 5,0 1,40 6 1,0 0,40 7 2,0 0,65 8 3,0 0,90 9 4,0 1,15 10 5,0 1,50 Onde X : Tens˜ao (V ) Y : Corrente (A)Quest˜
ao 1: ´
E poss´ıvel descrever o tipo de rela¸c˜
ao entre as
vari´
aveis?
Duas vari´aveis s˜ao correlacionadas quando uma esta relacionada `a outra de alguma maneira
A verifica¸c˜ao da correla¸c˜ao pode ser realizada via um Gr´afico de Dispers˜ao
Plotando os valores de cada observa¸c˜ao em dois eixos, onde cada eixo corresponde a uma das vari´aveis
O Gr´afico de Dispers˜ao permite a verifica¸c˜ao visual de algum tipo de rela¸c˜ao entre as vari´aveis
Exemplos: Gr´
aficos de Dispers˜
ao
Situa¸c˜ao 1: Existe uma rela¸c˜ao n˜ao-linear Situa¸c˜ao 2: Existe uma rela¸c˜ao linear Situa¸c˜ao 3: N˜ao existe uma rela¸c˜aoQuest˜
ao 2: ´
E poss´ıvel quantificar essa rela¸c˜
ao?
Existe uma medida num´erica de intensidade para a rela¸c˜ao linear entre valores de duas vari´aveis quantitativas
Esta ´e conhecida como Coeficiente de Correla¸c˜ao Linear Denotada por ρ
Existem medidas para rela¸c˜oes n˜ao lineares, por´em estamos estudando somente o caso de uma rela¸c˜ao linear simples
Coeficiente de Correla¸c˜
ao Linear
ρ = Sxy2 SxSy,
onde
SX e SY representam o desvio-padr˜ao das vari´aveis x e y ,
respectivamente
SXY ´e a covariˆancia entre as vari´aveis X e Y , dada pela
express˜ao
SXY2 = Pn
i =1(xi− x)(yi− y )
Coeficiente de Correla¸c˜
ao Linear
Os valores de ρ est˜ao entre −1 e 1, isto ´e, −1 ≤ ρ ≤ 1 Quando ρ → 0, n˜ao existe correla¸c˜ao linear significativa Quando ρ → −1 ou 1, existe correla¸c˜ao linear significativa Se ρ > 0, h´a correla¸c˜ao positiva
Exemplos: Gr´
aficos de Dispers˜
ao
Situa¸c˜ao 1: Correla¸cao positiva Situa¸c˜ao 2: Correla¸c˜ao negativa Situa¸c˜ao 3: Sem correla¸c˜aoCoeficiente de Correla¸c˜
ao Linear (Lei de Ohm)
ρ = 0,9925
Note que ρ → 1 Existe correla¸c˜ao linear significativa
Quest˜
ao 3: ´
E poss´ıvel propor um modelo estat´ıstico?
Observamos que existe uma correla¸c˜ao linear evidente entre a tens˜ao el´etrica e a corrente el´etrica
´
E necess´ario um modelo que permita usar os valores da tens˜ao el´etrica de diferentes peda¸cos de grafite para obter poss´ıveis valores da corrente el´etrica, sem a necessidade de realizar o experimento novamente
Quest˜
ao 3: ´
E poss´ıvel propor um modelo estat´ıstico?
Um modelo de regress˜ao linear simples descreve uma rela¸c˜ao entre uma vari´avel independente (ou explicativa) X e uma vari´avel dependente (ou resposta) Y , dada por
y = β0+ β1x + ε,
onde β0 e β1 s˜ao constantes desconhecidas e ε ´e o erro
Contexto Hist´
orico
Francis Galton (inglˆes, 1822-1911), primo de Charles Darwin, fundou e defendia a eugenia (melhoramento gen´etico humano) Estudou a hereditariedade de diversas caracter´ısticas humanas Na ´ultima d´ecada do s´eculo 19, Galton estudava a rela¸c˜ao existente entre a estatura dos pais e dos filhos
Filhos de pais de estatura elevada tendiam a ser altos mas n˜ao t˜ao altos quanto seus pais
Filhos de pais de menor estatura tendiam a ser baixos mas n˜ao t˜ao baixos quanto seus pais
M´
etodo de M´ınimos Quadrados
As n observa¸c˜oes da amostra podem ser expressas por
yi = β0+ β1xi + εi, i = 1, · · · ,n
A reta que resulta no menor valor para a soma dos erros ao quadrado (Pn
Especificando o Modelo (Lei de Ohm)
A reta de regress˜ao ´e dada por
y = β0+ β1x + ε,
onde
y representa a corrente el´etrica (A) x representa a tens˜ao el´etrica (V )
Ser˜ao utilizadas as 10 observa¸c˜oes apresentadas anteriormente O modelo visa fornecer valores de corrente el´etrica para qualquer valor de tens˜ao
Encontrando os Valores para β
0e β
1 E (Y |X = x ) = β0+ β1x b β1= Pn i =1xiyi −1nPni =1xiPni =1yi P i =1(xi2) − 1 n( Pn i =1xi)2 , b β0= y − bβ1x , onde x = 1 n n X i =1 xi,Coeficiente de Determina¸c˜
ao
´
E um indicador para verificar o ajuste do modelo de regress˜ao ´
E denotado por R2
Para a regress˜ao linear simples ´e o valor do coeficiente de correla¸c˜ao linear ao quadrado, isto ´e, R2 = ρ2
Ou seja, varia entre 0 e 1
Verificando os Res´ıduos
De um modo similar ao apresentado para a avalia¸c˜ao de erros, verificaremos as diferen¸cas entre os valores observados e os valores calculados pelo modelo proposto
Estas diferen¸cas s˜ao denominadas res´ıduos
Limita¸c˜
oes do Modelo
Correla¸c˜ao n˜ao implica causalidade
Geralmente, a vari´avel independente ´e explicada por mais de uma vari´avel dependente
N˜ao ´e poss´ıvel extrapolar a predi¸c˜ao para intervalos fora do intervalo original de ajuste da reta
Vari´
aveis (Lei de Ohm)
Obs X Y W Z 1 1,0 0,25 4,00 digital 2 2,0 0,55 3,64 digital 3 3,0 0,85 3,53 digital 4 4,0 1,20 3,33 digital 5 5,0 1,40 3,57 digital 6 1,0 0,40 2,50 anal´ogico 7 2,0 0,65 3,08 anal´ogico 8 3,0 0,90 3,33 anal´ogico 9 4,0 1,15 3,48 anal´ogico 10 5,0 1,50 3,33 anal´ogico Onde X : Tens˜ao (V ) Y : Corrente (A) W : Resistˆencia (Ω) Z : Tipo de instrumentoModelo de Regress˜
ao (Lei de Ohm)
y = 0.0375+0.2835x
Vari´
aveis (Lei de Ohm)
Obs X Y 1 1,0 0,25 2 2,0 0,57 3 3,0 0,85 4 4,0 1,20 5 5,0 1,40 6 1,0 0,39 7 2,0 0,65 8 3,0 0,90 9 4,0 1,17 10 5,0 1,90 Onde X : Tens˜ao (V ) Y : Corrente (A)Modelo de Regress˜
ao (Lei de Ohm)
y = −0.0425+0.3235x
Quest˜
oes
1. Nomeie vari´aveis qualitativas nominais e ordinais e vari´aveis quantitativas discretas e cont´ınuas que n˜ao estejam listadas nos slides (pelo menos um exemplo de cada tipo de vari´avel)
2. Ajuste uma reta ao conjunto de dados da planilha e responda as quest˜oes abaixo:
a) As duas vari´aveis est˜ao correlacionadas positiva ou negativamente? Qual sua correla¸c˜ao?
b) Qual a equa¸c˜ao da reta encontrada?