• Nenhum resultado encontrado

Lecture Notes Estatística. Rodrigo Leandro de Moura. 1ª versão: 19/10/2010

N/A
N/A
Protected

Academic year: 2021

Share "Lecture Notes Estatística. Rodrigo Leandro de Moura. 1ª versão: 19/10/2010"

Copied!
52
0
0

Texto

(1)Lecture Notes – Estatística Rodrigo Leandro de Moura 1ª versão: 19/10/2010 Parte I – Análise de dados – Estatística descritiva. 1. Definições 1.1. População É o conjunto de todos os elementos (unidades observacionais) que constituem a abrangência do estudo. Exemplo: • • •. Conjunto dos 5564 municípios brasileiros Conjunto de todos os alunos de uma turma Conjunto de todos os discursos do Lula. 1.2. Amostra  Mais barata e mais rápida que o censo. É um subconjunto da população. (AAS = Amostra aleatória simples). Propabilística Amostra. Não probabilística. AAS com reposição AAS sem reposição Conglomerados Outras Cotas. Exemplo: Conjunto de municípios da região sudeste.. 1.3. Unidade observacional É a portadora da(s) característica(s) (ou propriedade(s)) que se deseja investigar. Exemplo: • • •. Um município Aluno de uma sala Discurso do Lula. 1.4. É a apresentação simbólica da característica ou propriedade que se deseja investigar. Exemplo:. 1.

(2) • • •. d3 = “Nunca antes na história desse país...” (traço característico da unidade observacional) Sexo – Variável qualitativa X Nº de irmãos – Variável quantitativa Grau de escolaridade do pai – Qualitativa (mas pode ser transformada em quantitativa (anos de estudo)). 1.5. Medidas estatísticas • Parâmetros da população • Estatísticas amostrais • Distribuição de frequência • Gráficos Permitem reduzir os dados. Exemplo:. 1.6. Inferência É o processo de generalizar na população os resultados obtidos em uma amostra. Exemplo:. 2. Níveis de mensuração A classificação de escalas métricas não é única. Diferentes autores classificam os fenômenos de modo diferente. Stevens (1946) define quatro níves de mensuração: − − − −. Nominal Ordinal Intervalar Razão. 2.1. Escala nominal É a escala de medidas com nível mais baixo de mensuração obtida quando as variáveis são utilizadas simplesmente para classificar. Neste caso os “valores” assumidos pelas variáveis são meramente rótulos. Exemplo: Estado civil, sexo... 2.2. Escala ordinal Quando as categorias de uma variável nominal podem ser ordenados, isto é, permitem uma relação do tipo “maior que” ou “menor que”. Exemplo 2.

(3) Escolaridade Freq. Absoluta. Freq. Relativa. Freq. Acumulada Freq. Acumulada Absoluta relativa. 1º Grau 2º Grau Podemos usar como estatística a mediana e moda. 2.3. Escala intervalar Quando os fenômenos são representados por variáveis que assumem valores num contínnuo, como o conjunto dos nº racionais, dizemos que essas variáveis são quantitativas e a descrição dos dados se torna mais informativa. Uma possível classificação para essas variáveis pode ser feita em função do tipo de valores que elas podem assumir: discretos ou contínuos. Esta escala incorpora todas as propriedades das escalas ordinal e nominal e, além disso, ela especifica uma correspondência 1 – 1 entre os elementos do domínio observável e o conjunto dos números reais, permitindo assim que a distância entre as observações tenha um significado código. Nesta escala, como a origem (zero) e a unidade de medida são indeterminadas, pode-se proceder a uma mudança da escala, isto é, mudar a origem e a unidade, através de uma transformação linear do tipo y = ax + b, cujos a e b são conhecidos. Assim, podemos distinguir entre uma medida que é igual, diferente, maior e quanto maior do que a outra. Exemplo: 0o F origem , unidade: 1 o F Fazendo uma transformação linear do tipo y=(5/9)*(x-32) transformamos entanto, a origem não se mantém fixa.. o. F em. o. C. No. Podemos usar como estatísticas a média, mediana e moda. 2.4. Escala de razão Esta escala representa o nível mais rico de mensuração que se pode obter na busca do conhecimento de um objeto. Além de incorporar todas as propriedades da escala intervalar, esta escala ainda permite que se estabeleçam relações de razão e proporção entre os valores observados de suas variáveis. Isso é possível pela existência de uma origem fixa, ou zero absoluto, e pela existência de uma unidade de medida. Grande parte das medidas físicas (comprimento, peso, etc.) e demográficas (idade, taxas de crescimento, natalidade, mortalidade, etc.) são representadas através de variáveis com níveis de mensuração expressas na escala de razão. Assim, podemos distinguar entre uma medida que é igual, diferente, maior, quanto maior e quantas vezes maior do que outra. Exemplo: altura. Origem: 0cm. Unidade: 1 cm.. 3.

(4) Assim, um indivíduo com 190 cm é 2x mais alto do que um com 95 cm. Mesmo se usarmos 1 m como unidade esta relação continua valendo pois 1.9m=2x0. 95m. Ou seja, a estrutura da escala razão não é alterada por transformações da forma y=cx, c>0. Podemos usar as mesmas estatísticas na escala razão e intervalar: média, mediana e moda.. 3. Análise exploratória de dados Objetivo: resumir dados para análise. 3.1. Distribuição de frequência. 3.1.1.Simples Aplicada a dados qualitativos e quantitativos. Exemplo: Construa uma distribuição de frequência com os dados números de irmãos: 2;2;3;1;1;1;1;1;2;2;3;1;1;1;0;2;2;1;1;3;1;1;1;1 Nº de irmãos Freq. Absoluta Freq. Relativa Freq. Acumulada Freq. Rel. Acum. 0 1 1/24 1 1/24 1 14 14/24 15 15/24 2 6 6/24 21 21/24 3 3 3/24 24 24/24 Total 24 100 *Frequência acumulada: Só vale para dados quantitativos (não tem como acumular sexo, por exemplo). 3.1.2.Classes Aplicada a dados quantitativos Renda (em s.m.) [1;3[ [3;5[ [5;7[ [7;9[ Total. Freq. Absoluta 5 10 4 1 20. 3.2. Medidas estatísticas 3.2.1.Medidas de posição 4.

(5) •. Média (µ):. ߤ=. ∑೙ ೔సభ ೔ . - A média terá a mesma unidade de medida dos dados originais.. Exemplo dos irmãos:. Exemplo do salário mínimo:. =. Considerando a média de cada classe de renda como a média da renda naquela classe:. 2 + 2 + ⋯ + 1 + 1 35 = = 1,16ã 24 24. Ou fazendo pela freq. acumulada: =. •. 0 ∗ 1 + 1 ∗ 14 + 2 ∗ 6 + 3 ∗ 3 24 = 1,16ã. =. 2 ∗ 5 + 4 ∗ 10 + 6 ∗ 4 + 8 ∗ 1 = 4,1. . 20. Mediana (Md): é o nº do meio (numa fila por tamanho, por exemplo: pegando o aluno do meio  50% dos alunos é menor que ele e os outros 50% são maiores  se o nº de alunos for par, pode-se fazer a média dos dois centrais). A unidade de medida é a mesma dos dados originais.. Ex. dos irmãos: Ordenando os dados: 0; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 3; 3; 3. Média dos elementos das posições 12 e 13 = 1 •. Moda (mo): é a obserbação mais frequente num conjunto de dados:. Ex: 2, 0, 1, 3, 5, 1  Mo = 1 Ex: 2, 0, 1, 3, 5  Mo = não existe Ex: 1, 1, 0, 5, 4, 4  Mo = 1 e 4 (bimodal) Exemplo dos irmãos:. Exemplo do salário:. Nº de irmãos 0 1 2 3 Mo = 14. Renda (em s.m.) [1;3[ [3;5[ [5;7[ [7;9[ Mo = média (3 e 5) = 4. Freq. Absoluta 1 14 6 3. Freq. Absoluta 5 10 4 1. 5.

(6) 3.2.2. Medidas de dispersão: não pode ser negtiva. Exemplo: Avaliar 4 turmas: Turma A: 1, 3, 5, 7, 9  µ = 5; Md = 5; Mo = ∄ Turma B: 3, 4, 5, 6, 7  µ = 5; Md = 5; Mo = ∄ Turma C: 3, 5, 7  µ = 5; Md = 5; Mo = ∄ Tumar D: 5, 5, 5, 5  µ = 5; Md = 5; Mo = ∄. Como escolher a melhor turma? Mede-se por dispersão.. •. Desvio médio:. ∑೙ ೔సభ |೔ | . A: (4+2+0+2+4)/5 = 12/5  Turma mais dispersa. Está na mesma unidade de medida dos dados originais.. B: (2+1+0+1+2)/5 = 6/5 C: (2+0+2)/3 = 4/3 D: (0+0+0+0)/4 = dispersão 0. •. Variância: ߪ². =. ∑೙ ೔సభ(೔ )² . A: (16+4+0+4+16)/5 = 40/5 = 8 B: (4+1+0+1+4)/5 = 10/5 = 2. Está na mesma unidade de medida dos dados originais elevado ao quadrado.. C: (4+ 0 + 4)/3 = 8/3 D: 0/4 = 0. •. Desvio padrão: ߪ. = ඥߪ². É a raíz quadrada da variância e está na mesma medida dos dados originais.. 6.

(7) •. Coeficiente de variação (cv) = ߪൗߤ. Medida relativa de variação. É adimensional: pode-se comparar Kg com cachos, por exemplo.. ** Se os dados forem oriundos de uma amostra, podemos calcular as estatísticas amostrais** • •. Média amostral: ‫ݔ‬ҧ. ∑݊. ‫ݔ‬ = ݅=1 ݅ ݊. Variância amostral: ‫ݏ‬². ∑݊. (‫ ݔ‬−‫)ݔ‬² = ݅=1 ݅ ݊−1 . Ex.: Considere dois portifólios de aplicações financeiras: um com rentabilidade média de 24% e σ=6% e outro com rentabilidade média de 18% e desvio padrão de 5%. Qual o de menor risco? 1) µ = 0,24 2) µ = 0,18. σ = 0,06 σ = 0,05.  cv = 0.25  25%  cv = 0.277  27.7%. O de menor risco é o de menor cv, ou seja, o portifólio 2 Se cv ≥ 20%, considere as medidas heterogêneas Se cv ≤ 20%, considere as medidas homogêneas.. 3.2.3. Medidas de forma:. •. Assimetria:. ߙ=. య ∑೙ ೔సభ೔  .  ³. 7.

(8) α > 0  assimetria positiva ou à direita (µ>Md>Mo). α < 0  assimetria negativa ou à esquerda (µ<Md<Mo). α = 0  simétrica (µ=Md=Mo). •. 3.2.4.Outras medidas descritivas/de análise: Separatrizes: Quartis, decis,..., percentis. - Discreta: Ex: 3, 5, 2, 4, 7, 9, 1 •. Ordenar: 1, 2, 3, 4, 5, 7, 9 1º 2º 3º 4º 5º 6º 7º. 1º quartil = Q1 = q(25) ou q(0.25) = 25% das observações estritamente menores que Q1 Dividindo o tamanho amostral por 4: 7/4=1.75 observações devem estar abaixo de q(25). Se fossemos arredondar, teríamos que ter 2 observações abaixo do 1º quartil. Mas, note que isso representa 2/7*100%=28% das observações. Ou seja, q(25)=q(28)? Assim, façamos o seguinte procedimento, que determinará mais precisamente o Q1.. 8.

(9) •. Determinar a posição do 1º quartil  x. 25% 1º. 75% 7º. xº. (7-x)= 3(x-1) 7 – x = 3x – 3 X = 2,5  posição do 1º Q Interpolação:. 2 -------- 2 2,5 ----- Q1 3 -------- 3. 1 − 2 2,5 − 2 = 3−2 3−2 Q1 = 2,5. 2º quartil = Q2 = Md = q(50) ou q(0.5) = 50% das observações estritamente menores que Q2 •. Md = 4. 3º quartil = Q3 = = q(75) ou q(0.75) = 75% das observações estritamente menores que Q3 •. Determinar a posição do 3º quartil  y 75%. 1º. 25% yº. 7º. (y-1) = 3 (7-y) y = 5,5  posição do 3º Q Interpolação:. 5 -------- 5 5,5 ----- Q3 7 -------- 7. 3 − 5 5,5 − 5 = 7−5 6−5 Q3 = 6. 9.

(10) Uma medida de dispersão alternativa ao desvio-padrão é a distância interquartil, definida como: dq=Q3-Q1 No exemplo acima, teríamos: dq =6-2.5=3.5. - Por Classes Renda (em s.m.) [1;3[ [3;5[ [5;7[ [7;9[ Total. Freq. Absoluta 5 10 4 1 20. Gráfico da Distribuição de Freqüências. 1º quartil Pelo gráfico visualizamos claramente que Q1=3. 2º quartil Pelo gráfico, notamos que falta 25% para completar 50%. Assim: 5−3 50% =  − 3 25% Md=4. 3º Quartil = Q3 10.

(11) Pelo gráfico visualizamos claramente que Q3=5. (*) Para dados bivariados temos ainda (se a variável for quantitativa): Covariância (Cov). 

(12) ,  =. ∑(  −  )( −  ) . Cov >0. Unidade de medida da cov. É o produto das unidades de medida. Cov = 0 Cov <0. Correlação de Pearson –  , . =.  ( , )  . −1 ≤  ≤ 1   = −1 é correlação perfeita negativa nos dados. 3.3. Análise Gráfica 3.3.1.Setor (para variáveis quantitativas e qualitativas) • Os dados somam 100% • Usado para medir partes de algo • Ângulo proporcional às partes. 3.3.2.Linhas (para variáveis quantitativas) 11.

(13) •. Usado para analisar a evolução de uma variável. •. 3.3.3.Colunas ou barras Usado para evolução ou partes. 6 5 4 3 2 1 0. 6 5 4 3 2 1 0. •. Histograma: nos dá a forma da distribuição da série/dados. Para isso, precisamos calcular a densidade da freqüência: fi/Δi ou ni/ Δi, onde fi=freqüência relativa, ni= freqüência absoluta, Δi=amplitude o i-ésimo intervalo. Com o uso da densidade, podemos considerar para intervalos com amplitudes diferentes.. 12.

(14) Gráfico. 3.3.4.Box-plot (mais elaborado). *. Ls = Q3 +1,5 (Q3 – Q1) Es (Extremo superior) = é o maior valor da série que não é maior que o limite superior (Ls). Q3. Se Md/Q2 cortar a caixa no meio a série é simétrica. Q2. Q1 Ei (Extremo inferior) = é o menor valor da série que não é menor que o limite inferior (Li) Li = Q1 -1,5(Q3 – Q1) * *: Pontos exteriores. São observações destoantes das demais e podendo ser ou não outliers. Valores adjacentes: valores compreendidos entre o Ls e Li. Box plot dá uma idéia da posição (mediana, q1, q3), dispersão (dq), assimetria (distância entre os quantis e destes em relação aos extremos, ou seja, posição relativa dos quantis), caudas e dados discrepantes da amostra.. 13.

(15) Retomando o exemplo: Ex: 3, 5, 2, 4, 7, 9, 1 •. Ordenar: 1, 2, 3, 4, 5, 7, 9 1º 2º 3º 4º 5º 6º 7º. Q1=2.5, Q2=4,Q3=6 Ls = Q3 +1,5 (Q3 – Q1)=5.5+1.5*3=10 Li = Q1 -1,5(Q3 – Q1)=2.5-1.5*3=-2. Es =9, Ei =1 O Box-Plot será: 10 9 Q3. 4. Q2. Q1 1 -2. 3.4. Transformação de variáveis (padronização). ܼ =. ‫ ݔ‬− ߤ ߪ. 14.

(16) Parte II – Inferência Idéias básicas Dois tipo de levantamento: • Censitários  vai acabar? Os levantamentos censitários, ou seja, os censos, são realizados quando investigamos toda a população. • Por amostragem: Os levantamenos por amostragem são realizados em um subconjunto da população de interesse. *No Brasil há dois levantamentos censitários considerados oficiais: − Censo demográfico − Censo agropecuário ( não vai acabar? É difícil estavelecer amostras neste caso). Tempo Custo Erros alheios à amostragem (mentira/Pergunta mal feita) Erros amostrais (auto-seleção). População (Censo) Leva mais tempo Mais custoso. Amostra Leva menos tempo Menos custoso. Sim. Não. Não. Sim Foco do nosso estudo: surgem ao coletarmos uma amostra, em vez de pesquisar a população inteira.. Tipos de amostragem • Probabilísticas: − Amostra Aleatória Simples  é cara: tem que ter um cadastro  Com reposição  Sem reposição − Amostra de conglomerados • Não probabilísticas − Por cotas  Classifica a população em função das propriedades relevantes para o estudo (realizando alguma estimativa), determina a proporção da população a ser pesquisada (divide em cotas) e determina uma cota a cada pesquisador. Ex: IBOPE, Uma ilustração sobre a técnica amostral:. 15.

(17)  Seja uma população de tamanho N = 3 com os valores: 1, 2, 3. Essa população tem média  =. . = 2 e variância populacional ² =.  

(18) మ   

(19) మ ( )². = 2/3. Vamos selecionar todas as amostras aleatórias simples de tamanho n = 2, com reposição dessa população (teremos (3x3) = 9 amostras):. Amostras (1,1) (1,2) (1,3) (2,1) (2,2) (2,3) (3,1) (3,2) (3,3). 1 2 3 4 5 6 7 8 9. Média amostral (  ) 1 1,5 2 1,5 2 2,5 2 2,5 3. Conclusões importantes: 1. AAS de tamanho n, por definição, é o conjunto de n variáveis aleatórias independentes  ,  , … ,  , cada uma com a mesma distribuição de x. Ou seja, as observações da amostra são variáveis aleatórias. Como  depende das observações, logo é também uma v.a. 2. 

(20)   =   ∑   =  ∑   = .  1 1,5 2 2,5 3. . 3. 

(21)   =   ∑   =. 4..  ². భ ⋯ [೙ ]  =  =    భ ⋯[೙ ] ∑   = ² ². =. ² ². =. ² . Gráfico Freq. 1 2 3 2 1 *Se tivermos uma amostra com reposição de tamanho grande, obtida de uma população grande também, então, a média da amostra também terá a cara de uma distribuição normal (mesmo que a população não seja normal) . aplicação do TLC:  ≈ (;. మ ). . *No caso da amostra ser sem reposição: 1.  é uma v.a. 2. 

(22)   = . 3. 

(23)   =     ∗  . ² . 16.

(24) 4.  ≈  ; .   ²  ∗ ,   . pelo TLC.. *Tipos de tabela da Dist. Normal (Gráficos) *No caso de uma v.a. a probabilidade é a freqüência relativa.. Ex:. Média =. 

(25)   = . 

(26)   =  ≈ . = −0,97. 

(27)  = # ∗ $( ). P 0,4 0,3 0,2 0,07 0,03 1. X -2 -1 0 1 2.  ,

(28) ⋯ ,

(29) . 

(30)  = #

(31) − ( ) ∗ $( ) TLC: a convergência de  para uma normal é grande, mesmo os dados originais não tendo cara de normal. మ . Distribuições derivadas da Normal. •. Qui-quadrada:. ~(0,1).  ! = x²~"(). 

(32)  = . 

(33)  = 2. %=. .  +  ~" 

(34). Gráfico. Graus de liberdade Esta relação é válida para x1 e x2 independentes *Tabela:  prob Graus. de. liberdade. 17.

(35) •. ~ (0,1). t de Student *=.  ! ~ "(). 

(36)  = 0. 

(37)  =.   . ~*. Para x e y independentes   . •. F de Snedecor.  ~ "().  & =  ~ &(, ) .  ! ~ "(). *Tabela:  Graus de liberdade do numerador Graus do denominador. Ex.:. $

(38) > ' = 0,025 → ()ℎ   *'+) → ' = 4,47. ~&(4,10). $

(39)  < < ' = 0,95. $

(40) 0,113 < < 4,45 = 0,95. 1.  ~ ?.  ≈ (;. మ ) . 1 1 1 $

(41) <  = 0,025 → $ , > - = $( > )   1 $ , < - = 0,975  ./,. ! ~ &

(42) 10,4. 1 = 8,84 →  = 0,113 . Se população for normal. Amostra grande e população grande. Se a população não é normal e se a amostra for pequena:  ~ ? 2. ² =. (೔  )మ ~  . ? 18.

(43)  

(44) ² ².  ~ "( ). 3.  ~ ?. σ² não é conhecido    √. 4.. భమ మమ. ~‫ ݊(ݐ‬− 1). ~ ?  భమ ~ & మ మ. 5.  −  ~ ?.   −   =    −    =  −  

(45)  −   =?. భ మ (భ మ )  ⁄/. ~ * . sp é a raiz quadrada da variância ponderada 6. 0̂ ~ ?. 0̂ é a dist. Proporção amostral. Se ~2(, 0). ≈ 30, 0

(46) 1 − 04 0̂ =. ೔ ( ) ~ 0;   . Estimação. A partir de agora começamos realmente a falar de estatística De uma maneira muito geral, o que pretendemos fazer é o seguinte: dada uma amostra aleatória de alguma distrivuição com certos parâmetros desconhecidos, como podemos fazer para descobrir alguma coisa sobre eles?. 19.

(47) Normalmente nós sabemos qual a distribuição da amostra no que diz respeito a estes parâmetros desconhecidos e tentaremos obter maneiras de encontrar estimadores (“chutes”) destes parâmetros. Também é preciso que tenhamos uma idéia clara das propriedades desejáveis destes estimadores para sabermos, segundo algum critério, se o estimado encontrado é vom ou ruim. São problemas de estimação, por exemplo: • • • •. A média µ de uma população A variância ou desvio padrão de uma população A proporção de ítens numa população A diferença de médias de duas populações. Como estimar estas quantidades? Alguns estimadores razpáveis nestas situações são: − − − −. A média amostral A variância amostral ou o desvio padrão amostral A proporção amostral A diferença entre duas médias amostrais. Notação: ,. , … ,. . . ..  ,  , … ,  )+ '+    . .. ,. , … ,. . Propriedades dos estimadores. a) Não tendenciosidade: um estimador 56 é dito não tendencioso de 5 se: 756 8 = 5.  Exemplo: a média da amostrada definida como 56 =  =  Σ  é um estimador não. tendencioso da méda da população µ.. 1 1 Σ[  ] Σ  756 8 =    =  9 Σ  : = Σ   = = = =  → (;!     . b) Consistência: um estimador 56 é dito consistente de 5 se:. lim 0(<56 − 5< < =) = 1, ∀= > 0. →". A verificação da consistência de um estimador pode ser feita pela observância das seguintes condições: 20.

(48) A. lim→" [56 ] = 5 B. lim→" [56 ] = 0. Exemplo: A estatística de média de uma amostra é um estimador consistente da média populacional. Verificação: A. lim→" [  ] = lim  =  → (;! →". B. lim→" [  ] = lim. ² →" . = 0 → (;!. c) Eficiência: Dada uma família de estimadores não tendenciosos de 5, i estimador mais eficiente será aquele que tenha a menor variância, isto é: 356 4 < 35> 4, +*ã 56 é  +? +*+. Exemplo: Sejam dois estimadores da média populacional:  e  , os quais são não tendenciosos:    = .    = . A média da amostra é mais eficiente do que a  para a estimação da média populacional. Prova: 

(49)   =   + 

(50)   = 

(51)   > (  ).  , . )/  é  +? +*+. A. Estimação pelo método dos momentos Definição:. Seja (  ,  , … ,  ) uma amostra aleatória de X. Chama-se momento ordinário de ordem s da amostra a estatística: . 1  = #(  ) ,  .  = 1,2, … , . O método dos momentos é um dos mais simples métodos de estimação. Este método consiste em igualar os momentos amostrais aos momentos populacionais. Exemplo: Suponha uma amostra aleatória de tamanho n de uma população com distribuição exponencial. 21.

(52) ?#

(53)  = @+ $ ;. 1º momento da população: 1A@. 1º momento da amostra:. Igualando, tem-se: 1A@ =. ≥0. ∑ A .  ∑ A  → $ =  → @ = 1/ . *Lembre-se que o s-ésimo momento da distribuição é (  ) *Exercícios: •. Seja ~B?+(−5; 5). 1º momento populacional: 

(54)  =. 1º momento amostral: Σ  /  = . % . =0. Igualando: 0 =  ? ? ? → Não consegui com o 1º momento, tento com o 2º 2º momento populacional: 

(55)   → C

(56)  = 

(57)   − 3

(58) 4. Como 

(59)  =. % 

(60) మ . → 

(61)   = 

(62)  + (

(63) )². e 3

(64) 4 = 0 . 2 º momento amostral:Σ  / Então:. . 

(65)   =. 5 35 −

(66) −54² + 0² = 3 12. 5  Σ  3 3 = → 5² = Σ  →56 = D Σ  3   . ***Quando não lembrar da distribuição: F  ?

(67)  → *íB G 

(68)   = E Σ  $

(69) −  →  +* 22.

(70) 

(71) . •. ~ H?+

(72) 0; 5. 1º momento populacional: 

(73)  =. 1º momento amostral: Σ  /  =  & . Igualando: =. '೔ . 1 5 = F ² = 25 3 &. . &. % . &. =. → 56 = 2 . Suponha que foi selecionada uma amostra aleatória de tamanho n=3 com os valores:  = 1,  = 15, = 2. 5=2. •. 1 + 15 + 3 ≅ 12 → Nem sempre é um bom estimador 3. Se ~

(74) ,    → dois parâmetros para estimar:  e   . Vamos utilizar os dois primeiros momentos. 1º momento populacional:  G Σ  I 1º momento amostral: =  . 2º momento populacional: ² + ² → 

(75)   = 

(76)  + 3

(77) 4 G E Σ  ² 2º momento amostral:  E.  = . ² + ² =. ̂ =  e J² =. . Σ  ²G . Σ  ² Σ  −  → J  = −    . * É melhor um estimador consistente tendencoso do que um não tendencioso e não consistente, porque o consistente é, no limite, se a amostra for grande, bom.. B. A função de verossimilhança (likelihood function) 23.

(78) Esta é uma função relativamente simples com um nome indigesto! “Likelihood” em inglês é uma palavra de uso corrente que indica “plausibilidade”. Ao contrário, “verossimilhança” em português não significa nada. Seja  ,  , … ,  uma amostra aleatória de densidade ?( ), a função de verossimilhança é a densidade conjunta escrita como função do parâmtero Θ. . .

(79) Θ = ?

(80)  ,  , … ,   = K ?(  , Θ) . A partir da verossimilhança podemos encontrar um estimador, o estimador de máxima verossimilhança (MLE). O MLE é obtido a partir da maximização da verossimilhança, geralmente feita através da equação: L.(Θ) =0 LΘ. Note que é equivalente maximizar .(Θ) ou o seu logaritmo natural ln (.

(81) Θ). Esta última função é chamada log verossimilhança e é frequentemente mais fácil de maximizar do que .(Θ). A equivalência da maximização de .(Θ) e ln (.

(82) Θ) decorre do fato de .(Θ) ser sempre ≥ 0 (pois é produto de densidades) e do logaritmo ser uma função bijetora.. Por que maximizar a verossimilhança? Suponha uma amostra aleatória de uma densidade qualquer que é completamente conhecida, exceto pelo parâmetro Θ. Ao observarmos  =  ;  =  ; … ;  =  , a densidade conjunta dos  ′ é completamente espcificada, exceto pelo valor de Θ. Então porque não “chutar” para Θ o valor que torna esta função um máximo? Num certo sentido esse “chute para Θ é o valor que mais concorda com os dados que observamos. Exemplo: Suponha que obtemos uma amostra aleatória de tamanho 5 de densidade Poisson com média Θ. Os valores observados são: x1=6, x2=1, x3=2, x4=1, x5=0. Determine o estimador de máxima verossimilhança (EMV) de Θ e forneça uma estimativa para Θ. . .

(83) Θ =. .

(84) Θ = K $

(85) =  . + ( Θభ + ( Θమ + ( Θఱ + )( Θ∑ ೔ ∙ ∙ ⋯∙ =   )  ⋯ ). ).

(86) Θ = −5Θ + Σ  )Θ − ln (  … ) ). 24.

(87) L).(Θ) Σ  = −5 + −0=0 LΘ Θ M= Θ. M= Θ. Σ  =  → *  5. 6+1+2+1+0 = 2 → **  5. Exemplo: Seja (x1, x2, ..., xn) uma amostra aleatória iid de tamenho n extraída de uma população com distribuição normal (µ, σ²). Encontre o EMV de µ e de σ². .

(88) , . . . = K ?# ( ) = . √2O  1. +. (భ )² ². ∙ ⋯∙. √2O  1.  1 ).

(89) ,    = − ln

(90) 2   −  Σ(  − )² 2 2. +. (೙ )² ². L).(,   ) 1 =  Σ

(91)  −  = 0 L  G  L).(,  )  1 R = −  +  Σ

(92)  −  = 0 Q 2 2 L² P S Q. ̂ =  =. 1 Σ   G. T 1 J² = Σ(  −  )² . Princípio da invariância de um estimador de máxima verossimilhança.. Seja (x1, x2, ..., xn) uma A.A. da densidade ?( , Θ) e .(Θ) a função de verossimilhança. M Seja Θ o estimador de máxima verossimilhança de Θ e suponha que queremos encontrar o MLE para /(Θ), sendo /

(93) .  uma função injetora conhecida. M ), sendo Θ M estimador Então o estimador de máxima verossimilhança para /(Θ) é /(Θ de máxima verossimilhança de Θ.. Exemplo: Obtenha o EMV do parâmetro P da V.A. geométrica a seguir e o da função: /

(94) 0: 1 − 0 = U Se. ~ V+

(95) $, $

(96) =  = $(1 − 0)  , = 1,2,3 …. .

(97) $ = 0

(98) 1 − 0 భ  ∙ ⋯ ∙ 0

(99) 1 − 0 ೙  = 0

(100)  − 0೔  25.

(101) ln .

(102) $ =  ln 0 +

(103) 2  −  ln

(104) 1 − 0. L ln .($)  1  Σ  − 

(105) Σ  −  = 0 → − = − =0 L$ 0

(106) 1 − 0 0

(107) 1 − 0. →  − 0 − 0Σ  + 0 = 0 →  − 0Σ  = 0 → 0̂ =. /

(108) $ =

(109) 1 − 0 → Logo: /3$6 4 = 1 − 0̂ = 1 − •.  1 = Σ   1 . Se eu quiser o estimador de UJ, onde U = (1 − 0) não preciso derivar tudo novamente em relação a (1 − 0)!. Exemplo: Seja Y1, Y2, ..., Yn uma amostra aleatória iid, de tamanho n, extraída de uma população com distribuição uniforme [0; Θ]. Determine o EMV de Θ.. 1 ?+

(110)  = IΘ , 0,. 0 <  < ΘG WW. 1 1 1  .

(111) Θ = … = , Θ Θ Θ. .

(112) Θ é maximizado quando Θ for o menor valor possível. (max

(113)  ,  , … ,   ; ∞). Valores possíveis. M = max ( ,  , … ,  ) Θ. *Valor esperado de um máximo: E(máx) $max

(114)  ,  , … ,  . X = max

(115)  ,  , … ,  . 1 1 &,

(116) Y$

(117) X ≤ Y = $

(118) max

(119)  ,  , … ,   ≤ Y = $

(120)  ≤ Y … $( ≤) = F Y … F Y Θ Θ   Y Y Y  = .…. =   Θ Θ Θ. &,

(121) Y =. 

(122) X = F Y ∙ (. . -. Y   Θ. Y    Y = Θ  Θ +1. 26.

(123) Estimação por intervalo *Estimação da média da população (µ) (Crio um intervalo para µ de modo a não ultrapassar um certo erro). Seja |  − | o erro cometido na estimação da média da população → |  − | = ε. Então a probabilidade de que esse erro não ultrapasse um dado [é: $

(124) |  − | < [ = 1 − \. Isto resulta em um intervalo com (1-α)% de confiança.. 1º caso: Sabemos que  ≈  ,. మ  . →  −  ~ (0,. మ ). . Então:. $

(125) |  − | < [ = 1 − \ → $

(126) −[ ≤  −  ≤ [ = 1 − \ [  −  [ $ ]−  ≤  ≤  ^ = 1 − \ √ √ √ $ ]−Y ≤. $ ,−  −. Y\. √. $ ,− ≤ − ≤ −  +. Y\. √. Y\. √.  −   ≤ Y^ = 1 − \ √. ≤  −  ≤. Y\. √. -=1−\. - = 1 − \ → $ ,  +. Ou seja: um intervalo de (1-α)% de confiança para µ é:  ± Y. . Y\. √. ≥  ≥  −. Y\. √. -=1−\. √. Repare que o erro amostral está na mesma unidade de medida da amostra. Repare que esse intervalo só pode ser calculado se σ é conhecido, o que nem sempre é verdade. * Intervalo de confiança de 90%: tenho 100% de certeza de que se eu tirar todas as amostras, em 90% delas a µ vai estar dentro do intervalo. Confiança. z. 90%. 1,645 27.

(127) 95% 99%. mais preciso, a confiança deve ser menor!. 1,96 2,575.  À medida que a confiança aumenta, o z aumenta. Para ser. 2º caso: Se eu não conheço σ da população  substituo pelo desvio padrão da amostra (s): Antes $ ]−Y ≤. Depois.  −   −   ≤ Y^ = 1 − \ → $ ]−* ≤  ≤ *^ √ √ Sendo que.  −   ~ *( ) √. O intervalo de (1-α)% de confiança para µ será, então:. * Obs: * =. # ~(,). మ .+/ ~ 0೙.  ± *. . √.  −    −  

(128) 0,1  * =  = √ =   "/ √ √ ∗ √ Sei que. Exemplo:.    "  

(129) ~ ² ( − 1). Sejam  ,  , … ,  uma amostra aleatória. Dado que  = 3,23,  = 1,17 e  = 1,1, construa um intervalo de confiança para µ (Repare que se tenho σ é preferível usá-lo!) 28.

(130)  ± Y.  Se σ não fosse conhecido:  ± *. . √ . √. = 3,23 ± Y. 1,1. √10. → 3,23 ± *( ). ,1 √. Conheço o σ. Utilizando 99% de confiança (2,575): [ = 2,575 ∗. 1,1. √10. = 0,896. Determine n para que com 99% de confiança o erro amostral seja no máximo 0,5: Y. . √. ≤ 0,5 → 2,575. √. 1,1. ≤ 0,5 →  ≥ 32,1 ≅ 33. * Para a variância da população (σ²) Sabemos que.  

(131) ² ².    ~ "  

(132) 2.3. , então temos que determinar "4 e "5 tal que:  ≤ $ _"4.

(133)  − 1   ≤ "5 `=1−\  (Gráfico). Logo:. Pivô 1  1 ≥  `=1−\ $_  ≥  "4

(134)  − 1 "5.

(135)  − 1   

(136)  − 1  $_ ≥ ≥ `=1−\   "4 "5

(137)  − 1   

(138)  − 1  $_ ≤ ≤ `=1−\   "5 "4. Limite inferior. Limite superior. * Para a proporção da população (π) Sabemos que se: = nº de sucessos;. ~ 2

(139) ; O;. ≈ (O; O

(140) 1 − O). 29.

(141) . Então, Seja P a proporção amostral, então: $=. . ≈  _O;. ≈  _O;. O

(142) 1 − O ` . e. Devemos determinar z, tal que: $−O. $ b−Y ≤. O

(143) 1 − O . a. Logo: $ ]−YD. O

(144) 1 − O `  $−O. O

(145) 1 − O . ≈ (0,1). ≤ Yd = 1 − \ c. O

(146) 1 − O O

(147) 1 − O ≤ $ − O ≤ YD ^=1−\  . $ ]−$ − YD. O

(148) 1 − O O

(149) 1 − O ≤ −O ≤ −$ + YD ^=1−\  . $ ]$ + YD $ ]$ − YD. O

(150) 1 − O O

(151) 1 − O ≥ O ≥ $ − YD ^=1−\  . O

(152) 1 − O O

(153) 1 − O ≤ O ≤ $ + YD ^=1−\  . Um intervalo de confiança para π seria: $ ± YD Como π não é conhecido: $ ± YD. O

(154) 1 − O . $

(155) 1 − $ . Sendo π a proporção da população e P a proporção da amostra.. * Testes de Hipóteses. 30.

(156) Hipóteses: Para realizar um teste de hipóteses partiremos sempre da premissa de que uma delas é verdadeira. Essas hipóteses são mutuamente exclusivas e exaustivas. A hipótese que iremos considerar verdadeira é chamada de hipótese nula (H0) e, a hipótese que a ela se contrapõe é denominada de hipótese alternativa (H1).. Exemplo:. Erros de 1ª e 2ª espécie. f : o réu é inocenteG e  f : o réu é culpado.  Erro tipo 1: consiste em rejeitar H0 quando H0 é verdadeiro. No nosso exemplo esse seria o erro cometido de rejeitar que o réu é inocente e culpá-lo quando na verdade é inocente.  Erro tipo 2: consiste em aceitar H0 quando H0 é falso. No nosso exemplo esse seria o erro cometido em aceitar que o réu é inocente quando na verdade ele é culpado. Perceba que o Erro Tipo 1 é mais importante para ser controlado. Seja α a probabilidade de cometermos um erro do tipo 1. Essa probabilidade é o nível de significância do teste. O nível de confiança de um teste é, portanto, igual a (1-α). A probabilidade de cometermos erro do tipo 2 é designado por β e a decisão correta de rejeitar H0 quando ela for de fato falsa é igual a (1-β) e é chamado de potência do teste. Resumindo: Decisão H0 Verdadeira. Falsa. Aceitar H0 OK! 1–α Nível de confiança Erro tipo 2 Β. Rejeitar H0 Erro tipo 1 α Nível de significância OK! 1–β Potência do teste. Principais tipos de testes (Gráficos). A. Teste Bilateral f : 5 = 5 G , ou seja, para rejeitar tanto faz ser maior ou menor que o valor e  f : 5 ≠ 5. 31.

(157) B. Unilateral Inferior. f : 5 = 5 G e  f : 5 < 5. C. Unilateral Superior. f : 5 = 5 G e  f : 5 > 5. Teste para a média da população - µ Exemplo: A experiência de muitos anos de observação estabeleceu uma média de 160 dias para o tratamento de uma certa doença com uma dispersão de 13 dias. Um hospital garantia possuir um tratamento mais eficaz sem alteração da dispersão. Foi retirada uma amostra de 100 pacientes portadores dessa doença. Nessa amostra aconstatou-se que o período médio de cura era igual a 150 dias. Utilizando 10% de significância, que conclusão podemos tirar? 1º Passo: Formulação das hipóteses. f : 5 = 5 G , um teste unilateral pois só nos interessa saber se o tempo de cura é de fato e  f : 5 ≠ 5 menor 2º Passo: Definir a estatística de teste.  Vamos utilizar a média amostral  para estimar a média populacional µ. Sabemos que a estatística a seguir é Normal (0,1):  − . /√. ~(0,1). E em considerando H0 como verdadeiro teremos:  − 160  √. 3º Passo: Substituindo pelos valores amostrais que temos: X6365378 =. 150 − 160 13/√150. = −7.69. 32.

(158) 4º Passo: Determinar a região crítica  Olhando na tabela = -1,28 (Gráfico) 5º Passo: Decisão  Como Zcalculado= -7,69 é menor que o valor crítico (Ztabela=-1,28), rejeitamos H0 com nível de significância de 10%. Poder de um teste Quando construímos um teste de hipóteses, o erro do tipo I, isto é, a probabilidade de rejeitar Ho quando H0 é verdadeiro, α é fixada. Fixamos o valor de α e então construímos a região de rejeição de H0 desse modo: $g+h+* f | f é +  +} = \. Isso é possível pois quando admitimos que H0 é verdadeira estamos também admitindo que os parâmetros que definem a distribuição da estatística usada na condução do teste são conhecidas e iguais a H0. Lembre-se que a igualdade ocorre sempre na definição da hipótese nula independente do tipo de teste considerado, seja ele unilateral ou bilateral. A dificuldade de calcular o erro do tipo II, β, que é definido como $g +* f | f é +  +}, é que, como podemos observar, a hipótese alternativa especifica um conjunto de valores para o parâmetro: Θ > Θ ;. Θ < Θ B Θ ≠ Θ. Logo, β = probabilidade do erro tipo II, só pode ser calculado se um valor alternativo para Θ for especificado. Desse modo:. 0

(159) Θ  = ${ +* f |Θ = Θ }. Definição: Poder ou potência do teste é a probabilidade de rejeitar H0 dado um valor qualquer de Θ. O

(160) Θ = $g+h+* f|Θi = 1 − j(Θ). O que seria ideal? Seria ideal que a função potência de um teste fosse: GRÁFICO Na prática a função potência tem a seguinte forma: GRÁFICO. 33.

(161) Exemplo: Uma máquina produz ovos com diâmetro que segue uma distribuição normal com média µ e variância igual a 100mm². A máquina foi regulada para µ=92mm. Seleciona-se uma amostra de 25 ovos e verifica-se que a média amostral,  , é igual a 90mm. Teste se a produção está sob controle. 1º Passo: Definição das hipóteses:. f :  = 92G e  f :  ≠ 92. 2º Passo: escolha da estatística do teste: Vamos utilizar  para estimar µ:.  −   − 92  ~ 

(162) 0,1 klllllllllllllllllm  95878 :బ ;77; √ √. 3º Passo: Incluindo os dados do problema: X6365378 =. 90 − 92 = −1 10 √25. 4º Passo: Escolhendo α e construindo a região crítica. Fixando α = 1% GRÁFICO Ztabela = ±2,575 5º Passo: Crítica de decisão: Como Zcalculado = -1, não podemos rejeitar H0!. * Cálculo do poder do teste:. O

(163) Θ = $

(164) +h+* f |Θ), para , por exemplo, um Θ0 = 95.  − 92  − 92 O

(165) Θ = $

(166) +h+* f |Θ) = $ _ < −2,58 B > 2,58 | Θ` 10⁄√25 10⁄√25 = $

(167)  < 86,84 B  > 97,16 |Θ = 95) =  − 95 86,84 − 95  − 95 97,16 − 95 = $_ < > `+$_ ` 10⁄√25 10⁄√25 10⁄√25 10⁄√25. $

(168) X < −4,08 + $

(169) X > 1,08 = 0,0000317 + 0,1401 = o, pqop GRÁFICO. 34.

(170) Pvalor = P(Z<-1) = 0,1587  para a normal é fácil calcular Pvalor ≠ 15%, no exemplo, como é bilateral: Pvalor = 30%. GRÁFICO. Teste para a média da população −. Caso em que σ² não é conhecido Implementação do Teste: •. 1º Passo: definição das hipóteses. •. 2º Passo: Definição da estatística de teste. Vamos utilizar  para estimar µ.. f :  =  G

(171) r e  f :  ≠ . Sabemos que:.   ⁄√. f :  =  G

(172) 2 e  f :  > . f :  =  G (W) e  f :  < . ~ (0; 1), mas σ² não é conhecido, logo:. Supondo H0 como verdadeiro, temos:.   ⁄√.  − . •. ⁄√. 3º Passo: Introduzindo os dados do problema: *6365378 =. •. ~ *  ..  −  ⁄√. 4º Passo: Determinação do nível de significância de α e construção da região crítica:. GRÁFICOS •. 5º Passo: Decisão  se tcalculado encontra-se na região de rejeição, rejeite H0. Teste para a proporção populacional (π). 35.

(173) •. 1º Passo: definição das hipóteses. •. 2º Passo: Definição da estatística de teste. Vamos utilizar a proporção amostral O para estimar a proporção populacional π:. f : O = O G

(174) r e  f : O ≠ O. 0−O. f : O = O G

(175) 2 e  f : O > O. O(1 − O) . ~ 

(176) 0,1. 0 ~  _O,. f : O = O G (W) e  f : O < O. O

(177) 1 − O ` . Supondo H0 como verdadeiro temos:. 0 − O. O (1 − O )  •. •. 3º Passo: Introduzindo os dados do problema: X<365378 =. 0 − O. O (1 − O ) . 4º Passo: Determinação do nível de significância de α e construção da região crítica:. GRÁFICOS •. 5º Passo: Decisão  idem teste anterior. Teste para a variância da população •. 1º Passo: definição das hipóteses

(178) r s. •. f : ² =  G f : ² ≠ .

(179) 2 s. f : ² =  G f : ² > . (W) s. f : ² =  G f : ² < . 2º Passo: Definição da estatística de teste. Vamos utilizar s² para estimar σ². Sabemos que:

(180)  − 1   ~ "( ) ². 36.

(181) Supondo H0 como verdadeiro temos:. •.

(182)  − 1  ². 3º Passo: Introduzindo os dados do problema: X²<365378 =. •.

(183)  − 1  ². 4º Passo: Determinação do nível de significância de α e construção da região crítica:. GRÁFICOS •. 5º Passo: Decisão  Se Z²calculado encontra-sena região de rejeição, rejeite H0.  Acabamos aqui a inferência para 1 população.. Teste para igualdade entre duas variâncias populacionais. •. 1º Passo: definição das hipóteses

(184) r s. •. f :  =  G f :  ≠ .

(185) 2 s. f :  =  G f :  > . f :  =  G f :  < . 2º Passo: Definição da estatística de teste. Vamos utilizar as variâncias amostrais s12 e s22 oara estimar as variâncias populacionais σ12 e σ22. Sabemos que: H= Logo:.

(186)  − 1  ~ "( ) . e. C=.

(187)  − 1 . H  − 1 &= C  − 1. Supondo H0 como verdadeiro temos: &= •. (W) s.  . 3º Passo: Introduzindo os dados do problema:. 37.

(188) &<365378 = •.  . 4º Passo: Determinação do nível de significância de α e construção da região crítica:. GRÁFICOS •. 5º Passo: Decisão  Se Fcalculado encontra-sena região de rejeição, rejeite H0.. Teste para igualdade duas médias populacionais independentes (µ1 - µ2) a) Caso em que σ12 e σ22 são conhecidas •. 1º Passo: definição das hipóteses. f :  −  = 0G

(189) r e   f :  −  ≠ 0 •. f :  −  = 0G

(190) 2 e   f :  −  > 0. f :  −  = 0G (W) e   f :  −  < 0. 2º Passo: Definição da estatística de teste. Vamos utilizar (  −  ) para estimar (µ1 - µ2).

(191)  −   ~  _ −  , Logo:.   + `  . 

(192)  −   = 

(193)   − 

(194)   =  − . C

(195)  −   = C

(196)   + C

(197)   = Então:.

(198)  −   − ( −  )  D  .  +  .   +  . ~ (0,1). Supondo H0 como verdadeiro temos:.

(199)  −  . D. •.    + . 3º Passo: Introduzindo os dados do problema:. 38.

(200) X<365378 = •.

(201)  −  . D.    + . 4º Passo: Determinação do nível de significância de α e construção da região crítica:. GRÁFICOS •. 5º Passo: Decisão  Se Zcalculado encontra-sena região de rejeição, rejeite H0.. b) Caso em que σ12 e σ22 não são conhecidas.. b1. σ12 = σ22 (variâncias desconhecidas mas iguais). •. 1º Passo: Definição das hipóteses:. •. 2º Passo: Definição da estatística de teste. Vamos utilizar (  −  ) para estimar (µ1 - µ2).. f :  −  = 0G

(202) r e   f :  −  ≠ 0. f :  −  = 0G

(203) 2 e   f :  −  > 0.

(204)  −   ~  _ −  ,. f :  −  = 0G (W) e   f :  −  < 0.   + `  . Como σ12 e σ22 são desconhecidas e o teste de igualdade de variância foi realizado e as variâncias foram consideradas iguais, podemos calcular: ²0 =.

(205)  − 1 +

(206)  − 1 ( +  − 2). → Câ  0 + . Nesse caso seja:. X=.

(207)  −   − ( −  ) D.    + . Então:. ~ 

(208) 0,1. e. t=. ( +  − 2)²0  ~ "( భ మ ) ².

(209)  −   − ( −  ) 1⁄ + 1⁄.

(210)  −   − ( −  ) X 1⁄ + 1⁄ u= = = = 0 t ( +  − 2)²0    +  − 2 D  ²( +  − 2). 39.

(211) =.

(212)  −   − ( −  ) 01⁄ + 1⁄. ~ *(భ మ ). Supondo H0 como verdadeiro temos: u= •.

(213)  −  . 01⁄ + 1⁄. 3º Passo: Introduzindo os dados do problema: u<365378 =. •.

(214)  −  . 01⁄ + 1⁄. 4º e 5º Passos: Iguais aos anteriores (Def. do nível de significância e região crítica e Decisão).. b2. σ12 ≠ σ22 (variâncias desconhecidas mas diferentes) •. 1º Passo: Definição das hipóteses:. •. 2º Passo: Definição da estatística de teste. Vamos utilizar (  −  ) para estimar (µ1 - µ2).. f :  −  = 0G

(215) r e   f :  −  ≠ 0. f :  −  = 0G

(216) 2 e   f :  −  > 0.

(217)  −   ~  _ −  ,. f :  −  = 0G (W) e   f :  −  < 0.   + `  . Como σ12 e σ22 são desconhecidas e o teste de igualdade de variância foi realizado e as variâncias não foram consideradas iguais, podemos calcular: ²0 =.

(218)  − 1 +

(219)  − 1 ( +  − 2). → Câ  0 + . Nesse caso seja:.

(220)  −   − ( −  )  D  .  +  . ≈ *23.

(221) r + 2 /) = r 2 + ( − 1) ( − 1). → +   t+) ℎ(1937)  +  r = .  +2=  40.

(222) É claro que o nº de graus de liberdade deve ser arredondado. Supondo H0 como verdadeiro temos:.

(223)  −  . D •.   +  . 3º, 4º e 5º Passos: Iguais aos anteriores (Introduzir os dados, def. o nível de significância e região crítica e Decisão).. Exercício – P. 365 (Bussab), adaptação: Uma fábrica de embalagens está estudando dois processos para combate à corrosão de suas latas especiais. Para verificar o efeito do tratamento, foram utilizadas amostras aleatórias cujos resultados estão no quadro abaixo (em % de corrosão eliminada). Qual é a conclusão sobre os dois tratamentos? (A). Método A B. Tamanho da Amostra 15 12. Média. Variância. 48 52. 10 15. Média. Variância. 21,15 21,12. 0,0412 0,1734. E também: (B). Método A B. Tamanho da Amostra 21 12. * 1ª Parte (A) Trata-se de duas populações distintas. Iremos aplicar o teste para verificar se µ1 = µ2. Antes porém, como as variâncias populacionais σ1² e σ2² não são conhecidas, precisamos testar se σ1² = σ2². Teste das variâncias 1º Passo: Definir as hipóteses: s. f : = /> = 1G f : = /> ≠ 1 41.

(224) 2º Passo: Definir a estatística de teste. Para isso usaremos sA2 e sB2 para estimar σ1² e σ2². Sabemos que:. Se H0 for verdadeira:.

(225) = − 1= = = =

(226) = − 1 &= =

(227) > − 1> > > >

(228) > − 1 = ~ &ಲ ,ಳ  >. 3º Passo: Introduzir os dados do problema: &<365378 =. 10 = 0,444 15. 4º Passo: Definir o nível de significância e construir a região crítica. Assumindo um α = 5%, a hipótese nula não é rejeitada se 0,31 < FCalculado < 3,33. Gráfico. &,? 1. =. 1 = 0,31 3,15. 5º Passo: Conclusão. Não rejeito H0 ou seja, utilizando 5% de significância, posso considerar as duas variâncias iguais.. Teste para a ≠ entre médias. 1º Passo: Definir as hipóteses:. f :  = > G e  = f : = ≠ >. 2º Passo: Definir as estatísticas de teste e supor H0 verdadeiro. Vamos utilizar = e > para estimar µA e µB. Como as variâncias podem ser consideradas iguais eu posso calcular:. 42.

(229) ²0 =.

(230) = − 1= +

(231) > − 1>

(232) 15 − 1 ∗ 100 +

(233) 12 − 1 ∗ 225 = = 155 (= + > − 2) 15 + 12 − 2. E então:.

(234) = − >  − (= − > ). Supondo H0 verdadeiro:. 1 1 0 +  = >. ~ *ಲ ಳ .

(235) = − > . 1 1 0 +  = >. 3º Passo: Dados do problema: *<365378 =. 48 − 52. 1 1 12,45 + 12 15. = −0,83. 4º Passo: Com α = 5%, não rejeito H0 se -2,06 < tcalculado < 2,06 5º Passo: Conclusão Não rejeito a hipótese das médias serem iguais ao nível de significância de 5%.. * 2ª Parte (B) Trata-se de duas populações distintas. Iremos aplicar o teste para verificar se µ1 = µ2. Antes porém, como as variâncias populacionais σ1² e σ2² não são conhecidas, precisamos testar se σ1² = σ2². Teste das variâncias 1º Passo: Definir as hipóteses: s. f : = /> = 1G f : = /> ≠ 1. 2º Passo: Definir a estatística de teste. Para isso usaremos sA2 e sB2 para estimar σ1² e σ2². Sabemos que:.

(236) = − 1= = = =

(237) = − 1 &= =

(238) > − 1> >  > >

(239) > − 1 43.

(240) Se H0 for verdadeira:. = ~ &ಲ ,ಳ  >. 3º Passo: Introduzir os dados do problema: &<365378 =. 0,0412 = 0,2376 0,1734. 4º Passo: Definir o nível de significância e construir a região crítica. Assumindo um α = 5%, a hipótese nula não é rejeitada se 0,389 < FCalculado < 2,68. &?, 1. Gráfico. =. 1 = 0,389 2,57. 5º Passo: Conclusão. Rejeito H0 ou seja, utilizando 5% de significância, não posso considerar as duas variâncias iguais.. Teste para a ≠ entre médias 1º Passo: Definir as hipóteses:. f :  = > G e  = f : = ≠ >. 2º Passo: Definir as estatísticas de teste e supor H0 verdadeiro. Vamos utilizar = e > para estimar µA e µB.

(241) = − >  − (= − > ) D. = > = + >. ~*. ;. =>

(242) మ =మ >మ  (ಲ ) (ಳ ). +  r =. = =. +2 =. > >. = 14,884 ≅ 15 Supondo H0 verdadeiro:. 44.

(243)

(244) = − > . D. = > = + >. 3º Passo: Dados do problema *<365378 =. 21,15 − 21,12. 0,0412 + 0,1734 17 21. = 0,272. 4º Passo: Considerando um α = 5%, não rejeitamos H0 se -2,131 < tCalculado < 2,131 5º Passo: Conclusão. Não rejeito H0 utilizando α = 5%.. * No mesmo exercício: quer ver antes e depois da aplicação do produto para corrosão (uso dif. De média) Embalagens 1 2 3 4 5. Antes 80 78 65 78 85. Depois 75 70 60 72 78. Variação -5 -2 -5 -6 -7. Trabalho com uma população ao invés de 2!  = 5,. 1º Passo:. 2º Passo:. Vou utilizar  para estimar µ. ² = 3,5. f :  = 0G e   f :  ≠ 0  −  ⁄√. 45.

(245) Supondo H0 como verdadeiro:. . ⁄√ 3º Passo: Dados: 5. 3,5⁄√5. ~ * → *<365378 = 5,98. 4º Passo: Considerando α = 5%, não rejeito H0 se -2,776 < tCalculado < 2,776 5º Passo: Conclusão. Rejeito H0 a um α = 5%.. Parte III – Números Índice • •. Para que servem? Para comparar grandezas em épocas diversas. Como calcular? As técnicas de cálculo serão apresentadas em seguida..  Preço relativo  é a relação dos preços de um determinado período com os preços de um período denominado Período-Base..  Índice de preços relativos v;3@8 =. 0@ 08. Fica livre da unidade de medida. Onde: pit = preço relativo do produto i no período t pio = preço relativo do produto i no período o ou base Em geral os índices são apresentados multiplicados por 100: vA;3 = B ೔೟ ∗ 100 B. ೔೚. O período de comparação é a base do número índice e deve estar sempre em destaque: 46.

(246)  Exemplo: Ano. Produto 1 Preço Quantidade 12 3 15 4 18 5 24 6. 2002 2003 2004 2005. Produto 2 Preço Quantidade 5 7 10 9 20 8 30 7. O índice de preços relativos dos dois produtos, de 2002 a 2005, tomando o ano de 2004 como base é: Ano 2002 2003 2004 2005. Produto 1 Produto 2 66,7 = 12/18 * 100 25 83,3 = 15/18 * 100 50 100 = 18/18 * 100 100 133,3 = 24/18 * 100 150 Aumento de 33,3% nos preços em relação a 2004. Repare que o índice relativo ao ano base é igual a 100  Quantidade Relativa. vC5@77; A;3. =. @ ∗ 100 → análogo ao índice de preço relativo 8 Agregação dos Índices. I.. Índice símples de preços relativos ou Índice de Bradstreet vBಳೝೌ೏. ∑ $@ =_  ` ∗ 100 ∑ $8. No exemplo anterior, com o ano 2004 como base: Ano 2002 2003 2004 2005. Índice Simpes de preços relativos (12 + 5)/(18 + 20) *100 = 44,74 (15 + 10)/(18 + 20) * 100 = 65,79 (18 + 20)/(18 + 20) * 100 = 100 (24 + 30)/(18 + 20) * 100 = 142,11. vBಳೝೌ೏. $ ∑ @ ∗ $8 $8 =w x ∗ 100 ∑ $8. (A parte marcada funciona como um ponderador). 47.

(247) II.. A média aritimética dos Relativos. No exemplo anterior, com o ano 2004 como base:. Ano Média aritmética dos índices de preços relativos 2002 (66,7 + 25)/2 = 45,83 2003 (83,3 + 50)/2 = 66,67 2004 (100 + 100)/2 = 100 2005 (133,3 + 150)/2 = 141,67  Dá a mesma importância aos dois produtos Como aprimorar o cálculo do Índice de Preços Simples? Incorporanto a informação de quantidade:. III.. O Índice de Preços de Laspeyres vBಽೌೞ೛. $ ∑ @ ∗ $8 ∗ 8 $8 =w x ∗ 100 ∑ $8 ∗ 8. ∑ $@ ∗ 8 vBಽೌೞ೛ = _  ` ∗ 100 ∑ $8 ∗ 8. Repare que:. - O peso está em destaque na primeira equação. Assim, o índice de preços de Laspeyres é definido como a média aritmética dos preços relativos ponderados pela participação do produto na despesa no período base. - O numerador é o valor da “cesta de produtos” se fossem adquiridas as mesmas quantidades do ano base (o) com os preços praticados no ano t. - O denominador é o valor da “cesta de produtos” no ano base (o). - Tendência de sobreestimar a alta de preços.. No exemplo anterior, com ano base em 2004: Ano 2002 2003 2004 2005. Índice de Preço de Laspeyres I02=(12 . 5 + 5 . 8)/ (18 . 5 + 20 . 8) *100 = 40 I03=(15 . 5 + 10 . 8)/ (18 . 5 + 20 . 8) *100 = 62 I04=(18 . 5 + 20 . 8)/ (18 . 5 + 20 . 8) *100 = 100 I05=(24 . 5 + 30 . 8)/ (18 . 5 + 20 . 8) *100 = 144. I05= 144 indica que o valor das quantidades aumentou 44% como resultado do aumento de preços entre 2004 e 2005.. 48.

(248) IV.. Índice de Preços de Paasche vBುೌೌೞ೎೓೐. $ ∑ @ ∗ $8 ∗ @ $8 =w x ∗ 100 ∑ $8 ∗ @. 1 vBುೌೌೞ೎೓೐ = w x ∗ 100 $ $ ∗ @ ∑  8   @ $@ ∑ $@ ∗ @ ∑ $@ ∗ @ vBುೌೌೞ೎೓೐ = _  ` ∗ 100 ∑ $8 ∗ @. - O peso está em destaque na primeira equação. Assim, o índice de preços de Paasche é definido como a média aritmética dos preços relativos ponderados pela participação do valor da do produto, se fosse adquirido a mesma quantidade do ano t com o preço praticado no ano base (o), no valor total da “cesta de produtos”, avaliados nas quantidades do ano t e preço do ano base (o). - Outra forma de interpretação é a dada na segunda equação: Consiste na média harmônica do preços relativos ponderada pela participação do produto na despesa no período atual (peso destacado). - Pesos variam a cada período, onerando a pesquisa. Por isso, muitas vezes utiliza-se apenas o Laspeyres pois só precisa-se pesquisar o preço no período.. - Assim, por exemplo, o IPC é calculado usando Laspeyres. - Tendência de subestimar a alta de preços.. No exemplo anterior, com ano base em 2004 Ano 2002 2003 2004 2005. Índice de Preço de Paasche I02=(12 . 3 + 5 . 7)/ (18 . 3 + 20 . 7) *100 =36,59 I03=(15 . 4 + 10 . 9)/ (18 . 4 + 20 . 9) *100 =59,52 I04=(18 . 5 + 20 . 8)/ (18 . 5 + 20 . 8) *100 =100 I05=(24 . 6 + 30 . 7)/ (18 . 6 + 20 . 7) *100 =142,74. 49.

(249) V.. Índice de Preço de Fisher D E B vB;ç8 = vB;ç8 ∗ vB;ç8. - Como o L superestima e o P subestima, o índice de Fischer usa ambos,sendo obtido através de uma média geométrica.  Índice de Quantidade: Troca P por Q e vice versa (mede a variação real (do crescimento/volume econômico) na economia).  Índice de Valor (P * Q = Valor): mede a variação “nominal”de uma economia. ∑ $@ ∗ @ vF38 = _  ` ∗ 100 ∑ $8 ∗ . No exemplo anterior, para o ano de 2005, considerando o ano de 2004 como base, seria: 24 ∗ 6 + 30 ∗ 7 ∗ 100 = 141,6 18 ∗ 5 + 20 ∗ 8 - Mas nem sempre Ip * IQ = IV. Para os relativos individuais: $@ @ $@ ∗ @ ∗ = → (;! $  $ ∗ . Já para os agregados.... Vamos utilizar o índice de Paasche:. ∑ $@ ∗ @ ∑ $@ ∗ @ ∑ $@ ∗ @ ∗ ≠ ∑ $8 ∗ @ ∑ $@ ∗ 8 ∑ $8 ∗ 8. Índ. Preç. Paasc.. Índ.Preç. Lasp.. - Esperava-se que a multiplicação de um índice de preços por um de quantidade seja igual a um índice de valor. Mas isso não ocorre no caso de Laspeyres nem de Paasche. No entanto, IqP * IPL = IV. ∑ $@ ∗ @ ∑ $8 ∗ @ ∑ $@ ∗ @ ∗ = → (;! ∑ $8 ∗ @ ∑ $8 ∗ 8 ∑ $8 ∗ 8. Igualmente vale: IpP * IqL = IV. Ex.: Qual a variação real do crescimento ecônomico (no ano de 2005)? 50.

Referências

Documentos relacionados

O objetivo desse trabalho ´e a construc¸ ˜ao de um dispositivo embarcado que pode ser acoplado entre a fonte de alimentac¸ ˜ao e a carga de teste (monof ´asica) capaz de calcular

Na apropriação do PROEB em três anos consecutivos na Escola Estadual JF, foi possível notar que o trabalho ora realizado naquele local foi mais voltado à

insights into the effects of small obstacles on riverine habitat and fish community structure of two Iberian streams with different levels of impact from the

There a case in Brazil, in an appeal judged by the 36ª Câmara Cível do Tribunal de Justiça do Estado de São Paulo (São Paulo’s Civil Tribunal, 36th Chamber), recognized

Neste estágio, assisti a diversas consultas de cariz mais subespecializado, como as que elenquei anteriormente, bem como Imunoalergologia e Pneumologia; frequentei o berçário

As análises serão aplicadas em chapas de aços de alta resistência (22MnB5) de 1 mm de espessura e não esperados são a realização de um mapeamento do processo

O objetivo do presente estudo foi conhecer os principais agentes etiológicos causadores de bacteremias no Hospital Universitário Júlio Müller no ano de 2007,

B4 Identificação dos compostos presentes nas amostras de bio-óleo obtidos via pirólise catalítica da fibra de casca de coco utilizando carvão ativado (ABC) e