Métodos Quantitativos
Aplicados à Contabilidade (III)
2
Revisão de Matemática
Parte III
Estatística
Variáveis aleatórias
• Uma variável aleatória é uma variável que pode assumir qualquer valor dentro de um dado conjunto, sendo esse valor determinado pelo menos em parte ao acaso.
• Pela sua natureza, variáveis aleatórias não são perfeitamente
previsíveis.
• A maioria dos dados em economia, finanças e contabilidade são
variáveis aleatórias, embora elas possam possuir alguma estrutura mensurável. Sendo assim elas não são puramente aleatórias.
• Podemos pensar nessas séries como tendo uma parte fixa (que
Valor esperado de uma variável aleatória
• A média de uma variável aleatória y é também conhecida como valor
esperado, E(y).
• O valor esperado de uma constante (ou de uma variável não
estocástica) é a própria constante, por exemplo E(c ) = c .
• O valor esperado de uma constante multiplicada por uma variável
aleatória é igual à própria constante multiplicada pelo valor esperado da variável: E(cy) = cE(y).
• Além disso, E(cy + d ) = cE(y) + d, onde d é também uma constante.
Variância de uma variável aleatória
• A variância de uma variável aleatória y é denominada var(y).
• As propriedades do operador de variância var(·), são:
• A variância de uma variável aleatória y é var(y) = E[y − E(y)]2
• A variância de uma constante é zero: var(c) = 0
• Se c e d são constantes, var(cy + d ) = c2var(y)
• Para duas variáveis aleatórias independentes, y1 e y2, var(cy1 + dy2) =
Covariância entre duas variáveis aleatórias
• A covariância entre duas variáveis aleatórias, y1 e y2 pode ser expressa
como cov(y1, y2). As propriedades do operador de covariância são:
• cov(y1, y2) = E[(y1 − E(y1))(y2 − E(y2))]
• Para duas variáveis aleatórias independentes, y1 e y2, cov(y1, y2)=0
A distribuição normal
• A distribuição mais utilizada para caracterizar uma variável aleatória é
a normal ou gaussiana.
• A distribuição normal é simples de se usar, uma vez que é simétrica e
A distribuição normal
• A distribuição normal tem várias propriedades matemáticas úteis.
• Por exemplo, qualquer transformação linear de uma variável aleatória
normalmente distribuída será também normalmente distribuída.
• Assim, se y N(μ, σ2), isto é, se y é normalmente distribuída com
média μ e variância σ2, então (a+by) N(a+bμ, b2σ2) onde a e b são
escalares. O símbolo após a variável significa que a variável tem a
distribuição indicada pelo símbolo em seguida, no caso, N = normal.
• Além disso, qualquer combinação linear de variáveis aleatórias
A distribuição normal
• Suponha que temos um variável aleatória normalmente distribuída
com média μ e variância σ2.
• Sua função densidade de probabilidade é dada por f(y) na seguinte
A distribuição normal
• Um variável aleatória com distribuição normal padrão pode ser obtida a partir desta fórmula subtraindo-se a média e dividindo-se pelo desvio padrão (a raiz quadrada da variância).
• O variável aleatória com distribuição normal padrão seria então:
• Geralmente, é necessário utilizar a distribuição normal na sua forma padronizada, pois ela é tabelada.
• Podemos usar a fdp para calcular a probabilidade de que a variável aleatória situa-se dentro de um determinado intervalo - por exemplo, qual é a probabilidade de que y se situa entre 0,2 e 0,3?
• Para achar isso, teríamos substituir y = 0,2 e depois y = 0,3 na equação da página anterior e calcular o valor correspondente de f(y) em cada caso.
• Então, a diferença entre estes dois valores de f(y) nos daria a resposta.
~ (0,1)
y
Z N
Teorema do Limite Central
• Se uma amostra aleatória de tamanho N: y1, y2, y3, ..., yn for extraída a partir de uma população normalmente distribuída com média μ e variância σ2, a média da amostra, ത𝑦 será também normalmente distribuída com média μ e variância σ2/N. • Essa regra importante da estatística conhecida como teorema do limite central
afirma que a distribuição amostral da média de qualquer amostra aleatória de observações tenderá para a distribuição normal, com média igual a média da população, μ, quando o tamanho da amostra tende ao infinito, i.e., N .
• Este teorema é muito relevante, porque ele afirma que a média amostral, ത𝑦, vai seguir uma distribuição normal, mesmo que as observações originais (y1, y2, ..., yn) não o façam.
Outras distribuições estatísticas
• Há muitas distribuições estatísticas, tais como a binomial, Poisson,
lognormal, normal, exponencial, t, qui-quadrada e F, cada uma com a sua própria função densidade de probabilidade característica.
• Diferentes variáveis aleatórias serão melhor modeladas com
distribuições diferentes.
• Muitas das distribuições estatísticas também estão relacionadas entre
si, e a maioria (exceto a normal) têm um ou mais parâmetros de graus de liberdade que determinam a posição e forma da distribuição.
• Por exemplo, a distribuição qui-quadrada (χ2) pode ser obtida pela
Distribuição t-Student
• A distribuição mais importante usada em econometria é a distribuição t,
também conhecida como t-Student.
• A distribuição normal é um caso especial da t. A distribuição normal tende
no limite para a distribuição t quando N .
• A distribuição t pode ser obtida tomando-se uma variável aleatória com
distribuição normal padrão, Z, e dividindo-a pela raiz quadrada de uma
variável aleatória independente com distribuição qui-quadrada (y1),
dividida pelos seus graus de liberdade, n1
• A distribuição t é simétrica em torno de zero e é similar à distribuição
normal, exceto que é mais achatada e mais larga.
Distribuição t x Distribuição Normal
normal
Estatísticas Descritivas
• Quando a análise de uma série contém muitas observações, é usual
descrever as características mais importantes das séries usando um resumo das medidas mais importantes: as estatísticas descritivas.
• Estatísticas descritivas são calculadas a partir de uma amostra de
dados, em vez de valores atribuídos com base na teoria.
• Antes de descrever as estatísticas mais importantes usadas em
População e Amostra
• População é a coleção total de todos os objetos a serem estudados.
• Por exemplo, na determinação da relação entre o risco e retorno das ações no Brasil, a população de interesse seria todas as observações de todas as ações negociadas na Bovespa
• Uma população pode ser finita ou infinita, enquanto que amostra é uma seleção de alguns itens
da população.
• A população é finita se ela contém um número fixo de elementos.
• Em geral, ou todas as observações para toda a população não estará disponível, ou elas podem
ser tão numerosas que seria inviável trabalhar com elas, caso em que uma amostra de dados é extraída para análise.
• A amostra é geralmente aleatória e deve ser representativa da população de interesse.
• Uma amostra aleatória é aquela em que cada item individual na população tem a mesma
probabilidade de ser extraída.
• O tamanho da amostra é o número de observações disponíveis, ou que o pesquisador decide
Medidas de tendência central
• O valor médio de uma série é conhecido como a sua medida de localização ou de tendência central.
• O valor médio é geralmente utilizado para medir o valor "típico“ de uma série. • Há vários métodos para o cálculo de médias.
• O mais conhecido é a média aritmética (geralmente denominado apenas “a média”), denotado 𝑟ഥ𝐴 para uma série ri de comprimento N, que é calculado
simplesmente como a soma de todos os valores da série dividido pelo número de valores:
Medidas de dispersão
• Variância:
• Desvio-padrão:
2
2 ( )
Assimetria e Curtose
• Assimetria • Curtose
3 3/ 2 2 1 ( )1 yi y
N S
4 2 2 1 ( ) 1 yi y21
Distribuição Normal x Distribuição Assimétrica
distribuição normal distribuição assimétrica
f(x)
x x
22
Distribuição Leptocúrtica x Distribuição Normal
-5.4 -3.6 -1.8 -0.0 1.8 3.6 5.4
Medidas de associação
• Covariância • Correlação , , , ( )( ), 1 1 ( 1)
x y
i i
x y x y
x y x y
x x y y
N
, ( )( ) 1 i i x yx x y y
N