Métodos Quantitativos Aplicados à Contabilidade (III)

(1)

Métodos Quantitativos

Aplicados à Contabilidade (III)

(2)

2

Revisão de Matemática

Parte III

Estatística

(3)

Variáveis aleatórias

• Uma variável aleatória é uma variável que pode assumir qualquer valor dentro de um dado conjunto, sendo esse valor determinado pelo menos em parte ao acaso.

• Pela sua natureza, variáveis aleatórias não são perfeitamente

previsíveis.

• A maioria dos dados em economia, finanças e contabilidade são

variáveis aleatórias, embora elas possam possuir alguma estrutura mensurável. Sendo assim elas não são puramente aleatórias.

• Podemos pensar nessas séries como tendo uma parte fixa (que

(4)

Valor esperado de uma variável aleatória

• A média de uma variável aleatória y é também conhecida como valor

esperado, E(y).

• O valor esperado de uma constante (ou de uma variável não

estocástica) é a própria constante, por exemplo E(c ) = c .

• O valor esperado de uma constante multiplicada por uma variável

aleatória é igual à própria constante multiplicada pelo valor esperado da variável: E(cy) = cE(y).

• Além disso, E(cy + d ) = cE(y) + d, onde d é também uma constante.

(5)

Variância de uma variável aleatória

• A variância de uma variável aleatória y é denominada var(y).

• As propriedades do operador de variância var(·), são:

• A variância de uma variável aleatória y é var(y) = E[y − E(y)]2

• A variância de uma constante é zero: var(c) = 0

• Se c e d são constantes, var(cy + d ) = c2var(y)

• Para duas variáveis aleatórias independentes, y₁ e y₂, var(cy₁ + dy₂) =

(6)

Covariância entre duas variáveis aleatórias

• A covariância entre duas variáveis aleatórias, y₁ e y₂ pode ser expressa

como cov(y₁, y₂). As propriedades do operador de covariância são:

• cov(y₁, y₂) = E[(y₁ − E(y₁))(y₂ − E(y₂))]

• Para duas variáveis aleatórias independentes, y₁ e y₂, cov(y₁, y₂)=0

(7)

A distribuição normal

• A distribuição mais utilizada para caracterizar uma variável aleatória é

a normal ou gaussiana.

• A distribuição normal é simples de se usar, uma vez que é simétrica e

(8)

A distribuição normal

• A distribuição normal tem várias propriedades matemáticas úteis.

• Por exemplo, qualquer transformação linear de uma variável aleatória

normalmente distribuída será também normalmente distribuída.

• Assim, se y  N(μ, σ2), isto é, se y é normalmente distribuída com

média μ e variância σ2_{, então (}_a₊_by₎ _N(_a₊bμ_,_b2σ2_{) onde}_a _e_b _são

escalares. O símbolo  após a variável significa que a variável tem a

distribuição indicada pelo símbolo em seguida, no caso, N = normal.

• Além disso, qualquer combinação linear de variáveis aleatórias

(9)

A distribuição normal

• Suponha que temos um variável aleatória normalmente distribuída

com média μ e variância σ2.

• Sua função densidade de probabilidade é dada por f(y) na seguinte

(10)

A distribuição normal

• Um variável aleatória com distribuição normal padrão pode ser obtida a partir desta fórmula subtraindo-se a média e dividindo-se pelo desvio padrão (a raiz quadrada da variância).

• O variável aleatória com distribuição normal padrão seria então:

• Geralmente, é necessário utilizar a distribuição normal na sua forma padronizada, pois ela é tabelada.

• Podemos usar a fdp para calcular a probabilidade de que a variável aleatória situa-se dentro de um determinado intervalo - por exemplo, qual é a probabilidade de que y se situa entre 0,2 e 0,3?

• Para achar isso, teríamos substituir y = 0,2 e depois y = 0,3 na equação da página anterior e calcular o valor correspondente de f(y) em cada caso.

• Então, a diferença entre estes dois valores de f(y) nos daria a resposta.

~ (0,1)

y

Z  N



(11)

(12)

Teorema do Limite Central

• Se uma amostra aleatória de tamanho N: y₁, y₂, y₃, ..., y_n for extraída a partir de uma população normalmente distribuída com média μ e variância σ2_{, a média da} amostra, ത𝑦 será também normalmente distribuída com média μ e variância σ2_/N. • Essa regra importante da estatística conhecida como teorema do limite central

afirma que a distribuição amostral da média de qualquer amostra aleatória de observações tenderá para a distribuição normal, com média igual a média da população, μ, quando o tamanho da amostra tende ao infinito, i.e., N .

• Este teorema é muito relevante, porque ele afirma que a média amostral, ത𝑦, vai seguir uma distribuição normal, mesmo que as observações originais (y₁, y₂, ..., y_n) não o façam.

(13)

Outras distribuições estatísticas

• Há muitas distribuições estatísticas, tais como a binomial, Poisson,

lognormal, normal, exponencial, t, qui-quadrada e F, cada uma com a sua própria função densidade de probabilidade característica.

• Diferentes variáveis aleatórias serão melhor modeladas com

distribuições diferentes.

• Muitas das distribuições estatísticas também estão relacionadas entre

si, e a maioria (exceto a normal) têm um ou mais parâmetros de graus de liberdade que determinam a posição e forma da distribuição.

• Por exemplo, a distribuição qui-quadrada (χ2) pode ser obtida pela

(14)

Distribuição t-Student

• A distribuição mais importante usada em econometria é a distribuição t,

também conhecida como t-Student.

• A distribuição normal é um caso especial da t. A distribuição normal tende

no limite para a distribuição t quando N  .

• A distribuição t pode ser obtida tomando-se uma variável aleatória com

distribuição normal padrão, Z, e dividindo-a pela raiz quadrada de uma

variável aleatória independente com distribuição qui-quadrada (y₁),

dividida pelos seus graus de liberdade, n₁

• A distribuição t é simétrica em torno de zero e é similar à distribuição

normal, exceto que é mais achatada e mais larga.

(15)

Distribuição t x Distribuição Normal

normal

(16)

Estatísticas Descritivas

• Quando a análise de uma série contém muitas observações, é usual

descrever as características mais importantes das séries usando um resumo das medidas mais importantes: as estatísticas descritivas.

• Estatísticas descritivas são calculadas a partir de uma amostra de

dados, em vez de valores atribuídos com base na teoria.

• Antes de descrever as estatísticas mais importantes usadas em

(17)

População e Amostra

• População é a coleção total de todos os objetos a serem estudados.

• Por exemplo, na determinação da relação entre o risco e retorno das ações no Brasil, a população de interesse seria todas as observações de todas as ações negociadas na Bovespa

• Uma população pode ser finita ou infinita, enquanto que amostra é uma seleção de alguns itens

da população.

• A população é finita se ela contém um número fixo de elementos.

• Em geral, ou todas as observações para toda a população não estará disponível, ou elas podem

ser tão numerosas que seria inviável trabalhar com elas, caso em que uma amostra de dados é extraída para análise.

• A amostra é geralmente aleatória e deve ser representativa da população de interesse.

• Uma amostra aleatória é aquela em que cada item individual na população tem a mesma

probabilidade de ser extraída.

• O tamanho da amostra é o número de observações disponíveis, ou que o pesquisador decide

(18)

Medidas de tendência central

• O valor médio de uma série é conhecido como a sua medida de localização ou de tendência central.

• O valor médio é geralmente utilizado para medir o valor "típico“ de uma série. • Há vários métodos para o cálculo de médias.

• O mais conhecido é a média aritmética (geralmente denominado apenas “a média”), denotado _𝑟_ഥ_𝐴 para uma série r_i de comprimento N, que é calculado

simplesmente como a soma de todos os valores da série dividido pelo número de valores:

(19)

Medidas de dispersão

• Variância:

• Desvio-padrão:

2

2 ( )

(20)

Assimetria e Curtose

• Assimetria • Curtose

 

3 3/ 2 2 1 ( )

1 yi y

N S    



 

4 2 2 1 ( ) 1 yi y

(21)

21

Distribuição Normal x Distribuição Assimétrica

distribuição normal distribuição assimétrica

f(x)

x x

(22)

22

Distribuição Leptocúrtica x Distribuição Normal

-5.4 -3.6 -1.8 -0.0 1.8 3.6 5.4

(23)

Medidas de associação

• Covariância • Correlação , , , ( )( )

, 1 1 ( 1)

x y

i i

x y x y

x y x y

x x y y

N               



, ( )( ) 1 i i x y

x x y y

N

   