Introdu¸c˜ ao ` a probabilidade e ` a estat´ıstica II
Revis˜ao
Prof. Alexandre G Patriota Sala: 298A
Email: patriota@ime.usp.br Site: www.ime.usp.br/∼patriota
Estat´ıstica
Estat´ıstica: ´E uma ciˆencia que se dedica `a coleta, organiza¸c˜ao, an´alise e interpreta¸c˜ao de dados. ´E um conjunto de t´ecnicas e procedimentos que auxilia a compreender/descrever/inferir quantidades de interesse que a priori s˜ao desconhecidas.
Estat´ıstica descritiva: Consiste em apresentar, descrever e resumir os dados obtidos (seja de uma amostra ou popula¸c˜ao).
Geralmente ´e a primeira etapa da an´alise de dados e permite tirar algumas conclus˜oes iniciais.
Probabilidade: A teoria das probabilidades auxilia na modelagem de fenˆomenos aleat´orios, ou seja, aqueles em que est´a presente a incerteza.
Estat´ıstica indutiva: Consiste na extrapola¸c˜ao para a popula¸c˜ao dos resultados obtidos em uma amostra.
Exemplos
I Analisar a toxicidade de um extrato vegetal em larvas do mosquitos da dengue;
I Verificar se um rem´edio ´e mais eficaz que outro dispon´ıvel no mercado;
I Verificar quais fatores de risco (fumar, obesidade, colesterol alto, etc) est˜ao relacionados com problemas cardiovasculares;
I Calcular a probabilidade de um indiv´ıduo pagar um empr´estimo;
I Prever lucros e despesas de uma empresa;
I Prever o tempo de sobrevida de doentes ou materiais;
Popula¸c˜ ao e Amostra
Popula¸c˜ao: A cole¸c˜ao de todos os poss´ıveis elementos sob investiga¸c˜ao ´e denominada de popula¸c˜ao ou universo.
Em todos os problemas estat´ısticos devemos inicialmente definir qual a popula¸c˜ao alvo. Com ela, estar˜ao relacionadas as
quantidades de interesse.
Amostra: E um subconjunto da popula¸´ c˜ao.
A amostra ´e utilizada quando n˜ao temos acesso a popula¸c˜ao toda e serve como base para inferir sobre quantidades de interesse relacionadas `a popula¸c˜ao.
Amostra representativa da Popula¸c˜ ao
Uma amostra ´e representativa da popula¸c˜ao quando nela est˜ao contidas idealmente todas as caracter´ısticas e/ou propriedades da popula¸c˜ao alvo.
Ou seja, uma amostra representativa deve ter um comportamento parecido com o da popula¸c˜ao.
Caso contr´ario, diremos que a amostra ´e enviesada ou viciada.
Os m´etodos estat´ısticos para a retirada de amostras representativas s˜ao estudados na disciplina de amostragem.
Tipos de vari´ aveis
H´a dois tipos de vari´aveis, a saber: vari´aveis quantitativas e qualitativas.
Vari´aveis quantitativas descrevem quantidades (discretas e cont´ınuas)
Vari´aveis qualitativasdescrevem qualidades (ordinais e nominais).
Diagrama
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.
Vari´ aveis aleat´ orias
Vari´aveis aleat´orias s˜ao fun¸c˜oes reais dos elementos do espa¸co amostral Ω podendo ser
I Discretas (o suporte ´e enumer´avel): n´umero de filhos, n´umero de falhas ocorridas, etc.
I Cont´ınuas (o suporte ´e n˜ao-enumer´avel): peso, tempo de vida, lucro, etc.
Vari´ aveis aleat´ orias Discretas
Exemplo 1: SejaX a vari´avel aleat´oria que assume os valores 0,1,2 com fun¸c˜ao de probabilidades P tal que
P(X = 0) =P(X = 1) =P(X = 2) = 1 3.
Exemplo 2: SejaX a vari´avel aleat´oria que assume os valores 0,1,2 com fun¸c˜ao de probabilidades P tal que
P(X = 0) =p0, P(X = 1) =p1, P(X = 2) =p2. Note que as condi¸c˜oes necess´arias para queP seja uma fun¸c˜ao de probabilidades s˜ao
p0+p1+p2= 1 e 0<pi <1
Vari´ aveis aleat´ orias Discretas
Exemplo 3: SejaX a vari´avel aleat´oria que assume os valores x0,x1,x2, . . . ,xk com fun¸c˜ao de distribui¸c˜ao de probabilidades P tal que
P(X =xi) =pi, i = 0,1,2, . . . ,k
com k
X
i=0
pi = 1 e 0<pi <1
Exemplo 4: SejaX a vari´avel aleat´oria que assume os valores x0,x1,x2, . . . com fun¸c˜ao de distribui¸c˜ao de probabilidadesP tal que
P(X =xi) =pi, i = 0,1,2, . . . com
X
i≥0
pi = 1 e 0<pi <1
Apresenta¸c˜ ao da fun¸c˜ ao de probabilidades
Uma forma simples de apresenta¸c˜ao da fun¸c˜ao de probabilidades de uma vari´avel discreta X ´e dada abaixo
X x0 x1 . . . xk
P(X =x) p0 p1 . . . pk
X P(X =x) x0 p0 x1 p1 ... ... xk pk
Notem a semelhan¸ca com tabelas de frequˆencias. Qual a diferen¸ca?
Lan¸camentos de dados
Suponha o seguinte experimento: lan¸car um dado de 10 faces.
Defina a vari´avel aleat´oriaX como sendo o valor num´erico da face voltada para cima. Note que n˜ao conhecemos o valor antes de executar o experimento.
Neste caso podemospostular um modelo probabil´ıstico para os poss´ıveis valores observados.
X 1 2 3 4 5 6 7 8 9 10
P(X =x) 101 101 101 101 101 101 101 101 101 101 A fim de verificar o modelo postulado poderemos executar o experimentoN vezes e criar uma tabela de frequˆencias.
Valor esperado e variˆ ancia de uma v.a. discreta
SejaX a vari´avel aleat´oria que tem suporteSX ={x1,x2, . . . ,xk} com
P(X =xi) =pi, i = 1,2, . . . ,k Esperan¸ca matem´atica de X ´e dada por
E(X) =x1p1+x2p2+. . .+xkpk =
k
X
i=1
xipi
Variˆancia de X ´e definida por
Var(X) = (x1−E(X))2p1+ (x2−E(X))2p2+. . .+ (xk−E(X))2pk
=
k
X
i=1
(xi −E(X))2pi
O desvio-padr˜ao DP(X) ´e dado pela raiz quadrada da variˆancia.
Fun¸c˜ ao de distribui¸c˜ ao acumulada
SejaX a vari´avel aleat´oria que assume os valoresx1,x2, . . . ,xk com P(X =xi) =pi, i = 1,2, . . . ,k
A fun¸c˜ao de distribui¸c˜ao acumulada ´e definida por F(t) =P(X ≤t) t∈R
Principais distribui¸c˜ oes discretas
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.
Vari´ aveis aleat´ orias Cont´ınuas
Exemplo 1: SejaX uma v.a. cont´ınua com fun¸c˜ao densidade de probabilidades
f(x) = 1
b−a, sex∈(a,b) 0, caso contr´ario
Exemplo 2: SejaX uma v.a. cont´ınua com fun¸c˜ao densidade de probabilidades
f(x) =
3x2, sex∈(0,1) 0, caso contr´ario
Vari´ aveis aleat´ orias Cont´ınuas
Exemplo 3: SejaX uma v.a. cont´ınua com fun¸c˜ao densidade de probabilidades
f(x) = 1
β exp(−x/β), sex>0 0, caso contr´ario
Exemplo 4: SejaX uma v.a. cont´ınua com fun¸c˜ao densidade de probabilidades
f(x) = 1
σ√
2πexp
− 1
2σ2(x−µ)2
Lembre-se dafun¸c˜ao gama: Γ(k) =R∞
0 xk−1exp(−x)dx e suas propriedades: 1. Γ(k+ 1) =kΓ(k); 2. parak inteiro, Γ(k+ 1) =k!; 3.
Γ(1/2) =√ π.
Valor esperado e variˆ ancia de uma v.a. cont´ınua
SejaX a vari´avel aleat´oria cont´ınua com suporteSX e fun¸c˜ao densidadef.
Esperan¸ca matem´atica de X ´e dada por E(X) =
Z ∞
−∞
xf(x)dx
Variˆancia de X ´e definida por Var(X) =
Z ∞
−∞
[x−E(X)]2f(x)dx
O desvio-padr˜ao DP(X) ´e dado pela raiz quadrada da variˆancia.
Fun¸c˜ ao de distribui¸c˜ ao acumulada
A fun¸c˜ao de distribui¸c˜ao acumulada ´e definida por F(t) =P(X ≤t) =
Z t
−∞
f(x)dx, t ∈R.
Quantis
Op-quantil ´e o valor que divide a densidade de dados em duas regi˜oes onde a primeira (a regi˜ao `a esquerda) tem ´areap e a segunda (a regi˜ao `a direita) tem ´area 1−p.
Ou seja, o p-quantil ´e o valorqp tal que p =F(qp)
Principais Distribui¸c˜ oes
Principais distribui¸c˜oes cont´ınuas:
I Uniforme
I Exponencial
I Normal,
I t-Student,
I χ2 (Qui-quadrado),
I F de Snedecor.
Pacotes Estat´ısticos
Alguns pacotes estat´ısticos: MINITAB, SAS, SPLUS, SPSS, MATLAB, Maple, R.
Neste curso, sempre que necess´ario, eu utilizarei o R que pode ser obtido gratuitamente no endere¸co: http://CRAN.R-project.org
Aprenda a usar o R:
http://www.feferraz.net/files/Rlang-PT.pdf