PROBABILIDADE & ESTATÍSTICA
Prof. Hélio Radke Bittencourt 2019/1
1. CONCEITOS BÁSICOS DE ESTATÍSTICA
1.1 Conjuntos de dados. População e Amostra 1.2 Tipos de variáveis
1.3 Escalas de mensuração
1.4 Estatística descritiva e inferencial
2. ESTATÍSTICA DESCRITIVA
2.1 Tabelas de freqüência simples e cruzadas 2.2 Análise gráfica
2.3 Medidas de Tendência Central 2.4 Separatrizes
2.5 Medidas de Variabilidade
3. PROBABILIDADE
3.1 Experimentos, Espaço Amostral e Eventos 3.2 Operações com eventos
3.3 Conceitos de Probabilidade
3.4 Probabilidade Condicional e Independência 3.5 Teorema de Bayes
3.6 Variáveis aleatórias discretas 3.7 Principais modelos discretos 3.8 Variáveis aleatórias contínuas 3.9 Principais modelos contínuos
4. AMOSTRAGEM
4.1 Conceitos básicos
4.2 Principais técnicas de amostragem probabilística
5. DISTRIBUIÇOES AMOSTRAIS E ESTIMAÇÃO
5.1 Parâmetros e Estimadores 5.2 Distribuição amostral da média 5.3 Estimação por ponto
5.4 Estimação por intervalos de confiança
6. TESTES DE HIPÓTESES
6.1 Teste t de Student para uma média
6.2 Testes t de Student - duas amostras independentes 6.3 Análise de Variância (ANOVA)
6.4 Teste Qui-quadrado
7. CORRELAÇÃO E REGRESSÃO
7.1 Coeficiente de correlação de Pearson 7.2 Regressão Linear Simples
Cap. 1. CONCEITOS BÁSICOS DE ESTATÍSTICA
1.1 Conjunto de dados. População e amostra
A Estatística pode ser definida como o conjunto de ferramentas para coleta,
organização, análise e interpretação de dados experimentais. O objeto de estudo em
Estatística é um conjunto de dados que pode constituir uma população ou uma
amostra.
População é um conjunto finito ou infinito de elementos.
Amostra é um subconjunto da população. Geralmente buscamos amostras
representativas. Uma amostra representativa é aquela que mantém as
características da população.
1.2 Tipos de Variáveis
Em estatística não trabalhamos diretamente com os elementos que formam o conjunto
de dados, mas sim com suas características. Variáveis são características dos
elementos que formam o conjunto de dados.
As variáveis podem ser classificadas em qualitativas ou quantitativas: as variáveis
qualitativas expressam uma classificação em categorias e, por isso, também são
chamadas de categóricas. As variáveis quantitativas expressam quantidades numéricas
e se dividem em discretas e contínuas. As variáveis discretas assumem apenas
determinados valores num dado conjunto enumerável, enquanto as variáveis contínuas
podem assumir, ao menos teoricamente, qualquer valor num dado intervalo numérico.
Exemplo – Listar variáveis qualitativas e quantitativas para um laptop
Na prática todas as variáveis são discretas, devido à limitação dos instrumentos de
mensuração.
1.3 Escalas de Mensuração
As variáveis ainda podem ser classificadas de acordo com o nível ou escala de
mensuração: Nominal, Ordinal ou Intervalar/Razão.
O nível nominal de mensuração é caracterizado por números que apenas
diferenciam ou rotulam as categorias.
Exemplos: Sexo (1-M, 2-F), Estado Civil, Naturalidade, Curso.
O nível ordinal de mensuração envolve números que, além de diferenciar,
hierarquizam as categorias. Também são chamadas de escalas Likert em homenagem
ao americano Rensis Likert que publicou o artigo "A Technique for the measurement of
attitudes" em 1932, onde sugeriu escalas de 5 pontos com uma categoria neutra ao
centro.
Exemplos: Nível de satisfação, Nível de concordância, Escala de Avaliação, Níveis de
solubilidade.
O nível intervalar ou de razão apresenta números que expressam diretamente uma
quantidade seguindo uma métrica. Podemos tranqüilamente realizar operações
matemáticas com variáveis deste tipo.
Exemplos: Temperatura, tamanho de objetos, pesos, contagens.
1.4 Estatística Descritiva e Inferencial
A estatística é um conjunto de ferramentas utilizadas para a coleta, tabulação, análise e
interpretação de um conjunto de dados experimentais. A Estatística pode ser dividida
em duas grandes áreas: Descritiva e Inferencial.
A estatística descritiva é aquela que costumamos encontrar com maior freqüência
em jornais, revistas, relatórios, etc. Essa parte da estatística utiliza números para
descrever fatos. Seu foco é a representação gráfica e o resumo e organização de um
conjunto de dados, com a finalidade de simplificar informações. Nessa categoria se
enquadram as médias salariais, taxas de inflação, índice de desemprego, etc.
A estatística inferencial consiste na obtenção de resultados que possam ser
projetados para toda população a partir de uma amostra da mesma. Ela fundamenta-se
na teoria da amostragem e no cálculo de Probabilidades. Essa é a área mais importante
da Estatística.
Figura - Esquema geral de um curso de Estatística
Descritiva Estatística Inferencial Probabilidade Amostragem
Cap. 2 ESTATÍSTICA DESCRITIVA
2.1 Tabelas de freqüência simples e cruzadas
Vamos introduzir o tema de tabelas de freqüência simples construindo tabelas para o
banco de dados coletado em sala de aula:
Exemplo 1 – Banco de dados coletado em sala de aula
Aluno
Sexo
(M ou F)
Semestre Nº pessoas
domicílio
Nº contas de
Altura (cm)
Criar uma tabela de freqüências para cada uma das variáveis.
Tabelas de freqüência são encontradas em jornais informativos (Zero Hora, Correio do
Povo, etc.), relatórios técnicos, monografias, dissertações, teses e revistas científicas.
As tabelas de freqüência simples apresentam de forma concisa o número de
ocorrências (absoluta e relativa) dos valores de uma variável.
Uma tabela de freqüência genérica tem a seguinte configuração:
Tabela 1 – Tabela de freqüências genérica
i
x
if
ifr
i1
x
1f
1fr
12
x
2f
2fr
2
k
x
kf
kfr
k
n
100,0%
A notação utilizada é a seguinte:
X é uma variável qualquer
x é um particular valor da variável X
i é um índice útil para enunciar as expressões matemáticas
k é o número de linhas da tabela
Os componentes da tabela de freqüências são:
Freqüência absoluta (f
i): número de ocorrências do valor x
i.Freqüência relativa (fr
i): percentual de ocorrências do valor x
iFreqüência absoluta acumulada (F
i): número de ocorrências até o valor x
i.Freqüência relativa acumulada (Fr
i): percentual de ocorrências até o valor x
iAs Tabelas cruzadas apresentam a distribuição de freqüências de duas variáveis
simultaneamente. As tabelas cruzadas são abundantes em jornais e revistas
especializadas.
Exemplo 2 – Tabela Cruzada 2X2
Matriz de confusão / Tabela de classificação
Realidade
Sem
Classificação
mudanças Mudanças
Total
Sem mudanças
80
20
100
Mudanças
5
45
50
5,7% 1,9% 2,4% 2,8% 3,3% 8,5% 9,4% 28,3% 37,7% 0% 20% 40% 60% 80% 100% Outras Drogas Acidente de carro Doenças venéreas Armas de fogo Doenças infecciosas Ãlcool Obesidade Cigarro
2.2 Análise Gráfica
O tipo de gráfico adequado para cada variável depende do tipo de variável. Segue uma
relação de exemplos de variáveis e tipos de gráficos adequados.
Variável Qualitativa Nominal (com poucas categorias)
GRÁFICO DE SETORES (Pizza ou Torta)
Figura – Distribuição da turma por sexo
Masculino 40%
Feminino 60%
Base: 50 alunos de uma turma
Fonte: dados coletados em aula (numa turma, obviamente, não de CC)
Variável Qualitativa Nominal (com muitas categorias):
GRÁFICO DE BARRAS
Figura – Principais causas de morte - EUA
Base: ???
Variável Qualitativa Ordinal:
GRÁFICO DE BARRAS
Figura – Avaliação do atendimento da equipe de um call-center
2% 5% 8% 20% 35% 25% 0% 10% 20% 30% 40% Péssimo Ruim Regular Bom Muito Bom Ótimo % A v a li a ç ã o Base: 100 usuários Fonte: Dados fictícios.
Variável Quantitativa Discreta
GRÁFICO DE COLUNAS
Figura – Número de pessoas por domicílio
7,5% 20,0% 35,0% 25,0% 12,5% 0,0% 20,0% 40,0% 60,0% 80,0% 100,0% 1 2 3 4 5
Número de pessoas por domicílio
Base: 40 domicílios
Variável Quantitativa Contínua
HISTOGRAMA
Figura – Distribuição de uma turma por altura
Altura (cm) 200 ,0 190 ,0 180 ,0 170 ,0 160 ,0 150 ,0 F re q ü ê n c ia 10 8 6 4 2 0 Base: 20 observações
2.3 Medidas de Tendência Central
São valores que trazem informação sobre a região em torno da qual os dados estão
posicionados. As medidas de tendência central mais utilizadas são: Média, Mediana e
Moda.
2.3.1 – Média Aritmética (
, X )
A média aritmética é definida como a soma de todas observações da variável X,
dividida pelo número de elementos do conjunto de dados. Freqüentemente a média
aritmética é o valor que melhor representa um conjunto de dados.
Quando os dados não estão organizados na forma de uma tabela de freqüências e,
portanto, estão na forma isolada, as expressões genéricas para encontrar a média
são:
População
Amostra
N x N i i
1
n x X n i i
1Quando os dados estão organizados na forma de uma tabela de freqüências deve-se
ponderar os diferentes valores x
ipelas respectivas freqüências f
i. Procedendo desta
forma o cálculo da média aritmética torna-se mais simples e rápido.
População
Amostra
N f x k i i i
1
n f x X k i i i
1Exemplo 3 – Número de disciplinas cursadas no semestre
Encontrar a média para o número de disciplinas cursadas no semestre.
2.3.2 – Mediana (Md)
A mediana é o valor que divide o conjunto de dados ordenado em duas partes com
igual número de observações. Para calcular a mediana iremos utilizar uma nova
notação. Seja
x[1],x[2],,x[n]um conjunto de dados ordenado (ordem crescente),
onde o valor entre colchetes representa a posição no conjunto ordenado.
Deduzindo a posição mediana:
n ímpar n par
n
Fila
Md
n
Fila
Md
3
4
5
6
7
8
As expressões genéricas para encontrar a média são:
n ímpar n par
Quando os dados estão organizados na forma de uma tabela de freqüências pode-se
encontrar a posição mediana na coluna acumulada F
i.
Exemplo 4 – Número de disciplinas cursadas no semestre
2.3.3 – Moda (Mo)
A moda é definida como o valor mais freqüente de um conjunto de dados. É possível
que o conjunto seja bimodal (duas modas) ou até mesmo multimodal (três os mais
modas).
x
if
iMo
com
maior
Exemplo 5 – Número de disciplinas cursadas no semestre
Encontrar a moda para o número de disciplinas cursadas no semestre.
Considerações IMPORTANTES sobre as MTC
1. A média é a MTC mais influenciada por valores extremos, entretanto é a medida
mais “rica”, porque considera todos valores do conjunto de dados.
2. A mediana não é afetada por valores extremos.
3. A moda é a MTC mais “pobre”, porque considera apenas os valores mais freqüentes.
4. Existem outros tipos de média usadas em ocasiões especiais. A média harmônica é
muito utilizada em concursos públicos e a geométrica pode ser usada em situações de
alta variabilidade, visto que ela é mais estável. Discutiremos isto em aula.
Média harmônica
Média geométrica
n i i h x n X 1 1n n G x x x X 1 2
Pode-se estabelecer a seguinte relação entre as médias:
X X Xh G
Exemplo – Desempenho no Vestibular
Veja os quatro candidatos a seguir e seus respectivos desempenhos no vestibular.
Comente sobre a ação das médias.
Tabela – Desempenho de quatro alunos no vestibular
Aluno A Aluno B Aluno C Aluno DQuímica 500 498 410 580 Física 500 502 405 580 Matemática 500 500 415 580 Geografia 500 515 425 580 História 500 485 445 580 Português 500 500 900 100 Média Aritmética 500,0 500,0 500,0 500,0 Média Harmônica 500,0 499,8 460,5 322,2 Média Geométrica 500,0 499,9 476,7 432,7
2.4 Separatrizes
São valores que separam o conjunto de dados ordenado em partes com igual número
de observações.
A Mediana é, portanto, uma separatriz porque divide o conjunto de dados em duas
partes iguais.
Min |---|---| Máx
Md
Os Quartis (Q
i) dividem o conjunto de dados em 4 partes iguais.
Min |---|---| Máx
Os Percentis (P
i) dividem o conjunto de dados em 100 partes iguais.
Min |---|---| Máx
Exemplo 6 – Boletim de Desempenho do Provão do MEC
Exemplo 7 – Distribuição de Renda no Brasil
A régua de percentis a seguir apresenta a distribuição de renda per capita para a
população do Brasil todo no ano de 2012.
R$6000 R$ 286 R$ 533 R$ 936 R$ 1681 R$2600
Min|---|---|---|---|----|---|--| Max P25 P50 P75 P90 P95 P99
2.5 Medidas de Variabilidade
São medidas que complementam as MTC trazendo informação sobre a dispersão
existente no conjunto de dados. Para introduzi-las vamos recorrer a um exemplo onde
temos três diferentes processadores e o tempo necessário por eles para realizar uma
tarefa.
Exemplo 8 – Entendendo as Medidas de Variabilidade
Tabela – Tempos de processamento (ms)
Processador
Alfa ®
Processador
Beta ®
Processador
Gama ®
120
118
120
120
121
100
120
124
135
120
117
155
120
120
120
120
120
90
Média ( X )
Moda (Mo)
Mediana (Md)
Questões
1 – O que aconteceu com as MTC na tabela acima?
2 – Os três processadores são iguais em relação ao tempo de processamento?
3 – O que diferencia um processador do outro?
A partir de agora aprenderemos a calcular medidas capazes de quantificar a
variabilidade existente num conjunto de dados
2.5.1 – Amplitude (R, do termo Range)
É a diferença entre o maior e o menor valor de um conjunto de dados.
x
imín
x
imáx
R
Calcular R nos três processadores do Exemplo 8.
2.5.2 – Variância (
2, s
2)
A variância é uma medida da variação em torno da média. Por definição,
variância é a média dos quadrados dos desvios em torno da média.
População Amostra
N x N i i
1 2 2
1 1 2 2
n X x s n i iA variância, ao contrário da Amplitude, considera todos elementos do conjunto de
dados no seu cálculo. Quanto maior for a variação dos valores do conjunto de dados,
maior será a variância.
Quando os dados estão organizados na forma de uma tabela de freqüências,
deve-se ponderar os quadrados dos desvios pela freqüência. Esdeve-se procedimento facilita o
cálculo.
População Amostra
N f x i k i i
1 2 2
1 1 2 2
n f X x s k i i i2.5.3 – Desvio-padrão (
,
s)
O desvio-padrão é a raiz quadrada positiva da variância. Essa medida corrige o
problema de unidade que surge na variância. O desvio-padrão também é uma
medida da variação em torno da média.
População Amostra
2
2
s
s
O desvio-padrão expressa a variação média do conjunto de dados em torno da média,
para mais ou para menos.
Calcular s nos três processadores do Exemplo 8.
2.5.4 – Coeficiente de Variação (CV)
O CV é a razão entre o desvio-padrão e a média de um conjunto de dados. Ele expressa
a variação relativa (%) presente no conjunto de dados em relação à média.
População Amostra
%
100
CV
100% X s CV
Quanto maior o CV, mais heterogêneos serão os dados.
Considerações sobre as Medidas de Variabilidade (MV)
1. A Amplitude á a MV mais “pobre”, porque considera apenas os dois valores
extremos do conjunto de dados.
2. A Variância não é interpretada na prática devido ao problema da unidade, que está
ao quadrado.
3. O Desvio-padrão é a MV mais conhecida, sendo amplamente utilizada.
4. Dentre as MV estudadas, sugere-se que o CV seja utilizado para comparação da
variabilidade entre diferentes conjuntos de dados. Por não ter unidade, o CV pode ser
utilizado até mesmo para comparar a variabilidade entre variáveis expressas em
diferentes unidades.
Exemplo 9 – Número de pixels corretamente classificados
Suponha que numa amostra de 30 imagens de satélite de uma mesma região
submetidas ao mesmo classificador, os números de pixels classificados de forma errada
foram:
10 5 6 5 6 9 5 7 5 10
5 10 7 8 8 9 9 6 6 10
5 6 6 7 6 6 7 6 8 7
a) Construir uma tabela de freqüências para a variável X.
b) Encontrar e interpretar as MTC.
Cap. 3 – Probabilidade
3.1 – Experimentos, Espaço Amostral e Eventos
Probabilidade é o ramo da matemática que trata de fenômenos aleatórios. A observação de um fenômeno aleatório por parte do homem é chamada de experimento aleatório.
Características de um experimento aleatório:
1ª) Não se conhece um particular valor do experimento antes dele ser executado, porém podemos descrever todos os possíveis resultados - as possibilidades;
2ª) Quando o experimento é repetido algumas vezes, os resultados ocorrem de uma forma aparentemente acidental. Mas quando o número de repetições aumenta, uma regularidade aparecerá. E esta regularidade que torna possível construir um modelo matemático útil para análise do experimento.
Exemplos de fenômenos aleatórios:
1) Condições meteorológicas
2) Produção de arroz anual numa cidade 3) Mercado Financeiro
4) Lançamento de uma moeda 5) Resultados de loterias
Exemplos de experimentos aleatórios:
E1: Jogue um dado e observe o n.º na face de cima.
E2: Jogue uma moeda 3 vezes e observe o número de caras obtido.
E3: Jogue uma moeda 3 vezes e observe a seqüência de caras e coroas obtida. E4: O estado (conforme, não-conforme) de três peças produzidas é verificado. E5: O número de peças produzidas até a obtenção de uma defeituosa é anotado. E6: A temperatura de uma máquina é verificada por um supervisor.
Nos seis exemplos anteriores não somos capazes de precisar o resultado, entretanto conseguimos listar os possíveis resultados.
Espaço amostral de um experimento aleatório é o conjunto de todos os resultados possíveis
do experimento. É denotado por S ou . A cardinalidade do espaço amostra é denotada por #.
Exemplos de espaços amostrais relacionados aos experimentos anteriores. S1 = S2 = S3 = S4 = S5 = S6 =
Um evento é um subconjunto de S. Em particular, S e (conjunto vazio) são eventos; S é dito o evento certo e o evento impossível.
Exemplo de eventos no lançamento de um dado S = {1,2,3,4,5,6}
A: ocorre um n.º par A = {2,4,6} B: ocorre a face 6 B = {6} C: ocorre um n.º maior que 6 C = D: ocorre nº 6 ou nº par D = {2,4,6}
E: ocorre nº par ou nº ímpar E = {1,2,3,4,5,6} = S
3.2 Operações com eventos
É possível realizar operações com eventos que nada mais são do que as operações com conjuntos já estudadas no Ensino Fundamental.
Operações com eventos
Sejam A e B dois eventos associados a um espaço amostral S. 1) União: AB A ocorre ou B ocorre ou ambos ocorrem 2) Interseção: AB A ocorre e B ocorre
3) Complementar: Ac ou A não ocorre A
1) Dois eventos A e B são excludentes ou mutuamente exclusivos se a ocorrência de um impedir a ocorrência de outro. Em outras palavras, não podem ocorrer simultaneamente, logo, P(AB)=0.
2) Eventos ou resultados equiprováveis têm a mesma probabilidade de ocorrência. Se A e B são equiprováveis, então P(A)=P(B).
Exemplo – Lançamento de um dado e uma moeda, ambos honestos
Escreva o espaço amostral. Os resultados são todos equiprováveis? Qual a probabilidade de um particular par (x,y) ser selecionado. Assinale os seguintes eventos:
3.3 Conceitos de probabilidade
Os conceitos de probabilidade podem ser enunciados de três formas distintas. O conceito clássico - simples e antigo; o conceito frequentista - baseado na observação e o conceito moderno ou axiomático introduzido pelo russo Andrei Kolmogorov em 1933.
Considere P(A) = probabilidade de ocorrência do evento A.
Conceito clássico
Esse conceito só é válido se todos resultados de S forem equiprováveis. Para casos assim a probabilidade de ocorrência do evento A é obtida por:
)
(
)
(
)
(
S
Total
A
n
A
P
n(A) é o número de resultados favoráveis ao evento ATotal (s) é o número total de resultados em S
Exemplos – Conceito clássico
Conceito freqüentista
Neste conceito a probabilidade é tratada como um limite. Aqui é possível fazer uma relação entre probabilidade (teórica) e estatística (empírica). Para casos assim a probabilidade de ocorrência do evento A é obtida por:
1º) O experimento é repetido n vezes.
2º) Observa-se a freqüência relativa de ocorrência de um certo resultado A: fr(A) = ( ),
n A n
onde n(A) é o nº de vezes em que ocorre o resultado A em n realizações do experimento.
3º) Probabilidade como limite. A medida que n aumenta, a fr(A) converge para a real probabilidade P(A).
)
A
(
P
)
A
(
fr
lim
n
Exemplos – Conceito freqüentista
1) Verificando se um dado é honesto.
2) Encontrando a probabilidade de ocorrência de um acidente aéreo. 3) Qual a probabilidade de uma criança nascer com Síndrome de Down ?
TAREFA 1: “Não dê o peixe, ensine a pescar”
Desenvolver um dado no EXCEL de forma que seja possível verificar o funcionamento do Conceito Frequentista. Verifique se a fr(6) converge para 1/6 à medida que n aumenta.
Dica: Veja como podemos fazer uma moeda no Excel e como contar quantas caras ocorreu:
=SE(ALEATÓRIO()<0,5;”Cara”;”Coroa”)
Se o número aleatório entre 0 e 1 gerado pelo Excel for inferior a 0,5,então escreva “Cara”; caso contrário escreva “Coroa”. Depois, copie e cole esta fórmula para as células A2 até A1000. = CONT.SE(A2:A1000;”Cara”)
Conceito Axiomático
Os Axiomas da Probabilidade devem-se ao russo Kolmogorov. Seja A um evento de S. A probabilidade de ocorrência de A, denotada por P(A), deverá satisfazer os seguintes axiomas (propriedades fundamentais).
Axioma 1: 0 P(A) 1 Axioma 2: P(S) = 1
Axioma 3: Para eventos Ai excludentes, P(A1 A2) = P(A1) + P(A2)
3.4 Probabilidade Condicional e Independência
A probabilidade de ocorrência de um evento pode ser influenciada pela ocorrência de um evento paralelo. Considere que A e B são eventos de um mesmo espaço amostral S. Chamaremos de P(A|B) a probabilidade de ocorrência do evento A dado que o evento B já ocorreu.
Graficamente:
Olhando para o desenho podemos estabelecer as seguintes relações:
P(A|B) = P(B|A) =
Exemplo – Escolhendo alguém na sala de aula
Suponha que um aluno da turma será sorteado. Após saber o resultado o professor faz algumas perguntas utilizando probabilidade condicional.
Exemplo – Fornecedor X Devoluções
Devolução
Fornecedor Sim Não Total
A 30 50 80
B 60 40 100
C 50 50 100
Total 140 140 280
Resolver as seguintes probabilidades:
=> Independência
Dois eventos A e B são considerados independentes se a ocorrência de um não interfere na probabilidade de ocorrência do outro:
P(A|B) = P(A) e P(B|A) = P(B)
Isolando a intersecção na expressão de probabilidade condicional obtemos: P(AB) = P(A) x P(B)
Esse conceito é fundamental para aplicações em Estatística.
Exemplo – Lançamento de um dado e uma moeda, ambos honestos.
Exemplo – Três operadores diferentes realizam a mesma tarefa em máquinas distintas. Eles
produzem caixas com três peças, cada uma feita por um operado. A probabilidade do operador A falhar é de 3/1000 ; do operador B 5/1000 e do operador C, 1/100.
3.5 Teorema de Bayes
Considere um espaço amostral formado por n eventos Ai excludentes de forma que A1A2...An = S. Suponha que as probabilidades dos Ai´s sejam conhecidas bem como todas as condicionais P(B|Ai). Será possível determinar a probabilidade P(Ai|B)?
Dedução da “Regra de Bayes”:
... ) B ( P ) A | B ( P ) A ( P ) B ( P ) B A ( P ) B | A ( P i i i i
Exemplo – Máquinas e não-conformidade
Uma empresa possui três máquinas (A,B,C) com as seguintes probabilidades de produção de uma peça não-conforme (NC): 1%, 2% e 5%. A máquina A é responsável por 40% da produção; a máquina B por 50% e a máquina C é responsável pelo restante.
a) Se uma peça não-conforme é encontrada, qual a probabilidade dela ter sido produzida pela máquina A? Encontre as probabilidades para as máquinas B e C também.
b) Qual a probabilidade de uma peça não-conforme ser encontrada na produção conjunta?
Exemplo – Bayes numa tabela cruzada
Suponha uma sala de aula com 60 alunos, sendo 30 das Ciências da Computação, 20
da Engenharia Elétrica e 10 da Eng de Produção. Sabe-se que, nesta turma, 20 alunos
estão em G2, sendo 12 da CCO e seis da EEL. Sabendo que um aluno está em G2,
qual a probabilidade ele ser a Eng de Produção?
3.6 – Variáveis aleatórias discretas
3.6.1 Definições Básicas
Uma variável aleatória discreta X é uma função que associa números aos resultados do Espaço Amostral.
Exemplo – Prova
Para exemplificar vamos admitir uma prova composta de n=4 questões com cinco alternativas cada onde apenas uma está correta.
Q1) a) b) c) d) e) Q2) a) b) c) d) e) Q3) a) b) c) d) e) Q4) a) b) c) d) e)
Escreva o espaço amostral S considerando apenas questão certa (C) ou errada (E).
S = { EEEE; CEEE; CCEE; CCCE; CCCC } onde temos 24 = 16 ECEE; CECE; CCEC;
EECE; CEEC; CECC; EEEC; ECCE; ECCC;
ECEC EECC
Agora considere X=número de acertos em cada ponto amostral de S. Logo, os valores possíveis para X são 0,1,2,3 ou 4. O resultado EEEE implica em X=0; os resultados CEEE, ECEE, EECE, EEEC implicam num X=1, etc.
A função de probabilidade de X, denotada por P(X=x) ou f(x), indica o comportamento probabilístico de X.
Neste caso:
x 0 1 2 3 4
P(X=x)
Características da função de probabilidade: 1a)
0
P
(
X
x
)
1
2a)
x x X P( ) 1A Função de probabilidade acumulada de X, denotada por F(X) ou P(X x), indica a
probabilidade de ocorrerem valores menores ou iguais a x. Características da F(X) ou P(X x):
1a) Ela é contínua à direita; 2a) F()0 e F( )1
3a) F(x) é sempre não decrescente.
Graficamente:
Esperança e Variância de uma Variável Aleatória Discreta
O valor esperado ou esperança de uma variável discreta é o seu “centro de equilíbrio”. É uma média da variável X, mas do ponto de vista teórica, sem coleta de dados empíricos. A
esperança de uma variável discreta é calculada por:
x ) x X ( P x ) X ( E Exemplo – ProvaCalcular o número esperado de acertos no caso da prova.
A variância de uma variável aleatória discreta indica a variabilidade em torno de sua média. A expressão da variância pode ser melhor entendida se comparada a expressão da variância que aprendemos em Estatística Descritiva:
2
2
2 ) X ( E X E ) X ( E X E ) X ( Var O desvio-padrão, conseqüentemente é encontrado extraindo-se a raiz quadrada positiva da variância:
)
X
(
Var
)
X
(
DP
Exemplo - Prova
Encontrar a variância e o desvio-padrão para o número de acertos na prova.
Exemplo – Dados
Criar a variável X=soma das faces no lançamento de dois dados e construir a sua função de probabilidade.
Exercício completo – Para a função de probabilidade a segui, encontre o valor de k, construa a distribuição acumulada, encontre a Esperança e a Variância de X.
x 0 1 2 3 4
P(X=x) 0,35 0,30 0,20 k 0,05
3.7 Principais modelos discretos
A partir de agora veremos modelo (fórmulas, expressões) que retratam o comportamento probabilístico de variáveis discretas. Veremos apenas dois: Binomial e Poisson.
3.7.1 Distribuição Binomial
Um caso como o da prova de quatro questões pode ser resolvido pela Distribuição Binomial. Sempre que um experimento que assume apenas dois possíveis resultados em cada repetição for repetido n vezes e que a probabilidade de sucesso for constante em cada repetição, podemos modelar o número de sucessos pela distribuição Binomial.
X = número de sucessos, variando de 1 até n p = probabilidade de sucesso em cada repetição 1-p = probabilidade de fracasso em cada repetição n = número de repetições X ~ Binomial (n ; p) x=0,1,...,n
n
x
p
xp
n xx
n
x
X
P
(
1
)
!
!
!
)
(
Exemplo – Prova
No exemplo da prova, encontre os parâmetros da Binomial e calcule P(X=2).
Exemplo – Peças defeituosas
Numa fábrica peças são produzidas em larga escala (podemos considerar produção infinita). Sabe-se que 5% das peças são defeituosas (D) e o restante perfeitas (P).
a) Qual a probabilidade de obtermos 2 peças defeituosas?
Exemplo – Loteria Esportiva
Numa loteria com 13 jogos de futebol, qual a probabilidade de um “desentendido de futebol” acertar 11 ou mais jogos?
Esperança e Variância na Binomial
O número esperado ou esperança de sucessos na distribuição Binomial é facilmente encontrado. Intuitivamente, responda as perguntas a seguir:
1) Se lançarmos uma moeda honesta 100 vezes, qual o número esperado de caras? 2) Se lançarmos um dado 600 vezes, qual o número esperado de faces “5”.
3) No exemplo da prole de 6 filhos, qual o número esperado de meninos?
E(X) =
n x x n x x n n x ) p ( p C ) x X ( P 0 0 1 = np Var(X) = np(1-p)Exemplos – Nos exemplos anteriores encontre a esperança Prova: E(X) Var(X) Peças: E(X) Var(X) Loteria: E(X) Var(X)
3.7.2 A distribuição de Poisson
A distribuição de Poisson é conhecida com a distribuição de um só parâmetro. Uma variável aleatória discreta X segue uma distribuição de Poisson se a sua função de probabilidade é dada por: X ~ Poisson ()
!
x
e
x
X
P
x
, x = 0,1,2,... >0Geralmente X representa o número de ocorrências num determinado espaço de tempo e o parâmetro é a média de ocorrências neste intervalo. Conhecidamente, o número de chamadas telefônicas recebidas numa central, a chegada de navios a um porto, pode ser modelada pela distribuição de Poisson.
Atenção: o parâmetro deve estar em sintonia com a variável X. Provando que P(X=x) é função de probabilidade:
0 x x!
x
e
=1Esperança e Variância na Poisson
E(X) =
0 x 0 x xx
!
e
x
)
x
X
(
xP
Var(X) = Exemplo – NaviosA taxa de chegadas de navios a uma porto segue a média de 1 por dia e pode ser modelada pela distribuição de Poisson.
a) Qual a probabilidade de chegarem três navios em um mesmo dia?
b) Qual a probabilidade de chegar ao menos um navio em três dias?
c) Qual o número esperado de navios em uma semana?
Exemplo – Erros em um livro
Um revisor aponta que encontrou 100 erros em um livro de 200 páginas. Considere X=número de erros por página, podendo ser modelada pela distribuição de Poisson.
a) Qual a probabilidade de encontrar, em uma página escolhida ao acaso, dois erros?
b) Qual a probabilidade de encontrar, em uma página escolhida ao acaso, ao menos um erro?
Aproximação entre Binomial e Poisson
A medida que ninfinito e p0 a distribuição Binomial pode ser aproximada pela Poisson.
! x np e ) p ( p x n ) x X ( P x np 0 p n x n x 1Para np7 já temos uma boa aproximação.
Exemplo – X ~ Binomial (n=30 ; p=1/20)
Comparar a probabilidade P(X=0) e P(X=1) pela Binomial e Poisson.
Binomial -0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0 3 6 9 12 15 18 21 24 27 30 Poisson -0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0 3 6 9 12 15 18 21 24 27 30
3.8 Variáveis aleatórias contínuas 3.8.1 Definições Básicas
As variáveis contínuas podem, ao menos teoricamente, assumir qualquer valor num intervalo numérico. Sendo assim fica impossível representarmos variáveis contínuas da mesma forma que as variáveis discretas. Diferenciando um caso discreto de um contínuo:
Importante
As variáveis contínuas são representadas por curvas, chamadas de função densidade de
probabilidade, e a área sob essa função representa a probabilidade de ocorrência. Nas
variáveis contínuas não existe a probabilidade de ocorrência de um valor exato, mas sim de intervalos.
A função densidade de probabilidade, denotada por fx(x), é a função que indica o
comportamento probabilístico da variável aleatória contínua X. A função densidade de probabilidade deverá satisfazer as seguintes condições:
a)
f(x) 0, para todo x R.b)
f(x)dx 1A área sob a curva fx(x) nos informa a probabilidade de ocorrência de valores da variável X. Caso discreto -0,05 0,10 0,15 0,20 0,25 0,30 0 1 2 3 4 5 6 7 8 9 10 11 12 P (X = x ) Caso contínuo -0,05 0,10 0,15 0,20 0,25 0,30 1 2 3 4 5 6 7 8 9 10 11 12 13 P (X = x )
Supondo que o gráfico acima represente a função de probabilidade de uma variável aleatória X. Como sabermos a probabilidade de ocorrência de valores entre a e b ?
b adx
)
x
(
f
)
b
X
a
(
P
A função de distribuição acumulada de X, denotada por F(x), indica a a probabilidade acumulada até o valor x.
x dx ) x ( f ) x X ( P ) x ( F Propriedades da F(x):1o) F(x) é contínua e não decrescente 2o) F(-)=0 F() = 1 3o) P(a < X < b) = F(b) – F(a) 4o) F(x) dx d ) x ( f
Exercício – Fixação do conteúdo
Esboce graficamente a f(x). Verifique se f(x) é função densidade, encontre a F(x) e calcule P(X<0,5). . c . c ; x ; x ) x ( f 0 1 0 2
Exercício – Fixação do conteúdo II
Esboce graficamente a f(x). Verifique se f(x) é função densidade, encontre a F(x) e calcule a P(1/4<X<3/4).
contrário
caso
;
0
1
x
1/2
;
4x
-4
1/2
x
0
;
x
)
x
(
f
4
Esperança e Variância de uma variável aleatória contínua
O cálculo da esperança e da variância no caso contínuo pode ser feito de forma análoga ao caso discreto. Agora o será substituído pela
:
xf(x)dx ) X ( E
2 2 ) X ( E ) X ( E ) X ( Var onde E(X2 )
x2f(x)dx Em geral:
g(x)f(x)dx )) x ( g ( EExemplo – Encontrar E(X) e Var(X) nos exercícios de fixação I e II
3.9 - Principais Modelos Contínuos
Existe uma gama de modelos contínuos bastante utilizados. Eles já se encontram descritos na literatura e suas principais características são conhecidas.
3.9.1 Distribuição Uniforme ou Retangular
Uma v.a.c X tem distribuição Uniforme se a sua função densidade f(x) descreve um retângulo que dá sempre a mesma probabilidade de ocorrência para intervalos de mesmo tamanho. X ~ Uniforme [a , b] b x a contrário caso ; 0 b x a ; 1 ) (x b a f a b 1/(b-a) x f(x)
Provar que
a
b
a
x
x
F
)
(
para axb.Esperança e Variância na Uniforme
2 ) (X b a E
12
)
(
)
(
2a
b
X
Var
Exemplo - Tempo de produção (Distribuição Uniforme)
O tempo para produzir uma peça é igualmente provável de estar entre 60s e 70s. a) Esboce graficamente a função densidade de probabilidade para X = tempo (s).
b) Calcular a probabilidade do tempo na exceder 66s.
Exemplo - O gerador de números pseudo-aleatórios do EXCEL
O gerador de números pseudo-aleatórios do Excel deveria seguir uma Uniforme [0;1]. a) Calcule a esperança e a variância de X e a probabilidade P(X>0,7).
3.9.2 Distribuição Exponencial
A distribuição Exponencial pode ser utilizada na modelagem do tempo entre ocorrência de acidentes, tempo de ocorrência entre chamadas telefônicas. Na distribuição Exponencial consideramos que a probabilidade de ocorrência de um evento é constante em intervalos de amplitude .
Uma v.a.c. X tem distribuição Exponencial se a sua função densidade de probabilidade é dada por: X ~ Exponencial ()
c.c.
;
0
0
;
)
(
x
e
x
f
x
0Vejamos a forma da função densidade f(x) para diferentes valores de :
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 0 1 2 3 4 5 6 Lambda=0,5 Lambda=1 Lambda=2
Provando que f(x) é função densidade:
01
dx
e
x
Função de distribuição acumulada F(x):
x x
xe
dx
e
01
Esperança e Variância na Exponencial
Relembrando Integral por partes:
vu
'
vu
uv
'
neste caso, escolher x e u'
1
)
(
)
(
0dx
e
x
dx
x
xf
X
E
x 2 1 ) (
X VarExemplo – O período de quebra entre componentes eletrônicos segue uma distribuição
Exponencial com média de 2 anos.
a) Qual a probabilidade de que haja uma quebra dentro de 4 anos?
b) Qual a probabilidade de que haja uma quebra entre 2 e 4 anos?
Exemplo – O tempo entre chamadas telefônicas segue uma distribuição Exponencial com
média de 15 minutos.
a) Qual a probabilidade de que chegue uma chamada dentro de 20 minutos?
b) Sabendo que já se passaram 20 minutos, qual a probabilidade de que chegue uma ligação antes dos 40 minutos?
A letra b) do exercício anterior nos leva a perceber uma importante característica da distribuição exponencial: a falta de memória (memorylessness).
) ( ) | (X s t X t P X s P No exemplo: ) 20 ( ) 20 | 20 20 (X X P X P
3.9.3 Distribuição Normal, Gaussiana ou Curva de Gauss
A distribuição normal ou curva de Gauss é, sem dúvida, o principal modelo probabilístico contínuo, pois serve de base para a principal área da Estatística: a Estatística Inferencial.
Uma v.a.c. X tem distribuição normal com parâmetros e se sua função densidade de probabilidade é dada por:
0
;
+
<
<
-,
parâmetros
são
onde
,
,
2
1
2 2 2 ) (
e
x
e
x
f
x Notação X N(,)X tem distribuição Normal com média e desvio-padrão .
Os parâmetros da Normal são a média e o desvio-padrão, que permitem infinitas curvas normais com diferentes formatos (mas sempre simétricas). O gráfico da fX é apresentado a
seguir:
Características da Normal
f(x)dx1-10 -5 0 5 10 Valores de X f(x) -10 0 10 Valores de X f( x ) -10 -5 0 5 10 Valores de X f(x ) DP(X) =
2
2
dx
)
x
(
f
x
Outra característica importante da Normal é que, independentemente dos valores dos parâmetros, a seguinte relação é sempre válida:
Entendendo os parâmetros da curva Normal: (média) é uma parâmetro de locação (desvio-padrão) é um parâmetro de forma Vejamos exemplos:
Coletar a altura dos alunos em sala de aula e realizar alguns cálculos.
Os cálculos integrais envolvendo a distribuição Normal são bastante complicados. Felizmente, veremos a seguir uma relação que facilita muito nossa vida.
Distribuição Normal-padrão ou Normal reduzida
Seja X uma variável aleatória normalmente distribuída com quaisquer parâmetros média e desvio-padrão . Se realizarmos a seguinte transformação obteremos uma nova variável Z com média 0 e desvio-padrão 1: X N(,)
X
Z
Z (0,1)Qualquer variável com distribuição Normal pode ser padronizada para a Normal. A
distribuição Normal padronizada (Z) é tabelada.
Exemplo – Aprendendo a usar a tabela
1) Calcule:
a) P(Z 1,64) d) P(Z 0)
b) P(Z 0,38) e) P(-1,96 Z 1,96) c) P(2,57 Z 2,57)
2) O peso de sacos de arroz com valor nominal de 1kg segue uma distribuição aproximadamente Normal com média de 1010g com desvio-padrão de 20g.
a) Qual a probabilidade de um saco ter peso inferior a 1040g? b) Qual a probabilidade de um saco ter peso superior a 1050g? c) Qual a probabilidade de um saco ter menos de 1kg?
Cap. 4. - Amostragem
4.1 Conceitos Básicos
Amostragem é o nome dado ao conjunto de procedimentos e técnicas para extração
de elementos da população para compor a amostra. O objetivo da amostragem é obter
amostras representativas das populações em estudo. Um Censo seria a investigação da
população completa.
Por que trabalhar por amostragem?
________________________________________
________________________________________
________________________________________
________________________________________
A fração de amostragem é a razão entre o tamanho amostral e o tamanho
populacional. Não existem regras fixas para tamanho de amostra, ou seja cada caso
merece um cuidado especial. Frases como “20% da população é ideal”, quase sempre
não são verdadeiras.
As técnicas de amostragem se dividem em: probabilísticas e não-probabilísticas.
As técnicas probabilísticas são aquelas onde todos elementos da população têm uma
probabilidade não nula de seleção. Nas técnicas não-probabilísticas não podemos
garantir que todos elementos têm probabilidade de serem selecionados para a amostra.
4.2 Principais técnicas de amostragem probabilística
Geralmente as técnicas probabilísticas produzem melhores resultados do que as não
probabilísticas. A seleção dos elementos envolve obrigatoriamente a utilização de algum
dispositivo aleatório para seleção das unidades amostrais.
4.2.1 Amostragem Aleatória Simples (AAS)
Apesar de ser uma forma extremamente simples de seleção de elementos da
população, é considerada uma das melhores técnicas de amostragem.
Na AAS cada elemento da população tem igual probabilidade de seleção e o
pesquisador não introduz nenhum vício no processo.
Etapas:
1) Enumerar a população de 1 até N.
2) Sortear n números no intervalo de 1 até N. Caso haja números repetidos, sortear
novamente mais alguns valores.
Probabilidade de seleção de um elemento na AAS:
Número de amostras possíveis SEM reposição:
Número de amostras possíveis COM reposição:
Exemplo 23 – Amostra n=2 da população N=5
Verificar quantas amostras são possíveis COM e SEM reposição da população de
tamanho 5 verificando também as probabilidades de seleção de cada unidade.
4.2.2 Amostragem Estratificada
Na Amostragem estratificada a população é dividida em subpopulações ou estratos de
forma que N
1+ N
2+ ... + N
K= N.
Um tamanho amostral n é repartido proporcionalmente entre os estratos, respeitando
as frações N
i/ N. Depois de estabelecidos o valor de n
i, procede-se uma seleção
aleatória dentro de cada estrato.
Exemplo 24 – Amostra estratificada na região sul
Dividir proporcionalmente uma amostra de 1300 pessoas em três estratos,
correspondentes aos três estados da região sul.
i Estado Pop. % Amostra
1 Rio Grande do Sul 9.637.682 2 Santa Catarina 4.875.244
3 Paraná 9.003.804
Total 23.516.730
4.2.3 Amostragem Sistemática
A amostragem sistemática inicia com o cálculo do intervalo de amostragem f=N/n.
Depois, selecionamos um número entre 1 e f e vamos indo sistematicamente de f em f
elementos, até o final.
A amostragem sistemática é útil quando temos cadastros impressos que estão
ordenados segundo algum critério que nada tem a ver com os interesses da pesquisa.
Exemplo 25 – Escolhendo 8 alunos de um total de 40
Planta da sala de aula
1 11 21 31 2 12 22 32 3 13 23 33 4 14 24 34 5 15 25 35 6 16 26 36 7 17 27 37 8 18 28 38 9 19 29 39 10 20 30 40
Cap. 5. - Distribuições Amostrais e Estimação
5.1 – Parâmetros e Estimadores
O que é inferência estatística?
Inferir consiste na retirada de informações para TODA população baseando-se numa
amostra da mesma. Chamamos de parâmetros as quantidades populacionais e de
estimadores as funções de dados amostrais que irão gerar as estimativas para os
parâmetros populacionais.
Tabela - Exemplos de parâmetros e seus respectivos estimadores
Parâmetros
Estimadores
Média populacional
Média amostral
X
Desvio-padrão populacional
Desvio-padrão amostral
s
Proporção populacional
p
Proporção amostral
pˆ
Há dois tipos de estimação de parâmetros: a estimação por ponto e por intervalo.
Também existe uma outra forma de inferência estatística muito utilizada em situações
práticas: os testes de hipóteses.
5.2 Distribuição Amostral da Média
A base da estatística inferencial é o TEOREMA DO LIMITE CENTRAL.
O teorema diz que se extrairmos TODAS as possíveis amostras de tamanho
n de uma
população de tamanho
N a distribuição das médias amostrais X tende a se distribuir
como uma curva Normal com média igual ao parâmetro
e desvio-padrão
n.
Exemplo – População de tamanho N = 6
Considere a seguinte população de cinco elementos e X = Idade (anos)
20
30
40
50
60
70
A
B
C
D
E
F
a) Quais são os parâmetros populacionais?
Exemplo – Selecionando uma amostra na sala de aula
Suponha que seja necessário selecionar uma amostra de n=5 alunos da turma para
representar a nossa turma numa reunião na reitoria. Qual o número de amostras
possíveis de serem selecionadas?
Exemplo – População com média 0,5
Considere uma população infinitamente grande com média
0,5. Vamos avaliar as
distribuições amostrais da média amostral X com n = 30 e 300.
-0,5 1,0 1,5 2,0 0 0,2 0,4 0,6 0,8 1 Médias amostrais -0,5 1,0 1,5 2,0 2,5 3,0 3,5 0 0,2 0,4 0,6 0,8 1 Médias amostrais
n = 30
n = 300
Percebemos claramente que com o aumento do tamanho amostral a distribuição de X
fica cada vez mais concentrada em torno do parâmetro
. Isso quer dizer que, quanto
maior amostra maior a possibilidade de acerto.
RESULTADO
X
tem distribuição Normal com
Média = e Desvio-padrão =
n
5.3 – Estimação por ponto
Visa estimar o valor do parâmetro através de estimativas pontuais (únicas). A vantagem
é ser de fácil interpretação e rápida, mas a probabilidade de acerto “na mosca” é
praticamente nula, pois os estimadores podem ser encarados como variáveis aleatórias
contínuas.
Exemplo – World Trade Center
Um mês após o ataque ao WTC de NY perguntamos a 1000 americanos, escolhidos de
maneira aleatória, se estão com medo de viajar em vôos domésticos em território
americano.
Se 852 pessoas da amostra afirmam estar com medo, podemos estimar que 85,2% dos
americanos estão com medo de viajar de avião após os ataques terroristas de
11/Set/2001.
5.4 – Estimação por intervalo de confiança
Consiste em cercar o valor da estimativa pontual por uma região cuja probabilidade de
conter o verdadeiro parâmetro seja conhecida.
NOTAÇÕES que serão utilizadas a partir de agora
(alfa) = nível de significância
1 -
= nível de confiança
2 1 ; n
t
= valor da distribuição t de Student com
n-1 graus de liberdade e área
2
à
direita.
2 z = valor da distribuição normal padrão com área
2