INTRODUÇÃO À
PROBABILIDADE E À
ESTATÍSTICA
Aula 1 – Introdução ao Curso
Introdução
Cotidiano → previsão do tempo, caixa rápido, drive thru.
Estamos sempre criando hipóteses, fazendo previsões, testando e analisando.
Impossível viver sem probabilidade e estatística!
Trabalho/Pesquisa → analisar e entender um conjunto de dados para transformá-los em informações, para compará-los com outros resultados ou para julgar sua adequação a uma teoria.
O Método Científico
A essência da ciência é a observação e seu objetivo básico é a inferência!
Aspectos:
• Observação (olho nu, aparelhos),
• Descrição (reprodução),
• Previsão (passado, presente e futuro),
• Controle (variáveis desprezadas),
• Falseabilidade (testada ou contestada),
• Causalidade (correlação e ordem dos eventos).
Modelos Matemáticos
Modelo Determinístico: estipula que as condições sob as quais um experimento seja executado determinem o resultado do experimento. Ex:
Lei de Ohm, Gravitação.
Modelo Probabilístico: as condições do experimento determinam somente o comportamento probabilístico do resultado observável. Ex: Observações meteorológicas.
Considerações físicas para prever resultado!
Considerações físicas para especificar uma distribuição de probabilidade!
Visão Geral da Estatística
Estatística → ciência que se ocupa de coletar, organizar e analisar dados com intuito de tirar conclusões e tomar decisões.
Análise exploratória de dados → obter dos dados a maior quantidade possível de informação
Análise confirmatória de dados → inferência estatística (fazer afirmações a partir de um conjunto de valores representativo )
Desafio → transformar dados em inteligência!
Conjunto de Dados
Pesquisa de opinião: Em um levantamento recente, perguntou-se a 100 estudantes da UFABC se eles queriam que o conceito D fosse acima de 5.
70 estudantes disseram que sim!
População: todos os resultados, respostas, medidas ou contagens de interesse.
Amostra: subconjunto de uma população.
População: resposta de todos os estudantes da UFABC Amostra: resposta dos estudantes no levantamento
Parâmetro descrição numérica de uma característica da população.
Estatística descrição numérica de uma característica da amostra.
a) Recente levantamento de uma amostra de pessoas com bacharelado em física revelou que o salário médio inicial para elas é inferior a R$ 2.000.
b) O salário inicial para os 120 engenheiros formados na UFABC aumentou em 15% em relação ao ano anterior.
a) Subconjunto da população: estatística amostral b) Salário inicial de todos os formados: parâmetro populacional
Ramos da Estatística
- Descritiva organização, resumo e apresentação de dados.
-Inferencial tira conclusões sobre uma população a partir de amostra.
A ferramenta básica no estudo da estatística inferencial é a Probabilidade.
Uma amostra grande de homens com 48 anos foi estudada durante 18 anos.
Entre 60% e 70% dos homens solteiros estavam vivos aos 65 anos. Entre os casados, 90% estavam vivos aos 65 anos.
Ramo descritivo: “Entre 60% e 70% dos homens solteiros estavam vivos aos 65 anos. Entre os casados, 90% estavam vivos aos 65 anos.”
Inferência: fato de ser casado está associado com uma vida mais longa para os homens.
Classificação dos Dados
Nome Notas Antonio 6,5 Carla 7,0 Marcela 9,0 Rodrigo 5,0 Vitor 7,5
- Qualitativos atributos, classificações, registros não-numéricos.
- Quantitativos medidas, contagens numéricas.
Conjuntos de dados: nomes dos estudantes (qualitativos) e notas na P1 (quantitativos).
Níveis de Medida
-Nominal qualitativos (nomes, marcas, qualidades), não existe cálculo.
- Ordinal qualitativos ou quantitativos, organizados em ordem, mas as diferenças de dados não são significativas.
Ordinal
Nominal Classificar uma lista de livros em: excelente, bom, ruim.
Peixe é o melhor prato do RU? Respostas “Sim” e “Não”.
Vitórias do SPFC em Libertadores
1992 1993 2005
Títulos Libertadores SPFC 3 Santos 3 Internacional 2 Flamengo 1 Corinthians 1
- Intervalar quantitativos, ordenados, pode-se calcular diferenças significativas entre dados, registro nulo representa uma posição na escala (não é um zero inerente).
- Racional similar ao intervalar, no entanto um registro nulo é um zero inerente (zero que significa nenhum), pode-se combinar valores para expressar valores como múltiplos de outro.
Níveis de Medida
Intervalar Racional
Planejamento de Estudo Estatístico
- Variáveis de interesse e população;
- Plano de coleta de dados;
- Coleta de dados;
- Descrição dos dados usando estatística descritiva;
- Interpretação de dados e decisões acerca da população usando inferência estatística;
- Identificar os erros.