Estatística e Modelos
Probabilísticos
COE241
Edmundo de Souza e Silva Rosa M. M. Leão
Segundo semestre de 2010 LAND – COPPE/PESC – UFRJ
Professores
● Edmundo de Souza e Silva - [email protected]
Sala H-318 (COPPE/PESC)
● Rosa M. M. Leão - [email protected]
Website
http://www.land.ufrj.br/~classes/est-prob notas de aula (slides)
listas de exercícios
datas de provas, dicas, etc.
Informações
Lista de email do curso (ver website)
Fórum para anúncios gerais
Altamente recomendada
Será passada lista de presença
Pequena ajuda no final
Presença
Horário
Aulas iniciam às 13:10 Horário de atendimento
1 hora por semana (horário a definir)
Duas provas e uma prova final (se necessário) 1 trabalho
Avaliação
Listas não valem nota, entretanto... provas serão baseadas nas listas
(pequena) ajuda no final (se necessário) Cálculo das médias (ver website)
Segunda Chamada
Somente com atestado médio
Ou boa justificativa comunicada antes de perder a prova
Prova com toda a matéria, aplicada depois da prova final
Outline do Curso
Informação e Motivação
Definições Básicas de Probabilidade
Variáveis Aleatórias Discretas e Contínuas Variáveis Aleatórias Conjuntas
Média, Variância, Correlação
Distribuição e Esperança Condicional Distribuição amostral
Livros e Referências
Notas de aula (ver website)
“Probability & Statistics with Reliability, Queuing and
Computer Science Applications”, por K.S. Trivedi. Willey, 2001
“Introduction to Probability Models”, por S.M. Ross, Academic Press, 2006
Probabilidade e Estatística, Walpole, Myers, Myers, Ye, 8a edição, Pearson/Prentice Hall, 2008
Recomendação para Sucesso
Estudar a matéria da semana
Fazer listas de exercícios
provas serão baseadas nas listas
Utilizem o horário de atendimento
não deixem dúvidas acumularem
Venham às aulas
Objetivo do Curso
Aprender conhecimentos básicos deestatística e probabilidade e como a teoria
pode ser usada na avaliação de sistemas de computação
Como?
Construir modelo probabilístico do
comportamento do sistema, calcular estatísticas do sistema, para prever seu desempenho
Por que usar probabilidade ?
A maioria dos eventos que ocorrem nossistemas/vida real são aleatórios Exemplo:
Tempo de busca no Google
Perda de um pacote em um roteador
Tempo até que ocorra uma falha em um computador
Tempo de acesso ao Skype
Áreas onde a teoria é usada
Estatística e
Probabilidade
Processos
Estocásticos
Simulação
Medições
Teoria de
Filas
Redes
Bayesianas
Importância
Prever desempenho de um sistema
Identificar seus gargalos
Avaliar mudanças no sistema
Modelagem é fundamental para muitos sistemas Google, BitTorrent, NASA, Sprint (ISP), etc.
Aplicações
Medidas de Desempenho
●
Comunicações / Diversão
● Throughput ou Vazão ● Tempo de download
● Tempo para iniciar a exibição de um vídeo ● Tempo que um vídeo fica parado
Medidas de Desempenho
●
Aviação / Sistema Bancário
● Tempo até que ocorra uma falha ● Tempo até que ocorra um reparo ● Probabilidade de falha
Medidas de Desempenho
●
Biologia / Medicina
● Probabilidade de uma determinada sequência
de gens
● Probabilidade de uma população ter um certo
tipo de doença
Estatísticas das Medidas de
Desempenho
Média Variância Distribuição de probabilidade CorrelaçãoExemplo de estudo (1)
Tempo de resposta de um sistema deve estar abaixo de um limite com uma certa probabilidade e sua média não deve ser superior a um certo valor
Cálculo da frequência (histograma) Cálculo da média: 5*0.08 + 10*0.03 + 20*0.01 + 30*0.08 + 40*0.09 + 50*0.06 + 60*0.12 + 70*0.11 + 80*0.22 + 90*0.14 + 100*0.06 = 61
Exemplo de estudo (2)
Uma nova droga reduz a pressão arterial em 85% dos pacientes
Uma droga antiga tem o mesmo efeito em 80% dos pacientes
A nova droga é mais cara e pode trazer alguns efeitos colaterais
A nova droga deveria ser adotada ?
Estudo depende da população observada
Exemplo de estudo (3)
Uma empresa só pode tolerar 5% dos itens que fabrica defeituosos no longo prazo
Dado que foram encontrados mais do que 5% em uma dada amostra, isto significa que a empresa não está
cumprindo com as suas metas ?
Qual a “importância” dos dados coletados ? Como garantir que a amostra é “suficiente” ?