• Nenhum resultado encontrado

Estatística e Modelos Probabilísticos - COE241

N/A
N/A
Protected

Academic year: 2021

Share "Estatística e Modelos Probabilísticos - COE241"

Copied!
24
0
0

Texto

(1)

Estatística e Modelos

Probabilísticos -

COE241

Rosa M. M. Leão

Segundo semestre de 2012 UFRJ - COPPE

Programa de Engenharia de Sistemas e Computação

(2)

Professora:

Rosa M. M. Leão - [email protected] Sala H-318A (COPPE/PESC)

(3)

Website

http://www.land.ufrj.br/~classes/est-prob notas de aula (slides)

listas de exercícios

datas de provas, dicas, etc.

Informações

Lista de email do curso (ver website)

(4)

Altamente recomendada

Será passada lista de presença

Pequena ajuda no final

Presença

Horário de

Atendimento

(5)

Duas provas e uma prova final (se necessário) 1 trabalho

Avaliação

Listas valem um percentual da nota Provas serão baseadas nas listas Cálculo das médias

Media = Media_Provas*0.60 + 0.25*Trabalho + 0.15*Listas_de_Exercício

(6)

Segunda Chamada

Somente com atestado médio

Ou boa justificativa comunicada antes de perder a prova

Prova com toda a matéria, aplicada depois da prova final

(7)

Livros e Referências

Notas de aula (ver website)

“Probability & Statistics with Reliability, Queuing and

Computer Science Applications”, por K.S. Trivedi. Willey, 2001

“Introduction to Probability Models”, por S.M. Ross, Academic Press, 2006

Probabilidade e Estatística, Walpole, Myers, Myers, Ye, 8a edição, Pearson/Prentice Hall, 2008

Alguns disponíveis na biblioteca!

Alguns disponíveis na biblioteca!

Alguns disponíveis na biblioteca!

(8)

Recomendação para Sucesso

Estudar a matéria da semana

Fazer listas de exercícios

provas serão baseadas nas listas

Utilizem o horário de atendimento

não deixem dúvidas acumularem

Venham às aulas

(9)
(10)
(11)

Yet data is merely the raw material of knowledge. “We’re rapidly entering a world where everything can be monitored and measured,”

said Erik Brynjolfsson, an economist and director of the

Massachusetts Institute of Technology’s Center for Digital Business.

“But the big problem is going to be the ability of humans to use, analyze and make sense of the data.”

Netflix offered $1 million to anyone who could significantly improve the company’s movie recommendation system.

I.B.M. created a Business Analytics and Optimization Services

group with more than 200 mathematicians, statisticians in its research labs — but that number is not enough. I.B.M. plans to retrain or hire

4,000 more analysts across the company.

The rising stature of statisticians, who can earn $125,000 at top companies in their first year after getting a doctorate.

(12)

Statisticians also caution that strong correlations of data do not necessarily prove a cause-and-effect link.

For example, in the late 1940s, before there was a polio vaccine, public health experts in America noted that polio cases increased in step with the consumption of ice cream and soft drinks, according to David Alan Grier, a historian and statistician at George Washington University. Eliminating such treats was even recommended as part of an anti-polio diet. It turned out that polio outbreaks were most

common in the hot months of summer, when people naturally ate more ice cream, showing only an association, Mr. Grier said.

(13)

Explosion of digital data network measures Sophisticated mathematical models Meaningful patterns Insights Performance evaluation

sensor signals, user behaviour

surveillance tapes social network data

public records

(14)

A quantidade de dados armazenados na Web é um enorme banco de

dados que permite que novas descobertas/análises sejam feitas de maneira automatizada

Novas tecnologias permitem fácil coleta de diferentes tipos de dados (sensores, webcam, log de ações do usuário)

Os dados na Web são um enorme recurso para observar como milhares de pessoas interagem, suas preferências, seu comportamento, suas

necessidades

Aplicações podem ser desenvolvidas de acordo com as preferências, as necessidades e o comportamento do usuário

Dados coletados de sistemas permitem melhor planejamento, desempenho e análise da confiabilidade

(15)

Exemplos de Aplicação

Sistemas de recomendação Planejamento da rede Sugestão de produtos, filmes, músicas, amigos

Sugestão de tópicos a serem estudados, exercícios, outras aulas Demanda dos usuários Dados coletados Capacidade instalada

(16)

Exemplos de Aplicação

Sistemas de inferência Planejamento do sistema de computadores de bordo de um avião

População com maior probabilidade de ter um certo

tipo de doença

Tipo de medicamento que surte mais efeito em uma dada

população Requisitos: Probabilidade de falha do Sistema < 10-12 HW/SW do Sistema Arquitetura do Sistema Dados clínicos dos pacientes

(17)

Objetivo do Curso

Aprender conhecimentos básicos de

estatística e probabilidade e como a teoria pode ser usada no estudo e avaliação de sistemas/fenômenos aleatórios

Como?

Como?

Como?

Como?

Construir modelo probabilístico e calcular estatísticas de um sistema/população para analisar/estudar/prever seu desempenho

(18)

Por que usar probabilidade ?

A maioria dos eventos que ocorrem nos sistemas/vida real são aleatórios

Exemplo:

Tempo de busca no Google

Perda de um pacote em um roteador da Internet

Tempo até que ocorra uma falha em um computador

(19)

Por que usar estatística ?

Permite a caracterização de uma população ou de um sistema a partir de um conjunto de amostras

Exemplo:

Qual a variável que mais influencia no tempo de resposta de um sistema ?

Qual o erro que é cometido quando

considera-se um conjunto de amostras de tamanho N ?

Se existem dois sistemas A e B que realizam a mesma função, qual o que fornece a menor

(20)

Algumas áreas onde a teoria é

usada

Estatística e

Probabilidade

Processos

Simulação

Medições

Teoria de

Redes

Bayesianas

Inferência

(21)

Importância

Prever desempenho de um sistema Identificar gargalos de um sistema Avaliar mudanças no sistema

Inferir o comportamento de um sistema a partir de uma pequena amostra de dados coletada

Adequar o sistema às necessidades dos clientes Modelagem é fundamental para muitos sistemas Google, BitTorrent, NASA, Sprint (ISP), Empresas fabricantes de aviões, etc.

(22)

Exemplo de estudo (1)

Tempo de resposta de um sistema deve estar abaixo de um limite com uma certa probabilidade e sua média não deve ser superior a um certo valor

Cálculo da frequência (histograma)

(23)

Outline do Curso

Motivação

Definições Básicas de Probabilidade

Variáveis Aleatórias Discretas e Contínuas Variáveis Aleatórias Conjuntas

Média, Variância, Correlação

Distribuição e Esperança Condicional Distribuição amostral

(24)

Dúvidas

Referências

Documentos relacionados

c.4) Não ocorrerá o cancelamento do contrato de seguro cujo prêmio tenha sido pago a vista, mediante financiamento obtido junto a instituições financeiras, no

Os autores relatam a primeira ocorrência de Lymnaea columella (Say, 1817) no Estado de Goiás, ressaltando a importância da espécie como hospedeiro intermediário de vários parasitos

- Se o estagiário, ou alguém com contacto direto, tiver sintomas sugestivos de infeção respiratória (febre, tosse, expetoração e/ou falta de ar) NÃO DEVE frequentar

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

A Lei nº 2/2007 de 15 de janeiro, na alínea c) do Artigo 10º e Artigo 15º consagram que constitui receita do Município o produto da cobrança das taxas

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

Desta maneira, observando a figura 2A e 2C para os genótipos 6 e 8, nota-se que os valores de captura da energia luminosa (TRo/RC) são maiores que o de absorção (ABS/RC) e

Mediante o impacto do paciente com o ambiente do centro cirúrgico, a equipe de enfermagem deve estar voltada para o aspecto humano do atendimento, centrando suas