• Nenhum resultado encontrado

Teste de hipóteses bayesiano para intensidade de tráfego em filas M/M/s utilizando o algoritmo amostragem-reamostragem por importância (SIR)

N/A
N/A
Protected

Academic year: 2023

Share "Teste de hipóteses bayesiano para intensidade de tráfego em filas M/M/s utilizando o algoritmo amostragem-reamostragem por importância (SIR)"

Copied!
30
0
0

Texto

(1)

0

UNIVERSIDADE FEDERAL DE MINAS GERAIS Instituto de Ciências Exatas

Programa de Pós-Graduação em Estatística

Israel Tomaz Ferreira Junior

Teste de Hipóteses Bayesiano Para Intensidade de Tráfego em Filas M/M/s Utilizando o Algoritmo Amostragem-Reamostragem por Importância (SIR)

Belo Horizonte 2022

(2)

Israel Tomaz Ferreira Junior

Teste de Hipóteses Bayesiano Para Intensidade de Tráfego em Filas M/M/s Utilizando o Algoritmo Amostragem-Reamostragem por Importância (SIR)

Versão final

Monografia de especialização apresentada ao Instituto de Ciências Exatas da Universidade Federal de Minas Gerais, como requisito parcial à obtenção do título de Especialista em Estatística

Orientador: Prof. Dr. Roberto da Costa Quinino

Belo Horizonte 2022

(3)

2022, Israel Tomaz Ferreira Junior.

Todos os direitos reservados

Ferreira Junior, Israel Tomaz.

F383t Teste de hipóteses bayesiano para intensidade de tráfego em filas M/M/s utilizando o algoritmo amostragem-

reamostragem por importância (SIR) [manuscrito] / Israel Tomaz Ferreira Junior — 2022.

29.f. il.

Orientador: Roberto da Costa Quinino.

Monografia (especialização) - Universidade Federal de Minas Gerais, Instituto de Ciências Exatas,

Departamento de Estatística.

Referências: 25-26.

1. Estatística. 2. Teoria de filas markovianas. 3. Decisão estatística. I. Quinino, Roberto da Costa. II. Universidade Federal de Minas Gerais, Instituto de Ciências Exatas, Departamento de Estatística. III. Título.

CDU 519.2 (043) Ficha catalográfica elaborada pela bibliotecária Belkiz Inez Rezende Costa CRB

6/1510 Universidade Federal de Minas Gerais - ICEx

(4)
(5)

AGRADECIMENTOS

Sou grato pela oportunidade de concluir mais essa etapa que, sem o apoio de meus queridos familiares e amigos, não seria possível. Agradeço ao Senhor Jesus Cristo, autor e consumador da minha fé. À minha amada esposa Amanda, companheira de todas as horas e pessoa fundamental nessa jornada de muito empenho e sacrifícios. Às minhas queridas filhas: Joana e Helena, pela inspiração a prosseguir. Aos meus pais Cida e Israel, sempre presentes e prontos a ajudar. Aos professores do Departamento de Estatística da UFMG, em especial ao Professor Dr.

Roberto Quinino, pela ajuda fundamental e paciência.

(6)

“Podemos até ignorar, mas não temos como escapar para lugar algum da presença de Deus. O mundo está repleto dele. Ele anda incógnito por todo lugar. E o incógnito nem sempre é fácil de penetrar. Nossa luta real é contra nos esquecermos de nos preocupar com isso. E por acordarmos de verdade [para isso]. Mais ainda, por continuarmos acordados.”

Clive Staples Lewis

(7)

RESUMO

O estudo das filas visa equacionar custos operacionais com a eficiência do sistema e permitem o dimensionamento racional da infraestrutura, recursos humanos, do maquinário necessário e instalações visando uma melhor performance. Para tanto, são definidos alguns parâmetros que visam sistematizar o estudo das filas, dentre os quais se destaca a intensidade de tráfego. Para um estudo mais consistente desses sistemas pode-se empregar a inferência Bayesiana, que se baseia na associação de conhecimentos prévios sobre determinado sistema por um especialista da área, chamada de priori, aos conhecimentos empíricos obtidos a partir da análise de dados coletados in loco, utilizando, para tanto, o Teorema de Bayes. Esta monografia visa estabelecer um intervalo de credibilidade para intensidade de tráfego em filas M/M/s utilizando o algoritmo amostragem-reamostragem por importância (SIR) com distribuição a priori informativa utilizando uma distribuição triangular, fazendo uso de um programa desenvolvido no software R e analisando uma situação prática envolvendo observações de filas em um supermercado.

Palavras-chave: Filas Markovianas. Intensidade de Tráfego. Sampling Importance Resampling (SIR). Fator de Bayes.

(8)

ABSTRACT

The study of the queues aims to equate operating costs with the efficiency of the system and allow the rational sizing of the infrastructure, human resources, the necessary machinery and installations, aiming at a better performance. To this end, some parameters are defined that aim to systematize the study of queues, among which traffic intensity stands out. For a more consistent study of these systems, Bayesian inference can be used, which is based on the association of prior knowledge about a given system by a specialist in the area, called priori, to the empirical knowledge obtained from the analysis of data collected in loco, using, for that, the Bayes Theorem. This monograph aims to establish a sensitivity interval for traffic intensity in M/M/s queues using the importance-resampling-initiated algorithm (SIR) with an informative a priori distribution using a triangular distribution, making use of a program developed in the R software and analyzing a practical situation involving observations of queues in a supermarket.

Keys Words: Markovian Rows. Traffic Intensity. Sampling Importance Resampling (SIR), Bayes Factor.

(9)

LISTA DE FIGURAS

Figura 1 - Custos dos usuários e da gerência em função do número de postos de atendimento. (Fogliatti & Mattos, 2007) ... 12 Figura 2: Distribuição triangular ... 18 Figura 3: Distribuição a posteriori ... 22

(10)

LISTA DE TABELAS

Tabela 1: Número total de pessoas no sistema e suas frequências ... 21 Tabela 2: Critérios para tomada de decisão contra H0 ... 22

(11)

SUMÁRIO

1. INTRODUÇÃO ... 11

2. SISTEMA COM FILAS ... 14

3. ESTIMATIVA DE PARÂMETROS ... 16

4. INFERÊNCIA BAYESIANA ... 18

5. SAMPLING IMPORTANCE RESAMPLING (SIR) ... 20

6. EXEMPLO NUMÉRICO ... 21

7. CONCLUSÃO ... 24

REFERÊNCIAS

ANEXO A: PROGRAMA PARA DETERMINAÇÃO DO INTERVALO DE CREDIBILIDADE

(12)

11

1. Introdução

O oferecimento de serviços diversos pressupõe um sistema de atendimento e clientes a serem atendidos. Em um cenário ideal, um novo cliente somente chegaria ao sistema de atendimento quando o atendimento anterior estivesse finalizado, não ocasionando a formação de filas. Porém, tanto o tempo entre as chegadas de clientes quanto o tempo de atendimento de cada usuário para realizar o serviço são variáveis aleatórias e, a depender de como o sistema é estabelecido, são formadas grandes filas.

No cotidiano é muito comum encontrarmos sistemas com filas de espera de usuários por atendimento: para comprar uma passagem no metrô, um ingresso no cinema, nos serviços bancários, pedágios em estradas, dentre outros. Em alguns sistemas presentes no cotidiano moderno também ocorrem a formação de filas, mas, geralmente, não as percebemos como tal. É o caso, por exemplo, da troca de mensagens em uma rede de computadores e o controle de documentos enviados para impressão.

De uma maneira geral, do ponto de vista do prestador de serviço, quanto menor o número de postos de atendimento melhor, pois os gastos com funcionários e/ou manutenção e equipamentos é minimizado. Já sob a ótica dos usuários, quanto maior o número de postos de atendimento melhor, uma vez que o tempo nas filas seria reduzido. “O dimensionamento do sistema, considerando apenas um dos pontos de vista mencionados, implica insatisfação/perdas para o outro setor envolvido” (Fogliatti

& Mattos, 2007). A Figura 1 mostra uma relação entre os custos para os usuários (Cu) e os custos para a gerência (Cg) em função do número de postos de atendimento.

(13)

12

Figura 1 - Custos dos usuários e da gerência em função do número de postos de atendimento.

(Fogliatti & Mattos, 2007)

Além da questão dos custos despendidos pelas gerências dos sistemas de atendimento e do tempo e recursos empregados pelos usuários dos sistemas, há serviços nos quais o tempo máximo que um usuário pode permanecer na fila é determinado por lei. É o caso da lei municipal 7617 de 11 de dezembro de 1998 (PBH, 1998), que traz o seguinte texto:

Art. 1º Ficam os estabelecimentos bancários que operam no Município obrigados a atender cada cliente no prazo de 15 (quinze) minutos, contados a partir do momento em que ele tenha entrado na fila de atendimento.

Art. 5º O descumprimento do disposto nesta Lei sujeita o estabelecimento infrator à aplicação das seguintes penalidades:

I - advertência;

(14)

13

II - multa de 5.000 (cinco mil) Unidades Fiscais de Referência - UFIRs -, na primeira reincidência;

III - duplicação do valor da multa, em caso de nova reincidência.

No ano de 2022, no Estado de Minas Gerais, a Unidade Fiscal de Referência está estabelecida em R$ 4,7703 o que faz com que o valor da multa no caso da primeira reincidência esteja fixado em R$ 23.815,5 (Gerais, 2022). Legislações semelhantes também começam a se espalhar com vistas a regulamentar o tempo de espera em filas em outros serviços essenciais como em hospitais, por exemplo (DF, 2000).

(15)

14

2. Sistema Com Filas

Segundo Fogliatti e Mattos, “um sistema com fila é qualquer processo no qual usuários oriundos de uma determinada população chegam para receber um serviço pelo qual esperam, se for necessário, saindo do sistema assim que o serviço é completado. Essa espera acontece quando a demanda é maior do que a capacidade de atendimento oferecido, em termos de fluxo” (Fogliatti & Mattos, 2007).

Os processos de chegadas de usuários a um sistema com filas podem ser determinísticos, no qual se sabe o número de chegadas e o momento em que elas acontecerão, como no caso de agendamento prévio de atendimento, por exemplo, ou estocásticos, que apresentam um comportamento aleatório caracterizado por uma distribuição de probabilidades, o que acontece em uma fila de supermercados, por exemplo. De um modo geral, pode-se dizer que um processo estocástico é qualquer processo que evolui de maneira aleatória (Mendonça, 2014).

Existem algumas disciplinas de atendimento, que são critérios estabelecidos pela gerência do sistema para atender os usuários. Neste trabalho será estudado disciplinas de atendimento do tipo FIFO (first in – first out), na qual os usuários são atendidos na ordem de chegadas. Essa é, também, a mais comumente adotada em sistemas com filas.

Kendall, em 1953, propôs uma notação que é amplamente utilizada para se descrever um sistema com fila (Kendall, Stochastic processes occurring in the theory of queues and their analysis by the methd of imbedded markov chains, 1953). Nela é empregada uma notação do tipo A/B/C/D/E, na qual A denota a distribuição do tempo entre chegadas sucessivas de usuários, B se refere a distribuição do tempo de atendimento que o usuário passa no posto de atendimento, C denota o número de postos de atendimento em paralelo (tal qual o número de cabines de atendimento em um pedágio, por exemplo), D diz respeito à capacidade física do sistema (quantos clientes em fila o sistema comporta) e E se refere à disciplina de atendimento. No presente estudo os parâmetros D e E sempre vão dizer respeito a sistemas com capacidade física infinita e disciplina de atendimento do tipo FIFO.

Quando o sistema tem capacidade física infinita e a disciplina de atendimento é do tipo FIFO, pode ser feita uma simplificação da notação de Kendall omitindo as duas últimas letras. No presente trabalho, serão estudados sistemas com fila representados pelo modelo M/M/s, nos quais os tempos entre as chegadas dos

(16)

15

usuários e o atendimento deles são distribuições exponenciais (Memoryless ou Markovianas) sendo s o número de postos de atendimento. Segundo Montgomery e Runger a propriedade de falta de memória é uma “propriedade de um processo de Poisson. A probabilidade de uma contagem em um intervalo depende somente do comprimento do intervalo (e não do ponto inicial do intervalo)”, sendo a distribuição exponencial a única distribuição contínua com essa propriedade (Montgomery &

Runger, 2012).

(17)

16

3. Estimativa de Parâmetros

Como visto na seção anterior, no caso de filas M/M/s, a definição da taxa de chegadas (λ) e da taxa de atendimentos (μ) são fatores determinantes para o correto dimensionamento de sistemas com filas. Um parâmetro que engloba essas duas grandezas é a intensidade de tráfego (ρ) definida da seguinte forma:

𝜌 = 𝜆

𝑠𝜇 Equação 1

Segundo Kendall, quando uma fila possui uma entrada aleatória e a intensidade de tráfego apresenta um valor menor que uma unidade, o sistema não fica saturado (Kendall, Some problems in tne theory of queues, 1951). Assim, se ρ<1, o sistema está em equilíbrio e apresenta uma distribuição estacionária. A Equação 2, mostrada a seguir, expressa a distribuição estacionária da quantidade de clientes N no sistema (Braz, 2022).

𝑃𝑛 = 𝑃(𝑁 ≡ 𝑛) = {

(𝑠𝜌)𝑛

𝑛! 𝑃0, 0 < 𝑛 ≤ 𝑠

𝑆𝑠𝜌𝑛

𝑠! 𝑃0, 𝑛 > 𝑠 Equação 2

O valor de P0 pode ser determinado considerando o número de clientes igual a zero, o que torna P0 igual a P, e que a soma das probabilidades deve ser igual a 1.

Assim P0 na equação 2 é dado por:

𝑃0 = (∑(𝑠𝜌)𝑗 𝑗!

𝑠−1

𝑗=0

+(𝑠𝜌)𝑠 𝑠!

1 (1 − 𝜌))

−1

Se x = {x1, x2, x3, ..., xn} for a quantidade de clientes observadas em instantes diversos, onde n é o tamanho dos instantes aleatórios, há uma amostra de tamanho n e a função de verossimilhança associada é dada pela equação 3, na qual I é a função indicadora.

(18)

17

𝐿(𝜌|𝑥) = ∏ [(𝑠𝜌)𝑥𝑖

𝑥𝑖! 𝑃0𝐼{0≤𝑥𝑖≤𝑠}+𝑠𝑠𝜌𝑥𝑖

𝑠! 𝑃0𝐼{𝑥𝑖>𝑠}]

𝑛𝑖=1 Equação 3

De acordo com Sousa, “o Método da Máxima Verossimilhança consiste basicamente em obter a estimativa mais verossímil dentro de uma amostra para o parâmetro populacional desconhecido. O valor mais verossímil que o estimador pode assumir é o mesmo que maximiza a probabilidade da amostra em questão ocorrer.

Dessa forma, a função de probabilidade das variáveis aleatórias que representam uma amostra é encarada como função do correspondente parâmetro populacional de modo que possa ser obtida a estimativa desse parâmetro desconhecido” (Sousa, 2018). Em outras palavras, a função de verossimilhança utiliza informações a respeito dos dados coletados in loco.

(19)

18

4. Inferência Bayesiana

Nas palavras da Professora Cristina Graciele Cardoso, “a inferência Bayesiana adiciona no modelo preditivo, além dos dados coletados, as informações subjetivas.

Nesse caso, o pesquisador admite a existência de algum conhecimento que os dados coletados não dão conta de prever e que podem fazer diferença para a previsão”

(Cardoso, 2020). No presente estudo, o modelo preditivo se refere à função de verossimilhança e as informações subjetivas são chamadas de priori.

Quando não se tem conhecimento algum sobre o comportamento do sistema em estudo, uma aproximação adequada para a priori é uma distribuição contínua (Quinino & Cruz, 2021). Havendo conhecimento prévio, uma distribuição triangular, que é uma distribuição de probabilidade que possui um valor mínimo a, um valor máximo b e uma moda c, de modo que a função densidade de probabilidade é zero para os extremos (a e b), e afim entre cada extremo e a moda, gerando um gráfico triangular, pode ser utilizada como aproximação da informação a priori. A distribuição triangular é uma distribuição simples e útil quando se tem poucos dados, conhecendo- se um valor mínimo (a), um valor máximo (b) e um valor mais provável (c) é possível obter uma distribuição triangular que resulta em uma boa aproximação das probabilidades de ocorrência do evento em estudo, o que facilita muito no caso de se ter apenas uma opinião de um especialista para a estimativa da priori. A figura a seguir ilustra uma distribuição triangular.

Figura 2: Distribuição triangular

(Wikipédia, 2022)

(20)

19

A priori, que representa o conhecimento prévio do sistema, e que, associada através do Teorema de Bayes aos dados obtidos a partir de medições (função de verossimilhança), fornece um valor mais robusto das condições de operação do sistema, chamado de posteriori. Em termos matemáticos a distribuição a priori 𝜋(𝜌), definida entre a e b, pode ser expressa por:

𝜋(𝜌) = {

2(𝜌−𝑎)

(𝑏−𝑎)(𝑐−𝑎), 𝑎 ≤ 𝜌 ≤ 𝑐

2(𝑏−𝜌)

(𝑏−𝑎)(𝑏−𝑐), 𝑐 < 𝜌 ≤ 𝑏 Equação 4

No exemplo numérico desenvolvido neste trabalho foi utilizada uma distribuição triangular com c = 0,7, valor considerado o mais provável de acordo com o especialista. A distribuição a Posteriori é dada pela equação 5, descrita a seguir.

𝜋(𝜌|𝑑𝑎𝑑𝑜𝑠) ∝ 𝜋(𝜌)𝐿(𝜌|𝑑𝑎𝑑𝑜𝑠) 𝜋(𝜌|𝑑𝑎𝑑𝑜𝑠) ∝ 𝜋(𝜌) ∏ [(𝑠𝜌)𝑥𝑖

𝑥𝑖! 𝑃0𝐼{0≤𝑥𝑖≤𝑠}+𝑠𝑠𝜌𝑥𝑖

𝑠! 𝑃0𝐼{𝑥𝑖>𝑠}]

𝑛𝑖=1 Equação 5

A equação 5, empregada no processo inferencial de ρ, é denominada posteriori, sendo proporcional à priori, definida anteriormente, multiplicada pela função de verossimilhança (produtório das probabilidades). Para transformar a proporcionalidade contida na equação 5 em uma igualdade é necessário o uso de uma constante de proporcionalidade (K) que permita que, ao se integrar a função de 0 a 1, se obtenha como resultado 1, fazendo com que a distribuição da posteriori seja uma função densidade de probabilidade cuja média corresponderá a uma estimativa bayesiana da intensidade de tráfego ρ.

Intervalos de credibilidade de ρ, uma vez que se trata de inferência Bayesiana, também podem ser determinados a partir da posteriori através da integração da função encontrada com limites que contenham uma probabilidade pré-estabelecida.

Da mesma forma podemos avaliar hipóteses em relação a 𝜌, uma vez que dispomos da sua distribuição a posteriori. No entanto, esse é um procedimento de difícil realização, sendo necessário o cálculo de integrais não triviais, mas que pode ser aproximado com eficiência por algoritmos como o Sampling Importance Resampling (SIR).

(21)

20

5. Sampling Importance Resampling (SIR)

Sampling Importance Resampling (SIR) é um método empregado na inferência Bayesiana que visa obter uma amostra aleatória de uma de uma distribuição a posteriori (Skare, Bolviken, & Holden, 2003). O método consiste em selecionar uma amostra aleatória de tamanho k da função densidade de probabilidade a priori 𝜋(𝜌).

Em geral o tamanho de k é maior ou igual a 5000, na qual os valores amostrais são designados por ρprior,i, i = 0, 1, 2, ..., k. Uma função de pesos Wi, com i = 0, 1, 2, ..., k é calculada para cada ponto de ρprior,i, sendo Wi obtida a partir da função de verossimilhança expressa na equação 3. Então, uma amostra aleatória de tamanho k é selecionada da distribuição a priori ρprior,i, com probabilidade proporcional a função de pesos Wi. Essa nova amostra, denominada ρpost,i, i = 0, 1, 2, ..., k, pode ser considerada como vinda da distribuição a posteriori de ρ, bem como ser utilizada para estimativas Bayesianas de ρ (Quinino & Cruz, 2021).

Os pontos de ρpost,i podem ser considerados como tendo seus valores distribuídos como uma observação da equação 6, representada a seguir, que utiliza uma constante para transformar a proporcionalidade expressa na equação 5 em uma igualdade.

𝜋(𝜌|𝑑𝑎𝑑𝑜𝑠) = 𝐾 × 𝐿(𝜌|𝑑𝑎𝑑𝑜𝑠) × 𝜋(𝜌) Equação 6

(22)

21

6. Exemplo numérico

Com a finalidade de exemplificar o que foi visto até aqui, segue o exemplo que se baseia em dados coletados em um supermercado cujo objetivo é avaliar a intensidade de tráfego ρ de uma fila do tipo M/M/6 (tempo entre as chegadas dos usuários e o tempo de atendimento são distribuições Markovianas e o sistema contém 6 postos de atendimento). A tabela 1 organiza 100 dados coletados da quantidade total de clientes em atendimento e em fila, associando a frequência observada (F) ao número total de pessoas no sistema (O). Assim, por exemplo, um número F = 8 e O = 3 indica que em 8 observações haviam 3 pessoas no sistema.

Tabela 1: Número total de pessoas no sistema e suas frequências

F O F O F

1 3 9 6 17 1

2 1 10 3 18 2

3 8 11 3 19 3

4 13 12 3 20 4

5 10 13 1 21 1

6 9 14 5 22 4

7 6 15 4 23 1

8 6 16 3

Fonte: Elaborado pelo autor

A partir desses dados e com o programa contido no Anexo A, foi implementado o SIR para obtenção da posteriori de ρ, mostrada na figura 2. A distribuição a priori foi obtida com uma distribuição triangular com os parâmetros a = 0, b = 1 e a moda c = 0,7, indicando o conhecimento prévio do sistema em estudo. O programa em questão foi feito no aplicativo R, versão 4.2.2.

(23)

22

Figura 3: Distribuição a posteriori

Fonte: Elaborado pelo autor

A estimativa de ρ a posteriori foi de 0,8633045 sendo o intervalo percentílico de credibilidade de 95% igual a [0,8388307; 0,8867395].

Kass e Raftery propuseram um teste de hipóteses sob a estrutura bayesiana que envolve o cálculo do fator de Bayes B10, que é a divisão da probabilidade a favor de H1 sobre a probabilidade a favor de H0, expressa na equação 7 abaixo.

P(H1/dados)/P(H0/dados) = B10{P(H1)/P(H0) Equação 7

B10 é um resumo da evidência fornecida pelos dados em favor de uma hipótese alternativa H1 em oposição a uma hipótese nula H0. Uma vez calculado B10, as decisões a favor ou contra H1 podem ser tomadas com base na seguinte regra (Choudhury & Borthakur, 2008):

Tabela 2: Critérios para tomada de decisão contra H0

2loge(B10) Evidência contra H0

0 a 2 Não mais que uma simples menção

2 a 6 Positiva

6 a 10 Forte

>10 Determinante

Fonte: Elaborado pelo autor

(24)

23

O gerente do supermercado considerou importante, baseado em estudos anteriores, avaliar as hipóteses 𝐻0: 𝜌 ≤ 0,86 contra 𝐻1: 𝜌 > 0,86. Caso tenhamos evidência contra 𝐻0 será avaliado a possibilidade de aumento de atendentes. O programa disponível no Anexo A foi utilizado no software R e o Fator de Bayes nele encontrado indicou um valor de 21,34, sendo 2𝑙𝑛(21,34) = 6.12, o que indica uma grande evidência contra H0.

(25)

24

7. Conclusão

O estudo de sistemas com filas é muito relevante para diversos sistemas, podendo evitar prejuízos financeiros para empresas e desgastes desnecessários para usuários. Os procedimentos desenvolvidos no presente estudo podem servir de ferramenta no processo de tomada de decisão quando é necessário avaliar se um determinado sistema de filas M/M/s possui uma intensidade de tráfico 𝜌 que garanta um tamanho médio de fila considerado razoável pelo setor de controle de qualidade.

No caso em estudo, por exemplo, houve a indicação de que é necessário um aumento do número de postos de atendimento que, em um primeiro momento, pode envidar gastos por parte da gerência, mas com uma melhoria na qualidade de atendimento que se faz necessária de acordo com os dados coletados.

(26)

25

Referências

Braz, R. U. (2022). Intervalo de credibilidade para intensidade de tráfico em filas M/M/s utilizando o algoritmo amostragem-reamostragem por iportância (SIR). Belo Horizonte: UFMG.

Cardoso, C. G. (2020). O que é Estatística Bayesiana e como ela pode ajudar nas ciências sociais. Fonte: IBPAD - Instituto Brasileiro de Pesquisa e Análise de Dados: https://ibpad.com.br/ciencia-dados/o-que-e-estatistica-bayesiana/

Choudhury, A., & Borthakur, A. C. (2008). Bayesian inference and prediction in the single server Markovian queue. Metrika, 371-383.

DF. (12 de Maio de 2000). Sistema Integrado de Normas Jurídicas do Distrito Federal.

Fonte: SINJ:

http://www.sinj.df.gov.br/sinj/Norma/50505/Lei_2547_12_05_2000.html Fogliatti, M. C., & Mattos, N. M. (2007). Teoria de Filas. Rio de Janeiro: Interciência.

Gerais, S. d. (14 de Outubro de 2022). SEFMG. Fonte: Fazenda:

http://www.fazenda.mg.gov.br/empresas/legislacao_tributaria/resolucoes/ufem g.html

Gupta, A. K., & Nadarajah, S. (2004). Handbook of beta distribution and its applications. Nova Iorque: Marcel Dekker.

Kendall, D. G. (21 de Março de 1951). Some problems in tne theory of queues. Wiley for the royal statistical society, pp. 151-185.

Kendall, D. G. (1953). Stochastic processes occurring in the theory of queues and their analysis by the methd of imbedded markov chains. The Annals of Mathematic Statistics, pp. 338-354.

Ly, A., Verhagen, J., & Wagenmakers, E.-J. (2016). Harol Jeffreys's default Bayes Factor hypothesis tests: explanation, extension and application in psychology.

Journal of mathematical psychology, 19-32.

Mendonça, E. B. (2014). Teoria de Filas Markovianas e Aplicações. Campina Grande:

UEPB.

(27)

26

Montgomery, D. C., & Runger, G. C. (2012). Estatística Aplicada e Probabilidade Para Engenheiros. Rio de Janeiro: LTC.

PBH. (11 de Dezembro de 1998). Leis Municipais. Fonte: Leis Municipais:

https://leismunicipais.com.br/a/mg/b/belo-horizonte/lei-

ordinaria/1998/761/7617/lei-ordinaria-n-7617-1998-dispoe-sobre-o- atendimento-de-cliente-em-estabelecimento-bancario-no-municipio

Quinino, V. B., & Cruz, F. R. (2021). Estimação da intesidade de tráfego em filas markovianas de servidor único via SIR. Proceeding series of the brazilian society of computational and applied mathematics, 1-2.

Skare, O., Bolviken, E., & Holden, L. (2003). Improved sampling-importance resampling and reduce bias importance sampling. Scandinavian Journal of Statistics, 719-737.

Sousa, W. B. (2018). Estimadores de máxima verossimilhança: casos que não satisfazem as condições de regularidade. Brasília: UNB.

Taboga, M. (2021). "Jeffreys' scale", lectures on probability theory and mathematical statistics. Fonte: Statlec: https://www.statlect.com/fundamentals-of- statistics/Jeffreys-scale

(28)

27

Anexo A: programa para determinação do intervalo de credibilidade

library(pracma) library(HDInterval) library(triangle) tic()

clear()

corridas=50000

alfa=0.05 #A ser usado no Intervalo de Cridibilidade

R<-rep(c(1:23),c(3,1,8,13,10,9,6,6,6,3,3,3,1,5,4,3,1,2,3,4,1,4,1)) Ta=100

s=6

rf <- function(rhoe){

P0=0

for(j in 0:(s-1)){

P1=((s*rhoe)^j)/factorial(j) P0=P1+P0

}

P0=P0+((s^s)*(rhoe^s))/(factorial(s)*(1-rhoe)) P0=1/P0

E1=1

for (i in 1:Ta) { i1=R[i]

if (i1<=s) {

E11=(((s^i1)*((rhoe)^i1))/factorial(i1))*P0 E1=E1*E11

}else{

E11=(((rhoe^i1)*(s^s))/factorial(s))*P0 E1=E1*E11

} }

VeroA=E1 return(VeroA)

(29)

28

}

#R1<-rbeta(corridas,1,1) #priori R1<-rtriangle(corridas,0,1,0.7) Priori=R1

R2=matrix(0,corridas,3) for (i in 1:corridas){

k=R1[i]

P1=rf(k) R2[i,1]=P1 }

R2[,2]=R2[,1]/sum(R2[,1])

R2[,3]=sample(R1,corridas,replace=T,prob=R2[,2]) Posteriori=R2[,3]

windows(record = T)

hist(Posteriori,main="Distribuição a Posteriori",xlab=expression(rho)) LimitesA<-hdi(Posteriori)

LimitesB=quantile(Posteriori,c(0.025,0.975)) cat('Limites HPI - pacote do R',"\n")

cat('Limite Inferior de Credibilidade - 95% =',LimitesA[1],"\n") cat('Limite Superior de Credibilidade - 95% =',LimitesA[2],"\n") cat('Limites Percentílico',"\n")

cat('Limite Inferior de Credibilidade - 95% =',LimitesB[1],"\n") cat('Limite Superior de Credibilidade - 95% =',LimitesB[2],"\n")

#Chen-Shao Estimation Algorithm - HDI Posteriori=sort(Posteriori)

jmax=corridas-ceil((1-alfa)*corridas) Intervalos<-matrix(0,jmax,3)

for (i in 1:jmax){

j1=i

j2=j1+ceil((1-alfa)*corridas)

(30)

29

Intervalos[i,1]=Posteriori[j1]

Intervalos[i,2]=Posteriori[j2]

}

Intervalos[,3]=(Intervalos[,2]-Intervalos[,1]) Intervalos=sortrows(Intervalos,3)

cat('Limites Chen_Shao - Implementei - Bem simples',"\n") cat('Limite Inferior de Credibilidade - 95% =',Intervalos[1,1],"\n") cat('Limite Superior de Credibilidade - 95% =',Intervalos[1,2],"\n")

cat('Estimativa de rho a posteriori=',mean(Posteriori),"\n")

#Valor máximo de rho tolerável L=0.86

PH1data=mean(Posteriori>L) PH0data=mean(Posteriori<=L) PH1=mean(Priori>L)

PH0=mean(Priori<=L)

FB=(PH1data/PH0data)/(PH1/PH0)

#print(FB)

cat('Fator de Bayes =',FB,"\n") D=2*log(FB)

#print(D)

cat('2ln(FB)=',D,"\n")

toc()

Referências

Documentos relacionados

No Estado do Pará as seguintes potencialidades são observadas a partir do processo de descentralização da gestão florestal: i desenvolvimento da política florestal estadual; ii

Data de Nascimento Tempo de Serviço antes da profissionalização Tempo de Serviço após da

Fita 1 Lado A - O entrevistado faz um resumo sobre o histórico da relação entre sua família e a região na qual está localizada a Fazenda Santo Inácio; diz que a Fazenda

No entanto, maiores lucros com publicidade e um crescimento no uso da plataforma em smartphones e tablets não serão suficientes para o mercado se a maior rede social do mundo

Seja P a função que ao número de anos decorridos desde 2014, n, faz correspon- der o preço a pagar pelo bilhete de época do F.. Em que ano um bilhete de época no Estádio de

libras ou pedagogia com especialização e proficiência em libras 40h 3 Imediato 0821FLET03 FLET Curso de Letras - Língua e Literatura Portuguesa. Estudos literários

São por demais conhecidas as dificuldades de se incorporar a Amazônia à dinâmica de desenvolvimento nacional, ora por culpa do modelo estabelecido, ora pela falta de tecnologia ou