• Nenhum resultado encontrado

Processos semi-markovianos e análise de variabilidade populacional para estimação da indisponibilidade dos trabalhadores por acidentes do trabalho

N/A
N/A
Protected

Academic year: 2021

Share "Processos semi-markovianos e análise de variabilidade populacional para estimação da indisponibilidade dos trabalhadores por acidentes do trabalho"

Copied!
86
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DE PERNAMBUCO

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE

PRODUÇÃO

PROCESSOS SEMI-MARKOVIANOS E ANÁLISE DE

VARIABILIDADE POPULACIONAL PARA ESTIMAÇÃO DA

INDISPONIBILIDADE DOS TRABALHADORES POR

ACIDENTES DO TRABALHO

DISSERTAÇÃO SUBMETIDA À UFPE PARA OBTENÇÃO DE GRAU DE MESTRE

POR

FLÁVIO LEANDRO ALVES DOS SANTOS

Orientador: Enrique Andrés López Droguett, Ph.D.

(2)

Catalogação na fonte

Bibliotecária Margareth Malta, CRB-4 / 1198

S237p Santos, Flávio Leandro Alves dos.

Processos semi-markovianos e análise de variabilidade populacional para estimação da indisponibilidade dos trabalhadores por acidentes do trabalho / Flávio Lendro Alves dos Santos. - Recife: O Autor, 2013.

ix, 76 folhas, il., gráfs., tabs.

Orientador: Prof. Dr. Enrique Andrés López Droguett.

Dissertação (Mestrado) – Universidade Federal de Pernambuco. CTG. Programa de Pós-Graduação em Engenharia de Produção, 2013.

Inclui Referências e anexos.

1. Engenharia de Produção. 2. Processo Semi-Markov. 3. Análise de variabilidade populacional. 4. Inferência Bayesiana. I. Droguett, Enrique Andrés López. (Orientador). II. Título.

UFPE

(3)
(4)

ii

Aos meus pais, Maria de Fátima e Luís Pedro pela dedicação, incentivo e amor.

(5)

iii

AGRADECIMENTOS

Primeiramente gostaria de agradecer a Deus, que sempre me deu força em todos os momentos para concluir o mestrado e sem ele não conseguiria atingir esse objetivo.

A minha a minha mãe, Maria de Fátima, meu pai, Luís Pedro e meus irmãos (Janaina e Franklin) que sempre me deram amor e apoio em todas as ocasiões da minha vida.

A minha querida namorada, Mayra Queiroz, pelo incentivo em realizar essa jornada, por sua paciência em momentos difíceis e pelo amor que existe entre nós.

Aos meus amigos Ricardo Ferreira, Guilherme Cerqueira, Manoel Torres, Rodrigo Bernardo, Romero Sales e Thiago Albuquerque pela grande amizade, pelas conversas construtivas e por todos os momentos que passamos juntos nessa jornada.

Ao Professor Enrique Droguett, por ter me aceitado como seu aluno e pelos excelentes conselhos que me possibilitou à conclusão deste trabalho.

Ao Professor Márcio Moura, pelo incentivo, companheirismo e grande ajuda prestada neste trabalho.

Aos amigos do Ceerma, Ana Agra, Edlaine Correia, Daniella Nóbrega, Cláudia Silva, Victor Viana, Yuri Dourado, Marcela Guimarães, Jeane Kury e Rodolfo Araújo por fazer o dia a dia de trabalho ser sempre agradável.

De forma geral, agradeço a todos que contribuíram direta e indiretamente por esse trabalho, seja com ajuda acadêmica ou com conselhos de incentivo.

(6)

iv

RESUMO

O presente trabalho propõe uma metodologia que permite obter métricas de Disponibilidade e Indisponibilidade de um funcionário que trabalha em uma das seis regiões de atuação de uma Companhia de geração de energia elétrica, através da integração entre o processo semi-Markoviano (PSM) e Análise de variabilidade populacional Bayesiana.

A Análise de variabilidade populacional Bayesiana é um método para se chegar a uma distribuição a priori para avaliação Bayesiana dos parâmetros de confiabilidade baseado em dados parcialmente relevante. Já o processo semi-Markoviano pode ser visto como um processo cujas sucessivas transições de estados são governadas pelas probabilidades de transição do processo Markoviano (PM), mas sua permanência em qualquer estado é descrita por uma variável aleatória que depende do estado atual ocupado e do estado em que a próxima transição será feita.

A integração do PSM e da Análise de variabilidade populacional Bayesiana origina um modelo híbrido o qual é capaz de representar o comportamento do trabalhador que sofre diversos tipos de acidentes do trabalho com diferentes tempos de recuperação e taxas de falhas. Diante deste contexto, será utiliza a Análise de variabilidade populacional Bayesiana para a estimação da distribuição da taxa de acidentes e de recuperação para o processo semi-Markoviano.

Após aplicação da metodologia, é exposto métricas de um operário em cada uma das seis regiões de atuação da companhia elétrica como: Tempo operacional médio, Disponibilidade média, Disponibilidade instantânea ao final da missão, Tempo falho médio, Indisponibilidade média, Indisponibilidade instantânea ao final da missão e a Probabilidade do funcionário não acidentado e acidentado por acidente de trabalho.

(7)

v

ABSTRACT

This paper proposes a methodology to obtain metrics availability and unavailability of an employee working in one of six areas of activity of a company to generate electricity, through the integration between the semi-Markov process (PSM) and Bayesian approach for population variability analysis.

The Bayesian approach for population variability analysis is a method to reach a prior distribution for Bayesian assessment of reliability parameters based on data partially relevant. Already the semi-Markov process can be seen as a process whose successive state transitions are governed by the transition probabilities of the Markov process (MP), but his stay in any state is described by a random variable that depends on the current state and busy state wherein the next transition will be made.

The integration of SPM and Bayesian approach for population variability analysis yields a hybrid model which is able to represent the behavior of workers who suffer from various types of accidents at work with different recovery times and failure rates. Given this context, it uses Bayesian approach for population variability analysis to estimate the distribution of accident rates and recovery to semi-Markov process.

After application of the methodology, metrics is exposed workers in the six regions of operation of the utility as: average operating time, average availability, instant availability at the end of the mission, Time flawed medium Unavailability average Unavailability instant the end of the mission, expected number of accidents and the probability of non-injured employees and injured by an accident at work.

(8)

vi

SUMÁRIO

1 INTRODUÇÃO ... 1 1.1 Objetivos ... 5 1.1.1 Objetivo geral ... 5 1.1.2 Objetivos específicos ... 5 1.2 Estrutura da dissertação ... 5 2 FUNDAMENTAÇÃO TEÓRICA ... 6 2.1 Conceitos e Aplicações ... 6 2.2 Processos semi-Markovianos ... 7

2.2.1 PSMH descrito por probabilidades de transição ... 9

2.2.2 PSMH descrito por taxas de transição ... 10

2.3 Inferência Bayesiana ... 11

2.4 Análise de variabilidade populacional Bayesiana ... 13

2.4.1 Mistura de funções de Verossimilhança ... 16

2.4.2 Modelo Lognormal-Poisson-Lognormal ... 17

2.4.3 Caso especial: Modelo Lognormal-Poisson ... 20

2.4.4 Especificação a priori ... 21

2.4.5 Medidas de variabilidade ... 21

3 METODOLOGIA PROPOSTA ... 23

3.1 Integração: Processo semi-Markoviano e Análise de variabilidade populacional Bayesiana 23 4 EXEMPLO DE APLICAÇÃO ... 27

4.1 Descrição do Problema ... 27

4.2 Definição e categorização das variáveis ... 29

4.3 Testes de aderência e homogeneidade ... 30

4.4 Análise de variabilidade populacional Bayesiana ... 31

4.5 Análise de Sensibilidade ... 47

4.6 Processos semi-Markovianos ... 50

5 CONCLUSÃO ... 54

5.1 Limitações e Desafios Futuros ... 55

REFERÊNCIAS BIBLIOGRÁFICAS ... 56

ANEXOS ... 64

Anexo I – Análise gráfica das métricas de disponibilidade e indisponibilidade das Regiões B, C, D, E e F. ... 64

(9)

vii

LISTA DE FIGURAS

Figura 2.1: Esquema Bayesiano. Fonte: PAULINO et al.(2003, p 22). ... 13

Figura 3.1: Fluxograma para obtenção das métricas de disponibilidade e indisponibilidade. ... 26

Figura 4.1: Linha do tempo de N trabalhadores. Fonte: MARCOULAKI et al. (2012). ... 27

Figura 4.2: Modelo Estocástico para a disponibilidade e indisponibilidade do trabalhador. ... 28

Figura 4.3: Percentual de funcionários nas regiões de atuação da Companhia de geração de energia elétrica. ... 29

Figura 4.4: Função Densidade de Probabilidade da taxa do tempo (dias) entre acidentes dos funcionários da Companhia de geração de energia elétrica. ... 33

Figura 4.5: Função de Distribuição Acumulada a posteriori da taxa do tempo(dias) entre acidentes dos funcionários das regiões de atuação da Companhia de geração de energia elétrica ... 34

Figura 4.6: Função Densidade de Probabilidade da taxa de recuperação (dias) dos funcionários da região A da Companhia de geração de energia elétrica. ... 35

Figura 4.7: Função de Distribuição Acumulada a posteriori da taxa de recuperação (dias) do funcionário da Companhia de geração de energia elétrica da região A. ... 36

Figura 4.8: Função Densidade de Probabilidade a posteriori da taxa de recuperação (dias)dos funcionários da região B da Companhia de geração de energia elétrica. ... 37

Figura 4.9: Função de Distribuição Acumulada a posteriori da taxa de recuperação (dias) dos funcionários da Companhia de geração de energia elétrica na região B. ... 38

Figura 4.10: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos funcionários da região C da Companhia de geração de energia elétrica. ... 39

Figura 4.11: Função de Distribuição Acumulada a posteriori da taxa de recuperação dos funcionários da Companhia de geração de energia elétrica na região C. ... 40

Figura 4.12: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos funcionários da região D da Companhia de geração de energia elétrica. ... 41

Figura 4.13: Função de Distribuição Acumulada a posteriori da taxa de recuperações dos funcionários da Companhia de geração de energia elétrica na região D. ... 42

Figura 4.14: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos funcionários da região E da Companhia de geração de energia elétrica. ... 43

Figura 4.15: Função de Distribuição Acumulada a posteriori da taxa de recuperação dos funcionários da Companhia de geração de energia elétrica na região E. ... 44

Figura 4.16: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos funcionários da região F da Companhia de geração de energia elétrica. ... 45

Figura 4.17: Função de Distribuição Acumulada a posteriori da taxa de dias de recuperação dos funcionários da Companhia de geração de energia elétrica na região F. ... 46

Figura 4.18: Função Densidade de Probabilidade a posteriori da taxa de acidente para os percentis 5%, 50% e 95% da taxa do tempo (dias) entre acidentes n a região A. ... 48

Figura 4.19: Função Densidade de Probabilidade a posteriori da taxa de acidentes para os percentis 5%, 50% e 95% da taxa de recuperação nas categorias da região A. ... 49

Figura 4.20: Taxa de visita ao Estado 0 – trabalhador disponível – na região A. ... 51

Figura 4.21: Taxa de visita aos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho na região A. ... 52

Figura 4.22: Probabilidade dos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho na região A. ... 52

(10)

viii

LISTA DE TABELAS

Tabela 4.1: Teste de homogeneidade de Levene: dias de recuperação por região ... 30

Tabela 4.2: Teste de homogeneidade de Levene: dias de recuperação na região A... 30

Tabela 4.3: Teste de homogeneidade de Levene: dias de recuperação na região B. ... 30

Tabela 4.4: Teste de homogeneidade de Levene: dias de recuperação na região C. ... 30

Tabela 4.5: Teste de homogeneidade de Levene: dias de recuperação na região D. ... 31

Tabela 4.6: Teste de homogeneidade de Levene: dias de recuperação na região E. ... 31

Tabela 4.7: Teste de homogeneidade de Levene: dias de recuperação na região F. ... 31

Tabela 4.8: Curvas percentuais da distribuição de variabilidade da taxa de dias até o acidente. ... 32

Tabela 4.9: Estimativa da taxa de acidente e Fator de Erro para o tempo (dias) até o acidente na região A. ... 47

Tabela 4.10: Estimativa da taxa de acidentes e fator de erro para os dias de recuperação das categorias da região A ... 48

Tabela 4.11: Métricas de Disponibilidade e Indisponibilidade do funcionário da Companhia de geração de energia elétrica nas regiões de atuação. ... 50

(11)

1

1 INTRODUÇÃO

O estudo da segurança do trabalho passa a tomar uma atenção maior após a Revolução Industrial, quando começou a surgir o trabalhador assalariado e o empregador capitalista na imagem de patrão. Segundo Bitencourt & Quelhas (1998) as tarefas do dia a dia dos operários se tornaram mais simples com ajuda das máquinas na produção, acarretando tarefas repetitivas que levou ao aumento do número de acidentes. De acordo com Costa (2003), diante de um cenário de exploração aos trabalhadores que tinham carga horária elevada, sem descanso na jornada de trabalho semanal e das condições de periculosidade ambiental que contribuíam para o aumento dos números de acidentes, foi criada a primeira lei trabalhista que surgiu na Inglaterra para coibir essas irregularidades aos funcionários.

O conceito de acidente do trabalho típico é dado conforme o Art. 19, caput, da Lei nº 8.213/1991:

“É o que ocorre pelo exercício do trabalho a serviço da empresa ou pelo exercício do trabalho dos segurados referidos no inciso VII do art. 11 desta Lei, provocando lesão corporal ou perturbação funcional que a causa à morte ou a perda ou redução, permanente ou temporária, da capacidade para o trabalho”.

O conceito de acidente de trajeto ou acidente de percurso é dado conforme o Art. 21,

caput, da Lei nº 8.213/1991:

“Acidente de trajeto é o acidente sofrido pelo segurado ainda que fora do local e horário de trabalho, a serviço da empresa ou no percurso da residência para o local de trabalho ou deste para aquela, qualquer que seja o meio de locomoção, inclusive veículo de propriedade do segurado”.

A previdência Social garante aos trabalhadores cobertura nos afastamentos por acidentes ocorridos no ambiente de trabalho ou em razão da sua execução. O conceito de acidente segundo o regulamento da Previdência social – Art. 30, parágrafo único, Decreto nº 3.048/1999 é definido a seguir:

(12)

2

“Entende-se como acidente de qualquer natureza ou causa aquele de origem traumática e por exposição a agentes exógenos (físicos, químicos e biológicos), que acarrete lesão corporal ou perturbação funcional que cause a morte, a perda, ou a redução permanente ou temporária da capacidade laborativa”.

Conforme RIVM (2008) sempre que um trabalhador exerce suas atividades ligadas ao trabalho e depara com várias situações de perigo, existe a possibilidade de um acidente que poderá resultar em uma lesão corporal. Tais lesões não irão acontecer sempre, mas ocorrerão ocasionalmente na população ativa durante o tempo de vida dos funcionários.

Segundo dados da OIT (Organização Internacional do Trabalho), cerca de 317 milhões de trabalhadores sofrem acidentes do trabalho a cada ano. Isto representa uma média de 850.000 lesões diárias, fazendo que os trabalhadores passem quatro ou mais dias afastados de seus empregos. Os dados da EUROSTAT (2007) mostram que 3,2% entrevistados da União europeia (EU-27) relataram que no período de um ano sofreram um ou mais acidentes de trabalho. Esse percentual corresponde aproximadamente 6,9 milhões de pessoas na EU-27. No Brasil, segundo o Ministério da Previdência Social (MPAS), em 2011 foram registrados 711.164 casos de acidentes e doenças do trabalho, entre os trabalhadores assegurados da Previdência Social.

A experiência devido à ocorrência de acidentes do trabalho tem levado agências reguladoras a serem mais rigorosas na garantia da segurança, por exemplo, no setor elétrico a norma CFR 1910 padrão 29 subparte S da OSHA (Occupational Safetyand Health

Administration) exige que em uma planta do setor elétrico todos os perigos devam ser

identificados a fim de determinar suas severidades e designar quais equipamentos de proteção pessoal e práticas seguras de trabalho devem ser seguidas de forma a proteger os operadores e sistema.

A causa do acidente pode ser definida como qualquer fator que, se removido, teria evitado o acidente; é a ação e/ou a condição que precede imediatamente o acidente, (REDONDO, 1970). Conforme a NBR 14280 (2001) existem várias causas que contribuem para a ocorrência do acidente do trabalho que são fatores pessoais (falta de conhecimento, motivação deficiência e etc.), ato de insegurança (forma imperfeita de trabalhar, que violam as regras de segurança) e ambiente de trabalho (manutenção inadequada, ferramentas inadequadas e etc.).

(13)

3

Assim, os acidentes do trabalho geram diversos prejuízos para os funcionários e para a empresa, portanto gerenciar os riscos associados a acidentes do trabalho é fundamental, não apenas para reduzir custos relativos aos acidentados, mas também devido à indisponibilidade do sistema. Segundo a CNP/SP (2004) os acidentes do trabalho acarretam perdas gerais ao empreendimento devido ao tempo perdido, aos transtornos para os empregados, pela parada das máquinas, setores que podem ser interditados por longo prazo de tempo, redução do rendimento do trabalhador ao voltar do período de recuperação, perda de prestigio com o público consumidor de seus produtos, aumento de gastos com processos judiciais de indenização e custos com ações corretivas para minimizar futuros acidentes. Marcoulaki et al. (2012) ainda expõe que as perdas de tempo de trabalho estão vinculadas aos prejuízos econômicos da empresa e as estimativas de perda de tempo não podem levar em conta apenas o número de acidentes, pois é uma função da frequência dos acidentes e a gravidade do acidente.

Desta maneira, funcionários e contratados que trabalham em uma empresa estão frequentemente envolvidos em acidentes de trabalho e alguns desses acidentes deixam por vários dias de afastamento o trabalhador até sua recuperação, esse tempo de afastamento do empregado gera prejuízos financeiros a empresa. Com base no cenário relatado anteriormente, é importante se ter ferramentas que permitam calcular a indisponibilidade do trabalhador, isto é, o período entre o momento que o funcionário sofreu o acidente até sua plena recuperação, assumindo sua atividade na empresa.

Alguns modelos Markovianos ou semi-Markovianos são encontrados na literatura com objetivo de calcular a disponibilidade ou indisponibilidade de sistemas ou equipamentos, como por exemplo, os citados por Mendes (2008), Jens (2006), Vesely (1993) e Moura & Droguett (2008). Segundo Mathieu et al. (2005), os modelos semi-Markovianos possuem algumas vantagens em relação aos modelos Markovianos por ter maior tratabilidade matemática e simples interpretação. Enquanto nos processos Markovianos (PM) as distribuições de transições entre os estados têm distribuição exponencial (caso contínuo), no caso semi-Markoviano os tempos entre transições podem assumir diferentes tipos de distribuições.

Aplicações dos processos semi-Markovianos (PSM) podem ser encontradas em várias áreas, como por exemplo, o estudo feito na área financeira por D’amico (2005), que emprega modelos semi-Markovianos de confiabilidade em um ambiente de risco de crédito a empresas. Felli (2007) utiliza um modelo semi-Markoviano para explorar o perfil da população dos pacientes de um ensaio clínico com intuito de desenvolver novos medicamentos e tratamentos

(14)

4

complexos. Ainda dentro da área de saúde, Wu (1982) desenvolveu um modelo de sobrevida baseado em um PSM para descrever multi-estados, onde os dados estão parcialmente censurados. Janssen & Manca (2001) utilizou o PSM na ciência atuarial para modelos de recompensa de seguros de saúde. Outros recentes trabalhos que têm como tema central o PSM são os de D’amico & Petroni (2012), Lefebvre (2011), Gosavi (2011), Guenther (2010), Hunt & Devolder (2011) e Zhang & Hou (2012).

Os esforços para diminuir os prejuízos econômicos gerados pela indisponibilidade do trabalhador devido a acidentes do trabalho é umas das maiores preocupações das organizações atualmente. A fim de se obter a disponibilidade e indisponibilidade do trabalhador será utilizado o Processo semi-Markoviano que é uma generalização do Processo Markoviano e por isso fornece uma maior flexibilidade para a modelagem de sistemas dinâmicos complexos (WANG, 2010).

Porém, ainda existem vários tipos de acidentes que podem ter diferentes tempos de recuperação e taxas de falhas, tornando a amostra não homogênea. Nesses casos, não é realista assumir que todos os funcionários de uma empresa possuam as mesmas medidas de confiabilidade, pois desta forma não proporcionará estimativas adequadas para os parâmetros (taxas de transições do PSM). Para superar essas dificuldades será utilizada a Análise de variabilidade populacional (ver (Droguett et al. (2004), Kaplan (1983), Ramos et. al. (2012), Pörn (1996) e Sivini (2006)) para a estimação da distribuição da taxa de acidentes e de recuperação, de acordo com as categorias do problema em estudo. Os dados necessários para obtenção da distribuição da taxa de acidentes são: tempo até o acidente e o tempo que os acidentados passam em licença médica.

A Análise de variabilidade populacional Bayesiana é um método para se chegar a uma distribuição a priori para avaliação Bayesiana dos parâmetros de confiabilidade baseado em dados parcialmente relevante (DROGUETT et al., 2004). Desta forma, à medida que as novas evidências tornam-se disponíveis, as distribuições de probabilidade destes parâmetros assim como o nível de conhecimento sobre o comportamento do sistema podem ser atualizadas.

Neste trabalho, é apresentado uma exemplo de aplicação em uma Companhia de geração de energia elétrica dividida em 6 regiões de atuação, onde será obtido a Disponibilidade e Indisponibilidade do trabalhador. Com base na disponibilidade e indisponibilidade a companhia elétrica será capaz de estimar por quantos dias seu funcionário ficará afastado pelo acidente do trabalho e consequentemente estimar seus custos, podendo aperfeiçoar as condições do ambiente de trabalho a fim de diminuir os acidentes economizando recursos para a empresa.

(15)

5 1.1 Objetivos

1.1.1 Objetivo geral

Desenvolver uma metodologia que permita obter as métricas de Disponibilidade e Indisponibilidade: Tempo operacional médio, Disponibilidade média, Disponibilidade instantânea ao final da missão, Tempo falho médio, Indisponibilidade média, Indisponibilidade instantânea ao final da missão e a Probabilidade do funcionário não acidentado e acidentado por acidente de trabalho via hibridismo entre processo semi-Markovianos e Análise de variabilidade populacional Bayesiana.

1.1.2 Objetivos específicos

Para se atingir o objetivo geral, os seguintes objetivos específicos são estabelecidos:  Teste de homogeneidade entre as regiões de atuação da Companhia de geração de

energia elétrica;

 Análise de variabilidade populacional Bayesiana para estimar a Função Densidade de Probabilidade para as taxas de acidentes e as taxas de recuperações do processo semi-Markoviano;

 Análise dos resultados encontrados.

1.2 Estrutura da dissertação

Este trabalho desenvolve-se em seis capítulos, como descrito na sequencia, constituindo a presente introdução o primeiro capítulo. O capítulo dois trata da fundamentação teórica fundamentação teórica onde são expostos conceitos e definições referentes à processos semi-Markovianos, inferência Bayesiana e Análise de variabilidade populacional Bayesiana. O terceiro capítulo apresenta os procedimentos metodológicos para o desenvolvimento do trabalho proposto da integração do processo semi-Markoviano e da Análise de variabilidade populacional Bayesiana. No capítulo 4, é apresentada a descrição do problema assim como os resultados alcançados da análise do modelo híbrido para o mesmo. No capítulo cinco são apresentadas as conclusões e considerações finais. E, ao final deste, listam-se as fontes bibliográficas utilizadas nesta pesquisa.

(16)

6

2 FUNDAMENTAÇÃO TEÓRICA

2.1 Conceitos e Aplicações

Segundo Howard (2007), o PSM pode ser visto como um processo cujas sucessivas transições de estados são governadas pelas probabilidades de transição do PM, mas sua permanência em qualquer estado é descrita por uma variável aleatória que depende do estado atual ocupado e do estado em que a próxima transição será feita.

Alguns desenvolvimentos científicos sobre o PSM podem ser citados, como é o caso em que Grabski (2007) em seu trabalho apresenta definições básicas e teoremas de PSM, onde o mesmo permite construir diversos modelos de confiabilidade. Grabski (2002), em outro estudo, aborda as propriedades da função de confiabilidade de um sistema com taxa de falha modelada por um PSM, onde as funções de confiabilidade são obtidas utilizando transformada de Laplace-Stieltjes. Moura (2006) propõe um modelo para a avaliação da medida de disponibilidade de sistemas tolerantes a falha baseado na integração de um PSM com tempo contínuo e redes Bayesianas, onde essa integração resulta em um modelo estocástico híbrido que é capaz de representar as características dinâmicas de um sistema. Ouhbi & Limnios (2002) investigam e propõem uma fórmula simples para a taxa de falha (ROCOF) de um sistema de estados finitos de PSM, a partir da fórmula para a ROCOF é obtido um estimador estatístico desta função, onde esse estimador é fortemente consistente e assintoticamente normal. Veeramany & Pandey (2010) apresentam um modelo para avaliar as frequências de ruptura e confiabilidade do sistema de tubulação de uma usina nuclear com base na teoria de PSM, onde esse modelo é capaz de incorporar o efeito do envelhecimento de degradação dos tubos da usina. Yu (2010) apresenta uma visão geral do modelo semi-Markoviano oculto, incluindo modelagem, inferência, estimação, implementação e aplicações. Xie (2005) estuda a política de rejuvenescimento de dois níveis para sistemas de software com processo de degradação. O PSM é construído, e com base na sua solução de forma fechada é obtida a disponibilidade do sistema como uma função bivariada, em seguida a política rejuvenescimento é analisada para maximizar a disponibilidade do sistema. Pievatolo & Valadè (2003) estudam o desempenho da confiabilidade do sistema de energia constante, onde é apresentado um modelo analítico capaz de lidar com distribuições de tempos de falha e reparo não exponencial utilizando o PSM e, assumindo independência estocástica para os componentes do sistema em estudo, é calculado o tempo médio entre acidentes e o tempo médio de recuperação do compressor de saída de voltagem. Chen & Trived (2005) constroem um processo de decisão semi-Markov para otimização da política de manutenção baseados em

(17)

7

problemas de manutenção preventiva, e apresentam a abordagem conjunta da taxa de inspeção e política de manutenção. El-Gohary (2004) mostra estimativas obtidas por Máxima verossimilhança e pela abordagem Bayesiana dos parâmetros de um modelo de confiabilidade semi-Markov com três estados, onde o núcleo de renovação que depende de um vetor de parâmetros desconhecido é utilizado para definir o PSM que pode ser usado para descrever alguns modelos de confiabilidade. Dong (2009) utiliza uma metodologia baseada no processo homogêneo semi-Markoviano oculto adicionado a uma estrutura temporal para previsão de partículas no ar que são importantes para o controle e redução de poluentes no ar.

2.2 Processos semi-Markovianos

PSMHs contínuos no tempo podem ser introduzidos considerando uma nomenclatura similar à dada em Corradi et al. (2004). Permita { } representar o espaço finito de estados e definir as seguintes variáveis aleatórias , onde e são o estado e o instante da n-ésima transição, respectivamente.

O processo estocástico { } é chamado de processo de renovação Markoviano homogêneo se

]

]

(2.1)

O núcleo de um PSMH é definido como:

] (2.2)

A equação (2.1) é a probabilidade do PSMH alcançar o estado j no instante dado que permaneceu no estado i por unidades de tempo, onde t é o tempo de permanência no estado i dado que o PSMH desloca-se para o estado j.

De acordo com Howard (2007), o núcleo descreve fundamentalmente um PSMH

já que governa estocasticamente as transiçõs entre estados assim como os tempos de permanência t ambos condicionados no estado corrente i.

O PSMH deixará o estado i depois de permanecer neste estado por t unidades de tempo com probabilidade dada por:

(18)

8

] (2.3)

o qual representa a função de distribuição acumulada (CDF) do tempo de espera no estado i. As equações (2.2) e (2.3) são relacionadas como segue:

(2.4)

Na verdade, significa a probabilidade do PSMH deixar o estado i quando o seu estado sucessor é desconhecido.

O comportamento estocástico ao longo do tempo de um PSMH pode ser avaliado calculando as probabilidades (probabilidade do PSMH estar no estado j no instante t) dadas as condições iniciais . Permita, portanto, ser o número de vezes que o estado j de um PSMH é visitado a partir de qualquer outro estado r no intervalo [0, t]. Permita, também, que ] seja seu valor esperado. Caso seja

continuamente diferenciável, então é a sua função densidade correspondente. Como o processo sobre consideração é regular, isto é, não mais do que uma transição pode ocorrer em qualquer intervalo , então pode ser assumida como a probabilidade de uma transição ocorrer para o estado j em um intervalo de tempo infinitesimal dt como segue:

{ }.

Assim, segue que:

∑ ̇ ∑ ∫ ̇ , (2.5)

onde ̇ é a derivada do núcleo do PSMH on instante t.

A equação (2.5) significa que o estado j pode ser alcançado se o PSMH estava inicialmente no estado i e permanece neste estado até o instante t, quando uma transição para o estado j ocorre, ou se o PSMH alcançou o estado i no instante , permanecendo neste estado por unidades de tempo, então uma transição para o estado j ocorre.

(19)

9

O somatório ao longo do número de estados N leva em consideração todos os possíveis estados intermediários por onde o PSMH pode transitar. O termo integral, por sua vez, significa que a transição para o estado i pode ocorrer em qualquer instante de tempo ]. A equação (2.5) corresponde a um sistema de N equações integrais com raízes ,

. As probabilidades ] podem ser obtidas a partir das condições iniciais como segue:

[ ]

[ ] (2.6)

A equação (2.6) significa que um PSMH pode estar no estado j no instante t se estava inicialmente no estado j e permanece neste estado pelo menos até o instante t ou se visitou o estado j em qualquer instante ] com probabilidade e permaneceu lá por unidades de tempo. A equação (2.6) corresponde a N integrações diretas que podem ser resolvidas independentemente usando a solução da equação (2.5).

A definição dos PSMHs por probabilidades ou taxas de transição depende de como o núcleo e a função de distribuição são definidas. Nas próximas duas seções, as particularidades de cada tipo de definição serão analisadas.

2.2.1 PSMH descrito por probabilidades de transição

Para descrever um PSMH a partir de suas probabilidades de transição, é preciso definir as probabilidades do processo Markoviano embutido e as funções de distribuição do tempo de permanência t no estado i dado o próximo estado j a ser ocupado pelo processo.

Basicamente, segue que:

] , (2.7)

onde ] é a matriz de probabilidades de transição do processo Markoviano homogêneo

(20)

10

A CDF do tempo de permanência t dado i e j é definida como:

] (2.8)

As probabilidades são relacionadas como segue:

{

Basicamente, um PSMH descrito por probabilidades de transição funciona da seguinte maneira: quando o estado i é alcançado, o próximo estado j a ser ocupado pelo processo é imediatamente amostrado a partir das probabilidades do processo Markoviano homogêneo. Dados os estados i e j, o tempo de permanência t no estado i é amostrado da CDF

. Assim o tempo da próxima transição é determinado como .

2.2.2 PSMH descrito por taxas de transição

Os requisitos de informação para definição de um PSMH a partir de suas taxas de transição são as funções . A taxa de transição de um PSMH é definida em Becker

et al. (2000) como:

, (2.9)

onde e são os instantes da última e próxima transições, respectivamente. O tempo de

permanência t é dado pela diferença .

A equação (2.9) significa que uma transição para o estado j ocorre em um intervalo de tempo infinitesimal dt depois que o processo permaneceu no estado i por uma duração t, dado que não houve antes qualquer transição deixando tal estado.

Para o caso homogêneo, no qual as taxas de transição dependem apenas do tempo

decorrido desde a última transição (tempo de permanência), Becker et al. (2000) definem o núcleo como:

(21)

11

∫ ( ∫ ) (2.10)

onde

A CDF do tempo de espera no estado i é definida como:

( ∫ ) (2.11)

Basicamente, um PSMH descrito por taxas de transição funciona da seguinte maneira: quando o estado i é alcançado, o tempo de permanência t no estado i e o próximo estado j a ser ocupado pelo processo são amostrados diretamente a partir do núcleo .

2.3 Inferência Bayesiana

Os métodos bayesianos têm origem na ideia de impor uma probabilidade aos motivos de um evento observado a partir de um valor tomado a priori e atualizado em função dessa observação (COUTINHO, 1994).

O uso da inferência Bayesiana se faz vasto na literatura. Sobre este tema podemos citar trabalhos como o de Silva & Mattos (2001) que propõem uma aplicação de métodos de computacionais, para análise de confiabilidade com abordagem Bayesiana, em itens de produtos manufaturados em degradação. Galvanin (2007) sugere uma metodologia para extração de contornos de telhados de edifícios usando Modelo Digital de Elevação (MDE), inferência Bayesiana e Markov Random Field (MRF). Ribeiro (2005) realiza aplicações da inferência Bayesiana em estudos de confiabilidade em dados de falha em análises de segurança, explicando o impacto da mesma em estudos de análise de riscos (EAR) ambientais em plantas industriais e em análises probabilísticas de segurança (APS) em instalações nucleares. Vieira (2006) expõe uma metodologia Bayesiana de controle da qualidade de produtos indústrias, em unidades em testes sobre forte estresse. Moselhy & Marzouk (2012)

(22)

12

expõem uma nova abordagem para inferência Bayesiana que se baseia na construção de mapas. Scotto & Soares (2007) apresentam um método que combina a metodologia Bayesiana e as técnicas de valor extremo para estimar a ocorrência de ondas elevadas.

Um dos primeiros autores a definir probabilidade como o grau de confiança foi Bernoulli na sua obra Ars Conjectandi de 1713, onde define que “Probabilidade é o grau de certeza e difere da certeza absoluta assim como a parte difere do todo”.

O grau de confiança é uma medida do conhecimento de um indivíduo sobre uma dada proposição ou evento. Desta forma, o grau de confiança é subjetivo. É uma medida de incerteza (ou certeza) e, portanto é uma representação do estado mental e não do mundo externo.

A inferência Bayesiana é baseada em probabilidade subjetiva ou credibilidade a

posteriori associada a diferentes valores do parâmetro θ (desconhecido) e condicionada pelo

particular valor de y observado (PAULINO et al., 2003).

As vantagens da abordagem Bayesiana são: o tratamento numérico, ausência de assintóticos, enquadramento formal para a combinação de informações e recuso intuitivo, (KÉRY, 2010).

O conhecimento a priori sobre o parâmetro é resumido pela densidade , onde é a verossimilhança ou distribuição de probabilidade condicional de y dado , e o conhecimento atualizado está presente na densidade a posteriori, . A partir do teorema de Bayes se tem:

(2.12)

onde o denominador do lado direito é a probabilidade marginal. Para o caso discreto ∑ , ou seja, a soma para todos os valores possíveis de e no caso contínuo temos ∫ , (CONGDON, 2006).

Conforme Kéry (2010) observa-se que na equação (2.12) a distribuição a

posteriori, é proporcional ao produto da função de verossimilhança, , e da

distribuição a priori do parâmetro . Para assegurar que este produto é uma função de distribuição de probabilidade adequada, isto é, com integral igual a 1, o termo , que não depende de , funciona como uma constante normalizadora de . Assim, o teorema de Bayes pode ser escrito da forma abaixo:

(23)

13

(2.13)

Pode-se reescrever equação acima em palavras como

A verossimilhança tem importante tarefa na fórmula de Bayes, pois fornece um meio de combinar as informações sobre o parâmetro θ contidas nos dados observados em y. Esta forma simplificada do teorema de Bayes será útil em problemas que envolvam estimação de parâmetros já que o denominador é apenas uma constante normalizadora (EHLERS, 2003).

Na visão de Paulino (2003) para os bayesianos a distribuição a posteriori incorpora, por via do teorema de Bayes, toda a informação disponível sobre o parâmetro. No esquema Bayesiano (Figura 2.1) nota-se que todas as inferências são realizadas a partir da aplicação lógica do cálculo de probabilidade.

Figura 2.1: Esquema Bayesiano. Fonte: PAULINO et al.(2003, p 22).

2.4 Análise de variabilidade populacional Bayesiana

Análise de variabilidade populacional é um método para se chegar a uma distribuição a

priori para avaliação Bayesiana dos parâmetros de confiabilidade baseado em dados

parcialmente relevante (DROGUETT et al., 2006). Dados Amostra Distribuição a priori Teorema de Bayes Raciocínio Dedutivo Inferência Estatística Modelo Experimental

(24)

14

Segundo Kaplan (1983) a análise de variabilidade é primeira etapa de duas etapas da atualização dos parâmetros do processo Bayesiano. A segunda etapa do processo Bayesiano corresponde à atualização com base em dados específicos do sistema.

Segundo Droguett et al. (2004), a distribuição da variabilidade populacional é desenvolvida com base no tempo de execução dos dados. No entanto, as estimativas da taxa de ocorrência também podem estar disponíveis e constituem outra fonte valiosa de informação, principalmente quando os dados são escassos ou faltantes. Neste caso, o uso de técnicas bayesianas é de fundamental importância, bem como a opinião do especialista. O uso dessas técnicas consiste na atualização de alguma distribuição de probabilidade inicial, a distribuição priori, baseada na evidência específica. As soluções para a análise de variabilidade populacional, também conhecida como Bayes hierárquico, Bayes empírico, ou análise não homogênea, envolvem o uso de modelos Bayes hierárquico de distribuição paramétrica para descrever a variabilidade. O interesse é investigar a variabilidade das taxas de acidente e de recuperação.

Desta forma, se X indica a medida de interesse (taxa de acidente e recuperação), a avaliação da distribuição da variabilidade populacional de X é baseada nos seguintes tipos de informação:

 : Análise ou opinião do especialista;

 : Análise dos dados de exposição (tempo de execução ou demanda) com operação de sistemas semelhantes em aplicações análogas;

 : Estimativas ou distribuições sobre a confiabilidade de X medidas de várias fontes, tais como base de dados ou opiniões de especialistas.

A análise Bayesiana de variabilidade populacional tem a capacidade de utilizar dados oriundos de quaisquer das três fontes descritas anteriormente, bem como agregar valores permitindo uma melhor avaliação do sistema.

A verdadeira distribuição de variabilidade populacional pode ser apresentada como membro de uma família de distribuição paramétrica. Quando esta distribuição é incerta, esta incerteza é expressa sobre a forma de distribuição de probabilidade sobre todos os membros da família distribucional. Se denota a variabilidade distribucional do modelo paramétrico, então a distribuição de probabilidade sobre todos os parâmetros do modelo pode ser usada para descrever a incerteza sobre a distribuição da variabilidade do modelo. A estimativa da densidade da variabilidade populacional é dada por:

(25)

15 ̂ ∫ ∫ ( ) (2.14)

A equação (2.14) consiste na representação de uma “mistura” de distribuições do modelo escolhido, onde o modelo paramétrico da variabilidade é representado por e , que representa a incerteza sobre a distribuição de variabilidade. Tem-se que a distribuição de incerteza sobre o espaço de ( ) , onde , é a mesma que a incerteza sobre os valores de , uma vez que para cada valor de existe um único ( ) e vice-versa. Desta forma, o objetivo de estimar ( ) fica reduzido a estimar . Considerando que o estado de conhecimento a priori sobre é representado pela distribuição de probabilidade , e dada a evidência disponível, , usa-se o teorema de Bayes para encontrar a distribuição de probabilidade a posteriori sobre . Seja uma distribuição de probabilidade sobre os parâmetros do modelo de variabilidade , onde foram descritos anteriormente. Então a distribuição sobre X do sistema específico condicional a e a nova evidência

é dada por: ∫ ( ) ∫ ∫ ( ) (2.15) onde .

A distribuição a posteriori dos parâmetros da variabilidade populacional baseado nos três tipos de evidência é obtida através do teorema de Bayes

( | )

∫ (2.16)

onde é a verossimilhança da informação, e é a distribuição a priori sobre . Assumindo que as evidências e são independentes, a função de verossimilhança torna-se:

(26)

16

( | ) ( | ) ( | ) (2.17)

Por outro lado, escrevendo a equação (2.17) em termos das verossimilhanças das informações de cada item, obtém-se:

( | ) ∏ ( | ) ( | )

(2.18)

observar-se que ( | ) e ( | ) são as probabilidades das evidências e do

i-ésimo item do total de n itens, assumindo que o conjunto de parâmetros da curva da

variabilidade populacional é .

Observa-se que a medida de confiabilidade para o i-ésimo sistema, , é desconhecido, sabendo que é um dos possíveis valores de X. Além disso, X tem distribuição de acordo com , com também desconhecido. Portanto, é possível calcular as probabilidades de observar as informações e permitindo que a medida de confiabilidade possa assumir

todos os valores possíveis, isto é, calculando a média de ( | ) sobre a distribuição

X.

( | ) ∫ ( | ) ( | ) (2.19)

A equação (2.19) pode ser substituída na equação (2.18) para a obtenção da função de verossimilhança da informação total.

2.4.1 Mistura de funções de Verossimilhança

De acordo com Droguett et al. (2006), para a execução da análise de variabilidade populacional de uma medida de confiabilidade é fundamental especificar uma distribuição de probabilidade adequada que possa descrever a variabilidade subjacente da medida de interesse, , assim como a função de verossimilhança . A construção da verossimilhança depende do tipo de evidência disponível. São considerados dois tipos de categorias de evidência:

 Tipo (Evidência de exposição): número de acidentes e tempo de exposição (tempo de serviço ou número de demandas). Por exemplo, {

(27)

17

} ou { }, onde é o número de acidentes, é o tempo para observar acidentes no i-ésimo sistema, é o número total de demandas e é o número total de funcionários.

 Tipo (Fonte de estimativas): considera-se a opinião do especialista. A evidência é sob a forma de { } , onde é a estimativa fornecida pela i-ésima fonte e é o desvio padrão logarítmico que representa a opinião do i-ésimo especialista.

Podem existir várias versões das misturas de funções de verossimilhança dependendo da medida de interesse X e de como os dados são apresentados. Serão apresentados a seguir o desenvolvimento dos modelos Lognormal-Poisson-Lognormal e Lognormal-Binomial-Lognormal, respectivamente. Também serão apresentados os dados obtidos através da opinião de especialistas são casos especiais dos modelos mistos. Formulações alternativas com os modelos Gama-Poisson-Lognormal e Beta-Binomial-Lognormal seguem diretamente.

A especificação da distribuição de probabilidade que irá descrever a variabilidade se deve a natureza da medida de confiabilidade, por exemplo, o número de falhas observadas em um instante de tempo poderá ser modelado pela distribuição Poisson.

Como relatado anteriormente, há possibilidade de diferentes formas de construção da verossimilhança que depende da natureza da evidência e da escolha da distribuição de probabilidade da variabilidade subjacente, que geraram diferentes modelos de mistura de verossimilhança, tais como Lognormal-Poisson-Lognormal, Lognormal-Binomial-Lognormal, Gama-Poisson-Lognormal e Beta-Binomial-Lognormal.

2.4.2 Modelo Lognormal-Poisson-Lognormal

Suponha-se que o interesse seja avaliar a variabilidade populacional da taxa de acidente e as fontes disponíveis são: dados observados em operação { } e estimativas dadas por diferentes especialistas , definidos anteriormente. Considera-se que a variabilidade populacional do verdadeiro valor da taxa de falha siga uma distribuição Lognormal:

√ [ (

(28)

18

Portanto, a distribuição a posteriori dos parâmetros da variabilidade da equação 44 pode se escrita por:

( | )

∫ ∫ (2.21)

Para o i-ésimo sistema a verossimilhança do tipo de informação , , pode ser construída caso seja conhecida a taxa de falha , de cada sistema, pode-se usar a distribuição Poisson para estimar a probabilidade das falhas observadas em .

(2.22)

Tomando como base o modelo de erro multiplicativo proposto por Mosleh (1992), a função de verossimilhança para o i-ésima fonte estimada, , pode ser escrita em

termos da distribuição Lognormal com média , isto é:

√ [ (

) ] (2.23)

que é considerado um especialista imparcial. Utilizando a transformação , a equação (2.20) pode ser rescrita da seguinte forma:

| | (2.24)

desde que , então

√ [ ( ) ] (2.25) portanto, √ [ ( ) ] (2.26)

(29)

19 tem distribuição normal com média igual a .

Como é conhecido apenas que é um dos possíveis valores para a taxa de falha representada pela distribuição da variabilidade populacional ( ) ao integrar-se a probabilidade da equação (2.19) sobre todos os possíveis valores de , a fim de calcular a probabilidade dos dados incondicionais em relação ao valor desconhecido de

∫ (2.27)

onde se considera os dados observados durante um período de execução e as estimativas das evidências são independentes. Observa-se que a i-ésima estimativa do especialista é a mesma para o i-ésimo sistema para os dados observados no tempo de execução .

Substituindo a equação (2.26) e (2.22) na equação (2.27):

[ (

) ( ) ] (2.28)

Uma possível solução para equação (2.28) pode ser obtida se

{ [( ) ( ) ]} [ ( ) ]

Desta forma, pode-se mostrar que:

√ (2.29)

Assim, a função de verossimilhança dada pela equação 56 é

[ {(

)

}]

(30)

20 [ ] ∫ [ ( ) ] (2.30)

A equação anterior pode ser escrita como o produto entre as distribuições Gama e Lognormal. [ ] √ ∫ [ ( ) ] (2.31)

Substituindo as expressões e dados pela equação (57), tem-se:

[ ] √ √

∫ ( ) (2.32)

Portanto, a probabilidade total é obtida substituindo-se na equação (2.29) na equação a seguir:

(2.33)

2.4.3 Caso especial: Modelo Lognormal-Poisson

Quando os dados de execução estão disponíveis e considerando o modelo de variabilidade populacional tendo uma distribuição Lognormal, pode-se utilizar o modelo Lognormal-Poisson com parâmetros e para estabelecer sua verossimilhança, dada na forma a seguir: ∫ √ ( ) √ ∫ √ ( ) (2.34)

(31)

21

Observa-se que a equação acima pode ser definida como o produto das distribuições Gama e Lognormal.

2.4.4 Especificação a priori

A análise de variabilidade populacional pode ser usada para construir a distribuição a

priori para análises específicas do sistema de confiabilidade com base em dados e opinião de

especialistas para sistemas similares. A distribuição a priori pode ser informativa ou não. Quando se refere à distribuição a priori informativa leva-se em consideração a opinião do especialista da área de estudo em relação ao parâmetro de interesse. Uma a priori não informativa será baseada apenas em evidências. Quanto maior o número de evidências utilizadas na obtenção da verossimilhança, menor será a influência da distribuição a priori para obter a posteriori. Em um modelo com distribuição Lognormal, a priori será definida fornecendo-se a mediana e um Fator de Erro (FE). Segundo Mosleh (1992), o fator de erro é uma relação do percentil superior ao valor mediano de uma quantidade incerta, distribuída de acordo com uma distribuição Lognormal. O fator de erro é dado na equação

(2.35)

onde é a mediana e é 95º percentil que indica que há 95% de dados inferiores a esse

valor. Quanto maior o FE, maior o grau de incerteza da taxa. Quando menor o FE, maior a confiança se tem na qualidade das informações adquiridas.

2.4.5 Medidas de variabilidade

Segundo Droguett et. al. (2004), a função de verossimilhança e as distribuições a priori são incorporadas em procedimento de inferência Bayesiana em que a densidade a posteriori , é calculada. A inferência Bayesiana em que a densidade a posteriori é executada usando o método Markov Chain Monte Carlo (MCMC), que permite que amostras sejam geradas de uma função de densidade contínua não normalizada. O MCMC resulta em um conjunto de amostras { }, representando a densidade a posteriori sobre os parâmetros do modelo de distribuição de variabilidade ( ) { }.

(32)

22

Dado S, a densidade de variabilidade populacional estimada é calculada a seguir:

̂ ∫ ( ) ∑ ( )

A média e variância são calculadas a seguir:

̂ ∫ ̂ ∑ (2.36) ∫ ̂ ̂ ∑ (2.37)

onde e são a média e variância de ( ).

Os resultados gerados incluem limites de incerteza da densidade de variabilidade acumulada:

(2.38)

e na forma de z-percentis , é definido como , pode-se encontrar o valor de a seguir:

̂ (2.39)

Com base nos limites o analista tem um referencial para avaliar a incerteza estimada da distribuição de variabilidade populacional.

(33)

23

3 METODOLOGIA PROPOSTA

O presente capítulo tem por objetivo apresentar como será a conexão entre o processo semi-Markoviano e Análise de variabilidade populacional Bayesiana. O modelo proposto será apresentado através de uma aplicação a um banco de dados de uma Companhia de geração de energia elétrica com diversos tipos de acidentes do trabalho e tempos de recuperação distintos.

3.1 Integração: Processo semi-Markoviano e Análise de variabilidade populacional Bayesiana

O objetivo geral do presente trabalho é desenvolver uma metodologia que permita representar de forma mais realista sistemas complexos através do hibridismo entre o processo semi-Markoviano e Análise de variabilidade populacional Bayesiana, que permite obter métricas de Disponibilidade e Indisponibilidade (disponibilidade média, disponibilidade instantânea ao final da missão, indisponibilidade média, indisponibilidade instantânea ao final da missão). Segundo Rausand & Hoyland (2003), a disponibilidade instantânea, , é definida como sendo a probabilidade de um sistema estar disponível para o uso no tempo t: ]

A probabilidade que um sistema esteja indisponível no instante de tempo t é definida como (Indisponibilidade instantânea). A soma de e deve ser unitária.

(3.1)

A Disponibilidade média, , e Indisponibilidade média, , considerando o

intervalo de tempo T são definidas por (CASSADY, 2003)

∫ (3.2)

(34)

24

Também será possível obter através do hibridismo entre o processo semi-Markoviano e Análise de variabilidade populacional Bayesiana o Tempo operacional médio e o Tempo falho médio do funcionário, assim como a Taxa de visita aos Estados e a Probabilidade do funcionário não acidentado e acidentado por acidente de trabalho.

A Disponibilidade e Indisponibilidade do trabalhador serão estimadas utilizando a distribuição de probabilidade das variáveis “tempo até o acidente” e “recuperação”, através dos seguintes passos abaixo (ver Figura 4.1):

i. Supor que inicialmente, que um funcionário i qualquer da Companhia de geração de energia elétrica possa estar em qualquer um dos seis estados: operacional (0), apto a executar suas atividades; acidentado (1), situação em que se encontra em licença médica de até 3 dias; acidentado (2), situação em que se encontra em licença médica de 4 até 14 dias; acidentado (3), situação em que se encontra em licença médica de 15 dias até 1 mês; acidentado (4), situação em que se encontra em licença médica acima de 1 mês até 3 meses; acidentado (5), situação em que se encontra em licença médica acima de 3 meses. Portanto, o ciclo acidente-recuperação pode ser modelado por um processo estocástico para o qual as taxas de transição entre estados precisam ser estimadas a partir de dados de acidentes de trabalho;

ii. Como relatado no Item 1, é preciso estimar a Função Densidade de Probabilidade para as taxas de acidentes λ e as taxas de recuperações μ. Neste trabalho, serão usados métodos Bayesianos de estimação da distribuição da taxa de acidentes e de recuperação, de acordo com as categorias relatadas anteriormente. Os dados necessários exigidos para isto são, respectivamente, tempo até o acidente e o tempo em que os acidentados passam em licença médica. O processo semi-Markoviano, será utilizado para obter a disponibilidade e indisponibilidade média do funcionário ao longo de um período de um ano.

iii. Portanto, a partir dos Itens 2, é estimado a incerteza sobre a disponibilidade e indisponibilidade média dos acidentados através de percentis que são traçados em torno desse indicador.

iv. As saídas do passo 3 multiplicadas por um horizonte de tempo de interesse de um ano irão fornecer o tempo perdido esperado que os funcionários da Companhia de geração de energia elétrica passarão indisponíveis (em licença médica). É importante destacar que os funcionários pertencentes a diferentes

(35)

25

categorias (em licença médica) terão frequências e severidades distintas de acidentes.

v. Do passo 4, obtém a incerteza (percentis de 5%, 50% e 95%) sobre o tempo que os funcionários de cada categoria passariam em licença médica ao longo do ano. vi. A saída do passo 5 seria a curva de incerteza (percentis 5%, 50% e 95%) dos

dias perdidos de trabalho de cada categoria definida anteriormente. Com estas informações, será possível priorizar determinados grupos de funcionários da Companhia elétrica que possuem maior probabilidade de ocorrência e severidade de acidentes;

vii. A partir do momento que novos acidentes acontecerão, as taxas de transição λ e μ serão reavaliadas, i.e., suas PDF’s serão novamente estimadas no passo 2 e todos os passos serão seguidos novamente para estimação da disponibilidade e indisponibilidade do trabalhador no ano seguinte.

(36)

26

(37)

27

4 EXEMPLO DE APLICAÇÃO

4.1 Descrição do Problema

Considere um ambiente de trabalho com trabalhadores e um período de observação que inicia em e termina em . A Figura 4.1, mostra a linha do tempo para cada trabalhador (o tempo de trabalho não é necessariamente o mesmo para todos os trabalhadores), , onde o mesmo trabalha entre e e durante esse tempo se envolve em acidentes. O trabalhador começa a trabalhar na empresa no instante , e depois de um intervalo de tempo , sofre um acidente, retornando ao trabalho

após o primeiro acidente, depois do intervalo . Um segundo acidente ocorre depois do

intervalo , e o tempo de retorno ao trabalho é representado por , e assim ocorre sucessivamente. Os tempos iniciais coincidem com . Os tempos finais coincidem com . Apenas os trabalhadores 1, 6, 8 e 9 permaneceram empregados durante todo período de observação, enquanto os demais trabalharam apenas por uma porção de tempo. O tempo trabalhado do trabalhador n antes de acidentes ocorrer é denotado por . O respectivo tempo de recuperação é denotado por . O intervalo entre o último acidente de, , e é denotado por .

(38)

28

O comportamento dinâmico do trabalhador em uma empresa é representado por um processo estocástico semi-Markoviano como mostra a Figura 4.2. Os trabalhadores que se encontram no Estado 0 estão desempenhando sua função normalmente (disponíveis para trabalhar). Já os trabalhadores que permanecem nos Estados (1, 2, 3, 4 e 5) estão se recuperando de um acidente (indisponíveis, pois sofreram um acidente) são classificados segundo a Eurostat (2007) da seguinte forma: Estados 1 – De 0 até 3 dias, Estados 2 - De 4 até 14 dias, Estados 3 – De 15 dias até 1 mês, Estados 4 – Acima de 1mês até 3 meses e Estados 5 - Acima de 3 meses. Um processo aleatório gera os acidentes com taxa , de modo que um trabalhador que estava disponível (Estado 0), passa a ficar indisponível nos demais estados. Outro processo aleatório gera um tempo de recuperação de um acidente, para que um trabalhador que está no Estado 1 retorne ao Estado 0 com taxa . De forma análoga é obtido às taxas .

Assim, as taxas , são independentes e suas transições podem assumir qualquer tipo de distribuição de probabilidade. Portanto, o PSM se adapta em nosso problema por ter maior flexibilidade em termos de distribuições de probabilidade e não possui a limitação de assumir que os tempos entre eventos sejam necessariamente exponenciais o que permite um maior poder de generalização do modelo.

Figura 4.2: Modelo Estocástico para a disponibilidade e indisponibilidade do trabalhador.

Porém, existem vários tipos de acidentes do trabalho com diferentes taxas de recuperação e taxas de acidentes, que podem ocasionar a formação de uma amostra não homogênea, ou seja, as taxas de recuperação e taxas de acidentes por diferentes tipos de

(39)

29

acidentes não têm variabilidade semelhante, por esse motivo não proporciona uma amostra realista e não possuem o mesmo parâmetro de confiabilidade para o problema.

Para superar essas dificuldades será necessário utilizar a Análise da variabilidade populacional para superar a falta de homogeneidade da população e estimar a distribuição das taxas de transição de acidente ( ) e de recuperação ( ) entre os estados disponíveis e indisponíveis.

Supondo uma Companhia de geração de energia elétrica composta por 5.576 funcionários divididos em seis regiões (A, B, C, D, E e F) de atuação. Desse contingente, 804 acidentes foram observados no período entre Janeiro de 2005 a Setembro de 2012.

Figura 4.3: Percentual de funcionários nas regiões de atuação da Companhia de geração de energia elétrica.

Observa-se pela Figura 4.3, que as regiões de atuação da Companhia de geração de energia elétrica das regiões A, B e C possuem maior percentual de concentração de funcionários.

A análise de Disponibilidade e Indisponibilidade do trabalhador será modela através do software E&P Office, versão 3.2. Os testes estatísticos serão realizados no software livre R, versão 2.15.1.

4.2 Definição e categorização das variáveis

Tomando como base a data de admissão do assalariado e realizando a diferença entre a data do acidente é possível obter uma nova variável chamada “tempo até o acidente”. A

0,00 10,00 20,00 30,00 40,00 50,00 A B C D E F 44,40 17,08 16,26 11,61 7,24 3,42 Por ce n tagem (% ) Região

(40)

30

variável “recuperação” corresponde ao tempo decorrido desde a ocorrência do acidente até o retorno do acidentado ao trabalho, a mesma é categorizada segundo a classificação da Eurostat (2007) da seguinte forma: 0 até 3 dias, 4 até 14 dias, 15 dias até 1 mês, acima de 1 mês até 3 meses e acima de 3 meses.

4.3 Testes de aderência e homogeneidade

A fim de verificar qual a distribuição de probabilidade se ajusta para as variáveis “tempo até o acidente” e “recuperação” foi utilizado o teste de kolmogorov-smirnov (ver Mood et. al. 1976, p. 508), onde nenhuma distribuição paramétrica se ajustou aos dados. Portanto, será utilizada para as duas variáveis distribuições não paramétricas obtidas pela Análise de variabilidade populacional Bayesiana, uma vez que a variável “recuperação” não é homogênea em relação à região de atuação da Companhia de geração de energia elétrica.

A fim de indicar que as variâncias não são iguais para as regiões, foi utilizado o teste de homogeneidade de Levene (ver Levene, 1960) (Tabela 4.1), verifica-se que se rejeita a hipótese das regiões de atuação da Companhia de geração de energia elétrica ter a mesma variância em relação ao número de dias de recuperação, isto é, as regiões não apresentam variâncias homogêneas.

Tabela 4.1: Teste de homogeneidade de Levene: dias de recuperação por região

Levene Valor de p

Recuperação 1402,234 0,009

Com o propósito de verificar a homogeneidade dentro de cada região, as mesma foram divididas em 2 grupos, primeiro grupo até o valor da sua mediana e o segundo acima do valor da sua mediana. A seguir são apresentados os resultados dos testes de homogeneidade:

Tabela 4.2: Teste de homogeneidade de Levene: dias de recuperação na região A.

Levene Valor de p

Recuperação 600,13 0,004

Tabela 4.3: Teste de homogeneidade de Levene: dias de recuperação na região B.

Levene Valor de p

Recuperação 178,40 <0,0001

Referências

Documentos relacionados

De seguida, vamos adaptar a nossa demonstrac¸ ˜ao da f ´ormula de M ¨untz, partindo de outras transformadas aritm ´eticas diferentes da transformada de M ¨obius, para dedu-

Os resultados deste trabalho mostram que o tempo médio de jejum realizado é superior ao prescrito, sendo aqueles que realizam a operação no período da tarde foram submetidos a

•   O  material  a  seguir  consiste  de  adaptações  e  extensões  dos  originais  gentilmente  cedidos  pelo 

O processo de pseudo-individuação (Stanton et al., 1988) evidencia-se claramente no caso apresentado. Por um lado, Ricardo sofre pressões para individuar-se. Sua família e

Outro aspecto a ser observado é que, apesar da maioria das enfermeiras referirem ter aprendido e executado as fases do processo na graduação, as dificuldades na prática

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

No final, os EUA viram a maioria das questões que tinham de ser resolvidas no sentido da criação de um tribunal que lhe fosse aceitável serem estabelecidas em sentido oposto, pelo

Para analisar as Componentes de Gestão foram utilizadas questões referentes à forma como o visitante considera as condições da ilha no momento da realização do