• Nenhum resultado encontrado

Modelagem proposta para sele¸ c˜ ao de atributos

A figura 3 apresenta uma vis˜ao geral do contexto de estudo deste trabalho. Na figura est˜ao organizados os elementos que fornecem e aqueles que geram informa¸c˜ao na estrat´egia em estudo, o tipo de informa¸c˜ao envolvida em cada passo da estrat´egia, e os passos em si, com destaque para os que se constituem como a principal contribui¸c˜ao associada a este trabalho.

A fonte de dados prim´aria para este estudo ´e um sistema de informa¸c˜ao que trata do gerenciamento de um processo estruturado ou semiestruturado. No estudo atual, foi utilizada a plataforma ServiceN owT M 2, que ´e uma plataforma propriet´aria e implementa o gerenciamento de processos de tecnologia com referˆencia no framework ITIL. A partir dela

1 A partir deste ponto, por simplicidade, usar-se-´a apenas tempo para execu¸ao do incidente 2 Informa¸oes detalhadas podem ser obtidas emhhttps://docs.servicenow.com/i

Figura 3 – Diagrama geral da solu¸c˜ao

Fonte: Claudio Aparecido Lira do Amaral, 2018

´

e realizada a extra¸c˜ao de dados do processo. Esses dados dizem respeito `as informa¸c˜oes sobre o registro do processo em estudo, nesse caso, o processo de incidentes (atributos descritivos - dados estruturados) e aos registros do log de auditoria da ferramenta (log de eventos referentes ao uso da ferramenta no processo de gerenciamento de incidentes - dados n˜ao estruturados). Sobre esses dois conjuntos de dados ´e executado um conjunto de fun¸c˜oes de pr´e-processamento que permitem a gera¸c˜ao de um log de eventos enriquecido e correspondem a um “log de incidentes”. Esse log viabiliza a implementa¸c˜ao da tarefa de minera¸c˜ao de processos (neste trabalho, predi¸c˜ao de tempo de execu¸c˜ao do incidente) e os procedimentos de sele¸c˜ao de atributos.

O principal interesse do trabalho est´a concentrado na melhoria dos resultados referentes `a estimativa de tempo para execu¸c˜ao de um processo at´e sua conclus˜ao. Isto envolve a aplica¸c˜ao da funcionalidade de constru¸c˜ao do modelo de predi¸c˜ao. Neste trabalho o modelo utilizado ´e o STA e tem a finalidade de fornecer as estimativas de tempo para conclus˜ao. Ele ´e gerado3 conforme as defini¸c˜oes de literatura citadas no

cap´ıtulo 2. Entretanto, a depender de como um processo ´e descrito, e do qu˜ao refinada ou detalhada ´e essa descri¸c˜ao, o modelo resultante pode oferecer estimativas muito diferentes e pouco precisas (demonstrado nos testes da se¸c˜ao 4.1.1). Desta forma, faz-se justific´avel o

estabelecimento de procedimentos para sele¸c˜ao de atributos que forne¸cam listas de atributos com potencial para minimizar tais diferen¸cas e aumentar as chances de melhorar a precis˜ao da predi¸c˜ao obtida com os modelos gerados. A sele¸c˜ao de atributos foi implementada neste trabalho de forma orientada pelo especialista e a partir da aplica¸c˜ao de t´ecnicas de sele¸c˜ao de atributos (se¸c˜ao2.2) do tipo filtro e do tipo inv´olucro.

Na sele¸c˜ao orientada pelo especialista, o especialista usa o seu conhecimento sobre o processo de neg´ocio associado (neste caso, o gerenciamento de incidentes) para escolher os atributos que entende serem os melhores para descrever o processo (incidentes) com fins de predi¸c˜ao do seu tempo de execu¸c˜ao. Ent˜ao, o modelo (STA) ´e constru´ıdo com base no conjunto de atributos selecionado pelo especialista, e as predi¸c˜oes podem ser realizadas e avaliadas.

A sele¸c˜ao por filtro utiliza o conceito de correla¸c˜ao entre os atributos independen- tes e o atributo dependente para cria¸c˜ao de um “ranking” ordenado do mais correlacionado para o menos correlacionado. Deste modo, ´e poss´ıvel ter informa¸c˜oes para decidir sobre a relevˆancia de um subconjunto proposto. Ap´os a escolha dos atributos a serem utilizados, os subconjuntos de atributos s˜ao criados de modo a utilizar a sequˆencia do mais relevante para o menos relevante. A estrat´egia segue ent˜ao da mesma maneira que no caso da sele¸c˜ao orientada pelo especialista com a constru¸c˜ao dos modelos de predi¸c˜ao para cada um dos subconjuntos definidos.

Na sele¸c˜ao por inv´olucro, o modelo (STA), constru´ıdo com um subconjunto de atributos sugerido por um processo de busca, ´e utilizado para gerar predi¸c˜oes cujas acur´acias conduzir˜ao `a sele¸c˜ao de um subconjunto ´otimo ou sub-´otimo de atributos. A partir de diferentes listas de atributos, modelos podem ser gerados e suas estat´ısticas de tempo de execu¸c˜ao de instˆancias de processos podem ser avaliadas. Seguindo o fluxo de trabalho proposto no diagrama da figura3para a sele¸c˜ao por inv´olucro, essa avalia¸c˜ao retro-alimenta o processo de sele¸c˜ao de atributos, proporcionando a melhoria do processo de sele¸c˜ao de atributos. Para implementar a sele¸c˜ao por inv´olucro, foram usadas as estrat´egias de buscas heur´ısticas subida de encost a e primeira-melhora e a estrat´egia de busca meta-heur´ıstica com algoritmos gen´eticos. As caracter´ısticas espec´ıficas de cada m´etodo s˜ao fornecidas na se¸c˜ao 2.2. De maneira pr´atica, a ideia b´asica ´e que o modelo de predi¸c˜ao possa ser gerado a partir de um subconjunto de atributos que descreve adequadamente os casos conclu´ıdos. A partir deste ponto, esse modelo pode ser aplicado para prever o tempo para conclus˜ao dos novos casos – incidentes, no processo em quest˜ao.

Vale ressaltar que, embora uma estrat´egia gen´erica para sele¸c˜ao de atributos esteja sendo buscada, o processo de gerenciamento de incidentes ´e usado neste trabalho como um ambiente de testes, principalmente por ser um gerenciamento cr´ıtico em rela¸c˜ao a tempo. A solu¸c˜ao proposta neste trabalho pode ser utilizada em outros tipos de processos, desde que respeitadas as defini¸c˜oes de utiliza¸c˜ao em processos estruturados ou semi-estruturados e que tenham uma vari´avel dependente cont´ınua relacionado ao tempo (com alguns ajustes, poderia ser utilizados com vari´aveis dependentes categ´oricas).

No processo de gerenciamento de incidentes ´e recomendada a distribui¸c˜ao do tratamento de um incidente de acordo com v´arias informa¸c˜oes: fases do processo de tratamento, perfil dos recursos humanos envolvidos, conhecimento t´ecnico exigido no tratamento, etc. Todas essas informa¸c˜oes geram um grande conjunto de atributos associados aos registros dos incidentes, e ´e invi´avel usar todos eles na gera¸c˜ao dos sistemas de transi¸c˜ao, visto que os logs de eventos tornam-se muito grandes e tais sistemas assumem alto grau de ramifica¸c˜ao. Um outro comportamento observado ´e que as instˆancias de processos tornam- se muito espec´ıficas causando um problema de superajuste para as estimativas. Assim, a quest˜ao de criticidade e necessidade de estimativas de tempo precisas (minimiza¸c˜ao de estat´ısticas de acur´acia e seus respectivos desvios-padr˜ao) e a presen¸ca de v´arios atributos gerando numerosas possibilidades de combina¸c˜oes nas instˆancias de processos proporcionam um ambiente adequado para a valida¸c˜ao da estrat´egia de sele¸c˜ao constru´ıda neste trabalho.