Recentemente pesquisado

Nenhum resultado encontrado

Tags

Nenhum resultado encontrado

Documento

Nenhum resultado encontrado

Página inicial Escolas Tópicos

Entrar

An´ alise de impacto dos non-fitting

No documento Tratamento do impacto de casos non-fitting em predição de tempo de resolução usando mineração de processos com múltiplos atributos (páginas 65-70)

3.4 Fase 2: execu¸ c˜ ao do Experimento 1

3.4.3 An´ alise de impacto dos non-fitting

Os gráficos das figuras anteriores apresentaram os resultados da assertividade em fun¸cão dos modelos usando os atributos do ranking. Os próximos trarão a mesma informa¸cão, porém com a inclusão do percentual de casos que não puderam ser mapeados diretamente a um caminho existente dentro do sistema de transi¸cão anotado gerado na fase de treinamento. São portanto varia¸cões do processo de negócio para as quais o modelo não chegou a ser treinado.

O gráfico da figura 20 traz os resultados para o horizonte 1. Como previamente mencionado, uma vez que a representa¸cão nas três abstra¸cões de conjunto é a mesma quando o horizonte é 1, por simplifica¸cão estão no gráfico apenas os dados para sequência.

Como é poss´ıvel observar, o percentual de casos non-fitting aumenta muito rapi- damente, à medida em que os atributos são adicionados, a ponto de que quinto cenário ela já é de quase 90%. Visando facilitar a visualiza¸cão, o percentual de non-fitting está representado pela linha azul.

Resultados análogos podem ser observados para os demais horizontes, como visto nas figuras 21, 22 e 23 que trazem respectivamente os horizontes 3, 5 e 7. Os horizontes 6 e infinito são tão análogos ao horizonte 7 que se julgou desnecessário inclu´ı-los aqui. Porém, esse alto percentual de casos não encontrados não é necessariamente um problema. Concei- tualmente, é esperado que um bom modelo possua uma boa capacidade de generaliza¸cão.

Figura 20 – Exp. 1 - Erro de predi¸cão (RMSPE) (barras) e Percentual de Casos non-fitting (NF) (linha) no horizonte 1 para os 15 cenários (eixo horizontal), abstra¸cão

sequˆencia (SEQ)

Fonte: Alexandre Gastaldi Lopes Fernandes, 2019

Portanto, se o modelo é capaz de responder adequadamente a um conjunto de valida¸cão que difere quase que por completo dos dados a que foi exposto durante seu treinamento, essa é uma caracter´ıstica sem dúvida muito positiva. O problema reside justamente na questão do “adequadamente”. O que se espera realmente é que o modelo seja capaz de responder com uma assertividade que seja aceitável para o contexto em questão.

Figura 21 – Exp. 1 - Erro de predi¸cão (RMSPE) (barras) e Percentual de Casos non-fitting (NF) (linhas) no horizonte 3 para os 15 cenários (eixo horizontal), abstra¸cões

SET, MSET e SEQ

Figura 22 – Exp. 1 - Erro de predi¸cão (RMSPE) (barras) e Percentual de Casos non-fitting (NF) (linhas) no horizonte 5 para os 15 cenários (eixo horizontal), abstra¸cões

SET, MSET e SEQ

Fonte: Alexandre Gastaldi Lopes Fernandes, 2019

Figura 23 – Exp. 1 - Erro de predi¸cão (RMSPE) (barras) e Percentual de Casos non-fitting (NF) (linhas) no horizonte 7 para os 15 cenários (eixo horizontal), abstra¸cões

SET, MSET e SEQ

Fonte: Alexandre Gastaldi Lopes Fernandes, 2019

Na prática, o modelo sempre irá responder com uma predi¸cão. Quando um caso em progresso é avaliado pelo modelo preditivo e o mesmo identifica que se trata de um caminho conhecido, a probabilidade de que a predi¸cão seja mais precisa é maior. Mas

quando se trata de um caso non-fitting, essa assertividade dependerá do tratamento que se dá quando ocorre essa situa¸cão.

O próximo passo da avalia¸cão consistiu então em dividir os casos fitted dos casos non-fitting e obter-se o erro de predi¸cão para esses cenários em separado. Para isso, foi utilizado um subconjunto reduzido dos dados, contendo 8.000 casos, sendo 6.400 casos para treinamento e 1.600 casos para a valida¸cão. Os resultados dessa análise podem ser visualizados nos gráficos das figuras 24 e 25, que trazem respectivamente os números para os horizontes 3 e 5. Explicando melhor o gráfico, apenas as medi¸cões do erro usando RMSPE para os cenários com dois até dez atributos foram inclu´ıdas pois se por um lado o objetivo é discutir o cenário de múltiplos atributos, por outro o que foi verificado é que a partir do décimo atributo os valores são realmente muito próximos, não agregando informa¸cões novas para essa análise. Para cada um dos cenários (CEN. 2 até CEN. 10), as três primeiras colunas trazem os resultados para todo o conjunto de valida¸cão, para SET, MSET e SEQ. As próximas três colunas trazem os erros de predi¸cão considerando apenas os casos fitted, ou seja, que seguiram o mesmo processo que casos aos quais o modelo foi exposto durante o treinamento. Finalmente, as últimas três colunas trazem os erros de predi¸cão considerando apenas os casos non-fitting.

Observando-se o gráfico da figura 24 é poss´ıvel perceber que a partir do sexto atributo, o erro da predi¸cão aumenta bastante, assim como o erro para os casos non-fitting. Esse comportamento se confirma para o horizonte 5 também (Figura 25), no qual isso já é vis´ıvel a partir do cenário 3, para as abstra¸cões MSET e SEQ. Dado o volume desses casos nesses cenários apresentado nos gráficos das figuras 20 a 23, fica claro o quanto a assertividade para esses casos impacta a assertividade geral do modelo. Outro cenário em que essa rela¸cão fica evidente é para a abstra¸cão SET, no qual tanto a assertividade para os casos non-fitting quanto a assertividade geral tiveram o mesmo padrão até o cenário oito. O comportamento observado para o horizonte 5 se repete também nos horizontes 6, 7 e infinito, com varia¸cões muito pequenas, razão pela qual optou-se por não incluir os respectivos gráficos.

Figura 24 – Exp. 1 - Erro de predi¸c˜ao (RMSPE) para cen´arios 2 a 10 no horizonte 3 em subconjunto parcial (8.000 casos) para SET, MSET e SEQ; “Sem NF”: RMSPE apenas dos casos fitted ; “Somente NF”: RMSPE apenas dos casos non-fitting

Fonte: Alexandre Gastaldi Lopes Fernandes, 2019

Figura 25 – Exp. 1 - Erro de predi¸c˜ao (RMSPE) para cen´arios 2 a 10 no horizonte 5 em subconjunto parcial (8.000 casos) para SET, MSET e SEQ; “Sem NF”: RMSPE apenas dos casos fitted ; “Somente NF”: RMSPE apenas dos casos non-fitting

Fonte: Alexandre Gastaldi Lopes Fernandes, 2019

Essas observa¸cões confirmaram que o método necessitava lidar melhor com os casos non-fitting, adotando alguma estratégia que pudesse melhorar a assertividade da predi¸cão

para esses casos em espec´ıfico, e como consequência, para o modelo como um todo. A próxima se¸cão detalha essa parte do trabalho.

No documento Tratamento do impacto de casos non-fitting em predição de tempo de resolução usando mineração de processos com múltiplos atributos (páginas 65-70)

Descarregar agora "Tratamento do impacto ..."

Outline

Documentos relacionados