Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/100/100131/tde-04052022-215626/ |
Resumo: | A mineração de processos é uma área que visa a usar dados de eventos para extrair informação útil sobre os processos subjacentes a esses eventos. A sua principal tarefa é a descoberta de modelos de processos, cujo objetivo é criar um modelo que represente o comportamento real dos processos da organização. No entanto, essa tarefa é dificultada pela existência de comportamentos anômalos nos processos, que se reflete nos logs de eventos da organização. Por um lado, a tarefa da detecção dessas anomalias é importante porque podem ser sinais de fraudes ou erros nos sistemas de informação, assim, a organização pode tomar decisões com base nessas detecções. Por outro lado, a tarefa do tratamento ou remoção delas é fundamental para a melhoria da descoberta de modelos de processos. Existem diversos tipos de abordagens para a detecção de anomalias em logs de eventos, entre elas as abordagens baseadas em redes neurais e as baseadas em contagem. Na literatura, algumas dessas abordagens são parte do estado da arte da detecção de anomalias porém não foram utilizadas no tratamento ou remoção de anomalias para a melhoria da descoberta de modelos. Outras abordagens são parte do estado da arte em relação ao tratamento ou remoção de anomalias para melhorar a descoberta, porém não foram avaliadas na tarefa da detecção de anomalias. Assim, existe uma lacuna entre essas duas tarefas que foi abordada pela presente pesquisa por meio de um estudo comparativo abrangente. O objetivo da presente pesquisa foi identificar quais abordagens são adequadas para a detecção de três tipos de anomalias (atividade faltante, inserção de atividade, troca de atividades), levando em consideração as suas capacidades para realizar as duas tarefas mencionadas. O estudo foi realizado por meio de análises quantitativas e qualitativas aplicadas sobre trinta logs de eventos sintéticos. Essas análises permitiram expor as vantagens, desvantagens e limitações das abordagens sob a presença de cada tipo de anomalia no log. Foi encontrado que algumas abordagens não lidaram bem com dois desafios: classificação de casos cujos traces são normais e infrequentes e classificação de casos que executam comportamento de loop. Também foi estudado quais abordagens lidam melhor com esses desafios. O estudo comparativo realizado é importante para a mineração de processos pois pode fornecer embasamento para que as organizações decidam utilizar uma ou outra abordagem de acordo às características específicas do seu problema |
id |
USP_08df94df334a233fd14095061550b10d |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-04052022-215626 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagemAnomaly detection in business process event logs: an comparative study between neural networks-based and count-based approachesAprendizado de máquinaArtificial neural networksAutoencodersAutoencodersBusiness Process ManagementData miningDescoberta de processosDetecção de anomaliasGerenciamento de processos de negócioMachine learningMineração de dadosMineração de processosOutlier detectionProcess discoveryProcess miningRedes neurais artificiaisA mineração de processos é uma área que visa a usar dados de eventos para extrair informação útil sobre os processos subjacentes a esses eventos. A sua principal tarefa é a descoberta de modelos de processos, cujo objetivo é criar um modelo que represente o comportamento real dos processos da organização. No entanto, essa tarefa é dificultada pela existência de comportamentos anômalos nos processos, que se reflete nos logs de eventos da organização. Por um lado, a tarefa da detecção dessas anomalias é importante porque podem ser sinais de fraudes ou erros nos sistemas de informação, assim, a organização pode tomar decisões com base nessas detecções. Por outro lado, a tarefa do tratamento ou remoção delas é fundamental para a melhoria da descoberta de modelos de processos. Existem diversos tipos de abordagens para a detecção de anomalias em logs de eventos, entre elas as abordagens baseadas em redes neurais e as baseadas em contagem. Na literatura, algumas dessas abordagens são parte do estado da arte da detecção de anomalias porém não foram utilizadas no tratamento ou remoção de anomalias para a melhoria da descoberta de modelos. Outras abordagens são parte do estado da arte em relação ao tratamento ou remoção de anomalias para melhorar a descoberta, porém não foram avaliadas na tarefa da detecção de anomalias. Assim, existe uma lacuna entre essas duas tarefas que foi abordada pela presente pesquisa por meio de um estudo comparativo abrangente. O objetivo da presente pesquisa foi identificar quais abordagens são adequadas para a detecção de três tipos de anomalias (atividade faltante, inserção de atividade, troca de atividades), levando em consideração as suas capacidades para realizar as duas tarefas mencionadas. O estudo foi realizado por meio de análises quantitativas e qualitativas aplicadas sobre trinta logs de eventos sintéticos. Essas análises permitiram expor as vantagens, desvantagens e limitações das abordagens sob a presença de cada tipo de anomalia no log. Foi encontrado que algumas abordagens não lidaram bem com dois desafios: classificação de casos cujos traces são normais e infrequentes e classificação de casos que executam comportamento de loop. Também foi estudado quais abordagens lidam melhor com esses desafios. O estudo comparativo realizado é importante para a mineração de processos pois pode fornecer embasamento para que as organizações decidam utilizar uma ou outra abordagem de acordo às características específicas do seu problemaProcess mining aims to use event data to obtain useful information about the processes related to these events. Its main task is process discovery, that aims to create a model that represents behavior occurring in the organizations processes. However, anomaly behaviour occurring in processes makes process discovery challenging, because anomalies impact event logs. On the one hand, the anomalies detection task is important because they can indicate fraud or errors in information systems, thus, the organization can make decisions based on these detections. On the other hand, the anomalies treatment/filtering task is essential to improve process discovery. There are several approaches for anomaly detection in event logs, including neural networks-based and count-based approaches. In the literature, some of those are state-of-the-art approaches in anomaly detection but have not been evaluated for the treatment/removal of anomalies aiming to improve model discovery. Also, some state-of-the-art approaches for the treatment/removal of anomalies aiming to improve discovery have not been evaluated in the anomaly detection task. Therefore, there is a gap between these two tasks. That gap was addressed in this research through a comprehensive comparative study. The goal of this research was to identify which approaches are suitable for the detection of three types of anomalies (skipping activity, activity insertion, activity switching), considering their capabilities to perform the two tasks. This research was carried out through quantitative and qualitative analyzes applied to thirty artificial events logs. These analyzes showed the advantages, disadvantages and limitations of the approaches under the presence of three types of anomalies in the event log. It was found that some approaches did not handle two challenges effectively: classifying normal cases whose traces are infrequent, and classifying cases that execute loop behavior. Furthermore, in this research was studied which approaches best deal with these challenges. This comparative study is important for process mining as it can provide a basis for organizations to decide to use one or another approach according to specific characteristics of their problemBiblioteca Digitais de Teses e Dissertações da USPPeres, Sarajane MarquesRojas Krugger, Esther María 2022-03-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-04052022-215626/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T13:16:04Zoai:teses.usp.br:tde-04052022-215626Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T13:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem Anomaly detection in business process event logs: an comparative study between neural networks-based and count-based approaches |
title |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem |
spellingShingle |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem Rojas Krugger, Esther María Aprendizado de máquina Artificial neural networks Autoencoders Autoencoders Business Process Management Data mining Descoberta de processos Detecção de anomalias Gerenciamento de processos de negócio Machine learning Mineração de dados Mineração de processos Outlier detection Process discovery Process mining Redes neurais artificiais |
title_short |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem |
title_full |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem |
title_fullStr |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem |
title_full_unstemmed |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem |
title_sort |
Detecção de anomalias em logs de eventos de processos de negócio: um estudo comparativo entre abordagens baseadas em redes neurais e baseadas em contagem |
author |
Rojas Krugger, Esther María |
author_facet |
Rojas Krugger, Esther María |
author_role |
author |
dc.contributor.none.fl_str_mv |
Peres, Sarajane Marques |
dc.contributor.author.fl_str_mv |
Rojas Krugger, Esther María |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Artificial neural networks Autoencoders Autoencoders Business Process Management Data mining Descoberta de processos Detecção de anomalias Gerenciamento de processos de negócio Machine learning Mineração de dados Mineração de processos Outlier detection Process discovery Process mining Redes neurais artificiais |
topic |
Aprendizado de máquina Artificial neural networks Autoencoders Autoencoders Business Process Management Data mining Descoberta de processos Detecção de anomalias Gerenciamento de processos de negócio Machine learning Mineração de dados Mineração de processos Outlier detection Process discovery Process mining Redes neurais artificiais |
description |
A mineração de processos é uma área que visa a usar dados de eventos para extrair informação útil sobre os processos subjacentes a esses eventos. A sua principal tarefa é a descoberta de modelos de processos, cujo objetivo é criar um modelo que represente o comportamento real dos processos da organização. No entanto, essa tarefa é dificultada pela existência de comportamentos anômalos nos processos, que se reflete nos logs de eventos da organização. Por um lado, a tarefa da detecção dessas anomalias é importante porque podem ser sinais de fraudes ou erros nos sistemas de informação, assim, a organização pode tomar decisões com base nessas detecções. Por outro lado, a tarefa do tratamento ou remoção delas é fundamental para a melhoria da descoberta de modelos de processos. Existem diversos tipos de abordagens para a detecção de anomalias em logs de eventos, entre elas as abordagens baseadas em redes neurais e as baseadas em contagem. Na literatura, algumas dessas abordagens são parte do estado da arte da detecção de anomalias porém não foram utilizadas no tratamento ou remoção de anomalias para a melhoria da descoberta de modelos. Outras abordagens são parte do estado da arte em relação ao tratamento ou remoção de anomalias para melhorar a descoberta, porém não foram avaliadas na tarefa da detecção de anomalias. Assim, existe uma lacuna entre essas duas tarefas que foi abordada pela presente pesquisa por meio de um estudo comparativo abrangente. O objetivo da presente pesquisa foi identificar quais abordagens são adequadas para a detecção de três tipos de anomalias (atividade faltante, inserção de atividade, troca de atividades), levando em consideração as suas capacidades para realizar as duas tarefas mencionadas. O estudo foi realizado por meio de análises quantitativas e qualitativas aplicadas sobre trinta logs de eventos sintéticos. Essas análises permitiram expor as vantagens, desvantagens e limitações das abordagens sob a presença de cada tipo de anomalia no log. Foi encontrado que algumas abordagens não lidaram bem com dois desafios: classificação de casos cujos traces são normais e infrequentes e classificação de casos que executam comportamento de loop. Também foi estudado quais abordagens lidam melhor com esses desafios. O estudo comparativo realizado é importante para a mineração de processos pois pode fornecer embasamento para que as organizações decidam utilizar uma ou outra abordagem de acordo às características específicas do seu problema |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-03-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-04052022-215626/ |
url |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-04052022-215626/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256486824116224 |