Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/001300000104x |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/40071 |
Resumo: | Nos últimos anos, desenvolveu-se uma disciplina denominada mineração de processos, cujo objetivo é ajudar a descobrir e analisar processos de negócios através da exploração de informações não triviais oriundas de sistemas de informações (logs de eventos). A mineração de processos vem avançando rapidamente, mas ainda existem importantes desafios que influenciam no seu resultado. Um dos desafios é lidar com diferentes níveis de granularidade nos eventos registrados. Em certas circunstâncias, deseja-se visualizar o processo em um nível de abstração diferente do modelado. Contudo, no atual cenário da mineração de processos, essa transformação precisa ser realizada no pré-processamento dos dados, sendo custosa e exigindo conhecimento abrangente sobre o negócio. Conduzimos estudos exploratórios que nos permitiram identificar meios de alterar a granularidade dos eventos e propusemos duas abordagens para este fim. As abordagens propostas transformam automaticamente os logs de eventos através do agrupamento de eventos de atividades afins. Com isso, proporcionam uma visão alternativa para o processo e uma significativa redução de tamanho dos logs de eventos. Outro problema tratado nesta tese diz respeito à incidência de atividades recorrentes nos logs de eventos. Estas atividades ocorrem em diversas fases do processo (contextos de negócio), propiciando modelos mais difíceis de interpretar. Propusemos uma abordagem de pré processamento de log de eventos que identifica e trata as atividades recorrentes. O tratamento consiste em desmembrar as atividades recorrentes a partir dos contextos de negócios aos quais as atividades estão vinculadas. Os estudos conduzidos mostraram que os modelos de processos descoberto a partir de logs de eventos transformados pelas abordagens propostas apresentaram qualidade superior no tocante ao fitness, bem como em algumas medidas de simplicidade. Cabe ressaltar que todas as abordagens dessa tese de doutorado foram avaliadas através de estudos com logs de eventos reais. |
id |
UFPE_2695574405065303a39809be1740b54c |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/40071 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
D'CASTRO, Raphael Joséhttp://lattes.cnpq.br/8050676848021920http://lattes.cnpq.br/5194381227316437OLIVEIRA, Adriano Lorena Inacio de2021-05-13T17:33:30Z2021-05-13T17:33:30Z2020-11-04D'CASTRO, Raphael José. Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos. 2020. Tese (Doutorado em Ciências da Computação) - Universidade Federal de Pernambuco, Recife, 2020.https://repositorio.ufpe.br/handle/123456789/40071ark:/64986/001300000104xNos últimos anos, desenvolveu-se uma disciplina denominada mineração de processos, cujo objetivo é ajudar a descobrir e analisar processos de negócios através da exploração de informações não triviais oriundas de sistemas de informações (logs de eventos). A mineração de processos vem avançando rapidamente, mas ainda existem importantes desafios que influenciam no seu resultado. Um dos desafios é lidar com diferentes níveis de granularidade nos eventos registrados. Em certas circunstâncias, deseja-se visualizar o processo em um nível de abstração diferente do modelado. Contudo, no atual cenário da mineração de processos, essa transformação precisa ser realizada no pré-processamento dos dados, sendo custosa e exigindo conhecimento abrangente sobre o negócio. Conduzimos estudos exploratórios que nos permitiram identificar meios de alterar a granularidade dos eventos e propusemos duas abordagens para este fim. As abordagens propostas transformam automaticamente os logs de eventos através do agrupamento de eventos de atividades afins. Com isso, proporcionam uma visão alternativa para o processo e uma significativa redução de tamanho dos logs de eventos. Outro problema tratado nesta tese diz respeito à incidência de atividades recorrentes nos logs de eventos. Estas atividades ocorrem em diversas fases do processo (contextos de negócio), propiciando modelos mais difíceis de interpretar. Propusemos uma abordagem de pré processamento de log de eventos que identifica e trata as atividades recorrentes. O tratamento consiste em desmembrar as atividades recorrentes a partir dos contextos de negócios aos quais as atividades estão vinculadas. Os estudos conduzidos mostraram que os modelos de processos descoberto a partir de logs de eventos transformados pelas abordagens propostas apresentaram qualidade superior no tocante ao fitness, bem como em algumas medidas de simplicidade. Cabe ressaltar que todas as abordagens dessa tese de doutorado foram avaliadas através de estudos com logs de eventos reais.Process mining is an emerging discipline that helps discover and analyze business processes by exploring non-trivial information from information systems records (event logs). Process mining is advancing rapidly, but there are still critical challenges that influence its results. One of the challenges is dealing with different levels of granularity in registered events. In certain circumstances, we want to see the process at a different abstraction level than in the process modeled. However, in the current process mining scenario, this transformation must occur in the data pre processing, being costly, and requiring knowledge about the business. Exploratory studies allowed us to identify ways to change the granularity of events and proposed two approaches for this purpose. Our techniques automatically transform event logs by grouping events from related activities, providing an alternative view of the process and a significant reduction in the event logs' size. Another problem addressed in this thesis concerns the incidence of recurring activities in the event logs. These activities occur at different stages of the process (business contexts), providing models that are more difficult to interpret. We proposed an event log pre-processing approach that identifies and handles recurring activities. The treatment consists of breaking up recurring activities from the business contexts to which the activities are linked. The studies showed that the processes models discovered from event logs transformed by the approaches proposed have superior fitness and better simplicity measures. The studies and evaluations performed in this Ph.D. thesis used real event logs.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência ComputacionalMineração de processosPré-processamento de logs de eventosSimplificação de Log de eventosPré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETEXTTESE Raphael José D’castro.pdf.txtTESE Raphael José D’castro.pdf.txtExtracted texttext/plain355948https://repositorio.ufpe.br/bitstream/123456789/40071/4/TESE%20Raphael%20Jos%c3%a9%20D%e2%80%99castro.pdf.txtad17258238e6e10bbf4f6d3fb3aae1f4MD54THUMBNAILTESE Raphael José D’castro.pdf.jpgTESE Raphael José D’castro.pdf.jpgGenerated Thumbnailimage/jpeg1313https://repositorio.ufpe.br/bitstream/123456789/40071/5/TESE%20Raphael%20Jos%c3%a9%20D%e2%80%99castro.pdf.jpg77d52a834ae0ec71409e59806e208410MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/40071/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/40071/3/license.txtbd573a5ca8288eb7272482765f819534MD53ORIGINALTESE Raphael José D’castro.pdfTESE Raphael José D’castro.pdfapplication/pdf7893281https://repositorio.ufpe.br/bitstream/123456789/40071/1/TESE%20Raphael%20Jos%c3%a9%20D%e2%80%99castro.pdfe34f965a8e6d907ca3a3b39e4e1ec2f0MD51123456789/400712021-05-14 02:17:01.516oai:repositorio.ufpe.br:123456789/40071TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212021-05-14T05:17:01Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos |
title |
Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos |
spellingShingle |
Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos D'CASTRO, Raphael José Inteligência Computacional Mineração de processos Pré-processamento de logs de eventos Simplificação de Log de eventos |
title_short |
Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos |
title_full |
Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos |
title_fullStr |
Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos |
title_full_unstemmed |
Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos |
title_sort |
Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos |
author |
D'CASTRO, Raphael José |
author_facet |
D'CASTRO, Raphael José |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/8050676848021920 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5194381227316437 |
dc.contributor.author.fl_str_mv |
D'CASTRO, Raphael José |
dc.contributor.advisor1.fl_str_mv |
OLIVEIRA, Adriano Lorena Inacio de |
contributor_str_mv |
OLIVEIRA, Adriano Lorena Inacio de |
dc.subject.por.fl_str_mv |
Inteligência Computacional Mineração de processos Pré-processamento de logs de eventos Simplificação de Log de eventos |
topic |
Inteligência Computacional Mineração de processos Pré-processamento de logs de eventos Simplificação de Log de eventos |
description |
Nos últimos anos, desenvolveu-se uma disciplina denominada mineração de processos, cujo objetivo é ajudar a descobrir e analisar processos de negócios através da exploração de informações não triviais oriundas de sistemas de informações (logs de eventos). A mineração de processos vem avançando rapidamente, mas ainda existem importantes desafios que influenciam no seu resultado. Um dos desafios é lidar com diferentes níveis de granularidade nos eventos registrados. Em certas circunstâncias, deseja-se visualizar o processo em um nível de abstração diferente do modelado. Contudo, no atual cenário da mineração de processos, essa transformação precisa ser realizada no pré-processamento dos dados, sendo custosa e exigindo conhecimento abrangente sobre o negócio. Conduzimos estudos exploratórios que nos permitiram identificar meios de alterar a granularidade dos eventos e propusemos duas abordagens para este fim. As abordagens propostas transformam automaticamente os logs de eventos através do agrupamento de eventos de atividades afins. Com isso, proporcionam uma visão alternativa para o processo e uma significativa redução de tamanho dos logs de eventos. Outro problema tratado nesta tese diz respeito à incidência de atividades recorrentes nos logs de eventos. Estas atividades ocorrem em diversas fases do processo (contextos de negócio), propiciando modelos mais difíceis de interpretar. Propusemos uma abordagem de pré processamento de log de eventos que identifica e trata as atividades recorrentes. O tratamento consiste em desmembrar as atividades recorrentes a partir dos contextos de negócios aos quais as atividades estão vinculadas. Os estudos conduzidos mostraram que os modelos de processos descoberto a partir de logs de eventos transformados pelas abordagens propostas apresentaram qualidade superior no tocante ao fitness, bem como em algumas medidas de simplicidade. Cabe ressaltar que todas as abordagens dessa tese de doutorado foram avaliadas através de estudos com logs de eventos reais. |
publishDate |
2020 |
dc.date.issued.fl_str_mv |
2020-11-04 |
dc.date.accessioned.fl_str_mv |
2021-05-13T17:33:30Z |
dc.date.available.fl_str_mv |
2021-05-13T17:33:30Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
D'CASTRO, Raphael José. Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos. 2020. Tese (Doutorado em Ciências da Computação) - Universidade Federal de Pernambuco, Recife, 2020. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/40071 |
dc.identifier.dark.fl_str_mv |
ark:/64986/001300000104x |
identifier_str_mv |
D'CASTRO, Raphael José. Pré-processamento para mineração de processos : técnicas para simplificação automática de logs de eventos. 2020. Tese (Doutorado em Ciências da Computação) - Universidade Federal de Pernambuco, Recife, 2020. ark:/64986/001300000104x |
url |
https://repositorio.ufpe.br/handle/123456789/40071 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/40071/4/TESE%20Raphael%20Jos%c3%a9%20D%e2%80%99castro.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/40071/5/TESE%20Raphael%20Jos%c3%a9%20D%e2%80%99castro.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/40071/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/40071/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/40071/1/TESE%20Raphael%20Jos%c3%a9%20D%e2%80%99castro.pdf |
bitstream.checksum.fl_str_mv |
ad17258238e6e10bbf4f6d3fb3aae1f4 77d52a834ae0ec71409e59806e208410 e39d27027a6cc9cb039ad269a5db8e34 bd573a5ca8288eb7272482765f819534 e34f965a8e6d907ca3a3b39e4e1ec2f0 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172685661995008 |