[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS

Detalhes bibliográficos
Autor(a) principal: GEORGES MIRANDA SPYRIDES
Data de Publicação: 2024
Tipo de documento: Outros
Idioma: eng
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2
http://doi.org/10.17771/PUCRio.acad.65993
Resumo: [pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada.
id PUC_RIO-1_96a33b529e196dc5bb87f486c600e178
oai_identifier_str oai:MAXWELL.puc-rio.br:65993
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS [pt] PÓS-PROCESSAMENTO DE FATORAÇÃO BINÁRIA DE MATRIZES E APLICAÇÕES [pt] MINERACAO DE PROCESSOS[pt] FATORACAO DE MATRIZES NAO NEGATIVAS[pt] FATORACAO DE MATRIZES BINARIAS[en] PROCESS MINING[en] NON-NEGATIVE MATRIX FACTORIZATION[en] BINARY MATRIX FACTORIZATION[pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada.[en] Novel methods for matrix factorization introduce constraints to the decomposed matrices, allowing for unique kinds of analysis. One significant modification is the binary matrix factorization for binary matrices. This technique can reveal common subsets and mixing of subsets, making it useful in a variety of applications, such as market basket analysis, topic modeling, and recommendation systems. Despite the advantages, current approaches face a trade-off between accuracy, scalability, and explainability. While gradient descent-based methods are scalable, they yield high reconstruction errors when thresholded for binary matrices. Conversely, heuristic methods are not scalable. To overcome this, this thesis propose a post-processing procedure for discretizing matrices obtained by gradient descent. This novel approach recovers the reconstruction error post-thresholding and successfully processes larger matrices within a reasonable timeframe. We apply this technique to many applications including a novel pipeline for discovering and visualizing patterns in petrochemical batch processes. MAXWELLHELIO CORTES VIEIRA LOPESGEORGES MIRANDA SPYRIDES2024-02-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2http://doi.org/10.17771/PUCRio.acad.65993engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2024-02-06T00:00:00Zoai:MAXWELL.puc-rio.br:65993Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342024-02-06T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
[pt] PÓS-PROCESSAMENTO DE FATORAÇÃO BINÁRIA DE MATRIZES E APLICAÇÕES
title [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
spellingShingle [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
GEORGES MIRANDA SPYRIDES
[pt] MINERACAO DE PROCESSOS
[pt] FATORACAO DE MATRIZES NAO NEGATIVAS
[pt] FATORACAO DE MATRIZES BINARIAS
[en] PROCESS MINING
[en] NON-NEGATIVE MATRIX FACTORIZATION
[en] BINARY MATRIX FACTORIZATION
title_short [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
title_full [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
title_fullStr [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
title_full_unstemmed [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
title_sort [en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
author GEORGES MIRANDA SPYRIDES
author_facet GEORGES MIRANDA SPYRIDES
author_role author
dc.contributor.none.fl_str_mv HELIO CORTES VIEIRA LOPES
dc.contributor.author.fl_str_mv GEORGES MIRANDA SPYRIDES
dc.subject.por.fl_str_mv [pt] MINERACAO DE PROCESSOS
[pt] FATORACAO DE MATRIZES NAO NEGATIVAS
[pt] FATORACAO DE MATRIZES BINARIAS
[en] PROCESS MINING
[en] NON-NEGATIVE MATRIX FACTORIZATION
[en] BINARY MATRIX FACTORIZATION
topic [pt] MINERACAO DE PROCESSOS
[pt] FATORACAO DE MATRIZES NAO NEGATIVAS
[pt] FATORACAO DE MATRIZES BINARIAS
[en] PROCESS MINING
[en] NON-NEGATIVE MATRIX FACTORIZATION
[en] BINARY MATRIX FACTORIZATION
description [pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada.
publishDate 2024
dc.date.none.fl_str_mv 2024-02-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/other
format other
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2
http://doi.org/10.17771/PUCRio.acad.65993
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2
http://doi.org/10.17771/PUCRio.acad.65993
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1814822644792426496