[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Outros |
Idioma: | eng |
Título da fonte: | Repositório Institucional da PUC-RIO (Projeto Maxwell) |
Texto Completo: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2 http://doi.org/10.17771/PUCRio.acad.65993 |
Resumo: | [pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada. |
id |
PUC_RIO-1_96a33b529e196dc5bb87f486c600e178 |
---|---|
oai_identifier_str |
oai:MAXWELL.puc-rio.br:65993 |
network_acronym_str |
PUC_RIO-1 |
network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository_id_str |
534 |
spelling |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS [pt] PÓS-PROCESSAMENTO DE FATORAÇÃO BINÁRIA DE MATRIZES E APLICAÇÕES [pt] MINERACAO DE PROCESSOS[pt] FATORACAO DE MATRIZES NAO NEGATIVAS[pt] FATORACAO DE MATRIZES BINARIAS[en] PROCESS MINING[en] NON-NEGATIVE MATRIX FACTORIZATION[en] BINARY MATRIX FACTORIZATION[pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada.[en] Novel methods for matrix factorization introduce constraints to the decomposed matrices, allowing for unique kinds of analysis. One significant modification is the binary matrix factorization for binary matrices. This technique can reveal common subsets and mixing of subsets, making it useful in a variety of applications, such as market basket analysis, topic modeling, and recommendation systems. Despite the advantages, current approaches face a trade-off between accuracy, scalability, and explainability. While gradient descent-based methods are scalable, they yield high reconstruction errors when thresholded for binary matrices. Conversely, heuristic methods are not scalable. To overcome this, this thesis propose a post-processing procedure for discretizing matrices obtained by gradient descent. This novel approach recovers the reconstruction error post-thresholding and successfully processes larger matrices within a reasonable timeframe. We apply this technique to many applications including a novel pipeline for discovering and visualizing patterns in petrochemical batch processes. MAXWELLHELIO CORTES VIEIRA LOPESGEORGES MIRANDA SPYRIDES2024-02-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2http://doi.org/10.17771/PUCRio.acad.65993engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2024-02-06T00:00:00Zoai:MAXWELL.puc-rio.br:65993Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342024-02-06T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
dc.title.none.fl_str_mv |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS [pt] PÓS-PROCESSAMENTO DE FATORAÇÃO BINÁRIA DE MATRIZES E APLICAÇÕES |
title |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS |
spellingShingle |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS GEORGES MIRANDA SPYRIDES [pt] MINERACAO DE PROCESSOS [pt] FATORACAO DE MATRIZES NAO NEGATIVAS [pt] FATORACAO DE MATRIZES BINARIAS [en] PROCESS MINING [en] NON-NEGATIVE MATRIX FACTORIZATION [en] BINARY MATRIX FACTORIZATION |
title_short |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS |
title_full |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS |
title_fullStr |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS |
title_full_unstemmed |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS |
title_sort |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS |
author |
GEORGES MIRANDA SPYRIDES |
author_facet |
GEORGES MIRANDA SPYRIDES |
author_role |
author |
dc.contributor.none.fl_str_mv |
HELIO CORTES VIEIRA LOPES |
dc.contributor.author.fl_str_mv |
GEORGES MIRANDA SPYRIDES |
dc.subject.por.fl_str_mv |
[pt] MINERACAO DE PROCESSOS [pt] FATORACAO DE MATRIZES NAO NEGATIVAS [pt] FATORACAO DE MATRIZES BINARIAS [en] PROCESS MINING [en] NON-NEGATIVE MATRIX FACTORIZATION [en] BINARY MATRIX FACTORIZATION |
topic |
[pt] MINERACAO DE PROCESSOS [pt] FATORACAO DE MATRIZES NAO NEGATIVAS [pt] FATORACAO DE MATRIZES BINARIAS [en] PROCESS MINING [en] NON-NEGATIVE MATRIX FACTORIZATION [en] BINARY MATRIX FACTORIZATION |
description |
[pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-02-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/other |
format |
other |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2 http://doi.org/10.17771/PUCRio.acad.65993 |
url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2 http://doi.org/10.17771/PUCRio.acad.65993 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
MAXWELL |
publisher.none.fl_str_mv |
MAXWELL |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
instacron_str |
PUC_RIO |
institution |
PUC_RIO |
reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
repository.mail.fl_str_mv |
|
_version_ |
1814822644792426496 |