A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks

Detalhes bibliográficos
Autor(a) principal: Katague, Gustavo Perez
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05032021-193406/
Resumo: Sum-Product Network (SPN) is a relatively new class of probabilistic graphical models. They differ from other probabilistic graphical models by allowing explicit representation of context-sensitive independence and marginal inference computation in linear time. Bayesian Networks and Markov Networks, for example, require #P-hard effort for performing marginal inference. However, it is still NP-hard to find the most probable configuration for a set of variables in an SPN, and there is currently a shortage of efficient techniques to solve the problem. A widely employed technique for solving NP-hard optimization problems consists in translating them into Mixed-Integer Linear Programming (MILP) programs, which hence can be solved by highly efficient commercial solvers. Besides harvesting the power of current solvers, formulating the problem as a MILP program immediately allows us to obtain an anytime algorithm that continuously improves its solution as more resources are given (time and memory), and can be stopped at any time with a feasible solution with error bounds. In this work, we developed a new algorithm that finds the most probable configuration for a set of variables in SPNs (Maximum A Posteriori inference) by reformulating it as a MILP program. This translation is rather intricate and relies on several results scattered throughout this field of study, such as the reformulation of SPNs as Bayesian Networks with latent variables, the compact representation of conditional probability tables through Algebraic Decision Diagrams and the symbolic manipulation of multilinear expressions by Parameterized Algebraic Decision Diagrams.
id USP_0595834963df95db9627ac8cb68f8782
oai_identifier_str oai:teses.usp.br:tde-05032021-193406
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product NetworksUma abordagem de reformulação à Programação Linear Inteira Mista para a inferência de Máximo A Posteriori em Redes Soma-ProdutoDiagramas de decisão algébrica parametrizadosInferência de máximo a posterioriMaximum a posteriori inferenceMixed-integer linear programmingModelos probabilísticos baseados em grafosParameterized algebraic decision diagramsProbabilistic graphical modelsProgramação linear inteira mistaRedes soma-produtoSum-product networksSum-Product Network (SPN) is a relatively new class of probabilistic graphical models. They differ from other probabilistic graphical models by allowing explicit representation of context-sensitive independence and marginal inference computation in linear time. Bayesian Networks and Markov Networks, for example, require #P-hard effort for performing marginal inference. However, it is still NP-hard to find the most probable configuration for a set of variables in an SPN, and there is currently a shortage of efficient techniques to solve the problem. A widely employed technique for solving NP-hard optimization problems consists in translating them into Mixed-Integer Linear Programming (MILP) programs, which hence can be solved by highly efficient commercial solvers. Besides harvesting the power of current solvers, formulating the problem as a MILP program immediately allows us to obtain an anytime algorithm that continuously improves its solution as more resources are given (time and memory), and can be stopped at any time with a feasible solution with error bounds. In this work, we developed a new algorithm that finds the most probable configuration for a set of variables in SPNs (Maximum A Posteriori inference) by reformulating it as a MILP program. This translation is rather intricate and relies on several results scattered throughout this field of study, such as the reformulation of SPNs as Bayesian Networks with latent variables, the compact representation of conditional probability tables through Algebraic Decision Diagrams and the symbolic manipulation of multilinear expressions by Parameterized Algebraic Decision Diagrams.Rede Soma-Produto (SPN) é uma classe de modelos probabilísticos baseados em grafos relativamente nova. Elas diferem de outros modelos probabilísticos por permitir a representação explícita de independência sensível a contexto e a computação de inferência marginal em tempo linear. Redes Bayesianas e redes de Markov, por exemplo, exigem esforço #P-difícil para computar inferência marginal. Entretanto, continua sendo NP-difícil encontrar a configuração mais provável para um conjunto de variáveis em uma SPN, e atualmente há uma escassez de técnicas eficientes que solucionam o problema. Uma técnica amplamente utilizada para solucionar problemas de otimização NP-difíceis consiste em transformá-los em um programa de Programação Linear Inteira Mista (MILP), que então poderia ser solucionado por otimizadores de alta performance disponíveis comercialmente. Além de aproveitar o potencial dos otimizadores atuais, formular o problema como um programa MILP nos permite obter um algoritmo anytime que continuamente encontra soluções melhores quanto mais recursos (tempo e memória) forem disponibilizados, e pode ser interrompido a qualquer momento obtendo-se uma solução válida com margens de erro. Neste trabalho nós desenvolvemos um novo algoritmo que soluciona o problema de computar a configuração mais provável (inferência de Máximo A Posteriori) para um conjunto de variáveis em SPNs através de sua reformulação como um programa MILP. Esta reformulação é consideravelmente complexa e se baseia em diversos resultados dispersos pela literatura, tal como a reformulação de SPNs em Redes Bayesianas com variáveis latentes, a representação compacta das tabelas de probabilidades através de Diagramas de Decisão Algébrica, e manipulações simbólicas de expressões multilineares na forma de Diagramas de Decisão Algébrica Parametrizados.Biblioteca Digitais de Teses e Dissertações da USPMauá, Denis DerataniKatague, Gustavo Perez2021-02-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-05032021-193406/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2021-06-02T04:27:02Zoai:teses.usp.br:tde-05032021-193406Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-06-02T04:27:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
Uma abordagem de reformulação à Programação Linear Inteira Mista para a inferência de Máximo A Posteriori em Redes Soma-Produto
title A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
spellingShingle A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
Katague, Gustavo Perez
Diagramas de decisão algébrica parametrizados
Inferência de máximo a posteriori
Maximum a posteriori inference
Mixed-integer linear programming
Modelos probabilísticos baseados em grafos
Parameterized algebraic decision diagrams
Probabilistic graphical models
Programação linear inteira mista
Redes soma-produto
Sum-product networks
title_short A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
title_full A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
title_fullStr A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
title_full_unstemmed A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
title_sort A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
author Katague, Gustavo Perez
author_facet Katague, Gustavo Perez
author_role author
dc.contributor.none.fl_str_mv Mauá, Denis Deratani
dc.contributor.author.fl_str_mv Katague, Gustavo Perez
dc.subject.por.fl_str_mv Diagramas de decisão algébrica parametrizados
Inferência de máximo a posteriori
Maximum a posteriori inference
Mixed-integer linear programming
Modelos probabilísticos baseados em grafos
Parameterized algebraic decision diagrams
Probabilistic graphical models
Programação linear inteira mista
Redes soma-produto
Sum-product networks
topic Diagramas de decisão algébrica parametrizados
Inferência de máximo a posteriori
Maximum a posteriori inference
Mixed-integer linear programming
Modelos probabilísticos baseados em grafos
Parameterized algebraic decision diagrams
Probabilistic graphical models
Programação linear inteira mista
Redes soma-produto
Sum-product networks
description Sum-Product Network (SPN) is a relatively new class of probabilistic graphical models. They differ from other probabilistic graphical models by allowing explicit representation of context-sensitive independence and marginal inference computation in linear time. Bayesian Networks and Markov Networks, for example, require #P-hard effort for performing marginal inference. However, it is still NP-hard to find the most probable configuration for a set of variables in an SPN, and there is currently a shortage of efficient techniques to solve the problem. A widely employed technique for solving NP-hard optimization problems consists in translating them into Mixed-Integer Linear Programming (MILP) programs, which hence can be solved by highly efficient commercial solvers. Besides harvesting the power of current solvers, formulating the problem as a MILP program immediately allows us to obtain an anytime algorithm that continuously improves its solution as more resources are given (time and memory), and can be stopped at any time with a feasible solution with error bounds. In this work, we developed a new algorithm that finds the most probable configuration for a set of variables in SPNs (Maximum A Posteriori inference) by reformulating it as a MILP program. This translation is rather intricate and relies on several results scattered throughout this field of study, such as the reformulation of SPNs as Bayesian Networks with latent variables, the compact representation of conditional probability tables through Algebraic Decision Diagrams and the symbolic manipulation of multilinear expressions by Parameterized Algebraic Decision Diagrams.
publishDate 2021
dc.date.none.fl_str_mv 2021-02-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05032021-193406/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05032021-193406/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256687835086848