A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks

Katague, Gustavo Perez

A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks

Detalhes bibliográficos
Autor(a) principal:	Katague, Gustavo Perez
Data de Publicação:	2021
Tipo de documento:	Dissertação
Idioma:	eng
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05032021-193406/
Resumo:	Sum-Product Network (SPN) is a relatively new class of probabilistic graphical models. They differ from other probabilistic graphical models by allowing explicit representation of context-sensitive independence and marginal inference computation in linear time. Bayesian Networks and Markov Networks, for example, require #P-hard effort for performing marginal inference. However, it is still NP-hard to find the most probable configuration for a set of variables in an SPN, and there is currently a shortage of efficient techniques to solve the problem. A widely employed technique for solving NP-hard optimization problems consists in translating them into Mixed-Integer Linear Programming (MILP) programs, which hence can be solved by highly efficient commercial solvers. Besides harvesting the power of current solvers, formulating the problem as a MILP program immediately allows us to obtain an anytime algorithm that continuously improves its solution as more resources are given (time and memory), and can be stopped at any time with a feasible solution with error bounds. In this work, we developed a new algorithm that finds the most probable configuration for a set of variables in SPNs (Maximum A Posteriori inference) by reformulating it as a MILP program. This translation is rather intricate and relies on several results scattered throughout this field of study, such as the reformulation of SPNs as Bayesian Networks with latent variables, the compact representation of conditional probability tables through Algebraic Decision Diagrams and the symbolic manipulation of multilinear expressions by Parameterized Algebraic Decision Diagrams.

Metadados do item

id	USP_0595834963df95db9627ac8cb68f8782
oai_identifier_str	oai:teses.usp.br:tde-05032021-193406
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product NetworksUma abordagem de reformulação à Programação Linear Inteira Mista para a inferência de Máximo A Posteriori em Redes Soma-ProdutoDiagramas de decisão algébrica parametrizadosInferência de máximo a posterioriMaximum a posteriori inferenceMixed-integer linear programmingModelos probabilísticos baseados em grafosParameterized algebraic decision diagramsProbabilistic graphical modelsProgramação linear inteira mistaRedes soma-produtoSum-product networksSum-Product Network (SPN) is a relatively new class of probabilistic graphical models. They differ from other probabilistic graphical models by allowing explicit representation of context-sensitive independence and marginal inference computation in linear time. Bayesian Networks and Markov Networks, for example, require #P-hard effort for performing marginal inference. However, it is still NP-hard to find the most probable configuration for a set of variables in an SPN, and there is currently a shortage of efficient techniques to solve the problem. A widely employed technique for solving NP-hard optimization problems consists in translating them into Mixed-Integer Linear Programming (MILP) programs, which hence can be solved by highly efficient commercial solvers. Besides harvesting the power of current solvers, formulating the problem as a MILP program immediately allows us to obtain an anytime algorithm that continuously improves its solution as more resources are given (time and memory), and can be stopped at any time with a feasible solution with error bounds. In this work, we developed a new algorithm that finds the most probable configuration for a set of variables in SPNs (Maximum A Posteriori inference) by reformulating it as a MILP program. This translation is rather intricate and relies on several results scattered throughout this field of study, such as the reformulation of SPNs as Bayesian Networks with latent variables, the compact representation of conditional probability tables through Algebraic Decision Diagrams and the symbolic manipulation of multilinear expressions by Parameterized Algebraic Decision Diagrams.Rede Soma-Produto (SPN) é uma classe de modelos probabilísticos baseados em grafos relativamente nova. Elas diferem de outros modelos probabilísticos por permitir a representação explícita de independência sensível a contexto e a computação de inferência marginal em tempo linear. Redes Bayesianas e redes de Markov, por exemplo, exigem esforço #P-difícil para computar inferência marginal. Entretanto, continua sendo NP-difícil encontrar a configuração mais provável para um conjunto de variáveis em uma SPN, e atualmente há uma escassez de técnicas eficientes que solucionam o problema. Uma técnica amplamente utilizada para solucionar problemas de otimização NP-difíceis consiste em transformá-los em um programa de Programação Linear Inteira Mista (MILP), que então poderia ser solucionado por otimizadores de alta performance disponíveis comercialmente. Além de aproveitar o potencial dos otimizadores atuais, formular o problema como um programa MILP nos permite obter um algoritmo anytime que continuamente encontra soluções melhores quanto mais recursos (tempo e memória) forem disponibilizados, e pode ser interrompido a qualquer momento obtendo-se uma solução válida com margens de erro. Neste trabalho nós desenvolvemos um novo algoritmo que soluciona o problema de computar a configuração mais provável (inferência de Máximo A Posteriori) para um conjunto de variáveis em SPNs através de sua reformulação como um programa MILP. Esta reformulação é consideravelmente complexa e se baseia em diversos resultados dispersos pela literatura, tal como a reformulação de SPNs em Redes Bayesianas com variáveis latentes, a representação compacta das tabelas de probabilidades através de Diagramas de Decisão Algébrica, e manipulações simbólicas de expressões multilineares na forma de Diagramas de Decisão Algébrica Parametrizados.Biblioteca Digitais de Teses e Dissertações da USPMauá, Denis DerataniKatague, Gustavo Perez2021-02-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-05032021-193406/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2021-06-02T04:27:02Zoai:teses.usp.br:tde-05032021-193406Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212021-06-02T04:27:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks Uma abordagem de reformulação à Programação Linear Inteira Mista para a inferência de Máximo A Posteriori em Redes Soma-Produto
title	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
spellingShingle	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks Katague, Gustavo Perez Diagramas de decisão algébrica parametrizados Inferência de máximo a posteriori Maximum a posteriori inference Mixed-integer linear programming Modelos probabilísticos baseados em grafos Parameterized algebraic decision diagrams Probabilistic graphical models Programação linear inteira mista Redes soma-produto Sum-product networks
title_short	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
title_full	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
title_fullStr	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
title_full_unstemmed	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
title_sort	A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks
author	Katague, Gustavo Perez
author_facet	Katague, Gustavo Perez
author_role	author
dc.contributor.none.fl_str_mv	Mauá, Denis Deratani
dc.contributor.author.fl_str_mv	Katague, Gustavo Perez
dc.subject.por.fl_str_mv	Diagramas de decisão algébrica parametrizados Inferência de máximo a posteriori Maximum a posteriori inference Mixed-integer linear programming Modelos probabilísticos baseados em grafos Parameterized algebraic decision diagrams Probabilistic graphical models Programação linear inteira mista Redes soma-produto Sum-product networks
topic	Diagramas de decisão algébrica parametrizados Inferência de máximo a posteriori Maximum a posteriori inference Mixed-integer linear programming Modelos probabilísticos baseados em grafos Parameterized algebraic decision diagrams Probabilistic graphical models Programação linear inteira mista Redes soma-produto Sum-product networks
description	Sum-Product Network (SPN) is a relatively new class of probabilistic graphical models. They differ from other probabilistic graphical models by allowing explicit representation of context-sensitive independence and marginal inference computation in linear time. Bayesian Networks and Markov Networks, for example, require #P-hard effort for performing marginal inference. However, it is still NP-hard to find the most probable configuration for a set of variables in an SPN, and there is currently a shortage of efficient techniques to solve the problem. A widely employed technique for solving NP-hard optimization problems consists in translating them into Mixed-Integer Linear Programming (MILP) programs, which hence can be solved by highly efficient commercial solvers. Besides harvesting the power of current solvers, formulating the problem as a MILP program immediately allows us to obtain an anytime algorithm that continuously improves its solution as more resources are given (time and memory), and can be stopped at any time with a feasible solution with error bounds. In this work, we developed a new algorithm that finds the most probable configuration for a set of variables in SPNs (Maximum A Posteriori inference) by reformulating it as a MILP program. This translation is rather intricate and relies on several results scattered throughout this field of study, such as the reformulation of SPNs as Bayesian Networks with latent variables, the compact representation of conditional probability tables through Algebraic Decision Diagrams and the symbolic manipulation of multilinear expressions by Parameterized Algebraic Decision Diagrams.
publishDate	2021
dc.date.none.fl_str_mv	2021-02-03
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05032021-193406/
url	https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05032021-193406/
dc.language.iso.fl_str_mv	eng
language	eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1815256687835086848

A Mixed-Integer Linear Programming reformulation approach to Maximum A Posteriori inference in Sum-Product Networks

Registros relacionados