Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov

Detalhes bibliográficos
Autor(a) principal: Costa, Felipe Schneider
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/123052
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2013.
id UFSC_5e97169db3aeffe73e6a2a04876fc5fd
oai_identifier_str oai:repositorio.ufsc.br:123456789/123052
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de MarkovComputaçãoRedes bayesianasMonte Carlo, Método deMarkov, Processos deAprendizado do computadorDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2013.Esta dissertação aborda a aplicação dos métodos de Monte Carlo via Cadeias de Markov na aprendizagem de estruturas de redes Bayesianas. Estes métodos têm se mostrado extremamente eficientes nos cálculos aproximados de problemas nos quais é impossível obter uma solução exata. Neste sentido, apresenta um método para gerar estruturas de redes Bayesianas a partir dos dados para que possam ser utilizadas para realizar consultas sobre o domínio do problema e também que permitam extrair conhecimento sobre o problema através dos modelos gráficos gerados. Inicialmente, através do uso de técnicas de verificação de independência condicional entre os nós da rede, alguns vértices (conexões entre os nós) da estrutura inicial foram fixados e não mais alterados, visando minimizar o uso de recursos computacionais. Após fixar esses vértices, o próximo passo consistiu em construir uma estrutura inicial de rede (conectar os demais nós da rede não fixados no passo anterior) a ser alterada durante toda a execução do algoritmo. Para isso, foram utilizados algoritmos de busca heurística. De posse de um modelo inicial de rede e seguindo o fluxo dos métodos de Monte Carlo e Cadeias de Markov, a próxima etapa alterava esse modelo, a cada iteração do algoritmo, de forma aleatória, visando encontrar o modelo que melhor representasse os dados. Os algoritmos de geração de amostras de rede utilizados nessa etapa selecionavam dois nós e uma operação a ser realizada no vértice de conexão entre esses nós (incluir, excluir ou inverter), sempre de forma aleatória. Depois de verificar se a operação realizada na estrutura atual da rede gerava uma rede válida (sem ciclos), a rede era aceita como novo estado da cadeia. Finalmente, para comparar os modelos de rede e selecionar o melhor entre eles, foram utilizadas métricas de score. Analisando as redes geradas durante as execuções do algoritmo, juntamente com os dados capturados na submissão dos casos de teste, pôde-se concluir que os resultados mostraram-se muito satisfatórios, devido, principalmente, às taxas de erros apresentadas nas matrizes de classificação. Como exemplo, na submissão de um dos conjuntos de testes a uma das redes gerada pelo algoritmo, apenas 7% (sete) dos dados foram classificados incorretamente. Pode-se crer que os bons resultados obtidos devem-se ao processo utilizado na coleta de modelos de rede, no qual foram salvos os melhores modelos durante toda a execução do programa.<br>Abstract : This paper discusses the application of the methods of Markov Chain Monte Carlo in the learning of structures of Bayesian networks. These methods have proved to be extremely effective in approximate calculations of problems in which it is impossible to obtain an exact solution. In this sense, it presents a method for generating structures of Bayesian networks from data that can be used to perform queries on the problem domain and also for extracting knowledge about the problem through the graphic models generated. Initially, through the use of verification techniques for conditional independence between the network nodes, some vertices (connections between nodes) of the initial structure were fixed and not altered in order to minimize the use of computational resources. After fixing these vertices, the next step was to build an initial network structure (connect other network nodes not set in the previous step) to be changed throughout the execution of the algorithm. For this, heuristic search algorithms are used. With this initial network model and following the flow of the Monte Carlo and Markov chains methods, the next step alter this model, in each iteration of the algorithm, randomly, aiming to find the model that best represents the data. The algorithms for generating samples of network used in this step selected two nodes and an operation to be performed at the vertice of connection between these nodes (add, delete or reverse), always randomly. After checking that the operation performed on the current network structure generated a valid network (without cycles), the network was accepted as a new state of the chain. Finally, to compare the network models and select the best among them, metrics score are used. Analyzing the networks generated during the execution of the algorithm, along with the data captured in the submission of test cases, it can be concluded that the results were very satisfactory, mainly due to error rates presented in the matrix of classification. As an example, submission of one of the test sets to the network generated by the algorithm, only 7% (seven) of data were misclassified. It is believed that the good results are due to the process used to collect network models, where it saves the best models throughout the execution of the program.Nassar, Silvia ModestoUniversidade Federal de Santa CatarinaCosta, Felipe Schneider2014-08-06T17:43:59Z2014-08-06T17:43:59Z2013info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis90 p.| il., grafs., tabs.application/pdf326135https://repositorio.ufsc.br/xmlui/handle/123456789/123052porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2014-08-06T17:43:59Zoai:repositorio.ufsc.br:123456789/123052Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732014-08-06T17:43:59Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov
title Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov
spellingShingle Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov
Costa, Felipe Schneider
Computação
Redes bayesianas
Monte Carlo, Método de
Markov, Processos de
Aprendizado do computador
title_short Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov
title_full Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov
title_fullStr Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov
title_full_unstemmed Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov
title_sort Aprendizagem estrutural de redes bayesianas pelo método de Monte Carlo e cadeias de Markov
author Costa, Felipe Schneider
author_facet Costa, Felipe Schneider
author_role author
dc.contributor.none.fl_str_mv Nassar, Silvia Modesto
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Costa, Felipe Schneider
dc.subject.por.fl_str_mv Computação
Redes bayesianas
Monte Carlo, Método de
Markov, Processos de
Aprendizado do computador
topic Computação
Redes bayesianas
Monte Carlo, Método de
Markov, Processos de
Aprendizado do computador
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2013.
publishDate 2013
dc.date.none.fl_str_mv 2013
2014-08-06T17:43:59Z
2014-08-06T17:43:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 326135
https://repositorio.ufsc.br/xmlui/handle/123456789/123052
identifier_str_mv 326135
url https://repositorio.ufsc.br/xmlui/handle/123456789/123052
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 90 p.| il., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652290420113408