A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados

Bibliographic Details
Main Author: Galvão, Sebastian David Carvalho de Oliveira
Publication Date: 2007
Format: Master thesis
Language: por
Source: Repositório Institucional da UFSCAR
Download full: https://repositorio.ufscar.br/handle/ufscar/366
Summary: The Knowledge Discovery in Databases (KDD) techniques have grown from the need for obtain more information about the data stored by organizations, such as, enterprise companies and research institutes. Bayesian Networks (BNs) can be considered as a probabilistic reasoning based model to represent knowledge and are very adequate to KDD tasks. In the last years, Bayesian Networks (BNs) have been applied in many supervised and unsupervised learning successful applications. The process to induce BNs and Bayesian Classifiers (BCs) from data tries do identify a BN (or a BC) able to represent the relationship among the variables of a certain data set. However, this is a NP-complete problem and, thus, its search space may become very large in most applications. That is the reason why many algorithms explore some way to reduce the search space in order to make the learning process computationally viable. In this master s thesis a new Conditional Independence based approach to induce BCs from data is proposed and implemented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with ten data sets revealed that the proposed approach tends to execute fewer comparisons than the traditional PC. The experiments also show that the implemented algorithm produce competitive classification rates when compared with both, PC and NaiveBayes
id SCAR_fc479a4d60b1efecd5891d8f403f12bd
oai_identifier_str oai:repositorio.ufscar.br:ufscar/366
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Galvão, Sebastian David Carvalho de OliveiraHruschka Júnior, Estevam Rafaelhttp://lattes.cnpq.br/2097340857065853http://lattes.cnpq.br/81782916022706012016-06-02T19:05:28Z2008-03-242016-06-02T19:05:28Z2007-10-29GALVÃO, Sebastian David Carvalho de Oliveira. A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados. 2007. 111 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007.https://repositorio.ufscar.br/handle/ufscar/366The Knowledge Discovery in Databases (KDD) techniques have grown from the need for obtain more information about the data stored by organizations, such as, enterprise companies and research institutes. Bayesian Networks (BNs) can be considered as a probabilistic reasoning based model to represent knowledge and are very adequate to KDD tasks. In the last years, Bayesian Networks (BNs) have been applied in many supervised and unsupervised learning successful applications. The process to induce BNs and Bayesian Classifiers (BCs) from data tries do identify a BN (or a BC) able to represent the relationship among the variables of a certain data set. However, this is a NP-complete problem and, thus, its search space may become very large in most applications. That is the reason why many algorithms explore some way to reduce the search space in order to make the learning process computationally viable. In this master s thesis a new Conditional Independence based approach to induce BCs from data is proposed and implemented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with ten data sets revealed that the proposed approach tends to execute fewer comparisons than the traditional PC. The experiments also show that the implemented algorithm produce competitive classification rates when compared with both, PC and NaiveBayesAs técnicas de Descoberta de Conhecimento em Bancos de Dados (KDD), também chamadas de Mineração de Dados, surgiram da grande necessidade de se obter mais informação sobre os dados armazenados por organizações, como empresas, grandes corporações e instituições de pesquisa. As Redes Bayesianas (RBs) podem ser consideradas como uma forma de representação do conhecimento baseada no raciocínio probabilístico e possuem características que as tornam muito adequadas para tarefas de descoberta de conhecimento em bancos de dados. Por isso, este é um campo de aplicação efervescente nos últimos anos. O aprendizado automático de RBs e Classificadores Bayesianos (CBs) busca identificar uma RB (ou CB) que represente o relacionamento entre as variáveis de um determinado conjunto de dados, mas como este é um problema NP-completo o espaço de busca se torna muito amplo na maioria das aplicações. Por este motivo, muitos algoritmos exploram alguma forma de redução do espaço de busca para tornar o processo de aprendizado computacionalmente viável. Esta dissertação de mestrado apresenta um método (MarkovPC) de aprendizado de CBs que visa exatamente reduzir o espaço de busca durante a indução de um classificador a partir de dados. Para tanto, toma-se como base algoritmos de aprendizado de RB da classe IC (Independência Condicional) e o conceito de Markov Blanket. Resultados obtidos através de experimentos realizados com 10 conjuntos de dados mostram que o MarkovPC é capaz de reduzir o esforço computacional do processo de indução de um classificador Bayesiano e manter a qualidade do classificador induzido (em termos de taxa de classificação correta)Universidade Federal de Minas Geraisapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRAprendizado de computadorData mining (Mineração de dados)Redes BayesianasCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOA seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL1698.pdfapplication/pdf1287729https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/366/1/1698.pdf3b1a05110798861ad7e42fd67b1694d6MD51THUMBNAIL1698.pdf.jpg1698.pdf.jpgIM Thumbnailimage/jpeg8799https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/366/2/1698.pdf.jpgd17b449ff37f75ebd15ac9c28a74bed2MD52ufscar/3662020-03-23 19:48:49.766oai:repositorio.ufscar.br:ufscar/366Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222020-03-23T19:48:49Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
title A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
spellingShingle A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
Galvão, Sebastian David Carvalho de Oliveira
Aprendizado de computador
Data mining (Mineração de dados)
Redes Bayesianas
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
title_full A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
title_fullStr A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
title_full_unstemmed A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
title_sort A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
author Galvão, Sebastian David Carvalho de Oliveira
author_facet Galvão, Sebastian David Carvalho de Oliveira
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/8178291602270601
dc.contributor.author.fl_str_mv Galvão, Sebastian David Carvalho de Oliveira
dc.contributor.advisor1.fl_str_mv Hruschka Júnior, Estevam Rafael
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2097340857065853
contributor_str_mv Hruschka Júnior, Estevam Rafael
dc.subject.por.fl_str_mv Aprendizado de computador
Data mining (Mineração de dados)
Redes Bayesianas
topic Aprendizado de computador
Data mining (Mineração de dados)
Redes Bayesianas
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The Knowledge Discovery in Databases (KDD) techniques have grown from the need for obtain more information about the data stored by organizations, such as, enterprise companies and research institutes. Bayesian Networks (BNs) can be considered as a probabilistic reasoning based model to represent knowledge and are very adequate to KDD tasks. In the last years, Bayesian Networks (BNs) have been applied in many supervised and unsupervised learning successful applications. The process to induce BNs and Bayesian Classifiers (BCs) from data tries do identify a BN (or a BC) able to represent the relationship among the variables of a certain data set. However, this is a NP-complete problem and, thus, its search space may become very large in most applications. That is the reason why many algorithms explore some way to reduce the search space in order to make the learning process computationally viable. In this master s thesis a new Conditional Independence based approach to induce BCs from data is proposed and implemented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with ten data sets revealed that the proposed approach tends to execute fewer comparisons than the traditional PC. The experiments also show that the implemented algorithm produce competitive classification rates when compared with both, PC and NaiveBayes
publishDate 2007
dc.date.issued.fl_str_mv 2007-10-29
dc.date.available.fl_str_mv 2008-03-24
2016-06-02T19:05:28Z
dc.date.accessioned.fl_str_mv 2016-06-02T19:05:28Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GALVÃO, Sebastian David Carvalho de Oliveira. A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados. 2007. 111 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/366
identifier_str_mv GALVÃO, Sebastian David Carvalho de Oliveira. A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados. 2007. 111 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007.
url https://repositorio.ufscar.br/handle/ufscar/366
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/366/1/1698.pdf
https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/366/2/1698.pdf.jpg
bitstream.checksum.fl_str_mv 3b1a05110798861ad7e42fd67b1694d6
d17b449ff37f75ebd15ac9c28a74bed2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1777472015663366144