A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2007 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/366 |
Resumo: | The Knowledge Discovery in Databases (KDD) techniques have grown from the need for obtain more information about the data stored by organizations, such as, enterprise companies and research institutes. Bayesian Networks (BNs) can be considered as a probabilistic reasoning based model to represent knowledge and are very adequate to KDD tasks. In the last years, Bayesian Networks (BNs) have been applied in many supervised and unsupervised learning successful applications. The process to induce BNs and Bayesian Classifiers (BCs) from data tries do identify a BN (or a BC) able to represent the relationship among the variables of a certain data set. However, this is a NP-complete problem and, thus, its search space may become very large in most applications. That is the reason why many algorithms explore some way to reduce the search space in order to make the learning process computationally viable. In this master s thesis a new Conditional Independence based approach to induce BCs from data is proposed and implemented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with ten data sets revealed that the proposed approach tends to execute fewer comparisons than the traditional PC. The experiments also show that the implemented algorithm produce competitive classification rates when compared with both, PC and NaiveBayes |
id |
SCAR_fc479a4d60b1efecd5891d8f403f12bd |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/366 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
|
spelling |
Galvão, Sebastian David Carvalho de OliveiraHruschka Júnior, Estevam Rafaelhttp://lattes.cnpq.br/2097340857065853http://lattes.cnpq.br/81782916022706012016-06-02T19:05:28Z2008-03-242016-06-02T19:05:28Z2007-10-29GALVÃO, Sebastian David Carvalho de Oliveira. A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados. 2007. 111 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007.https://repositorio.ufscar.br/handle/ufscar/366The Knowledge Discovery in Databases (KDD) techniques have grown from the need for obtain more information about the data stored by organizations, such as, enterprise companies and research institutes. Bayesian Networks (BNs) can be considered as a probabilistic reasoning based model to represent knowledge and are very adequate to KDD tasks. In the last years, Bayesian Networks (BNs) have been applied in many supervised and unsupervised learning successful applications. The process to induce BNs and Bayesian Classifiers (BCs) from data tries do identify a BN (or a BC) able to represent the relationship among the variables of a certain data set. However, this is a NP-complete problem and, thus, its search space may become very large in most applications. That is the reason why many algorithms explore some way to reduce the search space in order to make the learning process computationally viable. In this master s thesis a new Conditional Independence based approach to induce BCs from data is proposed and implemented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with ten data sets revealed that the proposed approach tends to execute fewer comparisons than the traditional PC. The experiments also show that the implemented algorithm produce competitive classification rates when compared with both, PC and NaiveBayesAs técnicas de Descoberta de Conhecimento em Bancos de Dados (KDD), também chamadas de Mineração de Dados, surgiram da grande necessidade de se obter mais informação sobre os dados armazenados por organizações, como empresas, grandes corporações e instituições de pesquisa. As Redes Bayesianas (RBs) podem ser consideradas como uma forma de representação do conhecimento baseada no raciocínio probabilístico e possuem características que as tornam muito adequadas para tarefas de descoberta de conhecimento em bancos de dados. Por isso, este é um campo de aplicação efervescente nos últimos anos. O aprendizado automático de RBs e Classificadores Bayesianos (CBs) busca identificar uma RB (ou CB) que represente o relacionamento entre as variáveis de um determinado conjunto de dados, mas como este é um problema NP-completo o espaço de busca se torna muito amplo na maioria das aplicações. Por este motivo, muitos algoritmos exploram alguma forma de redução do espaço de busca para tornar o processo de aprendizado computacionalmente viável. Esta dissertação de mestrado apresenta um método (MarkovPC) de aprendizado de CBs que visa exatamente reduzir o espaço de busca durante a indução de um classificador a partir de dados. Para tanto, toma-se como base algoritmos de aprendizado de RB da classe IC (Independência Condicional) e o conceito de Markov Blanket. Resultados obtidos através de experimentos realizados com 10 conjuntos de dados mostram que o MarkovPC é capaz de reduzir o esforço computacional do processo de indução de um classificador Bayesiano e manter a qualidade do classificador induzido (em termos de taxa de classificação correta)Universidade Federal de Minas Geraisapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRAprendizado de computadorData mining (Mineração de dados)Redes BayesianasCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOA seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL1698.pdfapplication/pdf1287729https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/366/1/1698.pdf3b1a05110798861ad7e42fd67b1694d6MD51THUMBNAIL1698.pdf.jpg1698.pdf.jpgIM Thumbnailimage/jpeg8799https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/366/2/1698.pdf.jpgd17b449ff37f75ebd15ac9c28a74bed2MD52ufscar/3662020-03-23 19:48:49.766oai:repositorio.ufscar.br:ufscar/366Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222020-03-23T19:48:49Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados |
title |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados |
spellingShingle |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados Galvão, Sebastian David Carvalho de Oliveira Aprendizado de computador Data mining (Mineração de dados) Redes Bayesianas CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados |
title_full |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados |
title_fullStr |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados |
title_full_unstemmed |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados |
title_sort |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados |
author |
Galvão, Sebastian David Carvalho de Oliveira |
author_facet |
Galvão, Sebastian David Carvalho de Oliveira |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/8178291602270601 |
dc.contributor.author.fl_str_mv |
Galvão, Sebastian David Carvalho de Oliveira |
dc.contributor.advisor1.fl_str_mv |
Hruschka Júnior, Estevam Rafael |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2097340857065853 |
contributor_str_mv |
Hruschka Júnior, Estevam Rafael |
dc.subject.por.fl_str_mv |
Aprendizado de computador Data mining (Mineração de dados) Redes Bayesianas |
topic |
Aprendizado de computador Data mining (Mineração de dados) Redes Bayesianas CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
The Knowledge Discovery in Databases (KDD) techniques have grown from the need for obtain more information about the data stored by organizations, such as, enterprise companies and research institutes. Bayesian Networks (BNs) can be considered as a probabilistic reasoning based model to represent knowledge and are very adequate to KDD tasks. In the last years, Bayesian Networks (BNs) have been applied in many supervised and unsupervised learning successful applications. The process to induce BNs and Bayesian Classifiers (BCs) from data tries do identify a BN (or a BC) able to represent the relationship among the variables of a certain data set. However, this is a NP-complete problem and, thus, its search space may become very large in most applications. That is the reason why many algorithms explore some way to reduce the search space in order to make the learning process computationally viable. In this master s thesis a new Conditional Independence based approach to induce BCs from data is proposed and implemented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with ten data sets revealed that the proposed approach tends to execute fewer comparisons than the traditional PC. The experiments also show that the implemented algorithm produce competitive classification rates when compared with both, PC and NaiveBayes |
publishDate |
2007 |
dc.date.issued.fl_str_mv |
2007-10-29 |
dc.date.available.fl_str_mv |
2008-03-24 2016-06-02T19:05:28Z |
dc.date.accessioned.fl_str_mv |
2016-06-02T19:05:28Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GALVÃO, Sebastian David Carvalho de Oliveira. A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados. 2007. 111 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/366 |
identifier_str_mv |
GALVÃO, Sebastian David Carvalho de Oliveira. A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados. 2007. 111 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007. |
url |
https://repositorio.ufscar.br/handle/ufscar/366 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/366/1/1698.pdf https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/366/2/1698.pdf.jpg |
bitstream.checksum.fl_str_mv |
3b1a05110798861ad7e42fd67b1694d6 d17b449ff37f75ebd15ac9c28a74bed2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1777472015663366144 |