Evolução automática de algoritmos de redes bayesianas de classificação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/ESBF-9KHHLU |
Resumo: | Quando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados. |
id |
UFMG_198a7d3cab3b469c2f8b309edc92f3de |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/ESBF-9KHHLU |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Gisele Lobo PappaAdriano César Machado PereiraMarcio Porto BasgaluppRenato Martins AssuncaoAlex Guimarães Cardoso de Sá2019-08-13T21:32:39Z2019-08-13T21:32:39Z2014-02-26http://hdl.handle.net/1843/ESBF-9KHHLUQuando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados.When faced with a new machine learning problem, selecting which classifier is the best to perform the task at hand is a very hard problem. The reason for this is the nature of the data used by the classifier, which can differ abruptly from one set to another, consequently affecting the classification outcome. In other words, the same classifier can not be adapted to different types of data. Most solutions proposed in the literature are based on meta-learning, and use meta-data about the problem to recommend an effective algorithm to solve the task. This work proposes a new approach to this problem: to build an algorithm tailored to the application problem at hand. More specifically, we propose an evolutionary algorithm (EA) to automatically evolve Bayesian Network Classifiers (BNCs). The method receives as input a list of the main components of BNC algorithms, and uses an EA to encode these components. Given an input dataset (or a group of datasets), the method tests different combinations of components and returns the best BNC algorithm to that specific application domain. For testing, we divided the experiments in three main parts: (i) tests in specific datasets domains; (ii) tests directed to sets of similar datasets; (iii) tests directed to sets of distinct datasets. For the first part, 15 UCI datasets were chosen to evaluate the proposed approach and generate tailored algorithms for these datasets. The other two parts focused on applying the EA on sets of datasets. In this case, 20 datasets with distinct characteristics were selected in order to cluster them and, thus, create different experiment scenarios. Tests were performed on the AE considering the three parts of experiments and results were compared separately with a greedy search method and, then, with three state-of-art BNC algorithms (Naïve Bayes, TAN and K2). Results showed that the generated BNC algorithms are competitive with those of the state-of-art methods, and in most cases the use of an evolutionary algorithm, rather than a simple greedy search, improved statistically the results.Universidade Federal de Minas GeraisUFMGAlgoritmos de computadorComputaçãoClassificação (Computadores)Redes Bayesianas de ClassificaçãoEvolução automáticaComponentes problema de classificaçãoAlgoritmo evolucionárioEvolução automática de algoritmos de redes bayesianas de classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALalexguimaraes_vers_ocorreta.pdfapplication/pdf2398040https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/1/alexguimaraes_vers_ocorreta.pdf2f7b7677593de0366f968b19000fbda3MD51TEXTalexguimaraes_vers_ocorreta.pdf.txtalexguimaraes_vers_ocorreta.pdf.txtExtracted texttext/plain229216https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/2/alexguimaraes_vers_ocorreta.pdf.txtf3a6e9f4abdddf1f6a047a7cebf4fce2MD521843/ESBF-9KHHLU2019-11-14 17:07:23.299oai:repositorio.ufmg.br:1843/ESBF-9KHHLURepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:07:23Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Evolução automática de algoritmos de redes bayesianas de classificação |
title |
Evolução automática de algoritmos de redes bayesianas de classificação |
spellingShingle |
Evolução automática de algoritmos de redes bayesianas de classificação Alex Guimarães Cardoso de Sá Redes Bayesianas de Classificação Evolução automática Componentes problema de classificação Algoritmo evolucionário Algoritmos de computador Computação Classificação (Computadores) |
title_short |
Evolução automática de algoritmos de redes bayesianas de classificação |
title_full |
Evolução automática de algoritmos de redes bayesianas de classificação |
title_fullStr |
Evolução automática de algoritmos de redes bayesianas de classificação |
title_full_unstemmed |
Evolução automática de algoritmos de redes bayesianas de classificação |
title_sort |
Evolução automática de algoritmos de redes bayesianas de classificação |
author |
Alex Guimarães Cardoso de Sá |
author_facet |
Alex Guimarães Cardoso de Sá |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Gisele Lobo Pappa |
dc.contributor.referee1.fl_str_mv |
Adriano César Machado Pereira |
dc.contributor.referee2.fl_str_mv |
Marcio Porto Basgalupp |
dc.contributor.referee3.fl_str_mv |
Renato Martins Assuncao |
dc.contributor.author.fl_str_mv |
Alex Guimarães Cardoso de Sá |
contributor_str_mv |
Gisele Lobo Pappa Adriano César Machado Pereira Marcio Porto Basgalupp Renato Martins Assuncao |
dc.subject.por.fl_str_mv |
Redes Bayesianas de Classificação Evolução automática Componentes problema de classificação Algoritmo evolucionário |
topic |
Redes Bayesianas de Classificação Evolução automática Componentes problema de classificação Algoritmo evolucionário Algoritmos de computador Computação Classificação (Computadores) |
dc.subject.other.pt_BR.fl_str_mv |
Algoritmos de computador Computação Classificação (Computadores) |
description |
Quando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados. |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014-02-26 |
dc.date.accessioned.fl_str_mv |
2019-08-13T21:32:39Z |
dc.date.available.fl_str_mv |
2019-08-13T21:32:39Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/ESBF-9KHHLU |
url |
http://hdl.handle.net/1843/ESBF-9KHHLU |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/1/alexguimaraes_vers_ocorreta.pdf https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/2/alexguimaraes_vers_ocorreta.pdf.txt |
bitstream.checksum.fl_str_mv |
2f7b7677593de0366f968b19000fbda3 f3a6e9f4abdddf1f6a047a7cebf4fce2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589269385641984 |