Evolução automática de algoritmos de redes bayesianas de classificação

Alex Guimarães Cardoso de Sá

Evolução automática de algoritmos de redes bayesianas de classificação

Detalhes bibliográficos
Autor(a) principal:	Alex Guimarães Cardoso de Sá
Data de Publicação:	2014
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFMG
Texto Completo:	http://hdl.handle.net/1843/ESBF-9KHHLU
Resumo:	Quando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados.

Metadados do item

id	UFMG_198a7d3cab3b469c2f8b309edc92f3de
oai_identifier_str	oai:repositorio.ufmg.br:1843/ESBF-9KHHLU
network_acronym_str	UFMG
network_name_str	Repositório Institucional da UFMG
repository_id_str
spelling	Gisele Lobo PappaAdriano César Machado PereiraMarcio Porto BasgaluppRenato Martins AssuncaoAlex Guimarães Cardoso de Sá2019-08-13T21:32:39Z2019-08-13T21:32:39Z2014-02-26http://hdl.handle.net/1843/ESBF-9KHHLUQuando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados.When faced with a new machine learning problem, selecting which classifier is the best to perform the task at hand is a very hard problem. The reason for this is the nature of the data used by the classifier, which can differ abruptly from one set to another, consequently affecting the classification outcome. In other words, the same classifier can not be adapted to different types of data. Most solutions proposed in the literature are based on meta-learning, and use meta-data about the problem to recommend an effective algorithm to solve the task. This work proposes a new approach to this problem: to build an algorithm tailored to the application problem at hand. More specifically, we propose an evolutionary algorithm (EA) to automatically evolve Bayesian Network Classifiers (BNCs). The method receives as input a list of the main components of BNC algorithms, and uses an EA to encode these components. Given an input dataset (or a group of datasets), the method tests different combinations of components and returns the best BNC algorithm to that specific application domain. For testing, we divided the experiments in three main parts: (i) tests in specific datasets domains; (ii) tests directed to sets of similar datasets; (iii) tests directed to sets of distinct datasets. For the first part, 15 UCI datasets were chosen to evaluate the proposed approach and generate tailored algorithms for these datasets. The other two parts focused on applying the EA on sets of datasets. In this case, 20 datasets with distinct characteristics were selected in order to cluster them and, thus, create different experiment scenarios. Tests were performed on the AE considering the three parts of experiments and results were compared separately with a greedy search method and, then, with three state-of-art BNC algorithms (Naïve Bayes, TAN and K2). Results showed that the generated BNC algorithms are competitive with those of the state-of-art methods, and in most cases the use of an evolutionary algorithm, rather than a simple greedy search, improved statistically the results.Universidade Federal de Minas GeraisUFMGAlgoritmos de computadorComputaçãoClassificação (Computadores)Redes Bayesianas de ClassificaçãoEvolução automáticaComponentes problema de classificaçãoAlgoritmo evolucionárioEvolução automática de algoritmos de redes bayesianas de classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALalexguimaraes_vers_ocorreta.pdfapplication/pdf2398040https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/1/alexguimaraes_vers_ocorreta.pdf2f7b7677593de0366f968b19000fbda3MD51TEXTalexguimaraes_vers_ocorreta.pdf.txtalexguimaraes_vers_ocorreta.pdf.txtExtracted texttext/plain229216https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/2/alexguimaraes_vers_ocorreta.pdf.txtf3a6e9f4abdddf1f6a047a7cebf4fce2MD521843/ESBF-9KHHLU2019-11-14 17:07:23.299oai:repositorio.ufmg.br:1843/ESBF-9KHHLURepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:07:23Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv	Evolução automática de algoritmos de redes bayesianas de classificação
title	Evolução automática de algoritmos de redes bayesianas de classificação
spellingShingle	Evolução automática de algoritmos de redes bayesianas de classificação Alex Guimarães Cardoso de Sá Redes Bayesianas de Classificação Evolução automática Componentes problema de classificação Algoritmo evolucionário Algoritmos de computador Computação Classificação (Computadores)
title_short	Evolução automática de algoritmos de redes bayesianas de classificação
title_full	Evolução automática de algoritmos de redes bayesianas de classificação
title_fullStr	Evolução automática de algoritmos de redes bayesianas de classificação
title_full_unstemmed	Evolução automática de algoritmos de redes bayesianas de classificação
title_sort	Evolução automática de algoritmos de redes bayesianas de classificação
author	Alex Guimarães Cardoso de Sá
author_facet	Alex Guimarães Cardoso de Sá
author_role	author
dc.contributor.advisor1.fl_str_mv	Gisele Lobo Pappa
dc.contributor.referee1.fl_str_mv	Adriano César Machado Pereira
dc.contributor.referee2.fl_str_mv	Marcio Porto Basgalupp
dc.contributor.referee3.fl_str_mv	Renato Martins Assuncao
dc.contributor.author.fl_str_mv	Alex Guimarães Cardoso de Sá
contributor_str_mv	Gisele Lobo Pappa Adriano César Machado Pereira Marcio Porto Basgalupp Renato Martins Assuncao
dc.subject.por.fl_str_mv	Redes Bayesianas de Classificação Evolução automática Componentes problema de classificação Algoritmo evolucionário
topic	Redes Bayesianas de Classificação Evolução automática Componentes problema de classificação Algoritmo evolucionário Algoritmos de computador Computação Classificação (Computadores)
dc.subject.other.pt_BR.fl_str_mv	Algoritmos de computador Computação Classificação (Computadores)
description	Quando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados.
publishDate	2014
dc.date.issued.fl_str_mv	2014-02-26
dc.date.accessioned.fl_str_mv	2019-08-13T21:32:39Z
dc.date.available.fl_str_mv	2019-08-13T21:32:39Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/1843/ESBF-9KHHLU
url	http://hdl.handle.net/1843/ESBF-9KHHLU
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv	UFMG
publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
instname_str	Universidade Federal de Minas Gerais (UFMG)
instacron_str	UFMG
institution	UFMG
reponame_str	Repositório Institucional da UFMG
collection	Repositório Institucional da UFMG
bitstream.url.fl_str_mv	https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/1/alexguimaraes_vers_ocorreta.pdf https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/2/alexguimaraes_vers_ocorreta.pdf.txt
bitstream.checksum.fl_str_mv	2f7b7677593de0366f968b19000fbda3 f3a6e9f4abdddf1f6a047a7cebf4fce2
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_	1803589269385641984

Evolução automática de algoritmos de redes bayesianas de classificação

Registros relacionados