Classificação de dados híbridos através de algoritmos evolucionários

Detalhes bibliográficos
Autor(a) principal: Marconi de Arruda Pereira
Data de Publicação: 2012
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/BUOS-9AYG7M
Resumo: A mineração de dados tem se tornado uma aliada do tomador de decisão atual, tanto nas grandes quanto nas pequenas corporações: informações não triviais são identificadas de maneira a possibilitar correções e ajustes nas estratégias econômicas e administrativas. Aliando-se a este fato, vê-se um grande crescimento no uso de informações georreferenciadas, de maneira que a mineração de dados convencional já não é capaz de responder a todas às questões de uma corporação. A pesquisa bibliográfica realizada no contexto deste trabalho mostrou que ainda existem poucos métodos capazes de extrair conhecimento a partir de dados híbridos, principalmente quando se trata de dados convencionais (numéricos e textuais) e geográficos (pontos, linhas e polígonos). O objetivo principal deste trabalho consiste no desenvolvimento de novos algoritmos que sejam capazes de explorar todos os atributos, convencionais ou geográficos, de um banco de dados, visando extrair as informações relevantes. Os algoritmos evolucionários foram escolhidos como ponto de partida para a elaboração desses novos algoritmos, pelos seguintes motivos: (a) são flexíveis, uma vez que podem ser aplicados em diversos contextos; (b) são robustos, pois tendem a explorar satisfatoriamente o espaço de busca, encontrando soluções viáveis. Para se alcançar o objetivo proposto, foi elaborado um primeiro algoritmo de obtenção de regras de classificação (NGAE), baseado num Algoritmo Genético, que pode ser aplicado em bancos de dados compostos por dados numéricos. Posteriormente, foi elaborado outro algoritmo (DMGeo), baseado na Programação Genética, que visa obter regras de classificação de padrões que possuem atributos numéricos e atributos geográficos. Finalmente, o DMGeo foi estendido para uma versão multiobjetivo mais robusta e eficiente, chamada MDMGeo. Todos os algoritmos propostos foram comparados com outros algoritmos eficientes na tarefa de classificação de dados, utilizando bancos de dados benchmark além de bancos reais. Os experimentos realizados mostram que o resultado final obtido é um conjunto de ferramentas robusto e eficiente, em particular, quando aplicado sobre dados híbridos.
id UFMG_637ef8e96800a26d09ff7dd9ec629c66
oai_identifier_str oai:repositorio.ufmg.br:1843/BUOS-9AYG7M
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Joao Antonio de VasconcelosClodoveu Augusto Davis JuniorClodoveu Augusto Davis JuniorFelipe Campelo França PintoDouglas Alexandre Gomes VieiraMarco Antonio CasanovaLuiz lebensztajnMarconi de Arruda Pereira2019-08-14T01:18:03Z2019-08-14T01:18:03Z2012-09-28http://hdl.handle.net/1843/BUOS-9AYG7MA mineração de dados tem se tornado uma aliada do tomador de decisão atual, tanto nas grandes quanto nas pequenas corporações: informações não triviais são identificadas de maneira a possibilitar correções e ajustes nas estratégias econômicas e administrativas. Aliando-se a este fato, vê-se um grande crescimento no uso de informações georreferenciadas, de maneira que a mineração de dados convencional já não é capaz de responder a todas às questões de uma corporação. A pesquisa bibliográfica realizada no contexto deste trabalho mostrou que ainda existem poucos métodos capazes de extrair conhecimento a partir de dados híbridos, principalmente quando se trata de dados convencionais (numéricos e textuais) e geográficos (pontos, linhas e polígonos). O objetivo principal deste trabalho consiste no desenvolvimento de novos algoritmos que sejam capazes de explorar todos os atributos, convencionais ou geográficos, de um banco de dados, visando extrair as informações relevantes. Os algoritmos evolucionários foram escolhidos como ponto de partida para a elaboração desses novos algoritmos, pelos seguintes motivos: (a) são flexíveis, uma vez que podem ser aplicados em diversos contextos; (b) são robustos, pois tendem a explorar satisfatoriamente o espaço de busca, encontrando soluções viáveis. Para se alcançar o objetivo proposto, foi elaborado um primeiro algoritmo de obtenção de regras de classificação (NGAE), baseado num Algoritmo Genético, que pode ser aplicado em bancos de dados compostos por dados numéricos. Posteriormente, foi elaborado outro algoritmo (DMGeo), baseado na Programação Genética, que visa obter regras de classificação de padrões que possuem atributos numéricos e atributos geográficos. Finalmente, o DMGeo foi estendido para uma versão multiobjetivo mais robusta e eficiente, chamada MDMGeo. Todos os algoritmos propostos foram comparados com outros algoritmos eficientes na tarefa de classificação de dados, utilizando bancos de dados benchmark além de bancos reais. Os experimentos realizados mostram que o resultado final obtido é um conjunto de ferramentas robusto e eficiente, em particular, quando aplicado sobre dados híbridos.Data mining has become an ally of the decision maker today, in both large and small corporations: nontrivial information is identified in order to allow corrections and adjustments in the economic and administrative actions. Moreover, we can see an increasing use of georeferenced information so that conventional data mining is not able to answer all the questions of a corporation. A survey of geographical data mining showed that there are few tools capable of extracting knowledge from georeferenced data, especially when it comes from a database storing conventional (numerical and textual) and geographical (points, lines and polygons) data. The main objective of this work is to develop new algorithms that are able to explore all the attributes, conventional and geographical, of a database in order to extract relevant information. The evolutionary algorithms were chosen as a starting point for the development of these new algorithms by the following reasons: (a) they are flexible, since they can be applied in different contexts, (b) they are robust, they tend to adequately explore the searching space, finding viable solutions. To achieve our objective the first algorithm described in the thesis obtains classification rules (NGAE) based on a genetic algorithm, which can be applied to databases storing numeric data. The second algorithm (DMGeo) is based on genetic programming, which aims to obtain classification rules for patterns that have numerical and spatial attributes. Finally, DMGeo has progressed to a multiobjective version, more robust and efficient, called MDMGeo. All proposed algorithms were compared with other efficient algorithms applied to classification problems, using benchmark datasets and real datasets. Experiments show that the final result is a set of robust and efficient tools, in particular, when applied to a database composed by hybrid attributes.Universidade Federal de Minas GeraisUFMGEngenharia elétricaEngenharia ElétricaClassificação de dados híbridos através de algoritmos evolucionáriosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALmarconi_de_arruda_pereira_tese.pdfapplication/pdf2345081https://repositorio.ufmg.br/bitstream/1843/BUOS-9AYG7M/1/marconi_de_arruda_pereira_tese.pdf31caa8a9fc3f5a3b4a5dbf3d8d25628eMD51TEXTmarconi_de_arruda_pereira_tese.pdf.txtmarconi_de_arruda_pereira_tese.pdf.txtExtracted texttext/plain265781https://repositorio.ufmg.br/bitstream/1843/BUOS-9AYG7M/2/marconi_de_arruda_pereira_tese.pdf.txtb054492b8b95bf6f89d7f2db6811ab24MD521843/BUOS-9AYG7M2019-11-14 17:15:59.716oai:repositorio.ufmg.br:1843/BUOS-9AYG7MRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:15:59Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Classificação de dados híbridos através de algoritmos evolucionários
title Classificação de dados híbridos através de algoritmos evolucionários
spellingShingle Classificação de dados híbridos através de algoritmos evolucionários
Marconi de Arruda Pereira
Engenharia Elétrica
Engenharia elétrica
title_short Classificação de dados híbridos através de algoritmos evolucionários
title_full Classificação de dados híbridos através de algoritmos evolucionários
title_fullStr Classificação de dados híbridos através de algoritmos evolucionários
title_full_unstemmed Classificação de dados híbridos através de algoritmos evolucionários
title_sort Classificação de dados híbridos através de algoritmos evolucionários
author Marconi de Arruda Pereira
author_facet Marconi de Arruda Pereira
author_role author
dc.contributor.advisor1.fl_str_mv Joao Antonio de Vasconcelos
dc.contributor.advisor-co1.fl_str_mv Clodoveu Augusto Davis Junior
dc.contributor.referee1.fl_str_mv Clodoveu Augusto Davis Junior
dc.contributor.referee2.fl_str_mv Felipe Campelo França Pinto
dc.contributor.referee3.fl_str_mv Douglas Alexandre Gomes Vieira
dc.contributor.referee4.fl_str_mv Marco Antonio Casanova
dc.contributor.referee5.fl_str_mv Luiz lebensztajn
dc.contributor.author.fl_str_mv Marconi de Arruda Pereira
contributor_str_mv Joao Antonio de Vasconcelos
Clodoveu Augusto Davis Junior
Clodoveu Augusto Davis Junior
Felipe Campelo França Pinto
Douglas Alexandre Gomes Vieira
Marco Antonio Casanova
Luiz lebensztajn
dc.subject.por.fl_str_mv Engenharia Elétrica
topic Engenharia Elétrica
Engenharia elétrica
dc.subject.other.pt_BR.fl_str_mv Engenharia elétrica
description A mineração de dados tem se tornado uma aliada do tomador de decisão atual, tanto nas grandes quanto nas pequenas corporações: informações não triviais são identificadas de maneira a possibilitar correções e ajustes nas estratégias econômicas e administrativas. Aliando-se a este fato, vê-se um grande crescimento no uso de informações georreferenciadas, de maneira que a mineração de dados convencional já não é capaz de responder a todas às questões de uma corporação. A pesquisa bibliográfica realizada no contexto deste trabalho mostrou que ainda existem poucos métodos capazes de extrair conhecimento a partir de dados híbridos, principalmente quando se trata de dados convencionais (numéricos e textuais) e geográficos (pontos, linhas e polígonos). O objetivo principal deste trabalho consiste no desenvolvimento de novos algoritmos que sejam capazes de explorar todos os atributos, convencionais ou geográficos, de um banco de dados, visando extrair as informações relevantes. Os algoritmos evolucionários foram escolhidos como ponto de partida para a elaboração desses novos algoritmos, pelos seguintes motivos: (a) são flexíveis, uma vez que podem ser aplicados em diversos contextos; (b) são robustos, pois tendem a explorar satisfatoriamente o espaço de busca, encontrando soluções viáveis. Para se alcançar o objetivo proposto, foi elaborado um primeiro algoritmo de obtenção de regras de classificação (NGAE), baseado num Algoritmo Genético, que pode ser aplicado em bancos de dados compostos por dados numéricos. Posteriormente, foi elaborado outro algoritmo (DMGeo), baseado na Programação Genética, que visa obter regras de classificação de padrões que possuem atributos numéricos e atributos geográficos. Finalmente, o DMGeo foi estendido para uma versão multiobjetivo mais robusta e eficiente, chamada MDMGeo. Todos os algoritmos propostos foram comparados com outros algoritmos eficientes na tarefa de classificação de dados, utilizando bancos de dados benchmark além de bancos reais. Os experimentos realizados mostram que o resultado final obtido é um conjunto de ferramentas robusto e eficiente, em particular, quando aplicado sobre dados híbridos.
publishDate 2012
dc.date.issued.fl_str_mv 2012-09-28
dc.date.accessioned.fl_str_mv 2019-08-14T01:18:03Z
dc.date.available.fl_str_mv 2019-08-14T01:18:03Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/BUOS-9AYG7M
url http://hdl.handle.net/1843/BUOS-9AYG7M
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/BUOS-9AYG7M/1/marconi_de_arruda_pereira_tese.pdf
https://repositorio.ufmg.br/bitstream/1843/BUOS-9AYG7M/2/marconi_de_arruda_pereira_tese.pdf.txt
bitstream.checksum.fl_str_mv 31caa8a9fc3f5a3b4a5dbf3d8d25628e
b054492b8b95bf6f89d7f2db6811ab24
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589312471629824