Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do Mackenzie |
Texto Completo: | http://dspace.mackenzie.br/handle/10899/24259 |
Resumo: | Data clustering is an important data mining task that aims to segment a database into groups of objects based on their similarity or dissimilarity. Due to the unsupervised nature of clustering, the search for a good quality solution can become a complex process. There is currently a wide range of clustering algorithms and selecting the most suitable one for a given problem can be a slow and costly process. In 1976, Rice formulated the algorithm selection problem (PSA) postulating that a good performance algorithm can be chosen according to the problem s structural characteristics. Meta-learning brings the concept of learning about learning, that is, the meta-knowledge obtained from the algorithms learning process allows it to improve its performance. Meta-learning has a major intersection with data mining in classification problems, where it is used to select algorithms. This thesis proposes an approach to the algorithm selection problem by using meta-learning techniques for clustering. The characterization of 84 problems is performed by a classical approach, based on the problems, and a new proposal based on the similarity among the objects. Ten internal indices are used to provide different performance assessments of seven algorithms, where the combination of the indices determine the ranking for the algorithms. Several analyzes are performed in order to assess the quality of the obtained meta-knowledge in facilitating the mapping between the problem s features and the performance of the algorithms. The results show that the new characterization approach and method to combine the indices provide a good quality algorithm selection mechanism for data clustering problems. |
id |
UPM_f62c19efcc1fb0dd890ffb709d2c94d8 |
---|---|
oai_identifier_str |
oai:dspace.mackenzie.br:10899/24259 |
network_acronym_str |
UPM |
network_name_str |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
repository_id_str |
10277 |
spelling |
2016-03-15T19:38:50Z2020-05-28T18:07:56Z2014-06-302020-05-28T18:07:56Z2014-03-27FERRARI, Daniel Gomes. Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem. 2014. 204 f. Tese (Doutorado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014.http://dspace.mackenzie.br/handle/10899/24259Data clustering is an important data mining task that aims to segment a database into groups of objects based on their similarity or dissimilarity. Due to the unsupervised nature of clustering, the search for a good quality solution can become a complex process. There is currently a wide range of clustering algorithms and selecting the most suitable one for a given problem can be a slow and costly process. In 1976, Rice formulated the algorithm selection problem (PSA) postulating that a good performance algorithm can be chosen according to the problem s structural characteristics. Meta-learning brings the concept of learning about learning, that is, the meta-knowledge obtained from the algorithms learning process allows it to improve its performance. Meta-learning has a major intersection with data mining in classification problems, where it is used to select algorithms. This thesis proposes an approach to the algorithm selection problem by using meta-learning techniques for clustering. The characterization of 84 problems is performed by a classical approach, based on the problems, and a new proposal based on the similarity among the objects. Ten internal indices are used to provide different performance assessments of seven algorithms, where the combination of the indices determine the ranking for the algorithms. Several analyzes are performed in order to assess the quality of the obtained meta-knowledge in facilitating the mapping between the problem s features and the performance of the algorithms. The results show that the new characterization approach and method to combine the indices provide a good quality algorithm selection mechanism for data clustering problems.Agrupamento é uma tarefa importante na mineração de dados, tendo como objetivo segmentar uma base de dados em grupos de objetos baseando-se na similaridade ou dissimilaridade entre os mesmos. Devido à natureza não supervisionada da tarefa, a busca por uma solução de boa qualidade pode se tornar um processo complexo. Atualmente, existe na literatura acadêmica uma grande quantidade de algoritmos que podem ser utilizados na resolução deste problema. A seleção do algoritmo mais adequado para um determinado problema pode ser um processo lento e custoso. Em 1976, Rice formulou o Problema de Seleção de Algoritmos (PSA), postulando que um algoritmo de bom desempenho pode ser escolhido de acordo com as características estruturais do problema em que o mesmo será aplicado. A meta-aprendizagem traz consigo o conceito de aprender sobre o aprender, isto é, por meio do meta-conhecimento obtido do processo de aprendizagem dos algoritmos é possível aprimorar o desempenho do processo. Meta-aprendizagem possui grande interseção com mineração de dados no que tange problemas de classificação, sendo utilizada no desenvolvimento de sistemas de seleção de algoritmos. Nesta tese é proposta a abordagem ao PSA por meio de técnicas de meta-aprendizagem para agrupamento de dados. A caracterização de 84 problemas é realizada pela abordagem clássica, baseada nos problemas, e por uma nova proposta baseada na similaridade entre os objetos. São utilizados dez índices internos para promover diferentes avaliações do desempenho de sete algoritmos, onde a combinação desses índices determina o ranking dos algoritmos. São realizadas diversas análises no intuito de avaliar a qualidade do meta-conhecimento obtido em viabilizar o mapeamento entre as características do problema e o desempenho dos algoritmos. Os resultados mostram que a nova caracterização e combinação dos índices proporcionam a seleção, com qualidade, de algoritmos para agrupamento de dados.Natcomp Informatica e Equipamentos Eletronicos LTDAapplication/pdfporUniversidade Presbiteriana MackenzieEngenharia ElétricaUPMBREngenharia Elétricaagrupamento de dadosmeta-aprendizagemmeta-conhecimentoseleção de algoritmosdata clusteringmeta-learningmeta-knowledgealgorithm selectionCNPQ::ENGENHARIAS::ENGENHARIA ELETRICASeleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizageminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisSilva, Leandro Nunes de Castrohttp://lattes.cnpq.br/2741458816539568Omar, Nizamhttp://lattes.cnpq.br/2067336430076971Silva, Leandro Augusto dahttp://lattes.cnpq.br/1396385111251741Carvalho, André Carlos Ponce de Leon Ferreira dehttp://lattes.cnpq.br/9674541381385819Medeiros, Claudia Maria Bauzerhttp://lattes.cnpq.br/4643608666899616http://lattes.cnpq.br/2650691713057509Ferrari, Daniel Gomeshttp://tede.mackenzie.br/jspui/retrieve/3809/Daniel%20Gomes%20Ferrari.pdf.jpghttp://tede.mackenzie.br/jspui/bitstream/tede/1523/1/Daniel%20Gomes%20Ferrari.pdfinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIE10899/242592020-05-28 15:07:56.947Biblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRI |
dc.title.por.fl_str_mv |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem |
title |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem |
spellingShingle |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem Ferrari, Daniel Gomes agrupamento de dados meta-aprendizagem meta-conhecimento seleção de algoritmos data clustering meta-learning meta-knowledge algorithm selection CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
title_short |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem |
title_full |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem |
title_fullStr |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem |
title_full_unstemmed |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem |
title_sort |
Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem |
author |
Ferrari, Daniel Gomes |
author_facet |
Ferrari, Daniel Gomes |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Silva, Leandro Nunes de Castro |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2741458816539568 |
dc.contributor.referee1.fl_str_mv |
Omar, Nizam |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/2067336430076971 |
dc.contributor.referee2.fl_str_mv |
Silva, Leandro Augusto da |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/1396385111251741 |
dc.contributor.referee3.fl_str_mv |
Carvalho, André Carlos Ponce de Leon Ferreira de |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/9674541381385819 |
dc.contributor.referee4.fl_str_mv |
Medeiros, Claudia Maria Bauzer |
dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/4643608666899616 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2650691713057509 |
dc.contributor.author.fl_str_mv |
Ferrari, Daniel Gomes |
contributor_str_mv |
Silva, Leandro Nunes de Castro Omar, Nizam Silva, Leandro Augusto da Carvalho, André Carlos Ponce de Leon Ferreira de Medeiros, Claudia Maria Bauzer |
dc.subject.por.fl_str_mv |
agrupamento de dados meta-aprendizagem meta-conhecimento seleção de algoritmos |
topic |
agrupamento de dados meta-aprendizagem meta-conhecimento seleção de algoritmos data clustering meta-learning meta-knowledge algorithm selection CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
dc.subject.eng.fl_str_mv |
data clustering meta-learning meta-knowledge algorithm selection |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
description |
Data clustering is an important data mining task that aims to segment a database into groups of objects based on their similarity or dissimilarity. Due to the unsupervised nature of clustering, the search for a good quality solution can become a complex process. There is currently a wide range of clustering algorithms and selecting the most suitable one for a given problem can be a slow and costly process. In 1976, Rice formulated the algorithm selection problem (PSA) postulating that a good performance algorithm can be chosen according to the problem s structural characteristics. Meta-learning brings the concept of learning about learning, that is, the meta-knowledge obtained from the algorithms learning process allows it to improve its performance. Meta-learning has a major intersection with data mining in classification problems, where it is used to select algorithms. This thesis proposes an approach to the algorithm selection problem by using meta-learning techniques for clustering. The characterization of 84 problems is performed by a classical approach, based on the problems, and a new proposal based on the similarity among the objects. Ten internal indices are used to provide different performance assessments of seven algorithms, where the combination of the indices determine the ranking for the algorithms. Several analyzes are performed in order to assess the quality of the obtained meta-knowledge in facilitating the mapping between the problem s features and the performance of the algorithms. The results show that the new characterization approach and method to combine the indices provide a good quality algorithm selection mechanism for data clustering problems. |
publishDate |
2014 |
dc.date.available.fl_str_mv |
2014-06-30 2020-05-28T18:07:56Z |
dc.date.issued.fl_str_mv |
2014-03-27 |
dc.date.accessioned.fl_str_mv |
2016-03-15T19:38:50Z 2020-05-28T18:07:56Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FERRARI, Daniel Gomes. Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem. 2014. 204 f. Tese (Doutorado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014. |
dc.identifier.uri.fl_str_mv |
http://dspace.mackenzie.br/handle/10899/24259 |
identifier_str_mv |
FERRARI, Daniel Gomes. Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem. 2014. 204 f. Tese (Doutorado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014. |
url |
http://dspace.mackenzie.br/handle/10899/24259 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Presbiteriana Mackenzie |
dc.publisher.program.fl_str_mv |
Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
UPM |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Engenharia Elétrica |
publisher.none.fl_str_mv |
Universidade Presbiteriana Mackenzie |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do Mackenzie instname:Universidade Presbiteriana Mackenzie (MACKENZIE) instacron:MACKENZIE |
instname_str |
Universidade Presbiteriana Mackenzie (MACKENZIE) |
instacron_str |
MACKENZIE |
institution |
MACKENZIE |
reponame_str |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
collection |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
repository.name.fl_str_mv |
|
repository.mail.fl_str_mv |
|
_version_ |
1757177220360568832 |