Um novo algoritmo imunológico artificial para agrupamento de dados

Detalhes bibliográficos
Autor(a) principal: Borges, Ederson
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do Mackenzie
Texto Completo: http://dspace.mackenzie.br/handle/10899/24414
Resumo: Clustering is an important data mining task from the field of Knowledge Discovery in Databases. There are several algorithms capable of performing clustering tasks, and the most popular ones involve the calculation of a similarity or distance measure among objects from the database. Many algorithms can perform clustering in a simple and efficient manner, but have drawbacks as a way to get the optimal number of partitions and the possibility of getting stuck in local optima solutions. To try and reduce these drawbacks this dissertation proposes a new clustering algorithm based on Artificial Immune Systems. This algorithm is characterized by the generation of multiple simultaneous high quality solutions in terms of the number of partitions (clusters) for the database and the use of a cost function that explicitly evaluates the quality of partitions, minimizing the inconvenience of getting stuck in local optima. The algorithm was tested using four databases known in the literature and obtained satisfactory results in terms of the diversity of solutions, but has a high computational cost compared to other algorithms tested.
id UPM_19b120aa1b8647dae7b20339ac912de9
oai_identifier_str oai:dspace.mackenzie.br:10899/24414
network_acronym_str UPM
network_name_str Biblioteca Digital de Teses e Dissertações do Mackenzie
repository_id_str 10277
spelling 2016-03-15T19:38:14Z2020-05-28T18:08:45Z2010-08-042020-05-28T18:08:45Z2010-01-27http://dspace.mackenzie.br/handle/10899/24414Clustering is an important data mining task from the field of Knowledge Discovery in Databases. There are several algorithms capable of performing clustering tasks, and the most popular ones involve the calculation of a similarity or distance measure among objects from the database. Many algorithms can perform clustering in a simple and efficient manner, but have drawbacks as a way to get the optimal number of partitions and the possibility of getting stuck in local optima solutions. To try and reduce these drawbacks this dissertation proposes a new clustering algorithm based on Artificial Immune Systems. This algorithm is characterized by the generation of multiple simultaneous high quality solutions in terms of the number of partitions (clusters) for the database and the use of a cost function that explicitly evaluates the quality of partitions, minimizing the inconvenience of getting stuck in local optima. The algorithm was tested using four databases known in the literature and obtained satisfactory results in terms of the diversity of solutions, but has a high computational cost compared to other algorithms tested.Agrupamento de dados é uma importante tarefa da mineração de dados e descoberta de conhecimentos em bases de dados. Existem diversos algoritmos capazes de realizar a tarefa de agrupamento de dados, sendo que os mais populares envolvem o cálculo de similaridade ou distância entre objetos da base de dados. Boa parte dos algoritmos pode agrupar os dados de forma simples e eficiente, mas possui inconvenientes como a forma de obter o número ótimo de partições e a possibilidade de ficar preso em ótimos locais. Para tentar diminuir estes inconvenientes essa dissertação propõe um novo Algoritmo Imunológico para Agrupamento de Dados baseado em Sistemas Imunológicos Artificiais. Esse algoritmo é caracterizado pela geração de múltiplas soluções simultâneas de boa qualidade no que tange o número de partições (grupos) para a base de dados e uma função de custo que avalia explicitamente a qualidade dessas partições, minimizando o inconveniente de ficar preso em ótimos locais. O algoritmo foi testado utilizando quatro bases de dados conhecidas na literatura e obteve resultados satisfatórios no que tange a diversidade das soluções encontradas, mas apresentou um custo computacional elevado em relação a outros algoritmos testados.application/pdfporUniversidade Presbiteriana MackenzieEngenharia ElétricaUPMBREngenharia Elétricaagrupamento de dadosdiversidadek-médiasrede imunológica artificialsistemas imunológicos artificiaisclusteringdiversityk-meansartificial immune networkartificial immune systemsCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAUm novo algoritmo imunológico artificial para agrupamento de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisSilva, Leandro Nunes de Castrohttp://lattes.cnpq.br/2741458816539568Oliveira, Pedro Paulo Balbi dehttp://lattes.cnpq.br/9556738277476279Gomes, Lalinka Teixeira de Camposhttp://lattes.cnpq.br/9676459879184623http://lattes.cnpq.br/2600519989703553Borges, Edersonhttp://tede.mackenzie.br/jspui/retrieve/3644/Ederson%20Borges.pdf.jpghttp://tede.mackenzie.br/jspui/bitstream/tede/1511/1/Ederson%20Borges.pdfinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIE10899/244142020-05-28 15:08:45.142Biblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRI
dc.title.por.fl_str_mv Um novo algoritmo imunológico artificial para agrupamento de dados
title Um novo algoritmo imunológico artificial para agrupamento de dados
spellingShingle Um novo algoritmo imunológico artificial para agrupamento de dados
Borges, Ederson
agrupamento de dados
diversidade
k-médias
rede imunológica artificial
sistemas imunológicos artificiais
clustering
diversity
k-means
artificial immune network
artificial immune systems
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
title_short Um novo algoritmo imunológico artificial para agrupamento de dados
title_full Um novo algoritmo imunológico artificial para agrupamento de dados
title_fullStr Um novo algoritmo imunológico artificial para agrupamento de dados
title_full_unstemmed Um novo algoritmo imunológico artificial para agrupamento de dados
title_sort Um novo algoritmo imunológico artificial para agrupamento de dados
author Borges, Ederson
author_facet Borges, Ederson
author_role author
dc.contributor.advisor1.fl_str_mv Silva, Leandro Nunes de Castro
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2741458816539568
dc.contributor.referee1.fl_str_mv Oliveira, Pedro Paulo Balbi de
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/9556738277476279
dc.contributor.referee2.fl_str_mv Gomes, Lalinka Teixeira de Campos
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/9676459879184623
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2600519989703553
dc.contributor.author.fl_str_mv Borges, Ederson
contributor_str_mv Silva, Leandro Nunes de Castro
Oliveira, Pedro Paulo Balbi de
Gomes, Lalinka Teixeira de Campos
dc.subject.por.fl_str_mv agrupamento de dados
diversidade
k-médias
rede imunológica artificial
sistemas imunológicos artificiais
topic agrupamento de dados
diversidade
k-médias
rede imunológica artificial
sistemas imunológicos artificiais
clustering
diversity
k-means
artificial immune network
artificial immune systems
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
dc.subject.eng.fl_str_mv clustering
diversity
k-means
artificial immune network
artificial immune systems
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
description Clustering is an important data mining task from the field of Knowledge Discovery in Databases. There are several algorithms capable of performing clustering tasks, and the most popular ones involve the calculation of a similarity or distance measure among objects from the database. Many algorithms can perform clustering in a simple and efficient manner, but have drawbacks as a way to get the optimal number of partitions and the possibility of getting stuck in local optima solutions. To try and reduce these drawbacks this dissertation proposes a new clustering algorithm based on Artificial Immune Systems. This algorithm is characterized by the generation of multiple simultaneous high quality solutions in terms of the number of partitions (clusters) for the database and the use of a cost function that explicitly evaluates the quality of partitions, minimizing the inconvenience of getting stuck in local optima. The algorithm was tested using four databases known in the literature and obtained satisfactory results in terms of the diversity of solutions, but has a high computational cost compared to other algorithms tested.
publishDate 2010
dc.date.available.fl_str_mv 2010-08-04
2020-05-28T18:08:45Z
dc.date.issued.fl_str_mv 2010-01-27
dc.date.accessioned.fl_str_mv 2016-03-15T19:38:14Z
2020-05-28T18:08:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.mackenzie.br/handle/10899/24414
url http://dspace.mackenzie.br/handle/10899/24414
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
dc.publisher.program.fl_str_mv Engenharia Elétrica
dc.publisher.initials.fl_str_mv UPM
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Engenharia Elétrica
publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do Mackenzie
instname:Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron:MACKENZIE
instname_str Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron_str MACKENZIE
institution MACKENZIE
reponame_str Biblioteca Digital de Teses e Dissertações do Mackenzie
collection Biblioteca Digital de Teses e Dissertações do Mackenzie
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1757177239504420864