O uso de algoritmos genéticos para a solução de problemas de agrupamento automático

Detalhes bibliográficos
Autor(a) principal: Lima, Suzane Pereira
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRRJ
Texto Completo: https://rima.ufrrj.br/jspui/handle/20.500.14407/14340
Resumo: Técnicas de agrupamento de dados consistem na organização de um conjunto de informações em grupos de acordo com as similaridades presentes em seus registros, assim propriedades comuns entre o conjunto de dados conseguem ser identificadas facilitando a sua compreensão. Nem sempre o número de grupos é um dado disponível a priori para a resolução desse processo. Quando esta informação é desconhecida tem-se o denominado Problema de Agrupamento Automático. Neste trabalho são apresentadas estratégias para a resolução deste problema, tendo como base a meta-heurística Algoritmo Genético. Sabendo que a qualidade de um agrupamento pode ser influenciada pelo modo como são gerados os grupos iniciais e pela escolha da função de avaliação das soluções, diferentes procedimentos são propostos a partir de um método já existente com o objetivo de gerar resoluções de melhor qualidade. Experimentos foram aplicados às propostas para diversos conjuntos de dados. Os resultados obtidos são comparados entre si e com outros trabalhos da literatura.
id UFRRJ-1_71bae069b06762a5598876269f06e1c7
oai_identifier_str oai:rima.ufrrj.br:20.500.14407/14340
network_acronym_str UFRRJ-1
network_name_str Repositório Institucional da UFRRJ
repository_id_str
spelling Lima, Suzane PereiraCruz, Marcelo DibCPF: 016.628.007-03Vianna, Gizelle KupacTassinari, Wagner de SouzaCPF: 146.054.587-78http://lattes.cnpq.br/79712422190428552023-12-22T03:00:02Z2023-12-22T03:00:02Z2019-07-30LIMA, Suzane Pereira. O uso de algoritmos genéticos para a solução de problemas de agrupamento automático. 2019. 92 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica, 2019.https://rima.ufrrj.br/jspui/handle/20.500.14407/14340Técnicas de agrupamento de dados consistem na organização de um conjunto de informações em grupos de acordo com as similaridades presentes em seus registros, assim propriedades comuns entre o conjunto de dados conseguem ser identificadas facilitando a sua compreensão. Nem sempre o número de grupos é um dado disponível a priori para a resolução desse processo. Quando esta informação é desconhecida tem-se o denominado Problema de Agrupamento Automático. Neste trabalho são apresentadas estratégias para a resolução deste problema, tendo como base a meta-heurística Algoritmo Genético. Sabendo que a qualidade de um agrupamento pode ser influenciada pelo modo como são gerados os grupos iniciais e pela escolha da função de avaliação das soluções, diferentes procedimentos são propostos a partir de um método já existente com o objetivo de gerar resoluções de melhor qualidade. Experimentos foram aplicados às propostas para diversos conjuntos de dados. Os resultados obtidos são comparados entre si e com outros trabalhos da literatura.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorThe Clustering consists to organize a set of information into groups according to the similarities present in their records, so that common properties between the data can be identified for easy understanding. Sometimes the number of groups is a unavailable data for the resolution of this process. When this information is unknown a priori we have the so-called Automatic Clustering Problem. In this work are presented algorithms to solve this problem, based on the meta-heuristic Genetic Algorithm. The quality of a Clustering can be affected by the way the initial groups are generated and by the choice of the cluster validity index, different methods are proposed based on an already existing methodology with the purpose of generating better quality resolutions. Experiments were applied to proposed approaches for several data sets. The obtained results are compared with each other and with other works of the literature.application/pdfporUniversidade Federal Rural do Rio de JaneiroPrograma de Pós-Graduação em Modelagem Matemática e ComputacionalUFRRJBrasilInstituto de Ciências ExatasProblema de Agrupamento AutomáticoHeurísticasOtimizaçãoAutomatic Clustering ProblemHeuristicsOptimizationCiência da ComputaçãoMatemáticaO uso de algoritmos genéticos para a solução de problemas de agrupamento automáticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis[1] Clustering basic benchmark. Disponível em: http://cs.joensuu.fi/sipu/datasets/; Acessado em 04 de Abril de 2018. [2] Machine learning repository. Disponível em: http://archive.ics.uci.edu/ml/index.php; Acessado em 13 de Julho de 2017. [3] ANARI, B., TORKESTANI, J. A., E RAHMANI, A. Automatic data clustering using continuous action-set learning automata and its application in segmentation of images. Applied Soft Computing 51 (2017), 253–265. [4] ARENALES, M., MORABITO, R., ARMENTANO, V., E YANASSE, H. Pesquisa operacional: Para cursos de engenharia. Elsevier Brasil, 2015. [5] BECKER, J. L. Estatística básica: transformando dados em informação. Bookman Editora, 2015. [6] BERKHIN, P. A survey of clustering data mining techniques. In Grouping multidimensional data. Springer, 2006, pp. 25–71. [7] BRITO, J. D. M., E MONTENEGRO, F. M. T. Aplicações de Técnicas de Pesquisa Operacional em Problemas de Agrupamento do IBGE. População, espaço e sustentabilidade: contribuições para o desenvolvimento do Brasil, 01 2015, pp. 15–33. [8] CALI´NSKI, T., E HARABASZ, J. A dendrite method for cluster analysis. Communications in Statistics-theory and Methods 3, 1 (1974), 1–27. [9] CHARU, C. A., E CHANDAN, K. R. Data clustering: algorithms and applications. Chapman and Hall/CRC Boca Raton, 2013. [10] CHOU, C.-H., SU, M.-C., E LAI, E. A new cluster validity measure and its application to image compression. Pattern Analysis and Applications 7, 2 (2004), 205–220. [11] CRUZ, M. D. O problema de clusterização automática. PhD thesis, COPPE/UFRJ, Rio de Janeiro, 2010. [12] DAS, S., ABRAHAM, A., E KONAR, A. Automatic clustering using an improved differential evolution algorithm. IEEE Transactions on systems, man, and cybernetics-Part A: Systems and Humans 38, 1 (2008), 218–237. [13] DAS, S., CHOWDHURY, A., E ABRAHAM, A. A bacterial evolutionary algorithm for automatic data clustering. In 2009 IEEE Congress on Evolutionary Computation (2009), IEEE, pp. 2403–2410. [14] DAVIES, D. L., E BOULDIN, D. W. A cluster separation measure. IEEE transactions on pattern analysis and machine intelligence, 2 (1979), 224–227. [15] DOVAL, D., MANCORIDIS, S., E MITCHELL, B. S. Automatic clustering of software systems using a genetic algorithm. In STEP’99. Proceedings Ninth International Workshop Software Technology and Engineering Practice (1999), IEEE, pp. 73–81. [16] DUNN, J. C. A fuzzy relative of the isodata process and its use in detecting compact wellseparated clusters. Journal of Cybernetics (1973). [17] FERRARI, D. G., E SILVA, L. N. D. C. Introdução a mineração de dados. Editora Saraiva, 2017. [18] FISHER, R. A. The use of multiple measurements in taxonomic problems. Annals of eugenics 7, 2 (1936), 179–188. [19] GAN, G., MA, C., E WU, J. Data clustering: theory, algorithms, and applications, vol. 20. Siam, 2007. [20] GOLDSCHMIDT, R. R. Uma Introdução à Inteligência Computacional: fundamentos, ferramentas e aplicações. IST-Rio, 2010. [21] GOLDSCHMIDT, R. R. Tópicos Especiais em Inteligência Computacional. IST-Rio, 2011. [22] HANSEN, P., E JAUMARD, B. Cluster analysis and mathematical programming. Mathematical programming 79, 1-3 (1997), 191–215. [23] HARSH, A., E BALL, J. E. Automatic k-expectation maximization (a k-em) algorithm for data mining applications. Journal of Computations & Modelling 6, 3 (2016), 43–85. [24] HE, H., E TAN, Y. A two-stage genetic algorithm for automatic clustering. Neurocomputing 81 (2012), 49–59. [25] HILLIER, F. S., E LIEBERMAN, G. J. Introdução à pesquisa operacional. McGraw Hill Brasil, 2013. [26] JAIN, A. K., DUBES, R. C., E OTHERS. Algorithms for clustering data, vol. 6. Prentice hall Englewood Cliffs, 1988. [27] JAIN, A. K., MURTY, M. N., E FLYNN, P. J. Data clustering: a review. ACM computing surveys (CSUR) 31, 3 (1999), 264–323. [28] JOSÉ-GARCÍA, A., E GÓMEZ-FLORES, W. Automatic clustering using nature-inspired metaheuristics: A survey. Applied Soft Computing 41 (2016), 192–213. [29] KETTANI, O., RAMDANI, F., E TADILI, B. Ak-means: an automatic clustering algorithm based on k-means. Journal of Advanced Computer Science & Technology 4, 2 (2015), 231. [30] KUDOVA, P. Clustering genetic algorithm. In 18th International Workshop on Database and Expert Systems Applications (DEXA 2007) (2007), IEEE, pp. 138–142. [31] KUNDU, D., SURESH, K., GHOSH, S., DAS, S., ABRAHAM, A., E BADR, Y. Automatic clustering using a synergy of genetic algorithm and multi-objective differential evolution. In International Conference on Hybrid Artificial Intelligence Systems (2009), Springer, pp. 177–186. [32] KUO, R., HUANG, Y., LIN, C.-C., WU, Y.-H., E ZULVIA, F. E. Automatic kernel clustering with bee colony optimization algorithm. Information Sciences 283 (2014), 107–122. [33] LINDEN, R. Algoritmos genéticos (2a ediçao). Brasport, 2008. [34] LINDEN, R. Técnicas de agrupamento. Revista de Sistemas de Informação da FSMA 4 (2009), 18–36. [35] LIU, Y., WU, X., E SHEN, Y. Automatic clustering using genetic algorithms. Applied mathematics and computation 218, 4 (2011), 1267–1279. [36] LOESCH, C., E HEIN, N. Pesquisa operacional. Editora Saraiva, 2009. [37] LOESCH, C., E HOELTGEBAUM, M. Métodos estatísticos multivariados. Editora Saraiva, 2017. [38] MARONNA, R., E JACOVKIS, P. M. Multivariate clustering procedures with variable metrics. Biometrics (1974), 499–505. [39] MARTINEZ, J. M., E SANTOS, S. A. Métodos computacionais de otimização. In XX Colóquio Brasileiro de Matemática, IMPA (1995). [40] MAULIK, U., E BANDYOPADHYAY, S. Genetic algorithm-based clustering technique. Pattern recognition 33, 9 (2000), 1455–1465. [41] MAULIK, U., E BANDYOPADHYAY, S. Performance evaluation of some clustering algorithms and validity indices. IEEE Transactions on pattern analysis and machine intelligence 24, 12 (2002), 1650–1654. [42] MISHRA, S., SAHA, S., E MONDAL, S. A multiobjective optimization based entity matching technique for bibliographic databases. Expert Systems with Applications 65 (2016), 100–115. [43] MITCHELL, M. An introduction to genetic algorithms. MIT press, 1998. [44] NANDA, S. J., E PANDA, G. A survey on nature inspired metaheuristic algorithms for partitional clustering. Swarm and Evolutionary computation 16 (2014), 1–18. [45] OCHI, L. S., DIAS, C. R., E SOARES, S. S. F. Clusterização em mineração de dados. Instituto de Computação-Universidade Federal Fluminense-Niterói (2004), 26. [46] PACHECO, T. M., BRUGIOLO, L., STRÖELE, V., E SÃ, S. Metaheurística inspirada no comportamento das formigas aplicada ao problema de agrupamento. In XIII Congresso Brasileiro de Inteligência Computacional (2017). [47] PAL, N. R., E BEZDEK, J. C. On cluster validity for the fuzzy c-means model. IEEE Transactions on Fuzzy systems 3, 3 (1995), 370–379. [48] QUEIROGA, E. V., SUBRAMANIAN, A., E CABRAL, L. D. A. F. Abordagem baseada em continuous grasp para clusterização de dados. In XLVIII SBPO (2016). [49] RAPOSO, C., ANTUNES, C. H., E BARRETO, J. P. Automatic clustering using a genetic algorithm with new solution encoding and operators. In International Conference on Computational Science and Its Applications (2014), Springer, pp. 92–103. [50] REZENDE, S. O., MARCACINI, R. M., E MOURA, M. F. O uso da mineração de textos para extração e organização não supervisionada de conhecimento. Embrapa Informática Agropecuária-Artigo em periódico indexado (ALICE) (2011). [51] RODRIGUES, W. C., FADEL, A. C., SEMAAN, G. S., E BRITO, J. A. D. M. Um novo método baseado em grade e densidade com tratamento de ruídos para a identificação do número ideal de grupos. In XLVIII SBPO (2016). [52] ROUSSEEUW, P. J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics 20 (1987), 53–65. [53] RUSPINI, E. H. Numerical methods for fuzzy clustering. Information Sciences 2, 3 (1970), 319–350. [54] SCHWAAB, M. Análise de Dados Experimentais: I. Fundamentos de Estatística e Estimação de Parâmetros. Editora E-papers, 2007. [55] SEMAAN, G. S., CRUZ, M. D., BRITO, G. D. M., E OCHI, L. S. Proposta de um métodode classificação baseado em densidade para a determinação do número ideal de grupos em problemas de clusterização. Journal of the Brazilian Computational Intelligence Society 10, 4 (2012), 242–262. [56] SEMAAN, G. S., FADEL, A. C., DE MOURA BRITO, J. A., E OCHI, L. S. Uma heurística baseada em densidade para o problema de agrupamento automático. Blucher Marine Engineering Proceedings 2, 1 (2016), 100–112. [57] THEODORIDIS, S., E KOUTROUMBAS, K. Pattern recognition. Second Edition. Elsevier, 2003. [58] TSENG, L. Y., E YANG, S. B. A genetic approach to the automatic clustering problem. Pattern recognition 34, 2 (2001), 415–424. [59] VEENMAN, C. J., REINDERS, M. J. T., E BACKER, E. A maximum variance cluster algorithm. IEEE Transactions on pattern analysis and machine intelligence 24, 9 (2002), 1273–1280. [60] WANG, X., QIU, W., E ZAMAR, R. H. Clues: A non-parametric clustering method based on local shrinking. Computational Statistics & Data Analysis 52, 1 (2007), 286–298.https://tede.ufrrj.br/retrieve/67578/2019%20-%20Suzane%20Pereira%20Lima.pdf.jpghttps://tede.ufrrj.br/jspui/handle/jspui/5245Submitted by Jorge Silva (jorgelmsilva@ufrrj.br) on 2021-11-20T22:24:54Z No. of bitstreams: 1 2019 - Suzane Pereira Lima.pdf: 2995803 bytes, checksum: aeb78744da9f2f8ed596bb13477fde62 (MD5)Made available in DSpace on 2021-11-20T22:24:57Z (GMT). No. of bitstreams: 1 2019 - Suzane Pereira Lima.pdf: 2995803 bytes, checksum: aeb78744da9f2f8ed596bb13477fde62 (MD5) Previous issue date: 2019-07-30info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRRJinstname:Universidade Federal Rural do Rio de Janeiro (UFRRJ)instacron:UFRRJTHUMBNAIL2019 - Suzane Pereira Lima.pdf.jpgGenerated Thumbnailimage/jpeg3736https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/1/2019%20-%20Suzane%20Pereira%20Lima.pdf.jpg5a8c734c99ac9a7b424f097ac631075dMD51TEXT2019 - Suzane Pereira Lima.pdf.txtExtracted Texttext/plain197047https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/2/2019%20-%20Suzane%20Pereira%20Lima.pdf.txte0cc625e112acde9e802f076ed13af25MD52ORIGINAL2019 - Suzane Pereira Lima.pdfapplication/pdf2995803https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/3/2019%20-%20Suzane%20Pereira%20Lima.pdfaeb78744da9f2f8ed596bb13477fde62MD53LICENSElicense.txttext/plain2089https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/4/license.txt7b5ba3d2445355f386edab96125d42b7MD5420.500.14407/143402023-12-22 00:00:02.247oai:rima.ufrrj.br:20.500.14407/14340Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSP1BSSUEgTElDRU4/QQpFc3RhIGxpY2VuP2EgZGUgZXhlbXBsbyA/IGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOP0EgREUgRElTVFJJQlVJPz9PIE4/Ty1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YT8/byBkZXN0YSBsaWNlbj9hLCB2b2M/IChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSA/IFVuaXZlcnNpZGFkZSAKWFhYIChTaWdsYSBkYSBVbml2ZXJzaWRhZGUpIG8gZGlyZWl0byBuP28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSAKZGlzdHJpYnVpciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyP25pY28gZSAKZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zID91ZGlvIG91IHY/ZGVvLgoKVm9jPyBjb25jb3JkYSBxdWUgYSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZT9kbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhPz9vLgoKVm9jPyB0YW1iP20gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGM/cGlhIGEgc3VhIHRlc2Ugb3UgCmRpc3NlcnRhPz9vIHBhcmEgZmlucyBkZSBzZWd1cmFuP2EsIGJhY2stdXAgZSBwcmVzZXJ2YT8/by4KClZvYz8gZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byA/IG9yaWdpbmFsIGUgcXVlIHZvYz8gdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgCm5lc3RhIGxpY2VuP2EuIFZvYz8gdGFtYj9tIGRlY2xhcmEgcXVlIG8gZGVwP3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGE/P28gbj9vLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3U/bS4KCkNhc28gYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jPyBuP28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jPyAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzcz9vIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgPyBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgCm9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbj9hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Q/IGNsYXJhbWVudGUgCmlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlP2RvIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgVEVTRSBPVSBESVNTRVJUQT8/TyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0M/TklPIE9VIApBUE9JTyBERSBVTUEgQUc/TkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTj9PIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0M/IERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJUz9PIENPTU8gClRBTUI/TSBBUyBERU1BSVMgT0JSSUdBPz9FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28sIGUgbj9vIGZhcj8gcXVhbHF1ZXIgYWx0ZXJhPz9vLCBhbD9tIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2VuP2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttps://tede.ufrrj.br/PUBhttps://tede.ufrrj.br/oai/requestbibliot@ufrrj.br||bibliot@ufrrj.bropendoar:2023-12-22T03:00:02Biblioteca Digital de Teses e Dissertações da UFRRJ - Universidade Federal Rural do Rio de Janeiro (UFRRJ)false
dc.title.por.fl_str_mv O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
title O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
spellingShingle O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
Lima, Suzane Pereira
Problema de Agrupamento Automático
Heurísticas
Otimização
Automatic Clustering Problem
Heuristics
Optimization
Ciência da Computação
Matemática
title_short O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
title_full O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
title_fullStr O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
title_full_unstemmed O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
title_sort O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
author Lima, Suzane Pereira
author_facet Lima, Suzane Pereira
author_role author
dc.contributor.author.fl_str_mv Lima, Suzane Pereira
dc.contributor.advisor1.fl_str_mv Cruz, Marcelo Dib
dc.contributor.advisor1ID.fl_str_mv CPF: 016.628.007-03
dc.contributor.referee1.fl_str_mv Vianna, Gizelle Kupac
dc.contributor.referee2.fl_str_mv Tassinari, Wagner de Souza
dc.contributor.authorID.fl_str_mv CPF: 146.054.587-78
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7971242219042855
contributor_str_mv Cruz, Marcelo Dib
Vianna, Gizelle Kupac
Tassinari, Wagner de Souza
dc.subject.por.fl_str_mv Problema de Agrupamento Automático
Heurísticas
Otimização
topic Problema de Agrupamento Automático
Heurísticas
Otimização
Automatic Clustering Problem
Heuristics
Optimization
Ciência da Computação
Matemática
dc.subject.eng.fl_str_mv Automatic Clustering Problem
Heuristics
Optimization
dc.subject.cnpq.fl_str_mv Ciência da Computação
Matemática
description Técnicas de agrupamento de dados consistem na organização de um conjunto de informações em grupos de acordo com as similaridades presentes em seus registros, assim propriedades comuns entre o conjunto de dados conseguem ser identificadas facilitando a sua compreensão. Nem sempre o número de grupos é um dado disponível a priori para a resolução desse processo. Quando esta informação é desconhecida tem-se o denominado Problema de Agrupamento Automático. Neste trabalho são apresentadas estratégias para a resolução deste problema, tendo como base a meta-heurística Algoritmo Genético. Sabendo que a qualidade de um agrupamento pode ser influenciada pelo modo como são gerados os grupos iniciais e pela escolha da função de avaliação das soluções, diferentes procedimentos são propostos a partir de um método já existente com o objetivo de gerar resoluções de melhor qualidade. Experimentos foram aplicados às propostas para diversos conjuntos de dados. Os resultados obtidos são comparados entre si e com outros trabalhos da literatura.
publishDate 2019
dc.date.issued.fl_str_mv 2019-07-30
dc.date.accessioned.fl_str_mv 2023-12-22T03:00:02Z
dc.date.available.fl_str_mv 2023-12-22T03:00:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LIMA, Suzane Pereira. O uso de algoritmos genéticos para a solução de problemas de agrupamento automático. 2019. 92 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica, 2019.
dc.identifier.uri.fl_str_mv https://rima.ufrrj.br/jspui/handle/20.500.14407/14340
identifier_str_mv LIMA, Suzane Pereira. O uso de algoritmos genéticos para a solução de problemas de agrupamento automático. 2019. 92 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica, 2019.
url https://rima.ufrrj.br/jspui/handle/20.500.14407/14340
dc.language.iso.fl_str_mv por
language por
dc.relation.references.por.fl_str_mv [1] Clustering basic benchmark. Disponível em: http://cs.joensuu.fi/sipu/datasets/; Acessado em 04 de Abril de 2018. [2] Machine learning repository. Disponível em: http://archive.ics.uci.edu/ml/index.php; Acessado em 13 de Julho de 2017. [3] ANARI, B., TORKESTANI, J. A., E RAHMANI, A. Automatic data clustering using continuous action-set learning automata and its application in segmentation of images. Applied Soft Computing 51 (2017), 253–265. [4] ARENALES, M., MORABITO, R., ARMENTANO, V., E YANASSE, H. Pesquisa operacional: Para cursos de engenharia. Elsevier Brasil, 2015. [5] BECKER, J. L. Estatística básica: transformando dados em informação. Bookman Editora, 2015. [6] BERKHIN, P. A survey of clustering data mining techniques. In Grouping multidimensional data. Springer, 2006, pp. 25–71. [7] BRITO, J. D. M., E MONTENEGRO, F. M. T. Aplicações de Técnicas de Pesquisa Operacional em Problemas de Agrupamento do IBGE. População, espaço e sustentabilidade: contribuições para o desenvolvimento do Brasil, 01 2015, pp. 15–33. [8] CALI´NSKI, T., E HARABASZ, J. A dendrite method for cluster analysis. Communications in Statistics-theory and Methods 3, 1 (1974), 1–27. [9] CHARU, C. A., E CHANDAN, K. R. Data clustering: algorithms and applications. Chapman and Hall/CRC Boca Raton, 2013. [10] CHOU, C.-H., SU, M.-C., E LAI, E. A new cluster validity measure and its application to image compression. Pattern Analysis and Applications 7, 2 (2004), 205–220. [11] CRUZ, M. D. O problema de clusterização automática. PhD thesis, COPPE/UFRJ, Rio de Janeiro, 2010. [12] DAS, S., ABRAHAM, A., E KONAR, A. Automatic clustering using an improved differential evolution algorithm. IEEE Transactions on systems, man, and cybernetics-Part A: Systems and Humans 38, 1 (2008), 218–237. [13] DAS, S., CHOWDHURY, A., E ABRAHAM, A. A bacterial evolutionary algorithm for automatic data clustering. In 2009 IEEE Congress on Evolutionary Computation (2009), IEEE, pp. 2403–2410. [14] DAVIES, D. L., E BOULDIN, D. W. A cluster separation measure. IEEE transactions on pattern analysis and machine intelligence, 2 (1979), 224–227. [15] DOVAL, D., MANCORIDIS, S., E MITCHELL, B. S. Automatic clustering of software systems using a genetic algorithm. In STEP’99. Proceedings Ninth International Workshop Software Technology and Engineering Practice (1999), IEEE, pp. 73–81. [16] DUNN, J. C. A fuzzy relative of the isodata process and its use in detecting compact wellseparated clusters. Journal of Cybernetics (1973). [17] FERRARI, D. G., E SILVA, L. N. D. C. Introdução a mineração de dados. Editora Saraiva, 2017. [18] FISHER, R. A. The use of multiple measurements in taxonomic problems. Annals of eugenics 7, 2 (1936), 179–188. [19] GAN, G., MA, C., E WU, J. Data clustering: theory, algorithms, and applications, vol. 20. Siam, 2007. [20] GOLDSCHMIDT, R. R. Uma Introdução à Inteligência Computacional: fundamentos, ferramentas e aplicações. IST-Rio, 2010. [21] GOLDSCHMIDT, R. R. Tópicos Especiais em Inteligência Computacional. IST-Rio, 2011. [22] HANSEN, P., E JAUMARD, B. Cluster analysis and mathematical programming. Mathematical programming 79, 1-3 (1997), 191–215. [23] HARSH, A., E BALL, J. E. Automatic k-expectation maximization (a k-em) algorithm for data mining applications. Journal of Computations & Modelling 6, 3 (2016), 43–85. [24] HE, H., E TAN, Y. A two-stage genetic algorithm for automatic clustering. Neurocomputing 81 (2012), 49–59. [25] HILLIER, F. S., E LIEBERMAN, G. J. Introdução à pesquisa operacional. McGraw Hill Brasil, 2013. [26] JAIN, A. K., DUBES, R. C., E OTHERS. Algorithms for clustering data, vol. 6. Prentice hall Englewood Cliffs, 1988. [27] JAIN, A. K., MURTY, M. N., E FLYNN, P. J. Data clustering: a review. ACM computing surveys (CSUR) 31, 3 (1999), 264–323. [28] JOSÉ-GARCÍA, A., E GÓMEZ-FLORES, W. Automatic clustering using nature-inspired metaheuristics: A survey. Applied Soft Computing 41 (2016), 192–213. [29] KETTANI, O., RAMDANI, F., E TADILI, B. Ak-means: an automatic clustering algorithm based on k-means. Journal of Advanced Computer Science & Technology 4, 2 (2015), 231. [30] KUDOVA, P. Clustering genetic algorithm. In 18th International Workshop on Database and Expert Systems Applications (DEXA 2007) (2007), IEEE, pp. 138–142. [31] KUNDU, D., SURESH, K., GHOSH, S., DAS, S., ABRAHAM, A., E BADR, Y. Automatic clustering using a synergy of genetic algorithm and multi-objective differential evolution. In International Conference on Hybrid Artificial Intelligence Systems (2009), Springer, pp. 177–186. [32] KUO, R., HUANG, Y., LIN, C.-C., WU, Y.-H., E ZULVIA, F. E. Automatic kernel clustering with bee colony optimization algorithm. Information Sciences 283 (2014), 107–122. [33] LINDEN, R. Algoritmos genéticos (2a ediçao). Brasport, 2008. [34] LINDEN, R. Técnicas de agrupamento. Revista de Sistemas de Informação da FSMA 4 (2009), 18–36. [35] LIU, Y., WU, X., E SHEN, Y. Automatic clustering using genetic algorithms. Applied mathematics and computation 218, 4 (2011), 1267–1279. [36] LOESCH, C., E HEIN, N. Pesquisa operacional. Editora Saraiva, 2009. [37] LOESCH, C., E HOELTGEBAUM, M. Métodos estatísticos multivariados. Editora Saraiva, 2017. [38] MARONNA, R., E JACOVKIS, P. M. Multivariate clustering procedures with variable metrics. Biometrics (1974), 499–505. [39] MARTINEZ, J. M., E SANTOS, S. A. Métodos computacionais de otimização. In XX Colóquio Brasileiro de Matemática, IMPA (1995). [40] MAULIK, U., E BANDYOPADHYAY, S. Genetic algorithm-based clustering technique. Pattern recognition 33, 9 (2000), 1455–1465. [41] MAULIK, U., E BANDYOPADHYAY, S. Performance evaluation of some clustering algorithms and validity indices. IEEE Transactions on pattern analysis and machine intelligence 24, 12 (2002), 1650–1654. [42] MISHRA, S., SAHA, S., E MONDAL, S. A multiobjective optimization based entity matching technique for bibliographic databases. Expert Systems with Applications 65 (2016), 100–115. [43] MITCHELL, M. An introduction to genetic algorithms. MIT press, 1998. [44] NANDA, S. J., E PANDA, G. A survey on nature inspired metaheuristic algorithms for partitional clustering. Swarm and Evolutionary computation 16 (2014), 1–18. [45] OCHI, L. S., DIAS, C. R., E SOARES, S. S. F. Clusterização em mineração de dados. Instituto de Computação-Universidade Federal Fluminense-Niterói (2004), 26. [46] PACHECO, T. M., BRUGIOLO, L., STRÖELE, V., E SÃ, S. Metaheurística inspirada no comportamento das formigas aplicada ao problema de agrupamento. In XIII Congresso Brasileiro de Inteligência Computacional (2017). [47] PAL, N. R., E BEZDEK, J. C. On cluster validity for the fuzzy c-means model. IEEE Transactions on Fuzzy systems 3, 3 (1995), 370–379. [48] QUEIROGA, E. V., SUBRAMANIAN, A., E CABRAL, L. D. A. F. Abordagem baseada em continuous grasp para clusterização de dados. In XLVIII SBPO (2016). [49] RAPOSO, C., ANTUNES, C. H., E BARRETO, J. P. Automatic clustering using a genetic algorithm with new solution encoding and operators. In International Conference on Computational Science and Its Applications (2014), Springer, pp. 92–103. [50] REZENDE, S. O., MARCACINI, R. M., E MOURA, M. F. O uso da mineração de textos para extração e organização não supervisionada de conhecimento. Embrapa Informática Agropecuária-Artigo em periódico indexado (ALICE) (2011). [51] RODRIGUES, W. C., FADEL, A. C., SEMAAN, G. S., E BRITO, J. A. D. M. Um novo método baseado em grade e densidade com tratamento de ruídos para a identificação do número ideal de grupos. In XLVIII SBPO (2016). [52] ROUSSEEUW, P. J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics 20 (1987), 53–65. [53] RUSPINI, E. H. Numerical methods for fuzzy clustering. Information Sciences 2, 3 (1970), 319–350. [54] SCHWAAB, M. Análise de Dados Experimentais: I. Fundamentos de Estatística e Estimação de Parâmetros. Editora E-papers, 2007. [55] SEMAAN, G. S., CRUZ, M. D., BRITO, G. D. M., E OCHI, L. S. Proposta de um métodode classificação baseado em densidade para a determinação do número ideal de grupos em problemas de clusterização. Journal of the Brazilian Computational Intelligence Society 10, 4 (2012), 242–262. [56] SEMAAN, G. S., FADEL, A. C., DE MOURA BRITO, J. A., E OCHI, L. S. Uma heurística baseada em densidade para o problema de agrupamento automático. Blucher Marine Engineering Proceedings 2, 1 (2016), 100–112. [57] THEODORIDIS, S., E KOUTROUMBAS, K. Pattern recognition. Second Edition. Elsevier, 2003. [58] TSENG, L. Y., E YANG, S. B. A genetic approach to the automatic clustering problem. Pattern recognition 34, 2 (2001), 415–424. [59] VEENMAN, C. J., REINDERS, M. J. T., E BACKER, E. A maximum variance cluster algorithm. IEEE Transactions on pattern analysis and machine intelligence 24, 9 (2002), 1273–1280. [60] WANG, X., QIU, W., E ZAMAR, R. H. Clues: A non-parametric clustering method based on local shrinking. Computational Statistics & Data Analysis 52, 1 (2007), 286–298.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal Rural do Rio de Janeiro
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Modelagem Matemática e Computacional
dc.publisher.initials.fl_str_mv UFRRJ
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Ciências Exatas
publisher.none.fl_str_mv Universidade Federal Rural do Rio de Janeiro
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRRJ
instname:Universidade Federal Rural do Rio de Janeiro (UFRRJ)
instacron:UFRRJ
instname_str Universidade Federal Rural do Rio de Janeiro (UFRRJ)
instacron_str UFRRJ
institution UFRRJ
reponame_str Biblioteca Digital de Teses e Dissertações da UFRRJ
collection Biblioteca Digital de Teses e Dissertações da UFRRJ
bitstream.url.fl_str_mv https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/1/2019%20-%20Suzane%20Pereira%20Lima.pdf.jpg
https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/2/2019%20-%20Suzane%20Pereira%20Lima.pdf.txt
https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/3/2019%20-%20Suzane%20Pereira%20Lima.pdf
https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/4/license.txt
bitstream.checksum.fl_str_mv 5a8c734c99ac9a7b424f097ac631075d
e0cc625e112acde9e802f076ed13af25
aeb78744da9f2f8ed596bb13477fde62
7b5ba3d2445355f386edab96125d42b7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRRJ - Universidade Federal Rural do Rio de Janeiro (UFRRJ)
repository.mail.fl_str_mv bibliot@ufrrj.br||bibliot@ufrrj.br
_version_ 1810108016392929280