O uso de algoritmos genéticos para a solução de problemas de agrupamento automático
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRRJ |
Texto Completo: | https://rima.ufrrj.br/jspui/handle/20.500.14407/14340 |
Resumo: | Técnicas de agrupamento de dados consistem na organização de um conjunto de informações em grupos de acordo com as similaridades presentes em seus registros, assim propriedades comuns entre o conjunto de dados conseguem ser identificadas facilitando a sua compreensão. Nem sempre o número de grupos é um dado disponível a priori para a resolução desse processo. Quando esta informação é desconhecida tem-se o denominado Problema de Agrupamento Automático. Neste trabalho são apresentadas estratégias para a resolução deste problema, tendo como base a meta-heurística Algoritmo Genético. Sabendo que a qualidade de um agrupamento pode ser influenciada pelo modo como são gerados os grupos iniciais e pela escolha da função de avaliação das soluções, diferentes procedimentos são propostos a partir de um método já existente com o objetivo de gerar resoluções de melhor qualidade. Experimentos foram aplicados às propostas para diversos conjuntos de dados. Os resultados obtidos são comparados entre si e com outros trabalhos da literatura. |
id |
UFRRJ-1_71bae069b06762a5598876269f06e1c7 |
---|---|
oai_identifier_str |
oai:rima.ufrrj.br:20.500.14407/14340 |
network_acronym_str |
UFRRJ-1 |
network_name_str |
Repositório Institucional da UFRRJ |
repository_id_str |
|
spelling |
Lima, Suzane PereiraCruz, Marcelo DibCPF: 016.628.007-03Vianna, Gizelle KupacTassinari, Wagner de SouzaCPF: 146.054.587-78http://lattes.cnpq.br/79712422190428552023-12-22T03:00:02Z2023-12-22T03:00:02Z2019-07-30LIMA, Suzane Pereira. O uso de algoritmos genéticos para a solução de problemas de agrupamento automático. 2019. 92 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica, 2019.https://rima.ufrrj.br/jspui/handle/20.500.14407/14340Técnicas de agrupamento de dados consistem na organização de um conjunto de informações em grupos de acordo com as similaridades presentes em seus registros, assim propriedades comuns entre o conjunto de dados conseguem ser identificadas facilitando a sua compreensão. Nem sempre o número de grupos é um dado disponível a priori para a resolução desse processo. Quando esta informação é desconhecida tem-se o denominado Problema de Agrupamento Automático. Neste trabalho são apresentadas estratégias para a resolução deste problema, tendo como base a meta-heurística Algoritmo Genético. Sabendo que a qualidade de um agrupamento pode ser influenciada pelo modo como são gerados os grupos iniciais e pela escolha da função de avaliação das soluções, diferentes procedimentos são propostos a partir de um método já existente com o objetivo de gerar resoluções de melhor qualidade. Experimentos foram aplicados às propostas para diversos conjuntos de dados. Os resultados obtidos são comparados entre si e com outros trabalhos da literatura.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorThe Clustering consists to organize a set of information into groups according to the similarities present in their records, so that common properties between the data can be identified for easy understanding. Sometimes the number of groups is a unavailable data for the resolution of this process. When this information is unknown a priori we have the so-called Automatic Clustering Problem. In this work are presented algorithms to solve this problem, based on the meta-heuristic Genetic Algorithm. The quality of a Clustering can be affected by the way the initial groups are generated and by the choice of the cluster validity index, different methods are proposed based on an already existing methodology with the purpose of generating better quality resolutions. Experiments were applied to proposed approaches for several data sets. The obtained results are compared with each other and with other works of the literature.application/pdfporUniversidade Federal Rural do Rio de JaneiroPrograma de Pós-Graduação em Modelagem Matemática e ComputacionalUFRRJBrasilInstituto de Ciências ExatasProblema de Agrupamento AutomáticoHeurísticasOtimizaçãoAutomatic Clustering ProblemHeuristicsOptimizationCiência da ComputaçãoMatemáticaO uso de algoritmos genéticos para a solução de problemas de agrupamento automáticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis[1] Clustering basic benchmark. Disponível em: http://cs.joensuu.fi/sipu/datasets/; Acessado em 04 de Abril de 2018. [2] Machine learning repository. Disponível em: http://archive.ics.uci.edu/ml/index.php; Acessado em 13 de Julho de 2017. [3] ANARI, B., TORKESTANI, J. A., E RAHMANI, A. Automatic data clustering using continuous action-set learning automata and its application in segmentation of images. Applied Soft Computing 51 (2017), 253–265. [4] ARENALES, M., MORABITO, R., ARMENTANO, V., E YANASSE, H. Pesquisa operacional: Para cursos de engenharia. Elsevier Brasil, 2015. [5] BECKER, J. L. Estatística básica: transformando dados em informação. Bookman Editora, 2015. [6] BERKHIN, P. A survey of clustering data mining techniques. In Grouping multidimensional data. Springer, 2006, pp. 25–71. [7] BRITO, J. D. M., E MONTENEGRO, F. M. T. Aplicações de Técnicas de Pesquisa Operacional em Problemas de Agrupamento do IBGE. População, espaço e sustentabilidade: contribuições para o desenvolvimento do Brasil, 01 2015, pp. 15–33. [8] CALI´NSKI, T., E HARABASZ, J. A dendrite method for cluster analysis. Communications in Statistics-theory and Methods 3, 1 (1974), 1–27. [9] CHARU, C. A., E CHANDAN, K. R. Data clustering: algorithms and applications. Chapman and Hall/CRC Boca Raton, 2013. [10] CHOU, C.-H., SU, M.-C., E LAI, E. A new cluster validity measure and its application to image compression. Pattern Analysis and Applications 7, 2 (2004), 205–220. [11] CRUZ, M. D. O problema de clusterização automática. PhD thesis, COPPE/UFRJ, Rio de Janeiro, 2010. [12] DAS, S., ABRAHAM, A., E KONAR, A. Automatic clustering using an improved differential evolution algorithm. IEEE Transactions on systems, man, and cybernetics-Part A: Systems and Humans 38, 1 (2008), 218–237. [13] DAS, S., CHOWDHURY, A., E ABRAHAM, A. A bacterial evolutionary algorithm for automatic data clustering. In 2009 IEEE Congress on Evolutionary Computation (2009), IEEE, pp. 2403–2410. [14] DAVIES, D. L., E BOULDIN, D. W. A cluster separation measure. IEEE transactions on pattern analysis and machine intelligence, 2 (1979), 224–227. [15] DOVAL, D., MANCORIDIS, S., E MITCHELL, B. S. Automatic clustering of software systems using a genetic algorithm. In STEP’99. Proceedings Ninth International Workshop Software Technology and Engineering Practice (1999), IEEE, pp. 73–81. [16] DUNN, J. C. A fuzzy relative of the isodata process and its use in detecting compact wellseparated clusters. Journal of Cybernetics (1973). [17] FERRARI, D. G., E SILVA, L. N. D. C. Introdução a mineração de dados. Editora Saraiva, 2017. [18] FISHER, R. A. The use of multiple measurements in taxonomic problems. Annals of eugenics 7, 2 (1936), 179–188. [19] GAN, G., MA, C., E WU, J. Data clustering: theory, algorithms, and applications, vol. 20. Siam, 2007. [20] GOLDSCHMIDT, R. R. Uma Introdução à Inteligência Computacional: fundamentos, ferramentas e aplicações. IST-Rio, 2010. [21] GOLDSCHMIDT, R. R. Tópicos Especiais em Inteligência Computacional. IST-Rio, 2011. [22] HANSEN, P., E JAUMARD, B. Cluster analysis and mathematical programming. Mathematical programming 79, 1-3 (1997), 191–215. [23] HARSH, A., E BALL, J. E. Automatic k-expectation maximization (a k-em) algorithm for data mining applications. Journal of Computations & Modelling 6, 3 (2016), 43–85. [24] HE, H., E TAN, Y. A two-stage genetic algorithm for automatic clustering. Neurocomputing 81 (2012), 49–59. [25] HILLIER, F. S., E LIEBERMAN, G. J. Introdução à pesquisa operacional. McGraw Hill Brasil, 2013. [26] JAIN, A. K., DUBES, R. C., E OTHERS. Algorithms for clustering data, vol. 6. Prentice hall Englewood Cliffs, 1988. [27] JAIN, A. K., MURTY, M. N., E FLYNN, P. J. Data clustering: a review. ACM computing surveys (CSUR) 31, 3 (1999), 264–323. [28] JOSÉ-GARCÍA, A., E GÓMEZ-FLORES, W. Automatic clustering using nature-inspired metaheuristics: A survey. Applied Soft Computing 41 (2016), 192–213. [29] KETTANI, O., RAMDANI, F., E TADILI, B. Ak-means: an automatic clustering algorithm based on k-means. Journal of Advanced Computer Science & Technology 4, 2 (2015), 231. [30] KUDOVA, P. Clustering genetic algorithm. In 18th International Workshop on Database and Expert Systems Applications (DEXA 2007) (2007), IEEE, pp. 138–142. [31] KUNDU, D., SURESH, K., GHOSH, S., DAS, S., ABRAHAM, A., E BADR, Y. Automatic clustering using a synergy of genetic algorithm and multi-objective differential evolution. In International Conference on Hybrid Artificial Intelligence Systems (2009), Springer, pp. 177–186. [32] KUO, R., HUANG, Y., LIN, C.-C., WU, Y.-H., E ZULVIA, F. E. Automatic kernel clustering with bee colony optimization algorithm. Information Sciences 283 (2014), 107–122. [33] LINDEN, R. Algoritmos genéticos (2a ediçao). Brasport, 2008. [34] LINDEN, R. Técnicas de agrupamento. Revista de Sistemas de Informação da FSMA 4 (2009), 18–36. [35] LIU, Y., WU, X., E SHEN, Y. Automatic clustering using genetic algorithms. Applied mathematics and computation 218, 4 (2011), 1267–1279. [36] LOESCH, C., E HEIN, N. Pesquisa operacional. Editora Saraiva, 2009. [37] LOESCH, C., E HOELTGEBAUM, M. Métodos estatísticos multivariados. Editora Saraiva, 2017. [38] MARONNA, R., E JACOVKIS, P. M. Multivariate clustering procedures with variable metrics. Biometrics (1974), 499–505. [39] MARTINEZ, J. M., E SANTOS, S. A. Métodos computacionais de otimização. In XX Colóquio Brasileiro de Matemática, IMPA (1995). [40] MAULIK, U., E BANDYOPADHYAY, S. Genetic algorithm-based clustering technique. Pattern recognition 33, 9 (2000), 1455–1465. [41] MAULIK, U., E BANDYOPADHYAY, S. Performance evaluation of some clustering algorithms and validity indices. IEEE Transactions on pattern analysis and machine intelligence 24, 12 (2002), 1650–1654. [42] MISHRA, S., SAHA, S., E MONDAL, S. A multiobjective optimization based entity matching technique for bibliographic databases. Expert Systems with Applications 65 (2016), 100–115. [43] MITCHELL, M. An introduction to genetic algorithms. MIT press, 1998. [44] NANDA, S. J., E PANDA, G. A survey on nature inspired metaheuristic algorithms for partitional clustering. Swarm and Evolutionary computation 16 (2014), 1–18. [45] OCHI, L. S., DIAS, C. R., E SOARES, S. S. F. Clusterização em mineração de dados. Instituto de Computação-Universidade Federal Fluminense-Niterói (2004), 26. [46] PACHECO, T. M., BRUGIOLO, L., STRÖELE, V., E SÃ, S. Metaheurística inspirada no comportamento das formigas aplicada ao problema de agrupamento. In XIII Congresso Brasileiro de Inteligência Computacional (2017). [47] PAL, N. R., E BEZDEK, J. C. On cluster validity for the fuzzy c-means model. IEEE Transactions on Fuzzy systems 3, 3 (1995), 370–379. [48] QUEIROGA, E. V., SUBRAMANIAN, A., E CABRAL, L. D. A. F. Abordagem baseada em continuous grasp para clusterização de dados. In XLVIII SBPO (2016). [49] RAPOSO, C., ANTUNES, C. H., E BARRETO, J. P. Automatic clustering using a genetic algorithm with new solution encoding and operators. In International Conference on Computational Science and Its Applications (2014), Springer, pp. 92–103. [50] REZENDE, S. O., MARCACINI, R. M., E MOURA, M. F. O uso da mineração de textos para extração e organização não supervisionada de conhecimento. Embrapa Informática Agropecuária-Artigo em periódico indexado (ALICE) (2011). [51] RODRIGUES, W. C., FADEL, A. C., SEMAAN, G. S., E BRITO, J. A. D. M. Um novo método baseado em grade e densidade com tratamento de ruídos para a identificação do número ideal de grupos. In XLVIII SBPO (2016). [52] ROUSSEEUW, P. J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics 20 (1987), 53–65. [53] RUSPINI, E. H. Numerical methods for fuzzy clustering. Information Sciences 2, 3 (1970), 319–350. [54] SCHWAAB, M. Análise de Dados Experimentais: I. Fundamentos de Estatística e Estimação de Parâmetros. Editora E-papers, 2007. [55] SEMAAN, G. S., CRUZ, M. D., BRITO, G. D. M., E OCHI, L. S. Proposta de um métodode classificação baseado em densidade para a determinação do número ideal de grupos em problemas de clusterização. Journal of the Brazilian Computational Intelligence Society 10, 4 (2012), 242–262. [56] SEMAAN, G. S., FADEL, A. C., DE MOURA BRITO, J. A., E OCHI, L. S. Uma heurística baseada em densidade para o problema de agrupamento automático. Blucher Marine Engineering Proceedings 2, 1 (2016), 100–112. [57] THEODORIDIS, S., E KOUTROUMBAS, K. Pattern recognition. Second Edition. Elsevier, 2003. [58] TSENG, L. Y., E YANG, S. B. A genetic approach to the automatic clustering problem. Pattern recognition 34, 2 (2001), 415–424. [59] VEENMAN, C. J., REINDERS, M. J. T., E BACKER, E. A maximum variance cluster algorithm. IEEE Transactions on pattern analysis and machine intelligence 24, 9 (2002), 1273–1280. [60] WANG, X., QIU, W., E ZAMAR, R. H. Clues: A non-parametric clustering method based on local shrinking. Computational Statistics & Data Analysis 52, 1 (2007), 286–298.https://tede.ufrrj.br/retrieve/67578/2019%20-%20Suzane%20Pereira%20Lima.pdf.jpghttps://tede.ufrrj.br/jspui/handle/jspui/5245Submitted by Jorge Silva (jorgelmsilva@ufrrj.br) on 2021-11-20T22:24:54Z No. of bitstreams: 1 2019 - Suzane Pereira Lima.pdf: 2995803 bytes, checksum: aeb78744da9f2f8ed596bb13477fde62 (MD5)Made available in DSpace on 2021-11-20T22:24:57Z (GMT). No. of bitstreams: 1 2019 - Suzane Pereira Lima.pdf: 2995803 bytes, checksum: aeb78744da9f2f8ed596bb13477fde62 (MD5) Previous issue date: 2019-07-30info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRRJinstname:Universidade Federal Rural do Rio de Janeiro (UFRRJ)instacron:UFRRJTHUMBNAIL2019 - Suzane Pereira Lima.pdf.jpgGenerated Thumbnailimage/jpeg3736https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/1/2019%20-%20Suzane%20Pereira%20Lima.pdf.jpg5a8c734c99ac9a7b424f097ac631075dMD51TEXT2019 - Suzane Pereira Lima.pdf.txtExtracted Texttext/plain197047https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/2/2019%20-%20Suzane%20Pereira%20Lima.pdf.txte0cc625e112acde9e802f076ed13af25MD52ORIGINAL2019 - Suzane Pereira Lima.pdfapplication/pdf2995803https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/3/2019%20-%20Suzane%20Pereira%20Lima.pdfaeb78744da9f2f8ed596bb13477fde62MD53LICENSElicense.txttext/plain2089https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/4/license.txt7b5ba3d2445355f386edab96125d42b7MD5420.500.14407/143402023-12-22 00:00:02.247oai:rima.ufrrj.br:20.500.14407/14340Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSP1BSSUEgTElDRU4/QQpFc3RhIGxpY2VuP2EgZGUgZXhlbXBsbyA/IGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOP0EgREUgRElTVFJJQlVJPz9PIE4/Ty1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YT8/byBkZXN0YSBsaWNlbj9hLCB2b2M/IChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSA/IFVuaXZlcnNpZGFkZSAKWFhYIChTaWdsYSBkYSBVbml2ZXJzaWRhZGUpIG8gZGlyZWl0byBuP28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSAKZGlzdHJpYnVpciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyP25pY28gZSAKZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zID91ZGlvIG91IHY/ZGVvLgoKVm9jPyBjb25jb3JkYSBxdWUgYSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZT9kbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhPz9vLgoKVm9jPyB0YW1iP20gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGM/cGlhIGEgc3VhIHRlc2Ugb3UgCmRpc3NlcnRhPz9vIHBhcmEgZmlucyBkZSBzZWd1cmFuP2EsIGJhY2stdXAgZSBwcmVzZXJ2YT8/by4KClZvYz8gZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byA/IG9yaWdpbmFsIGUgcXVlIHZvYz8gdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgCm5lc3RhIGxpY2VuP2EuIFZvYz8gdGFtYj9tIGRlY2xhcmEgcXVlIG8gZGVwP3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGE/P28gbj9vLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3U/bS4KCkNhc28gYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jPyBuP28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jPyAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzcz9vIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgPyBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgCm9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbj9hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Q/IGNsYXJhbWVudGUgCmlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlP2RvIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgVEVTRSBPVSBESVNTRVJUQT8/TyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0M/TklPIE9VIApBUE9JTyBERSBVTUEgQUc/TkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTj9PIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0M/IERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJUz9PIENPTU8gClRBTUI/TSBBUyBERU1BSVMgT0JSSUdBPz9FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28sIGUgbj9vIGZhcj8gcXVhbHF1ZXIgYWx0ZXJhPz9vLCBhbD9tIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2VuP2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttps://tede.ufrrj.br/PUBhttps://tede.ufrrj.br/oai/requestbibliot@ufrrj.br||bibliot@ufrrj.bropendoar:2023-12-22T03:00:02Biblioteca Digital de Teses e Dissertações da UFRRJ - Universidade Federal Rural do Rio de Janeiro (UFRRJ)false |
dc.title.por.fl_str_mv |
O uso de algoritmos genéticos para a solução de problemas de agrupamento automático |
title |
O uso de algoritmos genéticos para a solução de problemas de agrupamento automático |
spellingShingle |
O uso de algoritmos genéticos para a solução de problemas de agrupamento automático Lima, Suzane Pereira Problema de Agrupamento Automático Heurísticas Otimização Automatic Clustering Problem Heuristics Optimization Ciência da Computação Matemática |
title_short |
O uso de algoritmos genéticos para a solução de problemas de agrupamento automático |
title_full |
O uso de algoritmos genéticos para a solução de problemas de agrupamento automático |
title_fullStr |
O uso de algoritmos genéticos para a solução de problemas de agrupamento automático |
title_full_unstemmed |
O uso de algoritmos genéticos para a solução de problemas de agrupamento automático |
title_sort |
O uso de algoritmos genéticos para a solução de problemas de agrupamento automático |
author |
Lima, Suzane Pereira |
author_facet |
Lima, Suzane Pereira |
author_role |
author |
dc.contributor.author.fl_str_mv |
Lima, Suzane Pereira |
dc.contributor.advisor1.fl_str_mv |
Cruz, Marcelo Dib |
dc.contributor.advisor1ID.fl_str_mv |
CPF: 016.628.007-03 |
dc.contributor.referee1.fl_str_mv |
Vianna, Gizelle Kupac |
dc.contributor.referee2.fl_str_mv |
Tassinari, Wagner de Souza |
dc.contributor.authorID.fl_str_mv |
CPF: 146.054.587-78 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7971242219042855 |
contributor_str_mv |
Cruz, Marcelo Dib Vianna, Gizelle Kupac Tassinari, Wagner de Souza |
dc.subject.por.fl_str_mv |
Problema de Agrupamento Automático Heurísticas Otimização |
topic |
Problema de Agrupamento Automático Heurísticas Otimização Automatic Clustering Problem Heuristics Optimization Ciência da Computação Matemática |
dc.subject.eng.fl_str_mv |
Automatic Clustering Problem Heuristics Optimization |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação Matemática |
description |
Técnicas de agrupamento de dados consistem na organização de um conjunto de informações em grupos de acordo com as similaridades presentes em seus registros, assim propriedades comuns entre o conjunto de dados conseguem ser identificadas facilitando a sua compreensão. Nem sempre o número de grupos é um dado disponível a priori para a resolução desse processo. Quando esta informação é desconhecida tem-se o denominado Problema de Agrupamento Automático. Neste trabalho são apresentadas estratégias para a resolução deste problema, tendo como base a meta-heurística Algoritmo Genético. Sabendo que a qualidade de um agrupamento pode ser influenciada pelo modo como são gerados os grupos iniciais e pela escolha da função de avaliação das soluções, diferentes procedimentos são propostos a partir de um método já existente com o objetivo de gerar resoluções de melhor qualidade. Experimentos foram aplicados às propostas para diversos conjuntos de dados. Os resultados obtidos são comparados entre si e com outros trabalhos da literatura. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-07-30 |
dc.date.accessioned.fl_str_mv |
2023-12-22T03:00:02Z |
dc.date.available.fl_str_mv |
2023-12-22T03:00:02Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
LIMA, Suzane Pereira. O uso de algoritmos genéticos para a solução de problemas de agrupamento automático. 2019. 92 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica, 2019. |
dc.identifier.uri.fl_str_mv |
https://rima.ufrrj.br/jspui/handle/20.500.14407/14340 |
identifier_str_mv |
LIMA, Suzane Pereira. O uso de algoritmos genéticos para a solução de problemas de agrupamento automático. 2019. 92 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica, 2019. |
url |
https://rima.ufrrj.br/jspui/handle/20.500.14407/14340 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.references.por.fl_str_mv |
[1] Clustering basic benchmark. Disponível em: http://cs.joensuu.fi/sipu/datasets/; Acessado em 04 de Abril de 2018. [2] Machine learning repository. Disponível em: http://archive.ics.uci.edu/ml/index.php; Acessado em 13 de Julho de 2017. [3] ANARI, B., TORKESTANI, J. A., E RAHMANI, A. Automatic data clustering using continuous action-set learning automata and its application in segmentation of images. Applied Soft Computing 51 (2017), 253–265. [4] ARENALES, M., MORABITO, R., ARMENTANO, V., E YANASSE, H. Pesquisa operacional: Para cursos de engenharia. Elsevier Brasil, 2015. [5] BECKER, J. L. Estatística básica: transformando dados em informação. Bookman Editora, 2015. [6] BERKHIN, P. A survey of clustering data mining techniques. In Grouping multidimensional data. Springer, 2006, pp. 25–71. [7] BRITO, J. D. M., E MONTENEGRO, F. M. T. Aplicações de Técnicas de Pesquisa Operacional em Problemas de Agrupamento do IBGE. População, espaço e sustentabilidade: contribuições para o desenvolvimento do Brasil, 01 2015, pp. 15–33. [8] CALI´NSKI, T., E HARABASZ, J. A dendrite method for cluster analysis. Communications in Statistics-theory and Methods 3, 1 (1974), 1–27. [9] CHARU, C. A., E CHANDAN, K. R. Data clustering: algorithms and applications. Chapman and Hall/CRC Boca Raton, 2013. [10] CHOU, C.-H., SU, M.-C., E LAI, E. A new cluster validity measure and its application to image compression. Pattern Analysis and Applications 7, 2 (2004), 205–220. [11] CRUZ, M. D. O problema de clusterização automática. PhD thesis, COPPE/UFRJ, Rio de Janeiro, 2010. [12] DAS, S., ABRAHAM, A., E KONAR, A. Automatic clustering using an improved differential evolution algorithm. IEEE Transactions on systems, man, and cybernetics-Part A: Systems and Humans 38, 1 (2008), 218–237. [13] DAS, S., CHOWDHURY, A., E ABRAHAM, A. A bacterial evolutionary algorithm for automatic data clustering. In 2009 IEEE Congress on Evolutionary Computation (2009), IEEE, pp. 2403–2410. [14] DAVIES, D. L., E BOULDIN, D. W. A cluster separation measure. IEEE transactions on pattern analysis and machine intelligence, 2 (1979), 224–227. [15] DOVAL, D., MANCORIDIS, S., E MITCHELL, B. S. Automatic clustering of software systems using a genetic algorithm. In STEP’99. Proceedings Ninth International Workshop Software Technology and Engineering Practice (1999), IEEE, pp. 73–81. [16] DUNN, J. C. A fuzzy relative of the isodata process and its use in detecting compact wellseparated clusters. Journal of Cybernetics (1973). [17] FERRARI, D. G., E SILVA, L. N. D. C. Introdução a mineração de dados. Editora Saraiva, 2017. [18] FISHER, R. A. The use of multiple measurements in taxonomic problems. Annals of eugenics 7, 2 (1936), 179–188. [19] GAN, G., MA, C., E WU, J. Data clustering: theory, algorithms, and applications, vol. 20. Siam, 2007. [20] GOLDSCHMIDT, R. R. Uma Introdução à Inteligência Computacional: fundamentos, ferramentas e aplicações. IST-Rio, 2010. [21] GOLDSCHMIDT, R. R. Tópicos Especiais em Inteligência Computacional. IST-Rio, 2011. [22] HANSEN, P., E JAUMARD, B. Cluster analysis and mathematical programming. Mathematical programming 79, 1-3 (1997), 191–215. [23] HARSH, A., E BALL, J. E. Automatic k-expectation maximization (a k-em) algorithm for data mining applications. Journal of Computations & Modelling 6, 3 (2016), 43–85. [24] HE, H., E TAN, Y. A two-stage genetic algorithm for automatic clustering. Neurocomputing 81 (2012), 49–59. [25] HILLIER, F. S., E LIEBERMAN, G. J. Introdução à pesquisa operacional. McGraw Hill Brasil, 2013. [26] JAIN, A. K., DUBES, R. C., E OTHERS. Algorithms for clustering data, vol. 6. Prentice hall Englewood Cliffs, 1988. [27] JAIN, A. K., MURTY, M. N., E FLYNN, P. J. Data clustering: a review. ACM computing surveys (CSUR) 31, 3 (1999), 264–323. [28] JOSÉ-GARCÍA, A., E GÓMEZ-FLORES, W. Automatic clustering using nature-inspired metaheuristics: A survey. Applied Soft Computing 41 (2016), 192–213. [29] KETTANI, O., RAMDANI, F., E TADILI, B. Ak-means: an automatic clustering algorithm based on k-means. Journal of Advanced Computer Science & Technology 4, 2 (2015), 231. [30] KUDOVA, P. Clustering genetic algorithm. In 18th International Workshop on Database and Expert Systems Applications (DEXA 2007) (2007), IEEE, pp. 138–142. [31] KUNDU, D., SURESH, K., GHOSH, S., DAS, S., ABRAHAM, A., E BADR, Y. Automatic clustering using a synergy of genetic algorithm and multi-objective differential evolution. In International Conference on Hybrid Artificial Intelligence Systems (2009), Springer, pp. 177–186. [32] KUO, R., HUANG, Y., LIN, C.-C., WU, Y.-H., E ZULVIA, F. E. Automatic kernel clustering with bee colony optimization algorithm. Information Sciences 283 (2014), 107–122. [33] LINDEN, R. Algoritmos genéticos (2a ediçao). Brasport, 2008. [34] LINDEN, R. Técnicas de agrupamento. Revista de Sistemas de Informação da FSMA 4 (2009), 18–36. [35] LIU, Y., WU, X., E SHEN, Y. Automatic clustering using genetic algorithms. Applied mathematics and computation 218, 4 (2011), 1267–1279. [36] LOESCH, C., E HEIN, N. Pesquisa operacional. Editora Saraiva, 2009. [37] LOESCH, C., E HOELTGEBAUM, M. Métodos estatísticos multivariados. Editora Saraiva, 2017. [38] MARONNA, R., E JACOVKIS, P. M. Multivariate clustering procedures with variable metrics. Biometrics (1974), 499–505. [39] MARTINEZ, J. M., E SANTOS, S. A. Métodos computacionais de otimização. In XX Colóquio Brasileiro de Matemática, IMPA (1995). [40] MAULIK, U., E BANDYOPADHYAY, S. Genetic algorithm-based clustering technique. Pattern recognition 33, 9 (2000), 1455–1465. [41] MAULIK, U., E BANDYOPADHYAY, S. Performance evaluation of some clustering algorithms and validity indices. IEEE Transactions on pattern analysis and machine intelligence 24, 12 (2002), 1650–1654. [42] MISHRA, S., SAHA, S., E MONDAL, S. A multiobjective optimization based entity matching technique for bibliographic databases. Expert Systems with Applications 65 (2016), 100–115. [43] MITCHELL, M. An introduction to genetic algorithms. MIT press, 1998. [44] NANDA, S. J., E PANDA, G. A survey on nature inspired metaheuristic algorithms for partitional clustering. Swarm and Evolutionary computation 16 (2014), 1–18. [45] OCHI, L. S., DIAS, C. R., E SOARES, S. S. F. Clusterização em mineração de dados. Instituto de Computação-Universidade Federal Fluminense-Niterói (2004), 26. [46] PACHECO, T. M., BRUGIOLO, L., STRÖELE, V., E SÃ, S. Metaheurística inspirada no comportamento das formigas aplicada ao problema de agrupamento. In XIII Congresso Brasileiro de Inteligência Computacional (2017). [47] PAL, N. R., E BEZDEK, J. C. On cluster validity for the fuzzy c-means model. IEEE Transactions on Fuzzy systems 3, 3 (1995), 370–379. [48] QUEIROGA, E. V., SUBRAMANIAN, A., E CABRAL, L. D. A. F. Abordagem baseada em continuous grasp para clusterização de dados. In XLVIII SBPO (2016). [49] RAPOSO, C., ANTUNES, C. H., E BARRETO, J. P. Automatic clustering using a genetic algorithm with new solution encoding and operators. In International Conference on Computational Science and Its Applications (2014), Springer, pp. 92–103. [50] REZENDE, S. O., MARCACINI, R. M., E MOURA, M. F. O uso da mineração de textos para extração e organização não supervisionada de conhecimento. Embrapa Informática Agropecuária-Artigo em periódico indexado (ALICE) (2011). [51] RODRIGUES, W. C., FADEL, A. C., SEMAAN, G. S., E BRITO, J. A. D. M. Um novo método baseado em grade e densidade com tratamento de ruídos para a identificação do número ideal de grupos. In XLVIII SBPO (2016). [52] ROUSSEEUW, P. J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of computational and applied mathematics 20 (1987), 53–65. [53] RUSPINI, E. H. Numerical methods for fuzzy clustering. Information Sciences 2, 3 (1970), 319–350. [54] SCHWAAB, M. Análise de Dados Experimentais: I. Fundamentos de Estatística e Estimação de Parâmetros. Editora E-papers, 2007. [55] SEMAAN, G. S., CRUZ, M. D., BRITO, G. D. M., E OCHI, L. S. Proposta de um métodode classificação baseado em densidade para a determinação do número ideal de grupos em problemas de clusterização. Journal of the Brazilian Computational Intelligence Society 10, 4 (2012), 242–262. [56] SEMAAN, G. S., FADEL, A. C., DE MOURA BRITO, J. A., E OCHI, L. S. Uma heurística baseada em densidade para o problema de agrupamento automático. Blucher Marine Engineering Proceedings 2, 1 (2016), 100–112. [57] THEODORIDIS, S., E KOUTROUMBAS, K. Pattern recognition. Second Edition. Elsevier, 2003. [58] TSENG, L. Y., E YANG, S. B. A genetic approach to the automatic clustering problem. Pattern recognition 34, 2 (2001), 415–424. [59] VEENMAN, C. J., REINDERS, M. J. T., E BACKER, E. A maximum variance cluster algorithm. IEEE Transactions on pattern analysis and machine intelligence 24, 9 (2002), 1273–1280. [60] WANG, X., QIU, W., E ZAMAR, R. H. Clues: A non-parametric clustering method based on local shrinking. Computational Statistics & Data Analysis 52, 1 (2007), 286–298. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal Rural do Rio de Janeiro |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Modelagem Matemática e Computacional |
dc.publisher.initials.fl_str_mv |
UFRRJ |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Ciências Exatas |
publisher.none.fl_str_mv |
Universidade Federal Rural do Rio de Janeiro |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRRJ instname:Universidade Federal Rural do Rio de Janeiro (UFRRJ) instacron:UFRRJ |
instname_str |
Universidade Federal Rural do Rio de Janeiro (UFRRJ) |
instacron_str |
UFRRJ |
institution |
UFRRJ |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRRJ |
collection |
Biblioteca Digital de Teses e Dissertações da UFRRJ |
bitstream.url.fl_str_mv |
https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/1/2019%20-%20Suzane%20Pereira%20Lima.pdf.jpg https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/2/2019%20-%20Suzane%20Pereira%20Lima.pdf.txt https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/3/2019%20-%20Suzane%20Pereira%20Lima.pdf https://rima.ufrrj.br/jspui/bitstream/20.500.14407/14340/4/license.txt |
bitstream.checksum.fl_str_mv |
5a8c734c99ac9a7b424f097ac631075d e0cc625e112acde9e802f076ed13af25 aeb78744da9f2f8ed596bb13477fde62 7b5ba3d2445355f386edab96125d42b7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRRJ - Universidade Federal Rural do Rio de Janeiro (UFRRJ) |
repository.mail.fl_str_mv |
bibliot@ufrrj.br||bibliot@ufrrj.br |
_version_ |
1810108016392929280 |