Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means

Detalhes bibliográficos
Autor(a) principal: MACARIO FILHO, Valmir
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/2383
Resumo: Nas aplicações tradicionais de aprendizagem de máquina, os classificadores utilizam apenas dados rotulados em seu treinamento. Os dados rotulados, por sua vez, são difíceis, caros, consomem tempo e requerem especialistas humanos para serem obtidos em algumas aplicações reais. Entretanto, dados não rotulados são abundantes e fáceis de serem obtidos mas há poucas abordagens que os utilizam no treinamento. Para contornar esse problema existe a aprendizagem semi-supervisionada. A aprendizagem semi-supervisionada utiliza uma grande quantidade de dados não rotulados, juntamente com dados rotulados, com a finalidade de construir classificadores melhores. A abordagem semi-supervisionada obtém resultados melhores do que se utilizassem apenas poucos padrões rotulados em uma abordagem supervisionada ou se utilizassem apenas padrões não rotulados numa abordagem não supervisionada. O algoritmo semi-supervisionado pode ser uma extensão de um algoritmo não supervisionado. Um algoritmo desse tipo pode se basear em algoritmos de agrupamento não supervisionado, adicionando-se um termo em sua função objetivo que faz uso de informações rotuladas para guiar o processo de aprendizagem do algoritmo. Este trabalho apresenta um estudo da aprendizagem semi-supervisionada e apresenta um novo algoritmo de agrupamento semi-supervisionado baseado no algoritmo Fuzzy C-Means. Também, apresenta uma validação cruzada para o contexto de algoritmos semi-supervisionados. Estudos experimentais são apresentados. Primeiro, o algoritmo semi-supervisionado proposto é avaliado com dados completamente rotulados, comparado com alguns classificadores totalmente supervisionados. Depois, o mesmo algoritmo semi-supervisionado é, então, avaliado e comparado com três algoritmos também de agrupamento semi-supervisionados que otimizam uma função objetivo no contexto da aprendizagem a partir de dados parcialmente rotulados. Além disso, o comportamento do algoritmo é discutido e os resultados examinados através da construção de intervalos de confiança. Derivou deste trabalho, uma ferramenta contendo os algoritmos semi-supervisionados e o ambiente experimental para validação desses algoritmos foi desenvolvida. Desse modo, foi possível certificar que o novo algoritmo de agrupamento semi-supervisionad apresenta desempenho melhor, ou pelo menos do mesmo nível, que algoritmos já consolidados na literatura
id UFPE_1d47c198b25db64d71408d1037845385
oai_identifier_str oai:repositorio.ufpe.br:123456789/2383
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling MACARIO FILHO, ValmirCARVALHO, Francisco de Assis Tenório2014-06-12T15:57:35Z2014-06-12T15:57:35Z2009-01-31Macario Filho, Valmir; de Assis Tenório Carvalho, Francisco. Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means. 2009. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2009.https://repositorio.ufpe.br/handle/123456789/2383Nas aplicações tradicionais de aprendizagem de máquina, os classificadores utilizam apenas dados rotulados em seu treinamento. Os dados rotulados, por sua vez, são difíceis, caros, consomem tempo e requerem especialistas humanos para serem obtidos em algumas aplicações reais. Entretanto, dados não rotulados são abundantes e fáceis de serem obtidos mas há poucas abordagens que os utilizam no treinamento. Para contornar esse problema existe a aprendizagem semi-supervisionada. A aprendizagem semi-supervisionada utiliza uma grande quantidade de dados não rotulados, juntamente com dados rotulados, com a finalidade de construir classificadores melhores. A abordagem semi-supervisionada obtém resultados melhores do que se utilizassem apenas poucos padrões rotulados em uma abordagem supervisionada ou se utilizassem apenas padrões não rotulados numa abordagem não supervisionada. O algoritmo semi-supervisionado pode ser uma extensão de um algoritmo não supervisionado. Um algoritmo desse tipo pode se basear em algoritmos de agrupamento não supervisionado, adicionando-se um termo em sua função objetivo que faz uso de informações rotuladas para guiar o processo de aprendizagem do algoritmo. Este trabalho apresenta um estudo da aprendizagem semi-supervisionada e apresenta um novo algoritmo de agrupamento semi-supervisionado baseado no algoritmo Fuzzy C-Means. Também, apresenta uma validação cruzada para o contexto de algoritmos semi-supervisionados. Estudos experimentais são apresentados. Primeiro, o algoritmo semi-supervisionado proposto é avaliado com dados completamente rotulados, comparado com alguns classificadores totalmente supervisionados. Depois, o mesmo algoritmo semi-supervisionado é, então, avaliado e comparado com três algoritmos também de agrupamento semi-supervisionados que otimizam uma função objetivo no contexto da aprendizagem a partir de dados parcialmente rotulados. Além disso, o comportamento do algoritmo é discutido e os resultados examinados através da construção de intervalos de confiança. Derivou deste trabalho, uma ferramenta contendo os algoritmos semi-supervisionados e o ambiente experimental para validação desses algoritmos foi desenvolvida. Desse modo, foi possível certificar que o novo algoritmo de agrupamento semi-supervisionad apresenta desempenho melhor, ou pelo menos do mesmo nível, que algoritmos já consolidados na literaturaConselho Nacional de Desenvolvimento Científico e TecnológicoporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAprendizagem Semi-SupervisionadaAgupamento Semi-SupervisionadoAgrupamento FuzzyFunção ObjetivoClassificação de PadrõesValidação CruzadaUm novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Meansinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILarquivo3210_1.pdf.jpgarquivo3210_1.pdf.jpgGenerated Thumbnailimage/jpeg1239https://repositorio.ufpe.br/bitstream/123456789/2383/4/arquivo3210_1.pdf.jpgee7076cbe7cecf6747144fcefe7b0150MD54ORIGINALarquivo3210_1.pdfapplication/pdf1552746https://repositorio.ufpe.br/bitstream/123456789/2383/1/arquivo3210_1.pdf98771d23cdfb48745520719f0b3134ddMD51LICENSElicense.txttext/plain1748https://repositorio.ufpe.br/bitstream/123456789/2383/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTarquivo3210_1.pdf.txtarquivo3210_1.pdf.txtExtracted texttext/plain202701https://repositorio.ufpe.br/bitstream/123456789/2383/3/arquivo3210_1.pdf.txt619f75846fb085cb49c0f46adb6045cdMD53123456789/23832019-10-25 12:50:56.772oai:repositorio.ufpe.br:123456789/2383Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T15:50:56Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means
title Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means
spellingShingle Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means
MACARIO FILHO, Valmir
Aprendizagem Semi-Supervisionada
Agupamento Semi-Supervisionado
Agrupamento Fuzzy
Função Objetivo
Classificação de Padrões
Validação Cruzada
title_short Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means
title_full Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means
title_fullStr Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means
title_full_unstemmed Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means
title_sort Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means
author MACARIO FILHO, Valmir
author_facet MACARIO FILHO, Valmir
author_role author
dc.contributor.author.fl_str_mv MACARIO FILHO, Valmir
dc.contributor.advisor1.fl_str_mv CARVALHO, Francisco de Assis Tenório
contributor_str_mv CARVALHO, Francisco de Assis Tenório
dc.subject.por.fl_str_mv Aprendizagem Semi-Supervisionada
Agupamento Semi-Supervisionado
Agrupamento Fuzzy
Função Objetivo
Classificação de Padrões
Validação Cruzada
topic Aprendizagem Semi-Supervisionada
Agupamento Semi-Supervisionado
Agrupamento Fuzzy
Função Objetivo
Classificação de Padrões
Validação Cruzada
description Nas aplicações tradicionais de aprendizagem de máquina, os classificadores utilizam apenas dados rotulados em seu treinamento. Os dados rotulados, por sua vez, são difíceis, caros, consomem tempo e requerem especialistas humanos para serem obtidos em algumas aplicações reais. Entretanto, dados não rotulados são abundantes e fáceis de serem obtidos mas há poucas abordagens que os utilizam no treinamento. Para contornar esse problema existe a aprendizagem semi-supervisionada. A aprendizagem semi-supervisionada utiliza uma grande quantidade de dados não rotulados, juntamente com dados rotulados, com a finalidade de construir classificadores melhores. A abordagem semi-supervisionada obtém resultados melhores do que se utilizassem apenas poucos padrões rotulados em uma abordagem supervisionada ou se utilizassem apenas padrões não rotulados numa abordagem não supervisionada. O algoritmo semi-supervisionado pode ser uma extensão de um algoritmo não supervisionado. Um algoritmo desse tipo pode se basear em algoritmos de agrupamento não supervisionado, adicionando-se um termo em sua função objetivo que faz uso de informações rotuladas para guiar o processo de aprendizagem do algoritmo. Este trabalho apresenta um estudo da aprendizagem semi-supervisionada e apresenta um novo algoritmo de agrupamento semi-supervisionado baseado no algoritmo Fuzzy C-Means. Também, apresenta uma validação cruzada para o contexto de algoritmos semi-supervisionados. Estudos experimentais são apresentados. Primeiro, o algoritmo semi-supervisionado proposto é avaliado com dados completamente rotulados, comparado com alguns classificadores totalmente supervisionados. Depois, o mesmo algoritmo semi-supervisionado é, então, avaliado e comparado com três algoritmos também de agrupamento semi-supervisionados que otimizam uma função objetivo no contexto da aprendizagem a partir de dados parcialmente rotulados. Além disso, o comportamento do algoritmo é discutido e os resultados examinados através da construção de intervalos de confiança. Derivou deste trabalho, uma ferramenta contendo os algoritmos semi-supervisionados e o ambiente experimental para validação desses algoritmos foi desenvolvida. Desse modo, foi possível certificar que o novo algoritmo de agrupamento semi-supervisionad apresenta desempenho melhor, ou pelo menos do mesmo nível, que algoritmos já consolidados na literatura
publishDate 2009
dc.date.issued.fl_str_mv 2009-01-31
dc.date.accessioned.fl_str_mv 2014-06-12T15:57:35Z
dc.date.available.fl_str_mv 2014-06-12T15:57:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Macario Filho, Valmir; de Assis Tenório Carvalho, Francisco. Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means. 2009. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2009.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/2383
identifier_str_mv Macario Filho, Valmir; de Assis Tenório Carvalho, Francisco. Um novo algoritmo de agrupamento semisupervisionado baseado no Fuzzy C-Means. 2009. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2009.
url https://repositorio.ufpe.br/handle/123456789/2383
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/2383/4/arquivo3210_1.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/2383/1/arquivo3210_1.pdf
https://repositorio.ufpe.br/bitstream/123456789/2383/2/license.txt
https://repositorio.ufpe.br/bitstream/123456789/2383/3/arquivo3210_1.pdf.txt
bitstream.checksum.fl_str_mv ee7076cbe7cecf6747144fcefe7b0150
98771d23cdfb48745520719f0b3134dd
8a4605be74aa9ea9d79846c1fba20a33
619f75846fb085cb49c0f46adb6045cd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1793515652066050048