Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Calvin Silva
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFJF
Texto Completo: https://repositorio.ufjf.br/jspui/handle/ufjf/13433
Resumo: Na última década, a quantidade de informações armazenadas no formato digital tem crescido exponencialmente, levando à necessidade cada vez maior de produção de procedimentos computacionalmente intensivos que auxiliem na geração de informação a partir desses dados. Dentre outras, a área de aprendizagem estatística não supervisionada fornece técnicas que auxiliam na obtenção de informação a partir desses dados sem que estejam associados a respostas. Dessa maneira, esse trabalho propôs estudar técnicas de agrupamento e de redução de dimensionalidade, a fim de explicar a configuração dos dados a partir de medida de distância entre objetos. Em redução de dimensionalidade foram explorados métodos de escalonamento multidimensional métrico e não métrico para visualizar previamente os possíveis grupos formados em um espaço de dimensão reduzida. Por sua vez, para agrupamento, foram utilizados os procedimentos K-médias, AGNES e DIANA, no qual o primeiro, que agrupa de maneira particionada, solicita previamente o número de grupos a ser formado, enquanto os demais, que agrupam hierarquicamente, contornam esse problema em troca da definição da medida de ligação entre grupos. Por fim, as metodologias estudadas foram aplicadas em conjuntos de dados reais com o software R Core Team (2020).
id UFJF_d246ca321f1c788e0703115b56987eaf
oai_identifier_str oai:hermes.cpd.ufjf.br:ufjf/13433
network_acronym_str UFJF
network_name_str Repositório Institucional da UFJF
repository_id_str
spelling Bessegato, Lupércio Françahttp://lattes.cnpq.br/1996265064545965Bessegato, Lupércio Françahttp://lattes.cnpq.br/1996265064545965Zeller, Camila Borellihttp://lattes.cnpq.br/6671405481844657Lana, Gustavo de Carvalhohttp://lattes.cnpq.br/4240584806339105http://lattes.cnpq.br/2004040805272486Rodrigues, Calvin Silva2021-09-20T20:12:28Z2021-09-172021-09-20T20:12:28Z2021-09-10https://repositorio.ufjf.br/jspui/handle/ufjf/13433Na última década, a quantidade de informações armazenadas no formato digital tem crescido exponencialmente, levando à necessidade cada vez maior de produção de procedimentos computacionalmente intensivos que auxiliem na geração de informação a partir desses dados. Dentre outras, a área de aprendizagem estatística não supervisionada fornece técnicas que auxiliam na obtenção de informação a partir desses dados sem que estejam associados a respostas. Dessa maneira, esse trabalho propôs estudar técnicas de agrupamento e de redução de dimensionalidade, a fim de explicar a configuração dos dados a partir de medida de distância entre objetos. Em redução de dimensionalidade foram explorados métodos de escalonamento multidimensional métrico e não métrico para visualizar previamente os possíveis grupos formados em um espaço de dimensão reduzida. Por sua vez, para agrupamento, foram utilizados os procedimentos K-médias, AGNES e DIANA, no qual o primeiro, que agrupa de maneira particionada, solicita previamente o número de grupos a ser formado, enquanto os demais, que agrupam hierarquicamente, contornam esse problema em troca da definição da medida de ligação entre grupos. Por fim, as metodologias estudadas foram aplicadas em conjuntos de dados reais com o software R Core Team (2020).In the last decade, the amount of information stored in digital format has grown exponentially, leading to the growing need to produce computationally intensive procedures that help generate information from this data. Among others, the area of unsupervised statistical learning provides techniques that help to obtain information from these data without being associated with answers. Thus, this work proposed to study clustering and dimensionality reduction techniques, in order to explain the data configuration based on measuring the distance between objects. In dimensionality reduction, metric and non-metric multidimensional scaling methods were explored to preview the possible groups formed in a reduced dimension space. In turn, for clustering, the K-means, AGNES and DIANA procedures were used. The first, which groups in a partitioned manner, previously requests the number of groups to be formed, while the others, which group hierarchically, bypass this problem in exchange for defining the measure of linkage between groups. Finally, the studied methodologies were applied to real datasets with the R Core Team software (2020).porUniversidade Federal de Juiz de Fora (UFJF)UFJFBrasilICE – Instituto de Ciências ExatasAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAAprendizagem não supervisionadaUnsupervised learningAnálise de agrupamentoCluster analysisRedução de dimensionalidadeDimensionality reductionEscalonamento multidimensionalMultidimensional scalingVisualização multivariadaMultivariate visualizationTécnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicaçõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALcalvinsilvarodrigues.pdfcalvinsilvarodrigues.pdfCalvin Silva Rodriguesapplication/pdf588851https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/1/calvinsilvarodrigues.pdf82c68d1f496f982a94ad6ebba844c4ceMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTcalvinsilvarodrigues.pdf.txtcalvinsilvarodrigues.pdf.txtExtracted texttext/plain80844https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/4/calvinsilvarodrigues.pdf.txtfa3115921f5389045bdd826afe9505f4MD54THUMBNAILcalvinsilvarodrigues.pdf.jpgcalvinsilvarodrigues.pdf.jpgGenerated Thumbnailimage/jpeg1111https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/5/calvinsilvarodrigues.pdf.jpgbff867040a2e20635098dfa39ff1eebaMD55ufjf/134332021-09-21 03:24:48.694oai:hermes.cpd.ufjf.br:ufjf/13433Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2021-09-21T06:24:48Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false
dc.title.pt_BR.fl_str_mv Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
title Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
spellingShingle Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
Rodrigues, Calvin Silva
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Aprendizagem não supervisionada
Unsupervised learning
Análise de agrupamento
Cluster analysis
Redução de dimensionalidade
Dimensionality reduction
Escalonamento multidimensional
Multidimensional scaling
Visualização multivariada
Multivariate visualization
title_short Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
title_full Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
title_fullStr Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
title_full_unstemmed Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
title_sort Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
author Rodrigues, Calvin Silva
author_facet Rodrigues, Calvin Silva
author_role author
dc.contributor.advisor1.fl_str_mv Bessegato, Lupércio França
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1996265064545965
dc.contributor.referee1.fl_str_mv Bessegato, Lupércio França
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/1996265064545965
dc.contributor.referee2.fl_str_mv Zeller, Camila Borelli
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/6671405481844657
dc.contributor.referee3.fl_str_mv Lana, Gustavo de Carvalho
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/4240584806339105
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2004040805272486
dc.contributor.author.fl_str_mv Rodrigues, Calvin Silva
contributor_str_mv Bessegato, Lupércio França
Bessegato, Lupércio França
Zeller, Camila Borelli
Lana, Gustavo de Carvalho
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
topic CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Aprendizagem não supervisionada
Unsupervised learning
Análise de agrupamento
Cluster analysis
Redução de dimensionalidade
Dimensionality reduction
Escalonamento multidimensional
Multidimensional scaling
Visualização multivariada
Multivariate visualization
dc.subject.por.fl_str_mv Aprendizagem não supervisionada
Unsupervised learning
Análise de agrupamento
Cluster analysis
Redução de dimensionalidade
Dimensionality reduction
Escalonamento multidimensional
Multidimensional scaling
Visualização multivariada
Multivariate visualization
description Na última década, a quantidade de informações armazenadas no formato digital tem crescido exponencialmente, levando à necessidade cada vez maior de produção de procedimentos computacionalmente intensivos que auxiliem na geração de informação a partir desses dados. Dentre outras, a área de aprendizagem estatística não supervisionada fornece técnicas que auxiliam na obtenção de informação a partir desses dados sem que estejam associados a respostas. Dessa maneira, esse trabalho propôs estudar técnicas de agrupamento e de redução de dimensionalidade, a fim de explicar a configuração dos dados a partir de medida de distância entre objetos. Em redução de dimensionalidade foram explorados métodos de escalonamento multidimensional métrico e não métrico para visualizar previamente os possíveis grupos formados em um espaço de dimensão reduzida. Por sua vez, para agrupamento, foram utilizados os procedimentos K-médias, AGNES e DIANA, no qual o primeiro, que agrupa de maneira particionada, solicita previamente o número de grupos a ser formado, enquanto os demais, que agrupam hierarquicamente, contornam esse problema em troca da definição da medida de ligação entre grupos. Por fim, as metodologias estudadas foram aplicadas em conjuntos de dados reais com o software R Core Team (2020).
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-09-20T20:12:28Z
dc.date.available.fl_str_mv 2021-09-17
2021-09-20T20:12:28Z
dc.date.issued.fl_str_mv 2021-09-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufjf.br/jspui/handle/ufjf/13433
url https://repositorio.ufjf.br/jspui/handle/ufjf/13433
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.publisher.initials.fl_str_mv UFJF
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICE – Instituto de Ciências Exatas
publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFJF
instname:Universidade Federal de Juiz de Fora (UFJF)
instacron:UFJF
instname_str Universidade Federal de Juiz de Fora (UFJF)
instacron_str UFJF
institution UFJF
reponame_str Repositório Institucional da UFJF
collection Repositório Institucional da UFJF
bitstream.url.fl_str_mv https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/1/calvinsilvarodrigues.pdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/2/license_rdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/3/license.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/4/calvinsilvarodrigues.pdf.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/5/calvinsilvarodrigues.pdf.jpg
bitstream.checksum.fl_str_mv 82c68d1f496f982a94ad6ebba844c4ce
e39d27027a6cc9cb039ad269a5db8e34
8a4605be74aa9ea9d79846c1fba20a33
fa3115921f5389045bdd826afe9505f4
bff867040a2e20635098dfa39ff1eeba
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)
repository.mail.fl_str_mv
_version_ 1801661295801401344