Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFJF |
Texto Completo: | https://repositorio.ufjf.br/jspui/handle/ufjf/13433 |
Resumo: | Na última década, a quantidade de informações armazenadas no formato digital tem crescido exponencialmente, levando à necessidade cada vez maior de produção de procedimentos computacionalmente intensivos que auxiliem na geração de informação a partir desses dados. Dentre outras, a área de aprendizagem estatística não supervisionada fornece técnicas que auxiliam na obtenção de informação a partir desses dados sem que estejam associados a respostas. Dessa maneira, esse trabalho propôs estudar técnicas de agrupamento e de redução de dimensionalidade, a fim de explicar a configuração dos dados a partir de medida de distância entre objetos. Em redução de dimensionalidade foram explorados métodos de escalonamento multidimensional métrico e não métrico para visualizar previamente os possíveis grupos formados em um espaço de dimensão reduzida. Por sua vez, para agrupamento, foram utilizados os procedimentos K-médias, AGNES e DIANA, no qual o primeiro, que agrupa de maneira particionada, solicita previamente o número de grupos a ser formado, enquanto os demais, que agrupam hierarquicamente, contornam esse problema em troca da definição da medida de ligação entre grupos. Por fim, as metodologias estudadas foram aplicadas em conjuntos de dados reais com o software R Core Team (2020). |
id |
UFJF_d246ca321f1c788e0703115b56987eaf |
---|---|
oai_identifier_str |
oai:hermes.cpd.ufjf.br:ufjf/13433 |
network_acronym_str |
UFJF |
network_name_str |
Repositório Institucional da UFJF |
repository_id_str |
|
spelling |
Bessegato, Lupércio Françahttp://lattes.cnpq.br/1996265064545965Bessegato, Lupércio Françahttp://lattes.cnpq.br/1996265064545965Zeller, Camila Borellihttp://lattes.cnpq.br/6671405481844657Lana, Gustavo de Carvalhohttp://lattes.cnpq.br/4240584806339105http://lattes.cnpq.br/2004040805272486Rodrigues, Calvin Silva2021-09-20T20:12:28Z2021-09-172021-09-20T20:12:28Z2021-09-10https://repositorio.ufjf.br/jspui/handle/ufjf/13433Na última década, a quantidade de informações armazenadas no formato digital tem crescido exponencialmente, levando à necessidade cada vez maior de produção de procedimentos computacionalmente intensivos que auxiliem na geração de informação a partir desses dados. Dentre outras, a área de aprendizagem estatística não supervisionada fornece técnicas que auxiliam na obtenção de informação a partir desses dados sem que estejam associados a respostas. Dessa maneira, esse trabalho propôs estudar técnicas de agrupamento e de redução de dimensionalidade, a fim de explicar a configuração dos dados a partir de medida de distância entre objetos. Em redução de dimensionalidade foram explorados métodos de escalonamento multidimensional métrico e não métrico para visualizar previamente os possíveis grupos formados em um espaço de dimensão reduzida. Por sua vez, para agrupamento, foram utilizados os procedimentos K-médias, AGNES e DIANA, no qual o primeiro, que agrupa de maneira particionada, solicita previamente o número de grupos a ser formado, enquanto os demais, que agrupam hierarquicamente, contornam esse problema em troca da definição da medida de ligação entre grupos. Por fim, as metodologias estudadas foram aplicadas em conjuntos de dados reais com o software R Core Team (2020).In the last decade, the amount of information stored in digital format has grown exponentially, leading to the growing need to produce computationally intensive procedures that help generate information from this data. Among others, the area of unsupervised statistical learning provides techniques that help to obtain information from these data without being associated with answers. Thus, this work proposed to study clustering and dimensionality reduction techniques, in order to explain the data configuration based on measuring the distance between objects. In dimensionality reduction, metric and non-metric multidimensional scaling methods were explored to preview the possible groups formed in a reduced dimension space. In turn, for clustering, the K-means, AGNES and DIANA procedures were used. The first, which groups in a partitioned manner, previously requests the number of groups to be formed, while the others, which group hierarchically, bypass this problem in exchange for defining the measure of linkage between groups. Finally, the studied methodologies were applied to real datasets with the R Core Team software (2020).porUniversidade Federal de Juiz de Fora (UFJF)UFJFBrasilICE – Instituto de Ciências ExatasAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAAprendizagem não supervisionadaUnsupervised learningAnálise de agrupamentoCluster analysisRedução de dimensionalidadeDimensionality reductionEscalonamento multidimensionalMultidimensional scalingVisualização multivariadaMultivariate visualizationTécnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicaçõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALcalvinsilvarodrigues.pdfcalvinsilvarodrigues.pdfCalvin Silva Rodriguesapplication/pdf588851https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/1/calvinsilvarodrigues.pdf82c68d1f496f982a94ad6ebba844c4ceMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTcalvinsilvarodrigues.pdf.txtcalvinsilvarodrigues.pdf.txtExtracted texttext/plain80844https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/4/calvinsilvarodrigues.pdf.txtfa3115921f5389045bdd826afe9505f4MD54THUMBNAILcalvinsilvarodrigues.pdf.jpgcalvinsilvarodrigues.pdf.jpgGenerated Thumbnailimage/jpeg1111https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/5/calvinsilvarodrigues.pdf.jpgbff867040a2e20635098dfa39ff1eebaMD55ufjf/134332021-09-21 03:24:48.694oai:hermes.cpd.ufjf.br:ufjf/13433Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2021-09-21T06:24:48Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false |
dc.title.pt_BR.fl_str_mv |
Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações |
title |
Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações |
spellingShingle |
Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações Rodrigues, Calvin Silva CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA Aprendizagem não supervisionada Unsupervised learning Análise de agrupamento Cluster analysis Redução de dimensionalidade Dimensionality reduction Escalonamento multidimensional Multidimensional scaling Visualização multivariada Multivariate visualization |
title_short |
Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações |
title_full |
Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações |
title_fullStr |
Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações |
title_full_unstemmed |
Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações |
title_sort |
Técnicas e visualização de agrupamentos em aprendizagem não supervisionada com aplicações |
author |
Rodrigues, Calvin Silva |
author_facet |
Rodrigues, Calvin Silva |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Bessegato, Lupércio França |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1996265064545965 |
dc.contributor.referee1.fl_str_mv |
Bessegato, Lupércio França |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/1996265064545965 |
dc.contributor.referee2.fl_str_mv |
Zeller, Camila Borelli |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/6671405481844657 |
dc.contributor.referee3.fl_str_mv |
Lana, Gustavo de Carvalho |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/4240584806339105 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2004040805272486 |
dc.contributor.author.fl_str_mv |
Rodrigues, Calvin Silva |
contributor_str_mv |
Bessegato, Lupércio França Bessegato, Lupércio França Zeller, Camila Borelli Lana, Gustavo de Carvalho |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA Aprendizagem não supervisionada Unsupervised learning Análise de agrupamento Cluster analysis Redução de dimensionalidade Dimensionality reduction Escalonamento multidimensional Multidimensional scaling Visualização multivariada Multivariate visualization |
dc.subject.por.fl_str_mv |
Aprendizagem não supervisionada Unsupervised learning Análise de agrupamento Cluster analysis Redução de dimensionalidade Dimensionality reduction Escalonamento multidimensional Multidimensional scaling Visualização multivariada Multivariate visualization |
description |
Na última década, a quantidade de informações armazenadas no formato digital tem crescido exponencialmente, levando à necessidade cada vez maior de produção de procedimentos computacionalmente intensivos que auxiliem na geração de informação a partir desses dados. Dentre outras, a área de aprendizagem estatística não supervisionada fornece técnicas que auxiliam na obtenção de informação a partir desses dados sem que estejam associados a respostas. Dessa maneira, esse trabalho propôs estudar técnicas de agrupamento e de redução de dimensionalidade, a fim de explicar a configuração dos dados a partir de medida de distância entre objetos. Em redução de dimensionalidade foram explorados métodos de escalonamento multidimensional métrico e não métrico para visualizar previamente os possíveis grupos formados em um espaço de dimensão reduzida. Por sua vez, para agrupamento, foram utilizados os procedimentos K-médias, AGNES e DIANA, no qual o primeiro, que agrupa de maneira particionada, solicita previamente o número de grupos a ser formado, enquanto os demais, que agrupam hierarquicamente, contornam esse problema em troca da definição da medida de ligação entre grupos. Por fim, as metodologias estudadas foram aplicadas em conjuntos de dados reais com o software R Core Team (2020). |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-09-20T20:12:28Z |
dc.date.available.fl_str_mv |
2021-09-17 2021-09-20T20:12:28Z |
dc.date.issued.fl_str_mv |
2021-09-10 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufjf.br/jspui/handle/ufjf/13433 |
url |
https://repositorio.ufjf.br/jspui/handle/ufjf/13433 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.publisher.initials.fl_str_mv |
UFJF |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
ICE – Instituto de Ciências Exatas |
publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFJF instname:Universidade Federal de Juiz de Fora (UFJF) instacron:UFJF |
instname_str |
Universidade Federal de Juiz de Fora (UFJF) |
instacron_str |
UFJF |
institution |
UFJF |
reponame_str |
Repositório Institucional da UFJF |
collection |
Repositório Institucional da UFJF |
bitstream.url.fl_str_mv |
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/1/calvinsilvarodrigues.pdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/2/license_rdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/3/license.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/4/calvinsilvarodrigues.pdf.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/13433/5/calvinsilvarodrigues.pdf.jpg |
bitstream.checksum.fl_str_mv |
82c68d1f496f982a94ad6ebba844c4ce e39d27027a6cc9cb039ad269a5db8e34 8a4605be74aa9ea9d79846c1fba20a33 fa3115921f5389045bdd826afe9505f4 bff867040a2e20635098dfa39ff1eeba |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF) |
repository.mail.fl_str_mv |
|
_version_ |
1801661295801401344 |