Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado

Detalhes bibliográficos
Autor(a) principal: ARAÚJO, MARLON VINÍCIUS ALVES DE
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/26201
Resumo: Atualmente, conforme a tecnologia avança, a quantidade de dados cresce exponencialmente, com milhões de terabytes de dados sendo gerados diariamente. Para obter informações a partir de um conjunto de dados, métodos de machine learning, ou aprendizado de máquinas, são utilizados para análises, previsões, resolução de problemas, de acordo com o que se busca extrair, automatizando o desenvolvimento de modelos analíticos. Porém, por mais que seja “fácil” o acesso há diversas bases de dados, em alguns casos, as bases não conterão todas as informações almejadas, como dados rotulados, ou categorizados. Isso acontece porque coletar dados anotados pode ser extremamente caro, custar muito tempo, e em certas situações, até mesmo impossível. Para lidar com essa ausência de informações desejadas, são utilizadas técnicas de aprendizado de máquinas não supervisionado, que auxiliam na detecção de padrões e percepções ocultas nos dados analisados. Entre diversos métodos, um dos mais importantes dentro de aprendizagem não supervisionada é o clustering, ou agrupamento, em que seus algoritmos processarão os dados, permitindo encontrar clusters (grupos) caso existam, de forma que os elementos dentro do mesmo cluster sejam o mais semelhante possível, e tenham menos ou nenhuma semelhança com os elementos de outro grupo. O objetivo deste trabalho é estudar e aplicar algoritmos de clustering em um conjunto de dados não rotulado, utilizando suas respectivas ferramentas na linguagem de programação R, verificando se os algoritmos são capazes de fornecer resultados eficientes e confiáveis.
id UFF-2_64100d0e9afc25aae1468465cfae3c8a
oai_identifier_str oai:app.uff.br:1/26201
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Métodos de Clustering em Aprendizado de Máquinas Não SupervisionadoClusteringClusterMétodo k-meansMétodo complete linkageAprendizado de máquinaAnálise de agrupamentoAtualmente, conforme a tecnologia avança, a quantidade de dados cresce exponencialmente, com milhões de terabytes de dados sendo gerados diariamente. Para obter informações a partir de um conjunto de dados, métodos de machine learning, ou aprendizado de máquinas, são utilizados para análises, previsões, resolução de problemas, de acordo com o que se busca extrair, automatizando o desenvolvimento de modelos analíticos. Porém, por mais que seja “fácil” o acesso há diversas bases de dados, em alguns casos, as bases não conterão todas as informações almejadas, como dados rotulados, ou categorizados. Isso acontece porque coletar dados anotados pode ser extremamente caro, custar muito tempo, e em certas situações, até mesmo impossível. Para lidar com essa ausência de informações desejadas, são utilizadas técnicas de aprendizado de máquinas não supervisionado, que auxiliam na detecção de padrões e percepções ocultas nos dados analisados. Entre diversos métodos, um dos mais importantes dentro de aprendizagem não supervisionada é o clustering, ou agrupamento, em que seus algoritmos processarão os dados, permitindo encontrar clusters (grupos) caso existam, de forma que os elementos dentro do mesmo cluster sejam o mais semelhante possível, e tenham menos ou nenhuma semelhança com os elementos de outro grupo. O objetivo deste trabalho é estudar e aplicar algoritmos de clustering em um conjunto de dados não rotulado, utilizando suas respectivas ferramentas na linguagem de programação R, verificando se os algoritmos são capazes de fornecer resultados eficientes e confiáveis.89 f.NiteróiYaginuma, Karina YurikoYaginuma, Karina YurikoSantos, Hugo Henrique Kegler dosCosta, Patrícia Lusié Velozo daYaginuma, Karina YurikoARAÚJO, MARLON VINÍCIUS ALVES DE2022-09-05T13:53:50Z2022-09-05T13:53:50Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfARAÚJO, Marlon Vinícius Alves de. Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado. 2021. 89 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.http://app.uff.br/riuff/handle/1/26201Aluno de GraduaçãoCC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-09-05T13:53:54Zoai:app.uff.br:1/26201Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202022-09-05T13:53:54Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
title Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
spellingShingle Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
ARAÚJO, MARLON VINÍCIUS ALVES DE
Clustering
Cluster
Método k-means
Método complete linkage
Aprendizado de máquina
Análise de agrupamento
title_short Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
title_full Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
title_fullStr Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
title_full_unstemmed Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
title_sort Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
author ARAÚJO, MARLON VINÍCIUS ALVES DE
author_facet ARAÚJO, MARLON VINÍCIUS ALVES DE
author_role author
dc.contributor.none.fl_str_mv Yaginuma, Karina Yuriko
Yaginuma, Karina Yuriko
Santos, Hugo Henrique Kegler dos
Costa, Patrícia Lusié Velozo da
Yaginuma, Karina Yuriko
dc.contributor.author.fl_str_mv ARAÚJO, MARLON VINÍCIUS ALVES DE
dc.subject.por.fl_str_mv Clustering
Cluster
Método k-means
Método complete linkage
Aprendizado de máquina
Análise de agrupamento
topic Clustering
Cluster
Método k-means
Método complete linkage
Aprendizado de máquina
Análise de agrupamento
description Atualmente, conforme a tecnologia avança, a quantidade de dados cresce exponencialmente, com milhões de terabytes de dados sendo gerados diariamente. Para obter informações a partir de um conjunto de dados, métodos de machine learning, ou aprendizado de máquinas, são utilizados para análises, previsões, resolução de problemas, de acordo com o que se busca extrair, automatizando o desenvolvimento de modelos analíticos. Porém, por mais que seja “fácil” o acesso há diversas bases de dados, em alguns casos, as bases não conterão todas as informações almejadas, como dados rotulados, ou categorizados. Isso acontece porque coletar dados anotados pode ser extremamente caro, custar muito tempo, e em certas situações, até mesmo impossível. Para lidar com essa ausência de informações desejadas, são utilizadas técnicas de aprendizado de máquinas não supervisionado, que auxiliam na detecção de padrões e percepções ocultas nos dados analisados. Entre diversos métodos, um dos mais importantes dentro de aprendizagem não supervisionada é o clustering, ou agrupamento, em que seus algoritmos processarão os dados, permitindo encontrar clusters (grupos) caso existam, de forma que os elementos dentro do mesmo cluster sejam o mais semelhante possível, e tenham menos ou nenhuma semelhança com os elementos de outro grupo. O objetivo deste trabalho é estudar e aplicar algoritmos de clustering em um conjunto de dados não rotulado, utilizando suas respectivas ferramentas na linguagem de programação R, verificando se os algoritmos são capazes de fornecer resultados eficientes e confiáveis.
publishDate 2021
dc.date.none.fl_str_mv 2021
2022-09-05T13:53:50Z
2022-09-05T13:53:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ARAÚJO, Marlon Vinícius Alves de. Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado. 2021. 89 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.
http://app.uff.br/riuff/handle/1/26201
Aluno de Graduação
identifier_str_mv ARAÚJO, Marlon Vinícius Alves de. Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado. 2021. 89 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.
Aluno de Graduação
url http://app.uff.br/riuff/handle/1/26201
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Niterói
publisher.none.fl_str_mv Niterói
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1807838834848694272