Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/26201 |
Resumo: | Atualmente, conforme a tecnologia avança, a quantidade de dados cresce exponencialmente, com milhões de terabytes de dados sendo gerados diariamente. Para obter informações a partir de um conjunto de dados, métodos de machine learning, ou aprendizado de máquinas, são utilizados para análises, previsões, resolução de problemas, de acordo com o que se busca extrair, automatizando o desenvolvimento de modelos analíticos. Porém, por mais que seja “fácil” o acesso há diversas bases de dados, em alguns casos, as bases não conterão todas as informações almejadas, como dados rotulados, ou categorizados. Isso acontece porque coletar dados anotados pode ser extremamente caro, custar muito tempo, e em certas situações, até mesmo impossível. Para lidar com essa ausência de informações desejadas, são utilizadas técnicas de aprendizado de máquinas não supervisionado, que auxiliam na detecção de padrões e percepções ocultas nos dados analisados. Entre diversos métodos, um dos mais importantes dentro de aprendizagem não supervisionada é o clustering, ou agrupamento, em que seus algoritmos processarão os dados, permitindo encontrar clusters (grupos) caso existam, de forma que os elementos dentro do mesmo cluster sejam o mais semelhante possível, e tenham menos ou nenhuma semelhança com os elementos de outro grupo. O objetivo deste trabalho é estudar e aplicar algoritmos de clustering em um conjunto de dados não rotulado, utilizando suas respectivas ferramentas na linguagem de programação R, verificando se os algoritmos são capazes de fornecer resultados eficientes e confiáveis. |
id |
UFF-2_64100d0e9afc25aae1468465cfae3c8a |
---|---|
oai_identifier_str |
oai:app.uff.br:1/26201 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Métodos de Clustering em Aprendizado de Máquinas Não SupervisionadoClusteringClusterMétodo k-meansMétodo complete linkageAprendizado de máquinaAnálise de agrupamentoAtualmente, conforme a tecnologia avança, a quantidade de dados cresce exponencialmente, com milhões de terabytes de dados sendo gerados diariamente. Para obter informações a partir de um conjunto de dados, métodos de machine learning, ou aprendizado de máquinas, são utilizados para análises, previsões, resolução de problemas, de acordo com o que se busca extrair, automatizando o desenvolvimento de modelos analíticos. Porém, por mais que seja “fácil” o acesso há diversas bases de dados, em alguns casos, as bases não conterão todas as informações almejadas, como dados rotulados, ou categorizados. Isso acontece porque coletar dados anotados pode ser extremamente caro, custar muito tempo, e em certas situações, até mesmo impossível. Para lidar com essa ausência de informações desejadas, são utilizadas técnicas de aprendizado de máquinas não supervisionado, que auxiliam na detecção de padrões e percepções ocultas nos dados analisados. Entre diversos métodos, um dos mais importantes dentro de aprendizagem não supervisionada é o clustering, ou agrupamento, em que seus algoritmos processarão os dados, permitindo encontrar clusters (grupos) caso existam, de forma que os elementos dentro do mesmo cluster sejam o mais semelhante possível, e tenham menos ou nenhuma semelhança com os elementos de outro grupo. O objetivo deste trabalho é estudar e aplicar algoritmos de clustering em um conjunto de dados não rotulado, utilizando suas respectivas ferramentas na linguagem de programação R, verificando se os algoritmos são capazes de fornecer resultados eficientes e confiáveis.89 f.NiteróiYaginuma, Karina YurikoYaginuma, Karina YurikoSantos, Hugo Henrique Kegler dosCosta, Patrícia Lusié Velozo daYaginuma, Karina YurikoARAÚJO, MARLON VINÍCIUS ALVES DE2022-09-05T13:53:50Z2022-09-05T13:53:50Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfARAÚJO, Marlon Vinícius Alves de. Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado. 2021. 89 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.http://app.uff.br/riuff/handle/1/26201Aluno de GraduaçãoCC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-09-05T13:53:54Zoai:app.uff.br:1/26201Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202022-09-05T13:53:54Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado |
title |
Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado |
spellingShingle |
Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado ARAÚJO, MARLON VINÍCIUS ALVES DE Clustering Cluster Método k-means Método complete linkage Aprendizado de máquina Análise de agrupamento |
title_short |
Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado |
title_full |
Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado |
title_fullStr |
Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado |
title_full_unstemmed |
Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado |
title_sort |
Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado |
author |
ARAÚJO, MARLON VINÍCIUS ALVES DE |
author_facet |
ARAÚJO, MARLON VINÍCIUS ALVES DE |
author_role |
author |
dc.contributor.none.fl_str_mv |
Yaginuma, Karina Yuriko Yaginuma, Karina Yuriko Santos, Hugo Henrique Kegler dos Costa, Patrícia Lusié Velozo da Yaginuma, Karina Yuriko |
dc.contributor.author.fl_str_mv |
ARAÚJO, MARLON VINÍCIUS ALVES DE |
dc.subject.por.fl_str_mv |
Clustering Cluster Método k-means Método complete linkage Aprendizado de máquina Análise de agrupamento |
topic |
Clustering Cluster Método k-means Método complete linkage Aprendizado de máquina Análise de agrupamento |
description |
Atualmente, conforme a tecnologia avança, a quantidade de dados cresce exponencialmente, com milhões de terabytes de dados sendo gerados diariamente. Para obter informações a partir de um conjunto de dados, métodos de machine learning, ou aprendizado de máquinas, são utilizados para análises, previsões, resolução de problemas, de acordo com o que se busca extrair, automatizando o desenvolvimento de modelos analíticos. Porém, por mais que seja “fácil” o acesso há diversas bases de dados, em alguns casos, as bases não conterão todas as informações almejadas, como dados rotulados, ou categorizados. Isso acontece porque coletar dados anotados pode ser extremamente caro, custar muito tempo, e em certas situações, até mesmo impossível. Para lidar com essa ausência de informações desejadas, são utilizadas técnicas de aprendizado de máquinas não supervisionado, que auxiliam na detecção de padrões e percepções ocultas nos dados analisados. Entre diversos métodos, um dos mais importantes dentro de aprendizagem não supervisionada é o clustering, ou agrupamento, em que seus algoritmos processarão os dados, permitindo encontrar clusters (grupos) caso existam, de forma que os elementos dentro do mesmo cluster sejam o mais semelhante possível, e tenham menos ou nenhuma semelhança com os elementos de outro grupo. O objetivo deste trabalho é estudar e aplicar algoritmos de clustering em um conjunto de dados não rotulado, utilizando suas respectivas ferramentas na linguagem de programação R, verificando se os algoritmos são capazes de fornecer resultados eficientes e confiáveis. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 2022-09-05T13:53:50Z 2022-09-05T13:53:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
ARAÚJO, Marlon Vinícius Alves de. Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado. 2021. 89 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021. http://app.uff.br/riuff/handle/1/26201 Aluno de Graduação |
identifier_str_mv |
ARAÚJO, Marlon Vinícius Alves de. Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado. 2021. 89 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021. Aluno de Graduação |
url |
http://app.uff.br/riuff/handle/1/26201 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Niterói |
publisher.none.fl_str_mv |
Niterói |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1807838834848694272 |