Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFT |
Texto Completo: | http://hdl.handle.net/11612/1764 |
Resumo: | Este trabalho tem como objetivo analisar a convergência do método K-means, um algoritmo de aprendizado não supervisionado que agrupa n dados em k-clusters. Neste sentido, apresentamos algumas das vantagens e desvantagens do método K-means, comparando o agrupamento original e a clusterização feita pelo algoritmo. Também, apresentamos a aplicação do algoritmo em dois conjuntos de dados: o câncer de mama e diabetes, analisando a clusterização feita pelo K-means assim como os padrões e regularidades presentes nos clusters. Dessa forma, buscamos apresentar um estudo introdutório da teoria do Aprendizado de Máquina, que busca fazer com que as máquinas realizem tarefas sem que sejam instruídas o tempo todo, partindo apenas de algumas instruções iniciais. Especificamente, procuramos compreender algumas de suas definições e características que permitirão identificar o tipo de aprendizado estudado. |
id |
UFT_6d3c3093702af5c6f32bd928d6d3faf5 |
---|---|
oai_identifier_str |
oai:repositorio.uft.edu.br:11612/1764 |
network_acronym_str |
UFT |
network_name_str |
Repositório Institucional da UFT |
repository_id_str |
|
spelling |
Sousa, Maria Cristina Cordeiro SousaHancco, Alvaro Julio Yucra2020-02-20T17:51:43Z2020-02-20T17:51:43Z2020-02-20SOUSA, Maria Cristina Cordeiro. Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas. 2019. 74 f. Monografia (Graduação) - Curso de Matemática, Universidade Federal do Tocantins, Araguaína, 2019.http://hdl.handle.net/11612/1764Este trabalho tem como objetivo analisar a convergência do método K-means, um algoritmo de aprendizado não supervisionado que agrupa n dados em k-clusters. Neste sentido, apresentamos algumas das vantagens e desvantagens do método K-means, comparando o agrupamento original e a clusterização feita pelo algoritmo. Também, apresentamos a aplicação do algoritmo em dois conjuntos de dados: o câncer de mama e diabetes, analisando a clusterização feita pelo K-means assim como os padrões e regularidades presentes nos clusters. Dessa forma, buscamos apresentar um estudo introdutório da teoria do Aprendizado de Máquina, que busca fazer com que as máquinas realizem tarefas sem que sejam instruídas o tempo todo, partindo apenas de algumas instruções iniciais. Especificamente, procuramos compreender algumas de suas definições e características que permitirão identificar o tipo de aprendizado estudado.This work aims to analyze the convergence of the K-means method, an unsupervised learning algorithm that groups n data into k-clusters. In this sense, we presented some of the advantages and disadvantages of the K-means method, comparing the original clustering and the clustering done by the algorithm. Also, we presented the application of the algorithm in two data sets: breast cancer and diabetes, analyzing the clustering done by K-means as well as the patterns and regularities present in the clusters. In this way, we seek to present an introductory study of Machine Learning theory, which seeks to make machines perform tasks without being instructed all the time, starting only from some initial instructions. Specifically, we seek to understand some of its definitions and characteristics that will allow identifying the type of learning studied.Universidade Federal do TocantinsAraguaínaCURSO::ARAGUAÍNA::PRESENCIALAraguaínaGraduaçãoAcesso livre.info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICAOtimizaçãoK-meansClusteringAprendizado de MáquinaOptimizationMachine Learning.Uma análise do algoritmo K-means como introdução ao aprendizado de máquinasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFTinstname:Universidade Federal do Tocantins (UFT)instacron:UFTORIGINALMARIA CRISTINA CORDEIRO SOUSA - TCC - MATEMÁTICA.pdfMARIA CRISTINA CORDEIRO SOUSA - TCC - MATEMÁTICA.pdfapplication/pdf15090519http://repositorio.uft.edu.br/bitstream/11612/1764/1/MARIA%20CRISTINA%20CORDEIRO%20SOUSA%20-%20TCC%20-%20MATEM%c3%81TICA.pdfdb9c46f5b5efbf25f9ee8be597e683d3MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.uft.edu.br/bitstream/11612/1764/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTMARIA CRISTINA CORDEIRO SOUSA - TCC - MATEMÁTICA.pdf.txtMARIA CRISTINA CORDEIRO SOUSA - TCC - MATEMÁTICA.pdf.txtExtracted texttext/plain101003http://repositorio.uft.edu.br/bitstream/11612/1764/3/MARIA%20CRISTINA%20CORDEIRO%20SOUSA%20-%20TCC%20-%20MATEM%c3%81TICA.pdf.txta83c517348a0cf0a319f3d3aabbe83f8MD53THUMBNAILMARIA CRISTINA CORDEIRO SOUSA - TCC - MATEMÁTICA.pdf.jpgMARIA CRISTINA CORDEIRO SOUSA - TCC - MATEMÁTICA.pdf.jpgGenerated Thumbnailimage/jpeg1193http://repositorio.uft.edu.br/bitstream/11612/1764/4/MARIA%20CRISTINA%20CORDEIRO%20SOUSA%20-%20TCC%20-%20MATEM%c3%81TICA.pdf.jpg2c05edc50cb5f9cefb1becfe1299b977MD5411612/17642020-02-21 03:01:48.982oai:repositorio.uft.edu.br:11612/1764Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://repositorio.uft.edu.br/oai/requestbiblioarraias@uft.edu.br || bibliogpi@uft.edu.br || bibliomira@uft.edu.br || bibliopalmas@uft.edu.br || biblioporto@uft.edu.br || biblioarag@uft.edu.br || dirbib@ufnt.edu.br || bibliocca@uft.edu.br || bibliotoc@uft.edu.bropendoar:2020-02-21T06:01:48Repositório Institucional da UFT - Universidade Federal do Tocantins (UFT)false |
dc.title.pt_BR.fl_str_mv |
Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas |
title |
Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas |
spellingShingle |
Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas Sousa, Maria Cristina Cordeiro Sousa CNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICA Otimização K-means Clustering Aprendizado de Máquina Optimization Machine Learning. |
title_short |
Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas |
title_full |
Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas |
title_fullStr |
Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas |
title_full_unstemmed |
Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas |
title_sort |
Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas |
author |
Sousa, Maria Cristina Cordeiro Sousa |
author_facet |
Sousa, Maria Cristina Cordeiro Sousa |
author_role |
author |
dc.contributor.author.fl_str_mv |
Sousa, Maria Cristina Cordeiro Sousa |
dc.contributor.advisor1.fl_str_mv |
Hancco, Alvaro Julio Yucra |
contributor_str_mv |
Hancco, Alvaro Julio Yucra |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICA Otimização K-means Clustering Aprendizado de Máquina Optimization Machine Learning. |
dc.subject.por.fl_str_mv |
Otimização K-means Clustering Aprendizado de Máquina Optimization Machine Learning. |
description |
Este trabalho tem como objetivo analisar a convergência do método K-means, um algoritmo de aprendizado não supervisionado que agrupa n dados em k-clusters. Neste sentido, apresentamos algumas das vantagens e desvantagens do método K-means, comparando o agrupamento original e a clusterização feita pelo algoritmo. Também, apresentamos a aplicação do algoritmo em dois conjuntos de dados: o câncer de mama e diabetes, analisando a clusterização feita pelo K-means assim como os padrões e regularidades presentes nos clusters. Dessa forma, buscamos apresentar um estudo introdutório da teoria do Aprendizado de Máquina, que busca fazer com que as máquinas realizem tarefas sem que sejam instruídas o tempo todo, partindo apenas de algumas instruções iniciais. Especificamente, procuramos compreender algumas de suas definições e características que permitirão identificar o tipo de aprendizado estudado. |
publishDate |
2020 |
dc.date.accessioned.fl_str_mv |
2020-02-20T17:51:43Z |
dc.date.available.fl_str_mv |
2020-02-20T17:51:43Z |
dc.date.issued.fl_str_mv |
2020-02-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SOUSA, Maria Cristina Cordeiro. Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas. 2019. 74 f. Monografia (Graduação) - Curso de Matemática, Universidade Federal do Tocantins, Araguaína, 2019. |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11612/1764 |
identifier_str_mv |
SOUSA, Maria Cristina Cordeiro. Uma análise do algoritmo K-means como introdução ao aprendizado de máquinas. 2019. 74 f. Monografia (Graduação) - Curso de Matemática, Universidade Federal do Tocantins, Araguaína, 2019. |
url |
http://hdl.handle.net/11612/1764 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Acesso livre. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Acesso livre. |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Tocantins Araguaína CURSO::ARAGUAÍNA::PRESENCIAL Araguaína Graduação |
publisher.none.fl_str_mv |
Universidade Federal do Tocantins Araguaína CURSO::ARAGUAÍNA::PRESENCIAL Araguaína Graduação |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFT instname:Universidade Federal do Tocantins (UFT) instacron:UFT |
instname_str |
Universidade Federal do Tocantins (UFT) |
instacron_str |
UFT |
institution |
UFT |
reponame_str |
Repositório Institucional da UFT |
collection |
Repositório Institucional da UFT |
bitstream.url.fl_str_mv |
http://repositorio.uft.edu.br/bitstream/11612/1764/1/MARIA%20CRISTINA%20CORDEIRO%20SOUSA%20-%20TCC%20-%20MATEM%c3%81TICA.pdf http://repositorio.uft.edu.br/bitstream/11612/1764/2/license.txt http://repositorio.uft.edu.br/bitstream/11612/1764/3/MARIA%20CRISTINA%20CORDEIRO%20SOUSA%20-%20TCC%20-%20MATEM%c3%81TICA.pdf.txt http://repositorio.uft.edu.br/bitstream/11612/1764/4/MARIA%20CRISTINA%20CORDEIRO%20SOUSA%20-%20TCC%20-%20MATEM%c3%81TICA.pdf.jpg |
bitstream.checksum.fl_str_mv |
db9c46f5b5efbf25f9ee8be597e683d3 8a4605be74aa9ea9d79846c1fba20a33 a83c517348a0cf0a319f3d3aabbe83f8 2c05edc50cb5f9cefb1becfe1299b977 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFT - Universidade Federal do Tocantins (UFT) |
repository.mail.fl_str_mv |
biblioarraias@uft.edu.br || bibliogpi@uft.edu.br || bibliomira@uft.edu.br || bibliopalmas@uft.edu.br || biblioporto@uft.edu.br || biblioarag@uft.edu.br || dirbib@ufnt.edu.br || bibliocca@uft.edu.br || bibliotoc@uft.edu.br |
_version_ |
1813912795138228224 |