Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística

Detalhes bibliográficos
Autor(a) principal: Trindade, Mateus Oliveira Salvador da
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/55980
Resumo: Esse trabalho estuda a relação da Estatística com o Aprendizado de Máquina, especificamente no contexto de Métodos de Classificação, onde o computador deve aprender padrões estatísticos e computacionais com base nos dados propostos e conseguir classificar dados ainda não vistos com base em seu aprendizado. O banco de dados analisado nesse trabalho contém informações sobre pacientes com ou sem doenças no coração, em que o objetivo dos métodos é classificar novos pacientes, estimando se eles possuem ou não a doença. Os classificadores escolhidos para esse trabalho foram o Naive Bayes, K-Vizinhos mais próximos e o Random Forest. O desempenho foi medido através das métricas estatísticas acurácia, especificidade e sensitividade. Além disso, também foi medido o tempo de execução de cada classificador. No final, foi visto que o Random Forest obteve os melhores resultados nas métricas acurácia e sensitividade, apesar dos outros métodos alcançarem valores bastante próximos. Entretanto, também apresentou o pior resultado de tempo de execução. Dessa forma, é possível concluir que a seleção do melhor modelo, pode ser subjetiva, pois deve ser levado em consideração o contexto da aplicação e o poder computacional disponível.
id UFRN_d201533432c3eead506412963ac79767
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/55980
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Trindade, Mateus Oliveira Salvador daNunes, Marcus AlexandreCastro, Bruno Monte deSilva Júnior, Antônio Hermes Marques daCosta, Eliardo Guimarães da Costa2023-12-15T19:20:32Z2023-12-15T19:20:32Z2023-12-06TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/55980Esse trabalho estuda a relação da Estatística com o Aprendizado de Máquina, especificamente no contexto de Métodos de Classificação, onde o computador deve aprender padrões estatísticos e computacionais com base nos dados propostos e conseguir classificar dados ainda não vistos com base em seu aprendizado. O banco de dados analisado nesse trabalho contém informações sobre pacientes com ou sem doenças no coração, em que o objetivo dos métodos é classificar novos pacientes, estimando se eles possuem ou não a doença. Os classificadores escolhidos para esse trabalho foram o Naive Bayes, K-Vizinhos mais próximos e o Random Forest. O desempenho foi medido através das métricas estatísticas acurácia, especificidade e sensitividade. Além disso, também foi medido o tempo de execução de cada classificador. No final, foi visto que o Random Forest obteve os melhores resultados nas métricas acurácia e sensitividade, apesar dos outros métodos alcançarem valores bastante próximos. Entretanto, também apresentou o pior resultado de tempo de execução. Dessa forma, é possível concluir que a seleção do melhor modelo, pode ser subjetiva, pois deve ser levado em consideração o contexto da aplicação e o poder computacional disponível.This work studies the relationship between Statistics and Machine Learning, specifically in the context of Classifiers Methods, where the computer must learn statistical and computational patterns from the provided data and be able to classify new data based on its learning. The database analyzed in this study contains information about patients with or without heart diseases, and the goal of the methods is to classify new patients as either having or not having the disease. The classifiers chosen for this work were Naive Bayes, K-Nearest Neighbors, and Random Forest. Performance was measured using statistical metrics such as accuracy, specificity, and sensitivity. Additionally, the execution time of each classifier was also measured. In the end, it was observed that Random Forest achieved the best accuracy and specificity, despite other classifiers showing similar results, but it had the worst execution time result. It can be concluded that the selection of the best model may be subjective, as it should take into consideration the application context and the available computational power.Universidade Federal do Rio Grande do NorteEstatísticaUFRNBrasilEstatísticaNaive BayesK-Vizinhos mais PróximosRandom ForestAprendizado de MáquinaK-Nearest NeighborsMachine LearningExploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatísticaExploration and comparison of classification algorithms in Machine Learning: a statistical approachinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccessORIGINALTCCBiblioteca.pdfTCCBiblioteca.pdfExploração e Comparação de Algoritmos de Classificação em Machine Learning: Uma Abordagem Estatísticaapplication/pdf667682https://repositorio.ufrn.br/bitstream/123456789/55980/1/TCCBiblioteca.pdf00dbbe158af74b1370d551bf5c923ff4MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/55980/2/license.txte9597aa2854d128fd968be5edc8a28d9MD52123456789/559802023-12-15 16:20:32.871oai:https://repositorio.ufrn.br:123456789/55980Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-12-15T19:20:32Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
dc.title.alternative.pt_BR.fl_str_mv Exploration and comparison of classification algorithms in Machine Learning: a statistical approach
title Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
spellingShingle Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
Trindade, Mateus Oliveira Salvador da
Naive Bayes
K-Vizinhos mais Próximos
Random Forest
Aprendizado de Máquina
K-Nearest Neighbors
Machine Learning
title_short Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
title_full Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
title_fullStr Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
title_full_unstemmed Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
title_sort Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
author Trindade, Mateus Oliveira Salvador da
author_facet Trindade, Mateus Oliveira Salvador da
author_role author
dc.contributor.referees1.none.fl_str_mv Castro, Bruno Monte de
dc.contributor.referees2.none.fl_str_mv Silva Júnior, Antônio Hermes Marques da
dc.contributor.author.fl_str_mv Trindade, Mateus Oliveira Salvador da
dc.contributor.advisor-co1.fl_str_mv Nunes, Marcus Alexandre
dc.contributor.advisor1.fl_str_mv Costa, Eliardo Guimarães da Costa
contributor_str_mv Nunes, Marcus Alexandre
Costa, Eliardo Guimarães da Costa
dc.subject.por.fl_str_mv Naive Bayes
K-Vizinhos mais Próximos
Random Forest
Aprendizado de Máquina
K-Nearest Neighbors
Machine Learning
topic Naive Bayes
K-Vizinhos mais Próximos
Random Forest
Aprendizado de Máquina
K-Nearest Neighbors
Machine Learning
description Esse trabalho estuda a relação da Estatística com o Aprendizado de Máquina, especificamente no contexto de Métodos de Classificação, onde o computador deve aprender padrões estatísticos e computacionais com base nos dados propostos e conseguir classificar dados ainda não vistos com base em seu aprendizado. O banco de dados analisado nesse trabalho contém informações sobre pacientes com ou sem doenças no coração, em que o objetivo dos métodos é classificar novos pacientes, estimando se eles possuem ou não a doença. Os classificadores escolhidos para esse trabalho foram o Naive Bayes, K-Vizinhos mais próximos e o Random Forest. O desempenho foi medido através das métricas estatísticas acurácia, especificidade e sensitividade. Além disso, também foi medido o tempo de execução de cada classificador. No final, foi visto que o Random Forest obteve os melhores resultados nas métricas acurácia e sensitividade, apesar dos outros métodos alcançarem valores bastante próximos. Entretanto, também apresentou o pior resultado de tempo de execução. Dessa forma, é possível concluir que a seleção do melhor modelo, pode ser subjetiva, pois deve ser levado em consideração o contexto da aplicação e o poder computacional disponível.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-12-15T19:20:32Z
dc.date.available.fl_str_mv 2023-12-15T19:20:32Z
dc.date.issued.fl_str_mv 2023-12-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/55980
identifier_str_mv TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023.
url https://repositorio.ufrn.br/handle/123456789/55980
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv Estatística
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Estatística
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/55980/1/TCCBiblioteca.pdf
https://repositorio.ufrn.br/bitstream/123456789/55980/2/license.txt
bitstream.checksum.fl_str_mv 00dbbe158af74b1370d551bf5c923ff4
e9597aa2854d128fd968be5edc8a28d9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1802117662014177280