Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/55980 |
Resumo: | Esse trabalho estuda a relação da Estatística com o Aprendizado de Máquina, especificamente no contexto de Métodos de Classificação, onde o computador deve aprender padrões estatísticos e computacionais com base nos dados propostos e conseguir classificar dados ainda não vistos com base em seu aprendizado. O banco de dados analisado nesse trabalho contém informações sobre pacientes com ou sem doenças no coração, em que o objetivo dos métodos é classificar novos pacientes, estimando se eles possuem ou não a doença. Os classificadores escolhidos para esse trabalho foram o Naive Bayes, K-Vizinhos mais próximos e o Random Forest. O desempenho foi medido através das métricas estatísticas acurácia, especificidade e sensitividade. Além disso, também foi medido o tempo de execução de cada classificador. No final, foi visto que o Random Forest obteve os melhores resultados nas métricas acurácia e sensitividade, apesar dos outros métodos alcançarem valores bastante próximos. Entretanto, também apresentou o pior resultado de tempo de execução. Dessa forma, é possível concluir que a seleção do melhor modelo, pode ser subjetiva, pois deve ser levado em consideração o contexto da aplicação e o poder computacional disponível. |
id |
UFRN_d201533432c3eead506412963ac79767 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/55980 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Trindade, Mateus Oliveira Salvador daNunes, Marcus AlexandreCastro, Bruno Monte deSilva Júnior, Antônio Hermes Marques daCosta, Eliardo Guimarães da Costa2023-12-15T19:20:32Z2023-12-15T19:20:32Z2023-12-06TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/55980Esse trabalho estuda a relação da Estatística com o Aprendizado de Máquina, especificamente no contexto de Métodos de Classificação, onde o computador deve aprender padrões estatísticos e computacionais com base nos dados propostos e conseguir classificar dados ainda não vistos com base em seu aprendizado. O banco de dados analisado nesse trabalho contém informações sobre pacientes com ou sem doenças no coração, em que o objetivo dos métodos é classificar novos pacientes, estimando se eles possuem ou não a doença. Os classificadores escolhidos para esse trabalho foram o Naive Bayes, K-Vizinhos mais próximos e o Random Forest. O desempenho foi medido através das métricas estatísticas acurácia, especificidade e sensitividade. Além disso, também foi medido o tempo de execução de cada classificador. No final, foi visto que o Random Forest obteve os melhores resultados nas métricas acurácia e sensitividade, apesar dos outros métodos alcançarem valores bastante próximos. Entretanto, também apresentou o pior resultado de tempo de execução. Dessa forma, é possível concluir que a seleção do melhor modelo, pode ser subjetiva, pois deve ser levado em consideração o contexto da aplicação e o poder computacional disponível.This work studies the relationship between Statistics and Machine Learning, specifically in the context of Classifiers Methods, where the computer must learn statistical and computational patterns from the provided data and be able to classify new data based on its learning. The database analyzed in this study contains information about patients with or without heart diseases, and the goal of the methods is to classify new patients as either having or not having the disease. The classifiers chosen for this work were Naive Bayes, K-Nearest Neighbors, and Random Forest. Performance was measured using statistical metrics such as accuracy, specificity, and sensitivity. Additionally, the execution time of each classifier was also measured. In the end, it was observed that Random Forest achieved the best accuracy and specificity, despite other classifiers showing similar results, but it had the worst execution time result. It can be concluded that the selection of the best model may be subjective, as it should take into consideration the application context and the available computational power.Universidade Federal do Rio Grande do NorteEstatísticaUFRNBrasilEstatísticaNaive BayesK-Vizinhos mais PróximosRandom ForestAprendizado de MáquinaK-Nearest NeighborsMachine LearningExploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatísticaExploration and comparison of classification algorithms in Machine Learning: a statistical approachinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccessORIGINALTCCBiblioteca.pdfTCCBiblioteca.pdfExploração e Comparação de Algoritmos de Classificação em Machine Learning: Uma Abordagem Estatísticaapplication/pdf667682https://repositorio.ufrn.br/bitstream/123456789/55980/1/TCCBiblioteca.pdf00dbbe158af74b1370d551bf5c923ff4MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/55980/2/license.txte9597aa2854d128fd968be5edc8a28d9MD52123456789/559802023-12-15 16:20:32.871oai:https://repositorio.ufrn.br:123456789/55980Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-12-15T19:20:32Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística |
dc.title.alternative.pt_BR.fl_str_mv |
Exploration and comparison of classification algorithms in Machine Learning: a statistical approach |
title |
Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística |
spellingShingle |
Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística Trindade, Mateus Oliveira Salvador da Naive Bayes K-Vizinhos mais Próximos Random Forest Aprendizado de Máquina K-Nearest Neighbors Machine Learning |
title_short |
Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística |
title_full |
Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística |
title_fullStr |
Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística |
title_full_unstemmed |
Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística |
title_sort |
Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística |
author |
Trindade, Mateus Oliveira Salvador da |
author_facet |
Trindade, Mateus Oliveira Salvador da |
author_role |
author |
dc.contributor.referees1.none.fl_str_mv |
Castro, Bruno Monte de |
dc.contributor.referees2.none.fl_str_mv |
Silva Júnior, Antônio Hermes Marques da |
dc.contributor.author.fl_str_mv |
Trindade, Mateus Oliveira Salvador da |
dc.contributor.advisor-co1.fl_str_mv |
Nunes, Marcus Alexandre |
dc.contributor.advisor1.fl_str_mv |
Costa, Eliardo Guimarães da Costa |
contributor_str_mv |
Nunes, Marcus Alexandre Costa, Eliardo Guimarães da Costa |
dc.subject.por.fl_str_mv |
Naive Bayes K-Vizinhos mais Próximos Random Forest Aprendizado de Máquina K-Nearest Neighbors Machine Learning |
topic |
Naive Bayes K-Vizinhos mais Próximos Random Forest Aprendizado de Máquina K-Nearest Neighbors Machine Learning |
description |
Esse trabalho estuda a relação da Estatística com o Aprendizado de Máquina, especificamente no contexto de Métodos de Classificação, onde o computador deve aprender padrões estatísticos e computacionais com base nos dados propostos e conseguir classificar dados ainda não vistos com base em seu aprendizado. O banco de dados analisado nesse trabalho contém informações sobre pacientes com ou sem doenças no coração, em que o objetivo dos métodos é classificar novos pacientes, estimando se eles possuem ou não a doença. Os classificadores escolhidos para esse trabalho foram o Naive Bayes, K-Vizinhos mais próximos e o Random Forest. O desempenho foi medido através das métricas estatísticas acurácia, especificidade e sensitividade. Além disso, também foi medido o tempo de execução de cada classificador. No final, foi visto que o Random Forest obteve os melhores resultados nas métricas acurácia e sensitividade, apesar dos outros métodos alcançarem valores bastante próximos. Entretanto, também apresentou o pior resultado de tempo de execução. Dessa forma, é possível concluir que a seleção do melhor modelo, pode ser subjetiva, pois deve ser levado em consideração o contexto da aplicação e o poder computacional disponível. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-12-15T19:20:32Z |
dc.date.available.fl_str_mv |
2023-12-15T19:20:32Z |
dc.date.issued.fl_str_mv |
2023-12-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/55980 |
identifier_str_mv |
TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
url |
https://repositorio.ufrn.br/handle/123456789/55980 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
Estatística |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Estatística |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/55980/1/TCCBiblioteca.pdf https://repositorio.ufrn.br/bitstream/123456789/55980/2/license.txt |
bitstream.checksum.fl_str_mv |
00dbbe158af74b1370d551bf5c923ff4 e9597aa2854d128fd968be5edc8a28d9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1802117662014177280 |