Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza

Detalhes bibliográficos
Autor(a) principal: Macedo, Lucas do Nascimento
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFU
Texto Completo: https://repositorio.ufu.br/handle/123456789/38329
Resumo: Every year, efforts are made to produce vaccines that are effective against the influenza virus. However, in order for a vaccine to have the desired effect, in-depth studies on pos- sible virus mutations are necessary. Although there are several methods in the literature for predicting new strains of the influenza virus, only a few utilize artificial intelligence as a tool in this process. In light of this, this study proposes the implementation of learning algorithms to compare their performance in predicting new strains and to compare them with existing models in the literature. The learning models were implemented in Python, using external libraries such as Random Forests, Extra Trees, Naive Bayes, and Decision Trees. After implementation, data from H1N1 and H3N2 strains were collected from a database and organized in FASTA files in chronological order. The execution of all algo- rithms revealed that the Random Forests model had a higher accuracy than the others. When compared to the models in the literature, it was found that the Random Forests algorithm performed well, second only to a model that utilizes predictive fitness.
id UFU_90afb2f8e02bf3c145367a228f5983f7
oai_identifier_str oai:repositorio.ufu.br:123456789/38329
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenzaComparison of machine learning algorithms to predict future influenza virus strainsAprendizado de máquinaPrediçãoInfluenzaMachine learningPredictionFluCNPQ::CIENCIAS EXATAS E DA TERRAEvery year, efforts are made to produce vaccines that are effective against the influenza virus. However, in order for a vaccine to have the desired effect, in-depth studies on pos- sible virus mutations are necessary. Although there are several methods in the literature for predicting new strains of the influenza virus, only a few utilize artificial intelligence as a tool in this process. In light of this, this study proposes the implementation of learning algorithms to compare their performance in predicting new strains and to compare them with existing models in the literature. The learning models were implemented in Python, using external libraries such as Random Forests, Extra Trees, Naive Bayes, and Decision Trees. After implementation, data from H1N1 and H3N2 strains were collected from a database and organized in FASTA files in chronological order. The execution of all algo- rithms revealed that the Random Forests model had a higher accuracy than the others. When compared to the models in the literature, it was found that the Random Forests algorithm performed well, second only to a model that utilizes predictive fitness.Trabalho de Conclusão de Curso (Graduação)Todos os anos são feitos esforços para que a produção de vacinas que sejam eficazes contra o vírus influenza. No entanto, para que uma vacina tenha o efeito desejado, é necessário realizar estudos aprofundados sobre as possíveis mutações do vírus. Embora existam vários métodos de predição de novas cepas do vírus influenza na literatura, poucos ainda utilizam inteligência artificial como ferramenta nesse processo. Diante disso, este trabalho propõe a implementação de algoritmos de aprendizado para comparar seu desempenho na previsão de novas cepas, bem como compará-los com os modelos existentes na literatura. Os modelos de aprendizado foram implementados em Python, utilizando bibliotecas externas, como Florestas Aleatórias, Árvores Extras, Naive Bayes e Árvores de Decisão. Após a implementação, foram coletados dados das cepas H1N1 e H3N2 de um banco de dados e organizados em arquivos FASTA, seguindo uma ordem cronológica. A execução de todos os algoritmos revelou que o modelo de Florestas Aleatórias apresentou uma acurácia superior aos outros. Ao compará-lo com os modelos da literatura, constatou-se que o algoritmo de Florestas Aleatórias teve um bom desempenho, ficando atrás apenas de um modelo que utiliza aptidão preditiva.Universidade Federal de UberlândiaBrasilCiência da ComputaçãoGabriel, Paulo Henrique Ribeirohttp://lattes.cnpq.br/3181954061121790Barioni, Maria Camila Nardinihttp://lattes.cnpq.br/3785426518998830Amaral, Laurence Rodrigues dohttp://lattes.cnpq.br/6978567037098928Macedo, Lucas do Nascimento2023-07-03T18:23:21Z2023-07-03T18:23:21Z2023-06-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMACEDO, Lucas do Nascimento. Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza. 2023. 50 f. Trabalho de Conclusão de Curso (Graduação em Ciência da computação) – Universidade Federal de Uberlândia, Uberlândia, 2023.https://repositorio.ufu.br/handle/123456789/38329porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2023-07-04T06:18:26Zoai:repositorio.ufu.br:123456789/38329Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2023-07-04T06:18:26Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza
Comparison of machine learning algorithms to predict future influenza virus strains
title Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza
spellingShingle Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza
Macedo, Lucas do Nascimento
Aprendizado de máquina
Predição
Influenza
Machine learning
Prediction
Flu
CNPQ::CIENCIAS EXATAS E DA TERRA
title_short Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza
title_full Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza
title_fullStr Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza
title_full_unstemmed Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza
title_sort Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza
author Macedo, Lucas do Nascimento
author_facet Macedo, Lucas do Nascimento
author_role author
dc.contributor.none.fl_str_mv Gabriel, Paulo Henrique Ribeiro
http://lattes.cnpq.br/3181954061121790
Barioni, Maria Camila Nardini
http://lattes.cnpq.br/3785426518998830
Amaral, Laurence Rodrigues do
http://lattes.cnpq.br/6978567037098928
dc.contributor.author.fl_str_mv Macedo, Lucas do Nascimento
dc.subject.por.fl_str_mv Aprendizado de máquina
Predição
Influenza
Machine learning
Prediction
Flu
CNPQ::CIENCIAS EXATAS E DA TERRA
topic Aprendizado de máquina
Predição
Influenza
Machine learning
Prediction
Flu
CNPQ::CIENCIAS EXATAS E DA TERRA
description Every year, efforts are made to produce vaccines that are effective against the influenza virus. However, in order for a vaccine to have the desired effect, in-depth studies on pos- sible virus mutations are necessary. Although there are several methods in the literature for predicting new strains of the influenza virus, only a few utilize artificial intelligence as a tool in this process. In light of this, this study proposes the implementation of learning algorithms to compare their performance in predicting new strains and to compare them with existing models in the literature. The learning models were implemented in Python, using external libraries such as Random Forests, Extra Trees, Naive Bayes, and Decision Trees. After implementation, data from H1N1 and H3N2 strains were collected from a database and organized in FASTA files in chronological order. The execution of all algo- rithms revealed that the Random Forests model had a higher accuracy than the others. When compared to the models in the literature, it was found that the Random Forests algorithm performed well, second only to a model that utilizes predictive fitness.
publishDate 2023
dc.date.none.fl_str_mv 2023-07-03T18:23:21Z
2023-07-03T18:23:21Z
2023-06-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MACEDO, Lucas do Nascimento. Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza. 2023. 50 f. Trabalho de Conclusão de Curso (Graduação em Ciência da computação) – Universidade Federal de Uberlândia, Uberlândia, 2023.
https://repositorio.ufu.br/handle/123456789/38329
identifier_str_mv MACEDO, Lucas do Nascimento. Comparação de algoritmos de aprendizado de máquina para predizer futuras cepas do vírus da influenza. 2023. 50 f. Trabalho de Conclusão de Curso (Graduação em Ciência da computação) – Universidade Federal de Uberlândia, Uberlândia, 2023.
url https://repositorio.ufu.br/handle/123456789/38329
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Ciência da Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1813711558616809472