Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: Martins, João Maieron
Data de Publicação: 2024
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/273006
Resumo: A dengue é uma arbovirose que representa grande perigo à saúde pública no Brasil, onde anualmente são registrados números altíssimos de casos, e surtos têm se tornado cada vez mais recorrentes. Nos últimos anos, técnicas de aprendizado de máquina têm se mostrado muito úteis em esforços de monitoramento e contenção dessa doença. No entanto, esforços do tipo são bastante recentes e há muitos caminhos ainda não explorados. Este trabalho consiste na montagem de modelos preditivos de casos de dengue para todas as unidades federativas do Brasil, com uso das técnicas Random Forest (RF), Support Vector Regressor (SVR) e Long Short-term Memory (LSTM), treinados sobre séries temporais que englobam dados climáticos e números de buscas na Internet. Além de previsões por modelos individuais, foi testada uma modalidade ensemble por macrorregião, a fim de explorar a fundo a possibilidade de previsões nesse nível no país. Realizados os experi mentos, observou-se grande variação de performance sobre cada estado, indicando que há entre eles fortes diferenças na qualidade dos dados ou nas formas como se manifesta a doença, o que torna alguns deles mais favoráveis a predições desse tipo. Percebeu-se leve queda de performance com o uso de ensemble, o que reforçou esse entendimento. Os mo delos conseguiram, sobre uma parcela dos estados, captar bem as tendências temporais, ainda que com discrepâncias nos números exatos de casos. Também comprovaram-se a utilidade de dados do Google Trends e a boa adequação de SVR e LSTM para pes quisas deste tipo. Embora os modelos construídos não sejam precisos o bastante para o monitoramento da dengue, espera-se que as descobertas feitas possam direcionar esforços futuros, com foco nos locais e nas técnicas mais promissoras, para construir modelos mais eficientes.
id UFRGS-2_0d9ea713f5c60f2cff0bb87d0521eff1
oai_identifier_str oai:www.lume.ufrgs.br:10183/273006
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Martins, João MaieronRecamonde-Mendoza, Mariana2024-03-07T05:02:07Z2024http://hdl.handle.net/10183/273006001197737A dengue é uma arbovirose que representa grande perigo à saúde pública no Brasil, onde anualmente são registrados números altíssimos de casos, e surtos têm se tornado cada vez mais recorrentes. Nos últimos anos, técnicas de aprendizado de máquina têm se mostrado muito úteis em esforços de monitoramento e contenção dessa doença. No entanto, esforços do tipo são bastante recentes e há muitos caminhos ainda não explorados. Este trabalho consiste na montagem de modelos preditivos de casos de dengue para todas as unidades federativas do Brasil, com uso das técnicas Random Forest (RF), Support Vector Regressor (SVR) e Long Short-term Memory (LSTM), treinados sobre séries temporais que englobam dados climáticos e números de buscas na Internet. Além de previsões por modelos individuais, foi testada uma modalidade ensemble por macrorregião, a fim de explorar a fundo a possibilidade de previsões nesse nível no país. Realizados os experi mentos, observou-se grande variação de performance sobre cada estado, indicando que há entre eles fortes diferenças na qualidade dos dados ou nas formas como se manifesta a doença, o que torna alguns deles mais favoráveis a predições desse tipo. Percebeu-se leve queda de performance com o uso de ensemble, o que reforçou esse entendimento. Os mo delos conseguiram, sobre uma parcela dos estados, captar bem as tendências temporais, ainda que com discrepâncias nos números exatos de casos. Também comprovaram-se a utilidade de dados do Google Trends e a boa adequação de SVR e LSTM para pes quisas deste tipo. Embora os modelos construídos não sejam precisos o bastante para o monitoramento da dengue, espera-se que as descobertas feitas possam direcionar esforços futuros, com foco nos locais e nas técnicas mais promissoras, para construir modelos mais eficientes.Dengue is an arbovirus that poses a significant threat to public health in Brazil, where annually, extremely high numbers of cases are reported, and outbreaks have become in creasingly recurrent. In recent years, machine learning techniques have proven highly useful in monitoring and controlling this disease. However, such efforts are relatively recent, and there are many unexplored avenues. This work involves the construction of predictive models for dengue cases in all Brazilian states, using the Random Forest, Support Vector Regressor, and Long Short-term Memory techniques. These models are trained on time series data that encompass climatic information and Internet search vol umes. In addition to predictions by individual models, a regional ensemble approach was tested to thoroughly explore the possibility of forecasting at this level in the country. Fol lowing the experiments, significant performance variations were observed among states, indicating strong differences in data quality or the manifestation of the disease, making some states more favorable to such predictions. A slight drop in performance with the use of ensembles reinforced this understanding. The models were able to capture temporal trends well in some states, although with discrepancies in the exact numbers of cases. The utility of Google Trends data for such research was also confirmed. While the constructed models may not be accurate enough for dengue monitoring, it is hoped that the findings can guide future efforts, focusing on the most promising locations and techniques to build more efficient models.application/pdfporDengueSaúde públicaModelos preditivosAprendizado de máquinaTime seriesLSTMExplorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquinaExploring climate and Google Trends data to predict dengue cases in Brazil : a machine learning approachinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2024Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001197737.pdf.txt001197737.pdf.txtExtracted Texttext/plain106244http://www.lume.ufrgs.br/bitstream/10183/273006/2/001197737.pdf.txt9b06376c5764cc3916010725f9b08dcaMD52ORIGINAL001197737.pdfTexto completoapplication/pdf6117379http://www.lume.ufrgs.br/bitstream/10183/273006/1/001197737.pdf4fbec27f2d9ad68e7a507f7d0400e3d0MD5110183/2730062024-03-08 05:00:47.804336oai:www.lume.ufrgs.br:10183/273006Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2024-03-08T08:00:47Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
dc.title.alternative.pt.fl_str_mv Exploring climate and Google Trends data to predict dengue cases in Brazil : a machine learning approach
title Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
spellingShingle Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
Martins, João Maieron
Dengue
Saúde pública
Modelos preditivos
Aprendizado de máquina
Time series
LSTM
title_short Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
title_full Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
title_fullStr Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
title_full_unstemmed Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
title_sort Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
author Martins, João Maieron
author_facet Martins, João Maieron
author_role author
dc.contributor.author.fl_str_mv Martins, João Maieron
dc.contributor.advisor1.fl_str_mv Recamonde-Mendoza, Mariana
contributor_str_mv Recamonde-Mendoza, Mariana
dc.subject.por.fl_str_mv Dengue
Saúde pública
Modelos preditivos
Aprendizado de máquina
topic Dengue
Saúde pública
Modelos preditivos
Aprendizado de máquina
Time series
LSTM
dc.subject.eng.fl_str_mv Time series
LSTM
description A dengue é uma arbovirose que representa grande perigo à saúde pública no Brasil, onde anualmente são registrados números altíssimos de casos, e surtos têm se tornado cada vez mais recorrentes. Nos últimos anos, técnicas de aprendizado de máquina têm se mostrado muito úteis em esforços de monitoramento e contenção dessa doença. No entanto, esforços do tipo são bastante recentes e há muitos caminhos ainda não explorados. Este trabalho consiste na montagem de modelos preditivos de casos de dengue para todas as unidades federativas do Brasil, com uso das técnicas Random Forest (RF), Support Vector Regressor (SVR) e Long Short-term Memory (LSTM), treinados sobre séries temporais que englobam dados climáticos e números de buscas na Internet. Além de previsões por modelos individuais, foi testada uma modalidade ensemble por macrorregião, a fim de explorar a fundo a possibilidade de previsões nesse nível no país. Realizados os experi mentos, observou-se grande variação de performance sobre cada estado, indicando que há entre eles fortes diferenças na qualidade dos dados ou nas formas como se manifesta a doença, o que torna alguns deles mais favoráveis a predições desse tipo. Percebeu-se leve queda de performance com o uso de ensemble, o que reforçou esse entendimento. Os mo delos conseguiram, sobre uma parcela dos estados, captar bem as tendências temporais, ainda que com discrepâncias nos números exatos de casos. Também comprovaram-se a utilidade de dados do Google Trends e a boa adequação de SVR e LSTM para pes quisas deste tipo. Embora os modelos construídos não sejam precisos o bastante para o monitoramento da dengue, espera-se que as descobertas feitas possam direcionar esforços futuros, com foco nos locais e nas técnicas mais promissoras, para construir modelos mais eficientes.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-03-07T05:02:07Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/273006
dc.identifier.nrb.pt_BR.fl_str_mv 001197737
url http://hdl.handle.net/10183/273006
identifier_str_mv 001197737
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/273006/2/001197737.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/273006/1/001197737.pdf
bitstream.checksum.fl_str_mv 9b06376c5764cc3916010725f9b08dca
4fbec27f2d9ad68e7a507f7d0400e3d0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224677569331200