Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.

Detalhes bibliográficos
Autor(a) principal: Xavier, Fernando
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-09112023-115721/
Resumo: A dengue é uma doença que atinge milhões de pessoas anualmente no mundo. O Brasil, que tinha erradicado a doença, voltou a lidar com alto número de casos e epidemias sazonais. A despeito das ações executadas pelo poder público, não se observa uma evolução no programa de combate à dengue. A falta de compreensão das razões desse insucesso torna a dengue um problema de difícil solução. As avaliações em saúde normalmente utilizam-se de métodos que são de difícil aplicação em grande escala e nem sempre consideram fatores contextuais que podem ter influência decisiva nos resultados dos programas. Por outro lado, a era de Big Data tem apresentado oportunidades para avanço no conhecimento em áreas como a saúde. Nesse sentido, essa pesquisa de Doutorado teve como objetivo o desenvolvimento de uma metodologia com base em Big Data para avaliação do programa de combate à dengue. Nessa metodologia, buscou-se integrar fontes de dados relacionados à dengue em um repositório comum de dados, seguida da aplicação de técnicas de Ciência de Dados, como os algoritmos de aprendizado de máquina K-Means e Random Forest, além de análises estatísticas e visualização espacial. Inicialmente foi desenvolvida uma arquitetura de dados, usando conceitos de Big Data e Saúde Planetária, que foi utilizada como base para execução da avaliação do programa de combate à dengue de acordo com instrumento avaliativo desenvolvido nessa pesquisa. A solução proposta foi avaliada em um estudo de caso para os 645 municípios do Estado de São Paulo, em que foram desenvolvidos dois experimentos com utilização de técnicas de aprendizado de máquina e visualização de dados para extração de informação. Para ambos os experimentos, dados foram coletados de diversas fontes públicas e integrados em um data lake utilizando recursos de computação em nuvem. Além disso, foi desenvolvido um instrumento de avaliação considerando o modelo de Donabedian para avaliação de saúde que, em seguida, foi validado por especialistas de domínio. No primeiro experimento, aplicou-se o algoritmo K-Means para agrupar os municípios em quatro clusters de acordo com o contexto, como variáveis climáticas e socioeconômicas. Em seguida, foram realizadas avaliações dos indicadores dos componentes estrutura, processo e resultado do modelo Donabedian para identificar possíveis padrões. Nessas avaliações foram comparados os valores dos indicadores em municípios do mesmo cluster, assim como comparações dos indicadores entre clusters. Para monitoramento contínuo dos indicadores, foi desenvolvido no segundo experimento um painel de Business Intelligence através de uma ferramenta de visualização de dados. Os resultados dos experimentos revelaram importantes informações, como a insuficiência no número de agentes comunitários de saúde nos municípios com piores resultados. Ademais, foi observado que municípios com contextos mais favoráveis à disseminação da dengue tinham deficiências em relação à estrutura de saúde local. Os resultados mostraram que o uso de técnicas de Ciência de Dados para avaliação em saúde pode agregar diversos benefícios à gestão pública. Além da análise de fatores ambientais, a metodologia proposta nesta pesquisa possibilita que as avaliações possam ser realizadas em larga escala de forma mais eficiente, agregando valor ao processo de tomada de decisão na gestão pública.
id USP_d0b840d062bb8191732aa4eb752542e3
oai_identifier_str oai:teses.usp.br:tde-09112023-115721
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.Untitled in englishAvaliações em saúdeBig DataBig DataCiência de dadosData ScienceDengueDengueDonabedianHealth assessmentsA dengue é uma doença que atinge milhões de pessoas anualmente no mundo. O Brasil, que tinha erradicado a doença, voltou a lidar com alto número de casos e epidemias sazonais. A despeito das ações executadas pelo poder público, não se observa uma evolução no programa de combate à dengue. A falta de compreensão das razões desse insucesso torna a dengue um problema de difícil solução. As avaliações em saúde normalmente utilizam-se de métodos que são de difícil aplicação em grande escala e nem sempre consideram fatores contextuais que podem ter influência decisiva nos resultados dos programas. Por outro lado, a era de Big Data tem apresentado oportunidades para avanço no conhecimento em áreas como a saúde. Nesse sentido, essa pesquisa de Doutorado teve como objetivo o desenvolvimento de uma metodologia com base em Big Data para avaliação do programa de combate à dengue. Nessa metodologia, buscou-se integrar fontes de dados relacionados à dengue em um repositório comum de dados, seguida da aplicação de técnicas de Ciência de Dados, como os algoritmos de aprendizado de máquina K-Means e Random Forest, além de análises estatísticas e visualização espacial. Inicialmente foi desenvolvida uma arquitetura de dados, usando conceitos de Big Data e Saúde Planetária, que foi utilizada como base para execução da avaliação do programa de combate à dengue de acordo com instrumento avaliativo desenvolvido nessa pesquisa. A solução proposta foi avaliada em um estudo de caso para os 645 municípios do Estado de São Paulo, em que foram desenvolvidos dois experimentos com utilização de técnicas de aprendizado de máquina e visualização de dados para extração de informação. Para ambos os experimentos, dados foram coletados de diversas fontes públicas e integrados em um data lake utilizando recursos de computação em nuvem. Além disso, foi desenvolvido um instrumento de avaliação considerando o modelo de Donabedian para avaliação de saúde que, em seguida, foi validado por especialistas de domínio. No primeiro experimento, aplicou-se o algoritmo K-Means para agrupar os municípios em quatro clusters de acordo com o contexto, como variáveis climáticas e socioeconômicas. Em seguida, foram realizadas avaliações dos indicadores dos componentes estrutura, processo e resultado do modelo Donabedian para identificar possíveis padrões. Nessas avaliações foram comparados os valores dos indicadores em municípios do mesmo cluster, assim como comparações dos indicadores entre clusters. Para monitoramento contínuo dos indicadores, foi desenvolvido no segundo experimento um painel de Business Intelligence através de uma ferramenta de visualização de dados. Os resultados dos experimentos revelaram importantes informações, como a insuficiência no número de agentes comunitários de saúde nos municípios com piores resultados. Ademais, foi observado que municípios com contextos mais favoráveis à disseminação da dengue tinham deficiências em relação à estrutura de saúde local. Os resultados mostraram que o uso de técnicas de Ciência de Dados para avaliação em saúde pode agregar diversos benefícios à gestão pública. Além da análise de fatores ambientais, a metodologia proposta nesta pesquisa possibilita que as avaliações possam ser realizadas em larga escala de forma mais eficiente, agregando valor ao processo de tomada de decisão na gestão pública.Dengue is a disease that affects millions of people annually worldwide. Brazil, which had eradicated the disease, has faced a high number of cases and seasonal epidemics again. Despite the public policies, there has been no improvement in the results of the dengue control program. The lack of understanding of the reasons for this failure makes dengue a problem that is difficult to solve. Health assessments typically use methods that are difficult to apply on a large scale and do not always consider contextual factors that may have a decisive influence on program results. On the other hand, the era of Big Data has presented opportunities for advances in knowledge in areas such as health. In this sense, this doctoral research aimed to develop a methodology based on Big Data for evaluating the dengue control program. In this methodology, we sought to integrate sources of data related to dengue into a common data repository, followed by the application of Data Science technique, such as K-Means and Random Forest machine learning algorithms, as well as statistical analysis and spatial visualization. Initially, a data architecture was developed, using concepts of Big Data and Planetary Health, which was used as a basis for carrying out the evaluation of the program to combat dengue according to the evaluation instrument developed in this research. The proposed solution was evaluated in a case study for the 645 municipalities in the State of São Paulo, in which two experiments were developed using machine learning techniques and data visualization for information extraction. For both experiments, data were collected from diverse public sources and integrated in a data lake using cloud computing resources. Additionally, an evaluation instrument was developed considering the Donabedian framework for health assessment and validate with domain experts. In the first experiment, the K-Means algorithm was applied to group the municipalities into four clusters according to the context, such as climate and socioeconomic variables. Then evaluations of the indicators of the structure, process, and result components of the Donabedian model were carried out to identify possible patterns. In these evaluations, the indicators values were compared in municipalities in the same cluster as well as comparisons of indicators between clusters. For continuous monitoring of indicators, a Business Intelligence panel was developed in the second experiment using a data visualization tool. The results of the experiments revealed important information, such as the insufficient number of community health agents in the municipalities with the worst results. Furthermore, it was observed that municipalities with contexts more favorable to the spread of dengue had deficiencies in relation to the local health structure. The results showed that the use of Data Science techniques for health assessment can add several benefits to public management. In addition to the analysis of context factors, the methodology proposed in this research allows assessments to be carried out on a large scale in a more efficient way, adding value to the decision-making process in public management.Biblioteca Digitais de Teses e Dissertações da USPSaraiva, Antonio MauroXavier, Fernando2023-09-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-09112023-115721/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T12:45:10Zoai:teses.usp.br:tde-09112023-115721Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T12:45:10Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
Untitled in english
title Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
spellingShingle Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
Xavier, Fernando
Avaliações em saúde
Big Data
Big Data
Ciência de dados
Data Science
Dengue
Dengue
Donabedian
Health assessments
title_short Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
title_full Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
title_fullStr Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
title_full_unstemmed Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
title_sort Metodologia baseada em ciência de dados para avaliação do programa de combate à dengue.
author Xavier, Fernando
author_facet Xavier, Fernando
author_role author
dc.contributor.none.fl_str_mv Saraiva, Antonio Mauro
dc.contributor.author.fl_str_mv Xavier, Fernando
dc.subject.por.fl_str_mv Avaliações em saúde
Big Data
Big Data
Ciência de dados
Data Science
Dengue
Dengue
Donabedian
Health assessments
topic Avaliações em saúde
Big Data
Big Data
Ciência de dados
Data Science
Dengue
Dengue
Donabedian
Health assessments
description A dengue é uma doença que atinge milhões de pessoas anualmente no mundo. O Brasil, que tinha erradicado a doença, voltou a lidar com alto número de casos e epidemias sazonais. A despeito das ações executadas pelo poder público, não se observa uma evolução no programa de combate à dengue. A falta de compreensão das razões desse insucesso torna a dengue um problema de difícil solução. As avaliações em saúde normalmente utilizam-se de métodos que são de difícil aplicação em grande escala e nem sempre consideram fatores contextuais que podem ter influência decisiva nos resultados dos programas. Por outro lado, a era de Big Data tem apresentado oportunidades para avanço no conhecimento em áreas como a saúde. Nesse sentido, essa pesquisa de Doutorado teve como objetivo o desenvolvimento de uma metodologia com base em Big Data para avaliação do programa de combate à dengue. Nessa metodologia, buscou-se integrar fontes de dados relacionados à dengue em um repositório comum de dados, seguida da aplicação de técnicas de Ciência de Dados, como os algoritmos de aprendizado de máquina K-Means e Random Forest, além de análises estatísticas e visualização espacial. Inicialmente foi desenvolvida uma arquitetura de dados, usando conceitos de Big Data e Saúde Planetária, que foi utilizada como base para execução da avaliação do programa de combate à dengue de acordo com instrumento avaliativo desenvolvido nessa pesquisa. A solução proposta foi avaliada em um estudo de caso para os 645 municípios do Estado de São Paulo, em que foram desenvolvidos dois experimentos com utilização de técnicas de aprendizado de máquina e visualização de dados para extração de informação. Para ambos os experimentos, dados foram coletados de diversas fontes públicas e integrados em um data lake utilizando recursos de computação em nuvem. Além disso, foi desenvolvido um instrumento de avaliação considerando o modelo de Donabedian para avaliação de saúde que, em seguida, foi validado por especialistas de domínio. No primeiro experimento, aplicou-se o algoritmo K-Means para agrupar os municípios em quatro clusters de acordo com o contexto, como variáveis climáticas e socioeconômicas. Em seguida, foram realizadas avaliações dos indicadores dos componentes estrutura, processo e resultado do modelo Donabedian para identificar possíveis padrões. Nessas avaliações foram comparados os valores dos indicadores em municípios do mesmo cluster, assim como comparações dos indicadores entre clusters. Para monitoramento contínuo dos indicadores, foi desenvolvido no segundo experimento um painel de Business Intelligence através de uma ferramenta de visualização de dados. Os resultados dos experimentos revelaram importantes informações, como a insuficiência no número de agentes comunitários de saúde nos municípios com piores resultados. Ademais, foi observado que municípios com contextos mais favoráveis à disseminação da dengue tinham deficiências em relação à estrutura de saúde local. Os resultados mostraram que o uso de técnicas de Ciência de Dados para avaliação em saúde pode agregar diversos benefícios à gestão pública. Além da análise de fatores ambientais, a metodologia proposta nesta pesquisa possibilita que as avaliações possam ser realizadas em larga escala de forma mais eficiente, agregando valor ao processo de tomada de decisão na gestão pública.
publishDate 2023
dc.date.none.fl_str_mv 2023-09-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3141/tde-09112023-115721/
url https://www.teses.usp.br/teses/disponiveis/3/3141/tde-09112023-115721/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279071530876928