Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://doi.org/10.18055/Finis28635 |
Resumo: | Analisar a relação entre variáveis socioeconómicas e doenças tropicais negligenciadas pode auxiliar os gestores no desenvolvimento de políticas públicas para a redução de casos. O objetivo deste trabalho foi avaliar, com base em algoritmos de machine learning, quais as variáveis socioeconómicas mais importantes para a classificação de risco de três doenças negligenciadas: hanseníase, leishmaniose tegumentar e dengue. Foram avaliados três algoritmos baseados em árvores de decisão: Random Forest (RF), XGBoost e C5.0. Como área de estudo, delimitaram-se os municípios do Estado de Goiás e o Distrito Federal – Brasil. Para as classes de risco de dengue, tanto o algoritmo RF quanto o XGBoost apresentaram valores de exatidão acima de 0,6. Ambos destacaram como variáveis preditivas mais importantes as condições de baixa renda, alfabetização e raça. No caso das classes de risco de hanseníase, os três algoritmos apresentaram resultados de exatidão acima de 0,6 indicando como importantes as variáveis abastecimento de água, alfabetização, raça e moradia. No caso das classes de risco de leishmaniose tegumentar, os algoritmos apresentaram exatidão inferior a 0,4, inviabilizando a avaliação das possíveis variáveis preditivas ao modelo. Os três algoritmos avaliados apresentaram desempenho preditivo aproximado. No entanto, o RF foi ligeiramente superior. As variáveis socioeconómicas mais importantes para predição das classes de risco de dengue e hanseníase foram similares. |
id |
RCAP_f4ac3d618b7ce76e9798f9bfbd5412ce |
---|---|
oai_identifier_str |
oai:ojs.revistas.rcaap.pt:article/28635 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas.Factores socioeconómicos y algoritmos de machine learning aplicados a la predicción de riesgo de enfermedades desatendidas.Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas.Secção temática - Saúde e território em contexto de pós-pandemiaAnalisar a relação entre variáveis socioeconómicas e doenças tropicais negligenciadas pode auxiliar os gestores no desenvolvimento de políticas públicas para a redução de casos. O objetivo deste trabalho foi avaliar, com base em algoritmos de machine learning, quais as variáveis socioeconómicas mais importantes para a classificação de risco de três doenças negligenciadas: hanseníase, leishmaniose tegumentar e dengue. Foram avaliados três algoritmos baseados em árvores de decisão: Random Forest (RF), XGBoost e C5.0. Como área de estudo, delimitaram-se os municípios do Estado de Goiás e o Distrito Federal – Brasil. Para as classes de risco de dengue, tanto o algoritmo RF quanto o XGBoost apresentaram valores de exatidão acima de 0,6. Ambos destacaram como variáveis preditivas mais importantes as condições de baixa renda, alfabetização e raça. No caso das classes de risco de hanseníase, os três algoritmos apresentaram resultados de exatidão acima de 0,6 indicando como importantes as variáveis abastecimento de água, alfabetização, raça e moradia. No caso das classes de risco de leishmaniose tegumentar, os algoritmos apresentaram exatidão inferior a 0,4, inviabilizando a avaliação das possíveis variáveis preditivas ao modelo. Os três algoritmos avaliados apresentaram desempenho preditivo aproximado. No entanto, o RF foi ligeiramente superior. As variáveis socioeconómicas mais importantes para predição das classes de risco de dengue e hanseníase foram similares.Analyzing the relation between socioeconomic variables and neglected tropical diseases can help managers in the conception of public policies to reduce cases. The objective of this study was to evaluate, based on machine learning algorithms, which socioeconomic variables are more important for the risk classification of three neglected diseases: leprosy, cutaneous leishmaniasis, and dengue. Three algorithms based on decision trees were evaluated: Random Forest (RF), XGBoost, and C5.0. As a study area, the municipalities of the state of Goiás and of the Federal District – Brazil, were delimited. For the dengue risk classes, both the RF algorithm and the XGBoost showed accuracy values above 0.6. Both emphasizing the low-income conditions, literacy, and race as the most important predictive variables. In the leprosy risk classes case, the three algorithms presented accuracy results above 0.6, indicating the variables water supply, literacy, race, and housing as important. For the tegumentary leishmaniasis risk classes, the algorithms showed an accuracy lower than 0.4, making the evaluation of possible predictive variables to the model unfeasible. The three evaluated algorithms revealed approximate predictive performance; however, the RF was slightly higher. The most important socioeconomic variables for dengue and leprosy risk classes prediction were similar.Analizar la relación entre las variables socioeconómicas y las enfermedades tropicales desatendidas puede ayudar los gestores en la producción de políticas públicas para la reducción de casos. El objetivo de este trabajo fue evaluar, con base en algoritmos de machine learning, qué variables socioeconómicas son más importantes para la clasificación de riesgo de tres enfermedades desatendidas: lepra, leishmaniasis cutánea y dengue. Se evaluaron tres algoritmos basados en árboles de decisión: Random Forest (RF), XGBoost y C5.0. Como área de estudio, fueron delimitados los municipios del Estado de Goiás y del Distrito Federal – Brasil. Para las clases de riesgo de dengue, tanto el algoritmo RF como el XGBoost presentaron valores de exactitud superiores a 0,6. Ambos resaltan como las variables predictivas más importantes las condiciones de baja renta, alfabetización y raza. En el caso de las clases de riesgo de lepra, los tres algoritmos presentaron resultados de exactitud superiores a 0,6, lo que indica que las variables suministro de agua, alfabetización, raza y vivienda son importantes. En el caso de las clases de riesgo de leishmaniasis cutánea, los algoritmos mostraron una exactitud inferior a 0,4, haciendo inviable la evaluación de posibles variables predictivas del modelo. Los tres algoritmos evaluados presentaron un rendimiento predictivo aproximado, sin embargo, el RF fue ligeramente superior. Las variables socioeconómicas más importantes para la predicción de las clases de riesgo de dengue y de lepra fueron similares.Centro de Estudos Geográficos2022-12-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articlehttps://doi.org/10.18055/Finis28635por2182-29050430-5027Gioia, Thamy, Juliana Ramalho Barros, Renato Rodrigues da Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-05-04T06:03:01Zoai:ojs.revistas.rcaap.pt:article/28635Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T16:29:24.781431Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. Factores socioeconómicos y algoritmos de machine learning aplicados a la predicción de riesgo de enfermedades desatendidas. Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. |
title |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. |
spellingShingle |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. Gioia, Thamy Secção temática - Saúde e território em contexto de pós-pandemia |
title_short |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. |
title_full |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. |
title_fullStr |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. |
title_full_unstemmed |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. |
title_sort |
Fatores socioeconómicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. |
author |
Gioia, Thamy |
author_facet |
Gioia, Thamy , Juliana Ramalho Barros , Renato Rodrigues da Silva |
author_role |
author |
author2 |
, Juliana Ramalho Barros , Renato Rodrigues da Silva |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Gioia, Thamy , Juliana Ramalho Barros , Renato Rodrigues da Silva |
dc.subject.por.fl_str_mv |
Secção temática - Saúde e território em contexto de pós-pandemia |
topic |
Secção temática - Saúde e território em contexto de pós-pandemia |
description |
Analisar a relação entre variáveis socioeconómicas e doenças tropicais negligenciadas pode auxiliar os gestores no desenvolvimento de políticas públicas para a redução de casos. O objetivo deste trabalho foi avaliar, com base em algoritmos de machine learning, quais as variáveis socioeconómicas mais importantes para a classificação de risco de três doenças negligenciadas: hanseníase, leishmaniose tegumentar e dengue. Foram avaliados três algoritmos baseados em árvores de decisão: Random Forest (RF), XGBoost e C5.0. Como área de estudo, delimitaram-se os municípios do Estado de Goiás e o Distrito Federal – Brasil. Para as classes de risco de dengue, tanto o algoritmo RF quanto o XGBoost apresentaram valores de exatidão acima de 0,6. Ambos destacaram como variáveis preditivas mais importantes as condições de baixa renda, alfabetização e raça. No caso das classes de risco de hanseníase, os três algoritmos apresentaram resultados de exatidão acima de 0,6 indicando como importantes as variáveis abastecimento de água, alfabetização, raça e moradia. No caso das classes de risco de leishmaniose tegumentar, os algoritmos apresentaram exatidão inferior a 0,4, inviabilizando a avaliação das possíveis variáveis preditivas ao modelo. Os três algoritmos avaliados apresentaram desempenho preditivo aproximado. No entanto, o RF foi ligeiramente superior. As variáveis socioeconómicas mais importantes para predição das classes de risco de dengue e hanseníase foram similares. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-12-30 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.18055/Finis28635 |
url |
https://doi.org/10.18055/Finis28635 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
2182-2905 0430-5027 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Centro de Estudos Geográficos |
publisher.none.fl_str_mv |
Centro de Estudos Geográficos |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799130751473549312 |