Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data

Detalhes bibliográficos
Autor(a) principal: Lopes Júnior, Márcio Luiz Bezerra
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/48347
Resumo: Nascimento prematuro (PTB) é um fenômeno que traz riscos e desafios à sobrevivência de um recém-nascido. Apesar de muitos avanços na pesquisa, nem todas as causas do PTB estão bem definidas. Atualmente, entende-se que risco de PTB é multifatorial e que pode, também, estar associado a fatores socioeconômicos. Objetivando analisar essa possível relação, este trabalho busca estratificar o risco de PTB no Brasil utilizandose apenas de dados socioeconômicos, extraindo e analisando clusters que apresentarem divergência relevante de PTB, todos os quais serão descobertos por processos de clusterização automáticos usando uma série de métodos de aprendizagem de máquina nãosupervisionada. Através do uso de bancos de dados públicos disponibilizados pelo Governo Federal do Brasil, um novo banco de dados foi gerado com dados socioeconômicos a nível municipal e uma taxa de ocorrência de PTB. Esse banco de dados foi processado utilizando dois métodos de clusterização distintos, ambos construídos através da união de métodos de aprendizagem não-supervisionada, tais como k-médias, análise de componentes principais (PCA), clusterização espacial baseada em densidade de aplicações com ruído (DBSCAN), mapas auto-organizáveis (SOM) e clusterização hierárquica. Os clusters com alto PTB foram formados majoritariamente por municípios com baixos níveis educacionais, com pior qualidade de serviços públicos – como saneamento básico e coleta de lixo – e com populações mais brancas. A distribuição dos clusters também foi observada, com clusters com alto PTB concentrados nas regiões Norte e Nordeste. Os resultados indicam, uma influência positiva da qualidade de vida e da oferta de serviços públicos na redução do risco de PTB.
id UFRN_ee1e43c603a0334efe592843750c3890
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/48347
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Lopes Júnior, Márcio Luiz Bezerrahttp://lattes.cnpq.br/0833804654660654https://orcid.org/0000-0001-7536-2506http://lattes.cnpq.br/3475337353676349Barbosa, Raquel de MeloChiavegatto Filho, Alexandre Dias PortoSilva, Ivanovitch Medeiros Dantas dahttps://orcid.org/0000-0002-0116-6489http://lattes.cnpq.br/3608440944832201Dias, Leonardo AlvesFernandes, Marcelo Augusto Costa2022-07-05T22:14:39Z2022-07-05T22:14:39Z2022-04-29LOPES JÚNIOR, Márcio Luiz Bezerra. Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data. 2022. 83f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/48347Nascimento prematuro (PTB) é um fenômeno que traz riscos e desafios à sobrevivência de um recém-nascido. Apesar de muitos avanços na pesquisa, nem todas as causas do PTB estão bem definidas. Atualmente, entende-se que risco de PTB é multifatorial e que pode, também, estar associado a fatores socioeconômicos. Objetivando analisar essa possível relação, este trabalho busca estratificar o risco de PTB no Brasil utilizandose apenas de dados socioeconômicos, extraindo e analisando clusters que apresentarem divergência relevante de PTB, todos os quais serão descobertos por processos de clusterização automáticos usando uma série de métodos de aprendizagem de máquina nãosupervisionada. Através do uso de bancos de dados públicos disponibilizados pelo Governo Federal do Brasil, um novo banco de dados foi gerado com dados socioeconômicos a nível municipal e uma taxa de ocorrência de PTB. Esse banco de dados foi processado utilizando dois métodos de clusterização distintos, ambos construídos através da união de métodos de aprendizagem não-supervisionada, tais como k-médias, análise de componentes principais (PCA), clusterização espacial baseada em densidade de aplicações com ruído (DBSCAN), mapas auto-organizáveis (SOM) e clusterização hierárquica. Os clusters com alto PTB foram formados majoritariamente por municípios com baixos níveis educacionais, com pior qualidade de serviços públicos – como saneamento básico e coleta de lixo – e com populações mais brancas. A distribuição dos clusters também foi observada, com clusters com alto PTB concentrados nas regiões Norte e Nordeste. Os resultados indicam, uma influência positiva da qualidade de vida e da oferta de serviços públicos na redução do risco de PTB.Preterm birth (PTB) is a phenomenon that brings risks and challenges to the survival of the newborn child. Despite many advances in research, not all the causes of PTB are yet clear. It is currently understood that PTB risk is multi-factorial and may also be associated with socioeconomic factors. In order to analyse this possible relationship, this work seeks to stratify PTB risk in Brazil using only socioeconomic data, extracting and analysing those clusters that present relevant PTB divergence, all of which will be found by automatic clustering processes using a series of unsupervised machine learning methods. Through the use of datasets made publicly available by the Federal Government of Brazil, a new dataset was generated with municipality-level socioeconomic data and a PTB occurrence rate. This dataset was processed using two separate clustering methods, both built by assembling unsupervised learning techniques, such as k-means, principal component analysis (PCA), density-based spatial clustering of applications with noise (DBSCAN), self-organising maps (SOM) and hierarchical clustering. The methods discovered clusters of municipalities with both high levels and low levels of PTB occurrence. The clusters with high PTB were comprised predominantly of municipalities with lower levels of education, worse quality of public services – such as basic sanitation and garbage collection – and a less white population. The regional distribution of the clusters was also observed, with clusters of high PTB located primarily in the North and Northeast regions of Brazil. The results indicate a positive influence of the quality of life and the offer of public services on the reduction of PTB risk.Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilRisco de PTBClusterizaçãoAprendizagem não-supervisionadak-MeansMapas auto-organizáveisStratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALStratificationpretermbirth_LopesJunior_2022.pdfapplication/pdf7451727https://repositorio.ufrn.br/bitstream/123456789/48347/1/Stratificationpretermbirth_LopesJunior_2022.pdfb030001eed9a48165928728196ee98bfMD51123456789/483472022-07-05 19:15:16.487oai:https://repositorio.ufrn.br:123456789/48347Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-07-05T22:15:16Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
title Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
spellingShingle Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
Lopes Júnior, Márcio Luiz Bezerra
Risco de PTB
Clusterização
Aprendizagem não-supervisionada
k-Means
Mapas auto-organizáveis
title_short Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
title_full Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
title_fullStr Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
title_full_unstemmed Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
title_sort Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
author Lopes Júnior, Márcio Luiz Bezerra
author_facet Lopes Júnior, Márcio Luiz Bezerra
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0833804654660654
dc.contributor.advisorID.pt_BR.fl_str_mv https://orcid.org/0000-0001-7536-2506
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3475337353676349
dc.contributor.referees1.none.fl_str_mv Chiavegatto Filho, Alexandre Dias Porto
dc.contributor.referees2.none.fl_str_mv Silva, Ivanovitch Medeiros Dantas da
dc.contributor.referees2ID.pt_BR.fl_str_mv https://orcid.org/0000-0002-0116-6489
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3608440944832201
dc.contributor.referees3.none.fl_str_mv Dias, Leonardo Alves
dc.contributor.author.fl_str_mv Lopes Júnior, Márcio Luiz Bezerra
dc.contributor.advisor-co1.fl_str_mv Barbosa, Raquel de Melo
dc.contributor.advisor1.fl_str_mv Fernandes, Marcelo Augusto Costa
contributor_str_mv Barbosa, Raquel de Melo
Fernandes, Marcelo Augusto Costa
dc.subject.por.fl_str_mv Risco de PTB
Clusterização
Aprendizagem não-supervisionada
k-Means
Mapas auto-organizáveis
topic Risco de PTB
Clusterização
Aprendizagem não-supervisionada
k-Means
Mapas auto-organizáveis
description Nascimento prematuro (PTB) é um fenômeno que traz riscos e desafios à sobrevivência de um recém-nascido. Apesar de muitos avanços na pesquisa, nem todas as causas do PTB estão bem definidas. Atualmente, entende-se que risco de PTB é multifatorial e que pode, também, estar associado a fatores socioeconômicos. Objetivando analisar essa possível relação, este trabalho busca estratificar o risco de PTB no Brasil utilizandose apenas de dados socioeconômicos, extraindo e analisando clusters que apresentarem divergência relevante de PTB, todos os quais serão descobertos por processos de clusterização automáticos usando uma série de métodos de aprendizagem de máquina nãosupervisionada. Através do uso de bancos de dados públicos disponibilizados pelo Governo Federal do Brasil, um novo banco de dados foi gerado com dados socioeconômicos a nível municipal e uma taxa de ocorrência de PTB. Esse banco de dados foi processado utilizando dois métodos de clusterização distintos, ambos construídos através da união de métodos de aprendizagem não-supervisionada, tais como k-médias, análise de componentes principais (PCA), clusterização espacial baseada em densidade de aplicações com ruído (DBSCAN), mapas auto-organizáveis (SOM) e clusterização hierárquica. Os clusters com alto PTB foram formados majoritariamente por municípios com baixos níveis educacionais, com pior qualidade de serviços públicos – como saneamento básico e coleta de lixo – e com populações mais brancas. A distribuição dos clusters também foi observada, com clusters com alto PTB concentrados nas regiões Norte e Nordeste. Os resultados indicam, uma influência positiva da qualidade de vida e da oferta de serviços públicos na redução do risco de PTB.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-07-05T22:14:39Z
dc.date.available.fl_str_mv 2022-07-05T22:14:39Z
dc.date.issued.fl_str_mv 2022-04-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LOPES JÚNIOR, Márcio Luiz Bezerra. Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data. 2022. 83f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/48347
identifier_str_mv LOPES JÚNIOR, Márcio Luiz Bezerra. Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data. 2022. 83f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.
url https://repositorio.ufrn.br/handle/123456789/48347
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/48347/1/Stratificationpretermbirth_LopesJunior_2022.pdf
bitstream.checksum.fl_str_mv b030001eed9a48165928728196ee98bf
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1802117800014118912