Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/48347 |
Resumo: | Nascimento prematuro (PTB) é um fenômeno que traz riscos e desafios à sobrevivência de um recém-nascido. Apesar de muitos avanços na pesquisa, nem todas as causas do PTB estão bem definidas. Atualmente, entende-se que risco de PTB é multifatorial e que pode, também, estar associado a fatores socioeconômicos. Objetivando analisar essa possível relação, este trabalho busca estratificar o risco de PTB no Brasil utilizandose apenas de dados socioeconômicos, extraindo e analisando clusters que apresentarem divergência relevante de PTB, todos os quais serão descobertos por processos de clusterização automáticos usando uma série de métodos de aprendizagem de máquina nãosupervisionada. Através do uso de bancos de dados públicos disponibilizados pelo Governo Federal do Brasil, um novo banco de dados foi gerado com dados socioeconômicos a nível municipal e uma taxa de ocorrência de PTB. Esse banco de dados foi processado utilizando dois métodos de clusterização distintos, ambos construídos através da união de métodos de aprendizagem não-supervisionada, tais como k-médias, análise de componentes principais (PCA), clusterização espacial baseada em densidade de aplicações com ruído (DBSCAN), mapas auto-organizáveis (SOM) e clusterização hierárquica. Os clusters com alto PTB foram formados majoritariamente por municípios com baixos níveis educacionais, com pior qualidade de serviços públicos – como saneamento básico e coleta de lixo – e com populações mais brancas. A distribuição dos clusters também foi observada, com clusters com alto PTB concentrados nas regiões Norte e Nordeste. Os resultados indicam, uma influência positiva da qualidade de vida e da oferta de serviços públicos na redução do risco de PTB. |
id |
UFRN_ee1e43c603a0334efe592843750c3890 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/48347 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Lopes Júnior, Márcio Luiz Bezerrahttp://lattes.cnpq.br/0833804654660654https://orcid.org/0000-0001-7536-2506http://lattes.cnpq.br/3475337353676349Barbosa, Raquel de MeloChiavegatto Filho, Alexandre Dias PortoSilva, Ivanovitch Medeiros Dantas dahttps://orcid.org/0000-0002-0116-6489http://lattes.cnpq.br/3608440944832201Dias, Leonardo AlvesFernandes, Marcelo Augusto Costa2022-07-05T22:14:39Z2022-07-05T22:14:39Z2022-04-29LOPES JÚNIOR, Márcio Luiz Bezerra. Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data. 2022. 83f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/48347Nascimento prematuro (PTB) é um fenômeno que traz riscos e desafios à sobrevivência de um recém-nascido. Apesar de muitos avanços na pesquisa, nem todas as causas do PTB estão bem definidas. Atualmente, entende-se que risco de PTB é multifatorial e que pode, também, estar associado a fatores socioeconômicos. Objetivando analisar essa possível relação, este trabalho busca estratificar o risco de PTB no Brasil utilizandose apenas de dados socioeconômicos, extraindo e analisando clusters que apresentarem divergência relevante de PTB, todos os quais serão descobertos por processos de clusterização automáticos usando uma série de métodos de aprendizagem de máquina nãosupervisionada. Através do uso de bancos de dados públicos disponibilizados pelo Governo Federal do Brasil, um novo banco de dados foi gerado com dados socioeconômicos a nível municipal e uma taxa de ocorrência de PTB. Esse banco de dados foi processado utilizando dois métodos de clusterização distintos, ambos construídos através da união de métodos de aprendizagem não-supervisionada, tais como k-médias, análise de componentes principais (PCA), clusterização espacial baseada em densidade de aplicações com ruído (DBSCAN), mapas auto-organizáveis (SOM) e clusterização hierárquica. Os clusters com alto PTB foram formados majoritariamente por municípios com baixos níveis educacionais, com pior qualidade de serviços públicos – como saneamento básico e coleta de lixo – e com populações mais brancas. A distribuição dos clusters também foi observada, com clusters com alto PTB concentrados nas regiões Norte e Nordeste. Os resultados indicam, uma influência positiva da qualidade de vida e da oferta de serviços públicos na redução do risco de PTB.Preterm birth (PTB) is a phenomenon that brings risks and challenges to the survival of the newborn child. Despite many advances in research, not all the causes of PTB are yet clear. It is currently understood that PTB risk is multi-factorial and may also be associated with socioeconomic factors. In order to analyse this possible relationship, this work seeks to stratify PTB risk in Brazil using only socioeconomic data, extracting and analysing those clusters that present relevant PTB divergence, all of which will be found by automatic clustering processes using a series of unsupervised machine learning methods. Through the use of datasets made publicly available by the Federal Government of Brazil, a new dataset was generated with municipality-level socioeconomic data and a PTB occurrence rate. This dataset was processed using two separate clustering methods, both built by assembling unsupervised learning techniques, such as k-means, principal component analysis (PCA), density-based spatial clustering of applications with noise (DBSCAN), self-organising maps (SOM) and hierarchical clustering. The methods discovered clusters of municipalities with both high levels and low levels of PTB occurrence. The clusters with high PTB were comprised predominantly of municipalities with lower levels of education, worse quality of public services – such as basic sanitation and garbage collection – and a less white population. The regional distribution of the clusters was also observed, with clusters of high PTB located primarily in the North and Northeast regions of Brazil. The results indicate a positive influence of the quality of life and the offer of public services on the reduction of PTB risk.Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilRisco de PTBClusterizaçãoAprendizagem não-supervisionadak-MeansMapas auto-organizáveisStratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALStratificationpretermbirth_LopesJunior_2022.pdfapplication/pdf7451727https://repositorio.ufrn.br/bitstream/123456789/48347/1/Stratificationpretermbirth_LopesJunior_2022.pdfb030001eed9a48165928728196ee98bfMD51123456789/483472022-07-05 19:15:16.487oai:https://repositorio.ufrn.br:123456789/48347Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-07-05T22:15:16Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data |
title |
Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data |
spellingShingle |
Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data Lopes Júnior, Márcio Luiz Bezerra Risco de PTB Clusterização Aprendizagem não-supervisionada k-Means Mapas auto-organizáveis |
title_short |
Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data |
title_full |
Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data |
title_fullStr |
Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data |
title_full_unstemmed |
Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data |
title_sort |
Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data |
author |
Lopes Júnior, Márcio Luiz Bezerra |
author_facet |
Lopes Júnior, Márcio Luiz Bezerra |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0833804654660654 |
dc.contributor.advisorID.pt_BR.fl_str_mv |
https://orcid.org/0000-0001-7536-2506 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3475337353676349 |
dc.contributor.referees1.none.fl_str_mv |
Chiavegatto Filho, Alexandre Dias Porto |
dc.contributor.referees2.none.fl_str_mv |
Silva, Ivanovitch Medeiros Dantas da |
dc.contributor.referees2ID.pt_BR.fl_str_mv |
https://orcid.org/0000-0002-0116-6489 |
dc.contributor.referees2Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3608440944832201 |
dc.contributor.referees3.none.fl_str_mv |
Dias, Leonardo Alves |
dc.contributor.author.fl_str_mv |
Lopes Júnior, Márcio Luiz Bezerra |
dc.contributor.advisor-co1.fl_str_mv |
Barbosa, Raquel de Melo |
dc.contributor.advisor1.fl_str_mv |
Fernandes, Marcelo Augusto Costa |
contributor_str_mv |
Barbosa, Raquel de Melo Fernandes, Marcelo Augusto Costa |
dc.subject.por.fl_str_mv |
Risco de PTB Clusterização Aprendizagem não-supervisionada k-Means Mapas auto-organizáveis |
topic |
Risco de PTB Clusterização Aprendizagem não-supervisionada k-Means Mapas auto-organizáveis |
description |
Nascimento prematuro (PTB) é um fenômeno que traz riscos e desafios à sobrevivência de um recém-nascido. Apesar de muitos avanços na pesquisa, nem todas as causas do PTB estão bem definidas. Atualmente, entende-se que risco de PTB é multifatorial e que pode, também, estar associado a fatores socioeconômicos. Objetivando analisar essa possível relação, este trabalho busca estratificar o risco de PTB no Brasil utilizandose apenas de dados socioeconômicos, extraindo e analisando clusters que apresentarem divergência relevante de PTB, todos os quais serão descobertos por processos de clusterização automáticos usando uma série de métodos de aprendizagem de máquina nãosupervisionada. Através do uso de bancos de dados públicos disponibilizados pelo Governo Federal do Brasil, um novo banco de dados foi gerado com dados socioeconômicos a nível municipal e uma taxa de ocorrência de PTB. Esse banco de dados foi processado utilizando dois métodos de clusterização distintos, ambos construídos através da união de métodos de aprendizagem não-supervisionada, tais como k-médias, análise de componentes principais (PCA), clusterização espacial baseada em densidade de aplicações com ruído (DBSCAN), mapas auto-organizáveis (SOM) e clusterização hierárquica. Os clusters com alto PTB foram formados majoritariamente por municípios com baixos níveis educacionais, com pior qualidade de serviços públicos – como saneamento básico e coleta de lixo – e com populações mais brancas. A distribuição dos clusters também foi observada, com clusters com alto PTB concentrados nas regiões Norte e Nordeste. Os resultados indicam, uma influência positiva da qualidade de vida e da oferta de serviços públicos na redução do risco de PTB. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-07-05T22:14:39Z |
dc.date.available.fl_str_mv |
2022-07-05T22:14:39Z |
dc.date.issued.fl_str_mv |
2022-04-29 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
LOPES JÚNIOR, Márcio Luiz Bezerra. Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data. 2022. 83f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/48347 |
identifier_str_mv |
LOPES JÚNIOR, Márcio Luiz Bezerra. Stratification of preterm birth risk in Brazil through unsupervised learning methods and socioeconomic data. 2022. 83f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
url |
https://repositorio.ufrn.br/handle/123456789/48347 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/48347/1/Stratificationpretermbirth_LopesJunior_2022.pdf |
bitstream.checksum.fl_str_mv |
b030001eed9a48165928728196ee98bf |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1802117800014118912 |