A deep learning model for identifying academic publications aligned with the sustainable development goals

Detalhes bibliográficos
Autor(a) principal: Dias, Alexandre Henrique Soares
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/55191
Resumo: Em 2015, as Nações Unidas estabeleceram os 17 Objetivos de Desenvolvimento Sustentável (ODS) para promover a responsabilidade ambiental, o avanço econômico e a equidade social. Dentro desse contexto, a pesquisa científica desempenha um papel fundamental na abordagem dos desafios abrangidos pelos ODS. Este trabalho apresenta o desenvolvimento e a implementação de um classificador multirrótulo para identificar artigos científicos alinhados com os ODS, estabelecidos pelas Nações Unidas. Reconhecendo as complexidades e desafios inerentes aos ODS, o trabalho visa auxiliar instituições governamentais, educacionais e privadas na tomada de decisões informadas relacionadas à implementação dos ODS. O classificador proposto foi treinado e avaliado em um conjunto de dados de aproximadamente um milhão de amostras da base de dados Scopus, consistindo em títulos de publicações científicas e rótulos dos ODS. Foram exploradas três arquiteturas distintas de aprendizado profundo: Redes Neurais Recorrentes, BERT e Distilled BERT. Consideração especial foi dada ao tratamento do desequilíbrio de classes, e uma nova métrica multiobjetivo, F-Green, foi introduzida para avaliar tanto o desempenho do modelo quanto a sua pegada de carbono. Entre as arquiteturas de modelo experimentadas, a arquitetura Distilled BERT mostrou-se a melhor opção em equilíbrio entre desempenho e impacto ambiental. Uma aplicação web de prova de conceito foi desenvolvida para demonstrar a funcionalidade do modelo, permitindo que os usuários classifiquem títulos acadêmicos hipotéticos de acordo com os ODS relevantes. O trabalho destaca a importância de alinhar a produção científica com os objetivos de sustentabilidade e fornece uma ferramenta prática para apoiar a tomada de decisões na academia e além.
id UFRN_4a644d0c4ae869afc3faf73cd2e99652
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/55191
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Dias, Alexandre Henrique Soareshttp://lattes.cnpq.br/0578269600292819https://orcid.org/0000-0002-0116-6489http://lattes.cnpq.br/3608440944832201Coelho, Livy Maria RealMartins, Allan de Medeiroshttps://orcid.org/0000-0002-9486-4509http://lattes.cnpq.br/4402694969508077Soares, Eduardo AlmeidaMedeiros Neta, Olivia Morais deSilva, Ivanovitch Medeiros Dantas da2023-11-07T20:03:28Z2023-11-07T20:03:28Z2023-08-31DIAS, Alexandre Henrique Soares. A deep learning model for identifying academic publications aligned with the sustainable development goals. Orientador: Dr. Ivanovitch Medeiros Dantas da Silva. 2023. 63f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/55191Em 2015, as Nações Unidas estabeleceram os 17 Objetivos de Desenvolvimento Sustentável (ODS) para promover a responsabilidade ambiental, o avanço econômico e a equidade social. Dentro desse contexto, a pesquisa científica desempenha um papel fundamental na abordagem dos desafios abrangidos pelos ODS. Este trabalho apresenta o desenvolvimento e a implementação de um classificador multirrótulo para identificar artigos científicos alinhados com os ODS, estabelecidos pelas Nações Unidas. Reconhecendo as complexidades e desafios inerentes aos ODS, o trabalho visa auxiliar instituições governamentais, educacionais e privadas na tomada de decisões informadas relacionadas à implementação dos ODS. O classificador proposto foi treinado e avaliado em um conjunto de dados de aproximadamente um milhão de amostras da base de dados Scopus, consistindo em títulos de publicações científicas e rótulos dos ODS. Foram exploradas três arquiteturas distintas de aprendizado profundo: Redes Neurais Recorrentes, BERT e Distilled BERT. Consideração especial foi dada ao tratamento do desequilíbrio de classes, e uma nova métrica multiobjetivo, F-Green, foi introduzida para avaliar tanto o desempenho do modelo quanto a sua pegada de carbono. Entre as arquiteturas de modelo experimentadas, a arquitetura Distilled BERT mostrou-se a melhor opção em equilíbrio entre desempenho e impacto ambiental. Uma aplicação web de prova de conceito foi desenvolvida para demonstrar a funcionalidade do modelo, permitindo que os usuários classifiquem títulos acadêmicos hipotéticos de acordo com os ODS relevantes. O trabalho destaca a importância de alinhar a produção científica com os objetivos de sustentabilidade e fornece uma ferramenta prática para apoiar a tomada de decisões na academia e além.In 2015, the United Nations established the 17 Sustainable Development Goals (SDGs) to promote environmental stewardship, economic advancement, and social equity. Within this framework, scientific research plays a pivotal role in addressing the challenges encompassed by the SDGs. This work presents the development and implementation of a multi-label classifier for identifying scientific articles aligned with the SDGs, established by the United Nations. Recognizing the inherent complexities and challenges associated with the SDGs, the work aims to assist governmental, educational, and private institutions in making informed decisions related to SDG implementation. The proposed classifier was trained and evaluated on a dataset of approximately one million samples from the Scopus database, consisting of titles of scientific publications and SDG labels. Three distinct deep learning architectures were explored: Recurrent Neural Networks, BERT, and Distilled BERT. Special consideration was given to handling class imbalance, and a new multi-objective metric, F-Green, was proposed as a way to assess the models’ performances considering not only their performance metrics but also their carbon footprint. Among the model architectures experimented with, the Distilled BERT architecture was found to provide the optimal balance between performance and environmental impact. A proof-of-concept web application was developed to demonstrate the model’s functionality, allowing users to interact with the model and classify hypothetical academic article titles according to one or more SDGs. The work highlights the importance of aligning scientific production with sustainability goals and provides a practical tool to support decision-making in academia and beyond.Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilCNPQ::ENGENHARIAS::ENGENHARIA ELETRICASustainable developmentMultilabel classificationDeep learningNatural languageScientometricsA deep learning model for identifying academic publications aligned with the sustainable development goalsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALDeeplearningmodel_Dias_2023.pdfapplication/pdf4408598https://repositorio.ufrn.br/bitstream/123456789/55191/1/Deeplearningmodel_Dias_2023.pdfe224a7708a044fa5b7ee7df28b6b9d8dMD51123456789/551912023-11-07 17:04:13.644oai:https://repositorio.ufrn.br:123456789/55191Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-11-07T20:04:13Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv A deep learning model for identifying academic publications aligned with the sustainable development goals
title A deep learning model for identifying academic publications aligned with the sustainable development goals
spellingShingle A deep learning model for identifying academic publications aligned with the sustainable development goals
Dias, Alexandre Henrique Soares
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Sustainable development
Multilabel classification
Deep learning
Natural language
Scientometrics
title_short A deep learning model for identifying academic publications aligned with the sustainable development goals
title_full A deep learning model for identifying academic publications aligned with the sustainable development goals
title_fullStr A deep learning model for identifying academic publications aligned with the sustainable development goals
title_full_unstemmed A deep learning model for identifying academic publications aligned with the sustainable development goals
title_sort A deep learning model for identifying academic publications aligned with the sustainable development goals
author Dias, Alexandre Henrique Soares
author_facet Dias, Alexandre Henrique Soares
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0578269600292819
dc.contributor.advisorID.pt_BR.fl_str_mv https://orcid.org/0000-0002-0116-6489
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3608440944832201
dc.contributor.referees1.none.fl_str_mv Coelho, Livy Maria Real
dc.contributor.referees2.none.fl_str_mv Martins, Allan de Medeiros
dc.contributor.referees2ID.pt_BR.fl_str_mv https://orcid.org/0000-0002-9486-4509
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4402694969508077
dc.contributor.referees3.none.fl_str_mv Soares, Eduardo Almeida
dc.contributor.referees4.none.fl_str_mv Medeiros Neta, Olivia Morais de
dc.contributor.author.fl_str_mv Dias, Alexandre Henrique Soares
dc.contributor.advisor1.fl_str_mv Silva, Ivanovitch Medeiros Dantas da
contributor_str_mv Silva, Ivanovitch Medeiros Dantas da
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Sustainable development
Multilabel classification
Deep learning
Natural language
Scientometrics
dc.subject.por.fl_str_mv Sustainable development
Multilabel classification
Deep learning
Natural language
Scientometrics
description Em 2015, as Nações Unidas estabeleceram os 17 Objetivos de Desenvolvimento Sustentável (ODS) para promover a responsabilidade ambiental, o avanço econômico e a equidade social. Dentro desse contexto, a pesquisa científica desempenha um papel fundamental na abordagem dos desafios abrangidos pelos ODS. Este trabalho apresenta o desenvolvimento e a implementação de um classificador multirrótulo para identificar artigos científicos alinhados com os ODS, estabelecidos pelas Nações Unidas. Reconhecendo as complexidades e desafios inerentes aos ODS, o trabalho visa auxiliar instituições governamentais, educacionais e privadas na tomada de decisões informadas relacionadas à implementação dos ODS. O classificador proposto foi treinado e avaliado em um conjunto de dados de aproximadamente um milhão de amostras da base de dados Scopus, consistindo em títulos de publicações científicas e rótulos dos ODS. Foram exploradas três arquiteturas distintas de aprendizado profundo: Redes Neurais Recorrentes, BERT e Distilled BERT. Consideração especial foi dada ao tratamento do desequilíbrio de classes, e uma nova métrica multiobjetivo, F-Green, foi introduzida para avaliar tanto o desempenho do modelo quanto a sua pegada de carbono. Entre as arquiteturas de modelo experimentadas, a arquitetura Distilled BERT mostrou-se a melhor opção em equilíbrio entre desempenho e impacto ambiental. Uma aplicação web de prova de conceito foi desenvolvida para demonstrar a funcionalidade do modelo, permitindo que os usuários classifiquem títulos acadêmicos hipotéticos de acordo com os ODS relevantes. O trabalho destaca a importância de alinhar a produção científica com os objetivos de sustentabilidade e fornece uma ferramenta prática para apoiar a tomada de decisões na academia e além.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-11-07T20:03:28Z
dc.date.available.fl_str_mv 2023-11-07T20:03:28Z
dc.date.issued.fl_str_mv 2023-08-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv DIAS, Alexandre Henrique Soares. A deep learning model for identifying academic publications aligned with the sustainable development goals. Orientador: Dr. Ivanovitch Medeiros Dantas da Silva. 2023. 63f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/55191
identifier_str_mv DIAS, Alexandre Henrique Soares. A deep learning model for identifying academic publications aligned with the sustainable development goals. Orientador: Dr. Ivanovitch Medeiros Dantas da Silva. 2023. 63f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.
url https://repositorio.ufrn.br/handle/123456789/55191
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/55191/1/Deeplearningmodel_Dias_2023.pdf
bitstream.checksum.fl_str_mv e224a7708a044fa5b7ee7df28b6b9d8d
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1802117743177105408