The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences

Detalhes bibliográficos
Autor(a) principal: Mesquita, Luiz Antonio lopes
Data de Publicação: 2021
Outros Autores: Dias, Célia da Consolação, Souza, Renato Rocha
Tipo de documento: Artigo
Idioma: por
Título da fonte: Múltiplos Olhares em Ciência da Informação
Texto Completo: https://periodicos.ufmg.br/index.php/moci/article/view/37241
Resumo: This research's general objective was to analyze if there is a temporal variation characteristic of the distribution of values of relevant terms over the time of the production of texts that can contribute as a criterion for the automatic indexing process. The doctoral theses of the graduate programs (PPGs) in Human Sciences at UFMG were analyzed, considering seven different PPGs, each of which is a corpus, with 929 theses defended in a period of twelve years, from 2007 to 2018. The terms considered were all the noun phrases contained in the texts of the theses. Each noun phrase received a value associated with its relevance as a descriptor according to the term frequency criteria in the thesis itself (TF - Term Frequency) and with the inverse of the frequency of occurrence of the term in the total of theses of each PPG (IDF - Inverse Document Frequency). The theses were divided into 12 groups in each PPG to calculate the average defense date of the theses and the average consolidated score of the relevant terms in the theses. As a result, each PPG's characteristic behavior was identified through a scatter plot of the average level of relevance score over time. For each graph of each of the 7 PPGs, a trend line was added, considering its respective R², and its specific analysis was made. All temporal distribution behaviors were characterized in polynomial equations and applied as a criterion for automatic indexing.
id UFMG-20_e5521e28edf2578643c16441b11fe003
oai_identifier_str oai:periodicos.ufmg.br:article/37241
network_acronym_str UFMG-20
network_name_str Múltiplos Olhares em Ciência da Informação
repository_id_str
spelling The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciencesO fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências humanasIndexação AutomáticaSintagmas NominaisRecuperação da Informação TemporalTemporal Information RetrievalAutomatic IndexingNoun PhraseThis research's general objective was to analyze if there is a temporal variation characteristic of the distribution of values of relevant terms over the time of the production of texts that can contribute as a criterion for the automatic indexing process. The doctoral theses of the graduate programs (PPGs) in Human Sciences at UFMG were analyzed, considering seven different PPGs, each of which is a corpus, with 929 theses defended in a period of twelve years, from 2007 to 2018. The terms considered were all the noun phrases contained in the texts of the theses. Each noun phrase received a value associated with its relevance as a descriptor according to the term frequency criteria in the thesis itself (TF - Term Frequency) and with the inverse of the frequency of occurrence of the term in the total of theses of each PPG (IDF - Inverse Document Frequency). The theses were divided into 12 groups in each PPG to calculate the average defense date of the theses and the average consolidated score of the relevant terms in the theses. As a result, each PPG's characteristic behavior was identified through a scatter plot of the average level of relevance score over time. For each graph of each of the 7 PPGs, a trend line was added, considering its respective R², and its specific analysis was made. All temporal distribution behaviors were characterized in polynomial equations and applied as a criterion for automatic indexing.O objetivo geral desta pesquisa foi analisar se há uma variação temporal característica da distribuição de valores de termos relevantes ao longo do tempo da produção de textos que possa contribuir como um critério para o processo de sua indexação automática. Foram analisadas as teses de doutorado dos programas de pós-graduação (PPGs) da área de Ciências Humanas da UFMG, considerando-se 7 PPGs distintos, sendo cada um deles um corpus, com um total de 929 teses defendidas período de 12 anos, de 2007 a 2018. Os termos considerados foram todos os sintagmas nominais contidos nos próprios textos das teses. Cada sintagma nominal recebeu um valor associado à sua relevância como descritor de acordo com os critérios de frequência do termo na própria tese (TF - Term Frequency) e com o inverso da frequência de ocorrência do termo no total de teses de cada PPG (IDF - Inverse Document Frequency). As teses foram divididas em 12 grupos em cada PPG para o cálculo da data média de defesa das teses e da média de pontuação consolidada dos termos relevantes nas teses. Como resultados, identificou-se o comportamento característico de cada PPG através de um gráfico de dispersão do nível médio de pontuação de relevância ao longo do tempo. Para cada gráfico de cada um dos 7 PPGs foi adicionada uma linha de tendência, considerando seu respectivo R², e feita sua análise específica. Todos os comportamentos de distribuição temporais foram caracterizados em equações e podem ser aplicados como critério para indexação automática.Universidade Federal de Minas Gerais (UFMG)2021-12-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.ufmg.br/index.php/moci/article/view/3724110.35699/2237-6658.2021.37241Múltiplos Olhares em Ciência da Informação ; III Fórum de Pesquisas Discentes (FORPED-PPGGOC - 2021)Múltiplos Olhares em Ciência da Informação - ISSN 2237-6658; III Fórum de Pesquisas Discentes (FORPED-PPGGOC - 2021)Múltiplos Olhares em Ciência da Informação - ISSN 2237-6658; III Fórum de Pesquisas Discentes (FORPED-PPGGOC - 2021)Múltiplos Olhares em Ciência da Informação; III Fórum de Pesquisas Discentes (FORPED-PPGGOC - 2021)2237-6658reponame:Múltiplos Olhares em Ciência da Informaçãoinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGporhttps://periodicos.ufmg.br/index.php/moci/article/view/37241/29004Copyright (c) 2021 Luiz Antonio lopes Mesquita, Célia da Consolação Dias, Renato Rocha Souzahttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessMesquita, Luiz Antonio lopesDias, Célia da ConsolaçãoSouza, Renato Rocha2023-05-07T12:25:53Zoai:periodicos.ufmg.br:article/37241Revistahttps://periodicos.ufmg.br/index.php/moci/PUBhttps://periodicos.ufmg.br/index.php/moci/oaimoci@eci.ufmg.br2237-66582237-6658opendoar:2023-05-07T12:25:53Múltiplos Olhares em Ciência da Informação - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências humanas
title The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences
spellingShingle The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences
Mesquita, Luiz Antonio lopes
Indexação Automática
Sintagmas Nominais
Recuperação da Informação Temporal
Temporal Information Retrieval
Automatic Indexing
Noun Phrase
title_short The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences
title_full The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences
title_fullStr The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences
title_full_unstemmed The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences
title_sort The temporal flow of relevant terms: an analysis in UFMG theses from 2007 to 2018 in human sciences
author Mesquita, Luiz Antonio lopes
author_facet Mesquita, Luiz Antonio lopes
Dias, Célia da Consolação
Souza, Renato Rocha
author_role author
author2 Dias, Célia da Consolação
Souza, Renato Rocha
author2_role author
author
dc.contributor.author.fl_str_mv Mesquita, Luiz Antonio lopes
Dias, Célia da Consolação
Souza, Renato Rocha
dc.subject.por.fl_str_mv Indexação Automática
Sintagmas Nominais
Recuperação da Informação Temporal
Temporal Information Retrieval
Automatic Indexing
Noun Phrase
topic Indexação Automática
Sintagmas Nominais
Recuperação da Informação Temporal
Temporal Information Retrieval
Automatic Indexing
Noun Phrase
description This research's general objective was to analyze if there is a temporal variation characteristic of the distribution of values of relevant terms over the time of the production of texts that can contribute as a criterion for the automatic indexing process. The doctoral theses of the graduate programs (PPGs) in Human Sciences at UFMG were analyzed, considering seven different PPGs, each of which is a corpus, with 929 theses defended in a period of twelve years, from 2007 to 2018. The terms considered were all the noun phrases contained in the texts of the theses. Each noun phrase received a value associated with its relevance as a descriptor according to the term frequency criteria in the thesis itself (TF - Term Frequency) and with the inverse of the frequency of occurrence of the term in the total of theses of each PPG (IDF - Inverse Document Frequency). The theses were divided into 12 groups in each PPG to calculate the average defense date of the theses and the average consolidated score of the relevant terms in the theses. As a result, each PPG's characteristic behavior was identified through a scatter plot of the average level of relevance score over time. For each graph of each of the 7 PPGs, a trend line was added, considering its respective R², and its specific analysis was made. All temporal distribution behaviors were characterized in polynomial equations and applied as a criterion for automatic indexing.
publishDate 2021
dc.date.none.fl_str_mv 2021-12-04
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.ufmg.br/index.php/moci/article/view/37241
10.35699/2237-6658.2021.37241
url https://periodicos.ufmg.br/index.php/moci/article/view/37241
identifier_str_mv 10.35699/2237-6658.2021.37241
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.ufmg.br/index.php/moci/article/view/37241/29004
dc.rights.driver.fl_str_mv Copyright (c) 2021 Luiz Antonio lopes Mesquita, Célia da Consolação Dias, Renato Rocha Souza
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2021 Luiz Antonio lopes Mesquita, Célia da Consolação Dias, Renato Rocha Souza
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais (UFMG)
publisher.none.fl_str_mv Universidade Federal de Minas Gerais (UFMG)
dc.source.none.fl_str_mv Múltiplos Olhares em Ciência da Informação ; III Fórum de Pesquisas Discentes (FORPED-PPGGOC - 2021)
Múltiplos Olhares em Ciência da Informação - ISSN 2237-6658; III Fórum de Pesquisas Discentes (FORPED-PPGGOC - 2021)
Múltiplos Olhares em Ciência da Informação - ISSN 2237-6658; III Fórum de Pesquisas Discentes (FORPED-PPGGOC - 2021)
Múltiplos Olhares em Ciência da Informação; III Fórum de Pesquisas Discentes (FORPED-PPGGOC - 2021)
2237-6658
reponame:Múltiplos Olhares em Ciência da Informação
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Múltiplos Olhares em Ciência da Informação
collection Múltiplos Olhares em Ciência da Informação
repository.name.fl_str_mv Múltiplos Olhares em Ciência da Informação - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv moci@eci.ufmg.br
_version_ 1796797464398790656