O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Biblos (Rio Grande. Online) |
Texto Completo: | https://periodicos.furg.br/biblos/article/view/12395 |
Resumo: | This research's general objective was to analyze if there is a temporal variation characteristic of the distribution of values of relevant terms over the time of the production of texts that can contribute as a criterion for the automatic indexing process. The doctoral theses of the graduate programs (PPGs) in the area of Applied Social Sciences at UFMG were analyzed, considering seven different PPGs, each of which is a corpus, with 641 theses defended in a period of twelve years, from 2007 to 2018. The terms considered were all the noun phrases contained in the texts of the theses. Each noun phrase received a value associated with its relevance as a descriptor according to the term frequency criteria in the thesis itself (TF - Term Frequency) and with the inverse of the frequency of occurrence of the term in the total of theses of each PPG (IDF - Inverse Document Frequency). The theses were divided into 12 groups in each PPG to calculate the average defense date of the theses and the average consolidated score of the relevant terms in the theses. As a result, each PPG's characteristic behavior was identified through a scatter plot of the average level of relevance score over time. For each graph of each of the 7 PPGs, a trend line was added, considering its respective R², and its specific analysis was made. All temporal distribution behaviors were characterized in polynomial equations and applied as a criterion for automatic indexing. |
id |
FURG-3_434089b7eb2e508e6cbc282e6b16b522 |
---|---|
oai_identifier_str |
oai:ojs.periodicos.furg.br:article/12395 |
network_acronym_str |
FURG-3 |
network_name_str |
Biblos (Rio Grande. Online) |
repository_id_str |
|
spelling |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadasThis research's general objective was to analyze if there is a temporal variation characteristic of the distribution of values of relevant terms over the time of the production of texts that can contribute as a criterion for the automatic indexing process. The doctoral theses of the graduate programs (PPGs) in the area of Applied Social Sciences at UFMG were analyzed, considering seven different PPGs, each of which is a corpus, with 641 theses defended in a period of twelve years, from 2007 to 2018. The terms considered were all the noun phrases contained in the texts of the theses. Each noun phrase received a value associated with its relevance as a descriptor according to the term frequency criteria in the thesis itself (TF - Term Frequency) and with the inverse of the frequency of occurrence of the term in the total of theses of each PPG (IDF - Inverse Document Frequency). The theses were divided into 12 groups in each PPG to calculate the average defense date of the theses and the average consolidated score of the relevant terms in the theses. As a result, each PPG's characteristic behavior was identified through a scatter plot of the average level of relevance score over time. For each graph of each of the 7 PPGs, a trend line was added, considering its respective R², and its specific analysis was made. All temporal distribution behaviors were characterized in polynomial equations and applied as a criterion for automatic indexing.O objetivo geral desta pesquisa foi analisar se há uma variação temporal característica da distribuição de valores de termos relevantes ao longo do tempo da produção de textos que possa contribuir como um critério para o processo de sua indexação automática. Foram analisadas as teses de doutorado dos programas de pós-graduação (PPGs) da área de Ciências Sociais Aplicadas da UFMG, considerando-se 7 PPGs distintos, sendo cada um deles um corpus, com um total de 641 teses defendidas período de 12 anos, de 2007 a 2018. Os termos considerados foram todos os sintagmas nominais contidos nos próprios textos das teses. Cada sintagma nominal recebeu um valor associado à sua relevância como descritor de acordo com os critérios de frequência do termo na própria tese (TF - Term Frequency) e com o inverso da frequência de ocorrência do termo no total de teses de cada PPG (IDF - Inverse Document Frequency). As teses foram divididas em 12 grupos em cada PPG para o cálculo da data média de defesa das teses e da média de pontuação consolidada dos termos relevantes nas teses. Como resultados, identificou-se o comportamento característico de cada PPG através de um gráfico de dispersão do nível médio de pontuação de relevância ao longo do tempo. Para cada gráfico de cada um dos 7 PPGs foi adicionada uma linha de tendência, considerando seu respectivo R², e feita sua análise específica. Todos os comportamentos de distribuição temporais foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.Editora e Gráfica da FURG - EDGRAF2020-12-31info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.furg.br/biblos/article/view/1239510.14295/biblos.v34i2.12395BIBLOS; Vol. 34 No. 2 (2020): Dossiê Tecnologias de Informação e Comunicação no contexto da Ciência da Informação ; 344-365BIBLOS; v. 34 n. 2 (2020): Dossiê Tecnologias de Informação e Comunicação no contexto da Ciência da Informação ; 344-3652236-75940102-4388reponame:Biblos (Rio Grande. Online)instname:Universidade Federal do Rio Grande (FURG)instacron:FURGporhttps://periodicos.furg.br/biblos/article/view/12395/8459Copyright (c) 2020 BIBLOShttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessMesquita, Luiz Antônio LopesSouza, Renato RochaDias, Célia da Consolação2023-05-03T17:40:53Zoai:ojs.periodicos.furg.br:article/12395Revistahttps://www.seer.furg.br/biblosPUBhttps://www.seer.furg.br/biblos/oaiangelicacdm@gmail.com2236-75940102-4388opendoar:2023-05-03T17:40:53Biblos (Rio Grande. Online) - Universidade Federal do Rio Grande (FURG)false |
dc.title.none.fl_str_mv |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas |
title |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas |
spellingShingle |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas Mesquita, Luiz Antônio Lopes |
title_short |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas |
title_full |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas |
title_fullStr |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas |
title_full_unstemmed |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas |
title_sort |
O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 a 2018 nas ciências sociais aplicadas |
author |
Mesquita, Luiz Antônio Lopes |
author_facet |
Mesquita, Luiz Antônio Lopes Souza, Renato Rocha Dias, Célia da Consolação |
author_role |
author |
author2 |
Souza, Renato Rocha Dias, Célia da Consolação |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Mesquita, Luiz Antônio Lopes Souza, Renato Rocha Dias, Célia da Consolação |
description |
This research's general objective was to analyze if there is a temporal variation characteristic of the distribution of values of relevant terms over the time of the production of texts that can contribute as a criterion for the automatic indexing process. The doctoral theses of the graduate programs (PPGs) in the area of Applied Social Sciences at UFMG were analyzed, considering seven different PPGs, each of which is a corpus, with 641 theses defended in a period of twelve years, from 2007 to 2018. The terms considered were all the noun phrases contained in the texts of the theses. Each noun phrase received a value associated with its relevance as a descriptor according to the term frequency criteria in the thesis itself (TF - Term Frequency) and with the inverse of the frequency of occurrence of the term in the total of theses of each PPG (IDF - Inverse Document Frequency). The theses were divided into 12 groups in each PPG to calculate the average defense date of the theses and the average consolidated score of the relevant terms in the theses. As a result, each PPG's characteristic behavior was identified through a scatter plot of the average level of relevance score over time. For each graph of each of the 7 PPGs, a trend line was added, considering its respective R², and its specific analysis was made. All temporal distribution behaviors were characterized in polynomial equations and applied as a criterion for automatic indexing. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-12-31 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://periodicos.furg.br/biblos/article/view/12395 10.14295/biblos.v34i2.12395 |
url |
https://periodicos.furg.br/biblos/article/view/12395 |
identifier_str_mv |
10.14295/biblos.v34i2.12395 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://periodicos.furg.br/biblos/article/view/12395/8459 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2020 BIBLOS https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2020 BIBLOS https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Editora e Gráfica da FURG - EDGRAF |
publisher.none.fl_str_mv |
Editora e Gráfica da FURG - EDGRAF |
dc.source.none.fl_str_mv |
BIBLOS; Vol. 34 No. 2 (2020): Dossiê Tecnologias de Informação e Comunicação no contexto da Ciência da Informação ; 344-365 BIBLOS; v. 34 n. 2 (2020): Dossiê Tecnologias de Informação e Comunicação no contexto da Ciência da Informação ; 344-365 2236-7594 0102-4388 reponame:Biblos (Rio Grande. Online) instname:Universidade Federal do Rio Grande (FURG) instacron:FURG |
instname_str |
Universidade Federal do Rio Grande (FURG) |
instacron_str |
FURG |
institution |
FURG |
reponame_str |
Biblos (Rio Grande. Online) |
collection |
Biblos (Rio Grande. Online) |
repository.name.fl_str_mv |
Biblos (Rio Grande. Online) - Universidade Federal do Rio Grande (FURG) |
repository.mail.fl_str_mv |
angelicacdm@gmail.com |
_version_ |
1798945098787979264 |