Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG

Detalhes bibliográficos
Autor(a) principal: Luiz Antonio Lopes Mesquita
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/ECID-943NXP
Resumo: O objetivo principal dessa dissertação foi analisar se haveria um comportamento característico de distribuição de termos relevantes ao longo de um texto científico que poderia contribuir como um critério para o processo da sua indexação automática. A distribuição foi analisada de duas formas: uma linear, realizada do início ao fim do texto; e outra que considera algumas de suas partes estruturais (introdução, desenvolvimento e conclusão). Os termos considerados aqui foram somente sintagmas nominais plenos contidos nos próprios textos. Os textos considerados foram um total de 98 teses de doutorado das oito áreas de conhecimento da UFMG. Inicialmente, para cada um dos textos, foram selecionados 20 sintagmas nominais como candidatos a descritores. Os próprios autores das teses, mediante entrevistas, avaliaram a relevância de cada um deles como descritor de suas obras. 77,9% dos candidatos foram considerados relevantes. Os valores de relevância dos descritores foram associados às suas posições no texto. Foram analisados os valores resultantes dessa distribuição considerando dois tipos de posição: uma linear, com valores consolidados em dez partes iguais e consecutivas; outro considerando partes estruturais do texto (como introdução, desenvlvimento e conclusão). Todos os textos apresentaram um comportamento característico único, assim como um comportamento característico quando estavam relacionados às ciências naturais ou às ciências sociais. Todos os comportamentos, inclusive o geral, foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.
id UFMG_530059f5a999b432abc6c885547cac18
oai_identifier_str oai:repositorio.ufmg.br:1843/ECID-943NXP
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Renato Rocha SouzaRenata Maria Abrantes Baracho PortoWagner Meira JuniorGercina Angela Borem de Oliveira LimaLuiz Antonio Lopes Mesquita2019-08-12T07:31:45Z2019-08-12T07:31:45Z2012-12-19http://hdl.handle.net/1843/ECID-943NXPO objetivo principal dessa dissertação foi analisar se haveria um comportamento característico de distribuição de termos relevantes ao longo de um texto científico que poderia contribuir como um critério para o processo da sua indexação automática. A distribuição foi analisada de duas formas: uma linear, realizada do início ao fim do texto; e outra que considera algumas de suas partes estruturais (introdução, desenvolvimento e conclusão). Os termos considerados aqui foram somente sintagmas nominais plenos contidos nos próprios textos. Os textos considerados foram um total de 98 teses de doutorado das oito áreas de conhecimento da UFMG. Inicialmente, para cada um dos textos, foram selecionados 20 sintagmas nominais como candidatos a descritores. Os próprios autores das teses, mediante entrevistas, avaliaram a relevância de cada um deles como descritor de suas obras. 77,9% dos candidatos foram considerados relevantes. Os valores de relevância dos descritores foram associados às suas posições no texto. Foram analisados os valores resultantes dessa distribuição considerando dois tipos de posição: uma linear, com valores consolidados em dez partes iguais e consecutivas; outro considerando partes estruturais do texto (como introdução, desenvlvimento e conclusão). Todos os textos apresentaram um comportamento característico único, assim como um comportamento característico quando estavam relacionados às ciências naturais ou às ciências sociais. Todos os comportamentos, inclusive o geral, foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.The main goal of this thesis was to analyze whether there was a characteristic behavior regarding the distribution of relevant terms through a scientific text that could contribute as a criterion for its automatic indexing process. The distribution was analyzed in two ways: a linear one, performed from the beginning to the end of the text; and another that considered some of its structural parts (introduction, development and conclusion). The terms considered here were only nominal phrases contained in the texts. The texts considered here are a total of 98 doctoral dissertations from the eight knowledge areas of UFMG. Initially, for each text, 20 nominal phrases were selected as candidates for descriptors. The authors of the theses, through interviews, rated the importance of each nominal phrase as a descriptor of his/her work. 77.9% of candidates were considered relevant. The descriptors relevance values were associated with their positions in the text. We analyzed the resulting values of this distribution considering two types of position: a linear one, where values were consolidated into ten equal and consecutive portions; and one considering other structural parts of the text (such as introduction, development and conclusion). All texts showed a unique and characteristic behavior, as well as a characteristic behavior when the text was related to the natural sciences or social sciences. All behaviors, including general, were characterized in polynomial equations and can be applied as a criterion for automatic indexing.Universidade Federal de Minas GeraisUFMGRecuperação da informaçãoLinguagens de indexaçãoUniversidade Federal de Minas GeraisIndexação automaticaCiência da informaçãoSintagmas nominaisIndexação automáticaSintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMGinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALmesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdfapplication/pdf5827181https://repositorio.ufmg.br/bitstream/1843/ECID-943NXP/1/mesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf84682f79547333d8aa732e373e57b91eMD51TEXTmesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf.txtmesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf.txtExtracted texttext/plain430825https://repositorio.ufmg.br/bitstream/1843/ECID-943NXP/2/mesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf.txtd37160c699f9ac35ffa1131b0b3c8594MD521843/ECID-943NXP2019-11-14 11:15:52.938oai:repositorio.ufmg.br:1843/ECID-943NXPRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T14:15:52Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
title Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
spellingShingle Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
Luiz Antonio Lopes Mesquita
Sintagmas nominais
Indexação automática
Recuperação da informação
Linguagens de indexação
Universidade Federal de Minas Gerais
Indexação automatica
Ciência da informação
title_short Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
title_full Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
title_fullStr Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
title_full_unstemmed Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
title_sort Sintagmas nominais na indexação automática: uma análise estrutural da distribuição de termos relevantes em teses de doutorado da UFMG
author Luiz Antonio Lopes Mesquita
author_facet Luiz Antonio Lopes Mesquita
author_role author
dc.contributor.advisor1.fl_str_mv Renato Rocha Souza
dc.contributor.advisor-co1.fl_str_mv Renata Maria Abrantes Baracho Porto
dc.contributor.referee1.fl_str_mv Wagner Meira Junior
dc.contributor.referee2.fl_str_mv Gercina Angela Borem de Oliveira Lima
dc.contributor.author.fl_str_mv Luiz Antonio Lopes Mesquita
contributor_str_mv Renato Rocha Souza
Renata Maria Abrantes Baracho Porto
Wagner Meira Junior
Gercina Angela Borem de Oliveira Lima
dc.subject.por.fl_str_mv Sintagmas nominais
Indexação automática
topic Sintagmas nominais
Indexação automática
Recuperação da informação
Linguagens de indexação
Universidade Federal de Minas Gerais
Indexação automatica
Ciência da informação
dc.subject.other.pt_BR.fl_str_mv Recuperação da informação
Linguagens de indexação
Universidade Federal de Minas Gerais
Indexação automatica
Ciência da informação
description O objetivo principal dessa dissertação foi analisar se haveria um comportamento característico de distribuição de termos relevantes ao longo de um texto científico que poderia contribuir como um critério para o processo da sua indexação automática. A distribuição foi analisada de duas formas: uma linear, realizada do início ao fim do texto; e outra que considera algumas de suas partes estruturais (introdução, desenvolvimento e conclusão). Os termos considerados aqui foram somente sintagmas nominais plenos contidos nos próprios textos. Os textos considerados foram um total de 98 teses de doutorado das oito áreas de conhecimento da UFMG. Inicialmente, para cada um dos textos, foram selecionados 20 sintagmas nominais como candidatos a descritores. Os próprios autores das teses, mediante entrevistas, avaliaram a relevância de cada um deles como descritor de suas obras. 77,9% dos candidatos foram considerados relevantes. Os valores de relevância dos descritores foram associados às suas posições no texto. Foram analisados os valores resultantes dessa distribuição considerando dois tipos de posição: uma linear, com valores consolidados em dez partes iguais e consecutivas; outro considerando partes estruturais do texto (como introdução, desenvlvimento e conclusão). Todos os textos apresentaram um comportamento característico único, assim como um comportamento característico quando estavam relacionados às ciências naturais ou às ciências sociais. Todos os comportamentos, inclusive o geral, foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.
publishDate 2012
dc.date.issued.fl_str_mv 2012-12-19
dc.date.accessioned.fl_str_mv 2019-08-12T07:31:45Z
dc.date.available.fl_str_mv 2019-08-12T07:31:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ECID-943NXP
url http://hdl.handle.net/1843/ECID-943NXP
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ECID-943NXP/1/mesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf
https://repositorio.ufmg.br/bitstream/1843/ECID-943NXP/2/mesquita__luiz_a._l._pesquisa___disserta__o___vers.10.final.pdf.txt
bitstream.checksum.fl_str_mv 84682f79547333d8aa732e373e57b91e
d37160c699f9ac35ffa1131b0b3c8594
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589547201658880