Proposta de normalização dos sintagmas nominais em termos para indexação automática

Detalhes bibliográficos
Autor(a) principal: CELERINO, Victor Galvão
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/0013000003655
Texto Completo: https://repositorio.ufpe.br/handle/123456789/29996
Resumo: Atualmente vivenciamos um crescimento informacional extraordinário, entretanto esse crescimento é acompanhado de um grande problema: como organizar toda essa informação? No cenário da organização e recuperação da informação digital, tem se destacado a Indexação Automática através do uso dos Sintagmas Nominais. Diferente da indexação praticada através de palavras isoladas, os Sintagmas Nominais são unidades sintáticas que possuem semântica, ou seja, possuem um sentido específico. Nesse contexto, o presente trabalho tem como objetivo geral propor um método de normalização dos Sintagmas Nominais, extraídos automaticamente, em termos canônicos, para que sejam satisfatórios como descritores dos documentos. No contexto da indexação automática por sintagmas nominais, pesquisas indicaram que nem todos os Sintagmas Nominais podem ser considerados descritores. Portanto, esta pesquisa: investigou os processos ligados a indexação automática por Sintagmas Nominais; selecionou manualmente Sintagmas Nominais contendo palavras-chaves; minimizou Sintagmas Nominais extensos; alterou os Sintagmas Nominais para aproximar de termos descritores; comparou os Sintagmas Nominais normalizados com termos do TBCI; e avaliou o método proposto em um experimento de normalização dos Sintagmas Nominais. Para atingir os objetivos propostos para esta pesquisa, foram utilizados a pesquisa bibliográfica e pesquisa empírica, com a realização da proposição e avaliação de método de normalização por meio da aplicação de um experimento. Através da pesquisa bibliográfica foi possível identificar estudos realizados sobre a indexação automática através de Sintagmas Nominais, estudos esses que auxiliaram no desenvolvimento da proposta de método de normalização dos Sintagmas Nominais. O experimento foi composto de duas etapas. A primeira etapa possui 85 regras voltadas a minimizar os Sintagmas Nominais extensos, e a segunda etapa lida com critérios voltados a alterar a estrutura dos Sintagmas Nominais, aproximando-os de termos canônicos. Através desse experimento foi possível avaliar e determinar quais critérios seriam importantes para a normalização dos Sintagmas Nominais. Os resultados apresentados no experimento indicaram que as etapas 1 e 2 da proposta de normalização foram satisfatórias. Concluiu-se que a proposta de normalização conseguiu atingir seu objetivo, pois os Sintagmas Nominais foram normalizados preservando a sua estrutura e as palavras-chave.
id UFPE_0db1487e2451425711f9107a97e73840
oai_identifier_str oai:repositorio.ufpe.br:123456789/29996
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling CELERINO, Victor Galvãohttp://lattes.cnpq.br/1944469937324832http://lattes.cnpq.br/7536537827447217CORRÊA, Renato Fernandes2019-04-02T21:01:51Z2019-04-02T21:01:51Z2018-02-26https://repositorio.ufpe.br/handle/123456789/29996ark:/64986/0013000003655Atualmente vivenciamos um crescimento informacional extraordinário, entretanto esse crescimento é acompanhado de um grande problema: como organizar toda essa informação? No cenário da organização e recuperação da informação digital, tem se destacado a Indexação Automática através do uso dos Sintagmas Nominais. Diferente da indexação praticada através de palavras isoladas, os Sintagmas Nominais são unidades sintáticas que possuem semântica, ou seja, possuem um sentido específico. Nesse contexto, o presente trabalho tem como objetivo geral propor um método de normalização dos Sintagmas Nominais, extraídos automaticamente, em termos canônicos, para que sejam satisfatórios como descritores dos documentos. No contexto da indexação automática por sintagmas nominais, pesquisas indicaram que nem todos os Sintagmas Nominais podem ser considerados descritores. Portanto, esta pesquisa: investigou os processos ligados a indexação automática por Sintagmas Nominais; selecionou manualmente Sintagmas Nominais contendo palavras-chaves; minimizou Sintagmas Nominais extensos; alterou os Sintagmas Nominais para aproximar de termos descritores; comparou os Sintagmas Nominais normalizados com termos do TBCI; e avaliou o método proposto em um experimento de normalização dos Sintagmas Nominais. Para atingir os objetivos propostos para esta pesquisa, foram utilizados a pesquisa bibliográfica e pesquisa empírica, com a realização da proposição e avaliação de método de normalização por meio da aplicação de um experimento. Através da pesquisa bibliográfica foi possível identificar estudos realizados sobre a indexação automática através de Sintagmas Nominais, estudos esses que auxiliaram no desenvolvimento da proposta de método de normalização dos Sintagmas Nominais. O experimento foi composto de duas etapas. A primeira etapa possui 85 regras voltadas a minimizar os Sintagmas Nominais extensos, e a segunda etapa lida com critérios voltados a alterar a estrutura dos Sintagmas Nominais, aproximando-os de termos canônicos. Através desse experimento foi possível avaliar e determinar quais critérios seriam importantes para a normalização dos Sintagmas Nominais. Os resultados apresentados no experimento indicaram que as etapas 1 e 2 da proposta de normalização foram satisfatórias. Concluiu-se que a proposta de normalização conseguiu atingir seu objetivo, pois os Sintagmas Nominais foram normalizados preservando a sua estrutura e as palavras-chave.CAPESToday we are experiencing extraordinary informational growth, but this growth generates a major problem: how can we organize all this information? In the scenario of the organization and retrieval of digital information, Automatic Indexing with using of the Noun Phrases highlights. Unlike the indexation practiced with isolated words, the Noun Phrases are syntactic units that have semantics, that is, they have a specific meaning. In this context, the present work has as general objective to propose a method of normalization of the Noun Phrases extracted automatically in canonical terms, so that they are satisfactory as descriptors of the documents. In the context of automatic indexing by Noun phrases, researches indicate that not all Noun Phrases are descriptors. Therefore, this research: investigated the processes of automatic indexing by Noun Phrases; manually selected Noun Phrases containing the keywords; changed Noun Phrases to approximate descriptor terms; minimized extensive Noun Phrases; compared the normalized Noun Phrases with the TBCI terms; and evaluated the proposed method in a Noun Phrases normalization experiment. In order to reach the objectives proposed for this research, were used bibliographic research and empirical research, with the accomplishment of the proposition and evaluation of method of normalization through the application of an experiment. Through the bibliographic research, it was possible to identify studies carried out on automatic indexing through Noun Phrases, which have helped to develop the proposal of normalization of Noun Phrases. The experiment was composed of two steps. The first step has 85 rules aimed at minimizing the extended Noun Phrases, and the second step deals with criteria aimed at changing the structure of the Noun Phrases, bringing them closer to canonical terms. Through the experiment, it was possible to evaluate and determine which criteria would be important for the normalization of the Noun Phrases. The results presented in the experiment indicated that steps 1 and 2 of the normalization proposal were satisfactory. It concludes that the normalization proposal succeeded in achieving its objective, since the Noun Phrases normalized preserving their structure and the keywords.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da InformacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessIndexação automáticaSintagmas nominaisRecuperação de informaçãoNormalização de sintagmas nominaisProposta de normalização dos sintagmas nominais em termos para indexação automáticainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Victor Galvão Celerino.pdf.jpgDISSERTAÇÃO Victor Galvão Celerino.pdf.jpgGenerated Thumbnailimage/jpeg1187https://repositorio.ufpe.br/bitstream/123456789/29996/5/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf.jpgf72502d5b9bb646c5eafa5b07445c68eMD55ORIGINALDISSERTAÇÃO Victor Galvão Celerino.pdfDISSERTAÇÃO Victor Galvão Celerino.pdfapplication/pdf2288648https://repositorio.ufpe.br/bitstream/123456789/29996/1/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf30a6ee210bf81f25b423eed931377f0eMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/29996/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/29996/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDISSERTAÇÃO Victor Galvão Celerino.pdf.txtDISSERTAÇÃO Victor Galvão Celerino.pdf.txtExtracted texttext/plain359520https://repositorio.ufpe.br/bitstream/123456789/29996/4/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf.txt29a448a2bffaecc942203f033c57de23MD54123456789/299962019-10-26 01:35:48.27oai:repositorio.ufpe.br:123456789/29996TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-26T04:35:48Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Proposta de normalização dos sintagmas nominais em termos para indexação automática
title Proposta de normalização dos sintagmas nominais em termos para indexação automática
spellingShingle Proposta de normalização dos sintagmas nominais em termos para indexação automática
CELERINO, Victor Galvão
Indexação automática
Sintagmas nominais
Recuperação de informação
Normalização de sintagmas nominais
title_short Proposta de normalização dos sintagmas nominais em termos para indexação automática
title_full Proposta de normalização dos sintagmas nominais em termos para indexação automática
title_fullStr Proposta de normalização dos sintagmas nominais em termos para indexação automática
title_full_unstemmed Proposta de normalização dos sintagmas nominais em termos para indexação automática
title_sort Proposta de normalização dos sintagmas nominais em termos para indexação automática
author CELERINO, Victor Galvão
author_facet CELERINO, Victor Galvão
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1944469937324832
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7536537827447217
dc.contributor.author.fl_str_mv CELERINO, Victor Galvão
dc.contributor.advisor1.fl_str_mv CORRÊA, Renato Fernandes
contributor_str_mv CORRÊA, Renato Fernandes
dc.subject.por.fl_str_mv Indexação automática
Sintagmas nominais
Recuperação de informação
Normalização de sintagmas nominais
topic Indexação automática
Sintagmas nominais
Recuperação de informação
Normalização de sintagmas nominais
description Atualmente vivenciamos um crescimento informacional extraordinário, entretanto esse crescimento é acompanhado de um grande problema: como organizar toda essa informação? No cenário da organização e recuperação da informação digital, tem se destacado a Indexação Automática através do uso dos Sintagmas Nominais. Diferente da indexação praticada através de palavras isoladas, os Sintagmas Nominais são unidades sintáticas que possuem semântica, ou seja, possuem um sentido específico. Nesse contexto, o presente trabalho tem como objetivo geral propor um método de normalização dos Sintagmas Nominais, extraídos automaticamente, em termos canônicos, para que sejam satisfatórios como descritores dos documentos. No contexto da indexação automática por sintagmas nominais, pesquisas indicaram que nem todos os Sintagmas Nominais podem ser considerados descritores. Portanto, esta pesquisa: investigou os processos ligados a indexação automática por Sintagmas Nominais; selecionou manualmente Sintagmas Nominais contendo palavras-chaves; minimizou Sintagmas Nominais extensos; alterou os Sintagmas Nominais para aproximar de termos descritores; comparou os Sintagmas Nominais normalizados com termos do TBCI; e avaliou o método proposto em um experimento de normalização dos Sintagmas Nominais. Para atingir os objetivos propostos para esta pesquisa, foram utilizados a pesquisa bibliográfica e pesquisa empírica, com a realização da proposição e avaliação de método de normalização por meio da aplicação de um experimento. Através da pesquisa bibliográfica foi possível identificar estudos realizados sobre a indexação automática através de Sintagmas Nominais, estudos esses que auxiliaram no desenvolvimento da proposta de método de normalização dos Sintagmas Nominais. O experimento foi composto de duas etapas. A primeira etapa possui 85 regras voltadas a minimizar os Sintagmas Nominais extensos, e a segunda etapa lida com critérios voltados a alterar a estrutura dos Sintagmas Nominais, aproximando-os de termos canônicos. Através desse experimento foi possível avaliar e determinar quais critérios seriam importantes para a normalização dos Sintagmas Nominais. Os resultados apresentados no experimento indicaram que as etapas 1 e 2 da proposta de normalização foram satisfatórias. Concluiu-se que a proposta de normalização conseguiu atingir seu objetivo, pois os Sintagmas Nominais foram normalizados preservando a sua estrutura e as palavras-chave.
publishDate 2018
dc.date.issued.fl_str_mv 2018-02-26
dc.date.accessioned.fl_str_mv 2019-04-02T21:01:51Z
dc.date.available.fl_str_mv 2019-04-02T21:01:51Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/29996
dc.identifier.dark.fl_str_mv ark:/64986/0013000003655
url https://repositorio.ufpe.br/handle/123456789/29996
identifier_str_mv ark:/64986/0013000003655
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Informacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/29996/5/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/29996/1/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf
https://repositorio.ufpe.br/bitstream/123456789/29996/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/29996/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/29996/4/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf.txt
bitstream.checksum.fl_str_mv f72502d5b9bb646c5eafa5b07445c68e
30a6ee210bf81f25b423eed931377f0e
e39d27027a6cc9cb039ad269a5db8e34
4b8a02c7f2818eaf00dcf2260dd5eb08
29a448a2bffaecc942203f033c57de23
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172707667410944