Proposta de normalização dos sintagmas nominais em termos para indexação automática
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/0013000003655 |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/29996 |
Resumo: | Atualmente vivenciamos um crescimento informacional extraordinário, entretanto esse crescimento é acompanhado de um grande problema: como organizar toda essa informação? No cenário da organização e recuperação da informação digital, tem se destacado a Indexação Automática através do uso dos Sintagmas Nominais. Diferente da indexação praticada através de palavras isoladas, os Sintagmas Nominais são unidades sintáticas que possuem semântica, ou seja, possuem um sentido específico. Nesse contexto, o presente trabalho tem como objetivo geral propor um método de normalização dos Sintagmas Nominais, extraídos automaticamente, em termos canônicos, para que sejam satisfatórios como descritores dos documentos. No contexto da indexação automática por sintagmas nominais, pesquisas indicaram que nem todos os Sintagmas Nominais podem ser considerados descritores. Portanto, esta pesquisa: investigou os processos ligados a indexação automática por Sintagmas Nominais; selecionou manualmente Sintagmas Nominais contendo palavras-chaves; minimizou Sintagmas Nominais extensos; alterou os Sintagmas Nominais para aproximar de termos descritores; comparou os Sintagmas Nominais normalizados com termos do TBCI; e avaliou o método proposto em um experimento de normalização dos Sintagmas Nominais. Para atingir os objetivos propostos para esta pesquisa, foram utilizados a pesquisa bibliográfica e pesquisa empírica, com a realização da proposição e avaliação de método de normalização por meio da aplicação de um experimento. Através da pesquisa bibliográfica foi possível identificar estudos realizados sobre a indexação automática através de Sintagmas Nominais, estudos esses que auxiliaram no desenvolvimento da proposta de método de normalização dos Sintagmas Nominais. O experimento foi composto de duas etapas. A primeira etapa possui 85 regras voltadas a minimizar os Sintagmas Nominais extensos, e a segunda etapa lida com critérios voltados a alterar a estrutura dos Sintagmas Nominais, aproximando-os de termos canônicos. Através desse experimento foi possível avaliar e determinar quais critérios seriam importantes para a normalização dos Sintagmas Nominais. Os resultados apresentados no experimento indicaram que as etapas 1 e 2 da proposta de normalização foram satisfatórias. Concluiu-se que a proposta de normalização conseguiu atingir seu objetivo, pois os Sintagmas Nominais foram normalizados preservando a sua estrutura e as palavras-chave. |
id |
UFPE_0db1487e2451425711f9107a97e73840 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/29996 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
CELERINO, Victor Galvãohttp://lattes.cnpq.br/1944469937324832http://lattes.cnpq.br/7536537827447217CORRÊA, Renato Fernandes2019-04-02T21:01:51Z2019-04-02T21:01:51Z2018-02-26https://repositorio.ufpe.br/handle/123456789/29996ark:/64986/0013000003655Atualmente vivenciamos um crescimento informacional extraordinário, entretanto esse crescimento é acompanhado de um grande problema: como organizar toda essa informação? No cenário da organização e recuperação da informação digital, tem se destacado a Indexação Automática através do uso dos Sintagmas Nominais. Diferente da indexação praticada através de palavras isoladas, os Sintagmas Nominais são unidades sintáticas que possuem semântica, ou seja, possuem um sentido específico. Nesse contexto, o presente trabalho tem como objetivo geral propor um método de normalização dos Sintagmas Nominais, extraídos automaticamente, em termos canônicos, para que sejam satisfatórios como descritores dos documentos. No contexto da indexação automática por sintagmas nominais, pesquisas indicaram que nem todos os Sintagmas Nominais podem ser considerados descritores. Portanto, esta pesquisa: investigou os processos ligados a indexação automática por Sintagmas Nominais; selecionou manualmente Sintagmas Nominais contendo palavras-chaves; minimizou Sintagmas Nominais extensos; alterou os Sintagmas Nominais para aproximar de termos descritores; comparou os Sintagmas Nominais normalizados com termos do TBCI; e avaliou o método proposto em um experimento de normalização dos Sintagmas Nominais. Para atingir os objetivos propostos para esta pesquisa, foram utilizados a pesquisa bibliográfica e pesquisa empírica, com a realização da proposição e avaliação de método de normalização por meio da aplicação de um experimento. Através da pesquisa bibliográfica foi possível identificar estudos realizados sobre a indexação automática através de Sintagmas Nominais, estudos esses que auxiliaram no desenvolvimento da proposta de método de normalização dos Sintagmas Nominais. O experimento foi composto de duas etapas. A primeira etapa possui 85 regras voltadas a minimizar os Sintagmas Nominais extensos, e a segunda etapa lida com critérios voltados a alterar a estrutura dos Sintagmas Nominais, aproximando-os de termos canônicos. Através desse experimento foi possível avaliar e determinar quais critérios seriam importantes para a normalização dos Sintagmas Nominais. Os resultados apresentados no experimento indicaram que as etapas 1 e 2 da proposta de normalização foram satisfatórias. Concluiu-se que a proposta de normalização conseguiu atingir seu objetivo, pois os Sintagmas Nominais foram normalizados preservando a sua estrutura e as palavras-chave.CAPESToday we are experiencing extraordinary informational growth, but this growth generates a major problem: how can we organize all this information? In the scenario of the organization and retrieval of digital information, Automatic Indexing with using of the Noun Phrases highlights. Unlike the indexation practiced with isolated words, the Noun Phrases are syntactic units that have semantics, that is, they have a specific meaning. In this context, the present work has as general objective to propose a method of normalization of the Noun Phrases extracted automatically in canonical terms, so that they are satisfactory as descriptors of the documents. In the context of automatic indexing by Noun phrases, researches indicate that not all Noun Phrases are descriptors. Therefore, this research: investigated the processes of automatic indexing by Noun Phrases; manually selected Noun Phrases containing the keywords; changed Noun Phrases to approximate descriptor terms; minimized extensive Noun Phrases; compared the normalized Noun Phrases with the TBCI terms; and evaluated the proposed method in a Noun Phrases normalization experiment. In order to reach the objectives proposed for this research, were used bibliographic research and empirical research, with the accomplishment of the proposition and evaluation of method of normalization through the application of an experiment. Through the bibliographic research, it was possible to identify studies carried out on automatic indexing through Noun Phrases, which have helped to develop the proposal of normalization of Noun Phrases. The experiment was composed of two steps. The first step has 85 rules aimed at minimizing the extended Noun Phrases, and the second step deals with criteria aimed at changing the structure of the Noun Phrases, bringing them closer to canonical terms. Through the experiment, it was possible to evaluate and determine which criteria would be important for the normalization of the Noun Phrases. The results presented in the experiment indicated that steps 1 and 2 of the normalization proposal were satisfactory. It concludes that the normalization proposal succeeded in achieving its objective, since the Noun Phrases normalized preserving their structure and the keywords.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da InformacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessIndexação automáticaSintagmas nominaisRecuperação de informaçãoNormalização de sintagmas nominaisProposta de normalização dos sintagmas nominais em termos para indexação automáticainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Victor Galvão Celerino.pdf.jpgDISSERTAÇÃO Victor Galvão Celerino.pdf.jpgGenerated Thumbnailimage/jpeg1187https://repositorio.ufpe.br/bitstream/123456789/29996/5/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf.jpgf72502d5b9bb646c5eafa5b07445c68eMD55ORIGINALDISSERTAÇÃO Victor Galvão Celerino.pdfDISSERTAÇÃO Victor Galvão Celerino.pdfapplication/pdf2288648https://repositorio.ufpe.br/bitstream/123456789/29996/1/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf30a6ee210bf81f25b423eed931377f0eMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/29996/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/29996/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDISSERTAÇÃO Victor Galvão Celerino.pdf.txtDISSERTAÇÃO Victor Galvão Celerino.pdf.txtExtracted texttext/plain359520https://repositorio.ufpe.br/bitstream/123456789/29996/4/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf.txt29a448a2bffaecc942203f033c57de23MD54123456789/299962019-10-26 01:35:48.27oai:repositorio.ufpe.br:123456789/29996TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-26T04:35:48Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Proposta de normalização dos sintagmas nominais em termos para indexação automática |
title |
Proposta de normalização dos sintagmas nominais em termos para indexação automática |
spellingShingle |
Proposta de normalização dos sintagmas nominais em termos para indexação automática CELERINO, Victor Galvão Indexação automática Sintagmas nominais Recuperação de informação Normalização de sintagmas nominais |
title_short |
Proposta de normalização dos sintagmas nominais em termos para indexação automática |
title_full |
Proposta de normalização dos sintagmas nominais em termos para indexação automática |
title_fullStr |
Proposta de normalização dos sintagmas nominais em termos para indexação automática |
title_full_unstemmed |
Proposta de normalização dos sintagmas nominais em termos para indexação automática |
title_sort |
Proposta de normalização dos sintagmas nominais em termos para indexação automática |
author |
CELERINO, Victor Galvão |
author_facet |
CELERINO, Victor Galvão |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1944469937324832 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7536537827447217 |
dc.contributor.author.fl_str_mv |
CELERINO, Victor Galvão |
dc.contributor.advisor1.fl_str_mv |
CORRÊA, Renato Fernandes |
contributor_str_mv |
CORRÊA, Renato Fernandes |
dc.subject.por.fl_str_mv |
Indexação automática Sintagmas nominais Recuperação de informação Normalização de sintagmas nominais |
topic |
Indexação automática Sintagmas nominais Recuperação de informação Normalização de sintagmas nominais |
description |
Atualmente vivenciamos um crescimento informacional extraordinário, entretanto esse crescimento é acompanhado de um grande problema: como organizar toda essa informação? No cenário da organização e recuperação da informação digital, tem se destacado a Indexação Automática através do uso dos Sintagmas Nominais. Diferente da indexação praticada através de palavras isoladas, os Sintagmas Nominais são unidades sintáticas que possuem semântica, ou seja, possuem um sentido específico. Nesse contexto, o presente trabalho tem como objetivo geral propor um método de normalização dos Sintagmas Nominais, extraídos automaticamente, em termos canônicos, para que sejam satisfatórios como descritores dos documentos. No contexto da indexação automática por sintagmas nominais, pesquisas indicaram que nem todos os Sintagmas Nominais podem ser considerados descritores. Portanto, esta pesquisa: investigou os processos ligados a indexação automática por Sintagmas Nominais; selecionou manualmente Sintagmas Nominais contendo palavras-chaves; minimizou Sintagmas Nominais extensos; alterou os Sintagmas Nominais para aproximar de termos descritores; comparou os Sintagmas Nominais normalizados com termos do TBCI; e avaliou o método proposto em um experimento de normalização dos Sintagmas Nominais. Para atingir os objetivos propostos para esta pesquisa, foram utilizados a pesquisa bibliográfica e pesquisa empírica, com a realização da proposição e avaliação de método de normalização por meio da aplicação de um experimento. Através da pesquisa bibliográfica foi possível identificar estudos realizados sobre a indexação automática através de Sintagmas Nominais, estudos esses que auxiliaram no desenvolvimento da proposta de método de normalização dos Sintagmas Nominais. O experimento foi composto de duas etapas. A primeira etapa possui 85 regras voltadas a minimizar os Sintagmas Nominais extensos, e a segunda etapa lida com critérios voltados a alterar a estrutura dos Sintagmas Nominais, aproximando-os de termos canônicos. Através desse experimento foi possível avaliar e determinar quais critérios seriam importantes para a normalização dos Sintagmas Nominais. Os resultados apresentados no experimento indicaram que as etapas 1 e 2 da proposta de normalização foram satisfatórias. Concluiu-se que a proposta de normalização conseguiu atingir seu objetivo, pois os Sintagmas Nominais foram normalizados preservando a sua estrutura e as palavras-chave. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-02-26 |
dc.date.accessioned.fl_str_mv |
2019-04-02T21:01:51Z |
dc.date.available.fl_str_mv |
2019-04-02T21:01:51Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/29996 |
dc.identifier.dark.fl_str_mv |
ark:/64986/0013000003655 |
url |
https://repositorio.ufpe.br/handle/123456789/29996 |
identifier_str_mv |
ark:/64986/0013000003655 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Informacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/29996/5/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/29996/1/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf https://repositorio.ufpe.br/bitstream/123456789/29996/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/29996/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/29996/4/DISSERTA%c3%87%c3%83O%20Victor%20Galv%c3%a3o%20Celerino.pdf.txt |
bitstream.checksum.fl_str_mv |
f72502d5b9bb646c5eafa5b07445c68e 30a6ee210bf81f25b423eed931377f0e e39d27027a6cc9cb039ad269a5db8e34 4b8a02c7f2818eaf00dcf2260dd5eb08 29a448a2bffaecc942203f033c57de23 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172707667410944 |