Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/134318 |
Resumo: | A vasta utilização de Expressões Multipalavras em textos de linguagem natural requer atenção para um estudo aprofundado neste assunto, para que posteriormente seja possível a manipulação e o tratamento, de forma robusta, deste tipo de expressão. Uma Expressão Multipalavra costuma transmitir precisamente conceitos e ideias que geralmente não podem ser expressos por apenas uma palavra e estima-se que sua frequência, em um léxico de um falante nativo, seja semelhante à quantidade de palavras simples. A maioria das aplicações reais simplesmente ignora ou lista possíveis termos compostos, porém os identifica e trata seus itens lexicais individualmente e não como uma unidade de conceito. Para o sucesso de uma aplicação de Processamento de Linguagem Natural, que envolva processamento semântico, é necessário um tratamento diferenciado para essas expressões. Com o devido tratamento, é investigada a hipótese das Expressões Multipalavras possibilitarem uma melhora nos resultados de uma aplicação, tal como os sistemas de Recuperação de Informação. Os objetivos desse trabalho estão voltados ao estudo de técnicas de descoberta automática de Expressões Multipalavras, permitindo a criação de dicionários, para fins de indexação, em um mecanismo de Recuperação de Informação. Resultados experimentais apontaram melhorias na recuperação de documentos relevantes, ao identificar Expressões Multipalavras e tratá-las como uma unidade de indexação única. |
id |
URGS_f71888ed13e0763eddcef1891c6ce94b |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/134318 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Acosta, Otavio CostaVillavicencio, AlineMoreira, Viviane Pereira2016-03-29T02:06:23Z2011http://hdl.handle.net/10183/134318000988401A vasta utilização de Expressões Multipalavras em textos de linguagem natural requer atenção para um estudo aprofundado neste assunto, para que posteriormente seja possível a manipulação e o tratamento, de forma robusta, deste tipo de expressão. Uma Expressão Multipalavra costuma transmitir precisamente conceitos e ideias que geralmente não podem ser expressos por apenas uma palavra e estima-se que sua frequência, em um léxico de um falante nativo, seja semelhante à quantidade de palavras simples. A maioria das aplicações reais simplesmente ignora ou lista possíveis termos compostos, porém os identifica e trata seus itens lexicais individualmente e não como uma unidade de conceito. Para o sucesso de uma aplicação de Processamento de Linguagem Natural, que envolva processamento semântico, é necessário um tratamento diferenciado para essas expressões. Com o devido tratamento, é investigada a hipótese das Expressões Multipalavras possibilitarem uma melhora nos resultados de uma aplicação, tal como os sistemas de Recuperação de Informação. Os objetivos desse trabalho estão voltados ao estudo de técnicas de descoberta automática de Expressões Multipalavras, permitindo a criação de dicionários, para fins de indexação, em um mecanismo de Recuperação de Informação. Resultados experimentais apontaram melhorias na recuperação de documentos relevantes, ao identificar Expressões Multipalavras e tratá-las como uma unidade de indexação única.The use of Multiword Expressions (MWE) in natural language texts requires a detailed study, to further support in manipulating and processing, robustly, these kinds of expression. A MWE typically gives concepts and ideas that usually cannot be expressed by a single word and it is estimated that the number of MWEs in the lexicon of a native speaker is similar to the number of single words. Most real applications simply ignore them or create a list of compounds, treating and identifying them as isolated lexical items and not as an individual unit. For the success of a Natural Language Processing (NLP) application, involving semantic processing, adequate treatment for these expressions is required. In this work we investigate the hypothesis that an appropriate identification of Multiword Expressions provide better results in an application, such as Information Retrieval (IR). The objectives of this work are to compare techniques of MWE extraction for creating MWE dictionaries, to be used for indexing purposes in IR. Experimental results show qualitative improvements on the retrieval of relevant documents when identifying MWEs and treating them as a single indexing unit.application/pdfporProcessamento : Linguagem naturalProcessamento : PalavraNatural language processingMultiword expressionInformation retrievalIdentificação e tratamento de expressões multipalavras aplicado à recuperação de informaçãoIdentification and treatment of multiword expressions applied to information retrieval info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2011mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000988401.pdf000988401.pdfTexto completoapplication/pdf1537942http://www.lume.ufrgs.br/bitstream/10183/134318/1/000988401.pdfbd948fbd738ef3212f93ed72eacc8ae3MD51TEXT000988401.pdf.txt000988401.pdf.txtExtracted Texttext/plain117979http://www.lume.ufrgs.br/bitstream/10183/134318/2/000988401.pdf.txta7dec86c879d9c72a198ea791ca716faMD52THUMBNAIL000988401.pdf.jpg000988401.pdf.jpgGenerated Thumbnailimage/jpeg1127http://www.lume.ufrgs.br/bitstream/10183/134318/3/000988401.pdf.jpgbf295e11861534bf413f37d37617c0a0MD5310183/1343182018-10-29 08:11:23.488oai:www.lume.ufrgs.br:10183/134318Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-29T11:11:23Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação |
dc.title.alternative.en.fl_str_mv |
Identification and treatment of multiword expressions applied to information retrieval |
title |
Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação |
spellingShingle |
Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação Acosta, Otavio Costa Processamento : Linguagem natural Processamento : Palavra Natural language processing Multiword expression Information retrieval |
title_short |
Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação |
title_full |
Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação |
title_fullStr |
Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação |
title_full_unstemmed |
Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação |
title_sort |
Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação |
author |
Acosta, Otavio Costa |
author_facet |
Acosta, Otavio Costa |
author_role |
author |
dc.contributor.author.fl_str_mv |
Acosta, Otavio Costa |
dc.contributor.advisor1.fl_str_mv |
Villavicencio, Aline |
dc.contributor.advisor-co1.fl_str_mv |
Moreira, Viviane Pereira |
contributor_str_mv |
Villavicencio, Aline Moreira, Viviane Pereira |
dc.subject.por.fl_str_mv |
Processamento : Linguagem natural Processamento : Palavra |
topic |
Processamento : Linguagem natural Processamento : Palavra Natural language processing Multiword expression Information retrieval |
dc.subject.eng.fl_str_mv |
Natural language processing Multiword expression Information retrieval |
description |
A vasta utilização de Expressões Multipalavras em textos de linguagem natural requer atenção para um estudo aprofundado neste assunto, para que posteriormente seja possível a manipulação e o tratamento, de forma robusta, deste tipo de expressão. Uma Expressão Multipalavra costuma transmitir precisamente conceitos e ideias que geralmente não podem ser expressos por apenas uma palavra e estima-se que sua frequência, em um léxico de um falante nativo, seja semelhante à quantidade de palavras simples. A maioria das aplicações reais simplesmente ignora ou lista possíveis termos compostos, porém os identifica e trata seus itens lexicais individualmente e não como uma unidade de conceito. Para o sucesso de uma aplicação de Processamento de Linguagem Natural, que envolva processamento semântico, é necessário um tratamento diferenciado para essas expressões. Com o devido tratamento, é investigada a hipótese das Expressões Multipalavras possibilitarem uma melhora nos resultados de uma aplicação, tal como os sistemas de Recuperação de Informação. Os objetivos desse trabalho estão voltados ao estudo de técnicas de descoberta automática de Expressões Multipalavras, permitindo a criação de dicionários, para fins de indexação, em um mecanismo de Recuperação de Informação. Resultados experimentais apontaram melhorias na recuperação de documentos relevantes, ao identificar Expressões Multipalavras e tratá-las como uma unidade de indexação única. |
publishDate |
2011 |
dc.date.issued.fl_str_mv |
2011 |
dc.date.accessioned.fl_str_mv |
2016-03-29T02:06:23Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/134318 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000988401 |
url |
http://hdl.handle.net/10183/134318 |
identifier_str_mv |
000988401 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/134318/1/000988401.pdf http://www.lume.ufrgs.br/bitstream/10183/134318/2/000988401.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/134318/3/000988401.pdf.jpg |
bitstream.checksum.fl_str_mv |
bd948fbd738ef3212f93ed72eacc8ae3 a7dec86c879d9c72a198ea791ca716fa bf295e11861534bf413f37d37617c0a0 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1800309081136693248 |