Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação

Detalhes bibliográficos
Autor(a) principal: Acosta, Otavio Costa
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/134318
Resumo: A vasta utilização de Expressões Multipalavras em textos de linguagem natural requer atenção para um estudo aprofundado neste assunto, para que posteriormente seja possível a manipulação e o tratamento, de forma robusta, deste tipo de expressão. Uma Expressão Multipalavra costuma transmitir precisamente conceitos e ideias que geralmente não podem ser expressos por apenas uma palavra e estima-se que sua frequência, em um léxico de um falante nativo, seja semelhante à quantidade de palavras simples. A maioria das aplicações reais simplesmente ignora ou lista possíveis termos compostos, porém os identifica e trata seus itens lexicais individualmente e não como uma unidade de conceito. Para o sucesso de uma aplicação de Processamento de Linguagem Natural, que envolva processamento semântico, é necessário um tratamento diferenciado para essas expressões. Com o devido tratamento, é investigada a hipótese das Expressões Multipalavras possibilitarem uma melhora nos resultados de uma aplicação, tal como os sistemas de Recuperação de Informação. Os objetivos desse trabalho estão voltados ao estudo de técnicas de descoberta automática de Expressões Multipalavras, permitindo a criação de dicionários, para fins de indexação, em um mecanismo de Recuperação de Informação. Resultados experimentais apontaram melhorias na recuperação de documentos relevantes, ao identificar Expressões Multipalavras e tratá-las como uma unidade de indexação única.
id URGS_f71888ed13e0763eddcef1891c6ce94b
oai_identifier_str oai:www.lume.ufrgs.br:10183/134318
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Acosta, Otavio CostaVillavicencio, AlineMoreira, Viviane Pereira2016-03-29T02:06:23Z2011http://hdl.handle.net/10183/134318000988401A vasta utilização de Expressões Multipalavras em textos de linguagem natural requer atenção para um estudo aprofundado neste assunto, para que posteriormente seja possível a manipulação e o tratamento, de forma robusta, deste tipo de expressão. Uma Expressão Multipalavra costuma transmitir precisamente conceitos e ideias que geralmente não podem ser expressos por apenas uma palavra e estima-se que sua frequência, em um léxico de um falante nativo, seja semelhante à quantidade de palavras simples. A maioria das aplicações reais simplesmente ignora ou lista possíveis termos compostos, porém os identifica e trata seus itens lexicais individualmente e não como uma unidade de conceito. Para o sucesso de uma aplicação de Processamento de Linguagem Natural, que envolva processamento semântico, é necessário um tratamento diferenciado para essas expressões. Com o devido tratamento, é investigada a hipótese das Expressões Multipalavras possibilitarem uma melhora nos resultados de uma aplicação, tal como os sistemas de Recuperação de Informação. Os objetivos desse trabalho estão voltados ao estudo de técnicas de descoberta automática de Expressões Multipalavras, permitindo a criação de dicionários, para fins de indexação, em um mecanismo de Recuperação de Informação. Resultados experimentais apontaram melhorias na recuperação de documentos relevantes, ao identificar Expressões Multipalavras e tratá-las como uma unidade de indexação única.The use of Multiword Expressions (MWE) in natural language texts requires a detailed study, to further support in manipulating and processing, robustly, these kinds of expression. A MWE typically gives concepts and ideas that usually cannot be expressed by a single word and it is estimated that the number of MWEs in the lexicon of a native speaker is similar to the number of single words. Most real applications simply ignore them or create a list of compounds, treating and identifying them as isolated lexical items and not as an individual unit. For the success of a Natural Language Processing (NLP) application, involving semantic processing, adequate treatment for these expressions is required. In this work we investigate the hypothesis that an appropriate identification of Multiword Expressions provide better results in an application, such as Information Retrieval (IR). The objectives of this work are to compare techniques of MWE extraction for creating MWE dictionaries, to be used for indexing purposes in IR. Experimental results show qualitative improvements on the retrieval of relevant documents when identifying MWEs and treating them as a single indexing unit.application/pdfporProcessamento : Linguagem naturalProcessamento : PalavraNatural language processingMultiword expressionInformation retrievalIdentificação e tratamento de expressões multipalavras aplicado à recuperação de informaçãoIdentification and treatment of multiword expressions applied to information retrieval info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2011mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000988401.pdf000988401.pdfTexto completoapplication/pdf1537942http://www.lume.ufrgs.br/bitstream/10183/134318/1/000988401.pdfbd948fbd738ef3212f93ed72eacc8ae3MD51TEXT000988401.pdf.txt000988401.pdf.txtExtracted Texttext/plain117979http://www.lume.ufrgs.br/bitstream/10183/134318/2/000988401.pdf.txta7dec86c879d9c72a198ea791ca716faMD52THUMBNAIL000988401.pdf.jpg000988401.pdf.jpgGenerated Thumbnailimage/jpeg1127http://www.lume.ufrgs.br/bitstream/10183/134318/3/000988401.pdf.jpgbf295e11861534bf413f37d37617c0a0MD5310183/1343182018-10-29 08:11:23.488oai:www.lume.ufrgs.br:10183/134318Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-29T11:11:23Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
dc.title.alternative.en.fl_str_mv Identification and treatment of multiword expressions applied to information retrieval
title Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
spellingShingle Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
Acosta, Otavio Costa
Processamento : Linguagem natural
Processamento : Palavra
Natural language processing
Multiword expression
Information retrieval
title_short Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
title_full Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
title_fullStr Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
title_full_unstemmed Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
title_sort Identificação e tratamento de expressões multipalavras aplicado à recuperação de informação
author Acosta, Otavio Costa
author_facet Acosta, Otavio Costa
author_role author
dc.contributor.author.fl_str_mv Acosta, Otavio Costa
dc.contributor.advisor1.fl_str_mv Villavicencio, Aline
dc.contributor.advisor-co1.fl_str_mv Moreira, Viviane Pereira
contributor_str_mv Villavicencio, Aline
Moreira, Viviane Pereira
dc.subject.por.fl_str_mv Processamento : Linguagem natural
Processamento : Palavra
topic Processamento : Linguagem natural
Processamento : Palavra
Natural language processing
Multiword expression
Information retrieval
dc.subject.eng.fl_str_mv Natural language processing
Multiword expression
Information retrieval
description A vasta utilização de Expressões Multipalavras em textos de linguagem natural requer atenção para um estudo aprofundado neste assunto, para que posteriormente seja possível a manipulação e o tratamento, de forma robusta, deste tipo de expressão. Uma Expressão Multipalavra costuma transmitir precisamente conceitos e ideias que geralmente não podem ser expressos por apenas uma palavra e estima-se que sua frequência, em um léxico de um falante nativo, seja semelhante à quantidade de palavras simples. A maioria das aplicações reais simplesmente ignora ou lista possíveis termos compostos, porém os identifica e trata seus itens lexicais individualmente e não como uma unidade de conceito. Para o sucesso de uma aplicação de Processamento de Linguagem Natural, que envolva processamento semântico, é necessário um tratamento diferenciado para essas expressões. Com o devido tratamento, é investigada a hipótese das Expressões Multipalavras possibilitarem uma melhora nos resultados de uma aplicação, tal como os sistemas de Recuperação de Informação. Os objetivos desse trabalho estão voltados ao estudo de técnicas de descoberta automática de Expressões Multipalavras, permitindo a criação de dicionários, para fins de indexação, em um mecanismo de Recuperação de Informação. Resultados experimentais apontaram melhorias na recuperação de documentos relevantes, ao identificar Expressões Multipalavras e tratá-las como uma unidade de indexação única.
publishDate 2011
dc.date.issued.fl_str_mv 2011
dc.date.accessioned.fl_str_mv 2016-03-29T02:06:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/134318
dc.identifier.nrb.pt_BR.fl_str_mv 000988401
url http://hdl.handle.net/10183/134318
identifier_str_mv 000988401
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/134318/1/000988401.pdf
http://www.lume.ufrgs.br/bitstream/10183/134318/2/000988401.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/134318/3/000988401.pdf.jpg
bitstream.checksum.fl_str_mv bd948fbd738ef3212f93ed72eacc8ae3
a7dec86c879d9c72a198ea791ca716fa
bf295e11861534bf413f37d37617c0a0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309081136693248