Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/26506 |
Resumo: | Este trabalho propõe a utilização de algoritmos de mineração de regras de associação para a Recuperação de Informações Multilíngues. Esses algoritmos têm sido amplamente utilizados para analisar transações de registro de vendas. A ideia é mapear o problema de encontrar associações entre itens vendidos para o problema de encontrar termos equivalentes entre idiomas diferentes em um corpus paralelo. A proposta foi validada por meio de experimentos com diferentes idiomas, conjuntos de consultas e corpora. Os resultados mostram que a eficácia da abordagem proposta é comparável ao estado da arte, ao resultado monolíngue e à tradução automática de consultas, embora este utilize técnicas mais complexas de processamento de linguagem natural. Foi criado um protótipo que faz consultas à Web utilizando o método proposto. O sistema recebe palavras-chave em português, as traduz para o inglês e submete a consulta a diversos sites de busca. |
id |
URGS_0b27c47091ead4d9204e261713eebe88 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/26506 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Geraldo, André PintoMoreira, Viviane PereiraHeuser, Carlos Alberto2010-10-29T11:11:01Z2009http://hdl.handle.net/10183/26506000759666Este trabalho propõe a utilização de algoritmos de mineração de regras de associação para a Recuperação de Informações Multilíngues. Esses algoritmos têm sido amplamente utilizados para analisar transações de registro de vendas. A ideia é mapear o problema de encontrar associações entre itens vendidos para o problema de encontrar termos equivalentes entre idiomas diferentes em um corpus paralelo. A proposta foi validada por meio de experimentos com diferentes idiomas, conjuntos de consultas e corpora. Os resultados mostram que a eficácia da abordagem proposta é comparável ao estado da arte, ao resultado monolíngue e à tradução automática de consultas, embora este utilize técnicas mais complexas de processamento de linguagem natural. Foi criado um protótipo que faz consultas à Web utilizando o método proposto. O sistema recebe palavras-chave em português, as traduz para o inglês e submete a consulta a diversos sites de busca.This work proposes the use of algorithms for mining association rules as an approach for Cross-Language Information Retrieval. These algorithms have been widely used to analyze market basket data. The idea is to map the problem of finding associations between sales items to the problem of finding term translations over a parallel corpus. The proposal was validated by means of experiments using different languages, queries and corpora. The results show that the performance of our proposed approach is comparable to the performance of the monolingual baseline and to query translation via machine translation, even though these systems employ more complex Natural Language Processing techniques. A prototype for cross-language web querying was implemented to test the proposed method. The system accepts keywords in Portuguese, translates them into English and submits the query to several web-sites that provide search functionalities.application/pdfporRecuperacao : InformacaoBanco : DadosMineracao : DadosInformation retrievalCross-language information retrievalAssociation rulesAplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues.Cross-language information retrieval using algorithms for mining association rules info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2009mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000759666.pdf000759666.pdfTexto completoapplication/pdf1213449http://www.lume.ufrgs.br/bitstream/10183/26506/1/000759666.pdf69017049f766f1fc58252cd285128f5bMD51TEXT000759666.pdf.txt000759666.pdf.txtExtracted Texttext/plain177209http://www.lume.ufrgs.br/bitstream/10183/26506/2/000759666.pdf.txt5407b43b63fed5c06c8ae3f71eebbea8MD52THUMBNAIL000759666.pdf.jpg000759666.pdf.jpgGenerated Thumbnailimage/jpeg1289http://www.lume.ufrgs.br/bitstream/10183/26506/3/000759666.pdf.jpg0af472d7d53a2bd7df1bc1f722da3c99MD5310183/265062018-10-18 07:38:29.476oai:www.lume.ufrgs.br:10183/26506Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-18T10:38:29Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues. |
dc.title.alternative.en.fl_str_mv |
Cross-language information retrieval using algorithms for mining association rules |
title |
Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues. |
spellingShingle |
Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues. Geraldo, André Pinto Recuperacao : Informacao Banco : Dados Mineracao : Dados Information retrieval Cross-language information retrieval Association rules |
title_short |
Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues. |
title_full |
Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues. |
title_fullStr |
Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues. |
title_full_unstemmed |
Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues. |
title_sort |
Aplicando algoritmos de mineração de regras de associação para recuperação de informações multilíngues. |
author |
Geraldo, André Pinto |
author_facet |
Geraldo, André Pinto |
author_role |
author |
dc.contributor.author.fl_str_mv |
Geraldo, André Pinto |
dc.contributor.advisor1.fl_str_mv |
Moreira, Viviane Pereira |
dc.contributor.advisor-co1.fl_str_mv |
Heuser, Carlos Alberto |
contributor_str_mv |
Moreira, Viviane Pereira Heuser, Carlos Alberto |
dc.subject.por.fl_str_mv |
Recuperacao : Informacao Banco : Dados Mineracao : Dados |
topic |
Recuperacao : Informacao Banco : Dados Mineracao : Dados Information retrieval Cross-language information retrieval Association rules |
dc.subject.eng.fl_str_mv |
Information retrieval Cross-language information retrieval Association rules |
description |
Este trabalho propõe a utilização de algoritmos de mineração de regras de associação para a Recuperação de Informações Multilíngues. Esses algoritmos têm sido amplamente utilizados para analisar transações de registro de vendas. A ideia é mapear o problema de encontrar associações entre itens vendidos para o problema de encontrar termos equivalentes entre idiomas diferentes em um corpus paralelo. A proposta foi validada por meio de experimentos com diferentes idiomas, conjuntos de consultas e corpora. Os resultados mostram que a eficácia da abordagem proposta é comparável ao estado da arte, ao resultado monolíngue e à tradução automática de consultas, embora este utilize técnicas mais complexas de processamento de linguagem natural. Foi criado um protótipo que faz consultas à Web utilizando o método proposto. O sistema recebe palavras-chave em português, as traduz para o inglês e submete a consulta a diversos sites de busca. |
publishDate |
2009 |
dc.date.issued.fl_str_mv |
2009 |
dc.date.accessioned.fl_str_mv |
2010-10-29T11:11:01Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/26506 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000759666 |
url |
http://hdl.handle.net/10183/26506 |
identifier_str_mv |
000759666 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/26506/1/000759666.pdf http://www.lume.ufrgs.br/bitstream/10183/26506/2/000759666.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/26506/3/000759666.pdf.jpg |
bitstream.checksum.fl_str_mv |
69017049f766f1fc58252cd285128f5b 5407b43b63fed5c06c8ae3f71eebbea8 0af472d7d53a2bd7df1bc1f722da3c99 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1800308995923116032 |