Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/18528 |
Resumo: | A Tradução Automática (TA) é uma das aplicações mais clássicas do Processamento da Língua Natural (PLN). As pesquisas nessa área geraram uma série de ferramentas e sistemas usados largamente hoje em dia. No entanto, na maior parte das aplicações, as traduções geradas por esses sistemas não são da qualidade exigida, sendo necessário um processo posterior de revisão. Uma das formas de melhorar os sistemas de TA é utilizar recursos linguísticos, como dicionários e ontologias. A idéia deste trabalho é aprimorar um sistema existente adicionando um dicionário de Expressões Multipalavras (EMPs), um fenômeno linguístico de grande importância para aplicações de PLN. Neste trabalho foi proposta uma abordagem para o tratamento de EMPs em um sistema de Tradução Automática, o Apertium, através da representação adequada das mesmas. O impacto causado pela adoção desta abordagem foi avaliado no contexto de TA com o par de línguas Inglês-Espanhol. |
id |
UFRGS-2_008e90c48c78203e1413aba00d9b76d2 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/18528 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Beck, Daniel EmilioVillavicencio, Aline2010-02-19T04:14:42Z2009http://hdl.handle.net/10183/18528000730572A Tradução Automática (TA) é uma das aplicações mais clássicas do Processamento da Língua Natural (PLN). As pesquisas nessa área geraram uma série de ferramentas e sistemas usados largamente hoje em dia. No entanto, na maior parte das aplicações, as traduções geradas por esses sistemas não são da qualidade exigida, sendo necessário um processo posterior de revisão. Uma das formas de melhorar os sistemas de TA é utilizar recursos linguísticos, como dicionários e ontologias. A idéia deste trabalho é aprimorar um sistema existente adicionando um dicionário de Expressões Multipalavras (EMPs), um fenômeno linguístico de grande importância para aplicações de PLN. Neste trabalho foi proposta uma abordagem para o tratamento de EMPs em um sistema de Tradução Automática, o Apertium, através da representação adequada das mesmas. O impacto causado pela adoção desta abordagem foi avaliado no contexto de TA com o par de línguas Inglês-Espanhol.Machine Translation (MT) is one of the most classic Natural Language Processing (NLP) applications. Research in this area generated a series of tools and systems widely used today. However, in most applications, the translations generated by these systems do not have the demanded quality, requiring a subsequent review process. One way to improve MT systems is to use linguistic resources, such as dictionaries and ontologies. The idea of this work is to improve an existing system by adding a dictionary of Multiword Expressions (MWEs), a linguistic phenomenon of great importance for NLP applications. In this work, we propose an approach for the EMPs treatment in a Machine Translation system, Apertium, through appropriate representation of the same. The impact caused by the adoption of this approach was evaluated in the MT context with the language pair English-Spanish.application/pdfporLinguagem naturalLinguística computacionalNatural language processingComputational linguisticsMultiword expressionsMachine translationAprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regrasImproving the multiword expression treatment in a rule-based machine translator info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2009Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000730572.pdf.txt000730572.pdf.txtExtracted Texttext/plain79605http://www.lume.ufrgs.br/bitstream/10183/18528/2/000730572.pdf.txtb74c37ff09ef20d45b6c0a895d3aacc9MD52ORIGINAL000730572.pdf000730572.pdfTexto completoapplication/pdf382857http://www.lume.ufrgs.br/bitstream/10183/18528/1/000730572.pdf154f5bf513a2c4b1ff3412cb07c38cc1MD51THUMBNAIL000730572.pdf.jpg000730572.pdf.jpgGenerated Thumbnailimage/jpeg1019http://www.lume.ufrgs.br/bitstream/10183/18528/3/000730572.pdf.jpg25e1813bee7bea9340d5b5e5f53cda2dMD5310183/185282018-10-17 08:44:43.147oai:www.lume.ufrgs.br:10183/18528Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-17T11:44:43Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras |
dc.title.alternative.en.fl_str_mv |
Improving the multiword expression treatment in a rule-based machine translator |
title |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras |
spellingShingle |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras Beck, Daniel Emilio Linguagem natural Linguística computacional Natural language processing Computational linguistics Multiword expressions Machine translation |
title_short |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras |
title_full |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras |
title_fullStr |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras |
title_full_unstemmed |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras |
title_sort |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras |
author |
Beck, Daniel Emilio |
author_facet |
Beck, Daniel Emilio |
author_role |
author |
dc.contributor.author.fl_str_mv |
Beck, Daniel Emilio |
dc.contributor.advisor1.fl_str_mv |
Villavicencio, Aline |
contributor_str_mv |
Villavicencio, Aline |
dc.subject.por.fl_str_mv |
Linguagem natural Linguística computacional |
topic |
Linguagem natural Linguística computacional Natural language processing Computational linguistics Multiword expressions Machine translation |
dc.subject.eng.fl_str_mv |
Natural language processing Computational linguistics Multiword expressions Machine translation |
description |
A Tradução Automática (TA) é uma das aplicações mais clássicas do Processamento da Língua Natural (PLN). As pesquisas nessa área geraram uma série de ferramentas e sistemas usados largamente hoje em dia. No entanto, na maior parte das aplicações, as traduções geradas por esses sistemas não são da qualidade exigida, sendo necessário um processo posterior de revisão. Uma das formas de melhorar os sistemas de TA é utilizar recursos linguísticos, como dicionários e ontologias. A idéia deste trabalho é aprimorar um sistema existente adicionando um dicionário de Expressões Multipalavras (EMPs), um fenômeno linguístico de grande importância para aplicações de PLN. Neste trabalho foi proposta uma abordagem para o tratamento de EMPs em um sistema de Tradução Automática, o Apertium, através da representação adequada das mesmas. O impacto causado pela adoção desta abordagem foi avaliado no contexto de TA com o par de línguas Inglês-Espanhol. |
publishDate |
2009 |
dc.date.issued.fl_str_mv |
2009 |
dc.date.accessioned.fl_str_mv |
2010-02-19T04:14:42Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/18528 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000730572 |
url |
http://hdl.handle.net/10183/18528 |
identifier_str_mv |
000730572 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/18528/2/000730572.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/18528/1/000730572.pdf http://www.lume.ufrgs.br/bitstream/10183/18528/3/000730572.pdf.jpg |
bitstream.checksum.fl_str_mv |
b74c37ff09ef20d45b6c0a895d3aacc9 154f5bf513a2c4b1ff3412cb07c38cc1 25e1813bee7bea9340d5b5e5f53cda2d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224390019383296 |