Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/40807 |
Resumo: | A presente dissertação teve como base a análise de dados obtidos a partir de um estágio realizado na start-up Unbabel e trata da tradução de combinatórias lexicais de inglês para português do Brasil na área de tradução automática e subsequente pós-edição. As combinatórias lexicais são expressões complexas que, por suas propriedades, causam problemas de tradução especiais, sobretudo para a tradução automática que, como toda área tecnológica, está em constante desenvolvimento. Presentes em todos tipos de comunicação e em todas línguas, tanto na língua comum quanto na linguagem especializada, estas expressões são realmente relevantes e o seu estudo indispensável. A pesquisa analisou um corpus proveniente do processo de anotação da empresa. Observamos as combinatórias lexicais tanto em relação à anotação dos erros, quanto à identificação das origens dos mesmos. Os resultados mais significantes demonstraram a necessidade de incluir um tipo de erros para as combinatórias lexicais na taxonomia da empresa, bem como critérios de anotação para tais. A análise também apontou para a falha na deteção de variedades linguísticas em relação às combinatórias lexicais. Desta forma, também criamos um glossário de combinatórias lexicais que, além de conter as soluções encontradas para o português do Brasil, inclui os diferentes equivalentes para português europeu, contribuindo também para a distinção entre as duas variedades linguísticas em relação a estas expressões, uma vez que os estudos comparativos entre ambas tendem a tratar fundamentalmente das diferenças gramaticais. |
id |
RCAP_f7c955b1b9a226e270d7857419206512 |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/40807 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automáticaLíngua inglesa - Tradução para portuguêsLíngua portuguesa - FraseologiaLíngua portuguesa - TraduçãoLíngua portuguesa - BrasilTradução automáticaTeses de mestrado - 2019Domínio/Área Científica::Humanidades::Línguas e LiteraturasA presente dissertação teve como base a análise de dados obtidos a partir de um estágio realizado na start-up Unbabel e trata da tradução de combinatórias lexicais de inglês para português do Brasil na área de tradução automática e subsequente pós-edição. As combinatórias lexicais são expressões complexas que, por suas propriedades, causam problemas de tradução especiais, sobretudo para a tradução automática que, como toda área tecnológica, está em constante desenvolvimento. Presentes em todos tipos de comunicação e em todas línguas, tanto na língua comum quanto na linguagem especializada, estas expressões são realmente relevantes e o seu estudo indispensável. A pesquisa analisou um corpus proveniente do processo de anotação da empresa. Observamos as combinatórias lexicais tanto em relação à anotação dos erros, quanto à identificação das origens dos mesmos. Os resultados mais significantes demonstraram a necessidade de incluir um tipo de erros para as combinatórias lexicais na taxonomia da empresa, bem como critérios de anotação para tais. A análise também apontou para a falha na deteção de variedades linguísticas em relação às combinatórias lexicais. Desta forma, também criamos um glossário de combinatórias lexicais que, além de conter as soluções encontradas para o português do Brasil, inclui os diferentes equivalentes para português europeu, contribuindo também para a distinção entre as duas variedades linguísticas em relação a estas expressões, uma vez que os estudos comparativos entre ambas tendem a tratar fundamentalmente das diferenças gramaticais.This thesis was based on the analysis of data obtained from an internship in the AI Customer Service start-up Unbabel. The goal is to analyse and discuss the translation of lexical combinations from English into Brazilian Portuguese in the area of machine translation and subsequent post-editing. Lexical combinations are complex expressions that, due to their properties, cause many problems of translation, especially in machine translation. Present in all types of communication and in all languages, both in the general and in the specialized language, these expressions are very relevant, and their study is indispensable. Through analysis of a corpus from the company’s annotation process, I observed lexical combinations related both to the annotation of errors and to the identification of their source. The most significant results demonstrated the need to include a type of error for lexical combinations in the company’s taxonomy, as well as the annotation criteria for such. The research also highlighted the lack of language variety detection regarding lexical combinations. Therefore, I created a glossary of lexical combinations that, in addition to containing the equivalent solutions for Brazilian Portuguese, includes the different equivalents in European Portuguese, furthermore contributing to the distinction between the two language varieties regarding these expressions, as the comparative studies between them tend to deal essentially with the grammatical differences.Colaço, MadalenaMoniz, HelenaRepositório da Universidade de LisboaOliveira, Tatiane Rocha2020-01-14T09:50:51Z2019-11-122019-07-182019-11-12T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/40807TID:202329755porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:40:29Zoai:repositorio.ul.pt:10451/40807Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:54:30.105500Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática |
title |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática |
spellingShingle |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática Oliveira, Tatiane Rocha Língua inglesa - Tradução para português Língua portuguesa - Fraseologia Língua portuguesa - Tradução Língua portuguesa - Brasil Tradução automática Teses de mestrado - 2019 Domínio/Área Científica::Humanidades::Línguas e Literaturas |
title_short |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática |
title_full |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática |
title_fullStr |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática |
title_full_unstemmed |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática |
title_sort |
Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática |
author |
Oliveira, Tatiane Rocha |
author_facet |
Oliveira, Tatiane Rocha |
author_role |
author |
dc.contributor.none.fl_str_mv |
Colaço, Madalena Moniz, Helena Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Oliveira, Tatiane Rocha |
dc.subject.por.fl_str_mv |
Língua inglesa - Tradução para português Língua portuguesa - Fraseologia Língua portuguesa - Tradução Língua portuguesa - Brasil Tradução automática Teses de mestrado - 2019 Domínio/Área Científica::Humanidades::Línguas e Literaturas |
topic |
Língua inglesa - Tradução para português Língua portuguesa - Fraseologia Língua portuguesa - Tradução Língua portuguesa - Brasil Tradução automática Teses de mestrado - 2019 Domínio/Área Científica::Humanidades::Línguas e Literaturas |
description |
A presente dissertação teve como base a análise de dados obtidos a partir de um estágio realizado na start-up Unbabel e trata da tradução de combinatórias lexicais de inglês para português do Brasil na área de tradução automática e subsequente pós-edição. As combinatórias lexicais são expressões complexas que, por suas propriedades, causam problemas de tradução especiais, sobretudo para a tradução automática que, como toda área tecnológica, está em constante desenvolvimento. Presentes em todos tipos de comunicação e em todas línguas, tanto na língua comum quanto na linguagem especializada, estas expressões são realmente relevantes e o seu estudo indispensável. A pesquisa analisou um corpus proveniente do processo de anotação da empresa. Observamos as combinatórias lexicais tanto em relação à anotação dos erros, quanto à identificação das origens dos mesmos. Os resultados mais significantes demonstraram a necessidade de incluir um tipo de erros para as combinatórias lexicais na taxonomia da empresa, bem como critérios de anotação para tais. A análise também apontou para a falha na deteção de variedades linguísticas em relação às combinatórias lexicais. Desta forma, também criamos um glossário de combinatórias lexicais que, além de conter as soluções encontradas para o português do Brasil, inclui os diferentes equivalentes para português europeu, contribuindo também para a distinção entre as duas variedades linguísticas em relação a estas expressões, uma vez que os estudos comparativos entre ambas tendem a tratar fundamentalmente das diferenças gramaticais. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-11-12 2019-07-18 2019-11-12T00:00:00Z 2020-01-14T09:50:51Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/40807 TID:202329755 |
url |
http://hdl.handle.net/10451/40807 |
identifier_str_mv |
TID:202329755 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134484603338752 |