Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática

Detalhes bibliográficos
Autor(a) principal: Oliveira, Tatiane Rocha
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/40807
Resumo: A presente dissertação teve como base a análise de dados obtidos a partir de um estágio realizado na start-up Unbabel e trata da tradução de combinatórias lexicais de inglês para português do Brasil na área de tradução automática e subsequente pós-edição. As combinatórias lexicais são expressões complexas que, por suas propriedades, causam problemas de tradução especiais, sobretudo para a tradução automática que, como toda área tecnológica, está em constante desenvolvimento. Presentes em todos tipos de comunicação e em todas línguas, tanto na língua comum quanto na linguagem especializada, estas expressões são realmente relevantes e o seu estudo indispensável. A pesquisa analisou um corpus proveniente do processo de anotação da empresa. Observamos as combinatórias lexicais tanto em relação à anotação dos erros, quanto à identificação das origens dos mesmos. Os resultados mais significantes demonstraram a necessidade de incluir um tipo de erros para as combinatórias lexicais na taxonomia da empresa, bem como critérios de anotação para tais. A análise também apontou para a falha na deteção de variedades linguísticas em relação às combinatórias lexicais. Desta forma, também criamos um glossário de combinatórias lexicais que, além de conter as soluções encontradas para o português do Brasil, inclui os diferentes equivalentes para português europeu, contribuindo também para a distinção entre as duas variedades linguísticas em relação a estas expressões, uma vez que os estudos comparativos entre ambas tendem a tratar fundamentalmente das diferenças gramaticais.
id RCAP_f7c955b1b9a226e270d7857419206512
oai_identifier_str oai:repositorio.ul.pt:10451/40807
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automáticaLíngua inglesa - Tradução para portuguêsLíngua portuguesa - FraseologiaLíngua portuguesa - TraduçãoLíngua portuguesa - BrasilTradução automáticaTeses de mestrado - 2019Domínio/Área Científica::Humanidades::Línguas e LiteraturasA presente dissertação teve como base a análise de dados obtidos a partir de um estágio realizado na start-up Unbabel e trata da tradução de combinatórias lexicais de inglês para português do Brasil na área de tradução automática e subsequente pós-edição. As combinatórias lexicais são expressões complexas que, por suas propriedades, causam problemas de tradução especiais, sobretudo para a tradução automática que, como toda área tecnológica, está em constante desenvolvimento. Presentes em todos tipos de comunicação e em todas línguas, tanto na língua comum quanto na linguagem especializada, estas expressões são realmente relevantes e o seu estudo indispensável. A pesquisa analisou um corpus proveniente do processo de anotação da empresa. Observamos as combinatórias lexicais tanto em relação à anotação dos erros, quanto à identificação das origens dos mesmos. Os resultados mais significantes demonstraram a necessidade de incluir um tipo de erros para as combinatórias lexicais na taxonomia da empresa, bem como critérios de anotação para tais. A análise também apontou para a falha na deteção de variedades linguísticas em relação às combinatórias lexicais. Desta forma, também criamos um glossário de combinatórias lexicais que, além de conter as soluções encontradas para o português do Brasil, inclui os diferentes equivalentes para português europeu, contribuindo também para a distinção entre as duas variedades linguísticas em relação a estas expressões, uma vez que os estudos comparativos entre ambas tendem a tratar fundamentalmente das diferenças gramaticais.This thesis was based on the analysis of data obtained from an internship in the AI Customer Service start-up Unbabel. The goal is to analyse and discuss the translation of lexical combinations from English into Brazilian Portuguese in the area of machine translation and subsequent post-editing. Lexical combinations are complex expressions that, due to their properties, cause many problems of translation, especially in machine translation. Present in all types of communication and in all languages, both in the general and in the specialized language, these expressions are very relevant, and their study is indispensable. Through analysis of a corpus from the company’s annotation process, I observed lexical combinations related both to the annotation of errors and to the identification of their source. The most significant results demonstrated the need to include a type of error for lexical combinations in the company’s taxonomy, as well as the annotation criteria for such. The research also highlighted the lack of language variety detection regarding lexical combinations. Therefore, I created a glossary of lexical combinations that, in addition to containing the equivalent solutions for Brazilian Portuguese, includes the different equivalents in European Portuguese, furthermore contributing to the distinction between the two language varieties regarding these expressions, as the comparative studies between them tend to deal essentially with the grammatical differences.Colaço, MadalenaMoniz, HelenaRepositório da Universidade de LisboaOliveira, Tatiane Rocha2020-01-14T09:50:51Z2019-11-122019-07-182019-11-12T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/40807TID:202329755porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:40:29Zoai:repositorio.ul.pt:10451/40807Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:54:30.105500Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
title Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
spellingShingle Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
Oliveira, Tatiane Rocha
Língua inglesa - Tradução para português
Língua portuguesa - Fraseologia
Língua portuguesa - Tradução
Língua portuguesa - Brasil
Tradução automática
Teses de mestrado - 2019
Domínio/Área Científica::Humanidades::Línguas e Literaturas
title_short Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
title_full Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
title_fullStr Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
title_full_unstemmed Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
title_sort Análise da tradução de combinatórias lexicais em tarefas de pós-edição de tradução automática
author Oliveira, Tatiane Rocha
author_facet Oliveira, Tatiane Rocha
author_role author
dc.contributor.none.fl_str_mv Colaço, Madalena
Moniz, Helena
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Oliveira, Tatiane Rocha
dc.subject.por.fl_str_mv Língua inglesa - Tradução para português
Língua portuguesa - Fraseologia
Língua portuguesa - Tradução
Língua portuguesa - Brasil
Tradução automática
Teses de mestrado - 2019
Domínio/Área Científica::Humanidades::Línguas e Literaturas
topic Língua inglesa - Tradução para português
Língua portuguesa - Fraseologia
Língua portuguesa - Tradução
Língua portuguesa - Brasil
Tradução automática
Teses de mestrado - 2019
Domínio/Área Científica::Humanidades::Línguas e Literaturas
description A presente dissertação teve como base a análise de dados obtidos a partir de um estágio realizado na start-up Unbabel e trata da tradução de combinatórias lexicais de inglês para português do Brasil na área de tradução automática e subsequente pós-edição. As combinatórias lexicais são expressões complexas que, por suas propriedades, causam problemas de tradução especiais, sobretudo para a tradução automática que, como toda área tecnológica, está em constante desenvolvimento. Presentes em todos tipos de comunicação e em todas línguas, tanto na língua comum quanto na linguagem especializada, estas expressões são realmente relevantes e o seu estudo indispensável. A pesquisa analisou um corpus proveniente do processo de anotação da empresa. Observamos as combinatórias lexicais tanto em relação à anotação dos erros, quanto à identificação das origens dos mesmos. Os resultados mais significantes demonstraram a necessidade de incluir um tipo de erros para as combinatórias lexicais na taxonomia da empresa, bem como critérios de anotação para tais. A análise também apontou para a falha na deteção de variedades linguísticas em relação às combinatórias lexicais. Desta forma, também criamos um glossário de combinatórias lexicais que, além de conter as soluções encontradas para o português do Brasil, inclui os diferentes equivalentes para português europeu, contribuindo também para a distinção entre as duas variedades linguísticas em relação a estas expressões, uma vez que os estudos comparativos entre ambas tendem a tratar fundamentalmente das diferenças gramaticais.
publishDate 2019
dc.date.none.fl_str_mv 2019-11-12
2019-07-18
2019-11-12T00:00:00Z
2020-01-14T09:50:51Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/40807
TID:202329755
url http://hdl.handle.net/10451/40807
identifier_str_mv TID:202329755
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134484603338752