Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/41784 |
Resumo: | Considerando-se as características da tradução automática, como o baixo custo e a rapidez, esse tipo de tradução tem sido cada vez mais utilizado no mercado de tradução. Todavia, a qualidade dos resultados obtidos pelos sistemas utilizados pode não ser ideal, sendo necessário fazer a tradução passar por um processo de pós-edição, feita por humanos, para atingir níveis de qualidade satisfatórios. O presente trabalho procura descrever o processo de tradução automática, pós-edição e anotação oferecido pela plataforma Unbabel, que faz uso de uma crowd para a edição online dos erros encontrados nos textos traduzidos pelo sistema Neural Machine Translation (NMT). O objetivo principal da presente pesquisa é aprimorar a qualidade dos textos traduzidos por essa empresa, através de propostas de aperfeiçoamento das orientações fornecidas pela empresa aos seus editores e anotadores e através de sugestões para a avaliação e treinamento desses elementos humanos. Para atingir esse objetivo, foram coletados e analisados dados contendo trechos de textos traduzidos pelo sistema automático, pós-editados por humanos e anotados também por humanos sob as etiquetas de Agreement e Word Order, tendo o inglês como língua de partida e o português brasileiro como língua de chegada. A partir da observação dos resultados dessas análises, foi possível definir Golden Texts e testes de múltipla escolha com mensagens de feedback para auxiliar na avaliação e treinamento dos anotadores e pós-editores. |
id |
RCAP_a0fdd6ee3968d81cec5bc02eb25874b3 |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/41784 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabrasLíngua inglesa - Tradução para portuguêsLíngua portuguesa - FraseologiaLíngua portuguesa - TraduçãoLíngua portuguesa - BrasilTradução automáticaTeses de mestrado - 2019Domínio/Área Científica::Humanidades::Línguas e LiteraturasConsiderando-se as características da tradução automática, como o baixo custo e a rapidez, esse tipo de tradução tem sido cada vez mais utilizado no mercado de tradução. Todavia, a qualidade dos resultados obtidos pelos sistemas utilizados pode não ser ideal, sendo necessário fazer a tradução passar por um processo de pós-edição, feita por humanos, para atingir níveis de qualidade satisfatórios. O presente trabalho procura descrever o processo de tradução automática, pós-edição e anotação oferecido pela plataforma Unbabel, que faz uso de uma crowd para a edição online dos erros encontrados nos textos traduzidos pelo sistema Neural Machine Translation (NMT). O objetivo principal da presente pesquisa é aprimorar a qualidade dos textos traduzidos por essa empresa, através de propostas de aperfeiçoamento das orientações fornecidas pela empresa aos seus editores e anotadores e através de sugestões para a avaliação e treinamento desses elementos humanos. Para atingir esse objetivo, foram coletados e analisados dados contendo trechos de textos traduzidos pelo sistema automático, pós-editados por humanos e anotados também por humanos sob as etiquetas de Agreement e Word Order, tendo o inglês como língua de partida e o português brasileiro como língua de chegada. A partir da observação dos resultados dessas análises, foi possível definir Golden Texts e testes de múltipla escolha com mensagens de feedback para auxiliar na avaliação e treinamento dos anotadores e pós-editores.Considering the characteristics of machine translation, as low costs and speed, it has been increasingly in the translation market. Nevertheless, the quality of the results obtained with these systems may not be ideal, a post-edition step, done by humans, to reach satisfactory quality levels being necessary. The present work describes the translation, post-edition and annotation done at Unbabel’s platform, that uses a crowd to edit online the errors occurring in the texts translated by the Neural Machine Translation (NMT) system. The main objective of this research is to enhance the quality of the texts translated in that platform, through the suggestions of improvements in the guidelines the company gives to its editors and annotators and also through suggestions to evaluate and train these people. In order to achieve this goals, data containing parts of texts translated by the machine translation, post-edited by humans and annotated, also by humans, under the Agreement and Word Order labels, was collected and analyzed. This data had the English as source language and Brazilian Portuguese as target text. The results of these analyzes make it possible to define Golden Texts and multiple choice tests to help the evaluation and training of annotators and post-editors.Moniz, Helena Gorete SilvaRepositório da Universidade de LisboaLopes, Rhandra Taysk da Silva2020-02-13T09:40:05Z2019-12-092019-09-142019-12-09T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/41784TID:202351050porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:41:24Zoai:repositorio.ul.pt:10451/41784Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:55:00.540992Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras |
title |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras |
spellingShingle |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras Lopes, Rhandra Taysk da Silva Língua inglesa - Tradução para português Língua portuguesa - Fraseologia Língua portuguesa - Tradução Língua portuguesa - Brasil Tradução automática Teses de mestrado - 2019 Domínio/Área Científica::Humanidades::Línguas e Literaturas |
title_short |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras |
title_full |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras |
title_fullStr |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras |
title_full_unstemmed |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras |
title_sort |
Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras |
author |
Lopes, Rhandra Taysk da Silva |
author_facet |
Lopes, Rhandra Taysk da Silva |
author_role |
author |
dc.contributor.none.fl_str_mv |
Moniz, Helena Gorete Silva Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Lopes, Rhandra Taysk da Silva |
dc.subject.por.fl_str_mv |
Língua inglesa - Tradução para português Língua portuguesa - Fraseologia Língua portuguesa - Tradução Língua portuguesa - Brasil Tradução automática Teses de mestrado - 2019 Domínio/Área Científica::Humanidades::Línguas e Literaturas |
topic |
Língua inglesa - Tradução para português Língua portuguesa - Fraseologia Língua portuguesa - Tradução Língua portuguesa - Brasil Tradução automática Teses de mestrado - 2019 Domínio/Área Científica::Humanidades::Línguas e Literaturas |
description |
Considerando-se as características da tradução automática, como o baixo custo e a rapidez, esse tipo de tradução tem sido cada vez mais utilizado no mercado de tradução. Todavia, a qualidade dos resultados obtidos pelos sistemas utilizados pode não ser ideal, sendo necessário fazer a tradução passar por um processo de pós-edição, feita por humanos, para atingir níveis de qualidade satisfatórios. O presente trabalho procura descrever o processo de tradução automática, pós-edição e anotação oferecido pela plataforma Unbabel, que faz uso de uma crowd para a edição online dos erros encontrados nos textos traduzidos pelo sistema Neural Machine Translation (NMT). O objetivo principal da presente pesquisa é aprimorar a qualidade dos textos traduzidos por essa empresa, através de propostas de aperfeiçoamento das orientações fornecidas pela empresa aos seus editores e anotadores e através de sugestões para a avaliação e treinamento desses elementos humanos. Para atingir esse objetivo, foram coletados e analisados dados contendo trechos de textos traduzidos pelo sistema automático, pós-editados por humanos e anotados também por humanos sob as etiquetas de Agreement e Word Order, tendo o inglês como língua de partida e o português brasileiro como língua de chegada. A partir da observação dos resultados dessas análises, foi possível definir Golden Texts e testes de múltipla escolha com mensagens de feedback para auxiliar na avaliação e treinamento dos anotadores e pós-editores. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-12-09 2019-09-14 2019-12-09T00:00:00Z 2020-02-13T09:40:05Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/41784 TID:202351050 |
url |
http://hdl.handle.net/10451/41784 |
identifier_str_mv |
TID:202351050 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134490106265600 |