Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras

Detalhes bibliográficos
Autor(a) principal: Lopes, Rhandra Taysk da Silva
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/41784
Resumo: Considerando-se as características da tradução automática, como o baixo custo e a rapidez, esse tipo de tradução tem sido cada vez mais utilizado no mercado de tradução. Todavia, a qualidade dos resultados obtidos pelos sistemas utilizados pode não ser ideal, sendo necessário fazer a tradução passar por um processo de pós-edição, feita por humanos, para atingir níveis de qualidade satisfatórios. O presente trabalho procura descrever o processo de tradução automática, pós-edição e anotação oferecido pela plataforma Unbabel, que faz uso de uma crowd para a edição online dos erros encontrados nos textos traduzidos pelo sistema Neural Machine Translation (NMT). O objetivo principal da presente pesquisa é aprimorar a qualidade dos textos traduzidos por essa empresa, através de propostas de aperfeiçoamento das orientações fornecidas pela empresa aos seus editores e anotadores e através de sugestões para a avaliação e treinamento desses elementos humanos. Para atingir esse objetivo, foram coletados e analisados dados contendo trechos de textos traduzidos pelo sistema automático, pós-editados por humanos e anotados também por humanos sob as etiquetas de Agreement e Word Order, tendo o inglês como língua de partida e o português brasileiro como língua de chegada. A partir da observação dos resultados dessas análises, foi possível definir Golden Texts e testes de múltipla escolha com mensagens de feedback para auxiliar na avaliação e treinamento dos anotadores e pós-editores.
id RCAP_a0fdd6ee3968d81cec5bc02eb25874b3
oai_identifier_str oai:repositorio.ul.pt:10451/41784
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabrasLíngua inglesa - Tradução para portuguêsLíngua portuguesa - FraseologiaLíngua portuguesa - TraduçãoLíngua portuguesa - BrasilTradução automáticaTeses de mestrado - 2019Domínio/Área Científica::Humanidades::Línguas e LiteraturasConsiderando-se as características da tradução automática, como o baixo custo e a rapidez, esse tipo de tradução tem sido cada vez mais utilizado no mercado de tradução. Todavia, a qualidade dos resultados obtidos pelos sistemas utilizados pode não ser ideal, sendo necessário fazer a tradução passar por um processo de pós-edição, feita por humanos, para atingir níveis de qualidade satisfatórios. O presente trabalho procura descrever o processo de tradução automática, pós-edição e anotação oferecido pela plataforma Unbabel, que faz uso de uma crowd para a edição online dos erros encontrados nos textos traduzidos pelo sistema Neural Machine Translation (NMT). O objetivo principal da presente pesquisa é aprimorar a qualidade dos textos traduzidos por essa empresa, através de propostas de aperfeiçoamento das orientações fornecidas pela empresa aos seus editores e anotadores e através de sugestões para a avaliação e treinamento desses elementos humanos. Para atingir esse objetivo, foram coletados e analisados dados contendo trechos de textos traduzidos pelo sistema automático, pós-editados por humanos e anotados também por humanos sob as etiquetas de Agreement e Word Order, tendo o inglês como língua de partida e o português brasileiro como língua de chegada. A partir da observação dos resultados dessas análises, foi possível definir Golden Texts e testes de múltipla escolha com mensagens de feedback para auxiliar na avaliação e treinamento dos anotadores e pós-editores.Considering the characteristics of machine translation, as low costs and speed, it has been increasingly in the translation market. Nevertheless, the quality of the results obtained with these systems may not be ideal, a post-edition step, done by humans, to reach satisfactory quality levels being necessary. The present work describes the translation, post-edition and annotation done at Unbabel’s platform, that uses a crowd to edit online the errors occurring in the texts translated by the Neural Machine Translation (NMT) system. The main objective of this research is to enhance the quality of the texts translated in that platform, through the suggestions of improvements in the guidelines the company gives to its editors and annotators and also through suggestions to evaluate and train these people. In order to achieve this goals, data containing parts of texts translated by the machine translation, post-edited by humans and annotated, also by humans, under the Agreement and Word Order labels, was collected and analyzed. This data had the English as source language and Brazilian Portuguese as target text. The results of these analyzes make it possible to define Golden Texts and multiple choice tests to help the evaluation and training of annotators and post-editors.Moniz, Helena Gorete SilvaRepositório da Universidade de LisboaLopes, Rhandra Taysk da Silva2020-02-13T09:40:05Z2019-12-092019-09-142019-12-09T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/41784TID:202351050porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:41:24Zoai:repositorio.ul.pt:10451/41784Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:55:00.540992Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
title Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
spellingShingle Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
Lopes, Rhandra Taysk da Silva
Língua inglesa - Tradução para português
Língua portuguesa - Fraseologia
Língua portuguesa - Tradução
Língua portuguesa - Brasil
Tradução automática
Teses de mestrado - 2019
Domínio/Área Científica::Humanidades::Línguas e Literaturas
title_short Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
title_full Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
title_fullStr Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
title_full_unstemmed Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
title_sort Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras
author Lopes, Rhandra Taysk da Silva
author_facet Lopes, Rhandra Taysk da Silva
author_role author
dc.contributor.none.fl_str_mv Moniz, Helena Gorete Silva
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Lopes, Rhandra Taysk da Silva
dc.subject.por.fl_str_mv Língua inglesa - Tradução para português
Língua portuguesa - Fraseologia
Língua portuguesa - Tradução
Língua portuguesa - Brasil
Tradução automática
Teses de mestrado - 2019
Domínio/Área Científica::Humanidades::Línguas e Literaturas
topic Língua inglesa - Tradução para português
Língua portuguesa - Fraseologia
Língua portuguesa - Tradução
Língua portuguesa - Brasil
Tradução automática
Teses de mestrado - 2019
Domínio/Área Científica::Humanidades::Línguas e Literaturas
description Considerando-se as características da tradução automática, como o baixo custo e a rapidez, esse tipo de tradução tem sido cada vez mais utilizado no mercado de tradução. Todavia, a qualidade dos resultados obtidos pelos sistemas utilizados pode não ser ideal, sendo necessário fazer a tradução passar por um processo de pós-edição, feita por humanos, para atingir níveis de qualidade satisfatórios. O presente trabalho procura descrever o processo de tradução automática, pós-edição e anotação oferecido pela plataforma Unbabel, que faz uso de uma crowd para a edição online dos erros encontrados nos textos traduzidos pelo sistema Neural Machine Translation (NMT). O objetivo principal da presente pesquisa é aprimorar a qualidade dos textos traduzidos por essa empresa, através de propostas de aperfeiçoamento das orientações fornecidas pela empresa aos seus editores e anotadores e através de sugestões para a avaliação e treinamento desses elementos humanos. Para atingir esse objetivo, foram coletados e analisados dados contendo trechos de textos traduzidos pelo sistema automático, pós-editados por humanos e anotados também por humanos sob as etiquetas de Agreement e Word Order, tendo o inglês como língua de partida e o português brasileiro como língua de chegada. A partir da observação dos resultados dessas análises, foi possível definir Golden Texts e testes de múltipla escolha com mensagens de feedback para auxiliar na avaliação e treinamento dos anotadores e pós-editores.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-09
2019-09-14
2019-12-09T00:00:00Z
2020-02-13T09:40:05Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/41784
TID:202351050
url http://hdl.handle.net/10451/41784
identifier_str_mv TID:202351050
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134490106265600