Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT

Detalhes bibliográficos
Autor(a) principal: Ferreira, Edgar Silva
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/36214
Resumo: O presente projeto, sob orientação do professor Fernando Martinho e realizado no âmbito do mestrado em Tradução Especializada, constitui o trabalho final que culmina com a conclusão do curso. Numa altura em que tradução automática (TA) observa avanços significativos em termos tecnológicos com o advento da Neural Machine Translation (NMT), a questão da pós-edição (PE) torna-se cada vez mais pertinente enquanto objeto de estudo, de forma a discernir a sua pertinência nomeadamente em contextos de tradução especializada. Tendo este enquadramento em conta, o presente projeto tem como objetivo analisar (qualitativamente) o output de um sistema de TA, mais precisamente o Google Translate, cuja tecnologia é uma das mais utilizadas e, de acordo com a literatura, uma das mais avançadas. O output analisado corresponde a traduções (geradas automaticamente) para português de textos franceses de investigação científica sobre a Alzheimer, uma doença que, pela sua incidência e pelo interesse que esta desperta em determinados públicos não especializados, como por exemplo cuidadores informais de doentes de Alzheimer, se considera de grande relevância, enquanto objeto de investigação, para fins de disseminação. Numa primeira fase, é feito um enquadramento geral, onde se procura clarificar os elementos conceptuais mais importantes da TA, do domínio médico em que a doença de Alzheimer se insere, do procedimento de pós-edição e dos métodos e categorias utilizados neste estudo. De seguida, é efetuado o levantamento e categorização dos erros cometidos pelo sistema de TA, à luz de uma tipologia de erros específica, seguido das respetivas propostas de correção. Quando pertinente, à medida que os erros e as correções são expostos, os mesmos são objeto de uma reflexão teórico-prática. Numa fase final, é efetuada uma reflexão crítica acerca da qualidade e pertinência da TA neste contexto prático específico e os dados obtidos na investigação são contrastados com as principais observações e projeções feitas sobre a TA na literatura atual. Desta forma, o projeto visa contribuir para o estudo linguístico do output da TA neuronal, para o estudo contrastivo dos problemas linguísticos na pós-edição em contexto de traduções técnico-científicas no par de línguas francês-português, e para uma reflexão crítica sobre o papel da TA num contexto de traduções de caráter científico.
id RCAP_7fb0d18eb153d9aac9900e4a9ae9f378
oai_identifier_str oai:ria.ua.pt:10773/36214
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PTPós-ediçãoTipologia de errosTradução automáticaAlzheimerTradução médicaGoogle tradutorTradução automática neuronalMemoqO presente projeto, sob orientação do professor Fernando Martinho e realizado no âmbito do mestrado em Tradução Especializada, constitui o trabalho final que culmina com a conclusão do curso. Numa altura em que tradução automática (TA) observa avanços significativos em termos tecnológicos com o advento da Neural Machine Translation (NMT), a questão da pós-edição (PE) torna-se cada vez mais pertinente enquanto objeto de estudo, de forma a discernir a sua pertinência nomeadamente em contextos de tradução especializada. Tendo este enquadramento em conta, o presente projeto tem como objetivo analisar (qualitativamente) o output de um sistema de TA, mais precisamente o Google Translate, cuja tecnologia é uma das mais utilizadas e, de acordo com a literatura, uma das mais avançadas. O output analisado corresponde a traduções (geradas automaticamente) para português de textos franceses de investigação científica sobre a Alzheimer, uma doença que, pela sua incidência e pelo interesse que esta desperta em determinados públicos não especializados, como por exemplo cuidadores informais de doentes de Alzheimer, se considera de grande relevância, enquanto objeto de investigação, para fins de disseminação. Numa primeira fase, é feito um enquadramento geral, onde se procura clarificar os elementos conceptuais mais importantes da TA, do domínio médico em que a doença de Alzheimer se insere, do procedimento de pós-edição e dos métodos e categorias utilizados neste estudo. De seguida, é efetuado o levantamento e categorização dos erros cometidos pelo sistema de TA, à luz de uma tipologia de erros específica, seguido das respetivas propostas de correção. Quando pertinente, à medida que os erros e as correções são expostos, os mesmos são objeto de uma reflexão teórico-prática. Numa fase final, é efetuada uma reflexão crítica acerca da qualidade e pertinência da TA neste contexto prático específico e os dados obtidos na investigação são contrastados com as principais observações e projeções feitas sobre a TA na literatura atual. Desta forma, o projeto visa contribuir para o estudo linguístico do output da TA neuronal, para o estudo contrastivo dos problemas linguísticos na pós-edição em contexto de traduções técnico-científicas no par de línguas francês-português, e para uma reflexão crítica sobre o papel da TA num contexto de traduções de caráter científico.The present project, carried out under the supervision of Professor Fernando Martinho in the context of a master’s degree in Specialized Translation, constitutes the final work culminating in the degree’s conclusion. In a time where machine translation (MT) undergoes significant technological progress with the advent of the Neural Machine Translation (NMT), post-editing (PE) becomes increasingly relevant as an object of study, in an attempt to assess its viability in specialized translation contexts. With this in mind, the present project aims to analyse (qualitatively) the MT’s output, more specifically Google’s neural machine translation system, the technology of which being one of the most used and, according to the literature, one of the most advanced. The output being analysed here are research papers on Alzheimer, a disease which, for its incidence and the interest it sparks on certain non-specialized publics, for example the Alzheimer patients’ informal caregivers, is of great importance for dissemination purposes. Firstly, a general framework is provided, seeking to clarify the conceptual elements of MT, the medical domain which the Alzheimer’s disease integrates, the post-editing procedure(s) and the methods and categories employed in this study. Next, from the (machine) translation and the subsequent post-editing of its output, the errors made by the MT are identified and categorized according to a specific error typology, followed by the respective explanation of the correction proposals. When viable, as the errors and their corrections are exposed, they will be subject to a theoretical-practical discussion. Lastly, a critical discussion is carried out regarding the quality and relevance of MT in this practical context and the data collected is contrasted with the main observations and hypothesis found in the present literature regarding MT. This way, the present study aims to make a contribution to the linguistic study of neural MT’s output, to the contrastive study of the linguistic problems that can be found in the post-editing of technical-scientific translations in the French-Portuguese language pair, and to the critical discussion concerning the role of MT in contexts of scientific translation.2023-02-03T10:47:58Z2022-12-16T00:00:00Z2022-12-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/36214porFerreira, Edgar Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T12:09:51Zoai:ria.ua.pt:10773/36214Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:07:05.686492Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT
title Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT
spellingShingle Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT
Ferreira, Edgar Silva
Pós-edição
Tipologia de erros
Tradução automática
Alzheimer
Tradução médica
Google tradutor
Tradução automática neuronal
Memoq
title_short Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT
title_full Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT
title_fullStr Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT
title_full_unstemmed Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT
title_sort Pós-edição de textos científicos sobre a Alzheimer: contributo para o estudo linguístico dos erros da NMT no par de línguas FR-PT
author Ferreira, Edgar Silva
author_facet Ferreira, Edgar Silva
author_role author
dc.contributor.author.fl_str_mv Ferreira, Edgar Silva
dc.subject.por.fl_str_mv Pós-edição
Tipologia de erros
Tradução automática
Alzheimer
Tradução médica
Google tradutor
Tradução automática neuronal
Memoq
topic Pós-edição
Tipologia de erros
Tradução automática
Alzheimer
Tradução médica
Google tradutor
Tradução automática neuronal
Memoq
description O presente projeto, sob orientação do professor Fernando Martinho e realizado no âmbito do mestrado em Tradução Especializada, constitui o trabalho final que culmina com a conclusão do curso. Numa altura em que tradução automática (TA) observa avanços significativos em termos tecnológicos com o advento da Neural Machine Translation (NMT), a questão da pós-edição (PE) torna-se cada vez mais pertinente enquanto objeto de estudo, de forma a discernir a sua pertinência nomeadamente em contextos de tradução especializada. Tendo este enquadramento em conta, o presente projeto tem como objetivo analisar (qualitativamente) o output de um sistema de TA, mais precisamente o Google Translate, cuja tecnologia é uma das mais utilizadas e, de acordo com a literatura, uma das mais avançadas. O output analisado corresponde a traduções (geradas automaticamente) para português de textos franceses de investigação científica sobre a Alzheimer, uma doença que, pela sua incidência e pelo interesse que esta desperta em determinados públicos não especializados, como por exemplo cuidadores informais de doentes de Alzheimer, se considera de grande relevância, enquanto objeto de investigação, para fins de disseminação. Numa primeira fase, é feito um enquadramento geral, onde se procura clarificar os elementos conceptuais mais importantes da TA, do domínio médico em que a doença de Alzheimer se insere, do procedimento de pós-edição e dos métodos e categorias utilizados neste estudo. De seguida, é efetuado o levantamento e categorização dos erros cometidos pelo sistema de TA, à luz de uma tipologia de erros específica, seguido das respetivas propostas de correção. Quando pertinente, à medida que os erros e as correções são expostos, os mesmos são objeto de uma reflexão teórico-prática. Numa fase final, é efetuada uma reflexão crítica acerca da qualidade e pertinência da TA neste contexto prático específico e os dados obtidos na investigação são contrastados com as principais observações e projeções feitas sobre a TA na literatura atual. Desta forma, o projeto visa contribuir para o estudo linguístico do output da TA neuronal, para o estudo contrastivo dos problemas linguísticos na pós-edição em contexto de traduções técnico-científicas no par de línguas francês-português, e para uma reflexão crítica sobre o papel da TA num contexto de traduções de caráter científico.
publishDate 2022
dc.date.none.fl_str_mv 2022-12-16T00:00:00Z
2022-12-16
2023-02-03T10:47:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/36214
url http://hdl.handle.net/10773/36214
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137726489952256