A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego

Detalhes bibliográficos
Autor(a) principal: Pichel, José Ramom
Data de Publicação: 2022
Outros Autores: Flores, Iria de Dios, Pablo, Gamallo, Neves, Marco
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10362/149797
Resumo: UIDB/04097/2020 UIDP/04097/2020
id RCAP_a7e8e4b4d8455cb7ad40c7270f4aa1d7
oai_identifier_str oai:run.unl.pt:10362/149797
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galegoThe paz-andrade law and the use of portuguese for automated translation in galegoLei Paz-AndradeLegislação linguísticaTradução automáticaPolítica linguísticaGalegoPortuguêsPaz-Andrade LawLinguistic legislationAutomatic translationLanguage policyGalicianPortugueseUIDB/04097/2020 UIDP/04097/2020Para a tradução automática baseada em corpus, seja estatística ou neuronal, são necessários grandes volumes de traduções humanas entre duas línguas. Algumas línguas com poucos recursos não têm volumes suficientemente grandes, mas poderá haver acesso a recursos de línguas ou variedades vizinhas. Contudo, se existem entre ambas relações de parentesco controversas de uma perspetiva sociolinguística, reforçadas por quadros legais, poderão existir entraves institucionais ao desenvolvimento de tradutores automáticos oficialmente reconhecidos pelas autoridades linguísticas da língua com menos recursos. Neste artigo veremos como uma lei, que descongela as polémicas relações linguísticas galego-portuguesas (Lei Paz-Andrade), facilita legalmente o desenvolvimento de tradutores automáticos neuronais (NMT) com bons resultados para o galego, graças à utilização de corpora de português. Finalmente, propõe-se, a partir desta experiência, um método que pode ser aplicado a outras línguas com relações de parentesco controversas para o desenvolvimento de tradutores neuronais. In order to obtain high-quality corpus-based, statistical and neural machine translation, large volumes of human translations are needed between the two languages. Some low-resource languages do not have this volume of resources, but resources may be accessible from close-related languages or variants. Nevertheless, it is difficult to develop machine translation systems that are officially recognized by the language authorities of the language with fewer resources if there are sociolinguistic controversies with respect to their relatedness, further strengthened by legal frameworks. In this article, we will see how a law that untangles the controversial Galician-Portuguese linguistic relations (i.e., PazAndrade Law) legally facilitates the development of neural machine translation (NMT) systems with good results for Galician, thanks to the use of Portuguese corpora. Finally, based on this experience, we propose a method to develop neural translation systems that can be applied in the context of other low-resource languages that, despite being controversial, have a close relation with a language with greater resources.Departamento de Línguas, Culturas e Literaturas Modernas (DLCLM)Centro de Estudos Ingleses de Tradução e Anglo-portugueses (CETAPS)RUNPichel, José RamomFlores, Iria de DiosPablo, GamalloNeves, Marco2023-02-27T22:23:34Z20222022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/article20application/pdfhttp://hdl.handle.net/10362/149797porPURE: 53966043https://doi.org/10.2436/rld.i78.2022.3845info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:31:39Zoai:run.unl.pt:10362/149797Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:53:51.916967Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
The paz-andrade law and the use of portuguese for automated translation in galego
title A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
spellingShingle A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
Pichel, José Ramom
Lei Paz-Andrade
Legislação linguística
Tradução automática
Política linguística
Galego
Português
Paz-Andrade Law
Linguistic legislation
Automatic translation
Language policy
Galician
Portuguese
title_short A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
title_full A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
title_fullStr A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
title_full_unstemmed A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
title_sort A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
author Pichel, José Ramom
author_facet Pichel, José Ramom
Flores, Iria de Dios
Pablo, Gamallo
Neves, Marco
author_role author
author2 Flores, Iria de Dios
Pablo, Gamallo
Neves, Marco
author2_role author
author
author
dc.contributor.none.fl_str_mv Departamento de Línguas, Culturas e Literaturas Modernas (DLCLM)
Centro de Estudos Ingleses de Tradução e Anglo-portugueses (CETAPS)
RUN
dc.contributor.author.fl_str_mv Pichel, José Ramom
Flores, Iria de Dios
Pablo, Gamallo
Neves, Marco
dc.subject.por.fl_str_mv Lei Paz-Andrade
Legislação linguística
Tradução automática
Política linguística
Galego
Português
Paz-Andrade Law
Linguistic legislation
Automatic translation
Language policy
Galician
Portuguese
topic Lei Paz-Andrade
Legislação linguística
Tradução automática
Política linguística
Galego
Português
Paz-Andrade Law
Linguistic legislation
Automatic translation
Language policy
Galician
Portuguese
description UIDB/04097/2020 UIDP/04097/2020
publishDate 2022
dc.date.none.fl_str_mv 2022
2022-01-01T00:00:00Z
2023-02-27T22:23:34Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/149797
url http://hdl.handle.net/10362/149797
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv PURE: 53966043
https://doi.org/10.2436/rld.i78.2022.3845
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 20
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799138128886235136