A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | , , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/149797 |
Resumo: | UIDB/04097/2020 UIDP/04097/2020 |
id |
RCAP_a7e8e4b4d8455cb7ad40c7270f4aa1d7 |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/149797 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galegoThe paz-andrade law and the use of portuguese for automated translation in galegoLei Paz-AndradeLegislação linguísticaTradução automáticaPolítica linguísticaGalegoPortuguêsPaz-Andrade LawLinguistic legislationAutomatic translationLanguage policyGalicianPortugueseUIDB/04097/2020 UIDP/04097/2020Para a tradução automática baseada em corpus, seja estatística ou neuronal, são necessários grandes volumes de traduções humanas entre duas línguas. Algumas línguas com poucos recursos não têm volumes suficientemente grandes, mas poderá haver acesso a recursos de línguas ou variedades vizinhas. Contudo, se existem entre ambas relações de parentesco controversas de uma perspetiva sociolinguística, reforçadas por quadros legais, poderão existir entraves institucionais ao desenvolvimento de tradutores automáticos oficialmente reconhecidos pelas autoridades linguísticas da língua com menos recursos. Neste artigo veremos como uma lei, que descongela as polémicas relações linguísticas galego-portuguesas (Lei Paz-Andrade), facilita legalmente o desenvolvimento de tradutores automáticos neuronais (NMT) com bons resultados para o galego, graças à utilização de corpora de português. Finalmente, propõe-se, a partir desta experiência, um método que pode ser aplicado a outras línguas com relações de parentesco controversas para o desenvolvimento de tradutores neuronais. In order to obtain high-quality corpus-based, statistical and neural machine translation, large volumes of human translations are needed between the two languages. Some low-resource languages do not have this volume of resources, but resources may be accessible from close-related languages or variants. Nevertheless, it is difficult to develop machine translation systems that are officially recognized by the language authorities of the language with fewer resources if there are sociolinguistic controversies with respect to their relatedness, further strengthened by legal frameworks. In this article, we will see how a law that untangles the controversial Galician-Portuguese linguistic relations (i.e., PazAndrade Law) legally facilitates the development of neural machine translation (NMT) systems with good results for Galician, thanks to the use of Portuguese corpora. Finally, based on this experience, we propose a method to develop neural translation systems that can be applied in the context of other low-resource languages that, despite being controversial, have a close relation with a language with greater resources.Departamento de Línguas, Culturas e Literaturas Modernas (DLCLM)Centro de Estudos Ingleses de Tradução e Anglo-portugueses (CETAPS)RUNPichel, José RamomFlores, Iria de DiosPablo, GamalloNeves, Marco2023-02-27T22:23:34Z20222022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/article20application/pdfhttp://hdl.handle.net/10362/149797porPURE: 53966043https://doi.org/10.2436/rld.i78.2022.3845info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:31:39Zoai:run.unl.pt:10362/149797Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:53:51.916967Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego The paz-andrade law and the use of portuguese for automated translation in galego |
title |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego |
spellingShingle |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego Pichel, José Ramom Lei Paz-Andrade Legislação linguística Tradução automática Política linguística Galego Português Paz-Andrade Law Linguistic legislation Automatic translation Language policy Galician Portuguese |
title_short |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego |
title_full |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego |
title_fullStr |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego |
title_full_unstemmed |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego |
title_sort |
A lei Paz-Andrade e o aproveitamento do português para a tradução automática em galego |
author |
Pichel, José Ramom |
author_facet |
Pichel, José Ramom Flores, Iria de Dios Pablo, Gamallo Neves, Marco |
author_role |
author |
author2 |
Flores, Iria de Dios Pablo, Gamallo Neves, Marco |
author2_role |
author author author |
dc.contributor.none.fl_str_mv |
Departamento de Línguas, Culturas e Literaturas Modernas (DLCLM) Centro de Estudos Ingleses de Tradução e Anglo-portugueses (CETAPS) RUN |
dc.contributor.author.fl_str_mv |
Pichel, José Ramom Flores, Iria de Dios Pablo, Gamallo Neves, Marco |
dc.subject.por.fl_str_mv |
Lei Paz-Andrade Legislação linguística Tradução automática Política linguística Galego Português Paz-Andrade Law Linguistic legislation Automatic translation Language policy Galician Portuguese |
topic |
Lei Paz-Andrade Legislação linguística Tradução automática Política linguística Galego Português Paz-Andrade Law Linguistic legislation Automatic translation Language policy Galician Portuguese |
description |
UIDB/04097/2020 UIDP/04097/2020 |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2022-01-01T00:00:00Z 2023-02-27T22:23:34Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/149797 |
url |
http://hdl.handle.net/10362/149797 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
PURE: 53966043 https://doi.org/10.2436/rld.i78.2022.3845 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
20 application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799138128886235136 |