Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/4863 |
Resumo: | Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia Informática |
id |
RCAP_0e1eea9714fb0b69b6d17dd44b36b75e |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/4863 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingueTradução automáticaAlinhamento de textos paralelosExtracção de equivalentes de traduçãoGeração automática de léxicos multilinguesLíngua pivôTrabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia InformáticaA construção automática de léxicos bilingues é indispensável para aplicações como o acesso a informação disponível em várias línguas, a tradução automática, a construção de ontologias multilingues, entre outras. Nos últimos anos tem havido alguma actividade no sentido de extrair traduções auxiliadas por léxicos bilingues existentes entre línguas com maiores recursos, X-Y e Y-Z, por exemplo, para pares de línguas com menores recursos, X-Z, utilizando uma das línguas com mais recursos (a língua Y, no caso) como língua pivô. Neste trabalho, assume-se o Português (PT) como língua pivô. Dada a existência de um léxico de traduções de palavras e de multi-palavras minimamente desenvolvido, com cerca de 200.000 entradas, entre Português e Inglês (EN), partindo da semelhança estrutural e lexical das línguas Portuguesa e Espanhola (ES), extraiu-se traduções de palavras para o par EN-ES, utilizando um corpus de textos paralelos (dois textos são paralelos se forem tradução um do outro ou ambos forem tradução de um mesmo texto fonte), existente para todas as línguas da União Europeia,detectando primeiro as palavras que possam ser cognatas (semelhantes na forma e com o mesmo significado). Considerando as entradas do léxico bilingue PT-EN, identificou-se as possíveis traduções em Inglês das palavras espanholas cognatas com palavras portuguesas previamente identificadas. Em seguida, os possíveis cognatos entre Português e Espanhol e as possíveis traduções de Espanhol em Inglês foram avaliadas adicionalmente quanto à sua semelhança nos textos da colecção em que ocorrem, recorrendo a medidas de semelhança utilizadas para estes efeitos e definindo um limiar de semelhança para a aceitação dos cognatos entre PT e ES como traduções e das traduções inferidas, entre o Espanhol e o Inglês, via o léxico bilingue PT-EN. Os resultados foram avaliados manualmente. Conseguiu-se aumentar a produtividade dos avaliadores das traduções de termos, passando-lhes traduções com um elevado grau de precisão. Discute-se, os resultados obtidos fazendo variar: o grau de semelhança entre possíveis cognatos, a medida de semelhança entre termos de línguas diferentes, distinguindo-se também o tipo de contextos em que ocorrem (textos completos paralelos, frases paralelas ou segmentos mais curtos obtidos pelo alinhamento realizado) e os limiares de aceitação utilizados.Faculdade de Ciências e TecnologiaLopes, José Gabriel PereiraRUNGomes, Gonçalo Nuno Ramos2011-01-17T16:27:04Z20102010-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/4863porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T03:34:56Zoai:run.unl.pt:10362/4863Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:15:56.325560Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue |
title |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue |
spellingShingle |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue Gomes, Gonçalo Nuno Ramos Tradução automática Alinhamento de textos paralelos Extracção de equivalentes de tradução Geração automática de léxicos multilingues Língua pivô |
title_short |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue |
title_full |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue |
title_fullStr |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue |
title_full_unstemmed |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue |
title_sort |
Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue |
author |
Gomes, Gonçalo Nuno Ramos |
author_facet |
Gomes, Gonçalo Nuno Ramos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Lopes, José Gabriel Pereira RUN |
dc.contributor.author.fl_str_mv |
Gomes, Gonçalo Nuno Ramos |
dc.subject.por.fl_str_mv |
Tradução automática Alinhamento de textos paralelos Extracção de equivalentes de tradução Geração automática de léxicos multilingues Língua pivô |
topic |
Tradução automática Alinhamento de textos paralelos Extracção de equivalentes de tradução Geração automática de léxicos multilingues Língua pivô |
description |
Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia Informática |
publishDate |
2010 |
dc.date.none.fl_str_mv |
2010 2010-01-01T00:00:00Z 2011-01-17T16:27:04Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/4863 |
url |
http://hdl.handle.net/10362/4863 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Faculdade de Ciências e Tecnologia |
publisher.none.fl_str_mv |
Faculdade de Ciências e Tecnologia |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137809682923520 |