Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/54326 |
Resumo: | In this article an evaluation of a method for extracting restricted lexical combinations from parallel corpora by detecting non-compositionality of multiword expressions in translation will be presented. This method presupposes that by finding sequences of words whose translation does not follow a simple word-to-word conversion of the component words, a collocation is probably present. Word bigrams are used. |
id |
RCAP_71a49d2139511c8cc9bfbf548a8dbbbd |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/54326 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressionsExtração de combinações lexicais restritas pela deteção da não composionalidade de expressões pluriverbaisCollocationsTranslationParallel CorporaColocaçõesTraduçãoCorpora ParalelosHumanidades::Línguas e LiteraturasIn this article an evaluation of a method for extracting restricted lexical combinations from parallel corpora by detecting non-compositionality of multiword expressions in translation will be presented. This method presupposes that by finding sequences of words whose translation does not follow a simple word-to-word conversion of the component words, a collocation is probably present. Word bigrams are used.Neste artigo apresentamos uma avaliação sobre um método para extrair combinações lexicais restritas a partir de corpora paralelos, pela deteção da não composicionalidade de expressões pluriverbais na tradução. Este método baseia-se na presunção de que, encontrando sequências de palavras cuja tradução não siga a tradução palavra por palavra dos seus componentes, é provável estar-se perante uma colocação. São usadas palavras brigrama.info:eu-repo/semantics/publishedVersionUniversidade do Minho. Centro de Estudos Humanísticos (CEHUM)Universidade do MinhoVeloso, Joana Isabel da SilvaSimões, AlbertoIriarte Sanromán, Álvaro20162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/1822/54326engVeloso, J., Simões, A., & Iriarte, A. (2016). Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions. Diacrítica --- Ciências da Linguagem, 30(1): 163-1800870-8967The original publication is available at http://ceh.ilch.uminho.pt/publicacoes/Diacritica_30-1.pdfinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T11:55:10Zoai:repositorium.sdum.uminho.pt:1822/54326Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:44:41.826290Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions Extração de combinações lexicais restritas pela deteção da não composionalidade de expressões pluriverbais |
title |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions |
spellingShingle |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions Veloso, Joana Isabel da Silva Collocations Translation Parallel Corpora Colocações Tradução Corpora Paralelos Humanidades::Línguas e Literaturas |
title_short |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions |
title_full |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions |
title_fullStr |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions |
title_full_unstemmed |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions |
title_sort |
Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions |
author |
Veloso, Joana Isabel da Silva |
author_facet |
Veloso, Joana Isabel da Silva Simões, Alberto Iriarte Sanromán, Álvaro |
author_role |
author |
author2 |
Simões, Alberto Iriarte Sanromán, Álvaro |
author2_role |
author author |
dc.contributor.none.fl_str_mv |
Universidade do Minho |
dc.contributor.author.fl_str_mv |
Veloso, Joana Isabel da Silva Simões, Alberto Iriarte Sanromán, Álvaro |
dc.subject.por.fl_str_mv |
Collocations Translation Parallel Corpora Colocações Tradução Corpora Paralelos Humanidades::Línguas e Literaturas |
topic |
Collocations Translation Parallel Corpora Colocações Tradução Corpora Paralelos Humanidades::Línguas e Literaturas |
description |
In this article an evaluation of a method for extracting restricted lexical combinations from parallel corpora by detecting non-compositionality of multiword expressions in translation will be presented. This method presupposes that by finding sequences of words whose translation does not follow a simple word-to-word conversion of the component words, a collocation is probably present. Word bigrams are used. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 2016-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/54326 |
url |
http://hdl.handle.net/1822/54326 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Veloso, J., Simões, A., & Iriarte, A. (2016). Extraction of restricted lexical combinations by detecting non-compositionality of multiword expressions. Diacrítica --- Ciências da Linguagem, 30(1): 163-180 0870-8967 The original publication is available at http://ceh.ilch.uminho.pt/publicacoes/Diacritica_30-1.pdf |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Minho. Centro de Estudos Humanísticos (CEHUM) |
publisher.none.fl_str_mv |
Universidade do Minho. Centro de Estudos Humanísticos (CEHUM) |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132197403230208 |