Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/30667 |
Resumo: | We present a semantic taxonomy to classify nominal multiword lexical units (MLU) for European Portuguese. Despite being built by single words, MLU don’t have a compositional meaning and have morphosyntactic restrictions. These units are so important in any text that their identification and classification is essential for information extraction and retrieval in Natural Language Processing. We adapted and applied a semantic taxonomy, based on the Lancaster semantic lexicon (Piao et alii, 2005), to a list of MLU extracted from CETEMPúblico. The results of the annotation task validated our taxonomy, because we were able to classify 97,1% of the corpus. |
id |
RCAP_ef486da90c598f844771fbf8ed2a8edc |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/30667 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra NominaisSemantic taxonomyMultiword lexical unitsNatural language processingWe present a semantic taxonomy to classify nominal multiword lexical units (MLU) for European Portuguese. Despite being built by single words, MLU don’t have a compositional meaning and have morphosyntactic restrictions. These units are so important in any text that their identification and classification is essential for information extraction and retrieval in Natural Language Processing. We adapted and applied a semantic taxonomy, based on the Lancaster semantic lexicon (Piao et alii, 2005), to a list of MLU extracted from CETEMPúblico. The results of the annotation task validated our taxonomy, because we were able to classify 97,1% of the corpus.Edições Colibri/APLRepositório da Universidade de LisboaAbalada, SilvanaCabarrão, VeraCardoso, Aida2018-01-17T14:28:31Z20102010-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/10451/30667porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:23:31Zoai:repositorio.ul.pt:10451/30667Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:46:17.579823Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais |
title |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais |
spellingShingle |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais Abalada, Silvana Semantic taxonomy Multiword lexical units Natural language processing |
title_short |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais |
title_full |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais |
title_fullStr |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais |
title_full_unstemmed |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais |
title_sort |
Proposta de Classificação Semântica de Unidades Lexicais Multipalavra Nominais |
author |
Abalada, Silvana |
author_facet |
Abalada, Silvana Cabarrão, Vera Cardoso, Aida |
author_role |
author |
author2 |
Cabarrão, Vera Cardoso, Aida |
author2_role |
author author |
dc.contributor.none.fl_str_mv |
Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Abalada, Silvana Cabarrão, Vera Cardoso, Aida |
dc.subject.por.fl_str_mv |
Semantic taxonomy Multiword lexical units Natural language processing |
topic |
Semantic taxonomy Multiword lexical units Natural language processing |
description |
We present a semantic taxonomy to classify nominal multiword lexical units (MLU) for European Portuguese. Despite being built by single words, MLU don’t have a compositional meaning and have morphosyntactic restrictions. These units are so important in any text that their identification and classification is essential for information extraction and retrieval in Natural Language Processing. We adapted and applied a semantic taxonomy, based on the Lancaster semantic lexicon (Piao et alii, 2005), to a list of MLU extracted from CETEMPúblico. The results of the annotation task validated our taxonomy, because we were able to classify 97,1% of the corpus. |
publishDate |
2010 |
dc.date.none.fl_str_mv |
2010 2010-01-01T00:00:00Z 2018-01-17T14:28:31Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/30667 |
url |
http://hdl.handle.net/10451/30667 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Edições Colibri/APL |
publisher.none.fl_str_mv |
Edições Colibri/APL |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134386894929920 |