Exploring Unsupervised Methods to Sematic Textual Similarity
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://doi.org/10.21814/lm.10.2.275 |
Resumo: | This paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually. |
id |
RCAP_02097bd57c1174af0074165f51010add |
---|---|
oai_identifier_str |
oai:linguamatica.com:article/275 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Exploring Unsupervised Methods to Sematic Textual SimilarityExplorando métodos non-supervisados para calcular a similitude semántica textualExplorando métodos non-supervisados para calcular a similitude semántica textualThis paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually.Neste traballo preséntanse varios métodos non-supervisados para a detección da similitude semántica textual, os cales están baseados en modelos distribucionais e no parseado de dependencias. Os sistemas son avaliados mediante datasets empregados na ASSIN Shared Task, celebrada conxuntamente co PROPOR 2016. Os métodos máis básicos ofrecen un mellor comportamento que aqueles, mais complexos, que inclúen información sintáctico-semántica na análise das oracións. Por último, o uso de modelos distribucionais construidos automaticamente a partir de corpus ofrece resultados comparábeis ás estratexias que utilizan recursos léxicos externos construídos manualmente.Neste traballo preséntanse varios métodos non-supervisados para a detección da similitude semántica textual, os cales están baseados en modelos distribucionais e no parseado de dependencias. Os sistemas son avaliados mediante datasets empregados na ASSIN Shared Task, celebrada conxuntamente co PROPOR 2016. Os métodos máis básicos ofrecen un mellor comportamento que aqueles, mais complexos, que inclúen información sintáctico-semántica na análise das oracións. Por último, o uso de modelos distribucionais construidos automaticamente a partir de corpus ofrece resultados comparábeis ás estratexias que utilizan recursos léxicos externos construídos manualmente.Universidade do Minho e Universidade de Vigo2019-01-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.10.2.275https://doi.org/10.21814/lm.10.2.275Linguamática; Vol. 10 No. 2; 63-68Linguamática; Vol. 10 Núm. 2; 63-68Linguamática; v. 10 n. 2; 63-681647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/275https://linguamatica.com/index.php/linguamatica/article/view/275/448Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariñahttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessGamallo, PabloPereira-Fariña, Martín2023-09-08T13:46:39Zoai:linguamatica.com:article/275Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:38.810879Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Exploring Unsupervised Methods to Sematic Textual Similarity Explorando métodos non-supervisados para calcular a similitude semántica textual Explorando métodos non-supervisados para calcular a similitude semántica textual |
title |
Exploring Unsupervised Methods to Sematic Textual Similarity |
spellingShingle |
Exploring Unsupervised Methods to Sematic Textual Similarity Gamallo, Pablo |
title_short |
Exploring Unsupervised Methods to Sematic Textual Similarity |
title_full |
Exploring Unsupervised Methods to Sematic Textual Similarity |
title_fullStr |
Exploring Unsupervised Methods to Sematic Textual Similarity |
title_full_unstemmed |
Exploring Unsupervised Methods to Sematic Textual Similarity |
title_sort |
Exploring Unsupervised Methods to Sematic Textual Similarity |
author |
Gamallo, Pablo |
author_facet |
Gamallo, Pablo Pereira-Fariña, Martín |
author_role |
author |
author2 |
Pereira-Fariña, Martín |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Gamallo, Pablo Pereira-Fariña, Martín |
description |
This paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-01-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.21814/lm.10.2.275 https://doi.org/10.21814/lm.10.2.275 |
url |
https://doi.org/10.21814/lm.10.2.275 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://linguamatica.com/index.php/linguamatica/article/view/275 https://linguamatica.com/index.php/linguamatica/article/view/275/448 |
dc.rights.driver.fl_str_mv |
Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariña http://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariña http://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
dc.source.none.fl_str_mv |
Linguamática; Vol. 10 No. 2; 63-68 Linguamática; Vol. 10 Núm. 2; 63-68 Linguamática; v. 10 n. 2; 63-68 1647-0818 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133553994235904 |