Exploring Unsupervised Methods to Sematic Textual Similarity

Detalhes bibliográficos
Autor(a) principal: Gamallo, Pablo
Data de Publicação: 2019
Outros Autores: Pereira-Fariña, Martín
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://doi.org/10.21814/lm.10.2.275
Resumo: This paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually.
id RCAP_02097bd57c1174af0074165f51010add
oai_identifier_str oai:linguamatica.com:article/275
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Exploring Unsupervised Methods to Sematic Textual SimilarityExplorando métodos non-supervisados para calcular a similitude semántica textualExplorando métodos non-supervisados para calcular a similitude semántica textualThis paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually.Neste traballo preséntanse varios métodos non-supervisados para a detección da similitude semántica textual, os cales están baseados en modelos distribucionais e no parseado de dependencias. Os sistemas son avaliados mediante datasets empregados na ASSIN Shared Task, celebrada conxuntamente co PROPOR 2016. Os métodos máis básicos ofrecen un mellor comportamento que aqueles, mais complexos, que inclúen información sintáctico-semántica na análise das oracións. Por último, o uso de modelos distribucionais construidos automaticamente a partir de corpus ofrece resultados comparábeis ás estratexias que utilizan recursos léxicos externos construídos manualmente.Neste traballo preséntanse varios métodos non-supervisados para a detección da similitude semántica textual, os cales están baseados en modelos distribucionais e no parseado de dependencias. Os sistemas son avaliados mediante datasets empregados na ASSIN Shared Task, celebrada conxuntamente co PROPOR 2016. Os métodos máis básicos ofrecen un mellor comportamento que aqueles, mais complexos, que inclúen información sintáctico-semántica na análise das oracións. Por último, o uso de modelos distribucionais construidos automaticamente a partir de corpus ofrece resultados comparábeis ás estratexias que utilizan recursos léxicos externos construídos manualmente.Universidade do Minho e Universidade de Vigo2019-01-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.10.2.275https://doi.org/10.21814/lm.10.2.275Linguamática; Vol. 10 No. 2; 63-68Linguamática; Vol. 10 Núm. 2; 63-68Linguamática; v. 10 n. 2; 63-681647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/275https://linguamatica.com/index.php/linguamatica/article/view/275/448Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariñahttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessGamallo, PabloPereira-Fariña, Martín2023-09-08T13:46:39Zoai:linguamatica.com:article/275Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:38.810879Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Exploring Unsupervised Methods to Sematic Textual Similarity
Explorando métodos non-supervisados para calcular a similitude semántica textual
Explorando métodos non-supervisados para calcular a similitude semántica textual
title Exploring Unsupervised Methods to Sematic Textual Similarity
spellingShingle Exploring Unsupervised Methods to Sematic Textual Similarity
Gamallo, Pablo
title_short Exploring Unsupervised Methods to Sematic Textual Similarity
title_full Exploring Unsupervised Methods to Sematic Textual Similarity
title_fullStr Exploring Unsupervised Methods to Sematic Textual Similarity
title_full_unstemmed Exploring Unsupervised Methods to Sematic Textual Similarity
title_sort Exploring Unsupervised Methods to Sematic Textual Similarity
author Gamallo, Pablo
author_facet Gamallo, Pablo
Pereira-Fariña, Martín
author_role author
author2 Pereira-Fariña, Martín
author2_role author
dc.contributor.author.fl_str_mv Gamallo, Pablo
Pereira-Fariña, Martín
description This paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually.
publishDate 2019
dc.date.none.fl_str_mv 2019-01-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.21814/lm.10.2.275
https://doi.org/10.21814/lm.10.2.275
url https://doi.org/10.21814/lm.10.2.275
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/275
https://linguamatica.com/index.php/linguamatica/article/view/275/448
dc.rights.driver.fl_str_mv Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariña
http://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariña
http://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
dc.source.none.fl_str_mv Linguamática; Vol. 10 No. 2; 63-68
Linguamática; Vol. 10 Núm. 2; 63-68
Linguamática; v. 10 n. 2; 63-68
1647-0818
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133553994235904