Exploring Unsupervised Methods to Sematic Textual Similarity

Gamallo, Pablo; Pereira-Fariña, Martín

Exploring Unsupervised Methods to Sematic Textual Similarity

Detalhes bibliográficos
Autor(a) principal:	Gamallo, Pablo
Data de Publicação:	2019
Outros Autores:	Pereira-Fariña, Martín
Tipo de documento:	Artigo
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	https://doi.org/10.21814/lm.10.2.275
Resumo:	This paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually.

Metadados do item

id	RCAP_02097bd57c1174af0074165f51010add
oai_identifier_str	oai:linguamatica.com:article/275
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Exploring Unsupervised Methods to Sematic Textual SimilarityExplorando métodos non-supervisados para calcular a similitude semántica textualExplorando métodos non-supervisados para calcular a similitude semántica textualThis paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually.Neste traballo preséntanse varios métodos non-supervisados para a detección da similitude semántica textual, os cales están baseados en modelos distribucionais e no parseado de dependencias. Os sistemas son avaliados mediante datasets empregados na ASSIN Shared Task, celebrada conxuntamente co PROPOR 2016. Os métodos máis básicos ofrecen un mellor comportamento que aqueles, mais complexos, que inclúen información sintáctico-semántica na análise das oracións. Por último, o uso de modelos distribucionais construidos automaticamente a partir de corpus ofrece resultados comparábeis ás estratexias que utilizan recursos léxicos externos construídos manualmente.Neste traballo preséntanse varios métodos non-supervisados para a detección da similitude semántica textual, os cales están baseados en modelos distribucionais e no parseado de dependencias. Os sistemas son avaliados mediante datasets empregados na ASSIN Shared Task, celebrada conxuntamente co PROPOR 2016. Os métodos máis básicos ofrecen un mellor comportamento que aqueles, mais complexos, que inclúen información sintáctico-semántica na análise das oracións. Por último, o uso de modelos distribucionais construidos automaticamente a partir de corpus ofrece resultados comparábeis ás estratexias que utilizan recursos léxicos externos construídos manualmente.Universidade do Minho e Universidade de Vigo2019-01-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.10.2.275https://doi.org/10.21814/lm.10.2.275Linguamática; Vol. 10 No. 2; 63-68Linguamática; Vol. 10 Núm. 2; 63-68Linguamática; v. 10 n. 2; 63-681647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/275https://linguamatica.com/index.php/linguamatica/article/view/275/448Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariñahttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessGamallo, PabloPereira-Fariña, Martín2023-09-08T13:46:39Zoai:linguamatica.com:article/275Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:38.810879Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Exploring Unsupervised Methods to Sematic Textual Similarity Explorando métodos non-supervisados para calcular a similitude semántica textual Explorando métodos non-supervisados para calcular a similitude semántica textual
title	Exploring Unsupervised Methods to Sematic Textual Similarity
spellingShingle	Exploring Unsupervised Methods to Sematic Textual Similarity Gamallo, Pablo
title_short	Exploring Unsupervised Methods to Sematic Textual Similarity
title_full	Exploring Unsupervised Methods to Sematic Textual Similarity
title_fullStr	Exploring Unsupervised Methods to Sematic Textual Similarity
title_full_unstemmed	Exploring Unsupervised Methods to Sematic Textual Similarity
title_sort	Exploring Unsupervised Methods to Sematic Textual Similarity
author	Gamallo, Pablo
author_facet	Gamallo, Pablo Pereira-Fariña, Martín
author_role	author
author2	Pereira-Fariña, Martín
author2_role	author
dc.contributor.author.fl_str_mv	Gamallo, Pablo Pereira-Fariña, Martín
description	This paper presents some unsupervised methods for detecting semantic textual similarity, which are based on distributional models and dependency parsing. The systems are evaluated using the dataset realased by the ASSIN Shared Task co-located with PROPOR 2016. The more basic methods offer better behavior than the more complex ones, which include syntactic-semantic information in sentence analysis. Finally, the use of distributional models built automatically from corpora provides results comparable to strategies that use external lexical resources built manually.
publishDate	2019
dc.date.none.fl_str_mv	2019-01-24
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/article
format	article
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://doi.org/10.21814/lm.10.2.275 https://doi.org/10.21814/lm.10.2.275
url	https://doi.org/10.21814/lm.10.2.275
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	https://linguamatica.com/index.php/linguamatica/article/view/275 https://linguamatica.com/index.php/linguamatica/article/view/275/448
dc.rights.driver.fl_str_mv	Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariña http://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Direitos de Autor (c) 2019 Pablo Gamallo, Martín Pereira-Fariña http://creativecommons.org/licenses/by/4.0
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade do Minho e Universidade de Vigo
publisher.none.fl_str_mv	Universidade do Minho e Universidade de Vigo
dc.source.none.fl_str_mv	Linguamática; Vol. 10 No. 2; 63-68 Linguamática; Vol. 10 Núm. 2; 63-68 Linguamática; v. 10 n. 2; 63-68 1647-0818 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799133553994235904

Exploring Unsupervised Methods to Sematic Textual Similarity

Registros relacionados