Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://linguamatica.com/index.php/linguamatica/article/view/153 |
Resumo: | Collaborative software such as Recommender Systems can benefit from the automatic classification of texts into linguistic registers. First, the linguistic register provides information about the users' profiles and the context of the recommendation. Second, considering the characteristics of each type of text can help to improve existing natural language processing methods. In this paper we contrast two approaches to register categorization for Spanish. The first approach is focused on morphosintactic patterns and the second one on lexical patterns. For the experimental evaluation we tested 38 machine learning algorithms with a precision higher than 89%. |
id |
RCAP_92826ce826544d50ed2e25e352caadec |
---|---|
oai_identifier_str |
oai:linguamatica.com:article/153 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysisClasificación automática del registro lingüístico en textos del español: un análisis contrastivoClasificación automática del registro lingüístico en textos del español: un análisis contrastivoNatural language processingmachine learninglinguistic registerProcesamiento del lenguaje naturalaprendizaje automáticoregistro lingüísticoProcesamiento del lenguaje naturalaprendizaje automáticoregistro lingüísticoCollaborative software such as Recommender Systems can benefit from the automatic classification of texts into linguistic registers. First, the linguistic register provides information about the users' profiles and the context of the recommendation. Second, considering the characteristics of each type of text can help to improve existing natural language processing methods. In this paper we contrast two approaches to register categorization for Spanish. The first approach is focused on morphosintactic patterns and the second one on lexical patterns. For the experimental evaluation we tested 38 machine learning algorithms with a precision higher than 89%.Las aplicaciones colaborativas como los Sistemas de Recomendación se pueden beneficiar de la clasificación de textos en registros lingüísticos. En primer lugar, el registro lingüístico proporciona información sobre el perfil de los usuarios y sobre el contexto de la recomendación. En segundo lugar, considerar las características de cada tipo de texto puede ayudar a mejorar los métodos actuales de procesamiento de lenguaje natural. En este trabajo contrastamos dos enfoques, uno morfosintáctico y el otro léxico, para categorizar textos por registro en español. Para su evaluación aplicamos 38 algoritmos de aprendizaje automático con los que obtuvimos niveles de precisión superiores al 89%.Las aplicaciones colaborativas como los Sistemas de Recomendación se pueden beneficiar de la clasificación de textos en registros lingüísticos. En primer lugar, el registro lingüístico proporciona información sobre el perfil de los usuarios y sobre el contexto de la recomendación. En segundo lugar, considerar las características de cada tipo de texto puede ayudar a mejorar los métodos actuales de procesamiento de lenguaje natural. En este trabajo contrastamos dos enfoques, uno morfosintáctico y el otro léxico, para categorizar textos por registro en español. Para su evaluación aplicamos 38 algoritmos de aprendizaje automático con los que obtuvimos niveles de precisión superiores al 89%.Universidade do Minho e Universidade de Vigo2013-07-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://linguamatica.com/index.php/linguamatica/article/view/153Linguamática; Vol. 5 No. 1; 59--67Linguamática; Vol. 5 Núm. 1; 59--67Linguamática; v. 5 n. 1; 59--671647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/153https://linguamatica.com/index.php/linguamatica/article/view/153/244Roberto Rodríguez, JohnSalamó Llorente, MariaMartí Antonín, Maria Antòniainfo:eu-repo/semantics/openAccess2023-09-08T13:46:28Zoai:linguamatica.com:article/153Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:35.729848Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis Clasificación automática del registro lingüístico en textos del español: un análisis contrastivo Clasificación automática del registro lingüístico en textos del español: un análisis contrastivo |
title |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis |
spellingShingle |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis Roberto Rodríguez, John Natural language processing machine learning linguistic register Procesamiento del lenguaje natural aprendizaje automático registro lingüístico Procesamiento del lenguaje natural aprendizaje automático registro lingüístico |
title_short |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis |
title_full |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis |
title_fullStr |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis |
title_full_unstemmed |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis |
title_sort |
Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis |
author |
Roberto Rodríguez, John |
author_facet |
Roberto Rodríguez, John Salamó Llorente, Maria Martí Antonín, Maria Antònia |
author_role |
author |
author2 |
Salamó Llorente, Maria Martí Antonín, Maria Antònia |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Roberto Rodríguez, John Salamó Llorente, Maria Martí Antonín, Maria Antònia |
dc.subject.por.fl_str_mv |
Natural language processing machine learning linguistic register Procesamiento del lenguaje natural aprendizaje automático registro lingüístico Procesamiento del lenguaje natural aprendizaje automático registro lingüístico |
topic |
Natural language processing machine learning linguistic register Procesamiento del lenguaje natural aprendizaje automático registro lingüístico Procesamiento del lenguaje natural aprendizaje automático registro lingüístico |
description |
Collaborative software such as Recommender Systems can benefit from the automatic classification of texts into linguistic registers. First, the linguistic register provides information about the users' profiles and the context of the recommendation. Second, considering the characteristics of each type of text can help to improve existing natural language processing methods. In this paper we contrast two approaches to register categorization for Spanish. The first approach is focused on morphosintactic patterns and the second one on lexical patterns. For the experimental evaluation we tested 38 machine learning algorithms with a precision higher than 89%. |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013-07-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://linguamatica.com/index.php/linguamatica/article/view/153 |
url |
https://linguamatica.com/index.php/linguamatica/article/view/153 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://linguamatica.com/index.php/linguamatica/article/view/153 https://linguamatica.com/index.php/linguamatica/article/view/153/244 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
dc.source.none.fl_str_mv |
Linguamática; Vol. 5 No. 1; 59--67 Linguamática; Vol. 5 Núm. 1; 59--67 Linguamática; v. 5 n. 1; 59--67 1647-0818 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133553200463872 |