Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis

Detalhes bibliográficos
Autor(a) principal: Roberto Rodríguez, John
Data de Publicação: 2013
Outros Autores: Salamó Llorente, Maria, Martí Antonín, Maria Antònia
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://linguamatica.com/index.php/linguamatica/article/view/153
Resumo: Collaborative software such as Recommender Systems can benefit from the automatic classification of texts into linguistic registers. First, the linguistic register provides information about the users' profiles and the context of the recommendation. Second, considering the characteristics of each type of text can help to improve existing natural language processing methods. In this paper we contrast two approaches to register categorization for Spanish. The first approach is focused on morphosintactic patterns and the second one on lexical patterns. For the experimental evaluation we tested 38 machine learning algorithms with a precision higher than 89%.
id RCAP_92826ce826544d50ed2e25e352caadec
oai_identifier_str oai:linguamatica.com:article/153
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Automatic categorization of Spanish texts into linguistic registers: a contrastive analysisClasificación automática del registro lingüístico en textos del español: un análisis contrastivoClasificación automática del registro lingüístico en textos del español: un análisis contrastivoNatural language processingmachine learninglinguistic registerProcesamiento del lenguaje naturalaprendizaje automáticoregistro lingüísticoProcesamiento del lenguaje naturalaprendizaje automáticoregistro lingüísticoCollaborative software such as Recommender Systems can benefit from the automatic classification of texts into linguistic registers. First, the linguistic register provides information about the users' profiles and the context of the recommendation. Second, considering the characteristics of each type of text can help to improve existing natural language processing methods. In this paper we contrast two approaches to register categorization for Spanish. The first approach is focused on morphosintactic patterns and the second one on lexical patterns. For the experimental evaluation we tested 38 machine learning algorithms with a precision higher than 89%.Las aplicaciones colaborativas como los Sistemas de Recomendación se pueden beneficiar de la clasificación de textos en registros lingüísticos. En primer lugar, el registro lingüístico proporciona información sobre el perfil de los usuarios y sobre el contexto de la recomendación. En segundo lugar, considerar las características de cada tipo de texto puede ayudar a mejorar los métodos actuales de procesamiento de lenguaje natural. En este trabajo contrastamos dos enfoques, uno morfosintáctico y el otro léxico, para categorizar textos por registro en español. Para su evaluación aplicamos 38 algoritmos de aprendizaje automático con los que obtuvimos niveles de precisión superiores al 89%.Las aplicaciones colaborativas como los Sistemas de Recomendación se pueden beneficiar de la clasificación de textos en registros lingüísticos. En primer lugar, el registro lingüístico proporciona información sobre el perfil de los usuarios y sobre el contexto de la recomendación. En segundo lugar, considerar las características de cada tipo de texto puede ayudar a mejorar los métodos actuales de procesamiento de lenguaje natural. En este trabajo contrastamos dos enfoques, uno morfosintáctico y el otro léxico, para categorizar textos por registro en español. Para su evaluación aplicamos 38 algoritmos de aprendizaje automático con los que obtuvimos niveles de precisión superiores al 89%.Universidade do Minho e Universidade de Vigo2013-07-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://linguamatica.com/index.php/linguamatica/article/view/153Linguamática; Vol. 5 No. 1; 59--67Linguamática; Vol. 5 Núm. 1; 59--67Linguamática; v. 5 n. 1; 59--671647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/153https://linguamatica.com/index.php/linguamatica/article/view/153/244Roberto Rodríguez, JohnSalamó Llorente, MariaMartí Antonín, Maria Antòniainfo:eu-repo/semantics/openAccess2023-09-08T13:46:28Zoai:linguamatica.com:article/153Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:35.729848Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
Clasificación automática del registro lingüístico en textos del español: un análisis contrastivo
Clasificación automática del registro lingüístico en textos del español: un análisis contrastivo
title Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
spellingShingle Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
Roberto Rodríguez, John
Natural language processing
machine learning
linguistic register
Procesamiento del lenguaje natural
aprendizaje automático
registro lingüístico
Procesamiento del lenguaje natural
aprendizaje automático
registro lingüístico
title_short Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
title_full Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
title_fullStr Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
title_full_unstemmed Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
title_sort Automatic categorization of Spanish texts into linguistic registers: a contrastive analysis
author Roberto Rodríguez, John
author_facet Roberto Rodríguez, John
Salamó Llorente, Maria
Martí Antonín, Maria Antònia
author_role author
author2 Salamó Llorente, Maria
Martí Antonín, Maria Antònia
author2_role author
author
dc.contributor.author.fl_str_mv Roberto Rodríguez, John
Salamó Llorente, Maria
Martí Antonín, Maria Antònia
dc.subject.por.fl_str_mv Natural language processing
machine learning
linguistic register
Procesamiento del lenguaje natural
aprendizaje automático
registro lingüístico
Procesamiento del lenguaje natural
aprendizaje automático
registro lingüístico
topic Natural language processing
machine learning
linguistic register
Procesamiento del lenguaje natural
aprendizaje automático
registro lingüístico
Procesamiento del lenguaje natural
aprendizaje automático
registro lingüístico
description Collaborative software such as Recommender Systems can benefit from the automatic classification of texts into linguistic registers. First, the linguistic register provides information about the users' profiles and the context of the recommendation. Second, considering the characteristics of each type of text can help to improve existing natural language processing methods. In this paper we contrast two approaches to register categorization for Spanish. The first approach is focused on morphosintactic patterns and the second one on lexical patterns. For the experimental evaluation we tested 38 machine learning algorithms with a precision higher than 89%.
publishDate 2013
dc.date.none.fl_str_mv 2013-07-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/153
url https://linguamatica.com/index.php/linguamatica/article/view/153
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/153
https://linguamatica.com/index.php/linguamatica/article/view/153/244
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
dc.source.none.fl_str_mv Linguamática; Vol. 5 No. 1; 59--67
Linguamática; Vol. 5 Núm. 1; 59--67
Linguamática; v. 5 n. 1; 59--67
1647-0818
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133553200463872