Clasificación de textos en lenguaje natural usando la Wikipedia
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Outros Autores: | , , , |
Tipo de documento: | Artigo |
Idioma: | spa |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005 |
Resumo: | La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático. |
id |
RCAP_7f4c6997fe9dd90aca7f35b56c5a2c22 |
---|---|
oai_identifier_str |
oai:scielo:S1646-98952011000200005 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Clasificación de textos en lenguaje natural usando la WikipediaCategorización de textosWikipediatf-idfAprendizaje AutomáticoProcesado de Lenguaje NaturalLa clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.AISTI - Associação Ibérica de Sistemas e Tecnologias de Informação2011-12-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articletext/htmlhttp://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação n.8 2011reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPspahttp://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005Quinteiro-González,Jose MaríaMartel-Jordán,ErnestinaHernández-Morera,PabloLigero-Fleitas,Juan A.López-Rodriguez,Aaroninfo:eu-repo/semantics/openAccess2024-02-06T17:23:59Zoai:scielo:S1646-98952011000200005Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:29:58.747487Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Clasificación de textos en lenguaje natural usando la Wikipedia |
title |
Clasificación de textos en lenguaje natural usando la Wikipedia |
spellingShingle |
Clasificación de textos en lenguaje natural usando la Wikipedia Quinteiro-González,Jose María Categorización de textos Wikipedia tf-idf Aprendizaje Automático Procesado de Lenguaje Natural |
title_short |
Clasificación de textos en lenguaje natural usando la Wikipedia |
title_full |
Clasificación de textos en lenguaje natural usando la Wikipedia |
title_fullStr |
Clasificación de textos en lenguaje natural usando la Wikipedia |
title_full_unstemmed |
Clasificación de textos en lenguaje natural usando la Wikipedia |
title_sort |
Clasificación de textos en lenguaje natural usando la Wikipedia |
author |
Quinteiro-González,Jose María |
author_facet |
Quinteiro-González,Jose María Martel-Jordán,Ernestina Hernández-Morera,Pablo Ligero-Fleitas,Juan A. López-Rodriguez,Aaron |
author_role |
author |
author2 |
Martel-Jordán,Ernestina Hernández-Morera,Pablo Ligero-Fleitas,Juan A. López-Rodriguez,Aaron |
author2_role |
author author author author |
dc.contributor.author.fl_str_mv |
Quinteiro-González,Jose María Martel-Jordán,Ernestina Hernández-Morera,Pablo Ligero-Fleitas,Juan A. López-Rodriguez,Aaron |
dc.subject.por.fl_str_mv |
Categorización de textos Wikipedia tf-idf Aprendizaje Automático Procesado de Lenguaje Natural |
topic |
Categorización de textos Wikipedia tf-idf Aprendizaje Automático Procesado de Lenguaje Natural |
description |
La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático. |
publishDate |
2011 |
dc.date.none.fl_str_mv |
2011-12-01 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005 |
url |
http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005 |
dc.language.iso.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
text/html |
dc.publisher.none.fl_str_mv |
AISTI - Associação Ibérica de Sistemas e Tecnologias de Informação |
publisher.none.fl_str_mv |
AISTI - Associação Ibérica de Sistemas e Tecnologias de Informação |
dc.source.none.fl_str_mv |
RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação n.8 2011 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137366228598784 |