Clasificación de textos en lenguaje natural usando la Wikipedia

Detalhes bibliográficos
Autor(a) principal: Quinteiro-González,Jose María
Data de Publicação: 2011
Outros Autores: Martel-Jordán,Ernestina, Hernández-Morera,Pablo, Ligero-Fleitas,Juan A., López-Rodriguez,Aaron
Tipo de documento: Artigo
Idioma: spa
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005
Resumo: La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.
id RCAP_7f4c6997fe9dd90aca7f35b56c5a2c22
oai_identifier_str oai:scielo:S1646-98952011000200005
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Clasificación de textos en lenguaje natural usando la WikipediaCategorización de textosWikipediatf-idfAprendizaje AutomáticoProcesado de Lenguaje NaturalLa clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.AISTI - Associação Ibérica de Sistemas e Tecnologias de Informação2011-12-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articletext/htmlhttp://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação n.8 2011reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPspahttp://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005Quinteiro-González,Jose MaríaMartel-Jordán,ErnestinaHernández-Morera,PabloLigero-Fleitas,Juan A.López-Rodriguez,Aaroninfo:eu-repo/semantics/openAccess2024-02-06T17:23:59Zoai:scielo:S1646-98952011000200005Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:29:58.747487Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Clasificación de textos en lenguaje natural usando la Wikipedia
title Clasificación de textos en lenguaje natural usando la Wikipedia
spellingShingle Clasificación de textos en lenguaje natural usando la Wikipedia
Quinteiro-González,Jose María
Categorización de textos
Wikipedia
tf-idf
Aprendizaje Automático
Procesado de Lenguaje Natural
title_short Clasificación de textos en lenguaje natural usando la Wikipedia
title_full Clasificación de textos en lenguaje natural usando la Wikipedia
title_fullStr Clasificación de textos en lenguaje natural usando la Wikipedia
title_full_unstemmed Clasificación de textos en lenguaje natural usando la Wikipedia
title_sort Clasificación de textos en lenguaje natural usando la Wikipedia
author Quinteiro-González,Jose María
author_facet Quinteiro-González,Jose María
Martel-Jordán,Ernestina
Hernández-Morera,Pablo
Ligero-Fleitas,Juan A.
López-Rodriguez,Aaron
author_role author
author2 Martel-Jordán,Ernestina
Hernández-Morera,Pablo
Ligero-Fleitas,Juan A.
López-Rodriguez,Aaron
author2_role author
author
author
author
dc.contributor.author.fl_str_mv Quinteiro-González,Jose María
Martel-Jordán,Ernestina
Hernández-Morera,Pablo
Ligero-Fleitas,Juan A.
López-Rodriguez,Aaron
dc.subject.por.fl_str_mv Categorización de textos
Wikipedia
tf-idf
Aprendizaje Automático
Procesado de Lenguaje Natural
topic Categorización de textos
Wikipedia
tf-idf
Aprendizaje Automático
Procesado de Lenguaje Natural
description La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.
publishDate 2011
dc.date.none.fl_str_mv 2011-12-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005
url http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005
dc.language.iso.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952011000200005
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv text/html
dc.publisher.none.fl_str_mv AISTI - Associação Ibérica de Sistemas e Tecnologias de Informação
publisher.none.fl_str_mv AISTI - Associação Ibérica de Sistemas e Tecnologias de Informação
dc.source.none.fl_str_mv RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação n.8 2011
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137366228598784