La compresión de frases: un recurso para la optimización de resumen automático de documentos

Detalhes bibliográficos
Autor(a) principal: Molina, Alejandro
Data de Publicação: 2011
Outros Autores: da Cunha, Iria, Torres-Moreno, Juan-Manuel, Velazquez-Morales, Patricia
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://linguamatica.com/index.php/linguamatica/article/view/72
Resumo: El objetivo de este trabajo de investigación es confirmar si es adecuado emplear la compresión de frases como recurso para la optimización de sistemas de resumen automático de documentos. Para ello, en primer lugar, creamos un corpus de resúmenes de documentos especializados (artículos médicos) producidos por diversos sistemas de resumen automático.  Posteriormente realizamos dos tipos de compresiones de estos resúmenes.  Por un lado, llevamos a cabo una compresión manual, siguiendo dos estrategias: la compresión mediante la eliminación intuitiva de algunos elementos de la oración y la compresión mediante la eliminación de ciertos elementos discursivos en el marco de la Rhetorical Structure Theory (RST).  Por otro lado, realizamos una compresión automática por medio de varias estrategias, basadas en la eliminación de palabras de ciertas categorías gramaticales (adjetivos y adverbios) y una baseline de eliminación aleatoria de palabras.  Finalmente, comparamos los resúmenes originales con los resúmenes comprimidos, mediante el sistema de evaluación Rouge. Los resultados muestran que, en ciertas condiciones, utilizar la compresión de frases puede ser beneficioso para mejorar el resumen automático de documentos.
id RCAP_ac1e1aa31166cf0f96923cb0831c0ba8
oai_identifier_str oai:linguamatica.com:article/72
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling La compresión de frases: un recurso para la optimización de resumen automático de documentossentence compressionspecialized corporainformation retrievalautomatic summarizationcompression de frasesresumen automaticocorpus especializadosbusqueda de informacioncompressão de frasescorpora especializadosbusca de informaçãosumarização automáticaEl objetivo de este trabajo de investigación es confirmar si es adecuado emplear la compresión de frases como recurso para la optimización de sistemas de resumen automático de documentos. Para ello, en primer lugar, creamos un corpus de resúmenes de documentos especializados (artículos médicos) producidos por diversos sistemas de resumen automático.  Posteriormente realizamos dos tipos de compresiones de estos resúmenes.  Por un lado, llevamos a cabo una compresión manual, siguiendo dos estrategias: la compresión mediante la eliminación intuitiva de algunos elementos de la oración y la compresión mediante la eliminación de ciertos elementos discursivos en el marco de la Rhetorical Structure Theory (RST).  Por otro lado, realizamos una compresión automática por medio de varias estrategias, basadas en la eliminación de palabras de ciertas categorías gramaticales (adjetivos y adverbios) y una baseline de eliminación aleatoria de palabras.  Finalmente, comparamos los resúmenes originales con los resúmenes comprimidos, mediante el sistema de evaluación Rouge. Los resultados muestran que, en ciertas condiciones, utilizar la compresión de frases puede ser beneficioso para mejorar el resumen automático de documentos.Universidade do Minho e Universidade de Vigo2011-01-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://linguamatica.com/index.php/linguamatica/article/view/72Linguamática; Vol. 2 No. 3; 13-27Linguamática; Vol. 2 Núm. 3; 13-27Linguamática; v. 2 n. 3; 13-271647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/72https://linguamatica.com/index.php/linguamatica/article/view/72/96Molina, Alejandroda Cunha, IriaTorres-Moreno, Juan-ManuelVelazquez-Morales, Patriciainfo:eu-repo/semantics/openAccess2023-09-08T13:46:18Zoai:linguamatica.com:article/72Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:33.882556Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv La compresión de frases: un recurso para la optimización de resumen automático de documentos
title La compresión de frases: un recurso para la optimización de resumen automático de documentos
spellingShingle La compresión de frases: un recurso para la optimización de resumen automático de documentos
Molina, Alejandro
sentence compression
specialized corpora
information retrieval
automatic summarization
compression de frases
resumen automatico
corpus especializados
busqueda de informacion
compressão de frases
corpora especializados
busca de informação
sumarização automática
title_short La compresión de frases: un recurso para la optimización de resumen automático de documentos
title_full La compresión de frases: un recurso para la optimización de resumen automático de documentos
title_fullStr La compresión de frases: un recurso para la optimización de resumen automático de documentos
title_full_unstemmed La compresión de frases: un recurso para la optimización de resumen automático de documentos
title_sort La compresión de frases: un recurso para la optimización de resumen automático de documentos
author Molina, Alejandro
author_facet Molina, Alejandro
da Cunha, Iria
Torres-Moreno, Juan-Manuel
Velazquez-Morales, Patricia
author_role author
author2 da Cunha, Iria
Torres-Moreno, Juan-Manuel
Velazquez-Morales, Patricia
author2_role author
author
author
dc.contributor.author.fl_str_mv Molina, Alejandro
da Cunha, Iria
Torres-Moreno, Juan-Manuel
Velazquez-Morales, Patricia
dc.subject.por.fl_str_mv sentence compression
specialized corpora
information retrieval
automatic summarization
compression de frases
resumen automatico
corpus especializados
busqueda de informacion
compressão de frases
corpora especializados
busca de informação
sumarização automática
topic sentence compression
specialized corpora
information retrieval
automatic summarization
compression de frases
resumen automatico
corpus especializados
busqueda de informacion
compressão de frases
corpora especializados
busca de informação
sumarização automática
description El objetivo de este trabajo de investigación es confirmar si es adecuado emplear la compresión de frases como recurso para la optimización de sistemas de resumen automático de documentos. Para ello, en primer lugar, creamos un corpus de resúmenes de documentos especializados (artículos médicos) producidos por diversos sistemas de resumen automático.  Posteriormente realizamos dos tipos de compresiones de estos resúmenes.  Por un lado, llevamos a cabo una compresión manual, siguiendo dos estrategias: la compresión mediante la eliminación intuitiva de algunos elementos de la oración y la compresión mediante la eliminación de ciertos elementos discursivos en el marco de la Rhetorical Structure Theory (RST).  Por otro lado, realizamos una compresión automática por medio de varias estrategias, basadas en la eliminación de palabras de ciertas categorías gramaticales (adjetivos y adverbios) y una baseline de eliminación aleatoria de palabras.  Finalmente, comparamos los resúmenes originales con los resúmenes comprimidos, mediante el sistema de evaluación Rouge. Los resultados muestran que, en ciertas condiciones, utilizar la compresión de frases puede ser beneficioso para mejorar el resumen automático de documentos.
publishDate 2011
dc.date.none.fl_str_mv 2011-01-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/72
url https://linguamatica.com/index.php/linguamatica/article/view/72
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/72
https://linguamatica.com/index.php/linguamatica/article/view/72/96
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
dc.source.none.fl_str_mv Linguamática; Vol. 2 No. 3; 13-27
Linguamática; Vol. 2 Núm. 3; 13-27
Linguamática; v. 2 n. 3; 13-27
1647-0818
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133553142792192