Un algoritmo lingüístico-estadístico para resumen automático de textos especializados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Outros Autores: | , , |
Tipo de documento: | Artigo |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://linguamatica.com/index.php/linguamatica/article/view/33 |
Resumo: | En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio. |
id |
RCAP_d0b6ea1bd6fdf8773988dd3d2b9c4ce3 |
---|---|
oai_identifier_str |
oai:linguamatica.com:article/33 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializadossummarizationlinguistic modelsstatistic modelsCortexDisicosumEnertexresumen automaticomodelos linguisticosmodelos estadisticosCortexDisicosumEnertexsumarizaçãomodelos linguísticosmodelos estatísticosCortexDisicosumEnertexEn este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio.Universidade do Minho e Universidade de Vigo2009-11-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://linguamatica.com/index.php/linguamatica/article/view/33Linguamática; Vol. 1 No. 2; 67-79Linguamática; Vol. 1 Núm. 2; 67-79Linguamática; v. 1 n. 2; 67-791647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPenghttps://linguamatica.com/index.php/linguamatica/article/view/33https://linguamatica.com/index.php/linguamatica/article/view/33/38Da Cunha, IriaTorres-Moreno, Juan-ManuelVelazquez-Morales, PatriciaVivaldi, Jorgeinfo:eu-repo/semantics/openAccess2023-09-08T13:46:12Zoai:linguamatica.com:article/33Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:32.933274Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializados |
title |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializados |
spellingShingle |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializados Da Cunha, Iria summarization linguistic models statistic models Cortex Disicosum Enertex resumen automatico modelos linguisticos modelos estadisticos Cortex Disicosum Enertex sumarização modelos linguísticos modelos estatísticos Cortex Disicosum Enertex |
title_short |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializados |
title_full |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializados |
title_fullStr |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializados |
title_full_unstemmed |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializados |
title_sort |
Un algoritmo lingüístico-estadístico para resumen automático de textos especializados |
author |
Da Cunha, Iria |
author_facet |
Da Cunha, Iria Torres-Moreno, Juan-Manuel Velazquez-Morales, Patricia Vivaldi, Jorge |
author_role |
author |
author2 |
Torres-Moreno, Juan-Manuel Velazquez-Morales, Patricia Vivaldi, Jorge |
author2_role |
author author author |
dc.contributor.author.fl_str_mv |
Da Cunha, Iria Torres-Moreno, Juan-Manuel Velazquez-Morales, Patricia Vivaldi, Jorge |
dc.subject.por.fl_str_mv |
summarization linguistic models statistic models Cortex Disicosum Enertex resumen automatico modelos linguisticos modelos estadisticos Cortex Disicosum Enertex sumarização modelos linguísticos modelos estatísticos Cortex Disicosum Enertex |
topic |
summarization linguistic models statistic models Cortex Disicosum Enertex resumen automatico modelos linguisticos modelos estadisticos Cortex Disicosum Enertex sumarização modelos linguísticos modelos estatísticos Cortex Disicosum Enertex |
description |
En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio. |
publishDate |
2009 |
dc.date.none.fl_str_mv |
2009-11-21 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://linguamatica.com/index.php/linguamatica/article/view/33 |
url |
https://linguamatica.com/index.php/linguamatica/article/view/33 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
https://linguamatica.com/index.php/linguamatica/article/view/33 https://linguamatica.com/index.php/linguamatica/article/view/33/38 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
dc.source.none.fl_str_mv |
Linguamática; Vol. 1 No. 2; 67-79 Linguamática; Vol. 1 Núm. 2; 67-79 Linguamática; v. 1 n. 2; 67-79 1647-0818 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133553109237760 |