RHeSumaRST: um sumarizador automático de estruturas RST.

Detalhes bibliográficos
Autor(a) principal: Seno, Eloize Rossi Marques
Data de Publicação: 2005
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/623
Resumo: This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST and the Veins Theory VT. RST allows inter-relating discourse units by means of rhetorical relations. These, in turn, mirror meaning relations between those units. Adding to RST, VT delimits the domain of referential accessibility of each discourse unit of an RST tree, resulting in its vein . A vein signals, thus, the limits of a discourse unit that may enclose its anaphora antecedents. The automatic summarization model also embeds Marcu s model of salience: once a discourse is structured as an RST tree, its units are classified according to their salience by considering the its deep in the tree. The model consists of a set of pruning heuristics that aim at identifying superfluous information in an RST tree of a text. In excluding them, the resulting summary RST tree and, thus, the text summary, should preserve the co-referential chains. In this way, the heuristics are driven by both, specific features of RST relations and constraints on the referential accessibility provided by VT. The main contributions of this work include the proposal of the AS model itself and the availability of a prototype for its automatic exploration.
id SCAR_8a013666281ca3118b6e3598a8e78db6
oai_identifier_str oai:repositorio.ufscar.br:ufscar/623
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Seno, Eloize Rossi MarquesRino, Lúcia Helena Machadohttp://lattes.cnpq.br/0315640846525832http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4750346P8&dataRevisao=nullda08f7dd-73c5-4e31-bfb4-ea975e0ded7e2016-06-02T19:06:27Z2007-07-102016-06-02T19:06:27Z2005-08-05SENO, Eloize Rossi Marques. RHeSumaRST: um sumarizador automático de estruturas RST.. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.https://repositorio.ufscar.br/handle/ufscar/623This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST and the Veins Theory VT. RST allows inter-relating discourse units by means of rhetorical relations. These, in turn, mirror meaning relations between those units. Adding to RST, VT delimits the domain of referential accessibility of each discourse unit of an RST tree, resulting in its vein . A vein signals, thus, the limits of a discourse unit that may enclose its anaphora antecedents. The automatic summarization model also embeds Marcu s model of salience: once a discourse is structured as an RST tree, its units are classified according to their salience by considering the its deep in the tree. The model consists of a set of pruning heuristics that aim at identifying superfluous information in an RST tree of a text. In excluding them, the resulting summary RST tree and, thus, the text summary, should preserve the co-referential chains. In this way, the heuristics are driven by both, specific features of RST relations and constraints on the referential accessibility provided by VT. The main contributions of this work include the proposal of the AS model itself and the availability of a prototype for its automatic exploration.Este trabalho apresenta um modelo de sumarização automática que se baseia no modelo de estruturação de discurso Rhetorical Structure Theory RST e no modelo de coerência global do discurso Veins Theory VT. A RST permite a estruturação de um discurso relacionando-se unidades discursivas com base em relações retóricas, isto é, permitindo recuperar as relações de significados entre tais unidades. Com base na estruturação RST, a Veins Theory delimita o domínio de acessibilidade referencial para cada unidade do discurso na forma de veias , indicando os limites nos quais os antecedentes de uma anáfora podem ocorrer ao longo do discurso. Além dessas teorias, o modelo também incorpora o modelo de classificação de saliência de unidades discursivas proposto por Marcu (1997a), que obtém uma ordem de importância das unidades discursivas de uma estrutura RST. O modelo de sumarização proposto consiste em um elenco de heurísticas que visam identificar informações supérfluas em uma estrutura RST de um texto, para exclusão durante a construção do seu sumário, tendo sempre como foco a preservação dos elos coreferenciais. Dessa forma, as heurísticas são guiadas por características específicas das relações retóricas da RST e por restrições de acessibilidade referencial da Veins Theory. Assim, o sumarizador proposto se resume à poda de segmentos discursivos irrelevantes das estruturas RST de textos, resultando em seus correspondentes sumários. As principais contribuições deste trabalho são a proposta de um novo modelo de sumarização automática e um protótipo para a sua aplicação automática.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRProcessamento da linguagem natural (Computação)Sumarização automáticaInteligência artificialCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAORHeSumaRST: um sumarizador automático de estruturas RST.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1629307e8-d9f0-4e50-b2e4-e495b4d8b0fbinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissERMS.pdfapplication/pdf1350059https://repositorio.ufscar.br/bitstream/ufscar/623/1/DissERMS.pdfb053cbd6eaf16da40d372057cbe1d76dMD51THUMBNAILDissERMS.pdf.jpgDissERMS.pdf.jpgIM Thumbnailimage/jpeg5526https://repositorio.ufscar.br/bitstream/ufscar/623/2/DissERMS.pdf.jpg67a5cafa6f4ceeda4b841da7df47a05cMD52ufscar/6232023-09-18 18:30:37.856oai:repositorio.ufscar.br:ufscar/623Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:30:37Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv RHeSumaRST: um sumarizador automático de estruturas RST.
title RHeSumaRST: um sumarizador automático de estruturas RST.
spellingShingle RHeSumaRST: um sumarizador automático de estruturas RST.
Seno, Eloize Rossi Marques
Processamento da linguagem natural (Computação)
Sumarização automática
Inteligência artificial
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short RHeSumaRST: um sumarizador automático de estruturas RST.
title_full RHeSumaRST: um sumarizador automático de estruturas RST.
title_fullStr RHeSumaRST: um sumarizador automático de estruturas RST.
title_full_unstemmed RHeSumaRST: um sumarizador automático de estruturas RST.
title_sort RHeSumaRST: um sumarizador automático de estruturas RST.
author Seno, Eloize Rossi Marques
author_facet Seno, Eloize Rossi Marques
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4750346P8&dataRevisao=null
dc.contributor.author.fl_str_mv Seno, Eloize Rossi Marques
dc.contributor.advisor1.fl_str_mv Rino, Lúcia Helena Machado
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0315640846525832
dc.contributor.authorID.fl_str_mv da08f7dd-73c5-4e31-bfb4-ea975e0ded7e
contributor_str_mv Rino, Lúcia Helena Machado
dc.subject.por.fl_str_mv Processamento da linguagem natural (Computação)
Sumarização automática
Inteligência artificial
topic Processamento da linguagem natural (Computação)
Sumarização automática
Inteligência artificial
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST and the Veins Theory VT. RST allows inter-relating discourse units by means of rhetorical relations. These, in turn, mirror meaning relations between those units. Adding to RST, VT delimits the domain of referential accessibility of each discourse unit of an RST tree, resulting in its vein . A vein signals, thus, the limits of a discourse unit that may enclose its anaphora antecedents. The automatic summarization model also embeds Marcu s model of salience: once a discourse is structured as an RST tree, its units are classified according to their salience by considering the its deep in the tree. The model consists of a set of pruning heuristics that aim at identifying superfluous information in an RST tree of a text. In excluding them, the resulting summary RST tree and, thus, the text summary, should preserve the co-referential chains. In this way, the heuristics are driven by both, specific features of RST relations and constraints on the referential accessibility provided by VT. The main contributions of this work include the proposal of the AS model itself and the availability of a prototype for its automatic exploration.
publishDate 2005
dc.date.issued.fl_str_mv 2005-08-05
dc.date.available.fl_str_mv 2007-07-10
2016-06-02T19:06:27Z
dc.date.accessioned.fl_str_mv 2016-06-02T19:06:27Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SENO, Eloize Rossi Marques. RHeSumaRST: um sumarizador automático de estruturas RST.. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/623
identifier_str_mv SENO, Eloize Rossi Marques. RHeSumaRST: um sumarizador automático de estruturas RST.. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.
url https://repositorio.ufscar.br/handle/ufscar/623
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 629307e8-d9f0-4e50-b2e4-e495b4d8b0fb
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/623/1/DissERMS.pdf
https://repositorio.ufscar.br/bitstream/ufscar/623/2/DissERMS.pdf.jpg
bitstream.checksum.fl_str_mv b053cbd6eaf16da40d372057cbe1d76d
67a5cafa6f4ceeda4b841da7df47a05c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136245819670528