RHeSumaRST: um sumarizador automático de estruturas RST.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2005 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/623 |
Resumo: | This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST and the Veins Theory VT. RST allows inter-relating discourse units by means of rhetorical relations. These, in turn, mirror meaning relations between those units. Adding to RST, VT delimits the domain of referential accessibility of each discourse unit of an RST tree, resulting in its vein . A vein signals, thus, the limits of a discourse unit that may enclose its anaphora antecedents. The automatic summarization model also embeds Marcu s model of salience: once a discourse is structured as an RST tree, its units are classified according to their salience by considering the its deep in the tree. The model consists of a set of pruning heuristics that aim at identifying superfluous information in an RST tree of a text. In excluding them, the resulting summary RST tree and, thus, the text summary, should preserve the co-referential chains. In this way, the heuristics are driven by both, specific features of RST relations and constraints on the referential accessibility provided by VT. The main contributions of this work include the proposal of the AS model itself and the availability of a prototype for its automatic exploration. |
id |
SCAR_8a013666281ca3118b6e3598a8e78db6 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/623 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Seno, Eloize Rossi MarquesRino, Lúcia Helena Machadohttp://lattes.cnpq.br/0315640846525832http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4750346P8&dataRevisao=nullda08f7dd-73c5-4e31-bfb4-ea975e0ded7e2016-06-02T19:06:27Z2007-07-102016-06-02T19:06:27Z2005-08-05SENO, Eloize Rossi Marques. RHeSumaRST: um sumarizador automático de estruturas RST.. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.https://repositorio.ufscar.br/handle/ufscar/623This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST and the Veins Theory VT. RST allows inter-relating discourse units by means of rhetorical relations. These, in turn, mirror meaning relations between those units. Adding to RST, VT delimits the domain of referential accessibility of each discourse unit of an RST tree, resulting in its vein . A vein signals, thus, the limits of a discourse unit that may enclose its anaphora antecedents. The automatic summarization model also embeds Marcu s model of salience: once a discourse is structured as an RST tree, its units are classified according to their salience by considering the its deep in the tree. The model consists of a set of pruning heuristics that aim at identifying superfluous information in an RST tree of a text. In excluding them, the resulting summary RST tree and, thus, the text summary, should preserve the co-referential chains. In this way, the heuristics are driven by both, specific features of RST relations and constraints on the referential accessibility provided by VT. The main contributions of this work include the proposal of the AS model itself and the availability of a prototype for its automatic exploration.Este trabalho apresenta um modelo de sumarização automática que se baseia no modelo de estruturação de discurso Rhetorical Structure Theory RST e no modelo de coerência global do discurso Veins Theory VT. A RST permite a estruturação de um discurso relacionando-se unidades discursivas com base em relações retóricas, isto é, permitindo recuperar as relações de significados entre tais unidades. Com base na estruturação RST, a Veins Theory delimita o domínio de acessibilidade referencial para cada unidade do discurso na forma de veias , indicando os limites nos quais os antecedentes de uma anáfora podem ocorrer ao longo do discurso. Além dessas teorias, o modelo também incorpora o modelo de classificação de saliência de unidades discursivas proposto por Marcu (1997a), que obtém uma ordem de importância das unidades discursivas de uma estrutura RST. O modelo de sumarização proposto consiste em um elenco de heurísticas que visam identificar informações supérfluas em uma estrutura RST de um texto, para exclusão durante a construção do seu sumário, tendo sempre como foco a preservação dos elos coreferenciais. Dessa forma, as heurísticas são guiadas por características específicas das relações retóricas da RST e por restrições de acessibilidade referencial da Veins Theory. Assim, o sumarizador proposto se resume à poda de segmentos discursivos irrelevantes das estruturas RST de textos, resultando em seus correspondentes sumários. As principais contribuições deste trabalho são a proposta de um novo modelo de sumarização automática e um protótipo para a sua aplicação automática.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRProcessamento da linguagem natural (Computação)Sumarização automáticaInteligência artificialCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAORHeSumaRST: um sumarizador automático de estruturas RST.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1629307e8-d9f0-4e50-b2e4-e495b4d8b0fbinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissERMS.pdfapplication/pdf1350059https://repositorio.ufscar.br/bitstream/ufscar/623/1/DissERMS.pdfb053cbd6eaf16da40d372057cbe1d76dMD51THUMBNAILDissERMS.pdf.jpgDissERMS.pdf.jpgIM Thumbnailimage/jpeg5526https://repositorio.ufscar.br/bitstream/ufscar/623/2/DissERMS.pdf.jpg67a5cafa6f4ceeda4b841da7df47a05cMD52ufscar/6232023-09-18 18:30:37.856oai:repositorio.ufscar.br:ufscar/623Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:30:37Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
RHeSumaRST: um sumarizador automático de estruturas RST. |
title |
RHeSumaRST: um sumarizador automático de estruturas RST. |
spellingShingle |
RHeSumaRST: um sumarizador automático de estruturas RST. Seno, Eloize Rossi Marques Processamento da linguagem natural (Computação) Sumarização automática Inteligência artificial CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
RHeSumaRST: um sumarizador automático de estruturas RST. |
title_full |
RHeSumaRST: um sumarizador automático de estruturas RST. |
title_fullStr |
RHeSumaRST: um sumarizador automático de estruturas RST. |
title_full_unstemmed |
RHeSumaRST: um sumarizador automático de estruturas RST. |
title_sort |
RHeSumaRST: um sumarizador automático de estruturas RST. |
author |
Seno, Eloize Rossi Marques |
author_facet |
Seno, Eloize Rossi Marques |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4750346P8&dataRevisao=null |
dc.contributor.author.fl_str_mv |
Seno, Eloize Rossi Marques |
dc.contributor.advisor1.fl_str_mv |
Rino, Lúcia Helena Machado |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0315640846525832 |
dc.contributor.authorID.fl_str_mv |
da08f7dd-73c5-4e31-bfb4-ea975e0ded7e |
contributor_str_mv |
Rino, Lúcia Helena Machado |
dc.subject.por.fl_str_mv |
Processamento da linguagem natural (Computação) Sumarização automática Inteligência artificial |
topic |
Processamento da linguagem natural (Computação) Sumarização automática Inteligência artificial CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
This work presents an automatic summarization model based on both the Rhetorical Structure Theory RST and the Veins Theory VT. RST allows inter-relating discourse units by means of rhetorical relations. These, in turn, mirror meaning relations between those units. Adding to RST, VT delimits the domain of referential accessibility of each discourse unit of an RST tree, resulting in its vein . A vein signals, thus, the limits of a discourse unit that may enclose its anaphora antecedents. The automatic summarization model also embeds Marcu s model of salience: once a discourse is structured as an RST tree, its units are classified according to their salience by considering the its deep in the tree. The model consists of a set of pruning heuristics that aim at identifying superfluous information in an RST tree of a text. In excluding them, the resulting summary RST tree and, thus, the text summary, should preserve the co-referential chains. In this way, the heuristics are driven by both, specific features of RST relations and constraints on the referential accessibility provided by VT. The main contributions of this work include the proposal of the AS model itself and the availability of a prototype for its automatic exploration. |
publishDate |
2005 |
dc.date.issued.fl_str_mv |
2005-08-05 |
dc.date.available.fl_str_mv |
2007-07-10 2016-06-02T19:06:27Z |
dc.date.accessioned.fl_str_mv |
2016-06-02T19:06:27Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SENO, Eloize Rossi Marques. RHeSumaRST: um sumarizador automático de estruturas RST.. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/623 |
identifier_str_mv |
SENO, Eloize Rossi Marques. RHeSumaRST: um sumarizador automático de estruturas RST.. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005. |
url |
https://repositorio.ufscar.br/handle/ufscar/623 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
-1 -1 |
dc.relation.authority.fl_str_mv |
629307e8-d9f0-4e50-b2e4-e495b4d8b0fb |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/623/1/DissERMS.pdf https://repositorio.ufscar.br/bitstream/ufscar/623/2/DissERMS.pdf.jpg |
bitstream.checksum.fl_str_mv |
b053cbd6eaf16da40d372057cbe1d76d 67a5cafa6f4ceeda4b841da7df47a05c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136245819670528 |