Simplificação automática de sentenças com ênfase no método split-and-rephrase

Detalhes bibliográficos
Autor(a) principal: Berlanga Neto, Paulo
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-18102021-210029/
Resumo: Simplificação de texto (ST) é um processo de transformação da linguagem natural para redução de sua complexidade e aumento de sua compreensão. No cerne deste problema, está a necessidade de uma preservação semântica adequada em conjunto com a melhoria da inteligibilidade. No campo de processamento de linguagem natural, abordagens recentes para a tarefa de simplificação automática de textos têm visto este processo de maneira holística ou abrangente. Muitas das ideias aplicadas são emprestadas pela tarefa de tradução automática, considerando que a simplificação pode ser vista como uma ação de tradução monolíngue entre um texto complexo e simples. Ao ponderar ainda que textos considerados complexos podem conter uma parcela de sentenças simples em sua composição, estudos recentes têm endereçado aspectos específicos da linguagem no âmbito de sentenças. Nesta pesquisa, visitamos a tarefa de simplificação automática de sentenças, apresentando características de abordagens recentes e propondo a construção de um pipeline computacional próprio para o aprendizado artificial do método split-and-rephrase. Este método busca particionar uma sentença singular de entrada em duas ou mais sentenças reescritas de saída que juntas mantêm o significado equivalente, com a concepção de que sentenças mais curtas beneficiam a compreensão na leitura humana e aprimoram o desempenho de tarefas relacionadas em processamento de linguagem natural.
id USP_cf57cff9ec9e59380017c67ae5fc5242
oai_identifier_str oai:teses.usp.br:tde-18102021-210029
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Simplificação automática de sentenças com ênfase no método split-and-rephraseSentence simplification with emphasis on split-and-rephrase methodNatural language processingProcessamento de linguagem naturalSentence simplificationSimplificação de sentençasSplit-and-rephraseSplit-and-rephraseSimplificação de texto (ST) é um processo de transformação da linguagem natural para redução de sua complexidade e aumento de sua compreensão. No cerne deste problema, está a necessidade de uma preservação semântica adequada em conjunto com a melhoria da inteligibilidade. No campo de processamento de linguagem natural, abordagens recentes para a tarefa de simplificação automática de textos têm visto este processo de maneira holística ou abrangente. Muitas das ideias aplicadas são emprestadas pela tarefa de tradução automática, considerando que a simplificação pode ser vista como uma ação de tradução monolíngue entre um texto complexo e simples. Ao ponderar ainda que textos considerados complexos podem conter uma parcela de sentenças simples em sua composição, estudos recentes têm endereçado aspectos específicos da linguagem no âmbito de sentenças. Nesta pesquisa, visitamos a tarefa de simplificação automática de sentenças, apresentando características de abordagens recentes e propondo a construção de um pipeline computacional próprio para o aprendizado artificial do método split-and-rephrase. Este método busca particionar uma sentença singular de entrada em duas ou mais sentenças reescritas de saída que juntas mantêm o significado equivalente, com a concepção de que sentenças mais curtas beneficiam a compreensão na leitura humana e aprimoram o desempenho de tarefas relacionadas em processamento de linguagem natural.Text Simplification (TS) is transforming natural language to reduce its complexity and improve its comprehension. At the heart of this problem is the need for adequate semantic preservation together with improved readability. In natural language processing, recent approaches to the automatic text simplification task have seen this process holistically. Many of the ideas applied are borrowed from the machine translation (MT) task since simplification can be considered a monolingual translation between complex and simple texts. Given that texts considered complex may contain a portion of simple sentences in their composition, recent studies have considered specific aspects of the language at the sentence level. In this research, we visited the sentence simplification task, presenting characteristics of recent approaches and proposing the construction of a computational pipeline to address the split-and-rephrase method. This method seeks to split one single input sentence into two or more output sentences that retain equivalent meaning, conceptualizing the notion that shorter sentences benefit human reading comprehension and improve the performance of natural language processing-related tasks.Biblioteca Digitais de Teses e Dissertações da USPRuiz, Evandro Eduardo SeronBerlanga Neto, Paulo2021-09-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-18102021-210029/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2021-11-12T17:23:02Zoai:teses.usp.br:tde-18102021-210029Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-11-12T17:23:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Simplificação automática de sentenças com ênfase no método split-and-rephrase
Sentence simplification with emphasis on split-and-rephrase method
title Simplificação automática de sentenças com ênfase no método split-and-rephrase
spellingShingle Simplificação automática de sentenças com ênfase no método split-and-rephrase
Berlanga Neto, Paulo
Natural language processing
Processamento de linguagem natural
Sentence simplification
Simplificação de sentenças
Split-and-rephrase
Split-and-rephrase
title_short Simplificação automática de sentenças com ênfase no método split-and-rephrase
title_full Simplificação automática de sentenças com ênfase no método split-and-rephrase
title_fullStr Simplificação automática de sentenças com ênfase no método split-and-rephrase
title_full_unstemmed Simplificação automática de sentenças com ênfase no método split-and-rephrase
title_sort Simplificação automática de sentenças com ênfase no método split-and-rephrase
author Berlanga Neto, Paulo
author_facet Berlanga Neto, Paulo
author_role author
dc.contributor.none.fl_str_mv Ruiz, Evandro Eduardo Seron
dc.contributor.author.fl_str_mv Berlanga Neto, Paulo
dc.subject.por.fl_str_mv Natural language processing
Processamento de linguagem natural
Sentence simplification
Simplificação de sentenças
Split-and-rephrase
Split-and-rephrase
topic Natural language processing
Processamento de linguagem natural
Sentence simplification
Simplificação de sentenças
Split-and-rephrase
Split-and-rephrase
description Simplificação de texto (ST) é um processo de transformação da linguagem natural para redução de sua complexidade e aumento de sua compreensão. No cerne deste problema, está a necessidade de uma preservação semântica adequada em conjunto com a melhoria da inteligibilidade. No campo de processamento de linguagem natural, abordagens recentes para a tarefa de simplificação automática de textos têm visto este processo de maneira holística ou abrangente. Muitas das ideias aplicadas são emprestadas pela tarefa de tradução automática, considerando que a simplificação pode ser vista como uma ação de tradução monolíngue entre um texto complexo e simples. Ao ponderar ainda que textos considerados complexos podem conter uma parcela de sentenças simples em sua composição, estudos recentes têm endereçado aspectos específicos da linguagem no âmbito de sentenças. Nesta pesquisa, visitamos a tarefa de simplificação automática de sentenças, apresentando características de abordagens recentes e propondo a construção de um pipeline computacional próprio para o aprendizado artificial do método split-and-rephrase. Este método busca particionar uma sentença singular de entrada em duas ou mais sentenças reescritas de saída que juntas mantêm o significado equivalente, com a concepção de que sentenças mais curtas beneficiam a compreensão na leitura humana e aprimoram o desempenho de tarefas relacionadas em processamento de linguagem natural.
publishDate 2021
dc.date.none.fl_str_mv 2021-09-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/59/59143/tde-18102021-210029/
url https://www.teses.usp.br/teses/disponiveis/59/59143/tde-18102021-210029/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090842532511744