Análise automática de coerência semântica em recursos acadêmicos escritos em português

Detalhes bibliográficos
Autor(a) principal: Souza, Vinícius Mourão Alves de
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
Texto Completo: http://repositorio.uem.br:8080/jspui/handle/1/2540
Resumo: The abstract can be considered one of the most important sections of an academic work. Along with the title, it is used by researchers to disseminate their research in scientic circles. In this context, Feltrim (2004) proposed an environment to support the writing of Abstract and Introduction sections called SciPo. This environment provides writing support by means of criticism and suggestions presented to the user with respect to the rhetorical (or schematic) structure identified in text submitted for analysis. Although the SciPo provides feedback indicating which parts of the text should be improved, it does not analyze features related to semantics, such as coherence, which is essential to the readability and interpretability of the text. Therefore, the main goal of this research was to develop computional resources to the automatic detection of semantic aspects of the Abstract section. We use these resources for the return of new suggestions related to coherence in the SciPo enviroment. In particular, we develop classifiers based on a set of features extracted automatically from the surface of the text and from the LSA technique - Latent Semantic Analysis and machine learning algorithms. Thus, the classifiers provide indications on the semantic aspects that contribute to the abstract is considered coherent. Both the intrinsic assessments of the classifiers as the evaluation of the prototype in a context of use with real users demonstrated the potential of classifiers to aid writing academics abstracts with higher lever of coherence through new suggestions.
id UEM-10_dd280afe952c02dc83fba0214bb487de
oai_identifier_str oai:localhost:1/2540
network_acronym_str UEM-10
network_name_str Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
repository_id_str
spelling Análise automática de coerência semântica em recursos acadêmicos escritos em portuguêsResumo acadêmicoCiência da computaçãoCoerência semânticaAnálise automáticaAnálise de semântica LatenteLatent Semantic AnalysisSciPo (Scientific Portuguese)Ambiente de auxílio à escritaNatural Language Processing.Academic abstractSemantic cohereceAutomatic analysis of coherenceLatent Semantic Analysis.Ciências Exatas e da TerraCiência da ComputaçãoThe abstract can be considered one of the most important sections of an academic work. Along with the title, it is used by researchers to disseminate their research in scientic circles. In this context, Feltrim (2004) proposed an environment to support the writing of Abstract and Introduction sections called SciPo. This environment provides writing support by means of criticism and suggestions presented to the user with respect to the rhetorical (or schematic) structure identified in text submitted for analysis. Although the SciPo provides feedback indicating which parts of the text should be improved, it does not analyze features related to semantics, such as coherence, which is essential to the readability and interpretability of the text. Therefore, the main goal of this research was to develop computional resources to the automatic detection of semantic aspects of the Abstract section. We use these resources for the return of new suggestions related to coherence in the SciPo enviroment. In particular, we develop classifiers based on a set of features extracted automatically from the surface of the text and from the LSA technique - Latent Semantic Analysis and machine learning algorithms. Thus, the classifiers provide indications on the semantic aspects that contribute to the abstract is considered coherent. Both the intrinsic assessments of the classifiers as the evaluation of the prototype in a context of use with real users demonstrated the potential of classifiers to aid writing academics abstracts with higher lever of coherence through new suggestions.O resumo pode ser considerado uma das seções mais importantes de um trabalho acadêmico, dado que, em conjunto com o título, é utilizado por pesquisadores na divulgação de suas pesquisas no meio científico. Nesse sentido, com o objetivo de auxiliar o processo de escrita das seções Resumo e Introdução de teses e dissertações da área de Ciência da Computação em português, Feltrim (2004) propôs um ambiente de auxílio à escrita denominado SciPo. O auxílio fornecido pelo SciPo é dado por meio de críticas e sugestões apresentadas ao usuário em relação ao uso da estrutura retórica (ou esquemática) identificada no texto submetido a análise. Embora o ambiente forneça feedback indicando quais pontos do texto devem ser melhorados, não analisa características relacionadas à semântica do texto, como a coerência, fundamental para a legibilidade e interpretabilidade do texto. Dessa maneira, o principal objetivo deste trabalho foi desenvolver recursos computacionais para a detecção automática de aspectos semânticos da seção Resumo de trabalhos acadêmicos escritos em português, de modo que eles possam ser utilizados pelo SciPo para o retorno de sugestões relacionadas à coerência. Mais especificamente, foram desenvolvidos classificadores que, com base em um certo conjunto de características extraídas automaticamente da superfície do texto e a partir da técnica LSA - Latent Semantic Analysis e de algoritmos de aprendizagem de máquina supervisionados, apresentam indicações sobre aspectos semânticos que contribuem para que o resumo seja considerado coerente. Tanto as avaliações intrínsecas dos classificadores quanto a avaliação do protótipo em um contexto de uso com usuários reais demonstraram o potencial dos classificadores no auxílio à escrita de resumos acadêmicos com um nível maior de coerência por meio da apresentação das novas sugestões.132 fUniversidade Estadual de MaringáBrasilDepartamento de InformáticaPrograma de Pós-Graduação em Ciência da ComputaçãoUEMMaringá, PRCentro de TecnologiaValéria Delisandra FeltrimSérgio Roberto Pereira da Silva - UEMThiago Alexandre Salgueiro Pardo - UCMC/USPSouza, Vinícius Mourão Alves de2018-04-10T20:12:23Z2018-04-10T20:12:23Z2011info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://repositorio.uem.br:8080/jspui/handle/1/2540porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)instname:Universidade Estadual de Maringá (UEM)instacron:UEM2018-10-18T19:20:34Zoai:localhost:1/2540Repositório InstitucionalPUBhttp://repositorio.uem.br:8080/oai/requestopendoar:2024-04-23T14:55:36.060079Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)false
dc.title.none.fl_str_mv Análise automática de coerência semântica em recursos acadêmicos escritos em português
title Análise automática de coerência semântica em recursos acadêmicos escritos em português
spellingShingle Análise automática de coerência semântica em recursos acadêmicos escritos em português
Souza, Vinícius Mourão Alves de
Resumo acadêmico
Ciência da computação
Coerência semântica
Análise automática
Análise de semântica Latente
Latent Semantic Analysis
SciPo (Scientific Portuguese)
Ambiente de auxílio à escrita
Natural Language Processing.
Academic abstract
Semantic coherece
Automatic analysis of coherence
Latent Semantic Analysis.
Ciências Exatas e da Terra
Ciência da Computação
title_short Análise automática de coerência semântica em recursos acadêmicos escritos em português
title_full Análise automática de coerência semântica em recursos acadêmicos escritos em português
title_fullStr Análise automática de coerência semântica em recursos acadêmicos escritos em português
title_full_unstemmed Análise automática de coerência semântica em recursos acadêmicos escritos em português
title_sort Análise automática de coerência semântica em recursos acadêmicos escritos em português
author Souza, Vinícius Mourão Alves de
author_facet Souza, Vinícius Mourão Alves de
author_role author
dc.contributor.none.fl_str_mv Valéria Delisandra Feltrim
Sérgio Roberto Pereira da Silva - UEM
Thiago Alexandre Salgueiro Pardo - UCMC/USP
dc.contributor.author.fl_str_mv Souza, Vinícius Mourão Alves de
dc.subject.por.fl_str_mv Resumo acadêmico
Ciência da computação
Coerência semântica
Análise automática
Análise de semântica Latente
Latent Semantic Analysis
SciPo (Scientific Portuguese)
Ambiente de auxílio à escrita
Natural Language Processing.
Academic abstract
Semantic coherece
Automatic analysis of coherence
Latent Semantic Analysis.
Ciências Exatas e da Terra
Ciência da Computação
topic Resumo acadêmico
Ciência da computação
Coerência semântica
Análise automática
Análise de semântica Latente
Latent Semantic Analysis
SciPo (Scientific Portuguese)
Ambiente de auxílio à escrita
Natural Language Processing.
Academic abstract
Semantic coherece
Automatic analysis of coherence
Latent Semantic Analysis.
Ciências Exatas e da Terra
Ciência da Computação
description The abstract can be considered one of the most important sections of an academic work. Along with the title, it is used by researchers to disseminate their research in scientic circles. In this context, Feltrim (2004) proposed an environment to support the writing of Abstract and Introduction sections called SciPo. This environment provides writing support by means of criticism and suggestions presented to the user with respect to the rhetorical (or schematic) structure identified in text submitted for analysis. Although the SciPo provides feedback indicating which parts of the text should be improved, it does not analyze features related to semantics, such as coherence, which is essential to the readability and interpretability of the text. Therefore, the main goal of this research was to develop computional resources to the automatic detection of semantic aspects of the Abstract section. We use these resources for the return of new suggestions related to coherence in the SciPo enviroment. In particular, we develop classifiers based on a set of features extracted automatically from the surface of the text and from the LSA technique - Latent Semantic Analysis and machine learning algorithms. Thus, the classifiers provide indications on the semantic aspects that contribute to the abstract is considered coherent. Both the intrinsic assessments of the classifiers as the evaluation of the prototype in a context of use with real users demonstrated the potential of classifiers to aid writing academics abstracts with higher lever of coherence through new suggestions.
publishDate 2011
dc.date.none.fl_str_mv 2011
2018-04-10T20:12:23Z
2018-04-10T20:12:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.uem.br:8080/jspui/handle/1/2540
url http://repositorio.uem.br:8080/jspui/handle/1/2540
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Estadual de Maringá
Brasil
Departamento de Informática
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringá, PR
Centro de Tecnologia
publisher.none.fl_str_mv Universidade Estadual de Maringá
Brasil
Departamento de Informática
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringá, PR
Centro de Tecnologia
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
instname:Universidade Estadual de Maringá (UEM)
instacron:UEM
instname_str Universidade Estadual de Maringá (UEM)
instacron_str UEM
institution UEM
reponame_str Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
collection Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
repository.name.fl_str_mv Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)
repository.mail.fl_str_mv
_version_ 1801841374886100992