SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia

Detalhes bibliográficos
Autor(a) principal: Flores, Murillo Lagranha
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/211556
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
id UFSC_fc46f5e5623cfbef5c3a542538319c0f
oai_identifier_str oai:repositorio.ufsc.br:123456789/211556
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Universidade Federal de Santa CatarinaFlores, Murillo LagranhaSilveira, Ricardo AzambujaSantos, Elder Rizzon2020-08-20T05:44:54Z2020-08-20T05:44:54Z2019368268https://repositorio.ufsc.br/handle/123456789/211556Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.A abundância de documentos de texto disponíveis na web, juntamente com a facilidade de encontrar e recuperar tais documentos trazida pelos buscadores, cria a necessidade de se desenvolverem ferramentas computacionais capazes de criar uma versão resumida destes documentos para que se possa capturar a informação presente nos mesmos sem que para isso haja a necessidade de lê-los na íntegra. Um sumarizador automático de texto cria uma versão resumida de um documento ou de um conjunto de documentos. Sumarizadores extrativos selecionam algumas unidades de texto, como parágrafos ou sentenças, do documento ou dos documentos originais para compor o sumário. Existem diversas técnicas empregadas na seleção e extração de sentenças, dentre elas o uso de medidas baseadas na análise semântica das sentenças. Nestas técnicas, a semântica das sentenças geralmente é representada a partir das formalizações encontradas em uma ontologia. Uma ontologia pode formalizar, entre outros, conceitos e indivíduos, que são instâncias destes conceitos. Os métodos de sumarização extrativa no estado-da-arte exploram somente os conceitos definidos nas ontologias para representar a semântica das sentenças, deixando indivíduos de lado. Desta forma, esta dissertação apresenta uma proposta de método de sumarização extrativa que utiliza as instâncias de uma ontologia para representar a semântica das sentenças, bem como uma série de experimentos realizados para avaliar a relevância dos resultados obtidos pelo mesmo na tarefa de sumarização automática de texto. Os resultados indicam que o método proposto alcança resultados relevantes, revelando que a representação semântica proposta para as sentenças é uma alternativa viável no contexto da sumarização automática.Abstract: The abundance of text documents available on the web, coupled with the ease of finding and retrieving such documents brought by search engines, creates the need to develop computational tools capable of creating summary versions of these documents so that the information present in them can be captured by a reader without them having to read the documents in full. An automatic text summarizer creates a shortened version of a document or set of documents. Extractive summarizers will select textual units, such as paragraphs or sentences, from the original document or documents to compose the summary. There are several techniques employed in sentence selection and extraction, including the ones based on the semantic analysis of sentences. In these techniques, sentence semantics are usually represented using formal descriptions found in an ontology. An ontology can formalize, among others, concepts and individuals, which are instances of the concepts. State-of-the-art extractive summarization methods explore only the concepts defined in ontologies to represent sentence semantics, leaving individuals aside. Thus, this dissertation presents a proposal for an extractive summarization method that uses the instances in an ontology to represent sentence semantics, as well as a series of experiments performed to evaluate the relevance of the results obtained by this method in the automatic text summarization task. The results indicate that the proposed method achieves relevant results, revealing that the proposed semantic representation for sentences is a viable alternative in the context of automatic summarization.115 p.| il., gráfs., tabs.porComputaçãoOntologias (Sistema de recuperação da informação)Processamento de linguagem natural (Computação)Processamento de textos (Computação)SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologiainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPGCC1157-D.pdfPGCC1157-D.pdfapplication/pdf3481928https://repositorio.ufsc.br/bitstream/123456789/211556/-1/PGCC1157-D.pdf098a38b6588e6c326c21b43065faa8dbMD5-1123456789/2115562020-08-20 02:44:55.096oai:repositorio.ufsc.br:123456789/211556Repositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732020-08-20T05:44:55Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia
title SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia
spellingShingle SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia
Flores, Murillo Lagranha
Computação
Ontologias (Sistema de recuperação da informação)
Processamento de linguagem natural (Computação)
Processamento de textos (Computação)
title_short SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia
title_full SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia
title_fullStr SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia
title_full_unstemmed SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia
title_sort SBI: um método de sumarização extrativa de texto baseado em instâncias de uma ontologia
author Flores, Murillo Lagranha
author_facet Flores, Murillo Lagranha
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Flores, Murillo Lagranha
dc.contributor.advisor1.fl_str_mv Silveira, Ricardo Azambuja
dc.contributor.advisor-co1.fl_str_mv Santos, Elder Rizzon
contributor_str_mv Silveira, Ricardo Azambuja
Santos, Elder Rizzon
dc.subject.classification.none.fl_str_mv Computação
Ontologias (Sistema de recuperação da informação)
Processamento de linguagem natural (Computação)
Processamento de textos (Computação)
topic Computação
Ontologias (Sistema de recuperação da informação)
Processamento de linguagem natural (Computação)
Processamento de textos (Computação)
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2020-08-20T05:44:54Z
dc.date.available.fl_str_mv 2020-08-20T05:44:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/211556
dc.identifier.other.none.fl_str_mv 368268
identifier_str_mv 368268
url https://repositorio.ufsc.br/handle/123456789/211556
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 115 p.| il., gráfs., tabs.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/211556/-1/PGCC1157-D.pdf
bitstream.checksum.fl_str_mv 098a38b6588e6c326c21b43065faa8db
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1766805085281583104