Construção automática de resumos gráficos utilizando processamento de linguagem natural

Detalhes bibliográficos
Autor(a) principal: Santos, Vinicius dos
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/3282
Resumo: Contexto: Estudos secundários, tais como Revisões Sistemáticas da Literatura (RSL) e Mapeamentos Sistemáticos (MS), têm sido cada vez mais utilizados na Engenharia de Software (ES) uma vez que permitem a identificação de evidências disponíveis relacionadas com um tópico de pesquisa. Uma das principais atividades do processo de condução de um estudo secundário é a seleção dos estudos primários, que envolve, em um primeiro momento, a leitura dos resumos dos estudos candidatos. No entanto, com o crescente número de publicações científicas, agregado à baixa qualidade dos seus resumos, torna essa atividade cada vez mais difícil para os pesquisadores. Algumas soluções têm sido propostas para atenuar o problema, entre elas, a utilização dos resumos gráficos baseados em Mapas Conceituais (MC). No entanto, estes resumos são criados de forma manual. Objetivo: este trabalho possui dois objetivos: (i) entender o uso dos MCs na Ciência da Computação, bem como identificar as principais técnicas para geração de MCs a partir do Processamento de Linguagem Natural (PLN); e (ii) propor uma abordagem para a construção automática de resumos gráficos baseados em MCs por meio de técnicas de PLN. Método: inicialmente foram conduzidos dois mapeamentos sistemáticos da literatura para entender o uso dos MCs na ciência da computação e identificar as principais práticas para construção de MCs a partir de PLN. Em seguida, foi definida uma abordagem para construção de resumos gráficos baseados em MCs. Por fim, foram conduzidas avaliações com o objetivo de verificar a qualidade dos MCs gerados. Resultado: O experimento piloto realizado apresentou que os MCs construídos pela iniciativa demonstraram um bom desempenho em termos de extração de conceitos e abrangência ao representar o conteúdo do resumo. Conclusão: Os resultados preliminares apresentados demonstram que a iniciativa proposta pode gerar proposições válidas e representar resumos gráficos por meio de MCs, tornando-se um importante instrumento para sumarizar uma estrutura complexa de informações textuais, contribuindo para a identificação das informações mais importantes de um artigo.
id UTFPR-12_6bd36309ccbb1b64cfb8359a80f1270d
oai_identifier_str oai:repositorio.utfpr.edu.br:1/3282
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2018-07-09T12:51:17Z2018-07-09T12:51:17Z2018-04-02SANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/3282Contexto: Estudos secundários, tais como Revisões Sistemáticas da Literatura (RSL) e Mapeamentos Sistemáticos (MS), têm sido cada vez mais utilizados na Engenharia de Software (ES) uma vez que permitem a identificação de evidências disponíveis relacionadas com um tópico de pesquisa. Uma das principais atividades do processo de condução de um estudo secundário é a seleção dos estudos primários, que envolve, em um primeiro momento, a leitura dos resumos dos estudos candidatos. No entanto, com o crescente número de publicações científicas, agregado à baixa qualidade dos seus resumos, torna essa atividade cada vez mais difícil para os pesquisadores. Algumas soluções têm sido propostas para atenuar o problema, entre elas, a utilização dos resumos gráficos baseados em Mapas Conceituais (MC). No entanto, estes resumos são criados de forma manual. Objetivo: este trabalho possui dois objetivos: (i) entender o uso dos MCs na Ciência da Computação, bem como identificar as principais técnicas para geração de MCs a partir do Processamento de Linguagem Natural (PLN); e (ii) propor uma abordagem para a construção automática de resumos gráficos baseados em MCs por meio de técnicas de PLN. Método: inicialmente foram conduzidos dois mapeamentos sistemáticos da literatura para entender o uso dos MCs na ciência da computação e identificar as principais práticas para construção de MCs a partir de PLN. Em seguida, foi definida uma abordagem para construção de resumos gráficos baseados em MCs. Por fim, foram conduzidas avaliações com o objetivo de verificar a qualidade dos MCs gerados. Resultado: O experimento piloto realizado apresentou que os MCs construídos pela iniciativa demonstraram um bom desempenho em termos de extração de conceitos e abrangência ao representar o conteúdo do resumo. Conclusão: Os resultados preliminares apresentados demonstram que a iniciativa proposta pode gerar proposições válidas e representar resumos gráficos por meio de MCs, tornando-se um importante instrumento para sumarizar uma estrutura complexa de informações textuais, contribuindo para a identificação das informações mais importantes de um artigo.Context: Secondary studies, such as Systematic Literature Reviews (SLR) and Systematic Mappings (SM), have been increasingly used in Software Engineering (SE) since they allow the identification of available evidence related to a research topic. One of the main activities of the process of conducting a secondary study is the primary studies selection, which involves, at first, the reading of the abstracts of the candidate studies. However, with the growing number of scientific publications, coupled with the poor quality of their abstracts, it makes this activity increasingly difficult for researchers. Some solutions have been proposed to mitigate the problem, among them, the use of structured abstracts and graphic summaries. Previous studies have proposed guidelines for the construction of graphic summaries. However, these summaries continue to be created manually. Objectives: This work has two objectives: (i) understand the use of Conceptual Maps (CM) in Computer Science and to investigate the main techniques for generation of MCs from Natural Language Processing (NPL); (ii) propose an approach for the automatic construction of graphic abstracts based on CMs using NLP techniques. Method: initially the collection of the main practices for the construction of CMs from NLP was performed. Next, an approach for the construction of graphic summaries based on CMs was defined. Finally, evaluations were conducted in order to verify the quality of the CMs generated. Results: The pilot experiment conducted showed that the CMs constructed by the initiative demonstrated a good performance in terms of concept extraction and comprehensiveness when representing the concepts of the abstract. Conclusions: The preliminary results show that the proposed initiative can generate valid propositions and represent graphic summaries through CMs, becoming an important tool to summarize a complex structure of textual information, contributing to the identification of the most important information of an article.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioPrograma de Pós-Graduação em InformáticaUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRACiência da ComputaçãoMapeamento conceitualProcessamento de linguagem natural (Computação)ResumosConcept mappingNatural language processing (Computer science)AbstractsConstrução automática de resumos gráficos utilizando processamento de linguagem naturalAutomatic construction of graphic summaries using natural language processinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCornélio ProcópioSouza, Érica Ferreira dehttp://lattes.cnpq.br/8904855809524041Scannavino, Katia Romero Felizardohttp://lattes.cnpq.br/3546986594133608Souza, Érica Ferreira deScannavino, Katia Romero FelizardoWatanabe, Willian MassamiVijaykumar, Nandamudi LankalapalliJunior, Arnaldo Candidohttp://lattes.cnpq.br/5934991054705733Santos, Vinicius dosinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_PPGI_M_Santos, Vinicius dos_2018.pdfCP_PPGI_M_Santos, Vinicius dos_2018.pdfapplication/pdf6174189http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/1/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdfd69d203d94636e137c191aeb3dbde2dcMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTCP_PPGI_M_Santos, Vinicius dos_2018.pdf.txtCP_PPGI_M_Santos, Vinicius dos_2018.pdf.txtExtracted texttext/plain190936http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/3/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf.txte14841e61f487fa5baec4f9099ba2f36MD53THUMBNAILCP_PPGI_M_Santos, Vinicius dos_2018.pdf.jpgCP_PPGI_M_Santos, Vinicius dos_2018.pdf.jpgGenerated Thumbnailimage/jpeg1332http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/4/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf.jpge128e31b07922b2971ee09d9d9d2c965MD541/32822018-07-09 09:51:17.892oai:repositorio.utfpr.edu.br:1/3282Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2018-07-09T12:51:17Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Construção automática de resumos gráficos utilizando processamento de linguagem natural
dc.title.alternative.pt_BR.fl_str_mv Automatic construction of graphic summaries using natural language processing
title Construção automática de resumos gráficos utilizando processamento de linguagem natural
spellingShingle Construção automática de resumos gráficos utilizando processamento de linguagem natural
Santos, Vinicius dos
CNPQ::CIENCIAS EXATAS E DA TERRA
Mapeamento conceitual
Processamento de linguagem natural (Computação)
Resumos
Concept mapping
Natural language processing (Computer science)
Abstracts
Ciência da Computação
title_short Construção automática de resumos gráficos utilizando processamento de linguagem natural
title_full Construção automática de resumos gráficos utilizando processamento de linguagem natural
title_fullStr Construção automática de resumos gráficos utilizando processamento de linguagem natural
title_full_unstemmed Construção automática de resumos gráficos utilizando processamento de linguagem natural
title_sort Construção automática de resumos gráficos utilizando processamento de linguagem natural
author Santos, Vinicius dos
author_facet Santos, Vinicius dos
author_role author
dc.contributor.advisor1.fl_str_mv Souza, Érica Ferreira de
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8904855809524041
dc.contributor.advisor-co1.fl_str_mv Scannavino, Katia Romero Felizardo
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/3546986594133608
dc.contributor.referee1.fl_str_mv Souza, Érica Ferreira de
dc.contributor.referee2.fl_str_mv Scannavino, Katia Romero Felizardo
dc.contributor.referee3.fl_str_mv Watanabe, Willian Massami
dc.contributor.referee4.fl_str_mv Vijaykumar, Nandamudi Lankalapalli
dc.contributor.referee5.fl_str_mv Junior, Arnaldo Candido
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5934991054705733
dc.contributor.author.fl_str_mv Santos, Vinicius dos
contributor_str_mv Souza, Érica Ferreira de
Scannavino, Katia Romero Felizardo
Souza, Érica Ferreira de
Scannavino, Katia Romero Felizardo
Watanabe, Willian Massami
Vijaykumar, Nandamudi Lankalapalli
Junior, Arnaldo Candido
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA
topic CNPQ::CIENCIAS EXATAS E DA TERRA
Mapeamento conceitual
Processamento de linguagem natural (Computação)
Resumos
Concept mapping
Natural language processing (Computer science)
Abstracts
Ciência da Computação
dc.subject.por.fl_str_mv Mapeamento conceitual
Processamento de linguagem natural (Computação)
Resumos
Concept mapping
Natural language processing (Computer science)
Abstracts
dc.subject.capes.pt_BR.fl_str_mv Ciência da Computação
description Contexto: Estudos secundários, tais como Revisões Sistemáticas da Literatura (RSL) e Mapeamentos Sistemáticos (MS), têm sido cada vez mais utilizados na Engenharia de Software (ES) uma vez que permitem a identificação de evidências disponíveis relacionadas com um tópico de pesquisa. Uma das principais atividades do processo de condução de um estudo secundário é a seleção dos estudos primários, que envolve, em um primeiro momento, a leitura dos resumos dos estudos candidatos. No entanto, com o crescente número de publicações científicas, agregado à baixa qualidade dos seus resumos, torna essa atividade cada vez mais difícil para os pesquisadores. Algumas soluções têm sido propostas para atenuar o problema, entre elas, a utilização dos resumos gráficos baseados em Mapas Conceituais (MC). No entanto, estes resumos são criados de forma manual. Objetivo: este trabalho possui dois objetivos: (i) entender o uso dos MCs na Ciência da Computação, bem como identificar as principais técnicas para geração de MCs a partir do Processamento de Linguagem Natural (PLN); e (ii) propor uma abordagem para a construção automática de resumos gráficos baseados em MCs por meio de técnicas de PLN. Método: inicialmente foram conduzidos dois mapeamentos sistemáticos da literatura para entender o uso dos MCs na ciência da computação e identificar as principais práticas para construção de MCs a partir de PLN. Em seguida, foi definida uma abordagem para construção de resumos gráficos baseados em MCs. Por fim, foram conduzidas avaliações com o objetivo de verificar a qualidade dos MCs gerados. Resultado: O experimento piloto realizado apresentou que os MCs construídos pela iniciativa demonstraram um bom desempenho em termos de extração de conceitos e abrangência ao representar o conteúdo do resumo. Conclusão: Os resultados preliminares apresentados demonstram que a iniciativa proposta pode gerar proposições válidas e representar resumos gráficos por meio de MCs, tornando-se um importante instrumento para sumarizar uma estrutura complexa de informações textuais, contribuindo para a identificação das informações mais importantes de um artigo.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-07-09T12:51:17Z
dc.date.available.fl_str_mv 2018-07-09T12:51:17Z
dc.date.issued.fl_str_mv 2018-04-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/3282
identifier_str_mv SANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/3282
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Informática
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/1/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/3/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/4/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf.jpg
bitstream.checksum.fl_str_mv d69d203d94636e137c191aeb3dbde2dc
8a4605be74aa9ea9d79846c1fba20a33
e14841e61f487fa5baec4f9099ba2f36
e128e31b07922b2971ee09d9d9d2c965
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923228926869504