Construção automática de resumos gráficos utilizando processamento de linguagem natural
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/3282 |
Resumo: | Contexto: Estudos secundários, tais como Revisões Sistemáticas da Literatura (RSL) e Mapeamentos Sistemáticos (MS), têm sido cada vez mais utilizados na Engenharia de Software (ES) uma vez que permitem a identificação de evidências disponíveis relacionadas com um tópico de pesquisa. Uma das principais atividades do processo de condução de um estudo secundário é a seleção dos estudos primários, que envolve, em um primeiro momento, a leitura dos resumos dos estudos candidatos. No entanto, com o crescente número de publicações científicas, agregado à baixa qualidade dos seus resumos, torna essa atividade cada vez mais difícil para os pesquisadores. Algumas soluções têm sido propostas para atenuar o problema, entre elas, a utilização dos resumos gráficos baseados em Mapas Conceituais (MC). No entanto, estes resumos são criados de forma manual. Objetivo: este trabalho possui dois objetivos: (i) entender o uso dos MCs na Ciência da Computação, bem como identificar as principais técnicas para geração de MCs a partir do Processamento de Linguagem Natural (PLN); e (ii) propor uma abordagem para a construção automática de resumos gráficos baseados em MCs por meio de técnicas de PLN. Método: inicialmente foram conduzidos dois mapeamentos sistemáticos da literatura para entender o uso dos MCs na ciência da computação e identificar as principais práticas para construção de MCs a partir de PLN. Em seguida, foi definida uma abordagem para construção de resumos gráficos baseados em MCs. Por fim, foram conduzidas avaliações com o objetivo de verificar a qualidade dos MCs gerados. Resultado: O experimento piloto realizado apresentou que os MCs construídos pela iniciativa demonstraram um bom desempenho em termos de extração de conceitos e abrangência ao representar o conteúdo do resumo. Conclusão: Os resultados preliminares apresentados demonstram que a iniciativa proposta pode gerar proposições válidas e representar resumos gráficos por meio de MCs, tornando-se um importante instrumento para sumarizar uma estrutura complexa de informações textuais, contribuindo para a identificação das informações mais importantes de um artigo. |
id |
UTFPR-12_6bd36309ccbb1b64cfb8359a80f1270d |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/3282 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2018-07-09T12:51:17Z2018-07-09T12:51:17Z2018-04-02SANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/3282Contexto: Estudos secundários, tais como Revisões Sistemáticas da Literatura (RSL) e Mapeamentos Sistemáticos (MS), têm sido cada vez mais utilizados na Engenharia de Software (ES) uma vez que permitem a identificação de evidências disponíveis relacionadas com um tópico de pesquisa. Uma das principais atividades do processo de condução de um estudo secundário é a seleção dos estudos primários, que envolve, em um primeiro momento, a leitura dos resumos dos estudos candidatos. No entanto, com o crescente número de publicações científicas, agregado à baixa qualidade dos seus resumos, torna essa atividade cada vez mais difícil para os pesquisadores. Algumas soluções têm sido propostas para atenuar o problema, entre elas, a utilização dos resumos gráficos baseados em Mapas Conceituais (MC). No entanto, estes resumos são criados de forma manual. Objetivo: este trabalho possui dois objetivos: (i) entender o uso dos MCs na Ciência da Computação, bem como identificar as principais técnicas para geração de MCs a partir do Processamento de Linguagem Natural (PLN); e (ii) propor uma abordagem para a construção automática de resumos gráficos baseados em MCs por meio de técnicas de PLN. Método: inicialmente foram conduzidos dois mapeamentos sistemáticos da literatura para entender o uso dos MCs na ciência da computação e identificar as principais práticas para construção de MCs a partir de PLN. Em seguida, foi definida uma abordagem para construção de resumos gráficos baseados em MCs. Por fim, foram conduzidas avaliações com o objetivo de verificar a qualidade dos MCs gerados. Resultado: O experimento piloto realizado apresentou que os MCs construídos pela iniciativa demonstraram um bom desempenho em termos de extração de conceitos e abrangência ao representar o conteúdo do resumo. Conclusão: Os resultados preliminares apresentados demonstram que a iniciativa proposta pode gerar proposições válidas e representar resumos gráficos por meio de MCs, tornando-se um importante instrumento para sumarizar uma estrutura complexa de informações textuais, contribuindo para a identificação das informações mais importantes de um artigo.Context: Secondary studies, such as Systematic Literature Reviews (SLR) and Systematic Mappings (SM), have been increasingly used in Software Engineering (SE) since they allow the identification of available evidence related to a research topic. One of the main activities of the process of conducting a secondary study is the primary studies selection, which involves, at first, the reading of the abstracts of the candidate studies. However, with the growing number of scientific publications, coupled with the poor quality of their abstracts, it makes this activity increasingly difficult for researchers. Some solutions have been proposed to mitigate the problem, among them, the use of structured abstracts and graphic summaries. Previous studies have proposed guidelines for the construction of graphic summaries. However, these summaries continue to be created manually. Objectives: This work has two objectives: (i) understand the use of Conceptual Maps (CM) in Computer Science and to investigate the main techniques for generation of MCs from Natural Language Processing (NPL); (ii) propose an approach for the automatic construction of graphic abstracts based on CMs using NLP techniques. Method: initially the collection of the main practices for the construction of CMs from NLP was performed. Next, an approach for the construction of graphic summaries based on CMs was defined. Finally, evaluations were conducted in order to verify the quality of the CMs generated. Results: The pilot experiment conducted showed that the CMs constructed by the initiative demonstrated a good performance in terms of concept extraction and comprehensiveness when representing the concepts of the abstract. Conclusions: The preliminary results show that the proposed initiative can generate valid propositions and represent graphic summaries through CMs, becoming an important tool to summarize a complex structure of textual information, contributing to the identification of the most important information of an article.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioPrograma de Pós-Graduação em InformáticaUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRACiência da ComputaçãoMapeamento conceitualProcessamento de linguagem natural (Computação)ResumosConcept mappingNatural language processing (Computer science)AbstractsConstrução automática de resumos gráficos utilizando processamento de linguagem naturalAutomatic construction of graphic summaries using natural language processinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCornélio ProcópioSouza, Érica Ferreira dehttp://lattes.cnpq.br/8904855809524041Scannavino, Katia Romero Felizardohttp://lattes.cnpq.br/3546986594133608Souza, Érica Ferreira deScannavino, Katia Romero FelizardoWatanabe, Willian MassamiVijaykumar, Nandamudi LankalapalliJunior, Arnaldo Candidohttp://lattes.cnpq.br/5934991054705733Santos, Vinicius dosinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_PPGI_M_Santos, Vinicius dos_2018.pdfCP_PPGI_M_Santos, Vinicius dos_2018.pdfapplication/pdf6174189http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/1/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdfd69d203d94636e137c191aeb3dbde2dcMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTCP_PPGI_M_Santos, Vinicius dos_2018.pdf.txtCP_PPGI_M_Santos, Vinicius dos_2018.pdf.txtExtracted texttext/plain190936http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/3/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf.txte14841e61f487fa5baec4f9099ba2f36MD53THUMBNAILCP_PPGI_M_Santos, Vinicius dos_2018.pdf.jpgCP_PPGI_M_Santos, Vinicius dos_2018.pdf.jpgGenerated Thumbnailimage/jpeg1332http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/4/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf.jpge128e31b07922b2971ee09d9d9d2c965MD541/32822018-07-09 09:51:17.892oai:repositorio.utfpr.edu.br:1/3282Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2018-07-09T12:51:17Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Construção automática de resumos gráficos utilizando processamento de linguagem natural |
dc.title.alternative.pt_BR.fl_str_mv |
Automatic construction of graphic summaries using natural language processing |
title |
Construção automática de resumos gráficos utilizando processamento de linguagem natural |
spellingShingle |
Construção automática de resumos gráficos utilizando processamento de linguagem natural Santos, Vinicius dos CNPQ::CIENCIAS EXATAS E DA TERRA Mapeamento conceitual Processamento de linguagem natural (Computação) Resumos Concept mapping Natural language processing (Computer science) Abstracts Ciência da Computação |
title_short |
Construção automática de resumos gráficos utilizando processamento de linguagem natural |
title_full |
Construção automática de resumos gráficos utilizando processamento de linguagem natural |
title_fullStr |
Construção automática de resumos gráficos utilizando processamento de linguagem natural |
title_full_unstemmed |
Construção automática de resumos gráficos utilizando processamento de linguagem natural |
title_sort |
Construção automática de resumos gráficos utilizando processamento de linguagem natural |
author |
Santos, Vinicius dos |
author_facet |
Santos, Vinicius dos |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Souza, Érica Ferreira de |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8904855809524041 |
dc.contributor.advisor-co1.fl_str_mv |
Scannavino, Katia Romero Felizardo |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/3546986594133608 |
dc.contributor.referee1.fl_str_mv |
Souza, Érica Ferreira de |
dc.contributor.referee2.fl_str_mv |
Scannavino, Katia Romero Felizardo |
dc.contributor.referee3.fl_str_mv |
Watanabe, Willian Massami |
dc.contributor.referee4.fl_str_mv |
Vijaykumar, Nandamudi Lankalapalli |
dc.contributor.referee5.fl_str_mv |
Junior, Arnaldo Candido |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5934991054705733 |
dc.contributor.author.fl_str_mv |
Santos, Vinicius dos |
contributor_str_mv |
Souza, Érica Ferreira de Scannavino, Katia Romero Felizardo Souza, Érica Ferreira de Scannavino, Katia Romero Felizardo Watanabe, Willian Massami Vijaykumar, Nandamudi Lankalapalli Junior, Arnaldo Candido |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA Mapeamento conceitual Processamento de linguagem natural (Computação) Resumos Concept mapping Natural language processing (Computer science) Abstracts Ciência da Computação |
dc.subject.por.fl_str_mv |
Mapeamento conceitual Processamento de linguagem natural (Computação) Resumos Concept mapping Natural language processing (Computer science) Abstracts |
dc.subject.capes.pt_BR.fl_str_mv |
Ciência da Computação |
description |
Contexto: Estudos secundários, tais como Revisões Sistemáticas da Literatura (RSL) e Mapeamentos Sistemáticos (MS), têm sido cada vez mais utilizados na Engenharia de Software (ES) uma vez que permitem a identificação de evidências disponíveis relacionadas com um tópico de pesquisa. Uma das principais atividades do processo de condução de um estudo secundário é a seleção dos estudos primários, que envolve, em um primeiro momento, a leitura dos resumos dos estudos candidatos. No entanto, com o crescente número de publicações científicas, agregado à baixa qualidade dos seus resumos, torna essa atividade cada vez mais difícil para os pesquisadores. Algumas soluções têm sido propostas para atenuar o problema, entre elas, a utilização dos resumos gráficos baseados em Mapas Conceituais (MC). No entanto, estes resumos são criados de forma manual. Objetivo: este trabalho possui dois objetivos: (i) entender o uso dos MCs na Ciência da Computação, bem como identificar as principais técnicas para geração de MCs a partir do Processamento de Linguagem Natural (PLN); e (ii) propor uma abordagem para a construção automática de resumos gráficos baseados em MCs por meio de técnicas de PLN. Método: inicialmente foram conduzidos dois mapeamentos sistemáticos da literatura para entender o uso dos MCs na ciência da computação e identificar as principais práticas para construção de MCs a partir de PLN. Em seguida, foi definida uma abordagem para construção de resumos gráficos baseados em MCs. Por fim, foram conduzidas avaliações com o objetivo de verificar a qualidade dos MCs gerados. Resultado: O experimento piloto realizado apresentou que os MCs construídos pela iniciativa demonstraram um bom desempenho em termos de extração de conceitos e abrangência ao representar o conteúdo do resumo. Conclusão: Os resultados preliminares apresentados demonstram que a iniciativa proposta pode gerar proposições válidas e representar resumos gráficos por meio de MCs, tornando-se um importante instrumento para sumarizar uma estrutura complexa de informações textuais, contribuindo para a identificação das informações mais importantes de um artigo. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-07-09T12:51:17Z |
dc.date.available.fl_str_mv |
2018-07-09T12:51:17Z |
dc.date.issued.fl_str_mv |
2018-04-02 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/3282 |
identifier_str_mv |
SANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/3282 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Informática |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/1/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/3/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3282/4/CP_PPGI_M_Santos%2c%20Vinicius%20dos_2018.pdf.jpg |
bitstream.checksum.fl_str_mv |
d69d203d94636e137c191aeb3dbde2dc 8a4605be74aa9ea9d79846c1fba20a33 e14841e61f487fa5baec4f9099ba2f36 e128e31b07922b2971ee09d9d9d2c965 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923228926869504 |