Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UNIFACS |
Texto Completo: | http://teste.tede.unifacs.br:8080/tede/handle/tede/291 |
Resumo: | As the number of scientific publications in Empirical Software Engineering grows, so does the need for automated support to locate, organize and summarize information for systematic reviews in the field. Although text mining and information extraction techniques are already being successfully used for secondary data analysis in areas like Biology and Medicine, researchers in software engineering still extract information manually from their papers. This work presents an approach for automated extraction of information for secondary studies in Empirical Software Engineering (ESE). The approach is based on a template that characterizes experimental studies in ESE and uses regular expression rules to obtain the template information fields directly from ESE scientific papers. A tool was developed to implement the approach and two studies were executed to compare its performance against the manual extraction of information from the papers. |
id |
UNIF_8c235710daf5f35de83bc445ac22762d |
---|---|
oai_identifier_str |
oai:teste.tede.unifacs.br:tede/291 |
network_acronym_str |
UNIF |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UNIFACS |
repository_id_str |
|
spelling |
Mendonça Neto, Manoel Gomes dehttp://dgp.cnpq.br/buscaoperacional/detalhepesq.jsp?pesq=1608062196337851Cruzes, Daniela Soareshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4707987T6Salvador, Laís do Nascimentohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723774J6CPF:56871945504http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4214159D2Silva, Marcus César Santos Rocha2016-04-29T14:14:25Z2011-10-182009-09-23SILVA, Marcus César Santos Rocha. Contextextractor: a support tool for extracting from the context information from of software engineering articles experimental. 2009. 28 f. Dissertação (Mestrado em Sistemas e Computação) - Universidade Salvador, Salvador, 2009.http://teste.tede.unifacs.br:8080/tede/handle/tede/291As the number of scientific publications in Empirical Software Engineering grows, so does the need for automated support to locate, organize and summarize information for systematic reviews in the field. Although text mining and information extraction techniques are already being successfully used for secondary data analysis in areas like Biology and Medicine, researchers in software engineering still extract information manually from their papers. This work presents an approach for automated extraction of information for secondary studies in Empirical Software Engineering (ESE). The approach is based on a template that characterizes experimental studies in ESE and uses regular expression rules to obtain the template information fields directly from ESE scientific papers. A tool was developed to implement the approach and two studies were executed to compare its performance against the manual extraction of information from the papers.Com o número crescente de publicações científicas relacionadas à Engenharia de Software Experimental (ESE), torna-se necessária a utilização de métodos e ferramentas para localizar, organizar, e resumir informações para a revisão sistemática, bem como para sintetizá-las em um conhecimento utilizável. Embora técnicas de mineração de textos e extração de informações estejam sendo usadas de forma satisfatória para análise secundária em áreas como Biologia e Medicina, pesquisadores de Engenharia de Software Experimental ainda extraem informações manualmente. Com o objetivo de atender a esta necessidade, é apresentada neste trabalho uma abordagem para a extração de informações para estudos secundários, a partir de artigos de Engenharia de Software Experimental. A abordagem é baseada em um template para caracterização de estudos experimentais em ESE e a utilização de regras baseadas em expressões regulares para obter os vários campos deste template a partir da análise do artigo científico. Uma ferramenta foi desenvolvida para implementar a abordagem e dois estudos experimentais foram executados para avaliar seu desempenho em comparação com a extração manual de informação.Made available in DSpace on 2016-04-29T14:14:25Z (GMT). No. of bitstreams: 1 Dissertacao MARCUS CESAR SANTOS ROCHA SILVA.pdf: 784666 bytes, checksum: 52fa6571a98b4099c5b2ab1fdeba0438 (MD5) Previous issue date: 2009-09-23Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorapplication/pdfporUniversidade SalvadorPrograma de Pós-Graduação em Sistemas e ComputaçãoUNIFACSBRSistemas e ComputaçãoMineração de TextosExtração de InformaçãoEngenharia de Software ExperimentalRevisões SistemáticasText MiningInformation ExtractionExperimental Software EngineeringSystematic ReviewsCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOContextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimentalContextextractor: a support tool for extracting from the context information from of software engineering articles experimentalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UNIFACSinstname:Universidade Salvador (UNIFACS)instacron:UNIFACSORIGINALDissertacao MARCUS CESAR SANTOS ROCHA SILVA.pdfapplication/pdf784666http://teste.tede.unifacs.br:8080/tede/bitstream/tede/291/1/Dissertacao+MARCUS+CESAR+SANTOS+ROCHA+SILVA.pdf52fa6571a98b4099c5b2ab1fdeba0438MD51tede/2912016-04-29 11:14:25.724oai:teste.tede.unifacs.br:tede/291Biblioteca Digital de Teses e Dissertaçõeshttp://tede.unifacs.br/http://tede.unifacs.br:8080/oai/requestbibliotecadigital@unifacs.br||bibliotecadigital@unifacs.bropendoar:2016-04-29T14:14:25Biblioteca Digital de Teses e Dissertações da UNIFACS - Universidade Salvador (UNIFACS)false |
dc.title.por.fl_str_mv |
Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental |
dc.title.alternative.eng.fl_str_mv |
Contextextractor: a support tool for extracting from the context information from of software engineering articles experimental |
title |
Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental |
spellingShingle |
Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental Silva, Marcus César Santos Rocha Mineração de Textos Extração de Informação Engenharia de Software Experimental Revisões Sistemáticas Text Mining Information Extraction Experimental Software Engineering Systematic Reviews CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental |
title_full |
Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental |
title_fullStr |
Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental |
title_full_unstemmed |
Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental |
title_sort |
Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental |
author |
Silva, Marcus César Santos Rocha |
author_facet |
Silva, Marcus César Santos Rocha |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Mendonça Neto, Manoel Gomes de |
dc.contributor.advisor1Lattes.fl_str_mv |
http://dgp.cnpq.br/buscaoperacional/detalhepesq.jsp?pesq=1608062196337851 |
dc.contributor.advisor-co1.fl_str_mv |
Cruzes, Daniela Soares |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4707987T6 |
dc.contributor.referee1.fl_str_mv |
Salvador, Laís do Nascimento |
dc.contributor.referee1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723774J6 |
dc.contributor.authorID.fl_str_mv |
CPF:56871945504 |
dc.contributor.authorLattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4214159D2 |
dc.contributor.author.fl_str_mv |
Silva, Marcus César Santos Rocha |
contributor_str_mv |
Mendonça Neto, Manoel Gomes de Cruzes, Daniela Soares Salvador, Laís do Nascimento |
dc.subject.por.fl_str_mv |
Mineração de Textos Extração de Informação Engenharia de Software Experimental Revisões Sistemáticas |
topic |
Mineração de Textos Extração de Informação Engenharia de Software Experimental Revisões Sistemáticas Text Mining Information Extraction Experimental Software Engineering Systematic Reviews CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Text Mining Information Extraction Experimental Software Engineering Systematic Reviews |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
As the number of scientific publications in Empirical Software Engineering grows, so does the need for automated support to locate, organize and summarize information for systematic reviews in the field. Although text mining and information extraction techniques are already being successfully used for secondary data analysis in areas like Biology and Medicine, researchers in software engineering still extract information manually from their papers. This work presents an approach for automated extraction of information for secondary studies in Empirical Software Engineering (ESE). The approach is based on a template that characterizes experimental studies in ESE and uses regular expression rules to obtain the template information fields directly from ESE scientific papers. A tool was developed to implement the approach and two studies were executed to compare its performance against the manual extraction of information from the papers. |
publishDate |
2009 |
dc.date.issued.fl_str_mv |
2009-09-23 |
dc.date.available.fl_str_mv |
2011-10-18 |
dc.date.accessioned.fl_str_mv |
2016-04-29T14:14:25Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Marcus César Santos Rocha. Contextextractor: a support tool for extracting from the context information from of software engineering articles experimental. 2009. 28 f. Dissertação (Mestrado em Sistemas e Computação) - Universidade Salvador, Salvador, 2009. |
dc.identifier.uri.fl_str_mv |
http://teste.tede.unifacs.br:8080/tede/handle/tede/291 |
identifier_str_mv |
SILVA, Marcus César Santos Rocha. Contextextractor: a support tool for extracting from the context information from of software engineering articles experimental. 2009. 28 f. Dissertação (Mestrado em Sistemas e Computação) - Universidade Salvador, Salvador, 2009. |
url |
http://teste.tede.unifacs.br:8080/tede/handle/tede/291 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Salvador |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Sistemas e Computação |
dc.publisher.initials.fl_str_mv |
UNIFACS |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Sistemas e Computação |
publisher.none.fl_str_mv |
Universidade Salvador |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UNIFACS instname:Universidade Salvador (UNIFACS) instacron:UNIFACS |
instname_str |
Universidade Salvador (UNIFACS) |
instacron_str |
UNIFACS |
institution |
UNIFACS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UNIFACS |
collection |
Biblioteca Digital de Teses e Dissertações da UNIFACS |
bitstream.url.fl_str_mv |
http://teste.tede.unifacs.br:8080/tede/bitstream/tede/291/1/Dissertacao+MARCUS+CESAR+SANTOS+ROCHA+SILVA.pdf |
bitstream.checksum.fl_str_mv |
52fa6571a98b4099c5b2ab1fdeba0438 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UNIFACS - Universidade Salvador (UNIFACS) |
repository.mail.fl_str_mv |
bibliotecadigital@unifacs.br||bibliotecadigital@unifacs.br |
_version_ |
1815289299968458752 |