Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental

Detalhes bibliográficos
Autor(a) principal: Silva, Marcus César Santos Rocha
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UNIFACS
Texto Completo: http://teste.tede.unifacs.br:8080/tede/handle/tede/291
Resumo: As the number of scientific publications in Empirical Software Engineering grows, so does the need for automated support to locate, organize and summarize information for systematic reviews in the field. Although text mining and information extraction techniques are already being successfully used for secondary data analysis in areas like Biology and Medicine, researchers in software engineering still extract information manually from their papers. This work presents an approach for automated extraction of information for secondary studies in Empirical Software Engineering (ESE). The approach is based on a template that characterizes experimental studies in ESE and uses regular expression rules to obtain the template information fields directly from ESE scientific papers. A tool was developed to implement the approach and two studies were executed to compare its performance against the manual extraction of information from the papers.
id UNIF_8c235710daf5f35de83bc445ac22762d
oai_identifier_str oai:teste.tede.unifacs.br:tede/291
network_acronym_str UNIF
network_name_str Biblioteca Digital de Teses e Dissertações da UNIFACS
repository_id_str
spelling Mendonça Neto, Manoel Gomes dehttp://dgp.cnpq.br/buscaoperacional/detalhepesq.jsp?pesq=1608062196337851Cruzes, Daniela Soareshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4707987T6Salvador, Laís do Nascimentohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723774J6CPF:56871945504http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4214159D2Silva, Marcus César Santos Rocha2016-04-29T14:14:25Z2011-10-182009-09-23SILVA, Marcus César Santos Rocha. Contextextractor: a support tool for extracting from the context information from of software engineering articles experimental. 2009. 28 f. Dissertação (Mestrado em Sistemas e Computação) - Universidade Salvador, Salvador, 2009.http://teste.tede.unifacs.br:8080/tede/handle/tede/291As the number of scientific publications in Empirical Software Engineering grows, so does the need for automated support to locate, organize and summarize information for systematic reviews in the field. Although text mining and information extraction techniques are already being successfully used for secondary data analysis in areas like Biology and Medicine, researchers in software engineering still extract information manually from their papers. This work presents an approach for automated extraction of information for secondary studies in Empirical Software Engineering (ESE). The approach is based on a template that characterizes experimental studies in ESE and uses regular expression rules to obtain the template information fields directly from ESE scientific papers. A tool was developed to implement the approach and two studies were executed to compare its performance against the manual extraction of information from the papers.Com o número crescente de publicações científicas relacionadas à Engenharia de Software Experimental (ESE), torna-se necessária a utilização de métodos e ferramentas para localizar, organizar, e resumir informações para a revisão sistemática, bem como para sintetizá-las em um conhecimento utilizável. Embora técnicas de mineração de textos e extração de informações estejam sendo usadas de forma satisfatória para análise secundária em áreas como Biologia e Medicina, pesquisadores de Engenharia de Software Experimental ainda extraem informações manualmente. Com o objetivo de atender a esta necessidade, é apresentada neste trabalho uma abordagem para a extração de informações para estudos secundários, a partir de artigos de Engenharia de Software Experimental. A abordagem é baseada em um template para caracterização de estudos experimentais em ESE e a utilização de regras baseadas em expressões regulares para obter os vários campos deste template a partir da análise do artigo científico. Uma ferramenta foi desenvolvida para implementar a abordagem e dois estudos experimentais foram executados para avaliar seu desempenho em comparação com a extração manual de informação.Made available in DSpace on 2016-04-29T14:14:25Z (GMT). No. of bitstreams: 1 Dissertacao MARCUS CESAR SANTOS ROCHA SILVA.pdf: 784666 bytes, checksum: 52fa6571a98b4099c5b2ab1fdeba0438 (MD5) Previous issue date: 2009-09-23Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorapplication/pdfporUniversidade SalvadorPrograma de Pós-Graduação em Sistemas e ComputaçãoUNIFACSBRSistemas e ComputaçãoMineração de TextosExtração de InformaçãoEngenharia de Software ExperimentalRevisões SistemáticasText MiningInformation ExtractionExperimental Software EngineeringSystematic ReviewsCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOContextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimentalContextextractor: a support tool for extracting from the context information from of software engineering articles experimentalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UNIFACSinstname:Universidade Salvador (UNIFACS)instacron:UNIFACSORIGINALDissertacao MARCUS CESAR SANTOS ROCHA SILVA.pdfapplication/pdf784666http://teste.tede.unifacs.br:8080/tede/bitstream/tede/291/1/Dissertacao+MARCUS+CESAR+SANTOS+ROCHA+SILVA.pdf52fa6571a98b4099c5b2ab1fdeba0438MD51tede/2912016-04-29 11:14:25.724oai:teste.tede.unifacs.br:tede/291Biblioteca Digital de Teses e Dissertaçõeshttp://tede.unifacs.br/http://tede.unifacs.br:8080/oai/requestbibliotecadigital@unifacs.br||bibliotecadigital@unifacs.bropendoar:2016-04-29T14:14:25Biblioteca Digital de Teses e Dissertações da UNIFACS - Universidade Salvador (UNIFACS)false
dc.title.por.fl_str_mv Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
dc.title.alternative.eng.fl_str_mv Contextextractor: a support tool for extracting from the context information from of software engineering articles experimental
title Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
spellingShingle Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
Silva, Marcus César Santos Rocha
Mineração de Textos
Extração de Informação
Engenharia de Software Experimental
Revisões Sistemáticas
Text Mining
Information Extraction
Experimental Software Engineering
Systematic Reviews
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
title_full Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
title_fullStr Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
title_full_unstemmed Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
title_sort Contextextractor: uma ferramenta de apoio para extração de informações de contexto de artigos de engenharia de software experimental
author Silva, Marcus César Santos Rocha
author_facet Silva, Marcus César Santos Rocha
author_role author
dc.contributor.advisor1.fl_str_mv Mendonça Neto, Manoel Gomes de
dc.contributor.advisor1Lattes.fl_str_mv http://dgp.cnpq.br/buscaoperacional/detalhepesq.jsp?pesq=1608062196337851
dc.contributor.advisor-co1.fl_str_mv Cruzes, Daniela Soares
dc.contributor.advisor-co1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4707987T6
dc.contributor.referee1.fl_str_mv Salvador, Laís do Nascimento
dc.contributor.referee1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723774J6
dc.contributor.authorID.fl_str_mv CPF:56871945504
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4214159D2
dc.contributor.author.fl_str_mv Silva, Marcus César Santos Rocha
contributor_str_mv Mendonça Neto, Manoel Gomes de
Cruzes, Daniela Soares
Salvador, Laís do Nascimento
dc.subject.por.fl_str_mv Mineração de Textos
Extração de Informação
Engenharia de Software Experimental
Revisões Sistemáticas
topic Mineração de Textos
Extração de Informação
Engenharia de Software Experimental
Revisões Sistemáticas
Text Mining
Information Extraction
Experimental Software Engineering
Systematic Reviews
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Text Mining
Information Extraction
Experimental Software Engineering
Systematic Reviews
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description As the number of scientific publications in Empirical Software Engineering grows, so does the need for automated support to locate, organize and summarize information for systematic reviews in the field. Although text mining and information extraction techniques are already being successfully used for secondary data analysis in areas like Biology and Medicine, researchers in software engineering still extract information manually from their papers. This work presents an approach for automated extraction of information for secondary studies in Empirical Software Engineering (ESE). The approach is based on a template that characterizes experimental studies in ESE and uses regular expression rules to obtain the template information fields directly from ESE scientific papers. A tool was developed to implement the approach and two studies were executed to compare its performance against the manual extraction of information from the papers.
publishDate 2009
dc.date.issued.fl_str_mv 2009-09-23
dc.date.available.fl_str_mv 2011-10-18
dc.date.accessioned.fl_str_mv 2016-04-29T14:14:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Marcus César Santos Rocha. Contextextractor: a support tool for extracting from the context information from of software engineering articles experimental. 2009. 28 f. Dissertação (Mestrado em Sistemas e Computação) - Universidade Salvador, Salvador, 2009.
dc.identifier.uri.fl_str_mv http://teste.tede.unifacs.br:8080/tede/handle/tede/291
identifier_str_mv SILVA, Marcus César Santos Rocha. Contextextractor: a support tool for extracting from the context information from of software engineering articles experimental. 2009. 28 f. Dissertação (Mestrado em Sistemas e Computação) - Universidade Salvador, Salvador, 2009.
url http://teste.tede.unifacs.br:8080/tede/handle/tede/291
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Salvador
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Sistemas e Computação
dc.publisher.initials.fl_str_mv UNIFACS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Sistemas e Computação
publisher.none.fl_str_mv Universidade Salvador
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UNIFACS
instname:Universidade Salvador (UNIFACS)
instacron:UNIFACS
instname_str Universidade Salvador (UNIFACS)
instacron_str UNIFACS
institution UNIFACS
reponame_str Biblioteca Digital de Teses e Dissertações da UNIFACS
collection Biblioteca Digital de Teses e Dissertações da UNIFACS
bitstream.url.fl_str_mv http://teste.tede.unifacs.br:8080/tede/bitstream/tede/291/1/Dissertacao+MARCUS+CESAR+SANTOS+ROCHA+SILVA.pdf
bitstream.checksum.fl_str_mv 52fa6571a98b4099c5b2ab1fdeba0438
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UNIFACS - Universidade Salvador (UNIFACS)
repository.mail.fl_str_mv bibliotecadigital@unifacs.br||bibliotecadigital@unifacs.br
_version_ 1815289299968458752