Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação

Bibliographic Details
Main Author: Noll, Rodrigo Perozzo
Publication Date: 2012
Format: Doctoral thesis
Language: por
Source: Biblioteca Digital de Teses e Dissertações da PUC_RS
Download full: http://tede2.pucrs.br/tede2/handle/tede/5190
Summary: Changes are inevitable during the product lifecycle. These changes are due different needs, such as the knowledge evolution of business processes, environment or infrastructure changes, etc. Under these circumstances, it is crucial to have the control about the knowledge of what these changes mean to the system. Impact analysis represents the process that creates this knowledge. The impact analysis has a wide meaning for software development, such as the assessment of source code structures or the control of project management constraints. This thesis aims to present a model to analyze the impact in source code using ontologies in order to improve precision and recall of the identified source code structures compared to existing techniques. The use of ontologies integrates a semantic layer under the traditional techniques founded in syntactic analysis. To develop the impact analysis model, it was defined two different sub models: traceability and probability. The traceability model receives as input the source code and domain ontology and generates a traceability ontology populated with links between domain concepts (classes and properties) and source code units (classes, methods and attributes). These links are populated by a lexical and semantic analyzer that categorize, normalize (token generation, expansion and elimination) and compare (stemming) each token. With the traceability ontology and a change request, the probabilistic model classifies each traceability link using Bayesian Belief Networks. To the probability calculus, the node classification used the Google PageRank algorithm and the arrows used frequency analysis TFIDF and conceptual dependency, defined in this thesis. The impact analysis model was implemented as an Eclipse plugin and was empirically evaluated using three controlled experiments.
id P_RS_aafb0a60810c2ca773ee34cf1877e7d7
oai_identifier_str oai:tede2.pucrs.br:tede/5190
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Ribeiro, Marcelo BloisCPF:02820399703http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4792228H1CPF:81888600004http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4509721E5Noll, Rodrigo Perozzo2015-04-14T14:49:53Z2012-10-102012-08-13NOLL, Rodrigo Perozzo. Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação. 2012. 235 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.http://tede2.pucrs.br/tede2/handle/tede/5190Changes are inevitable during the product lifecycle. These changes are due different needs, such as the knowledge evolution of business processes, environment or infrastructure changes, etc. Under these circumstances, it is crucial to have the control about the knowledge of what these changes mean to the system. Impact analysis represents the process that creates this knowledge. The impact analysis has a wide meaning for software development, such as the assessment of source code structures or the control of project management constraints. This thesis aims to present a model to analyze the impact in source code using ontologies in order to improve precision and recall of the identified source code structures compared to existing techniques. The use of ontologies integrates a semantic layer under the traditional techniques founded in syntactic analysis. To develop the impact analysis model, it was defined two different sub models: traceability and probability. The traceability model receives as input the source code and domain ontology and generates a traceability ontology populated with links between domain concepts (classes and properties) and source code units (classes, methods and attributes). These links are populated by a lexical and semantic analyzer that categorize, normalize (token generation, expansion and elimination) and compare (stemming) each token. With the traceability ontology and a change request, the probabilistic model classifies each traceability link using Bayesian Belief Networks. To the probability calculus, the node classification used the Google PageRank algorithm and the arrows used frequency analysis TFIDF and conceptual dependency, defined in this thesis. The impact analysis model was implemented as an Eclipse plugin and was empirically evaluated using three controlled experiments.Mudanças são inevitáveis durante o ciclo de vida do software. Estas mudanças são resultado de diferentes necessidades, como a evolução do conhecimento sobre os processos de negócio, alterações de ambiente, etc. Nestas circunstâncias, é crucial ter controle sobre o que essas mudanças representam na aplicação. A análise de impacto representa o processo que gera este conhecimento. Essa análise possui um significado abrangente dentro do desenvolvimento de software, incluindo desde a identificação de estruturas no código fonte até o controle das restrições de gestão de projeto. Esta tese apresenta um modelo para analisar o impacto no código fonte de uma aplicação utilizando ontologias, visando melhorar a precisão e revocação de estruturas identificadas se comparadas a técnicas existentes. O uso de ontologias integra uma perspectiva semântica nas técnicas tradicionalmente baseadas na análise sintática do código fonte. Para o desenvolvimento do modelo de análise de impacto, foram definidos dois submodelos: o de rastreabilidade e o de probabilidade. O modelo de rastreabilidade recebe como entrada o código fonte e uma ontologia de domínio e gera como resultado uma ontologia de rastreabilidade populada automaticamente com elos entre conceitos do domínio (classes e propriedades) e estruturas do código (classes, métodos e atributos). Estes elos são populados através de um analisador léxico e semântico que realiza a categorização, normalização (geração de tokens, expansão e eliminação) e comparação (stemming). Com base na ontologia de rastreabilidade e em um requisito de mudança, o modelo probabilístico classifica cada elo de rastreabilidade utilizando o modelo de Redes de Crenças Bayesianas. Para o cálculo de probabilidade, a classificação dos nodos utilizou o algoritmo PageRank do Google e das arestas, a análise de frequência TFIDF e a dependência conceitual, definida nesta tese. Este modelo de análise de impacto foi implementado como um plugin do eclipse e foi avaliado empiricamente através de três experimentos controlados.Made available in DSpace on 2015-04-14T14:49:53Z (GMT). No. of bitstreams: 1 442552.pdf: 9370705 bytes, checksum: 8a3aef50bd6e373e63349d63858be524 (MD5) Previous issue date: 2012-08-13application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/16065/442552.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBRFaculdade de InformácaINFORMÁTICAONTOLOGIARECUPERAÇÃO DA INFORMAÇÃOCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUm modelo para a análise de impacto em código fonte usando ontologias e recuperação de informaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL442552.pdf.jpg442552.pdf.jpgimage/jpeg4234http://tede2.pucrs.br/tede2/bitstream/tede/5190/3/442552.pdf.jpg67c926695b7a8b49ec426f9bfd56dba5MD53TEXT442552.pdf.txt442552.pdf.txttext/plain443114http://tede2.pucrs.br/tede2/bitstream/tede/5190/2/442552.pdf.txt36b7e42cef16c2206c079d953e33e4b7MD52ORIGINAL442552.pdfapplication/pdf9370705http://tede2.pucrs.br/tede2/bitstream/tede/5190/1/442552.pdf8a3aef50bd6e373e63349d63858be524MD51tede/51902015-04-17 11:57:32.601oai:tede2.pucrs.br:tede/5190Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:32Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação
title Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação
spellingShingle Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação
Noll, Rodrigo Perozzo
INFORMÁTICA
ONTOLOGIA
RECUPERAÇÃO DA INFORMAÇÃO
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação
title_full Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação
title_fullStr Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação
title_full_unstemmed Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação
title_sort Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação
author Noll, Rodrigo Perozzo
author_facet Noll, Rodrigo Perozzo
author_role author
dc.contributor.advisor1.fl_str_mv Ribeiro, Marcelo Blois
dc.contributor.advisor1ID.fl_str_mv CPF:02820399703
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4792228H1
dc.contributor.authorID.fl_str_mv CPF:81888600004
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4509721E5
dc.contributor.author.fl_str_mv Noll, Rodrigo Perozzo
contributor_str_mv Ribeiro, Marcelo Blois
dc.subject.por.fl_str_mv INFORMÁTICA
ONTOLOGIA
RECUPERAÇÃO DA INFORMAÇÃO
topic INFORMÁTICA
ONTOLOGIA
RECUPERAÇÃO DA INFORMAÇÃO
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Changes are inevitable during the product lifecycle. These changes are due different needs, such as the knowledge evolution of business processes, environment or infrastructure changes, etc. Under these circumstances, it is crucial to have the control about the knowledge of what these changes mean to the system. Impact analysis represents the process that creates this knowledge. The impact analysis has a wide meaning for software development, such as the assessment of source code structures or the control of project management constraints. This thesis aims to present a model to analyze the impact in source code using ontologies in order to improve precision and recall of the identified source code structures compared to existing techniques. The use of ontologies integrates a semantic layer under the traditional techniques founded in syntactic analysis. To develop the impact analysis model, it was defined two different sub models: traceability and probability. The traceability model receives as input the source code and domain ontology and generates a traceability ontology populated with links between domain concepts (classes and properties) and source code units (classes, methods and attributes). These links are populated by a lexical and semantic analyzer that categorize, normalize (token generation, expansion and elimination) and compare (stemming) each token. With the traceability ontology and a change request, the probabilistic model classifies each traceability link using Bayesian Belief Networks. To the probability calculus, the node classification used the Google PageRank algorithm and the arrows used frequency analysis TFIDF and conceptual dependency, defined in this thesis. The impact analysis model was implemented as an Eclipse plugin and was empirically evaluated using three controlled experiments.
publishDate 2012
dc.date.available.fl_str_mv 2012-10-10
dc.date.issued.fl_str_mv 2012-08-13
dc.date.accessioned.fl_str_mv 2015-04-14T14:49:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv NOLL, Rodrigo Perozzo. Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação. 2012. 235 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/5190
identifier_str_mv NOLL, Rodrigo Perozzo. Um modelo para a análise de impacto em código fonte usando ontologias e recuperação de informação. 2012. 235 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.
url http://tede2.pucrs.br/tede2/handle/tede/5190
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 500
600
dc.relation.department.fl_str_mv 1946639708616176246
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Faculdade de Informáca
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/5190/3/442552.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/5190/2/442552.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/5190/1/442552.pdf
bitstream.checksum.fl_str_mv 67c926695b7a8b49ec426f9bfd56dba5
36b7e42cef16c2206c079d953e33e4b7
8a3aef50bd6e373e63349d63858be524
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765306087833600