Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o

Detalhes bibliográficos
Autor(a) principal: Noll, Rodrigo Perozzo
Data de Publicação: 2012
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/5190
Resumo: Changes are inevitable during the product lifecycle. These changes are due different needs, such as the knowledge evolution of business processes, environment or infrastructure changes, etc. Under these circumstances, it is crucial to have the control about the knowledge of what these changes mean to the system. Impact analysis represents the process that creates this knowledge. The impact analysis has a wide meaning for software development, such as the assessment of source code structures or the control of project management constraints. This thesis aims to present a model to analyze the impact in source code using ontologies in order to improve precision and recall of the identified source code structures compared to existing techniques. The use of ontologies integrates a semantic layer under the traditional techniques founded in syntactic analysis. To develop the impact analysis model, it was defined two different sub models: traceability and probability. The traceability model receives as input the source code and domain ontology and generates a traceability ontology populated with links between domain concepts (classes and properties) and source code units (classes, methods and attributes). These links are populated by a lexical and semantic analyzer that categorize, normalize (token generation, expansion and elimination) and compare (stemming) each token. With the traceability ontology and a change request, the probabilistic model classifies each traceability link using Bayesian Belief Networks. To the probability calculus, the node classification used the Google PageRank algorithm and the arrows used frequency analysis TFIDF and conceptual dependency, defined in this thesis. The impact analysis model was implemented as an Eclipse plugin and was empirically evaluated using three controlled experiments.
id P_RS_aafb0a60810c2ca773ee34cf1877e7d7
oai_identifier_str oai:tede2.pucrs.br:tede/5190
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Ribeiro, Marcelo BloisCPF:02820399703http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4792228H1CPF:81888600004http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4509721E5Noll, Rodrigo Perozzo2015-04-14T14:49:53Z2012-10-102012-08-13NOLL, Rodrigo Perozzo. Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o. 2012. 235 f. Tese (Doutorado em Ci?ncia da Computa??o) - Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Porto Alegre, 2012.http://tede2.pucrs.br/tede2/handle/tede/5190Changes are inevitable during the product lifecycle. These changes are due different needs, such as the knowledge evolution of business processes, environment or infrastructure changes, etc. Under these circumstances, it is crucial to have the control about the knowledge of what these changes mean to the system. Impact analysis represents the process that creates this knowledge. The impact analysis has a wide meaning for software development, such as the assessment of source code structures or the control of project management constraints. This thesis aims to present a model to analyze the impact in source code using ontologies in order to improve precision and recall of the identified source code structures compared to existing techniques. The use of ontologies integrates a semantic layer under the traditional techniques founded in syntactic analysis. To develop the impact analysis model, it was defined two different sub models: traceability and probability. The traceability model receives as input the source code and domain ontology and generates a traceability ontology populated with links between domain concepts (classes and properties) and source code units (classes, methods and attributes). These links are populated by a lexical and semantic analyzer that categorize, normalize (token generation, expansion and elimination) and compare (stemming) each token. With the traceability ontology and a change request, the probabilistic model classifies each traceability link using Bayesian Belief Networks. To the probability calculus, the node classification used the Google PageRank algorithm and the arrows used frequency analysis TFIDF and conceptual dependency, defined in this thesis. The impact analysis model was implemented as an Eclipse plugin and was empirically evaluated using three controlled experiments.Mudan?as s?o inevit?veis durante o ciclo de vida do software. Estas mudan?as s?o resultado de diferentes necessidades, como a evolu??o do conhecimento sobre os processos de neg?cio, altera??es de ambiente, etc. Nestas circunst?ncias, ? crucial ter controle sobre o que essas mudan?as representam na aplica??o. A an?lise de impacto representa o processo que gera este conhecimento. Essa an?lise possui um significado abrangente dentro do desenvolvimento de software, incluindo desde a identifica??o de estruturas no c?digo fonte at? o controle das restri??es de gest?o de projeto. Esta tese apresenta um modelo para analisar o impacto no c?digo fonte de uma aplica??o utilizando ontologias, visando melhorar a precis?o e revoca??o de estruturas identificadas se comparadas a t?cnicas existentes. O uso de ontologias integra uma perspectiva sem?ntica nas t?cnicas tradicionalmente baseadas na an?lise sint?tica do c?digo fonte. Para o desenvolvimento do modelo de an?lise de impacto, foram definidos dois submodelos: o de rastreabilidade e o de probabilidade. O modelo de rastreabilidade recebe como entrada o c?digo fonte e uma ontologia de dom?nio e gera como resultado uma ontologia de rastreabilidade populada automaticamente com elos entre conceitos do dom?nio (classes e propriedades) e estruturas do c?digo (classes, m?todos e atributos). Estes elos s?o populados atrav?s de um analisador l?xico e sem?ntico que realiza a categoriza??o, normaliza??o (gera??o de tokens, expans?o e elimina??o) e compara??o (stemming). Com base na ontologia de rastreabilidade e em um requisito de mudan?a, o modelo probabil?stico classifica cada elo de rastreabilidade utilizando o modelo de Redes de Cren?as Bayesianas. Para o c?lculo de probabilidade, a classifica??o dos nodos utilizou o algoritmo PageRank do Google e das arestas, a an?lise de frequ?ncia TFIDF e a depend?ncia conceitual, definida nesta tese. Este modelo de an?lise de impacto foi implementado como um plugin do eclipse e foi avaliado empiricamente atrav?s de tr?s experimentos controlados.Made available in DSpace on 2015-04-14T14:49:53Z (GMT). No. of bitstreams: 1 442552.pdf: 9370705 bytes, checksum: 8a3aef50bd6e373e63349d63858be524 (MD5) Previous issue date: 2012-08-13application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/16065/442552.pdf.jpgporPontif?cia Universidade Cat?lica do Rio Grande do SulPrograma de P?s-Gradua??o em Ci?ncia da Computa??oPUCRSBRFaculdade de Inform?caINFORM?TICAONTOLOGIARECUPERA??O DA INFORMA??OCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUm modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??oinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL442552.pdf.jpg442552.pdf.jpgimage/jpeg4234http://tede2.pucrs.br/tede2/bitstream/tede/5190/3/442552.pdf.jpg67c926695b7a8b49ec426f9bfd56dba5MD53TEXT442552.pdf.txt442552.pdf.txttext/plain443114http://tede2.pucrs.br/tede2/bitstream/tede/5190/2/442552.pdf.txt36b7e42cef16c2206c079d953e33e4b7MD52ORIGINAL442552.pdfapplication/pdf9370705http://tede2.pucrs.br/tede2/bitstream/tede/5190/1/442552.pdf8a3aef50bd6e373e63349d63858be524MD51tede/51902015-04-17 11:57:32.601oai:tede2.pucrs.br:tede/5190Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:32Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o
title Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o
spellingShingle Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o
Noll, Rodrigo Perozzo
INFORM?TICA
ONTOLOGIA
RECUPERA??O DA INFORMA??O
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o
title_full Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o
title_fullStr Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o
title_full_unstemmed Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o
title_sort Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o
author Noll, Rodrigo Perozzo
author_facet Noll, Rodrigo Perozzo
author_role author
dc.contributor.advisor1.fl_str_mv Ribeiro, Marcelo Blois
dc.contributor.advisor1ID.fl_str_mv CPF:02820399703
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4792228H1
dc.contributor.authorID.fl_str_mv CPF:81888600004
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4509721E5
dc.contributor.author.fl_str_mv Noll, Rodrigo Perozzo
contributor_str_mv Ribeiro, Marcelo Blois
dc.subject.por.fl_str_mv INFORM?TICA
ONTOLOGIA
RECUPERA??O DA INFORMA??O
topic INFORM?TICA
ONTOLOGIA
RECUPERA??O DA INFORMA??O
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Changes are inevitable during the product lifecycle. These changes are due different needs, such as the knowledge evolution of business processes, environment or infrastructure changes, etc. Under these circumstances, it is crucial to have the control about the knowledge of what these changes mean to the system. Impact analysis represents the process that creates this knowledge. The impact analysis has a wide meaning for software development, such as the assessment of source code structures or the control of project management constraints. This thesis aims to present a model to analyze the impact in source code using ontologies in order to improve precision and recall of the identified source code structures compared to existing techniques. The use of ontologies integrates a semantic layer under the traditional techniques founded in syntactic analysis. To develop the impact analysis model, it was defined two different sub models: traceability and probability. The traceability model receives as input the source code and domain ontology and generates a traceability ontology populated with links between domain concepts (classes and properties) and source code units (classes, methods and attributes). These links are populated by a lexical and semantic analyzer that categorize, normalize (token generation, expansion and elimination) and compare (stemming) each token. With the traceability ontology and a change request, the probabilistic model classifies each traceability link using Bayesian Belief Networks. To the probability calculus, the node classification used the Google PageRank algorithm and the arrows used frequency analysis TFIDF and conceptual dependency, defined in this thesis. The impact analysis model was implemented as an Eclipse plugin and was empirically evaluated using three controlled experiments.
publishDate 2012
dc.date.available.fl_str_mv 2012-10-10
dc.date.issued.fl_str_mv 2012-08-13
dc.date.accessioned.fl_str_mv 2015-04-14T14:49:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv NOLL, Rodrigo Perozzo. Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o. 2012. 235 f. Tese (Doutorado em Ci?ncia da Computa??o) - Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Porto Alegre, 2012.
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/5190
identifier_str_mv NOLL, Rodrigo Perozzo. Um modelo para a an?lise de impacto em c?digo fonte usando ontologias e recupera??o de informa??o. 2012. 235 f. Tese (Doutorado em Ci?ncia da Computa??o) - Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Porto Alegre, 2012.
url http://tede2.pucrs.br/tede2/handle/tede/5190
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 500
600
dc.relation.department.fl_str_mv 1946639708616176246
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontif?cia Universidade Cat?lica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de P?s-Gradua??o em Ci?ncia da Computa??o
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Faculdade de Inform?ca
publisher.none.fl_str_mv Pontif?cia Universidade Cat?lica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/5190/3/442552.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/5190/2/442552.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/5190/1/442552.pdf
bitstream.checksum.fl_str_mv 67c926695b7a8b49ec426f9bfd56dba5
36b7e42cef16c2206c079d953e33e4b7
8a3aef50bd6e373e63349d63858be524
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1796793087849136128