Schema evolution and change coupling in MediaWiki

Detalhes bibliográficos
Autor(a) principal: Silva, Ricardo Jorge Ferreira da
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/29532
Resumo: Software developers face many adversities while working on projects, one of the most important ones being schema evolution. This is an inevitable procedure that, when not given the proper attention, can render an whole application unusable. The best option to study the impact of schema evolution on software development was the mining of data in a large database application. The chosen case study was MediaWiki. Using existing tools to mine the les of the MediaWiki project, the aim was to nd which les caused and which were a ected by schema evolution, and to extract frequent patterns. Building on existing work on mining data schema updates in each revision of MediaWiki, it was possible to extract over a hundred di erent association rules. These rules allowed the development of a recommendation system. This system allows to provide two les working on a database schema and receive as an output possible missing updates that should be applied to the newer schema. This will help software developers to keep their database schemas coherent and concise.
id RCAP_bbbbe80425e038958ebaaef3cd2eafb5
oai_identifier_str oai:ria.ua.pt:10773/29532
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Schema evolution and change coupling in MediaWikiSchema EvolutionDatabasesData MiningFrequent PatternsAssociation RulesSoftware developers face many adversities while working on projects, one of the most important ones being schema evolution. This is an inevitable procedure that, when not given the proper attention, can render an whole application unusable. The best option to study the impact of schema evolution on software development was the mining of data in a large database application. The chosen case study was MediaWiki. Using existing tools to mine the les of the MediaWiki project, the aim was to nd which les caused and which were a ected by schema evolution, and to extract frequent patterns. Building on existing work on mining data schema updates in each revision of MediaWiki, it was possible to extract over a hundred di erent association rules. These rules allowed the development of a recommendation system. This system allows to provide two les working on a database schema and receive as an output possible missing updates that should be applied to the newer schema. This will help software developers to keep their database schemas coherent and concise.Os desenvolvedores de software enfrentam diversas adversidades durante o desenvolvimento dos seus projetos, sendo uma das mais importantes a evolução dos esquemas das bases de dados. Este é um procedimento inevitável que quando não se lhe é fornecida a devida atenção, pode inutilizar uma aplicação inteira. A melhor opção para estudar o impacto da evolução dos esquemas no desenvolvimento de software foi a extração de dados de uma aplicação com uma grande base de dados. O caso de estudo escolhido foi a MediaWiki. Usando ferramentas existentes para extrair dados do projeto MediaWiki, o objectivo passou pela descoberta de cheiros que causavam a evolução de esquemas da base de dados e cheiros que eram afetados por essa evolução, e assim, extrair de padrões frequentes. Com base em trabalhos existentes, foi possível ter acesso a dados relacionados com as modificações que afetam os esquemas. A partir destes dados foi possível extrair mais de uma centena de regras de associação diferentes. Estas regras permitiram o desenvolvimento de um sistema de recomendação. Este sistema permite ao utilizador fornecer dois ficheiros que operam sobre um esquema de uma base de dados e receber as possíveis modificações a fazer no esquema mais recente. Permite-se assim que os desenvolvedores de software mantenham os seus esquemas de bases de dados coerentes e concisos.2020-10-21T14:35:54Z2019-12-01T00:00:00Z2019-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/29532engSilva, Ricardo Jorge Ferreira dainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:57:10Zoai:ria.ua.pt:10773/29532Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:01:51.189568Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Schema evolution and change coupling in MediaWiki
title Schema evolution and change coupling in MediaWiki
spellingShingle Schema evolution and change coupling in MediaWiki
Silva, Ricardo Jorge Ferreira da
Schema Evolution
Databases
Data Mining
Frequent Patterns
Association Rules
title_short Schema evolution and change coupling in MediaWiki
title_full Schema evolution and change coupling in MediaWiki
title_fullStr Schema evolution and change coupling in MediaWiki
title_full_unstemmed Schema evolution and change coupling in MediaWiki
title_sort Schema evolution and change coupling in MediaWiki
author Silva, Ricardo Jorge Ferreira da
author_facet Silva, Ricardo Jorge Ferreira da
author_role author
dc.contributor.author.fl_str_mv Silva, Ricardo Jorge Ferreira da
dc.subject.por.fl_str_mv Schema Evolution
Databases
Data Mining
Frequent Patterns
Association Rules
topic Schema Evolution
Databases
Data Mining
Frequent Patterns
Association Rules
description Software developers face many adversities while working on projects, one of the most important ones being schema evolution. This is an inevitable procedure that, when not given the proper attention, can render an whole application unusable. The best option to study the impact of schema evolution on software development was the mining of data in a large database application. The chosen case study was MediaWiki. Using existing tools to mine the les of the MediaWiki project, the aim was to nd which les caused and which were a ected by schema evolution, and to extract frequent patterns. Building on existing work on mining data schema updates in each revision of MediaWiki, it was possible to extract over a hundred di erent association rules. These rules allowed the development of a recommendation system. This system allows to provide two les working on a database schema and receive as an output possible missing updates that should be applied to the newer schema. This will help software developers to keep their database schemas coherent and concise.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-01T00:00:00Z
2019-12
2020-10-21T14:35:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/29532
url http://hdl.handle.net/10773/29532
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137674084220928