Construção de um classificador automático de severidade de bugs para sistemas open source
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFU |
Texto Completo: | https://repositorio.ufu.br/handle/123456789/17552 http://doi.org/10.14393/ufu.di.2016.234 |
Resumo: | Software bug analysis is one of the most important activities in Software Quality. The rapid and correct implementation of the necessary repair influence both developers, who must leave the fully functioning software, and users, who need to perform their daily tasks. In this context, if there is an incorrect classification of bugs, there may be unwanted situations. One of the main factors to be assigned bugs in the act of its initial report is severity, which lives up to the urgency of correcting that problem. In this scenario, we identified in datasets with data extracted from five open source systems (Apache, Eclipse, Kernel, Mozilla and Open Office), that there is an irregular distribution of bugs with respect to existing severities, which is an early sign of misclassification. In the dataset analyzed, exists a rate of about 85% bugs being ranked with normal severity. Therefore, this classification rate can have a negative influence on software development context, where the misclassified bug can be allocated to a developer with little experience to solve it and thus the correction of the same may take longer, or even generate a incorrect implementation. Several studies in the literature have disregarded the normal bugs, working only with the portion of bugs considered severe or not severe initially. This work aimed to investigate this portion of the data, with the purpose of identifying whether the normal severity reflects the real impact and urgency, to investigate if there are bugs (initially classified as normal) that could be classified with other severity, and to assess if there are impacts for developers in this context. For this, an automatic classifier was developed, which was based on three algorithms (Näive Bayes, Max Ent and Winnow) to assess if normal severity is correct for the bugs categorized initially with this severity. The algorithms presented accuracy of about 80%, and showed that between 21% and 36% of the bugs should have been classified differently (depending on the algorithm), which represents somewhere between 70,000 and 130,000 bugs of the dataset. |
id |
UFU_367e2625a25d6f879ee0ba508eca6cee |
---|---|
oai_identifier_str |
oai:repositorio.ufu.br:123456789/17552 |
network_acronym_str |
UFU |
network_name_str |
Repositório Institucional da UFU |
repository_id_str |
|
spelling |
Construção de um classificador automático de severidade de bugs para sistemas open sourceComputaçãoSoftware - Qualidade - ControleSoftware - TestesQualidade de softwareBug trackersRepositório de bugsSeveridade de bugsSoftware qualityBug repositoryBug severityCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSoftware bug analysis is one of the most important activities in Software Quality. The rapid and correct implementation of the necessary repair influence both developers, who must leave the fully functioning software, and users, who need to perform their daily tasks. In this context, if there is an incorrect classification of bugs, there may be unwanted situations. One of the main factors to be assigned bugs in the act of its initial report is severity, which lives up to the urgency of correcting that problem. In this scenario, we identified in datasets with data extracted from five open source systems (Apache, Eclipse, Kernel, Mozilla and Open Office), that there is an irregular distribution of bugs with respect to existing severities, which is an early sign of misclassification. In the dataset analyzed, exists a rate of about 85% bugs being ranked with normal severity. Therefore, this classification rate can have a negative influence on software development context, where the misclassified bug can be allocated to a developer with little experience to solve it and thus the correction of the same may take longer, or even generate a incorrect implementation. Several studies in the literature have disregarded the normal bugs, working only with the portion of bugs considered severe or not severe initially. This work aimed to investigate this portion of the data, with the purpose of identifying whether the normal severity reflects the real impact and urgency, to investigate if there are bugs (initially classified as normal) that could be classified with other severity, and to assess if there are impacts for developers in this context. For this, an automatic classifier was developed, which was based on three algorithms (Näive Bayes, Max Ent and Winnow) to assess if normal severity is correct for the bugs categorized initially with this severity. The algorithms presented accuracy of about 80%, and showed that between 21% and 36% of the bugs should have been classified differently (depending on the algorithm), which represents somewhere between 70,000 and 130,000 bugs of the dataset.Dissertação (Mestrado)A análise de bugs de software é uma das atividades mais importantes na Qualidade de Software. A rápida e correta implementação do reparo necessário tem influência tanto para os desenvolvedores, que devem deixar o software funcionando plenamente, quanto para os usuários, que precisam executar suas tarefas diárias. Neste contexto, caso haja incorreta caracterização no relato dos bugs, podem ocorrer situações indesejadas. Um dos principais fatores a serem atribuídos ao bug no ato de seu relato inicial é severidade, que diz respeito à urgência da correção aquele problema. Diante deste cenário, identificou-se em conjuntos de dados bugs extraídos de cinco sistemas open source (Apache, Eclipse, Kernel, Mozilla e Open Office), que há uma distribuição não uniforme dos bugs com relação às severidades existentes nesta amostra, o que é um indícioinicial de má classificação. Nos dados analisados existe uma taxa de cerca de 85% de bugs sendo classificados com apenas a severidade normal. Logo, esta taxa de classificação pode influenciar negativamente no contexto do desenvolvimento do software, em que o bug mal classificado pode ser alocado para um desenvolvedor com pouca experiência para poder resolvê-lo e assim, a correção do mesmo pode demorar, ou ainda gerar uma implementação incorreta. Vários trabalhos na literatura tem desconsiderado os bugs normais, trabalhando apenas com a porção de bugs considerados severos ou não severos inicialmente. Este trabalho teve como principal objetivo investigar esta porção dos dados, com finalidade de identificar se a severidade normal reflete a real urgência de correção do bug, investigar se existem bugs (classificados inicialmente como normais) que poderiam ser classificados com outra severidade, além de avaliar se há impactos para os desenvolvedores neste sentido. Para isso, foi desenvolvido um classificador automático, que baseou-se em três algoritmos(Näive Bayes, Max Ent e Win now) para aferir se a severidade normal está correta para os bugs assim categorizados inicialmente. Os algoritmos apresentaram a curácia de cerca de 80%,e mostraram que entre 21% e 36% dos bugs deveriam ter sido classificados de outra forma(dependendo do algoritmo), o que representa algo entre 70.000 e 130.000 bugs da amostra coletada.Universidade Federal de UbelândiaBrasilPrograma de Pós-graduação em Ciência da ComputaçãoMaia, Marcelo de Almeidahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4791753E8Julia, Stéphanehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4796960H1Song, Mark Alan Junhohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4798613U6Sousa, Cláudio Ribeiro de2016-07-27T18:12:40Z2016-07-27T18:12:40Z2016-03-112016-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUSA, Cláudio Ribeiro de. Construção de um classificador automático de severidade de bugs para sistemas open source. 2016. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2016. DOI http://doi.org/10.14393/ufu.di.2016.234https://repositorio.ufu.br/handle/123456789/17552http://doi.org/10.14393/ufu.di.2016.234porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2020-09-30T22:16:58Zoai:repositorio.ufu.br:123456789/17552Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2020-09-30T22:16:58Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false |
dc.title.none.fl_str_mv |
Construção de um classificador automático de severidade de bugs para sistemas open source |
title |
Construção de um classificador automático de severidade de bugs para sistemas open source |
spellingShingle |
Construção de um classificador automático de severidade de bugs para sistemas open source Sousa, Cláudio Ribeiro de Computação Software - Qualidade - Controle Software - Testes Qualidade de software Bug trackers Repositório de bugs Severidade de bugs Software quality Bug repository Bug severity CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Construção de um classificador automático de severidade de bugs para sistemas open source |
title_full |
Construção de um classificador automático de severidade de bugs para sistemas open source |
title_fullStr |
Construção de um classificador automático de severidade de bugs para sistemas open source |
title_full_unstemmed |
Construção de um classificador automático de severidade de bugs para sistemas open source |
title_sort |
Construção de um classificador automático de severidade de bugs para sistemas open source |
author |
Sousa, Cláudio Ribeiro de |
author_facet |
Sousa, Cláudio Ribeiro de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Maia, Marcelo de Almeida http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4791753E8 Julia, Stéphane http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4796960H1 Song, Mark Alan Junho http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4798613U6 |
dc.contributor.author.fl_str_mv |
Sousa, Cláudio Ribeiro de |
dc.subject.por.fl_str_mv |
Computação Software - Qualidade - Controle Software - Testes Qualidade de software Bug trackers Repositório de bugs Severidade de bugs Software quality Bug repository Bug severity CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Computação Software - Qualidade - Controle Software - Testes Qualidade de software Bug trackers Repositório de bugs Severidade de bugs Software quality Bug repository Bug severity CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Software bug analysis is one of the most important activities in Software Quality. The rapid and correct implementation of the necessary repair influence both developers, who must leave the fully functioning software, and users, who need to perform their daily tasks. In this context, if there is an incorrect classification of bugs, there may be unwanted situations. One of the main factors to be assigned bugs in the act of its initial report is severity, which lives up to the urgency of correcting that problem. In this scenario, we identified in datasets with data extracted from five open source systems (Apache, Eclipse, Kernel, Mozilla and Open Office), that there is an irregular distribution of bugs with respect to existing severities, which is an early sign of misclassification. In the dataset analyzed, exists a rate of about 85% bugs being ranked with normal severity. Therefore, this classification rate can have a negative influence on software development context, where the misclassified bug can be allocated to a developer with little experience to solve it and thus the correction of the same may take longer, or even generate a incorrect implementation. Several studies in the literature have disregarded the normal bugs, working only with the portion of bugs considered severe or not severe initially. This work aimed to investigate this portion of the data, with the purpose of identifying whether the normal severity reflects the real impact and urgency, to investigate if there are bugs (initially classified as normal) that could be classified with other severity, and to assess if there are impacts for developers in this context. For this, an automatic classifier was developed, which was based on three algorithms (Näive Bayes, Max Ent and Winnow) to assess if normal severity is correct for the bugs categorized initially with this severity. The algorithms presented accuracy of about 80%, and showed that between 21% and 36% of the bugs should have been classified differently (depending on the algorithm), which represents somewhere between 70,000 and 130,000 bugs of the dataset. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-07-27T18:12:40Z 2016-07-27T18:12:40Z 2016-03-11 2016-03-11 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SOUSA, Cláudio Ribeiro de. Construção de um classificador automático de severidade de bugs para sistemas open source. 2016. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2016. DOI http://doi.org/10.14393/ufu.di.2016.234 https://repositorio.ufu.br/handle/123456789/17552 http://doi.org/10.14393/ufu.di.2016.234 |
identifier_str_mv |
SOUSA, Cláudio Ribeiro de. Construção de um classificador automático de severidade de bugs para sistemas open source. 2016. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2016. DOI http://doi.org/10.14393/ufu.di.2016.234 |
url |
https://repositorio.ufu.br/handle/123456789/17552 http://doi.org/10.14393/ufu.di.2016.234 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Ubelândia Brasil Programa de Pós-graduação em Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Ubelândia Brasil Programa de Pós-graduação em Ciência da Computação |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFU instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Repositório Institucional da UFU |
collection |
Repositório Institucional da UFU |
repository.name.fl_str_mv |
Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
diinf@dirbi.ufu.br |
_version_ |
1813711390221795328 |