Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria

Detalhes bibliográficos
Autor(a) principal: Bandeira, Andre Luis Martins
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/5304
Resumo: Defeitos são inevitáveis em projetos de software, portanto, adotar uma política de análise e gerenciamento de defeitos durante o ciclo de desenvolvimento de software e vital para a garantia de qualidade do mesmo. O armazenamento de relatórios de defeitos é comum no ciclo de desenvolvimento de software, mas as informações contidas nos relatórios são difíceis de entender uma vez que geralmente são escritas em linguagem natural. Nesse sentido, a classificação de defeitos pode ajudar a agilizar o processo de entendimento e gerenciamento desses defeitos. Por serem escritas em linguagem natural, a classificação automática de defeitos se torna difícil e pode ter baixa efetividade, com um analista levando em media de 6 minutos para cada relatório de defeito. Devido a isso, alguns estudos propõem a utilização de abordagens de seleção de atributos para aumentar a precisão da classificação automática de defeitos. Este trabalho apresenta um estudo de caso da indústria com a classificação automática dos defeitos utilizando métodos de seleção de atributos propostos na literatura. Além disso, é proposta uma alteração ao algoritmo de seleção de características USES visando melhorar sua efetividade, o novo algoritmo foi denominado USES+. Como resultado, tem-se que as abordagens automáticas de seleção de atributos resultam em uma maior efetividade da classificação automática de defeito. Por fim, USES+ obteve uma melhor efetividade quando comparado ao USES, inclusive com diferenças significativas. Portanto, de um modo geral, a classificação automática de defeitos utilizando abordagens de seleção de atributos mostrou ser bastante promissora apresentando uma boa efetividade. Dessa forma, a classificação automática permite a redução do custo de priorização dos defeitos, melhorando significativamente o tempo para que as correções essenciais sejam executas.
id UTFPR-12_defaeb9df16ffceadf6baeb26f1580c4
oai_identifier_str oai:repositorio.utfpr.edu.br:1/5304
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-10-27T00:51:44Z2020-10-27T00:51:44Z2019-07-17BANDEIRA, Andre Luis Martins. Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria. 2019. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/5304Defeitos são inevitáveis em projetos de software, portanto, adotar uma política de análise e gerenciamento de defeitos durante o ciclo de desenvolvimento de software e vital para a garantia de qualidade do mesmo. O armazenamento de relatórios de defeitos é comum no ciclo de desenvolvimento de software, mas as informações contidas nos relatórios são difíceis de entender uma vez que geralmente são escritas em linguagem natural. Nesse sentido, a classificação de defeitos pode ajudar a agilizar o processo de entendimento e gerenciamento desses defeitos. Por serem escritas em linguagem natural, a classificação automática de defeitos se torna difícil e pode ter baixa efetividade, com um analista levando em media de 6 minutos para cada relatório de defeito. Devido a isso, alguns estudos propõem a utilização de abordagens de seleção de atributos para aumentar a precisão da classificação automática de defeitos. Este trabalho apresenta um estudo de caso da indústria com a classificação automática dos defeitos utilizando métodos de seleção de atributos propostos na literatura. Além disso, é proposta uma alteração ao algoritmo de seleção de características USES visando melhorar sua efetividade, o novo algoritmo foi denominado USES+. Como resultado, tem-se que as abordagens automáticas de seleção de atributos resultam em uma maior efetividade da classificação automática de defeito. Por fim, USES+ obteve uma melhor efetividade quando comparado ao USES, inclusive com diferenças significativas. Portanto, de um modo geral, a classificação automática de defeitos utilizando abordagens de seleção de atributos mostrou ser bastante promissora apresentando uma boa efetividade. Dessa forma, a classificação automática permite a redução do custo de priorização dos defeitos, melhorando significativamente o tempo para que as correções essenciais sejam executas.Defects are inevitable in software projects, so adopting a policy of analyzing and managing defects during the software development cycle is vital for quality assurance. Storing defect reports is commonplace in the software development cycle, but the information contained in the reports is difficult to understand because they are usually written in natural language. In this sense, classifying defects can help streamline the defect management process. As they are written in natural language, automatic defect classification becomes difficult and may have low effectiveness, with an analyst taking an average of 6 minutes for each bug report. Some studies propose using feature selection approaches to increase the accuracy of automatic defect classification. This study presents an industry case study with automatic defect classification using feature selection approaches proposed in the literature. In addition, a change to the USES feature selection algorithm is proposed to improve its effectiveness, the new algorithm was denominated USES+. As a result, we have that the automatic feature selection approaches result in a greater effectiveness of the automatic classification of defect written in natural language. Finally, USES+ obtained a better effectiveness when compared to USES, even with significant differences. Thus, in general, automatic defect classification using feature selection approaches has shown to be promising with good effectiveness. In this way, automatic classification allows reduction of the cost of prioritization of defects, significantly improving the delivery of the essential corrections.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioPrograma de Pós-Graduação em InformáticaUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRACiência Da ComputaçãoSoftware - DesenvolvimentoLocalização de falhas (Engenharia)Processamento de linguagem natural (Computação)Aprendizado do computadorComputer software - DevelopmentFault location (Engineering)Natural language processing (Computer science)Machine learningClassificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústriaAutomatic software defect priority classification using feature selection: a case study in industryinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCornélio ProcópioWatanabe, Willian Massamihttp://lattes.cnpq.br/8946276875418151Oliveira Junior, Edson Alves Dehttp://lattes.cnpq.br/8717980588591239Silva, Marco Aurelio Graciottohttp://lattes.cnpq.br/9383290036853173Re, Reginaldohttp://lattes.cnpq.br/5545891505433768Watanabe, Willian Massamihttp://lattes.cnpq.br/8946276875418151http://lattes.cnpq.br/4854076312675350Bandeira, Andre Luis Martinsinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_PPGI_M__Bandeira,AndreLuisMartins_2019.pdfapplication/pdf2268818http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5304/1/CP_PPGI_M__Bandeira%2cAndreLuisMartins_2019.pdfdd0bca0eba4328c50abcd6ae11e43a8fMD51TEXTCP_PPGI_M__Bandeira,AndreLuisMartins_2019.pdf.txtCP_PPGI_M__Bandeira,AndreLuisMartins_2019.pdf.txtExtracted texttext/plain100031http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5304/2/CP_PPGI_M__Bandeira%2cAndreLuisMartins_2019.pdf.txt6cb3ef4d8dca0dcb38bee36bdee63416MD52THUMBNAILCP_PPGI_M__Bandeira,AndreLuisMartins_2019.pdf.jpgCP_PPGI_M__Bandeira,AndreLuisMartins_2019.pdf.jpgGenerated Thumbnailimage/jpeg1338http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5304/3/CP_PPGI_M__Bandeira%2cAndreLuisMartins_2019.pdf.jpg2642f5f43075407793e239d3b185c902MD531/53042020-10-27 03:00:59.469oai:repositorio.utfpr.edu.br:1/5304Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-10-27T06:00:59Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
dc.title.alternative.pt_BR.fl_str_mv Automatic software defect priority classification using feature selection: a case study in industry
title Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
spellingShingle Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
Bandeira, Andre Luis Martins
CNPQ::CIENCIAS EXATAS E DA TERRA
Software - Desenvolvimento
Localização de falhas (Engenharia)
Processamento de linguagem natural (Computação)
Aprendizado do computador
Computer software - Development
Fault location (Engineering)
Natural language processing (Computer science)
Machine learning
Ciência Da Computação
title_short Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
title_full Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
title_fullStr Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
title_full_unstemmed Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
title_sort Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
author Bandeira, Andre Luis Martins
author_facet Bandeira, Andre Luis Martins
author_role author
dc.contributor.advisor1.fl_str_mv Watanabe, Willian Massami
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8946276875418151
dc.contributor.referee1.fl_str_mv Oliveira Junior, Edson Alves De
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/8717980588591239
dc.contributor.referee2.fl_str_mv Silva, Marco Aurelio Graciotto
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/9383290036853173
dc.contributor.referee3.fl_str_mv Re, Reginaldo
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/5545891505433768
dc.contributor.referee4.fl_str_mv Watanabe, Willian Massami
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/8946276875418151
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4854076312675350
dc.contributor.author.fl_str_mv Bandeira, Andre Luis Martins
contributor_str_mv Watanabe, Willian Massami
Oliveira Junior, Edson Alves De
Silva, Marco Aurelio Graciotto
Re, Reginaldo
Watanabe, Willian Massami
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA
topic CNPQ::CIENCIAS EXATAS E DA TERRA
Software - Desenvolvimento
Localização de falhas (Engenharia)
Processamento de linguagem natural (Computação)
Aprendizado do computador
Computer software - Development
Fault location (Engineering)
Natural language processing (Computer science)
Machine learning
Ciência Da Computação
dc.subject.por.fl_str_mv Software - Desenvolvimento
Localização de falhas (Engenharia)
Processamento de linguagem natural (Computação)
Aprendizado do computador
Computer software - Development
Fault location (Engineering)
Natural language processing (Computer science)
Machine learning
dc.subject.capes.pt_BR.fl_str_mv Ciência Da Computação
description Defeitos são inevitáveis em projetos de software, portanto, adotar uma política de análise e gerenciamento de defeitos durante o ciclo de desenvolvimento de software e vital para a garantia de qualidade do mesmo. O armazenamento de relatórios de defeitos é comum no ciclo de desenvolvimento de software, mas as informações contidas nos relatórios são difíceis de entender uma vez que geralmente são escritas em linguagem natural. Nesse sentido, a classificação de defeitos pode ajudar a agilizar o processo de entendimento e gerenciamento desses defeitos. Por serem escritas em linguagem natural, a classificação automática de defeitos se torna difícil e pode ter baixa efetividade, com um analista levando em media de 6 minutos para cada relatório de defeito. Devido a isso, alguns estudos propõem a utilização de abordagens de seleção de atributos para aumentar a precisão da classificação automática de defeitos. Este trabalho apresenta um estudo de caso da indústria com a classificação automática dos defeitos utilizando métodos de seleção de atributos propostos na literatura. Além disso, é proposta uma alteração ao algoritmo de seleção de características USES visando melhorar sua efetividade, o novo algoritmo foi denominado USES+. Como resultado, tem-se que as abordagens automáticas de seleção de atributos resultam em uma maior efetividade da classificação automática de defeito. Por fim, USES+ obteve uma melhor efetividade quando comparado ao USES, inclusive com diferenças significativas. Portanto, de um modo geral, a classificação automática de defeitos utilizando abordagens de seleção de atributos mostrou ser bastante promissora apresentando uma boa efetividade. Dessa forma, a classificação automática permite a redução do custo de priorização dos defeitos, melhorando significativamente o tempo para que as correções essenciais sejam executas.
publishDate 2019
dc.date.issued.fl_str_mv 2019-07-17
dc.date.accessioned.fl_str_mv 2020-10-27T00:51:44Z
dc.date.available.fl_str_mv 2020-10-27T00:51:44Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BANDEIRA, Andre Luis Martins. Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria. 2019. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2019.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/5304
identifier_str_mv BANDEIRA, Andre Luis Martins. Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria. 2019. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/5304
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Informática
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5304/1/CP_PPGI_M__Bandeira%2cAndreLuisMartins_2019.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5304/2/CP_PPGI_M__Bandeira%2cAndreLuisMartins_2019.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5304/3/CP_PPGI_M__Bandeira%2cAndreLuisMartins_2019.pdf.jpg
bitstream.checksum.fl_str_mv dd0bca0eba4328c50abcd6ae11e43a8f
6cb3ef4d8dca0dcb38bee36bdee63416
2642f5f43075407793e239d3b185c902
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923133244309504