Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais

Detalhes bibliográficos
Autor(a) principal: Coelho Neto, Luiz Eugênio
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: LOCUS Repositório Institucional da UFV
Texto Completo: https://locus.ufv.br//handle/123456789/29685
https://doi.org/10.47328/ufvbbt.2021.028
Resumo: Estimar o tempo de resolução de issues tem relevância comprovada no contexto dos proces- sos de manutenção de software. No entanto, dentre os modelos de estimativa encontrados na literatura, poucos se referem ao ambiente de issue tracking do GitHub. Apesar da popularidade dessa plataforma, especialmente no contexto Open Source, seu sistema de issue tracking é pouco burocrático e as issues são definidas de forma simplificada, o que torna o processo de construção de modelos preditivos ainda mais desafiador. O objetivo deste trabalho é desenvolver modelos de aprendizado de máquina para estimar o tempo de resolução de issues no GitHub, com intuito de auxiliar tarefas como definição de prazos. A fim de suprir a escassez de dados, são propostos atributos textuais, responsáveis por capturar características sobre o texto das issues; e temporais, responsáveis por fornecer informações sobre o momento em que ocorreram eventos relacionados a elas. Redes neu- rais (MLP) também são aplicadas para classificação e provam serem mais adequadas para resolução do problema. Para fins de validação, os modelos propostos são comparados com uma referência encontrada na literatura, revelando resultados positivos por meio de diver- sas métricas, destacando-se uma melhora significativa na acurácia. Por fim, são realizados testes após a adição das categorias de atributos propostas (textuais e temporais) a fim de avaliar o impacto causado por elas na qualidade das estimativas. Palavras-chave: Rastreamento de problemas. Estimativa do tempo de resolução. Apren- dizado de máquina. Redes neurais. GitHub.
id UFV_fe81308df8cafadd62cc3d3891f2e596
oai_identifier_str oai:locus.ufv.br:123456789/29685
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str 2145
spelling Silva, Gláucia Braga eCoelho Neto, Luiz Eugêniohttp://lattes.cnpq.br/9336171799583090Comarela, Giovanni Ventorim2022-08-17T11:48:09Z2022-08-17T11:48:09Z2021-06-25COELHO NETO, Luiz Eugênio. Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais. 2021. 64 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.https://locus.ufv.br//handle/123456789/29685https://doi.org/10.47328/ufvbbt.2021.028Estimar o tempo de resolução de issues tem relevância comprovada no contexto dos proces- sos de manutenção de software. No entanto, dentre os modelos de estimativa encontrados na literatura, poucos se referem ao ambiente de issue tracking do GitHub. Apesar da popularidade dessa plataforma, especialmente no contexto Open Source, seu sistema de issue tracking é pouco burocrático e as issues são definidas de forma simplificada, o que torna o processo de construção de modelos preditivos ainda mais desafiador. O objetivo deste trabalho é desenvolver modelos de aprendizado de máquina para estimar o tempo de resolução de issues no GitHub, com intuito de auxiliar tarefas como definição de prazos. A fim de suprir a escassez de dados, são propostos atributos textuais, responsáveis por capturar características sobre o texto das issues; e temporais, responsáveis por fornecer informações sobre o momento em que ocorreram eventos relacionados a elas. Redes neu- rais (MLP) também são aplicadas para classificação e provam serem mais adequadas para resolução do problema. Para fins de validação, os modelos propostos são comparados com uma referência encontrada na literatura, revelando resultados positivos por meio de diver- sas métricas, destacando-se uma melhora significativa na acurácia. Por fim, são realizados testes após a adição das categorias de atributos propostas (textuais e temporais) a fim de avaliar o impacto causado por elas na qualidade das estimativas. Palavras-chave: Rastreamento de problemas. Estimativa do tempo de resolução. Apren- dizado de máquina. Redes neurais. GitHub.Estimating issues resolution time is one of the most important step in software main- tenance processes. However, although the subject is covered in the literature, there are few specific models for GitHub. This platform is very popular mainly in the open source context but its issue tracking system is not bureaucratic and issues are registered in a very simple way, which makes the process of building predictive models even more chal- lenging. This work aims to develop machine learning models to estimate the resolution time of issues from GitHub. To handle with the data scarcity, we propose textual at- tributes to capture issues characteristics; and temporal attributes to provide information about the time of issue events. Neural networks were used in classification algorithms and proved to be more suitable for solving this problem. To validade the proposed models we compared them with a reference from literature through different metrics and the results were positive with a significant improvement in accuracy. Finally, to validate the new attributes we conduct comparative tests in order to assess the impact of their inclusion on the estimations quality. Keywords: Issue tracking. Issue lifetime prediction. Machine Learning Model. Neural networks GitHub.porUniversidade Federal de ViçosaCiência da ComputaçãoAprendizado do computadorRedes neurais (Computação)GitHub (Programa de computador)Ciência da ComputaçãoModelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporaisModels for estimating issue resolution time on GitHub using textual and temporal featuresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2021-06-25Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf7226770https://locus.ufv.br//bitstream/123456789/29685/1/texto%20completo.pdf5711cda961022626c91cdc31bf0fe1e2MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/29685/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/296852022-08-17 08:48:55.635oai:locus.ufv.br:123456789/29685Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452022-08-17T11:48:55LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.pt-BR.fl_str_mv Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
dc.title.en.fl_str_mv Models for estimating issue resolution time on GitHub using textual and temporal features
title Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
spellingShingle Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
Coelho Neto, Luiz Eugênio
Aprendizado do computador
Redes neurais (Computação)
GitHub (Programa de computador)
Ciência da Computação
title_short Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
title_full Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
title_fullStr Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
title_full_unstemmed Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
title_sort Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
author Coelho Neto, Luiz Eugênio
author_facet Coelho Neto, Luiz Eugênio
author_role author
dc.contributor.authorLattes.pt-BR.fl_str_mv http://lattes.cnpq.br/9336171799583090
dc.contributor.none.fl_str_mv Silva, Gláucia Braga e
dc.contributor.author.fl_str_mv Coelho Neto, Luiz Eugênio
dc.contributor.advisor1.fl_str_mv Comarela, Giovanni Ventorim
contributor_str_mv Comarela, Giovanni Ventorim
dc.subject.pt-BR.fl_str_mv Aprendizado do computador
Redes neurais (Computação)
GitHub (Programa de computador)
topic Aprendizado do computador
Redes neurais (Computação)
GitHub (Programa de computador)
Ciência da Computação
dc.subject.cnpq.fl_str_mv Ciência da Computação
description Estimar o tempo de resolução de issues tem relevância comprovada no contexto dos proces- sos de manutenção de software. No entanto, dentre os modelos de estimativa encontrados na literatura, poucos se referem ao ambiente de issue tracking do GitHub. Apesar da popularidade dessa plataforma, especialmente no contexto Open Source, seu sistema de issue tracking é pouco burocrático e as issues são definidas de forma simplificada, o que torna o processo de construção de modelos preditivos ainda mais desafiador. O objetivo deste trabalho é desenvolver modelos de aprendizado de máquina para estimar o tempo de resolução de issues no GitHub, com intuito de auxiliar tarefas como definição de prazos. A fim de suprir a escassez de dados, são propostos atributos textuais, responsáveis por capturar características sobre o texto das issues; e temporais, responsáveis por fornecer informações sobre o momento em que ocorreram eventos relacionados a elas. Redes neu- rais (MLP) também são aplicadas para classificação e provam serem mais adequadas para resolução do problema. Para fins de validação, os modelos propostos são comparados com uma referência encontrada na literatura, revelando resultados positivos por meio de diver- sas métricas, destacando-se uma melhora significativa na acurácia. Por fim, são realizados testes após a adição das categorias de atributos propostas (textuais e temporais) a fim de avaliar o impacto causado por elas na qualidade das estimativas. Palavras-chave: Rastreamento de problemas. Estimativa do tempo de resolução. Apren- dizado de máquina. Redes neurais. GitHub.
publishDate 2021
dc.date.issued.fl_str_mv 2021-06-25
dc.date.accessioned.fl_str_mv 2022-08-17T11:48:09Z
dc.date.available.fl_str_mv 2022-08-17T11:48:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv COELHO NETO, Luiz Eugênio. Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais. 2021. 64 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.
dc.identifier.uri.fl_str_mv https://locus.ufv.br//handle/123456789/29685
dc.identifier.doi.pt-BR.fl_str_mv https://doi.org/10.47328/ufvbbt.2021.028
identifier_str_mv COELHO NETO, Luiz Eugênio. Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais. 2021. 64 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.
url https://locus.ufv.br//handle/123456789/29685
https://doi.org/10.47328/ufvbbt.2021.028
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/29685/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/29685/2/license.txt
bitstream.checksum.fl_str_mv 5711cda961022626c91cdc31bf0fe1e2
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1801213074374393856