Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | https://locus.ufv.br//handle/123456789/29685 https://doi.org/10.47328/ufvbbt.2021.028 |
Resumo: | Estimar o tempo de resolução de issues tem relevância comprovada no contexto dos proces- sos de manutenção de software. No entanto, dentre os modelos de estimativa encontrados na literatura, poucos se referem ao ambiente de issue tracking do GitHub. Apesar da popularidade dessa plataforma, especialmente no contexto Open Source, seu sistema de issue tracking é pouco burocrático e as issues são definidas de forma simplificada, o que torna o processo de construção de modelos preditivos ainda mais desafiador. O objetivo deste trabalho é desenvolver modelos de aprendizado de máquina para estimar o tempo de resolução de issues no GitHub, com intuito de auxiliar tarefas como definição de prazos. A fim de suprir a escassez de dados, são propostos atributos textuais, responsáveis por capturar características sobre o texto das issues; e temporais, responsáveis por fornecer informações sobre o momento em que ocorreram eventos relacionados a elas. Redes neu- rais (MLP) também são aplicadas para classificação e provam serem mais adequadas para resolução do problema. Para fins de validação, os modelos propostos são comparados com uma referência encontrada na literatura, revelando resultados positivos por meio de diver- sas métricas, destacando-se uma melhora significativa na acurácia. Por fim, são realizados testes após a adição das categorias de atributos propostas (textuais e temporais) a fim de avaliar o impacto causado por elas na qualidade das estimativas. Palavras-chave: Rastreamento de problemas. Estimativa do tempo de resolução. Apren- dizado de máquina. Redes neurais. GitHub. |
id |
UFV_fe81308df8cafadd62cc3d3891f2e596 |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/29685 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Silva, Gláucia Braga eCoelho Neto, Luiz Eugêniohttp://lattes.cnpq.br/9336171799583090Comarela, Giovanni Ventorim2022-08-17T11:48:09Z2022-08-17T11:48:09Z2021-06-25COELHO NETO, Luiz Eugênio. Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais. 2021. 64 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.https://locus.ufv.br//handle/123456789/29685https://doi.org/10.47328/ufvbbt.2021.028Estimar o tempo de resolução de issues tem relevância comprovada no contexto dos proces- sos de manutenção de software. No entanto, dentre os modelos de estimativa encontrados na literatura, poucos se referem ao ambiente de issue tracking do GitHub. Apesar da popularidade dessa plataforma, especialmente no contexto Open Source, seu sistema de issue tracking é pouco burocrático e as issues são definidas de forma simplificada, o que torna o processo de construção de modelos preditivos ainda mais desafiador. O objetivo deste trabalho é desenvolver modelos de aprendizado de máquina para estimar o tempo de resolução de issues no GitHub, com intuito de auxiliar tarefas como definição de prazos. A fim de suprir a escassez de dados, são propostos atributos textuais, responsáveis por capturar características sobre o texto das issues; e temporais, responsáveis por fornecer informações sobre o momento em que ocorreram eventos relacionados a elas. Redes neu- rais (MLP) também são aplicadas para classificação e provam serem mais adequadas para resolução do problema. Para fins de validação, os modelos propostos são comparados com uma referência encontrada na literatura, revelando resultados positivos por meio de diver- sas métricas, destacando-se uma melhora significativa na acurácia. Por fim, são realizados testes após a adição das categorias de atributos propostas (textuais e temporais) a fim de avaliar o impacto causado por elas na qualidade das estimativas. Palavras-chave: Rastreamento de problemas. Estimativa do tempo de resolução. Apren- dizado de máquina. Redes neurais. GitHub.Estimating issues resolution time is one of the most important step in software main- tenance processes. However, although the subject is covered in the literature, there are few specific models for GitHub. This platform is very popular mainly in the open source context but its issue tracking system is not bureaucratic and issues are registered in a very simple way, which makes the process of building predictive models even more chal- lenging. This work aims to develop machine learning models to estimate the resolution time of issues from GitHub. To handle with the data scarcity, we propose textual at- tributes to capture issues characteristics; and temporal attributes to provide information about the time of issue events. Neural networks were used in classification algorithms and proved to be more suitable for solving this problem. To validade the proposed models we compared them with a reference from literature through different metrics and the results were positive with a significant improvement in accuracy. Finally, to validate the new attributes we conduct comparative tests in order to assess the impact of their inclusion on the estimations quality. Keywords: Issue tracking. Issue lifetime prediction. Machine Learning Model. Neural networks GitHub.porUniversidade Federal de ViçosaCiência da ComputaçãoAprendizado do computadorRedes neurais (Computação)GitHub (Programa de computador)Ciência da ComputaçãoModelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporaisModels for estimating issue resolution time on GitHub using textual and temporal featuresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2021-06-25Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf7226770https://locus.ufv.br//bitstream/123456789/29685/1/texto%20completo.pdf5711cda961022626c91cdc31bf0fe1e2MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/29685/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/296852022-08-17 08:48:55.635oai:locus.ufv.br:123456789/29685Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452022-08-17T11:48:55LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.pt-BR.fl_str_mv |
Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais |
dc.title.en.fl_str_mv |
Models for estimating issue resolution time on GitHub using textual and temporal features |
title |
Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais |
spellingShingle |
Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais Coelho Neto, Luiz Eugênio Aprendizado do computador Redes neurais (Computação) GitHub (Programa de computador) Ciência da Computação |
title_short |
Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais |
title_full |
Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais |
title_fullStr |
Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais |
title_full_unstemmed |
Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais |
title_sort |
Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais |
author |
Coelho Neto, Luiz Eugênio |
author_facet |
Coelho Neto, Luiz Eugênio |
author_role |
author |
dc.contributor.authorLattes.pt-BR.fl_str_mv |
http://lattes.cnpq.br/9336171799583090 |
dc.contributor.none.fl_str_mv |
Silva, Gláucia Braga e |
dc.contributor.author.fl_str_mv |
Coelho Neto, Luiz Eugênio |
dc.contributor.advisor1.fl_str_mv |
Comarela, Giovanni Ventorim |
contributor_str_mv |
Comarela, Giovanni Ventorim |
dc.subject.pt-BR.fl_str_mv |
Aprendizado do computador Redes neurais (Computação) GitHub (Programa de computador) |
topic |
Aprendizado do computador Redes neurais (Computação) GitHub (Programa de computador) Ciência da Computação |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
description |
Estimar o tempo de resolução de issues tem relevância comprovada no contexto dos proces- sos de manutenção de software. No entanto, dentre os modelos de estimativa encontrados na literatura, poucos se referem ao ambiente de issue tracking do GitHub. Apesar da popularidade dessa plataforma, especialmente no contexto Open Source, seu sistema de issue tracking é pouco burocrático e as issues são definidas de forma simplificada, o que torna o processo de construção de modelos preditivos ainda mais desafiador. O objetivo deste trabalho é desenvolver modelos de aprendizado de máquina para estimar o tempo de resolução de issues no GitHub, com intuito de auxiliar tarefas como definição de prazos. A fim de suprir a escassez de dados, são propostos atributos textuais, responsáveis por capturar características sobre o texto das issues; e temporais, responsáveis por fornecer informações sobre o momento em que ocorreram eventos relacionados a elas. Redes neu- rais (MLP) também são aplicadas para classificação e provam serem mais adequadas para resolução do problema. Para fins de validação, os modelos propostos são comparados com uma referência encontrada na literatura, revelando resultados positivos por meio de diver- sas métricas, destacando-se uma melhora significativa na acurácia. Por fim, são realizados testes após a adição das categorias de atributos propostas (textuais e temporais) a fim de avaliar o impacto causado por elas na qualidade das estimativas. Palavras-chave: Rastreamento de problemas. Estimativa do tempo de resolução. Apren- dizado de máquina. Redes neurais. GitHub. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-06-25 |
dc.date.accessioned.fl_str_mv |
2022-08-17T11:48:09Z |
dc.date.available.fl_str_mv |
2022-08-17T11:48:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
COELHO NETO, Luiz Eugênio. Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais. 2021. 64 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021. |
dc.identifier.uri.fl_str_mv |
https://locus.ufv.br//handle/123456789/29685 |
dc.identifier.doi.pt-BR.fl_str_mv |
https://doi.org/10.47328/ufvbbt.2021.028 |
identifier_str_mv |
COELHO NETO, Luiz Eugênio. Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais. 2021. 64 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021. |
url |
https://locus.ufv.br//handle/123456789/29685 https://doi.org/10.47328/ufvbbt.2021.028 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/29685/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/29685/2/license.txt |
bitstream.checksum.fl_str_mv |
5711cda961022626c91cdc31bf0fe1e2 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801213074374393856 |