Estudo de funções de custo para redes neurais com dados desbalanceados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/BUBD-AYSFMP |
Resumo: | Este trabalho apresenta uma análise comparativa das técnicas utilizadas em redes neurais para problemas de classes desbalanceadas. A partir de uma comparação inicial das técnicas clássicas, um estudo mais aprofundado é feito sob a utilização de funções de custos para lidar com o problema de treinamento das redes neurais onde se tem desbalanceamento das classes de saída. É apresentada uma abordagem da inclusão da informação à priori na função de custo de cross-entropy junto a uma modificação do algorítimo do resilient backpropagation e como essa impacta no aprendizado de algorítimo em problemas de classes desbalanceadas. Quando se trabalha com problemas de classes desbalanceadas, medir a performance do algorítimo de aprendizado é requer métricas mais apropriadas como AUC, F1-score, Kubat's G-mean (Geometric-mean), AGm (Adjusted Geometric-mean) e outras. Todavia, a grande maioria dos problemas dessa área são treinados usando o erro médio quadrático ou a entropia-cruzada (cross-entropy - também conhecida como função de erro logística). Isso faz com que o algorítimo de otimização da rede neural busque otimizar uma função de custo diferente daquela que será utilizada para validação da performance do mesmo. É então proposta uma abordagem de como extrair métricas adequadas para problemas de desbalanceamento da matriz de confusão e transformá-las em funções de custo a serem utilizadas durante a etapa de treinamento. Um estudo comparativo entre a abordagem tradicional de treinamento e as funções de custo apresentadas é realizado, apresentando-se os pontos positivos e negativos de cada abordagem. Experimentos numéricos para diferentes bases de treinamento com diferentes tipos de desbalanceamento são apresentados. |
id |
UFMG_ea10b9d670fca3890f96e3db54eec455 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/BUBD-AYSFMP |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Antonio de Padua BragaAdriano Vilela BarbosaAlair Dias JuniorLuiz Carlos Bambirra TorresYuri Sousa Aurelio2019-08-12T02:58:19Z2019-08-12T02:58:19Z2017-12-18http://hdl.handle.net/1843/BUBD-AYSFMPEste trabalho apresenta uma análise comparativa das técnicas utilizadas em redes neurais para problemas de classes desbalanceadas. A partir de uma comparação inicial das técnicas clássicas, um estudo mais aprofundado é feito sob a utilização de funções de custos para lidar com o problema de treinamento das redes neurais onde se tem desbalanceamento das classes de saída. É apresentada uma abordagem da inclusão da informação à priori na função de custo de cross-entropy junto a uma modificação do algorítimo do resilient backpropagation e como essa impacta no aprendizado de algorítimo em problemas de classes desbalanceadas. Quando se trabalha com problemas de classes desbalanceadas, medir a performance do algorítimo de aprendizado é requer métricas mais apropriadas como AUC, F1-score, Kubat's G-mean (Geometric-mean), AGm (Adjusted Geometric-mean) e outras. Todavia, a grande maioria dos problemas dessa área são treinados usando o erro médio quadrático ou a entropia-cruzada (cross-entropy - também conhecida como função de erro logística). Isso faz com que o algorítimo de otimização da rede neural busque otimizar uma função de custo diferente daquela que será utilizada para validação da performance do mesmo. É então proposta uma abordagem de como extrair métricas adequadas para problemas de desbalanceamento da matriz de confusão e transformá-las em funções de custo a serem utilizadas durante a etapa de treinamento. Um estudo comparativo entre a abordagem tradicional de treinamento e as funções de custo apresentadas é realizado, apresentando-se os pontos positivos e negativos de cada abordagem. Experimentos numéricos para diferentes bases de treinamento com diferentes tipos de desbalanceamento são apresentados.The work presented here makes a comparative approach of the techniques used in neural networks in problems of unbalanced classes. Based on an initial comparison of classical techniques, a more in-depth study is done under the use of cost functions to deal with the problem during the training phase in neural networks with unbalanced data. An approach about the inclusion of a priori information in the cross-entropy cost function is presented together with a modification of the resilient backpropagation algorithm and the impacts on the learning algorithm. When working with problems of unbalanced classes, measuring the performance of the learning algorithm requires more appropriate metrics such as AUC, F1-score, Kubat's G-mean (Geometric-mean), AGm (Adjusted Geometric-mean) and others. However, the vast majority of problems in this area are trained using the mean square error or cross-entropy (also known as logistic error function). This makes the neural network learning algorithm to optimize a cost function different from the one that will be used to validate its performance. An approach is then presented on how to extract appropriate metrics for this kind of problem from the confusion matrix and transform them into cost functions to be used during the training phase. A comparative study between the traditional training approach and the presented cost functions is carried out, presenting the positives and negatives points of each approach. Numerical experiments for different training bases with different unbalanced rates are presented.Universidade Federal de Minas GeraisUFMGEngenharia elétricaRedes neurais (Computação)Engenharia ElétricaEstudo de funções de custo para redes neurais com dados desbalanceadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdisserta__o_arquivo_final_yuri.pdfapplication/pdf12986732https://repositorio.ufmg.br/bitstream/1843/BUBD-AYSFMP/1/disserta__o_arquivo_final_yuri.pdf3a770fa77dc24e81b338295b52bb777eMD51TEXTdisserta__o_arquivo_final_yuri.pdf.txtdisserta__o_arquivo_final_yuri.pdf.txtExtracted texttext/plain865https://repositorio.ufmg.br/bitstream/1843/BUBD-AYSFMP/2/disserta__o_arquivo_final_yuri.pdf.txt2369cf6137f6bf37e87174e64a103bf2MD521843/BUBD-AYSFMP2019-11-14 10:17:37.26oai:repositorio.ufmg.br:1843/BUBD-AYSFMPRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T13:17:37Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Estudo de funções de custo para redes neurais com dados desbalanceados |
title |
Estudo de funções de custo para redes neurais com dados desbalanceados |
spellingShingle |
Estudo de funções de custo para redes neurais com dados desbalanceados Yuri Sousa Aurelio Engenharia Elétrica Engenharia elétrica Redes neurais (Computação) |
title_short |
Estudo de funções de custo para redes neurais com dados desbalanceados |
title_full |
Estudo de funções de custo para redes neurais com dados desbalanceados |
title_fullStr |
Estudo de funções de custo para redes neurais com dados desbalanceados |
title_full_unstemmed |
Estudo de funções de custo para redes neurais com dados desbalanceados |
title_sort |
Estudo de funções de custo para redes neurais com dados desbalanceados |
author |
Yuri Sousa Aurelio |
author_facet |
Yuri Sousa Aurelio |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Antonio de Padua Braga |
dc.contributor.referee1.fl_str_mv |
Adriano Vilela Barbosa |
dc.contributor.referee2.fl_str_mv |
Alair Dias Junior |
dc.contributor.referee3.fl_str_mv |
Luiz Carlos Bambirra Torres |
dc.contributor.author.fl_str_mv |
Yuri Sousa Aurelio |
contributor_str_mv |
Antonio de Padua Braga Adriano Vilela Barbosa Alair Dias Junior Luiz Carlos Bambirra Torres |
dc.subject.por.fl_str_mv |
Engenharia Elétrica |
topic |
Engenharia Elétrica Engenharia elétrica Redes neurais (Computação) |
dc.subject.other.pt_BR.fl_str_mv |
Engenharia elétrica Redes neurais (Computação) |
description |
Este trabalho apresenta uma análise comparativa das técnicas utilizadas em redes neurais para problemas de classes desbalanceadas. A partir de uma comparação inicial das técnicas clássicas, um estudo mais aprofundado é feito sob a utilização de funções de custos para lidar com o problema de treinamento das redes neurais onde se tem desbalanceamento das classes de saída. É apresentada uma abordagem da inclusão da informação à priori na função de custo de cross-entropy junto a uma modificação do algorítimo do resilient backpropagation e como essa impacta no aprendizado de algorítimo em problemas de classes desbalanceadas. Quando se trabalha com problemas de classes desbalanceadas, medir a performance do algorítimo de aprendizado é requer métricas mais apropriadas como AUC, F1-score, Kubat's G-mean (Geometric-mean), AGm (Adjusted Geometric-mean) e outras. Todavia, a grande maioria dos problemas dessa área são treinados usando o erro médio quadrático ou a entropia-cruzada (cross-entropy - também conhecida como função de erro logística). Isso faz com que o algorítimo de otimização da rede neural busque otimizar uma função de custo diferente daquela que será utilizada para validação da performance do mesmo. É então proposta uma abordagem de como extrair métricas adequadas para problemas de desbalanceamento da matriz de confusão e transformá-las em funções de custo a serem utilizadas durante a etapa de treinamento. Um estudo comparativo entre a abordagem tradicional de treinamento e as funções de custo apresentadas é realizado, apresentando-se os pontos positivos e negativos de cada abordagem. Experimentos numéricos para diferentes bases de treinamento com diferentes tipos de desbalanceamento são apresentados. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-12-18 |
dc.date.accessioned.fl_str_mv |
2019-08-12T02:58:19Z |
dc.date.available.fl_str_mv |
2019-08-12T02:58:19Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/BUBD-AYSFMP |
url |
http://hdl.handle.net/1843/BUBD-AYSFMP |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/BUBD-AYSFMP/1/disserta__o_arquivo_final_yuri.pdf https://repositorio.ufmg.br/bitstream/1843/BUBD-AYSFMP/2/disserta__o_arquivo_final_yuri.pdf.txt |
bitstream.checksum.fl_str_mv |
3a770fa77dc24e81b338295b52bb777e 2369cf6137f6bf37e87174e64a103bf2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589487989620736 |