Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias

Detalhes bibliográficos
Autor(a) principal: Cabral, Rafael da Veiga
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: http://hdl.handle.net/1884/26537
Resumo: Resumo: A PG (Programação Genetica) e aplicada com sucesso em Classicação. Entretanto, a pesquisa voltada a aplicação de PG para OCC (One-Class Classication) encontra-se em estagios iniciais, pois os poucos trabalhos relacionados existentes estão repletos de mudancas que não foram individualmente avaliadas e cujos propositos estão em resolver problemas provenientes do metodo de geracão de anomalias empregado e tambem na redução do tempo computacional da etapa de treino. Nesse contexto, e notavel que para tornar a PG em algoritmo de excelência para OCC o primeiro passo e avaliar sua abordagem convencional para o problema, algo que ainda no foi realizado, e objetivo central do presente trabalho, pois a introdução de novas ideias somente se justica ao se conhecer as limitações e os resultados obtidos pelo algoritmo convencional. Contudo, a aplicação de PG para OCC requer que o problema seja transformado em classicação binaria, cujas duas classes que compõem o conjunto de dados de treino são compostas por exemplos de perl normal e anormal. Porem, em diversos problemas de OCC e impraticavel obter exemplos anormais, por isto neste trabalho enfatiza-se a avaliacão de algoritmos para gerar exemplos anormais, algo que tambem ainda não foi realizado para PG. Entre os algoritmos de geração de anomalia estudados, selecionou-se o metodo pro- posto por Banhalmi et al. [6] que baseia-se em exemplos mais distantes da classe normal, o algoritmo baseado no conceito de hiperesfera proposto por Tax e Duin [38] e a tecnica RNS (Real-valued Negative Selection) inspirada em sistemas imunologicos proposta por Gonzales et al. [19] [20]. Um estudo comparativo entre eles foi realizado, para avaliar o desempenho de classicação obtido por um classicador induzido por PG convencio- nal sob uma abordagem de classicacão binaria. Vericou-se que o metodo proposto por Banhalmi et al. possibilitou a obtencão dos melhores resultados. O algoritmo de geracão de anomalias com melhor avaliacão foi empregado aos demais experimentos do presente trabalho, entre eles, um estudo comparativo entre a PG pro- posta no presente trabalho e as abordagens da literatura para OCC. Nesse experimento, vericou-se que a PG proposta neste trabalho obteve melhores resultados de classicacão em dois problemas OCC, em outros três obteve desempenho similar e em um deles foi in- ferior. Portanto, atesta-se a hipotese de que e possvel resolver OCC usando um algoritmo de PG convencional utilizando o algoritmo adequado para geracão de anomalias. O impacto de certos parâmetros da PG tambem foi avaliado. Entre eles o tamanho da populacão, que apresentou maior impacto no desempenho de classicacão em um problema OCC comparado a diferentes ajustes no tamanho da arvore e na taxa de mutacão. Alem disso, diferentes funcões de aptidão tambem foram experimentadas. Vericou-se que a funcão composta pela media das taxas individuais de acerto em cada classe apresentou melhor desempenho de classicacão OCC quando comparada ao uso da metrica AUC (Area Under the Receiver Operation Characteristic Curve). A taxa WMW (Wilcoxon- Mann-Whitney), considerada um estimador da AUC com custo computacional inferior, tambem foi aplicada como funcão de aptidão e apresentou resultado semelhante ao uso da AUC.
id UFPR_829ce55944fe056343e817e55d708731
oai_identifier_str oai:acervodigital.ufpr.br:1884/26537
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Cabral, Rafael da VeigaSpinosa, Eduardo JaquesUniversidade Federal do Paraná. Setor de Ciencias Exatas. Programa de Pós-Graduaçao em Informática2012-01-18T08:00:01Z2012-01-18T08:00:01Z2012-01-18http://hdl.handle.net/1884/26537Resumo: A PG (Programação Genetica) e aplicada com sucesso em Classicação. Entretanto, a pesquisa voltada a aplicação de PG para OCC (One-Class Classication) encontra-se em estagios iniciais, pois os poucos trabalhos relacionados existentes estão repletos de mudancas que não foram individualmente avaliadas e cujos propositos estão em resolver problemas provenientes do metodo de geracão de anomalias empregado e tambem na redução do tempo computacional da etapa de treino. Nesse contexto, e notavel que para tornar a PG em algoritmo de excelência para OCC o primeiro passo e avaliar sua abordagem convencional para o problema, algo que ainda no foi realizado, e objetivo central do presente trabalho, pois a introdução de novas ideias somente se justica ao se conhecer as limitações e os resultados obtidos pelo algoritmo convencional. Contudo, a aplicação de PG para OCC requer que o problema seja transformado em classicação binaria, cujas duas classes que compõem o conjunto de dados de treino são compostas por exemplos de perl normal e anormal. Porem, em diversos problemas de OCC e impraticavel obter exemplos anormais, por isto neste trabalho enfatiza-se a avaliacão de algoritmos para gerar exemplos anormais, algo que tambem ainda não foi realizado para PG. Entre os algoritmos de geração de anomalia estudados, selecionou-se o metodo pro- posto por Banhalmi et al. [6] que baseia-se em exemplos mais distantes da classe normal, o algoritmo baseado no conceito de hiperesfera proposto por Tax e Duin [38] e a tecnica RNS (Real-valued Negative Selection) inspirada em sistemas imunologicos proposta por Gonzales et al. [19] [20]. Um estudo comparativo entre eles foi realizado, para avaliar o desempenho de classicação obtido por um classicador induzido por PG convencio- nal sob uma abordagem de classicacão binaria. Vericou-se que o metodo proposto por Banhalmi et al. possibilitou a obtencão dos melhores resultados. O algoritmo de geracão de anomalias com melhor avaliacão foi empregado aos demais experimentos do presente trabalho, entre eles, um estudo comparativo entre a PG pro- posta no presente trabalho e as abordagens da literatura para OCC. Nesse experimento, vericou-se que a PG proposta neste trabalho obteve melhores resultados de classicacão em dois problemas OCC, em outros três obteve desempenho similar e em um deles foi in- ferior. Portanto, atesta-se a hipotese de que e possvel resolver OCC usando um algoritmo de PG convencional utilizando o algoritmo adequado para geracão de anomalias. O impacto de certos parâmetros da PG tambem foi avaliado. Entre eles o tamanho da populacão, que apresentou maior impacto no desempenho de classicacão em um problema OCC comparado a diferentes ajustes no tamanho da arvore e na taxa de mutacão. Alem disso, diferentes funcões de aptidão tambem foram experimentadas. Vericou-se que a funcão composta pela media das taxas individuais de acerto em cada classe apresentou melhor desempenho de classicacão OCC quando comparada ao uso da metrica AUC (Area Under the Receiver Operation Characteristic Curve). A taxa WMW (Wilcoxon- Mann-Whitney), considerada um estimador da AUC com custo computacional inferior, tambem foi aplicada como funcão de aptidão e apresentou resultado semelhante ao uso da AUC.application/pdfTesesProgramação genética (Computação)Algoritmos geneticosClassificação (Computadores)Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomaliasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALDissertacaoMetrado - RafaelCabral.pdfapplication/pdf1903315https://acervodigital.ufpr.br/bitstream/1884/26537/1/DissertacaoMetrado%20-%20RafaelCabral.pdf96ba915b5ef9eae7ece9732a7afbe170MD51open accessTEXTDissertacaoMetrado - RafaelCabral.pdf.txtDissertacaoMetrado - RafaelCabral.pdf.txtExtracted Texttext/plain215005https://acervodigital.ufpr.br/bitstream/1884/26537/2/DissertacaoMetrado%20-%20RafaelCabral.pdf.txt0fa1ffcc7cf2a7b85539257038659f88MD52open accessTHUMBNAILDissertacaoMetrado - RafaelCabral.pdf.jpgDissertacaoMetrado - RafaelCabral.pdf.jpgGenerated Thumbnailimage/jpeg1220https://acervodigital.ufpr.br/bitstream/1884/26537/3/DissertacaoMetrado%20-%20RafaelCabral.pdf.jpgba601c9177be23043da9bd89e1cb6b32MD53open access1884/265372016-04-07 08:31:05.717open accessoai:acervodigital.ufpr.br:1884/26537Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-07T11:31:05Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
spellingShingle Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
Cabral, Rafael da Veiga
Teses
Programação genética (Computação)
Algoritmos geneticos
Classificação (Computadores)
title_short Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_full Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_fullStr Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_full_unstemmed Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_sort Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
author Cabral, Rafael da Veiga
author_facet Cabral, Rafael da Veiga
author_role author
dc.contributor.other.pt_BR.fl_str_mv Spinosa, Eduardo Jaques
Universidade Federal do Paraná. Setor de Ciencias Exatas. Programa de Pós-Graduaçao em Informática
dc.contributor.author.fl_str_mv Cabral, Rafael da Veiga
dc.subject.por.fl_str_mv Teses
Programação genética (Computação)
Algoritmos geneticos
Classificação (Computadores)
topic Teses
Programação genética (Computação)
Algoritmos geneticos
Classificação (Computadores)
description Resumo: A PG (Programação Genetica) e aplicada com sucesso em Classicação. Entretanto, a pesquisa voltada a aplicação de PG para OCC (One-Class Classication) encontra-se em estagios iniciais, pois os poucos trabalhos relacionados existentes estão repletos de mudancas que não foram individualmente avaliadas e cujos propositos estão em resolver problemas provenientes do metodo de geracão de anomalias empregado e tambem na redução do tempo computacional da etapa de treino. Nesse contexto, e notavel que para tornar a PG em algoritmo de excelência para OCC o primeiro passo e avaliar sua abordagem convencional para o problema, algo que ainda no foi realizado, e objetivo central do presente trabalho, pois a introdução de novas ideias somente se justica ao se conhecer as limitações e os resultados obtidos pelo algoritmo convencional. Contudo, a aplicação de PG para OCC requer que o problema seja transformado em classicação binaria, cujas duas classes que compõem o conjunto de dados de treino são compostas por exemplos de perl normal e anormal. Porem, em diversos problemas de OCC e impraticavel obter exemplos anormais, por isto neste trabalho enfatiza-se a avaliacão de algoritmos para gerar exemplos anormais, algo que tambem ainda não foi realizado para PG. Entre os algoritmos de geração de anomalia estudados, selecionou-se o metodo pro- posto por Banhalmi et al. [6] que baseia-se em exemplos mais distantes da classe normal, o algoritmo baseado no conceito de hiperesfera proposto por Tax e Duin [38] e a tecnica RNS (Real-valued Negative Selection) inspirada em sistemas imunologicos proposta por Gonzales et al. [19] [20]. Um estudo comparativo entre eles foi realizado, para avaliar o desempenho de classicação obtido por um classicador induzido por PG convencio- nal sob uma abordagem de classicacão binaria. Vericou-se que o metodo proposto por Banhalmi et al. possibilitou a obtencão dos melhores resultados. O algoritmo de geracão de anomalias com melhor avaliacão foi empregado aos demais experimentos do presente trabalho, entre eles, um estudo comparativo entre a PG pro- posta no presente trabalho e as abordagens da literatura para OCC. Nesse experimento, vericou-se que a PG proposta neste trabalho obteve melhores resultados de classicacão em dois problemas OCC, em outros três obteve desempenho similar e em um deles foi in- ferior. Portanto, atesta-se a hipotese de que e possvel resolver OCC usando um algoritmo de PG convencional utilizando o algoritmo adequado para geracão de anomalias. O impacto de certos parâmetros da PG tambem foi avaliado. Entre eles o tamanho da populacão, que apresentou maior impacto no desempenho de classicacão em um problema OCC comparado a diferentes ajustes no tamanho da arvore e na taxa de mutacão. Alem disso, diferentes funcões de aptidão tambem foram experimentadas. Vericou-se que a funcão composta pela media das taxas individuais de acerto em cada classe apresentou melhor desempenho de classicacão OCC quando comparada ao uso da metrica AUC (Area Under the Receiver Operation Characteristic Curve). A taxa WMW (Wilcoxon- Mann-Whitney), considerada um estimador da AUC com custo computacional inferior, tambem foi aplicada como funcão de aptidão e apresentou resultado semelhante ao uso da AUC.
publishDate 2012
dc.date.accessioned.fl_str_mv 2012-01-18T08:00:01Z
dc.date.available.fl_str_mv 2012-01-18T08:00:01Z
dc.date.issued.fl_str_mv 2012-01-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1884/26537
url http://hdl.handle.net/1884/26537
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/26537/1/DissertacaoMetrado%20-%20RafaelCabral.pdf
https://acervodigital.ufpr.br/bitstream/1884/26537/2/DissertacaoMetrado%20-%20RafaelCabral.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/26537/3/DissertacaoMetrado%20-%20RafaelCabral.pdf.jpg
bitstream.checksum.fl_str_mv 96ba915b5ef9eae7ece9732a7afbe170
0fa1ffcc7cf2a7b85539257038659f88
ba601c9177be23043da9bd89e1cb6b32
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860915734249472