Explorando abordagens inovadoras para geração de classificadores

Detalhes bibliográficos
Autor(a) principal: Ishida, Celso Yoshikazu
Data de Publicação: 2008
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/19458
Resumo: Inclui apendices
id UFPR_da152387cebc5cdb80ad07a47aa28276
oai_identifier_str oai:acervodigital.ufpr.br:1884/19458
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em EngenhariaRamirez Pozo, Aurora Trinidad, 1959-Ishida, Celso Yoshikazu2024-05-17T17:44:48Z2024-05-17T17:44:48Z2008https://hdl.handle.net/1884/19458Inclui apendicesOrientadora: Aurora T. R. PozoTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas e Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa: Curitiba, 20/11/2008Inclui bibliografiaÁrea de concentração: Programação matemáticaResumo:  Desde os anos 80, a área de aprendizado de máquina tem contribuído para a descoberta deconhecimento e, dentre as suas atribuições, mais especificamente, a tarefa de classificação tem sido utilizada para a formulação de modelos de auxílio para previsões. Neste sentido, o propósito desta tese é melhorar a indução de classificadores por meio da combinação de conjuntos não-ordenados de modelos com a utilização de critérios biobjetivos. Para atingir tal objetivo foram utilizadas duas abordagens. A primeira abordagem buscou verificar a hipótese de que a combinação das técnicas de boosting e estratégia evolucionária podem atingir o equilíbrioentre precisão e generalidade. Para validação da hipótese, foi proposta uma nova linguagem de representação, juntamente com novas medidas de avaliação. Experimentos foram realizados comparando a proposta com um algoritmo clássico e, embora apenas um caso tenha demonstrado um desempenho melhor, acredita-se que a linguagem de representação criada pode ser útil com outras estratégias, sendo apontados alguns caminhos a explorar para seu aperfeiçoamento. A segunda abordagem investigou a hipótese de que a criação de um conjunto de regras não-ordenadas segundo critérios biobjetivos pode maximizar a AUC (Área abaixo da curva ROC (Receiver Operating Characteristic)). Procurou-se identificar as medidas desejáveis para a criação de conjuntos que fossem os mais próximos da Fronteira de Pareto. Para tal, foi criado o algoritmo Pareto Front Elite (PFE) que, deterministicamente, gera as regras e faz aseleção de acordo com os critérios de sensitividade e especificidade. Os resultados dos experimentos demonstraram que é possível utilizar os critérios biobjetivos para a maximização da AUC. Outras investigações foram feitas com a mesma finalidade do algoritmo PFE, porém, com o objetivo maior de trabalhar com grandes bases de dados; os resultados foram dois algoritmos baseados em metaheurísticas para a criação num único passo do conjunto de regras não-ordenadas. O primeiro algoritmo, MOPSO, utilizou a nuvem de partículas com conceitosmultiobjetivos; alguns experimentos foram realizados e os resultados de AUC foram semelhantes ou melhores do que a maioria dos trabalhos relacionados. A combinação entre GRASP epath-relinking resultou na construção do segundo algoritmo: GRASP-PR Rule Learning. Experimentos com o algoritmo foram realizados e os valores de AUC foram comparados, mostrando-se compatíveis com o algoritmo determinístico, além de serem melhores do que a maioria dos trabalhos relacionados. Outros experimentos foram conduzidos para a comparação dos conjuntos de aproximação utilizando como base o algoritmo com o melhor desempenho em termos de AUC; avaliações qualitativas e quantitativas multiobjetivas confirmaram que os conjuntos de aproximações da proposta são semelhantes às Fronteiras de Pareto.Abstract: Since the 80’s, the Machine Learning domain has been useful to knowledge discovery. Morespecifically, the classification task has been used to construct models for prevision. The goalof this thesis is to improve the induction of classifiers through the combination of non-orderedmodels using bi-objectives criteria. Two approaches were constructed for this proposes. Thefirst one verified the hypothesis that boosting technique can be combined to evolutionary strategies to reach the balance of precision and generality. To validate this hypothesis, a new representation language and new evaluation measures were proposed. Experiments were done tocompare the created algorithm with a classical one. Although, only one case demonstrated better performance, we believe the representation language can be useful with others strategies, forthat, some options must be tested and some improvement were indicated. The second approachinvestigated the hypothesis that the creation of a non-ordered set of rules following bi-objectivescriteria can maximize the AUC (Area Under the Receiver Operating Characteristic Curve). Itwas investigated the desirable measures for the creation of set of rules as close as possible to thePareto Front. For that, Pareto Front Elite (PFE) algorithm was created to generate the rules witha deterministic mechanism which makes the rule selection using the sensitivity and specificitycriteria. The experiment results show that it is possible to use bi-objective criteria to maximizethe AUC. Other investigations were done with the same goal as PFE algorithm, however, themain goal was to deal with great data sets; the results were two meta-heuristic algorithms thatcreate set of non-ordered rules in a single step. The first algorithm, MOPSO, used the particle swarm with multi objective criteria concepts. Some experiments with MOPSO were doneand its AUC results were similar or better than the most part of the related works. The secondalgorithm was a result of GRASP combined with path-relinking. Experiments were done toevaluate AUC values and the results were close to the deterministic algorithm results, and, itwas better than the most part of the related work. After choosing the algorithm with the bestAUC performance to be the basis algorithm, other experiments where done to compare the approximation sets. Quality and Quantitative multiobjective measures confirm that most part ofthe approximation sets of this approach are similar to the Pareto Fronts.xxvii, 154f. : il., grafs., tabs.application/pdfDisponível em formato digitalAlgorítmosFunção discriminante linearAnálise numéricaExplorando abordagens inovadoras para geração de classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALishida2007tese.pdfapplication/pdf849263https://acervodigital.ufpr.br/bitstream/1884/19458/1/ishida2007tese.pdf3bf3c76c8043652f3192c490f3716d29MD51open accessTEXTishida2007tese.pdf.txtExtracted Texttext/plain411615https://acervodigital.ufpr.br/bitstream/1884/19458/2/ishida2007tese.pdf.txt6591dadfc59dc5fba0f5dd69600b74aeMD52open accessTHUMBNAILishida2007tese.pdf.jpgGenerated Thumbnailimage/jpeg1117https://acervodigital.ufpr.br/bitstream/1884/19458/3/ishida2007tese.pdf.jpgecb0070604a3e9b872a3eaa3c9f7b188MD53open access1884/194582024-05-17 14:44:48.916open accessoai:acervodigital.ufpr.br:1884/19458Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082024-05-17T17:44:48Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Explorando abordagens inovadoras para geração de classificadores
title Explorando abordagens inovadoras para geração de classificadores
spellingShingle Explorando abordagens inovadoras para geração de classificadores
Ishida, Celso Yoshikazu
Algorítmos
Função discriminante linear
Análise numérica
title_short Explorando abordagens inovadoras para geração de classificadores
title_full Explorando abordagens inovadoras para geração de classificadores
title_fullStr Explorando abordagens inovadoras para geração de classificadores
title_full_unstemmed Explorando abordagens inovadoras para geração de classificadores
title_sort Explorando abordagens inovadoras para geração de classificadores
author Ishida, Celso Yoshikazu
author_facet Ishida, Celso Yoshikazu
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenharia
dc.contributor.advisor1.fl_str_mv Ramirez Pozo, Aurora Trinidad, 1959-
dc.contributor.author.fl_str_mv Ishida, Celso Yoshikazu
contributor_str_mv Ramirez Pozo, Aurora Trinidad, 1959-
dc.subject.por.fl_str_mv Algorítmos
Função discriminante linear
Análise numérica
topic Algorítmos
Função discriminante linear
Análise numérica
description Inclui apendices
publishDate 2008
dc.date.issued.fl_str_mv 2008
dc.date.accessioned.fl_str_mv 2024-05-17T17:44:48Z
dc.date.available.fl_str_mv 2024-05-17T17:44:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/19458
url https://hdl.handle.net/1884/19458
dc.language.iso.fl_str_mv por
language por
dc.relation.pt_BR.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv xxvii, 154f. : il., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/19458/1/ishida2007tese.pdf
https://acervodigital.ufpr.br/bitstream/1884/19458/2/ishida2007tese.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/19458/3/ishida2007tese.pdf.jpg
bitstream.checksum.fl_str_mv 3bf3c76c8043652f3192c490f3716d29
6591dadfc59dc5fba0f5dd69600b74ae
ecb0070604a3e9b872a3eaa3c9f7b188
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860193854685184