Explorando abordagens inovadoras para geração de classificadores
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPR |
Texto Completo: | https://hdl.handle.net/1884/19458 |
Resumo: | Inclui apendices |
id |
UFPR_da152387cebc5cdb80ad07a47aa28276 |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/19458 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
308 |
spelling |
Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em EngenhariaRamirez Pozo, Aurora Trinidad, 1959-Ishida, Celso Yoshikazu2024-05-17T17:44:48Z2024-05-17T17:44:48Z2008https://hdl.handle.net/1884/19458Inclui apendicesOrientadora: Aurora T. R. PozoTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas e Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa: Curitiba, 20/11/2008Inclui bibliografiaÁrea de concentração: Programação matemáticaResumo: Desde os anos 80, a área de aprendizado de máquina tem contribuído para a descoberta deconhecimento e, dentre as suas atribuições, mais especificamente, a tarefa de classificação tem sido utilizada para a formulação de modelos de auxílio para previsões. Neste sentido, o propósito desta tese é melhorar a indução de classificadores por meio da combinação de conjuntos não-ordenados de modelos com a utilização de critérios biobjetivos. Para atingir tal objetivo foram utilizadas duas abordagens. A primeira abordagem buscou verificar a hipótese de que a combinação das técnicas de boosting e estratégia evolucionária podem atingir o equilíbrioentre precisão e generalidade. Para validação da hipótese, foi proposta uma nova linguagem de representação, juntamente com novas medidas de avaliação. Experimentos foram realizados comparando a proposta com um algoritmo clássico e, embora apenas um caso tenha demonstrado um desempenho melhor, acredita-se que a linguagem de representação criada pode ser útil com outras estratégias, sendo apontados alguns caminhos a explorar para seu aperfeiçoamento. A segunda abordagem investigou a hipótese de que a criação de um conjunto de regras não-ordenadas segundo critérios biobjetivos pode maximizar a AUC (Área abaixo da curva ROC (Receiver Operating Characteristic)). Procurou-se identificar as medidas desejáveis para a criação de conjuntos que fossem os mais próximos da Fronteira de Pareto. Para tal, foi criado o algoritmo Pareto Front Elite (PFE) que, deterministicamente, gera as regras e faz aseleção de acordo com os critérios de sensitividade e especificidade. Os resultados dos experimentos demonstraram que é possível utilizar os critérios biobjetivos para a maximização da AUC. Outras investigações foram feitas com a mesma finalidade do algoritmo PFE, porém, com o objetivo maior de trabalhar com grandes bases de dados; os resultados foram dois algoritmos baseados em metaheurísticas para a criação num único passo do conjunto de regras não-ordenadas. O primeiro algoritmo, MOPSO, utilizou a nuvem de partículas com conceitosmultiobjetivos; alguns experimentos foram realizados e os resultados de AUC foram semelhantes ou melhores do que a maioria dos trabalhos relacionados. A combinação entre GRASP epath-relinking resultou na construção do segundo algoritmo: GRASP-PR Rule Learning. Experimentos com o algoritmo foram realizados e os valores de AUC foram comparados, mostrando-se compatíveis com o algoritmo determinístico, além de serem melhores do que a maioria dos trabalhos relacionados. Outros experimentos foram conduzidos para a comparação dos conjuntos de aproximação utilizando como base o algoritmo com o melhor desempenho em termos de AUC; avaliações qualitativas e quantitativas multiobjetivas confirmaram que os conjuntos de aproximações da proposta são semelhantes às Fronteiras de Pareto.Abstract: Since the 80’s, the Machine Learning domain has been useful to knowledge discovery. Morespecifically, the classification task has been used to construct models for prevision. The goalof this thesis is to improve the induction of classifiers through the combination of non-orderedmodels using bi-objectives criteria. Two approaches were constructed for this proposes. Thefirst one verified the hypothesis that boosting technique can be combined to evolutionary strategies to reach the balance of precision and generality. To validate this hypothesis, a new representation language and new evaluation measures were proposed. Experiments were done tocompare the created algorithm with a classical one. Although, only one case demonstrated better performance, we believe the representation language can be useful with others strategies, forthat, some options must be tested and some improvement were indicated. The second approachinvestigated the hypothesis that the creation of a non-ordered set of rules following bi-objectivescriteria can maximize the AUC (Area Under the Receiver Operating Characteristic Curve). Itwas investigated the desirable measures for the creation of set of rules as close as possible to thePareto Front. For that, Pareto Front Elite (PFE) algorithm was created to generate the rules witha deterministic mechanism which makes the rule selection using the sensitivity and specificitycriteria. The experiment results show that it is possible to use bi-objective criteria to maximizethe AUC. Other investigations were done with the same goal as PFE algorithm, however, themain goal was to deal with great data sets; the results were two meta-heuristic algorithms thatcreate set of non-ordered rules in a single step. The first algorithm, MOPSO, used the particle swarm with multi objective criteria concepts. Some experiments with MOPSO were doneand its AUC results were similar or better than the most part of the related works. The secondalgorithm was a result of GRASP combined with path-relinking. Experiments were done toevaluate AUC values and the results were close to the deterministic algorithm results, and, itwas better than the most part of the related work. After choosing the algorithm with the bestAUC performance to be the basis algorithm, other experiments where done to compare the approximation sets. Quality and Quantitative multiobjective measures confirm that most part ofthe approximation sets of this approach are similar to the Pareto Fronts.xxvii, 154f. : il., grafs., tabs.application/pdfDisponível em formato digitalAlgorítmosFunção discriminante linearAnálise numéricaExplorando abordagens inovadoras para geração de classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALishida2007tese.pdfapplication/pdf849263https://acervodigital.ufpr.br/bitstream/1884/19458/1/ishida2007tese.pdf3bf3c76c8043652f3192c490f3716d29MD51open accessTEXTishida2007tese.pdf.txtExtracted Texttext/plain411615https://acervodigital.ufpr.br/bitstream/1884/19458/2/ishida2007tese.pdf.txt6591dadfc59dc5fba0f5dd69600b74aeMD52open accessTHUMBNAILishida2007tese.pdf.jpgGenerated Thumbnailimage/jpeg1117https://acervodigital.ufpr.br/bitstream/1884/19458/3/ishida2007tese.pdf.jpgecb0070604a3e9b872a3eaa3c9f7b188MD53open access1884/194582024-05-17 14:44:48.916open accessoai:acervodigital.ufpr.br:1884/19458Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082024-05-17T17:44:48Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.pt_BR.fl_str_mv |
Explorando abordagens inovadoras para geração de classificadores |
title |
Explorando abordagens inovadoras para geração de classificadores |
spellingShingle |
Explorando abordagens inovadoras para geração de classificadores Ishida, Celso Yoshikazu Algorítmos Função discriminante linear Análise numérica |
title_short |
Explorando abordagens inovadoras para geração de classificadores |
title_full |
Explorando abordagens inovadoras para geração de classificadores |
title_fullStr |
Explorando abordagens inovadoras para geração de classificadores |
title_full_unstemmed |
Explorando abordagens inovadoras para geração de classificadores |
title_sort |
Explorando abordagens inovadoras para geração de classificadores |
author |
Ishida, Celso Yoshikazu |
author_facet |
Ishida, Celso Yoshikazu |
author_role |
author |
dc.contributor.other.pt_BR.fl_str_mv |
Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenharia |
dc.contributor.advisor1.fl_str_mv |
Ramirez Pozo, Aurora Trinidad, 1959- |
dc.contributor.author.fl_str_mv |
Ishida, Celso Yoshikazu |
contributor_str_mv |
Ramirez Pozo, Aurora Trinidad, 1959- |
dc.subject.por.fl_str_mv |
Algorítmos Função discriminante linear Análise numérica |
topic |
Algorítmos Função discriminante linear Análise numérica |
description |
Inclui apendices |
publishDate |
2008 |
dc.date.issued.fl_str_mv |
2008 |
dc.date.accessioned.fl_str_mv |
2024-05-17T17:44:48Z |
dc.date.available.fl_str_mv |
2024-05-17T17:44:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/19458 |
url |
https://hdl.handle.net/1884/19458 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.pt_BR.fl_str_mv |
Disponível em formato digital |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
xxvii, 154f. : il., grafs., tabs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/19458/1/ishida2007tese.pdf https://acervodigital.ufpr.br/bitstream/1884/19458/2/ishida2007tese.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/19458/3/ishida2007tese.pdf.jpg |
bitstream.checksum.fl_str_mv |
3bf3c76c8043652f3192c490f3716d29 6591dadfc59dc5fba0f5dd69600b74ae ecb0070604a3e9b872a3eaa3c9f7b188 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1801860193854685184 |