Boosted lazy associative classifier

Detalhes bibliográficos
Autor(a) principal: Vaux Sandino Diniz Gomes
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/SLSC-BBZNAY
Resumo: Aprendizado de Máquina é uma subárea de Mineração de Dados que busca maneiras de conferir às máquinas a habilidade de aprender a partir de conjuntos de dados sem que estas sejam explicitamente programadas para tal tarefa. A máquina, então, deve ser capaz de extrair e generalizar informações de dados, e, posteriormente, usar estas informações para compreender dados nunca observados. Algoritmos de classificação associativa extraem padrões frequentes existentes em conjuntos pre-classificados de dados transformando-os em regras capazes de predizer a classe de instâncias dos dados. As regras são humanamente inteligíveis, o que as tornam atrativas em casos onde é necessário entender ou explicar como o algoritmo chegou à cada predição de classe. Frequentemente, algoritmos classificação associativa sofrem com problemas de processamento, dado o número padrões existentes nos dados. O Lazy Associative Classifier (LAC) supera essa adversidade decompondo o problema de procurar por todos os padrões em vários subproblemas menores. Contudo o LAC utiliza indiscriminadamente todas as regras que consegue formar. Isto pode levar à perda de acurácia e de interpretabilidade das classificações do algoritmo. Neste trabalho, revisamos o processo do LAC e propomos o BLACk: um algoritmo de classificação associativa que utiliza boosting para montar um modelo aditivo com os mesmos padrões encontrados pelo LAC e que melhora a acurácia e a legibilidade do classificador. Foi possível comprovar estatisticamente que o BLACk é mais preciso que o LAC e que o número de regras do BLACk é algumas ordens de grandeza menor que o número de regras do LAC, o que o torna mais humanamente inteligível que o LAC.
id UFMG_10948afd641d96f21e1dec2688c08b9f
oai_identifier_str oai:repositorio.ufmg.br:1843/SLSC-BBZNAY
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Loïc Pascal Gilles CerfAdriano Alonso VelosoWagner Meira JuniorVaux Sandino Diniz Gomes2019-08-10T21:40:03Z2019-08-10T21:40:03Z2017-11-14http://hdl.handle.net/1843/SLSC-BBZNAYAprendizado de Máquina é uma subárea de Mineração de Dados que busca maneiras de conferir às máquinas a habilidade de aprender a partir de conjuntos de dados sem que estas sejam explicitamente programadas para tal tarefa. A máquina, então, deve ser capaz de extrair e generalizar informações de dados, e, posteriormente, usar estas informações para compreender dados nunca observados. Algoritmos de classificação associativa extraem padrões frequentes existentes em conjuntos pre-classificados de dados transformando-os em regras capazes de predizer a classe de instâncias dos dados. As regras são humanamente inteligíveis, o que as tornam atrativas em casos onde é necessário entender ou explicar como o algoritmo chegou à cada predição de classe. Frequentemente, algoritmos classificação associativa sofrem com problemas de processamento, dado o número padrões existentes nos dados. O Lazy Associative Classifier (LAC) supera essa adversidade decompondo o problema de procurar por todos os padrões em vários subproblemas menores. Contudo o LAC utiliza indiscriminadamente todas as regras que consegue formar. Isto pode levar à perda de acurácia e de interpretabilidade das classificações do algoritmo. Neste trabalho, revisamos o processo do LAC e propomos o BLACk: um algoritmo de classificação associativa que utiliza boosting para montar um modelo aditivo com os mesmos padrões encontrados pelo LAC e que melhora a acurácia e a legibilidade do classificador. Foi possível comprovar estatisticamente que o BLACk é mais preciso que o LAC e que o número de regras do BLACk é algumas ordens de grandeza menor que o número de regras do LAC, o que o torna mais humanamente inteligível que o LAC.Lazy machine learning algorithms have to learn every time it is been given a new example, however knowing which example is being classified gives them the advantage of adjusting their knowledge search accordingly. The Lazy Associative Classifier (LAC) is a rule-based demand-driven lazy machine learning algorithm that takes advantage of the information present in the example being classified by focusing its effort on inducing only rules that cover that particular example. Each rule comes from a frequent pattern present in the data. While, associative classifiers, in general, suffer from searching frequent patterns among the large number of existing patterns within the data, LAC breaks that problem down into many subproblems, solving one small problem at a time. Rule-based algorithms are often caught in the dilemma of not knowing the best way to combine their rules in order to form the best possible classifier. Usually, the choosing of a rule metric followed by a simple voting is used (as simple as assigning an importance -- or weight -- of one to each rule and averaging the accounts by each class). This approach is easily proven to be frail. Furthermore, LAC uses all rules available, which can be considered a large quantity of rules, regardless of their prediction quality. In this work we use a boosting algorithm known as Confidence-Rated Adaboost in conjunction with LAC to form a new, more accurate and smaller (in number of rules present in each model) classifier algorithm called BLACk. We prove that our approach is superior in terms of accuracy to LAC and other associative classifier. Nevertheless, we show that the built classifiers model are less complex compared to those built by LAC.Universidade Federal de Minas GeraisUFMGLazy associative classifierMineração de dados ComputaçãoComputaçãoBoostingAprendizado do computadorClassificação AssociativaAprendizado de MáquinasAlgoritmo lazyBoostingBoosted lazy associative classifierinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALvauxsandinodinizgomes.pdfapplication/pdf1513600https://repositorio.ufmg.br/bitstream/1843/SLSC-BBZNAY/1/vauxsandinodinizgomes.pdf07ad136e81d86a266c0d476d608909dcMD51TEXTvauxsandinodinizgomes.pdf.txtvauxsandinodinizgomes.pdf.txtExtracted texttext/plain139050https://repositorio.ufmg.br/bitstream/1843/SLSC-BBZNAY/2/vauxsandinodinizgomes.pdf.txte23f5fe33d8aef05a5dcae00345a2330MD521843/SLSC-BBZNAY2019-11-14 07:48:45.908oai:repositorio.ufmg.br:1843/SLSC-BBZNAYRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T10:48:45Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Boosted lazy associative classifier
title Boosted lazy associative classifier
spellingShingle Boosted lazy associative classifier
Vaux Sandino Diniz Gomes
Classificação Associativa
Aprendizado de Máquinas
Algoritmo lazy
Boosting
Lazy associative classifier
Mineração de dados Computação
Computação
Boosting
Aprendizado do computador
title_short Boosted lazy associative classifier
title_full Boosted lazy associative classifier
title_fullStr Boosted lazy associative classifier
title_full_unstemmed Boosted lazy associative classifier
title_sort Boosted lazy associative classifier
author Vaux Sandino Diniz Gomes
author_facet Vaux Sandino Diniz Gomes
author_role author
dc.contributor.advisor1.fl_str_mv Loïc Pascal Gilles Cerf
dc.contributor.referee1.fl_str_mv Adriano Alonso Veloso
dc.contributor.referee2.fl_str_mv Wagner Meira Junior
dc.contributor.author.fl_str_mv Vaux Sandino Diniz Gomes
contributor_str_mv Loïc Pascal Gilles Cerf
Adriano Alonso Veloso
Wagner Meira Junior
dc.subject.por.fl_str_mv Classificação Associativa
Aprendizado de Máquinas
Algoritmo lazy
Boosting
topic Classificação Associativa
Aprendizado de Máquinas
Algoritmo lazy
Boosting
Lazy associative classifier
Mineração de dados Computação
Computação
Boosting
Aprendizado do computador
dc.subject.other.pt_BR.fl_str_mv Lazy associative classifier
Mineração de dados Computação
Computação
Boosting
Aprendizado do computador
description Aprendizado de Máquina é uma subárea de Mineração de Dados que busca maneiras de conferir às máquinas a habilidade de aprender a partir de conjuntos de dados sem que estas sejam explicitamente programadas para tal tarefa. A máquina, então, deve ser capaz de extrair e generalizar informações de dados, e, posteriormente, usar estas informações para compreender dados nunca observados. Algoritmos de classificação associativa extraem padrões frequentes existentes em conjuntos pre-classificados de dados transformando-os em regras capazes de predizer a classe de instâncias dos dados. As regras são humanamente inteligíveis, o que as tornam atrativas em casos onde é necessário entender ou explicar como o algoritmo chegou à cada predição de classe. Frequentemente, algoritmos classificação associativa sofrem com problemas de processamento, dado o número padrões existentes nos dados. O Lazy Associative Classifier (LAC) supera essa adversidade decompondo o problema de procurar por todos os padrões em vários subproblemas menores. Contudo o LAC utiliza indiscriminadamente todas as regras que consegue formar. Isto pode levar à perda de acurácia e de interpretabilidade das classificações do algoritmo. Neste trabalho, revisamos o processo do LAC e propomos o BLACk: um algoritmo de classificação associativa que utiliza boosting para montar um modelo aditivo com os mesmos padrões encontrados pelo LAC e que melhora a acurácia e a legibilidade do classificador. Foi possível comprovar estatisticamente que o BLACk é mais preciso que o LAC e que o número de regras do BLACk é algumas ordens de grandeza menor que o número de regras do LAC, o que o torna mais humanamente inteligível que o LAC.
publishDate 2017
dc.date.issued.fl_str_mv 2017-11-14
dc.date.accessioned.fl_str_mv 2019-08-10T21:40:03Z
dc.date.available.fl_str_mv 2019-08-10T21:40:03Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/SLSC-BBZNAY
url http://hdl.handle.net/1843/SLSC-BBZNAY
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/SLSC-BBZNAY/1/vauxsandinodinizgomes.pdf
https://repositorio.ufmg.br/bitstream/1843/SLSC-BBZNAY/2/vauxsandinodinizgomes.pdf.txt
bitstream.checksum.fl_str_mv 07ad136e81d86a266c0d476d608909dc
e23f5fe33d8aef05a5dcae00345a2330
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589210618200064