Boosted lazy associative classifier

Vaux Sandino Diniz Gomes

Boosted lazy associative classifier

Detalhes bibliográficos
Autor(a) principal:	Vaux Sandino Diniz Gomes
Data de Publicação:	2017
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFMG
Texto Completo:	http://hdl.handle.net/1843/SLSC-BBZNAY
Resumo:	Aprendizado de Máquina é uma subárea de Mineração de Dados que busca maneiras de conferir às máquinas a habilidade de aprender a partir de conjuntos de dados sem que estas sejam explicitamente programadas para tal tarefa. A máquina, então, deve ser capaz de extrair e generalizar informações de dados, e, posteriormente, usar estas informações para compreender dados nunca observados. Algoritmos de classificação associativa extraem padrões frequentes existentes em conjuntos pre-classificados de dados transformando-os em regras capazes de predizer a classe de instâncias dos dados. As regras são humanamente inteligíveis, o que as tornam atrativas em casos onde é necessário entender ou explicar como o algoritmo chegou à cada predição de classe. Frequentemente, algoritmos classificação associativa sofrem com problemas de processamento, dado o número padrões existentes nos dados. O Lazy Associative Classifier (LAC) supera essa adversidade decompondo o problema de procurar por todos os padrões em vários subproblemas menores. Contudo o LAC utiliza indiscriminadamente todas as regras que consegue formar. Isto pode levar à perda de acurácia e de interpretabilidade das classificações do algoritmo. Neste trabalho, revisamos o processo do LAC e propomos o BLACk: um algoritmo de classificação associativa que utiliza boosting para montar um modelo aditivo com os mesmos padrões encontrados pelo LAC e que melhora a acurácia e a legibilidade do classificador. Foi possível comprovar estatisticamente que o BLACk é mais preciso que o LAC e que o número de regras do BLACk é algumas ordens de grandeza menor que o número de regras do LAC, o que o torna mais humanamente inteligível que o LAC.

Metadados do item

id	UFMG_10948afd641d96f21e1dec2688c08b9f
oai_identifier_str	oai:repositorio.ufmg.br:1843/SLSC-BBZNAY
network_acronym_str	UFMG
network_name_str	Repositório Institucional da UFMG
repository_id_str
spelling	Loïc Pascal Gilles CerfAdriano Alonso VelosoWagner Meira JuniorVaux Sandino Diniz Gomes2019-08-10T21:40:03Z2019-08-10T21:40:03Z2017-11-14http://hdl.handle.net/1843/SLSC-BBZNAYAprendizado de Máquina é uma subárea de Mineração de Dados que busca maneiras de conferir às máquinas a habilidade de aprender a partir de conjuntos de dados sem que estas sejam explicitamente programadas para tal tarefa. A máquina, então, deve ser capaz de extrair e generalizar informações de dados, e, posteriormente, usar estas informações para compreender dados nunca observados. Algoritmos de classificação associativa extraem padrões frequentes existentes em conjuntos pre-classificados de dados transformando-os em regras capazes de predizer a classe de instâncias dos dados. As regras são humanamente inteligíveis, o que as tornam atrativas em casos onde é necessário entender ou explicar como o algoritmo chegou à cada predição de classe. Frequentemente, algoritmos classificação associativa sofrem com problemas de processamento, dado o número padrões existentes nos dados. O Lazy Associative Classifier (LAC) supera essa adversidade decompondo o problema de procurar por todos os padrões em vários subproblemas menores. Contudo o LAC utiliza indiscriminadamente todas as regras que consegue formar. Isto pode levar à perda de acurácia e de interpretabilidade das classificações do algoritmo. Neste trabalho, revisamos o processo do LAC e propomos o BLACk: um algoritmo de classificação associativa que utiliza boosting para montar um modelo aditivo com os mesmos padrões encontrados pelo LAC e que melhora a acurácia e a legibilidade do classificador. Foi possível comprovar estatisticamente que o BLACk é mais preciso que o LAC e que o número de regras do BLACk é algumas ordens de grandeza menor que o número de regras do LAC, o que o torna mais humanamente inteligível que o LAC.Lazy machine learning algorithms have to learn every time it is been given a new example, however knowing which example is being classified gives them the advantage of adjusting their knowledge search accordingly. The Lazy Associative Classifier (LAC) is a rule-based demand-driven lazy machine learning algorithm that takes advantage of the information present in the example being classified by focusing its effort on inducing only rules that cover that particular example. Each rule comes from a frequent pattern present in the data. While, associative classifiers, in general, suffer from searching frequent patterns among the large number of existing patterns within the data, LAC breaks that problem down into many subproblems, solving one small problem at a time. Rule-based algorithms are often caught in the dilemma of not knowing the best way to combine their rules in order to form the best possible classifier. Usually, the choosing of a rule metric followed by a simple voting is used (as simple as assigning an importance -- or weight -- of one to each rule and averaging the accounts by each class). This approach is easily proven to be frail. Furthermore, LAC uses all rules available, which can be considered a large quantity of rules, regardless of their prediction quality. In this work we use a boosting algorithm known as Confidence-Rated Adaboost in conjunction with LAC to form a new, more accurate and smaller (in number of rules present in each model) classifier algorithm called BLACk. We prove that our approach is superior in terms of accuracy to LAC and other associative classifier. Nevertheless, we show that the built classifiers model are less complex compared to those built by LAC.Universidade Federal de Minas GeraisUFMGLazy associative classifierMineração de dados ComputaçãoComputaçãoBoostingAprendizado do computadorClassificação AssociativaAprendizado de MáquinasAlgoritmo lazyBoostingBoosted lazy associative classifierinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALvauxsandinodinizgomes.pdfapplication/pdf1513600https://repositorio.ufmg.br/bitstream/1843/SLSC-BBZNAY/1/vauxsandinodinizgomes.pdf07ad136e81d86a266c0d476d608909dcMD51TEXTvauxsandinodinizgomes.pdf.txtvauxsandinodinizgomes.pdf.txtExtracted texttext/plain139050https://repositorio.ufmg.br/bitstream/1843/SLSC-BBZNAY/2/vauxsandinodinizgomes.pdf.txte23f5fe33d8aef05a5dcae00345a2330MD521843/SLSC-BBZNAY2019-11-14 07:48:45.908oai:repositorio.ufmg.br:1843/SLSC-BBZNAYRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T10:48:45Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv	Boosted lazy associative classifier
title	Boosted lazy associative classifier
spellingShingle	Boosted lazy associative classifier Vaux Sandino Diniz Gomes Classificação Associativa Aprendizado de Máquinas Algoritmo lazy Boosting Lazy associative classifier Mineração de dados Computação Computação Boosting Aprendizado do computador
title_short	Boosted lazy associative classifier
title_full	Boosted lazy associative classifier
title_fullStr	Boosted lazy associative classifier
title_full_unstemmed	Boosted lazy associative classifier
title_sort	Boosted lazy associative classifier
author	Vaux Sandino Diniz Gomes
author_facet	Vaux Sandino Diniz Gomes
author_role	author
dc.contributor.advisor1.fl_str_mv	Loïc Pascal Gilles Cerf
dc.contributor.referee1.fl_str_mv	Adriano Alonso Veloso
dc.contributor.referee2.fl_str_mv	Wagner Meira Junior
dc.contributor.author.fl_str_mv	Vaux Sandino Diniz Gomes
contributor_str_mv	Loïc Pascal Gilles Cerf Adriano Alonso Veloso Wagner Meira Junior
dc.subject.por.fl_str_mv	Classificação Associativa Aprendizado de Máquinas Algoritmo lazy Boosting
topic	Classificação Associativa Aprendizado de Máquinas Algoritmo lazy Boosting Lazy associative classifier Mineração de dados Computação Computação Boosting Aprendizado do computador
dc.subject.other.pt_BR.fl_str_mv	Lazy associative classifier Mineração de dados Computação Computação Boosting Aprendizado do computador
description	Aprendizado de Máquina é uma subárea de Mineração de Dados que busca maneiras de conferir às máquinas a habilidade de aprender a partir de conjuntos de dados sem que estas sejam explicitamente programadas para tal tarefa. A máquina, então, deve ser capaz de extrair e generalizar informações de dados, e, posteriormente, usar estas informações para compreender dados nunca observados. Algoritmos de classificação associativa extraem padrões frequentes existentes em conjuntos pre-classificados de dados transformando-os em regras capazes de predizer a classe de instâncias dos dados. As regras são humanamente inteligíveis, o que as tornam atrativas em casos onde é necessário entender ou explicar como o algoritmo chegou à cada predição de classe. Frequentemente, algoritmos classificação associativa sofrem com problemas de processamento, dado o número padrões existentes nos dados. O Lazy Associative Classifier (LAC) supera essa adversidade decompondo o problema de procurar por todos os padrões em vários subproblemas menores. Contudo o LAC utiliza indiscriminadamente todas as regras que consegue formar. Isto pode levar à perda de acurácia e de interpretabilidade das classificações do algoritmo. Neste trabalho, revisamos o processo do LAC e propomos o BLACk: um algoritmo de classificação associativa que utiliza boosting para montar um modelo aditivo com os mesmos padrões encontrados pelo LAC e que melhora a acurácia e a legibilidade do classificador. Foi possível comprovar estatisticamente que o BLACk é mais preciso que o LAC e que o número de regras do BLACk é algumas ordens de grandeza menor que o número de regras do LAC, o que o torna mais humanamente inteligível que o LAC.
publishDate	2017
dc.date.issued.fl_str_mv	2017-11-14
dc.date.accessioned.fl_str_mv	2019-08-10T21:40:03Z
dc.date.available.fl_str_mv	2019-08-10T21:40:03Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/1843/SLSC-BBZNAY
url	http://hdl.handle.net/1843/SLSC-BBZNAY
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv	UFMG
publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
instname_str	Universidade Federal de Minas Gerais (UFMG)
instacron_str	UFMG
institution	UFMG
reponame_str	Repositório Institucional da UFMG
collection	Repositório Institucional da UFMG
bitstream.url.fl_str_mv	https://repositorio.ufmg.br/bitstream/1843/SLSC-BBZNAY/1/vauxsandinodinizgomes.pdf https://repositorio.ufmg.br/bitstream/1843/SLSC-BBZNAY/2/vauxsandinodinizgomes.pdf.txt
bitstream.checksum.fl_str_mv	07ad136e81d86a266c0d476d608909dc e23f5fe33d8aef05a5dcae00345a2330
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_	1803589210618200064

Boosted lazy associative classifier

Registros relacionados