Classificadores de alta interpretabilidade e de alta precisão
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/ESBF-9GNGG3 |
Resumo: | Na construção de uma aplicação de aprendizado de máquina, um especialista define seu objetivo, determina, baseado em algumas hipóteses, os dados que possuem uma relação causal com o objetivo, seleciona o modelo que melhor se adequa a suas hipóteses e dados, realiza experimentos e analisa a qualidade da solução. Na fase de análise, uma propriedade fundamental do modelo é a interpretabilidade. Em alguns domínios de aplicação, como médica ou de negócios, a interpretabilidade é tida como diferencial. Para que um modelo seja interpretável é indicado que ele possua poucos atributos e siga o princípio da parcimônia no qual, dentre explicações equivalentes, as mais simples são preferíveis. Esse princípio tem se mostrado adequado para classificadores baseados em regras de associação, nos quais a quantidade de regras utilizadas podem ser substancialmente reduzidas utilizando-se representações condensadas, como os conjuntos máximos ou fechados. Porém, a quantidade restante de regras ainda é grande, sendo os modelos resultantes de difícil interpretabilidade. Neste trabalho, propomos uma estratégia de redução mais agressiva, que ao mesmo tempo mantem a acurácia do classificador. Essa estratégia consiste em avaliarcada regra sob um critério estatístico e filtrar as melhores. Cada regra representa um ponto num espaço no qual cada dimensão é representada por um critério estatístico. Pontos que não são dominados por nenhum outro compõem a fronteira de Pareto e correspondem às regras que são ótimas, dado que não existe regra que possa ser melhor do que elas nos critérios selecionados. Um conjunto sistemático de experimentos envolvendo dados de referência, assim como dados de aplicações atuais, seguido de um conjunto extensivo de testes de significância, revelam que a estratégia proposta foi capaz de reduzir em até duas ordens de grandeza (reduções de até 96%) a quantidade de regras utilizadas na classificação, produzindo classificadores mais interpretáveis, sem prejudicar a acurácia dos modelos. |
id |
UFMG_3705942eb99f72fcda5fa97711d1fd09 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/ESBF-9GNGG3 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Adriano Alonso VelosoNivio ZivianiBerthier Ribeiro de Araujo NetoRenato Antonio Celso FerreiraItamar Sakae Viana Hata2019-08-14T03:38:44Z2019-08-14T03:38:44Z2013-12-12http://hdl.handle.net/1843/ESBF-9GNGG3Na construção de uma aplicação de aprendizado de máquina, um especialista define seu objetivo, determina, baseado em algumas hipóteses, os dados que possuem uma relação causal com o objetivo, seleciona o modelo que melhor se adequa a suas hipóteses e dados, realiza experimentos e analisa a qualidade da solução. Na fase de análise, uma propriedade fundamental do modelo é a interpretabilidade. Em alguns domínios de aplicação, como médica ou de negócios, a interpretabilidade é tida como diferencial. Para que um modelo seja interpretável é indicado que ele possua poucos atributos e siga o princípio da parcimônia no qual, dentre explicações equivalentes, as mais simples são preferíveis. Esse princípio tem se mostrado adequado para classificadores baseados em regras de associação, nos quais a quantidade de regras utilizadas podem ser substancialmente reduzidas utilizando-se representações condensadas, como os conjuntos máximos ou fechados. Porém, a quantidade restante de regras ainda é grande, sendo os modelos resultantes de difícil interpretabilidade. Neste trabalho, propomos uma estratégia de redução mais agressiva, que ao mesmo tempo mantem a acurácia do classificador. Essa estratégia consiste em avaliarcada regra sob um critério estatístico e filtrar as melhores. Cada regra representa um ponto num espaço no qual cada dimensão é representada por um critério estatístico. Pontos que não são dominados por nenhum outro compõem a fronteira de Pareto e correspondem às regras que são ótimas, dado que não existe regra que possa ser melhor do que elas nos critérios selecionados. Um conjunto sistemático de experimentos envolvendo dados de referência, assim como dados de aplicações atuais, seguido de um conjunto extensivo de testes de significância, revelam que a estratégia proposta foi capaz de reduzir em até duas ordens de grandeza (reduções de até 96%) a quantidade de regras utilizadas na classificação, produzindo classificadores mais interpretáveis, sem prejudicar a acurácia dos modelos.Building a Machine Learning application, typically requires an expert who defines the objectives and data that have a causal relationship with these objectives, selects the best model that fits the assumptions and data, conducts some experiments and analyses the quality of the solution. In the analysis phase, a fundamental property of the model is its interpretability. In some application domains, such as medical or business, the interpretability is taken as a differential solution. To build an interpretable model, it is recommended the use of few features within the parsimony principle, which states that everything being equal, simpler explanations are preferable. Recently, this principle has shown to be well suited to associative classifiers, where the number of rules composing the classifier can be substantially reduced by using condensed representations such as maximal or closed rules. However, the remaining amount of rules is still large, and the resulting models are hard to interpret. In this work we propose a more aggressive filtering strategy, which decreases the number of rules within the classifier without hurting its accuracy. Our strategy consists in evaluating each rule under different statistical criteria, and filtering only those rules that show a positive balance between all the criteria considered. Specifically, each candidate rule is associated with a point in an n-dimensional scatter-gram, where each coordinate corresponds to a statistical criterion. Points that are not dominated by any other point in the scatter-gram compose the Pareto frontier, and correspond to rules that are optimal in the sense that there is no rule that is better off when all the criteria are taken into account. Finally, rules lying in the Pareto frontier are filtered and compose the classifier. A systematic set of experiments involving benchmark data as well as recent data from actual application scenarios, followed by an extensive set of significance tests, reveal that the proposed strategy decreases the number of rules by up to two orders of magnitude and produces classifiers that are more readable without hurting accuracy.Universidade Federal de Minas GeraisUFMGAprendizado do computadorComputaçãoParetoParcimôniaAprendizado de máquinaInterpretávelClassificadores de alta interpretabilidade e de alta precisãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALitamarsakae.pdfapplication/pdf956545https://repositorio.ufmg.br/bitstream/1843/ESBF-9GNGG3/1/itamarsakae.pdf41eed973c1984713aae0e6b69e245400MD51TEXTitamarsakae.pdf.txtitamarsakae.pdf.txtExtracted texttext/plain141714https://repositorio.ufmg.br/bitstream/1843/ESBF-9GNGG3/2/itamarsakae.pdf.txt2baf6a8df9d62e494a8a0f0f489ab758MD521843/ESBF-9GNGG32019-11-14 15:16:49.377oai:repositorio.ufmg.br:1843/ESBF-9GNGG3Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T18:16:49Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Classificadores de alta interpretabilidade e de alta precisão |
title |
Classificadores de alta interpretabilidade e de alta precisão |
spellingShingle |
Classificadores de alta interpretabilidade e de alta precisão Itamar Sakae Viana Hata Pareto Parcimônia Aprendizado de máquina Interpretável Aprendizado do computador Computação |
title_short |
Classificadores de alta interpretabilidade e de alta precisão |
title_full |
Classificadores de alta interpretabilidade e de alta precisão |
title_fullStr |
Classificadores de alta interpretabilidade e de alta precisão |
title_full_unstemmed |
Classificadores de alta interpretabilidade e de alta precisão |
title_sort |
Classificadores de alta interpretabilidade e de alta precisão |
author |
Itamar Sakae Viana Hata |
author_facet |
Itamar Sakae Viana Hata |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Adriano Alonso Veloso |
dc.contributor.advisor-co1.fl_str_mv |
Nivio Ziviani |
dc.contributor.referee1.fl_str_mv |
Berthier Ribeiro de Araujo Neto |
dc.contributor.referee2.fl_str_mv |
Renato Antonio Celso Ferreira |
dc.contributor.author.fl_str_mv |
Itamar Sakae Viana Hata |
contributor_str_mv |
Adriano Alonso Veloso Nivio Ziviani Berthier Ribeiro de Araujo Neto Renato Antonio Celso Ferreira |
dc.subject.por.fl_str_mv |
Pareto Parcimônia Aprendizado de máquina Interpretável |
topic |
Pareto Parcimônia Aprendizado de máquina Interpretável Aprendizado do computador Computação |
dc.subject.other.pt_BR.fl_str_mv |
Aprendizado do computador Computação |
description |
Na construção de uma aplicação de aprendizado de máquina, um especialista define seu objetivo, determina, baseado em algumas hipóteses, os dados que possuem uma relação causal com o objetivo, seleciona o modelo que melhor se adequa a suas hipóteses e dados, realiza experimentos e analisa a qualidade da solução. Na fase de análise, uma propriedade fundamental do modelo é a interpretabilidade. Em alguns domínios de aplicação, como médica ou de negócios, a interpretabilidade é tida como diferencial. Para que um modelo seja interpretável é indicado que ele possua poucos atributos e siga o princípio da parcimônia no qual, dentre explicações equivalentes, as mais simples são preferíveis. Esse princípio tem se mostrado adequado para classificadores baseados em regras de associação, nos quais a quantidade de regras utilizadas podem ser substancialmente reduzidas utilizando-se representações condensadas, como os conjuntos máximos ou fechados. Porém, a quantidade restante de regras ainda é grande, sendo os modelos resultantes de difícil interpretabilidade. Neste trabalho, propomos uma estratégia de redução mais agressiva, que ao mesmo tempo mantem a acurácia do classificador. Essa estratégia consiste em avaliarcada regra sob um critério estatístico e filtrar as melhores. Cada regra representa um ponto num espaço no qual cada dimensão é representada por um critério estatístico. Pontos que não são dominados por nenhum outro compõem a fronteira de Pareto e correspondem às regras que são ótimas, dado que não existe regra que possa ser melhor do que elas nos critérios selecionados. Um conjunto sistemático de experimentos envolvendo dados de referência, assim como dados de aplicações atuais, seguido de um conjunto extensivo de testes de significância, revelam que a estratégia proposta foi capaz de reduzir em até duas ordens de grandeza (reduções de até 96%) a quantidade de regras utilizadas na classificação, produzindo classificadores mais interpretáveis, sem prejudicar a acurácia dos modelos. |
publishDate |
2013 |
dc.date.issued.fl_str_mv |
2013-12-12 |
dc.date.accessioned.fl_str_mv |
2019-08-14T03:38:44Z |
dc.date.available.fl_str_mv |
2019-08-14T03:38:44Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/ESBF-9GNGG3 |
url |
http://hdl.handle.net/1843/ESBF-9GNGG3 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/ESBF-9GNGG3/1/itamarsakae.pdf https://repositorio.ufmg.br/bitstream/1843/ESBF-9GNGG3/2/itamarsakae.pdf.txt |
bitstream.checksum.fl_str_mv |
41eed973c1984713aae0e6b69e245400 2baf6a8df9d62e494a8a0f0f489ab758 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589567285035008 |