Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/ |
Resumo: | O uso de aprendizado de máquina em domínios diversos é cada vez mais comum. No entanto, muitas aplicações críticas não podem usufruir desta tecnologia sem que as decisões de um classificador sejam interpretáveis. O problema é que a maioria dos modelos se comporta como uma caixa-preta cujas decisões não são facilmente interpretáveis, o que limita sua efetividade apesar do bom desempenho. Diversos trabalhos na literatura buscam resolver este problema propondo técnicas de decisão que explicam o comportamento de modelos caixa-preta quando estes são aplicados a um determinado exemplo. Uma delas é a técnica Local Rule Based Explanations (LORE) que gera explicações locais, utilizando uma Árvore de Decisão treinada a partir de dados artificiais gerados por um algoritmo genético (AG). O método LORE utiliza um algoritmo genético padrão, que não preserva necessariamente a diversidade das soluções na população final. A hipótese investigada neste trabalho é que a diversidade é importante para gerar árvores de decisão que consigam reproduzir com maior precisão as fronteiras de decisão do classificador localizadas perto do exemplo a ser explicado. Este trabalho mostra que os exemplos artificiais gerados pelos AGs em LORE não são necessariamente diversos. É proposto então o uso da técnica de fitness sharing no AG para gerar exemplos artificiais mais diversos. Consequentemente, as fronteiras de decisão locais da Árvore de Decisão devem ser mais semelhantes aos do classificador caixa-preta. Resultados experimentais com dois classificadores (Perceptron Multicamadas e Florestas Aleatórias) e quatro problemas de classificação indicam que LORE com fitness sharing produz populações de AG mais diversas e melhores explicações locais. |
id |
USP_667b7b9ef246aa15e5119351eb15d52c |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-17112023-112559 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populaçõesA model for explaining local classifier decisions based on genetic algorithms with preservation of population diversityAlgoritmos genéticosBlack boxCaixa-pretaExplainable artificial intelligenceExplanationExplicaçãoFitness sharingFitness sharingGenetic algorithmsInteligência artificial explicávelO uso de aprendizado de máquina em domínios diversos é cada vez mais comum. No entanto, muitas aplicações críticas não podem usufruir desta tecnologia sem que as decisões de um classificador sejam interpretáveis. O problema é que a maioria dos modelos se comporta como uma caixa-preta cujas decisões não são facilmente interpretáveis, o que limita sua efetividade apesar do bom desempenho. Diversos trabalhos na literatura buscam resolver este problema propondo técnicas de decisão que explicam o comportamento de modelos caixa-preta quando estes são aplicados a um determinado exemplo. Uma delas é a técnica Local Rule Based Explanations (LORE) que gera explicações locais, utilizando uma Árvore de Decisão treinada a partir de dados artificiais gerados por um algoritmo genético (AG). O método LORE utiliza um algoritmo genético padrão, que não preserva necessariamente a diversidade das soluções na população final. A hipótese investigada neste trabalho é que a diversidade é importante para gerar árvores de decisão que consigam reproduzir com maior precisão as fronteiras de decisão do classificador localizadas perto do exemplo a ser explicado. Este trabalho mostra que os exemplos artificiais gerados pelos AGs em LORE não são necessariamente diversos. É proposto então o uso da técnica de fitness sharing no AG para gerar exemplos artificiais mais diversos. Consequentemente, as fronteiras de decisão locais da Árvore de Decisão devem ser mais semelhantes aos do classificador caixa-preta. Resultados experimentais com dois classificadores (Perceptron Multicamadas e Florestas Aleatórias) e quatro problemas de classificação indicam que LORE com fitness sharing produz populações de AG mais diversas e melhores explicações locais.The use of machine learning in diverse domains is increasingly common. However, many critical applications cannot take advantage of this technology without the decisions of a classifier being interpretable. The problem is that most models behave like a black box whose decisions are not easily interpretable, which limits its effectiveness despite good performance. Several works in the literature seek to solve this problem by proposing decision techniques that explain the behavior of black box models when they are applied to a given example. One of them is the Local Rule Based Explanations (LORE), a technique that generates local explanations using a Decision Tree trained on artificial data generated by a genetic algorithm. The LORE method uses a standard genetic algorithm, which does not necessarily preserve the diversity of solutions in the final population. The hypothesis investigated in this work is that diversity is important to generate decision trees that can more accurately reproduce the classifier\'s decision boundaries located close to the example to be explained. This work shows that the artificial examples generated by the GA in LORE are not necessarily diverse. The Fitness Sharing technique is then used to generate more diverse artificial GA examples. Consequently, the local decision boundaries of the Decision Tree should be more similar to those of the black-box classifier. Experimental results with two classifiers (Multilayer Perceptron and Random Forests) and four classification problems indicate that LORE with fitness sharing produces more diverse GA populations and better local explanations.Biblioteca Digitais de Teses e Dissertações da USPTinós, RenatoSantos, Daniel Augusto dos2022-12-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-12-20T18:08:02Zoai:teses.usp.br:tde-17112023-112559Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-20T18:08:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações A model for explaining local classifier decisions based on genetic algorithms with preservation of population diversity |
title |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações |
spellingShingle |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações Santos, Daniel Augusto dos Algoritmos genéticos Black box Caixa-preta Explainable artificial intelligence Explanation Explicação Fitness sharing Fitness sharing Genetic algorithms Inteligência artificial explicável |
title_short |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações |
title_full |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações |
title_fullStr |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações |
title_full_unstemmed |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações |
title_sort |
Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações |
author |
Santos, Daniel Augusto dos |
author_facet |
Santos, Daniel Augusto dos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Tinós, Renato |
dc.contributor.author.fl_str_mv |
Santos, Daniel Augusto dos |
dc.subject.por.fl_str_mv |
Algoritmos genéticos Black box Caixa-preta Explainable artificial intelligence Explanation Explicação Fitness sharing Fitness sharing Genetic algorithms Inteligência artificial explicável |
topic |
Algoritmos genéticos Black box Caixa-preta Explainable artificial intelligence Explanation Explicação Fitness sharing Fitness sharing Genetic algorithms Inteligência artificial explicável |
description |
O uso de aprendizado de máquina em domínios diversos é cada vez mais comum. No entanto, muitas aplicações críticas não podem usufruir desta tecnologia sem que as decisões de um classificador sejam interpretáveis. O problema é que a maioria dos modelos se comporta como uma caixa-preta cujas decisões não são facilmente interpretáveis, o que limita sua efetividade apesar do bom desempenho. Diversos trabalhos na literatura buscam resolver este problema propondo técnicas de decisão que explicam o comportamento de modelos caixa-preta quando estes são aplicados a um determinado exemplo. Uma delas é a técnica Local Rule Based Explanations (LORE) que gera explicações locais, utilizando uma Árvore de Decisão treinada a partir de dados artificiais gerados por um algoritmo genético (AG). O método LORE utiliza um algoritmo genético padrão, que não preserva necessariamente a diversidade das soluções na população final. A hipótese investigada neste trabalho é que a diversidade é importante para gerar árvores de decisão que consigam reproduzir com maior precisão as fronteiras de decisão do classificador localizadas perto do exemplo a ser explicado. Este trabalho mostra que os exemplos artificiais gerados pelos AGs em LORE não são necessariamente diversos. É proposto então o uso da técnica de fitness sharing no AG para gerar exemplos artificiais mais diversos. Consequentemente, as fronteiras de decisão locais da Árvore de Decisão devem ser mais semelhantes aos do classificador caixa-preta. Resultados experimentais com dois classificadores (Perceptron Multicamadas e Florestas Aleatórias) e quatro problemas de classificação indicam que LORE com fitness sharing produz populações de AG mais diversas e melhores explicações locais. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-12-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/ |
url |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257054916378624 |