Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações

Detalhes bibliográficos
Autor(a) principal: Santos, Daniel Augusto dos
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/
Resumo: O uso de aprendizado de máquina em domínios diversos é cada vez mais comum. No entanto, muitas aplicações críticas não podem usufruir desta tecnologia sem que as decisões de um classificador sejam interpretáveis. O problema é que a maioria dos modelos se comporta como uma caixa-preta cujas decisões não são facilmente interpretáveis, o que limita sua efetividade apesar do bom desempenho. Diversos trabalhos na literatura buscam resolver este problema propondo técnicas de decisão que explicam o comportamento de modelos caixa-preta quando estes são aplicados a um determinado exemplo. Uma delas é a técnica Local Rule Based Explanations (LORE) que gera explicações locais, utilizando uma Árvore de Decisão treinada a partir de dados artificiais gerados por um algoritmo genético (AG). O método LORE utiliza um algoritmo genético padrão, que não preserva necessariamente a diversidade das soluções na população final. A hipótese investigada neste trabalho é que a diversidade é importante para gerar árvores de decisão que consigam reproduzir com maior precisão as fronteiras de decisão do classificador localizadas perto do exemplo a ser explicado. Este trabalho mostra que os exemplos artificiais gerados pelos AGs em LORE não são necessariamente diversos. É proposto então o uso da técnica de fitness sharing no AG para gerar exemplos artificiais mais diversos. Consequentemente, as fronteiras de decisão locais da Árvore de Decisão devem ser mais semelhantes aos do classificador caixa-preta. Resultados experimentais com dois classificadores (Perceptron Multicamadas e Florestas Aleatórias) e quatro problemas de classificação indicam que LORE com fitness sharing produz populações de AG mais diversas e melhores explicações locais.
id USP_667b7b9ef246aa15e5119351eb15d52c
oai_identifier_str oai:teses.usp.br:tde-17112023-112559
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populaçõesA model for explaining local classifier decisions based on genetic algorithms with preservation of population diversityAlgoritmos genéticosBlack boxCaixa-pretaExplainable artificial intelligenceExplanationExplicaçãoFitness sharingFitness sharingGenetic algorithmsInteligência artificial explicávelO uso de aprendizado de máquina em domínios diversos é cada vez mais comum. No entanto, muitas aplicações críticas não podem usufruir desta tecnologia sem que as decisões de um classificador sejam interpretáveis. O problema é que a maioria dos modelos se comporta como uma caixa-preta cujas decisões não são facilmente interpretáveis, o que limita sua efetividade apesar do bom desempenho. Diversos trabalhos na literatura buscam resolver este problema propondo técnicas de decisão que explicam o comportamento de modelos caixa-preta quando estes são aplicados a um determinado exemplo. Uma delas é a técnica Local Rule Based Explanations (LORE) que gera explicações locais, utilizando uma Árvore de Decisão treinada a partir de dados artificiais gerados por um algoritmo genético (AG). O método LORE utiliza um algoritmo genético padrão, que não preserva necessariamente a diversidade das soluções na população final. A hipótese investigada neste trabalho é que a diversidade é importante para gerar árvores de decisão que consigam reproduzir com maior precisão as fronteiras de decisão do classificador localizadas perto do exemplo a ser explicado. Este trabalho mostra que os exemplos artificiais gerados pelos AGs em LORE não são necessariamente diversos. É proposto então o uso da técnica de fitness sharing no AG para gerar exemplos artificiais mais diversos. Consequentemente, as fronteiras de decisão locais da Árvore de Decisão devem ser mais semelhantes aos do classificador caixa-preta. Resultados experimentais com dois classificadores (Perceptron Multicamadas e Florestas Aleatórias) e quatro problemas de classificação indicam que LORE com fitness sharing produz populações de AG mais diversas e melhores explicações locais.The use of machine learning in diverse domains is increasingly common. However, many critical applications cannot take advantage of this technology without the decisions of a classifier being interpretable. The problem is that most models behave like a black box whose decisions are not easily interpretable, which limits its effectiveness despite good performance. Several works in the literature seek to solve this problem by proposing decision techniques that explain the behavior of black box models when they are applied to a given example. One of them is the Local Rule Based Explanations (LORE), a technique that generates local explanations using a Decision Tree trained on artificial data generated by a genetic algorithm. The LORE method uses a standard genetic algorithm, which does not necessarily preserve the diversity of solutions in the final population. The hypothesis investigated in this work is that diversity is important to generate decision trees that can more accurately reproduce the classifier\'s decision boundaries located close to the example to be explained. This work shows that the artificial examples generated by the GA in LORE are not necessarily diverse. The Fitness Sharing technique is then used to generate more diverse artificial GA examples. Consequently, the local decision boundaries of the Decision Tree should be more similar to those of the black-box classifier. Experimental results with two classifiers (Multilayer Perceptron and Random Forests) and four classification problems indicate that LORE with fitness sharing produces more diverse GA populations and better local explanations.Biblioteca Digitais de Teses e Dissertações da USPTinós, RenatoSantos, Daniel Augusto dos2022-12-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-12-20T18:08:02Zoai:teses.usp.br:tde-17112023-112559Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-20T18:08:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
A model for explaining local classifier decisions based on genetic algorithms with preservation of population diversity
title Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
spellingShingle Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
Santos, Daniel Augusto dos
Algoritmos genéticos
Black box
Caixa-preta
Explainable artificial intelligence
Explanation
Explicação
Fitness sharing
Fitness sharing
Genetic algorithms
Inteligência artificial explicável
title_short Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
title_full Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
title_fullStr Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
title_full_unstemmed Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
title_sort Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações
author Santos, Daniel Augusto dos
author_facet Santos, Daniel Augusto dos
author_role author
dc.contributor.none.fl_str_mv Tinós, Renato
dc.contributor.author.fl_str_mv Santos, Daniel Augusto dos
dc.subject.por.fl_str_mv Algoritmos genéticos
Black box
Caixa-preta
Explainable artificial intelligence
Explanation
Explicação
Fitness sharing
Fitness sharing
Genetic algorithms
Inteligência artificial explicável
topic Algoritmos genéticos
Black box
Caixa-preta
Explainable artificial intelligence
Explanation
Explicação
Fitness sharing
Fitness sharing
Genetic algorithms
Inteligência artificial explicável
description O uso de aprendizado de máquina em domínios diversos é cada vez mais comum. No entanto, muitas aplicações críticas não podem usufruir desta tecnologia sem que as decisões de um classificador sejam interpretáveis. O problema é que a maioria dos modelos se comporta como uma caixa-preta cujas decisões não são facilmente interpretáveis, o que limita sua efetividade apesar do bom desempenho. Diversos trabalhos na literatura buscam resolver este problema propondo técnicas de decisão que explicam o comportamento de modelos caixa-preta quando estes são aplicados a um determinado exemplo. Uma delas é a técnica Local Rule Based Explanations (LORE) que gera explicações locais, utilizando uma Árvore de Decisão treinada a partir de dados artificiais gerados por um algoritmo genético (AG). O método LORE utiliza um algoritmo genético padrão, que não preserva necessariamente a diversidade das soluções na população final. A hipótese investigada neste trabalho é que a diversidade é importante para gerar árvores de decisão que consigam reproduzir com maior precisão as fronteiras de decisão do classificador localizadas perto do exemplo a ser explicado. Este trabalho mostra que os exemplos artificiais gerados pelos AGs em LORE não são necessariamente diversos. É proposto então o uso da técnica de fitness sharing no AG para gerar exemplos artificiais mais diversos. Consequentemente, as fronteiras de decisão locais da Árvore de Decisão devem ser mais semelhantes aos do classificador caixa-preta. Resultados experimentais com dois classificadores (Perceptron Multicamadas e Florestas Aleatórias) e quatro problemas de classificação indicam que LORE com fitness sharing produz populações de AG mais diversas e melhores explicações locais.
publishDate 2022
dc.date.none.fl_str_mv 2022-12-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/
url https://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257054916378624