Detecção de Bugs em Modelos de Machine Learning

Detalhes bibliográficos
Autor(a) principal: Santos, Giovanni Cardoso Pertence dos
Data de Publicação: 2022
Outros Autores: Andrade, João Pedro Gianfaldoni de, Silva, William Augusto Reis da
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do INSPER
Texto Completo: https://repositorio.insper.edu.br/handle/11224/5586
Resumo: Modelos de Machine Learning em produção muitas vezes apresentam comportamentos inesperados, que não foram detectados durante as etapas de treino, teste e validação, ao serem expostos a dados do mundo real. Esses comportamentos inesperados, ou “bugs” do modelo, ocorrem por diferentes motivos, como o não cumprimento de regras de negócio, dados de treino rotulados incorretamente e generalizações errôneas do próprio modelo. Este projeto tem como objetivo desenvolver uma biblioteca de Machine Learning explainability, open source, na linguagem de programação Python, que seja capaz de realizar diagnósticos e produzir relatórios que identifiquem esses bugs e comportamentos inesperados, permitindo assim que o cliente IFOOD, ou qualquer outro usuário da biblioteca, os corrija. Essa biblioteca poderá ser utilizada em modelos de classificação binária, na forma de “caixa-preta”, que foram treinados com dados tabulares.
id INSP_371777d7b83da311ff9cfdd0697e0fd3
oai_identifier_str oai:repositorio.insper.edu.br:11224/5586
network_acronym_str INSP
network_name_str Biblioteca Digital de Teses e Dissertações do INSPER
repository_id_str
spelling Detecção de Bugs em Modelos de Machine LearningMachine LearningIdentificação de bugsexplicabilidadeMachine Learningbug identificationexplicabilityModelos de Machine Learning em produção muitas vezes apresentam comportamentos inesperados, que não foram detectados durante as etapas de treino, teste e validação, ao serem expostos a dados do mundo real. Esses comportamentos inesperados, ou “bugs” do modelo, ocorrem por diferentes motivos, como o não cumprimento de regras de negócio, dados de treino rotulados incorretamente e generalizações errôneas do próprio modelo. Este projeto tem como objetivo desenvolver uma biblioteca de Machine Learning explainability, open source, na linguagem de programação Python, que seja capaz de realizar diagnósticos e produzir relatórios que identifiquem esses bugs e comportamentos inesperados, permitindo assim que o cliente IFOOD, ou qualquer outro usuário da biblioteca, os corrija. Essa biblioteca poderá ser utilizada em modelos de classificação binária, na forma de “caixa-preta”, que foram treinados com dados tabulares.Machine Learning models in production environment sometimes present unexpected behavior, which have not been detected during training, testing or validation phases, when faced with data from the real world. Those unexpected behaviors, or model bugs, have different explanations, such as not following business rules, wrong generalizations, or mislabeled training data. The goal of this project is to develop an open-source Python library for Machine Learning models explainability, that produces diagnosis and reports that identifies those bugs and allows the client IFOOD to correct them. This library will be compatible with “black boxes” binary classification Machine Learning models that have been trained with structured/tabular data.GraduaçãoProjeto realizado para empresa IFood - Mentor na Empresa: Thiago CardosoBarth, Fabrício JailsonSantos, Giovanni Cardoso Pertence dosAndrade, João Pedro Gianfaldoni deSilva, William Augusto Reis daSantos, Giovanni Cardoso Pertence dosAndrade, João Pedro Gianfaldoni deSilva, William Augusto Reis da2023-05-09T19:32:37Z2023-05-09T19:32:37Z2022bachelor thesisinfo:eu-repo/semantics/publishedVersion54 p.Digitalapplication/pdfhttps://repositorio.insper.edu.br/handle/11224/5586BrasilSão PauloTODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMinfo:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações do INSPERinstname:Instituição de Ensino Superior e de Pesquisa (INSPER)instacron:INSPER2024-04-01T12:33:37Zoai:repositorio.insper.edu.br:11224/5586Biblioteca Digital de Teses e Dissertaçõeshttps://www.insper.edu.br/biblioteca-telles/PRIhttps://repositorio.insper.edu.br/oai/requestbiblioteca@insper.edu.br ||opendoar:2024-04-01T12:33:37Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)false
dc.title.none.fl_str_mv Detecção de Bugs em Modelos de Machine Learning
title Detecção de Bugs em Modelos de Machine Learning
spellingShingle Detecção de Bugs em Modelos de Machine Learning
Santos, Giovanni Cardoso Pertence dos
Machine Learning
Identificação de bugs
explicabilidade
Machine Learning
bug identification
explicability
title_short Detecção de Bugs em Modelos de Machine Learning
title_full Detecção de Bugs em Modelos de Machine Learning
title_fullStr Detecção de Bugs em Modelos de Machine Learning
title_full_unstemmed Detecção de Bugs em Modelos de Machine Learning
title_sort Detecção de Bugs em Modelos de Machine Learning
author Santos, Giovanni Cardoso Pertence dos
author_facet Santos, Giovanni Cardoso Pertence dos
Andrade, João Pedro Gianfaldoni de
Silva, William Augusto Reis da
author_role author
author2 Andrade, João Pedro Gianfaldoni de
Silva, William Augusto Reis da
author2_role author
author
dc.contributor.none.fl_str_mv Barth, Fabrício Jailson
dc.contributor.author.fl_str_mv Santos, Giovanni Cardoso Pertence dos
Andrade, João Pedro Gianfaldoni de
Silva, William Augusto Reis da
Santos, Giovanni Cardoso Pertence dos
Andrade, João Pedro Gianfaldoni de
Silva, William Augusto Reis da
dc.subject.por.fl_str_mv Machine Learning
Identificação de bugs
explicabilidade
Machine Learning
bug identification
explicability
topic Machine Learning
Identificação de bugs
explicabilidade
Machine Learning
bug identification
explicability
description Modelos de Machine Learning em produção muitas vezes apresentam comportamentos inesperados, que não foram detectados durante as etapas de treino, teste e validação, ao serem expostos a dados do mundo real. Esses comportamentos inesperados, ou “bugs” do modelo, ocorrem por diferentes motivos, como o não cumprimento de regras de negócio, dados de treino rotulados incorretamente e generalizações errôneas do próprio modelo. Este projeto tem como objetivo desenvolver uma biblioteca de Machine Learning explainability, open source, na linguagem de programação Python, que seja capaz de realizar diagnósticos e produzir relatórios que identifiquem esses bugs e comportamentos inesperados, permitindo assim que o cliente IFOOD, ou qualquer outro usuário da biblioteca, os corrija. Essa biblioteca poderá ser utilizada em modelos de classificação binária, na forma de “caixa-preta”, que foram treinados com dados tabulares.
publishDate 2022
dc.date.none.fl_str_mv 2022
2023-05-09T19:32:37Z
2023-05-09T19:32:37Z
dc.type.driver.fl_str_mv bachelor thesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.insper.edu.br/handle/11224/5586
url https://repositorio.insper.edu.br/handle/11224/5586
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 54 p.
Digital
application/pdf
dc.coverage.none.fl_str_mv Brasil
São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do INSPER
instname:Instituição de Ensino Superior e de Pesquisa (INSPER)
instacron:INSPER
instname_str Instituição de Ensino Superior e de Pesquisa (INSPER)
instacron_str INSPER
institution INSPER
reponame_str Biblioteca Digital de Teses e Dissertações do INSPER
collection Biblioteca Digital de Teses e Dissertações do INSPER
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)
repository.mail.fl_str_mv biblioteca@insper.edu.br ||
_version_ 1814986257953980416