Detecção de Bugs em Modelos de Machine Learning
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | , |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do INSPER |
Texto Completo: | https://repositorio.insper.edu.br/handle/11224/5586 |
Resumo: | Modelos de Machine Learning em produção muitas vezes apresentam comportamentos inesperados, que não foram detectados durante as etapas de treino, teste e validação, ao serem expostos a dados do mundo real. Esses comportamentos inesperados, ou “bugs” do modelo, ocorrem por diferentes motivos, como o não cumprimento de regras de negócio, dados de treino rotulados incorretamente e generalizações errôneas do próprio modelo. Este projeto tem como objetivo desenvolver uma biblioteca de Machine Learning explainability, open source, na linguagem de programação Python, que seja capaz de realizar diagnósticos e produzir relatórios que identifiquem esses bugs e comportamentos inesperados, permitindo assim que o cliente IFOOD, ou qualquer outro usuário da biblioteca, os corrija. Essa biblioteca poderá ser utilizada em modelos de classificação binária, na forma de “caixa-preta”, que foram treinados com dados tabulares. |
id |
INSP_371777d7b83da311ff9cfdd0697e0fd3 |
---|---|
oai_identifier_str |
oai:repositorio.insper.edu.br:11224/5586 |
network_acronym_str |
INSP |
network_name_str |
Biblioteca Digital de Teses e Dissertações do INSPER |
repository_id_str |
|
spelling |
Detecção de Bugs em Modelos de Machine LearningMachine LearningIdentificação de bugsexplicabilidadeMachine Learningbug identificationexplicabilityModelos de Machine Learning em produção muitas vezes apresentam comportamentos inesperados, que não foram detectados durante as etapas de treino, teste e validação, ao serem expostos a dados do mundo real. Esses comportamentos inesperados, ou “bugs” do modelo, ocorrem por diferentes motivos, como o não cumprimento de regras de negócio, dados de treino rotulados incorretamente e generalizações errôneas do próprio modelo. Este projeto tem como objetivo desenvolver uma biblioteca de Machine Learning explainability, open source, na linguagem de programação Python, que seja capaz de realizar diagnósticos e produzir relatórios que identifiquem esses bugs e comportamentos inesperados, permitindo assim que o cliente IFOOD, ou qualquer outro usuário da biblioteca, os corrija. Essa biblioteca poderá ser utilizada em modelos de classificação binária, na forma de “caixa-preta”, que foram treinados com dados tabulares.Machine Learning models in production environment sometimes present unexpected behavior, which have not been detected during training, testing or validation phases, when faced with data from the real world. Those unexpected behaviors, or model bugs, have different explanations, such as not following business rules, wrong generalizations, or mislabeled training data. The goal of this project is to develop an open-source Python library for Machine Learning models explainability, that produces diagnosis and reports that identifies those bugs and allows the client IFOOD to correct them. This library will be compatible with “black boxes” binary classification Machine Learning models that have been trained with structured/tabular data.GraduaçãoProjeto realizado para empresa IFood - Mentor na Empresa: Thiago CardosoBarth, Fabrício JailsonSantos, Giovanni Cardoso Pertence dosAndrade, João Pedro Gianfaldoni deSilva, William Augusto Reis daSantos, Giovanni Cardoso Pertence dosAndrade, João Pedro Gianfaldoni deSilva, William Augusto Reis da2023-05-09T19:32:37Z2023-05-09T19:32:37Z2022bachelor thesisinfo:eu-repo/semantics/publishedVersion54 p.Digitalapplication/pdfhttps://repositorio.insper.edu.br/handle/11224/5586BrasilSão PauloTODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMinfo:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações do INSPERinstname:Instituição de Ensino Superior e de Pesquisa (INSPER)instacron:INSPER2024-04-01T12:33:37Zoai:repositorio.insper.edu.br:11224/5586Biblioteca Digital de Teses e Dissertaçõeshttps://www.insper.edu.br/biblioteca-telles/PRIhttps://repositorio.insper.edu.br/oai/requestbiblioteca@insper.edu.br ||opendoar:2024-04-01T12:33:37Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)false |
dc.title.none.fl_str_mv |
Detecção de Bugs em Modelos de Machine Learning |
title |
Detecção de Bugs em Modelos de Machine Learning |
spellingShingle |
Detecção de Bugs em Modelos de Machine Learning Santos, Giovanni Cardoso Pertence dos Machine Learning Identificação de bugs explicabilidade Machine Learning bug identification explicability |
title_short |
Detecção de Bugs em Modelos de Machine Learning |
title_full |
Detecção de Bugs em Modelos de Machine Learning |
title_fullStr |
Detecção de Bugs em Modelos de Machine Learning |
title_full_unstemmed |
Detecção de Bugs em Modelos de Machine Learning |
title_sort |
Detecção de Bugs em Modelos de Machine Learning |
author |
Santos, Giovanni Cardoso Pertence dos |
author_facet |
Santos, Giovanni Cardoso Pertence dos Andrade, João Pedro Gianfaldoni de Silva, William Augusto Reis da |
author_role |
author |
author2 |
Andrade, João Pedro Gianfaldoni de Silva, William Augusto Reis da |
author2_role |
author author |
dc.contributor.none.fl_str_mv |
Barth, Fabrício Jailson |
dc.contributor.author.fl_str_mv |
Santos, Giovanni Cardoso Pertence dos Andrade, João Pedro Gianfaldoni de Silva, William Augusto Reis da Santos, Giovanni Cardoso Pertence dos Andrade, João Pedro Gianfaldoni de Silva, William Augusto Reis da |
dc.subject.por.fl_str_mv |
Machine Learning Identificação de bugs explicabilidade Machine Learning bug identification explicability |
topic |
Machine Learning Identificação de bugs explicabilidade Machine Learning bug identification explicability |
description |
Modelos de Machine Learning em produção muitas vezes apresentam comportamentos inesperados, que não foram detectados durante as etapas de treino, teste e validação, ao serem expostos a dados do mundo real. Esses comportamentos inesperados, ou “bugs” do modelo, ocorrem por diferentes motivos, como o não cumprimento de regras de negócio, dados de treino rotulados incorretamente e generalizações errôneas do próprio modelo. Este projeto tem como objetivo desenvolver uma biblioteca de Machine Learning explainability, open source, na linguagem de programação Python, que seja capaz de realizar diagnósticos e produzir relatórios que identifiquem esses bugs e comportamentos inesperados, permitindo assim que o cliente IFOOD, ou qualquer outro usuário da biblioteca, os corrija. Essa biblioteca poderá ser utilizada em modelos de classificação binária, na forma de “caixa-preta”, que foram treinados com dados tabulares. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2023-05-09T19:32:37Z 2023-05-09T19:32:37Z |
dc.type.driver.fl_str_mv |
bachelor thesis |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.insper.edu.br/handle/11224/5586 |
url |
https://repositorio.insper.edu.br/handle/11224/5586 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
54 p. Digital application/pdf |
dc.coverage.none.fl_str_mv |
Brasil São Paulo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do INSPER instname:Instituição de Ensino Superior e de Pesquisa (INSPER) instacron:INSPER |
instname_str |
Instituição de Ensino Superior e de Pesquisa (INSPER) |
instacron_str |
INSPER |
institution |
INSPER |
reponame_str |
Biblioteca Digital de Teses e Dissertações do INSPER |
collection |
Biblioteca Digital de Teses e Dissertações do INSPER |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER) |
repository.mail.fl_str_mv |
biblioteca@insper.edu.br || |
_version_ |
1814986257953980416 |