Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow

Detalhes bibliográficos
Autor(a) principal: Alsina, Ariel da Silva
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/53635
Resumo: Com o aumento pela demanda de produtos tecnológicos que envolvem a utilização de modelos de aprendizado de máquina, aumentou também a necessidade de formalização das técnicas em que os mesmos são desenvolvidos. Desta forma, o paradigma MLOps surgiu, objetivando a reprodutibilidade e implantação automatizada de modelos em produção. Neste trabalho um modelo já desenvolvido previamente servirá de caso de uso, sendo assim portado para um pipeline ponta-a-ponta de MLOps. O objetivo é formalizar e segmentar cada uma das etapas de desenvolvimento deste modelo, de forma a garantir uma observabilidade e reprodutibilidade maior de seus resultados e pavimentar o caminho para melhorias no mesmo ou desenvolvimento de outros modelos mais avançados. Para isso, a adoção de um arcabouço de tecnologias foi delineado de forma a orquestrar, desacoplar, documentar e implantar o modelo em um ambiente efetivamente de produção. Mlflow, Weights & Biases, Hydra, Docker, Gradio e PostgreSQL compõem a combinação escolhida de ferramentas para a solução aqui proposta. Além disso, o trabalho tratou também da implantação desta solução em produção em cenários de infraestrutura remota e locais; sendo o cenário de produção remoto consolidado nos serviços da nuvem da Amazon Web Services. Com isso se comprovou que a solução e metodologia utilizadas conseguiram gerar, além de uma portabilidade consistente do modelo para um pipeline reprodutível, uma implantação em produção e uma visualização mais refinada para seus resultados.
id UFRN_3ccaa5fe6bfd5cbddc260d5a7965c8d9
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/53635
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Alsina, Ariel da Silvahttp://lattes.cnpq.br/6348931990449526https://orcid.org/0000-0002-0116-6489http://lattes.cnpq.br/3608440944832201Viegas, Carlos Manuel Diashttps://orcid.org/0000-0001-5061-7242http://lattes.cnpq.br/3134700668982522Kulesza, Uirahttps://orcid.org/0000-0002-5467-6458http://lattes.cnpq.br/0189095897739979Silva, Ivanovitch Medeiros Dantas da2023-07-18T17:05:21Z2023-07-18T17:05:21Z2023-06-30ALSINA, Ariel da Silva. Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow. Orientador: Ivanovitch Medeiros Dantas da Silva. 2023. 70f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/53635Com o aumento pela demanda de produtos tecnológicos que envolvem a utilização de modelos de aprendizado de máquina, aumentou também a necessidade de formalização das técnicas em que os mesmos são desenvolvidos. Desta forma, o paradigma MLOps surgiu, objetivando a reprodutibilidade e implantação automatizada de modelos em produção. Neste trabalho um modelo já desenvolvido previamente servirá de caso de uso, sendo assim portado para um pipeline ponta-a-ponta de MLOps. O objetivo é formalizar e segmentar cada uma das etapas de desenvolvimento deste modelo, de forma a garantir uma observabilidade e reprodutibilidade maior de seus resultados e pavimentar o caminho para melhorias no mesmo ou desenvolvimento de outros modelos mais avançados. Para isso, a adoção de um arcabouço de tecnologias foi delineado de forma a orquestrar, desacoplar, documentar e implantar o modelo em um ambiente efetivamente de produção. Mlflow, Weights & Biases, Hydra, Docker, Gradio e PostgreSQL compõem a combinação escolhida de ferramentas para a solução aqui proposta. Além disso, o trabalho tratou também da implantação desta solução em produção em cenários de infraestrutura remota e locais; sendo o cenário de produção remoto consolidado nos serviços da nuvem da Amazon Web Services. Com isso se comprovou que a solução e metodologia utilizadas conseguiram gerar, além de uma portabilidade consistente do modelo para um pipeline reprodutível, uma implantação em produção e uma visualização mais refinada para seus resultados.With the increasing demand for technological products involving the use of machine learning models, the need to formalize the techniques in which they are developed has also grown. Thus, the MLOps paradigm emerged, aiming for reproducibility and automated deployment of models in production. In this work, a previously developed model will serve as a use case, being ported to an end-to-end MLOps pipeline. The objective is to formalize and segment each stage of development of this model in order to ensure greater observability and reproducibility of its results and pave the way for improvements in the same model or the development of more advanced ones. For this purpose, the adoption of a set of frameworks and technologies was outlined to orchestrate, decouple, document, and deploy the model in an actual production environment. Mlflow, Weights & Biases, Docker, Gradio, and PostgreSQL make up the chosen combination of tools for the proposed solution. Additionally, the work also addressed the deployment of this solution in production in both remote and local infrastructure scenarios, with the remote production scenario being consolidated in the cloud services of Amazon Web Services. This confirmed that the solution and methodology used were able to generate not only consistent model portability for a reproducible pipeline but also production deployment and refined visualization of its results.Universidade Federal do Rio Grande do NorteEngenharia da Computação e AutomaçãoUFRNBrasilEngenharia de Computação e AutomaçãoAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOSCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAOMLOpsMLOpsAprendizado de máquinaMachine learningAWSAWSPipeline de dadosData pipelinePortabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflowPortability of a multilabel classification model to the MLOps paradigm: an approach with Weights & Biases and MLflowinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALtcc_ariel.pdftcc_ariel.pdfapplication/pdf5368664https://repositorio.ufrn.br/bitstream/123456789/53635/1/tcc_ariel.pdf5312e28af6decc6bb1a5c556d1d8107dMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/53635/3/license.txte9597aa2854d128fd968be5edc8a28d9MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufrn.br/bitstream/123456789/53635/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52123456789/536352023-07-18 14:05:22.283oai:https://repositorio.ufrn.br:123456789/53635Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-07-18T17:05:22Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
dc.title.alternative.pt_BR.fl_str_mv Portability of a multilabel classification model to the MLOps paradigm: an approach with Weights & Biases and MLflow
title Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
spellingShingle Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
Alsina, Ariel da Silva
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO
MLOps
MLOps
Aprendizado de máquina
Machine learning
AWS
AWS
Pipeline de dados
Data pipeline
title_short Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
title_full Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
title_fullStr Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
title_full_unstemmed Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
title_sort Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
author Alsina, Ariel da Silva
author_facet Alsina, Ariel da Silva
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6348931990449526
dc.contributor.advisorID.pt_BR.fl_str_mv https://orcid.org/0000-0002-0116-6489
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3608440944832201
dc.contributor.referees1.none.fl_str_mv Viegas, Carlos Manuel Dias
dc.contributor.referees1ID.pt_BR.fl_str_mv https://orcid.org/0000-0001-5061-7242
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3134700668982522
dc.contributor.referees2.none.fl_str_mv Kulesza, Uira
dc.contributor.referees2ID.pt_BR.fl_str_mv https://orcid.org/0000-0002-5467-6458
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0189095897739979
dc.contributor.author.fl_str_mv Alsina, Ariel da Silva
dc.contributor.advisor1.fl_str_mv Silva, Ivanovitch Medeiros Dantas da
contributor_str_mv Silva, Ivanovitch Medeiros Dantas da
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO
MLOps
MLOps
Aprendizado de máquina
Machine learning
AWS
AWS
Pipeline de dados
Data pipeline
dc.subject.por.fl_str_mv MLOps
MLOps
Aprendizado de máquina
Machine learning
AWS
AWS
Pipeline de dados
Data pipeline
description Com o aumento pela demanda de produtos tecnológicos que envolvem a utilização de modelos de aprendizado de máquina, aumentou também a necessidade de formalização das técnicas em que os mesmos são desenvolvidos. Desta forma, o paradigma MLOps surgiu, objetivando a reprodutibilidade e implantação automatizada de modelos em produção. Neste trabalho um modelo já desenvolvido previamente servirá de caso de uso, sendo assim portado para um pipeline ponta-a-ponta de MLOps. O objetivo é formalizar e segmentar cada uma das etapas de desenvolvimento deste modelo, de forma a garantir uma observabilidade e reprodutibilidade maior de seus resultados e pavimentar o caminho para melhorias no mesmo ou desenvolvimento de outros modelos mais avançados. Para isso, a adoção de um arcabouço de tecnologias foi delineado de forma a orquestrar, desacoplar, documentar e implantar o modelo em um ambiente efetivamente de produção. Mlflow, Weights & Biases, Hydra, Docker, Gradio e PostgreSQL compõem a combinação escolhida de ferramentas para a solução aqui proposta. Além disso, o trabalho tratou também da implantação desta solução em produção em cenários de infraestrutura remota e locais; sendo o cenário de produção remoto consolidado nos serviços da nuvem da Amazon Web Services. Com isso se comprovou que a solução e metodologia utilizadas conseguiram gerar, além de uma portabilidade consistente do modelo para um pipeline reprodutível, uma implantação em produção e uma visualização mais refinada para seus resultados.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-07-18T17:05:21Z
dc.date.available.fl_str_mv 2023-07-18T17:05:21Z
dc.date.issued.fl_str_mv 2023-06-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ALSINA, Ariel da Silva. Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow. Orientador: Ivanovitch Medeiros Dantas da Silva. 2023. 70f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/53635
identifier_str_mv ALSINA, Ariel da Silva. Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow. Orientador: Ivanovitch Medeiros Dantas da Silva. 2023. 70f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.
url https://repositorio.ufrn.br/handle/123456789/53635
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv Engenharia da Computação e Automação
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Engenharia de Computação e Automação
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/53635/1/tcc_ariel.pdf
https://repositorio.ufrn.br/bitstream/123456789/53635/3/license.txt
https://repositorio.ufrn.br/bitstream/123456789/53635/2/license_rdf
bitstream.checksum.fl_str_mv 5312e28af6decc6bb1a5c556d1d8107d
e9597aa2854d128fd968be5edc8a28d9
4d2950bda3d176f570a9f8b328dfbbef
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832851527401472