Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/53635 |
Resumo: | Com o aumento pela demanda de produtos tecnológicos que envolvem a utilização de modelos de aprendizado de máquina, aumentou também a necessidade de formalização das técnicas em que os mesmos são desenvolvidos. Desta forma, o paradigma MLOps surgiu, objetivando a reprodutibilidade e implantação automatizada de modelos em produção. Neste trabalho um modelo já desenvolvido previamente servirá de caso de uso, sendo assim portado para um pipeline ponta-a-ponta de MLOps. O objetivo é formalizar e segmentar cada uma das etapas de desenvolvimento deste modelo, de forma a garantir uma observabilidade e reprodutibilidade maior de seus resultados e pavimentar o caminho para melhorias no mesmo ou desenvolvimento de outros modelos mais avançados. Para isso, a adoção de um arcabouço de tecnologias foi delineado de forma a orquestrar, desacoplar, documentar e implantar o modelo em um ambiente efetivamente de produção. Mlflow, Weights & Biases, Hydra, Docker, Gradio e PostgreSQL compõem a combinação escolhida de ferramentas para a solução aqui proposta. Além disso, o trabalho tratou também da implantação desta solução em produção em cenários de infraestrutura remota e locais; sendo o cenário de produção remoto consolidado nos serviços da nuvem da Amazon Web Services. Com isso se comprovou que a solução e metodologia utilizadas conseguiram gerar, além de uma portabilidade consistente do modelo para um pipeline reprodutível, uma implantação em produção e uma visualização mais refinada para seus resultados. |
id |
UFRN_3ccaa5fe6bfd5cbddc260d5a7965c8d9 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/53635 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Alsina, Ariel da Silvahttp://lattes.cnpq.br/6348931990449526https://orcid.org/0000-0002-0116-6489http://lattes.cnpq.br/3608440944832201Viegas, Carlos Manuel Diashttps://orcid.org/0000-0001-5061-7242http://lattes.cnpq.br/3134700668982522Kulesza, Uirahttps://orcid.org/0000-0002-5467-6458http://lattes.cnpq.br/0189095897739979Silva, Ivanovitch Medeiros Dantas da2023-07-18T17:05:21Z2023-07-18T17:05:21Z2023-06-30ALSINA, Ariel da Silva. Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow. Orientador: Ivanovitch Medeiros Dantas da Silva. 2023. 70f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/53635Com o aumento pela demanda de produtos tecnológicos que envolvem a utilização de modelos de aprendizado de máquina, aumentou também a necessidade de formalização das técnicas em que os mesmos são desenvolvidos. Desta forma, o paradigma MLOps surgiu, objetivando a reprodutibilidade e implantação automatizada de modelos em produção. Neste trabalho um modelo já desenvolvido previamente servirá de caso de uso, sendo assim portado para um pipeline ponta-a-ponta de MLOps. O objetivo é formalizar e segmentar cada uma das etapas de desenvolvimento deste modelo, de forma a garantir uma observabilidade e reprodutibilidade maior de seus resultados e pavimentar o caminho para melhorias no mesmo ou desenvolvimento de outros modelos mais avançados. Para isso, a adoção de um arcabouço de tecnologias foi delineado de forma a orquestrar, desacoplar, documentar e implantar o modelo em um ambiente efetivamente de produção. Mlflow, Weights & Biases, Hydra, Docker, Gradio e PostgreSQL compõem a combinação escolhida de ferramentas para a solução aqui proposta. Além disso, o trabalho tratou também da implantação desta solução em produção em cenários de infraestrutura remota e locais; sendo o cenário de produção remoto consolidado nos serviços da nuvem da Amazon Web Services. Com isso se comprovou que a solução e metodologia utilizadas conseguiram gerar, além de uma portabilidade consistente do modelo para um pipeline reprodutível, uma implantação em produção e uma visualização mais refinada para seus resultados.With the increasing demand for technological products involving the use of machine learning models, the need to formalize the techniques in which they are developed has also grown. Thus, the MLOps paradigm emerged, aiming for reproducibility and automated deployment of models in production. In this work, a previously developed model will serve as a use case, being ported to an end-to-end MLOps pipeline. The objective is to formalize and segment each stage of development of this model in order to ensure greater observability and reproducibility of its results and pave the way for improvements in the same model or the development of more advanced ones. For this purpose, the adoption of a set of frameworks and technologies was outlined to orchestrate, decouple, document, and deploy the model in an actual production environment. Mlflow, Weights & Biases, Docker, Gradio, and PostgreSQL make up the chosen combination of tools for the proposed solution. Additionally, the work also addressed the deployment of this solution in production in both remote and local infrastructure scenarios, with the remote production scenario being consolidated in the cloud services of Amazon Web Services. This confirmed that the solution and methodology used were able to generate not only consistent model portability for a reproducible pipeline but also production deployment and refined visualization of its results.Universidade Federal do Rio Grande do NorteEngenharia da Computação e AutomaçãoUFRNBrasilEngenharia de Computação e AutomaçãoAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOSCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAOMLOpsMLOpsAprendizado de máquinaMachine learningAWSAWSPipeline de dadosData pipelinePortabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflowPortability of a multilabel classification model to the MLOps paradigm: an approach with Weights & Biases and MLflowinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALtcc_ariel.pdftcc_ariel.pdfapplication/pdf5368664https://repositorio.ufrn.br/bitstream/123456789/53635/1/tcc_ariel.pdf5312e28af6decc6bb1a5c556d1d8107dMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/53635/3/license.txte9597aa2854d128fd968be5edc8a28d9MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufrn.br/bitstream/123456789/53635/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52123456789/536352023-07-18 14:05:22.283oai:https://repositorio.ufrn.br:123456789/53635Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-07-18T17:05:22Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow |
dc.title.alternative.pt_BR.fl_str_mv |
Portability of a multilabel classification model to the MLOps paradigm: an approach with Weights & Biases and MLflow |
title |
Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow |
spellingShingle |
Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow Alsina, Ariel da Silva CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO MLOps MLOps Aprendizado de máquina Machine learning AWS AWS Pipeline de dados Data pipeline |
title_short |
Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow |
title_full |
Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow |
title_fullStr |
Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow |
title_full_unstemmed |
Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow |
title_sort |
Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow |
author |
Alsina, Ariel da Silva |
author_facet |
Alsina, Ariel da Silva |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6348931990449526 |
dc.contributor.advisorID.pt_BR.fl_str_mv |
https://orcid.org/0000-0002-0116-6489 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3608440944832201 |
dc.contributor.referees1.none.fl_str_mv |
Viegas, Carlos Manuel Dias |
dc.contributor.referees1ID.pt_BR.fl_str_mv |
https://orcid.org/0000-0001-5061-7242 |
dc.contributor.referees1Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3134700668982522 |
dc.contributor.referees2.none.fl_str_mv |
Kulesza, Uira |
dc.contributor.referees2ID.pt_BR.fl_str_mv |
https://orcid.org/0000-0002-5467-6458 |
dc.contributor.referees2Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0189095897739979 |
dc.contributor.author.fl_str_mv |
Alsina, Ariel da Silva |
dc.contributor.advisor1.fl_str_mv |
Silva, Ivanovitch Medeiros Dantas da |
contributor_str_mv |
Silva, Ivanovitch Medeiros Dantas da |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO MLOps MLOps Aprendizado de máquina Machine learning AWS AWS Pipeline de dados Data pipeline |
dc.subject.por.fl_str_mv |
MLOps MLOps Aprendizado de máquina Machine learning AWS AWS Pipeline de dados Data pipeline |
description |
Com o aumento pela demanda de produtos tecnológicos que envolvem a utilização de modelos de aprendizado de máquina, aumentou também a necessidade de formalização das técnicas em que os mesmos são desenvolvidos. Desta forma, o paradigma MLOps surgiu, objetivando a reprodutibilidade e implantação automatizada de modelos em produção. Neste trabalho um modelo já desenvolvido previamente servirá de caso de uso, sendo assim portado para um pipeline ponta-a-ponta de MLOps. O objetivo é formalizar e segmentar cada uma das etapas de desenvolvimento deste modelo, de forma a garantir uma observabilidade e reprodutibilidade maior de seus resultados e pavimentar o caminho para melhorias no mesmo ou desenvolvimento de outros modelos mais avançados. Para isso, a adoção de um arcabouço de tecnologias foi delineado de forma a orquestrar, desacoplar, documentar e implantar o modelo em um ambiente efetivamente de produção. Mlflow, Weights & Biases, Hydra, Docker, Gradio e PostgreSQL compõem a combinação escolhida de ferramentas para a solução aqui proposta. Além disso, o trabalho tratou também da implantação desta solução em produção em cenários de infraestrutura remota e locais; sendo o cenário de produção remoto consolidado nos serviços da nuvem da Amazon Web Services. Com isso se comprovou que a solução e metodologia utilizadas conseguiram gerar, além de uma portabilidade consistente do modelo para um pipeline reprodutível, uma implantação em produção e uma visualização mais refinada para seus resultados. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-07-18T17:05:21Z |
dc.date.available.fl_str_mv |
2023-07-18T17:05:21Z |
dc.date.issued.fl_str_mv |
2023-06-30 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ALSINA, Ariel da Silva. Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow. Orientador: Ivanovitch Medeiros Dantas da Silva. 2023. 70f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/53635 |
identifier_str_mv |
ALSINA, Ariel da Silva. Portabilidade de um modelo de classificação multilabel para o paradigma MLOps: uma abordagem com Weights & Biases e MLflow. Orientador: Ivanovitch Medeiros Dantas da Silva. 2023. 70f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
url |
https://repositorio.ufrn.br/handle/123456789/53635 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
Engenharia da Computação e Automação |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Engenharia de Computação e Automação |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/53635/1/tcc_ariel.pdf https://repositorio.ufrn.br/bitstream/123456789/53635/3/license.txt https://repositorio.ufrn.br/bitstream/123456789/53635/2/license_rdf |
bitstream.checksum.fl_str_mv |
5312e28af6decc6bb1a5c556d1d8107d e9597aa2854d128fd968be5edc8a28d9 4d2950bda3d176f570a9f8b328dfbbef |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832851527401472 |