Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/49080 |
Resumo: | O Processamento de Linguagem Natural (PNL), assim como o Aprendizado de Máquina vem sendo bastante utilizado para processar e classificar dados na busca de obter informações. Este trabalho tem como objetivo propor um modelo de aprendizado de máquina capaz de classificar marcas a partir das descrições de produtos. Para isso, foi utilizado dados coletados por Crawlers dos principais sistemas de comércios eletrônicos da América Latina. Primeiramente foi realizado um tratamento nos dados, o que inclui, remover, filtrar e transformá-los para que fiquem aptos a serem utilizados. Foi utilizado o PLN para vetorização da descrição dos produtos e em seguida foi utilizado três algoritmos de aprendizado de máquina. Este protótipo computacional foi construído utilizando Python e foram obtidos resultados significativos, demonstrando que o algoritmo se mostrou muito promissor. |
id |
UFRN_7d8c678ad06277dfdb73527c10841ffe |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/49080 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Freitas Filho, Nelson Silva de0000-0003-1138-4276D' Assunção, Adaildo GomesSilva, Bruno Marques Ferreira daLins, Hertz Wilton de Castro2022-08-08T14:36:59Z2022-08-08T14:36:59Z2022-07-15FREITAS FILHO, Nelson Silva de. Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/49080O Processamento de Linguagem Natural (PNL), assim como o Aprendizado de Máquina vem sendo bastante utilizado para processar e classificar dados na busca de obter informações. Este trabalho tem como objetivo propor um modelo de aprendizado de máquina capaz de classificar marcas a partir das descrições de produtos. Para isso, foi utilizado dados coletados por Crawlers dos principais sistemas de comércios eletrônicos da América Latina. Primeiramente foi realizado um tratamento nos dados, o que inclui, remover, filtrar e transformá-los para que fiquem aptos a serem utilizados. Foi utilizado o PLN para vetorização da descrição dos produtos e em seguida foi utilizado três algoritmos de aprendizado de máquina. Este protótipo computacional foi construído utilizando Python e foram obtidos resultados significativos, demonstrando que o algoritmo se mostrou muito promissor.Natural Language Processing, as well as Machine Learning, has been widely used to process and classify data in the search for information. This work aims to propose a machine learning model capable of classifying brands from product descriptions. For this, data collected by Crawlers from the main e-commerce systems in Latin America was used. First, a treatment was performed on the data, which includes removing, filtering and transforming them so that they are ready to be used. NLP was used to vectorize the product description and then three machine learning algorithms were used. This computational prototype was built using Python and significant were results obtained, demonstrating that the algorithm is very promising.Universidade Federal do Rio Grande do NorteEngenharia de TelecomunicaçõesUFRNBrasilEngenharia de ComunicaçõesAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de máquinaCrawlersProcessamento de linguagem naturalPythonMachine learningNatural language processingPythonAprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplacesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALAprendizadoDeMáquina_Freitas Filho_2022.pdfAprendizadoDeMáquina_Freitas Filho_2022.pdfapplication/pdf689977https://repositorio.ufrn.br/bitstream/123456789/49080/4/AprendizadoDeM%c3%a1quina_Freitas%20Filho_2022.pdf26ee90a2b49910bc991f30e1924827deMD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufrn.br/bitstream/123456789/49080/5/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD55LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/49080/6/license.txte9597aa2854d128fd968be5edc8a28d9MD56123456789/490802022-09-05 11:31:18.432oai:https://repositorio.ufrn.br:123456789/49080Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-09-05T14:31:18Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces |
title |
Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces |
spellingShingle |
Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces Freitas Filho, Nelson Silva de CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado de máquina Crawlers Processamento de linguagem natural Python Machine learning Natural language processing Python |
title_short |
Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces |
title_full |
Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces |
title_fullStr |
Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces |
title_full_unstemmed |
Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces |
title_sort |
Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces |
author |
Freitas Filho, Nelson Silva de |
author_facet |
Freitas Filho, Nelson Silva de |
author_role |
author |
dc.contributor.advisorID.pt_BR.fl_str_mv |
0000-0003-1138-4276 |
dc.contributor.referees1.none.fl_str_mv |
D' Assunção, Adaildo Gomes |
dc.contributor.referees2.none.fl_str_mv |
Silva, Bruno Marques Ferreira da |
dc.contributor.author.fl_str_mv |
Freitas Filho, Nelson Silva de |
dc.contributor.advisor1.fl_str_mv |
Lins, Hertz Wilton de Castro |
contributor_str_mv |
Lins, Hertz Wilton de Castro |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado de máquina Crawlers Processamento de linguagem natural Python Machine learning Natural language processing Python |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Crawlers Processamento de linguagem natural Python Machine learning Natural language processing Python |
description |
O Processamento de Linguagem Natural (PNL), assim como o Aprendizado de Máquina vem sendo bastante utilizado para processar e classificar dados na busca de obter informações. Este trabalho tem como objetivo propor um modelo de aprendizado de máquina capaz de classificar marcas a partir das descrições de produtos. Para isso, foi utilizado dados coletados por Crawlers dos principais sistemas de comércios eletrônicos da América Latina. Primeiramente foi realizado um tratamento nos dados, o que inclui, remover, filtrar e transformá-los para que fiquem aptos a serem utilizados. Foi utilizado o PLN para vetorização da descrição dos produtos e em seguida foi utilizado três algoritmos de aprendizado de máquina. Este protótipo computacional foi construído utilizando Python e foram obtidos resultados significativos, demonstrando que o algoritmo se mostrou muito promissor. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-08-08T14:36:59Z |
dc.date.available.fl_str_mv |
2022-08-08T14:36:59Z |
dc.date.issued.fl_str_mv |
2022-07-15 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FREITAS FILHO, Nelson Silva de. Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/49080 |
identifier_str_mv |
FREITAS FILHO, Nelson Silva de. Aprendizado de máquina e processamento de linguagem natural aplicado na predição de marcas a partir de dados de marketplaces. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
url |
https://repositorio.ufrn.br/handle/123456789/49080 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
Engenharia de Telecomunicações |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Engenharia de Comunicações |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/49080/4/AprendizadoDeM%c3%a1quina_Freitas%20Filho_2022.pdf https://repositorio.ufrn.br/bitstream/123456789/49080/5/license_rdf https://repositorio.ufrn.br/bitstream/123456789/49080/6/license.txt |
bitstream.checksum.fl_str_mv |
26ee90a2b49910bc991f30e1924827de e39d27027a6cc9cb039ad269a5db8e34 e9597aa2854d128fd968be5edc8a28d9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832687420014592 |