Um comparativo de performance para processamento de linguagem natural (PLN)

Detalhes bibliográficos
Autor(a) principal: Lomba, Edson Coutinho de Castro
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do Mackenzie
Texto Completo: https://dspace.mackenzie.br/handle/10899/31050
Resumo: Este artigo teve como objetivo abordar técnicas para melhorar o desempenho na manipulação de conjuntos de dados para processamento de linguagem natural (PLN). O artigo faz uma comparação de desempenho entre a biblioteca Pandas e a biblioteca Dask ao manipular conjuntos de dados para PNL, apresentando métodos para melhorar o desempenho e técnicas de paralelismo para processamento de dados.
id UPM_29dd74b5b274fb33f829f1be3363036a
oai_identifier_str oai:dspace.mackenzie.br:10899/31050
network_acronym_str UPM
network_name_str Biblioteca Digital de Teses e Dissertações do Mackenzie
repository_id_str 10277
spelling Lomba, Edson Coutinho de CastroMenezes, Mario Olímpio de2022-11-26T15:16:44Z2022-11-26T15:16:44Z2021-05-31Este artigo teve como objetivo abordar técnicas para melhorar o desempenho na manipulação de conjuntos de dados para processamento de linguagem natural (PLN). O artigo faz uma comparação de desempenho entre a biblioteca Pandas e a biblioteca Dask ao manipular conjuntos de dados para PNL, apresentando métodos para melhorar o desempenho e técnicas de paralelismo para processamento de dados.https://dspace.mackenzie.br/handle/10899/31050Universidade Presbiteriana MackenzieFaculdade de Computação e Informática (FCI)Attribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccesslinguagem natural (PLN)Um comparativo de performance para processamento de linguagem natural (PLN)info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Biblioteca Digital de Teses e Dissertações do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIEORIGINAL810-Artigo Final-3305-1-4-20210531.pdf810-Artigo Final-3305-1-4-20210531.pdfEdson Coutinho de Castro Lombaapplication/pdf620695https://dspace.mackenzie.br/bitstreams/6b7e2be6-c4a6-4009-b84a-fa97dce8386c/download11ad1f7195f6de9a5078c1d7adf8bc6cMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://dspace.mackenzie.br/bitstreams/472417fc-bbf1-4688-8690-b282d34b70c6/downloade39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81997https://dspace.mackenzie.br/bitstreams/aef3fb83-564e-4bf9-b9dc-1245868ee0a5/downloadfb735e1a8fa1feda568f1b61905f8d57MD53TEXT810-Artigo Final-3305-1-4-20210531.pdf.txt810-Artigo Final-3305-1-4-20210531.pdf.txtExtracted texttext/plain28769https://dspace.mackenzie.br/bitstreams/f4113585-0955-4043-8730-686627045cf0/download83ede3fc955d13d5527176888a4b5748MD54THUMBNAIL810-Artigo Final-3305-1-4-20210531.pdf.jpg810-Artigo Final-3305-1-4-20210531.pdf.jpgGenerated Thumbnailimage/jpeg1541https://dspace.mackenzie.br/bitstreams/a885055b-db07-4940-9ce0-2ebb6ded4197/downloaddad397aa13549938e593a0d912f52377MD5510899/310502023-01-05 01:08:12.842http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Braziloai:dspace.mackenzie.br:10899/31050https://dspace.mackenzie.brBiblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRIhttps://adelpha-api.mackenzie.br/server/oai/repositorio@mackenzie.br||paola.damato@mackenzie.bropendoar:102772023-01-05T01:08:12Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBzZXUgdHJhYmFsaG8gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgbyBzZXUgdHJhYmFsaG8gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZG8gc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkbyBzZXUgdHJhYmFsaG8gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc2V1IHRyYWJhbGhvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIGRlY2xhcmFyIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZG8gc2V1IHRyYWJhbGhvIG9yYSBkZXBvc2l0YWRvLgoKQ0FTTyBPIFRSQUJBTEhPIE9SQSBERVBPU0lUQURPIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTsODTyBTRUpBIEEgVU5JVkVSU0lEQURFIFBSRVNCSVRFUklBTkEgTUFDS0VOWklFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHNldSB0cmFiYWxobywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=
dc.title.pt_BR.fl_str_mv Um comparativo de performance para processamento de linguagem natural (PLN)
title Um comparativo de performance para processamento de linguagem natural (PLN)
spellingShingle Um comparativo de performance para processamento de linguagem natural (PLN)
Lomba, Edson Coutinho de Castro
linguagem natural (PLN)
title_short Um comparativo de performance para processamento de linguagem natural (PLN)
title_full Um comparativo de performance para processamento de linguagem natural (PLN)
title_fullStr Um comparativo de performance para processamento de linguagem natural (PLN)
title_full_unstemmed Um comparativo de performance para processamento de linguagem natural (PLN)
title_sort Um comparativo de performance para processamento de linguagem natural (PLN)
author Lomba, Edson Coutinho de Castro
author_facet Lomba, Edson Coutinho de Castro
author_role author
dc.contributor.author.fl_str_mv Lomba, Edson Coutinho de Castro
dc.contributor.advisor1.fl_str_mv Menezes, Mario Olímpio de
contributor_str_mv Menezes, Mario Olímpio de
dc.subject.por.fl_str_mv linguagem natural (PLN)
topic linguagem natural (PLN)
description Este artigo teve como objetivo abordar técnicas para melhorar o desempenho na manipulação de conjuntos de dados para processamento de linguagem natural (PLN). O artigo faz uma comparação de desempenho entre a biblioteca Pandas e a biblioteca Dask ao manipular conjuntos de dados para PNL, apresentando métodos para melhorar o desempenho e técnicas de paralelismo para processamento de dados.
publishDate 2021
dc.date.issued.fl_str_mv 2021-05-31
dc.date.accessioned.fl_str_mv 2022-11-26T15:16:44Z
dc.date.available.fl_str_mv 2022-11-26T15:16:44Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://dspace.mackenzie.br/handle/10899/31050
url https://dspace.mackenzie.br/handle/10899/31050
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
dc.publisher.department.fl_str_mv Faculdade de Computação e Informática (FCI)
publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do Mackenzie
instname:Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron:MACKENZIE
instname_str Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron_str MACKENZIE
institution MACKENZIE
reponame_str Biblioteca Digital de Teses e Dissertações do Mackenzie
collection Biblioteca Digital de Teses e Dissertações do Mackenzie
bitstream.url.fl_str_mv https://dspace.mackenzie.br/bitstreams/6b7e2be6-c4a6-4009-b84a-fa97dce8386c/download
https://dspace.mackenzie.br/bitstreams/472417fc-bbf1-4688-8690-b282d34b70c6/download
https://dspace.mackenzie.br/bitstreams/aef3fb83-564e-4bf9-b9dc-1245868ee0a5/download
https://dspace.mackenzie.br/bitstreams/f4113585-0955-4043-8730-686627045cf0/download
https://dspace.mackenzie.br/bitstreams/a885055b-db07-4940-9ce0-2ebb6ded4197/download
bitstream.checksum.fl_str_mv 11ad1f7195f6de9a5078c1d7adf8bc6c
e39d27027a6cc9cb039ad269a5db8e34
fb735e1a8fa1feda568f1b61905f8d57
83ede3fc955d13d5527176888a4b5748
dad397aa13549938e593a0d912f52377
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)
repository.mail.fl_str_mv repositorio@mackenzie.br||paola.damato@mackenzie.br
_version_ 1813820011238653952