Um comparativo de performance para processamento de linguagem natural (PLN)
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do Mackenzie |
Texto Completo: | https://dspace.mackenzie.br/handle/10899/31050 |
Resumo: | Este artigo teve como objetivo abordar técnicas para melhorar o desempenho na manipulação de conjuntos de dados para processamento de linguagem natural (PLN). O artigo faz uma comparação de desempenho entre a biblioteca Pandas e a biblioteca Dask ao manipular conjuntos de dados para PNL, apresentando métodos para melhorar o desempenho e técnicas de paralelismo para processamento de dados. |
id |
UPM_29dd74b5b274fb33f829f1be3363036a |
---|---|
oai_identifier_str |
oai:dspace.mackenzie.br:10899/31050 |
network_acronym_str |
UPM |
network_name_str |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
repository_id_str |
10277 |
spelling |
Lomba, Edson Coutinho de CastroMenezes, Mario Olímpio de2022-11-26T15:16:44Z2022-11-26T15:16:44Z2021-05-31Este artigo teve como objetivo abordar técnicas para melhorar o desempenho na manipulação de conjuntos de dados para processamento de linguagem natural (PLN). O artigo faz uma comparação de desempenho entre a biblioteca Pandas e a biblioteca Dask ao manipular conjuntos de dados para PNL, apresentando métodos para melhorar o desempenho e técnicas de paralelismo para processamento de dados.https://dspace.mackenzie.br/handle/10899/31050Universidade Presbiteriana MackenzieFaculdade de Computação e Informática (FCI)Attribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccesslinguagem natural (PLN)Um comparativo de performance para processamento de linguagem natural (PLN)info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Biblioteca Digital de Teses e Dissertações do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIEORIGINAL810-Artigo Final-3305-1-4-20210531.pdf810-Artigo Final-3305-1-4-20210531.pdfEdson Coutinho de Castro Lombaapplication/pdf620695https://dspace.mackenzie.br/bitstreams/6b7e2be6-c4a6-4009-b84a-fa97dce8386c/download11ad1f7195f6de9a5078c1d7adf8bc6cMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://dspace.mackenzie.br/bitstreams/472417fc-bbf1-4688-8690-b282d34b70c6/downloade39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81997https://dspace.mackenzie.br/bitstreams/aef3fb83-564e-4bf9-b9dc-1245868ee0a5/downloadfb735e1a8fa1feda568f1b61905f8d57MD53TEXT810-Artigo Final-3305-1-4-20210531.pdf.txt810-Artigo Final-3305-1-4-20210531.pdf.txtExtracted texttext/plain28769https://dspace.mackenzie.br/bitstreams/f4113585-0955-4043-8730-686627045cf0/download83ede3fc955d13d5527176888a4b5748MD54THUMBNAIL810-Artigo Final-3305-1-4-20210531.pdf.jpg810-Artigo Final-3305-1-4-20210531.pdf.jpgGenerated Thumbnailimage/jpeg1541https://dspace.mackenzie.br/bitstreams/a885055b-db07-4940-9ce0-2ebb6ded4197/downloaddad397aa13549938e593a0d912f52377MD5510899/310502023-01-05 01:08:12.842http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Braziloai:dspace.mackenzie.br:10899/31050https://dspace.mackenzie.brBiblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRIhttps://adelpha-api.mackenzie.br/server/oai/repositorio@mackenzie.br||paola.damato@mackenzie.bropendoar:102772023-01-05T01:08:12Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBzZXUgdHJhYmFsaG8gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgbyBzZXUgdHJhYmFsaG8gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZG8gc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkbyBzZXUgdHJhYmFsaG8gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc2V1IHRyYWJhbGhvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIGRlY2xhcmFyIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZG8gc2V1IHRyYWJhbGhvIG9yYSBkZXBvc2l0YWRvLgoKQ0FTTyBPIFRSQUJBTEhPIE9SQSBERVBPU0lUQURPIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTsODTyBTRUpBIEEgVU5JVkVSU0lEQURFIFBSRVNCSVRFUklBTkEgTUFDS0VOWklFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHNldSB0cmFiYWxobywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo= |
dc.title.pt_BR.fl_str_mv |
Um comparativo de performance para processamento de linguagem natural (PLN) |
title |
Um comparativo de performance para processamento de linguagem natural (PLN) |
spellingShingle |
Um comparativo de performance para processamento de linguagem natural (PLN) Lomba, Edson Coutinho de Castro linguagem natural (PLN) |
title_short |
Um comparativo de performance para processamento de linguagem natural (PLN) |
title_full |
Um comparativo de performance para processamento de linguagem natural (PLN) |
title_fullStr |
Um comparativo de performance para processamento de linguagem natural (PLN) |
title_full_unstemmed |
Um comparativo de performance para processamento de linguagem natural (PLN) |
title_sort |
Um comparativo de performance para processamento de linguagem natural (PLN) |
author |
Lomba, Edson Coutinho de Castro |
author_facet |
Lomba, Edson Coutinho de Castro |
author_role |
author |
dc.contributor.author.fl_str_mv |
Lomba, Edson Coutinho de Castro |
dc.contributor.advisor1.fl_str_mv |
Menezes, Mario Olímpio de |
contributor_str_mv |
Menezes, Mario Olímpio de |
dc.subject.por.fl_str_mv |
linguagem natural (PLN) |
topic |
linguagem natural (PLN) |
description |
Este artigo teve como objetivo abordar técnicas para melhorar o desempenho na manipulação de conjuntos de dados para processamento de linguagem natural (PLN). O artigo faz uma comparação de desempenho entre a biblioteca Pandas e a biblioteca Dask ao manipular conjuntos de dados para PNL, apresentando métodos para melhorar o desempenho e técnicas de paralelismo para processamento de dados. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-05-31 |
dc.date.accessioned.fl_str_mv |
2022-11-26T15:16:44Z |
dc.date.available.fl_str_mv |
2022-11-26T15:16:44Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://dspace.mackenzie.br/handle/10899/31050 |
url |
https://dspace.mackenzie.br/handle/10899/31050 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Presbiteriana Mackenzie |
dc.publisher.department.fl_str_mv |
Faculdade de Computação e Informática (FCI) |
publisher.none.fl_str_mv |
Universidade Presbiteriana Mackenzie |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do Mackenzie instname:Universidade Presbiteriana Mackenzie (MACKENZIE) instacron:MACKENZIE |
instname_str |
Universidade Presbiteriana Mackenzie (MACKENZIE) |
instacron_str |
MACKENZIE |
institution |
MACKENZIE |
reponame_str |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
collection |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
bitstream.url.fl_str_mv |
https://dspace.mackenzie.br/bitstreams/6b7e2be6-c4a6-4009-b84a-fa97dce8386c/download https://dspace.mackenzie.br/bitstreams/472417fc-bbf1-4688-8690-b282d34b70c6/download https://dspace.mackenzie.br/bitstreams/aef3fb83-564e-4bf9-b9dc-1245868ee0a5/download https://dspace.mackenzie.br/bitstreams/f4113585-0955-4043-8730-686627045cf0/download https://dspace.mackenzie.br/bitstreams/a885055b-db07-4940-9ce0-2ebb6ded4197/download |
bitstream.checksum.fl_str_mv |
11ad1f7195f6de9a5078c1d7adf8bc6c e39d27027a6cc9cb039ad269a5db8e34 fb735e1a8fa1feda568f1b61905f8d57 83ede3fc955d13d5527176888a4b5748 dad397aa13549938e593a0d912f52377 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE) |
repository.mail.fl_str_mv |
repositorio@mackenzie.br||paola.damato@mackenzie.br |
_version_ |
1813820011238653952 |