Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/16799 |
Resumo: | Este trabalho apresenta um estudo sobre a classificação de conjuntos de dados textuais utilizando algoritmos de aprendizagem de máquina através da plataforma WEKA. Apresenta-se uma visão geral sobre a interpretação da linguagem nos textos, as características e etapas da classificação e formas de avaliação dos resultados e desempenho dos algoritmos. Através de testes exemplifica-se todo o processo de classificação de textos e pela análise dos resultados procuram-se possíveis afinidades entre diversos algoritmos através da aplicação da técnica em bases de dados com características diversas. |
id |
UTFPR-12_89d3bca4a106d7b3385f215a49f9530f |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/16799 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-19T21:05:44Z2020-11-19T21:05:44Z2016-06-03KULTZAK, Adriano Francisco. Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA. 2016. 74 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Parana, Ponta Grossa, 2016.http://repositorio.utfpr.edu.br/jspui/handle/1/16799Este trabalho apresenta um estudo sobre a classificação de conjuntos de dados textuais utilizando algoritmos de aprendizagem de máquina através da plataforma WEKA. Apresenta-se uma visão geral sobre a interpretação da linguagem nos textos, as características e etapas da classificação e formas de avaliação dos resultados e desempenho dos algoritmos. Através de testes exemplifica-se todo o processo de classificação de textos e pela análise dos resultados procuram-se possíveis afinidades entre diversos algoritmos através da aplicação da técnica em bases de dados com características diversas.This paper presents a study on the classification of textual data sets using machine learning algorithms through the WEKA platform. It presents an overview of the interpretation of language in texts, characteristics and stages of the classification rating and forms of results evaluation and performance of the algorithms. Through testing it exemplifies up the process of classification of texts and analyzing the results looking for affinities between various possible algorithms by the technique of application databases with different characteristics.porUniversidade Tecnológica Federal do ParanáPonta GrossaTecnologia em Análise e Desenvolvimento de SistemasUTFPRBrasilDepartamento Acadêmico de InformáticaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOMineração de dados (Computação)AlgorítmosProcessamento de textos (Computação)Data miningAlgorithmsText processing (Computer science)Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKAinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPonta GrossaFidelis, Marcos ViniciusFidelis, Marcos ViniciusBorges, Helyane BronoskiRanthum, GeraldoKultzak, Adriano Franciscoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRLICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/1/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD51TEXTPG_COADS_2016_1_04.pdf.txtExtracted texttext/plain112793http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/2/PG_COADS_2016_1_04.pdf.txt4aa4fe719c5079b19ab8ff15ebc852d1MD52THUMBNAILPG_COADS_2016_1_04.pdf.jpgGenerated Thumbnailimage/jpeg1378http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/3/PG_COADS_2016_1_04.pdf.jpg34e5f8a2a3e029c672263ee58e0b445cMD53ORIGINALPG_COADS_2016_1_04.pdfapplication/pdf2680400http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/4/PG_COADS_2016_1_04.pdfa29e8e4c1771e17a65876a0f7388ca11MD541/167992020-11-19 19:05:44.797oai:repositorio.utfpr.edu.br:1/16799TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-19T21:05:44Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA |
title |
Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA |
spellingShingle |
Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA Kultzak, Adriano Francisco CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Mineração de dados (Computação) Algorítmos Processamento de textos (Computação) Data mining Algorithms Text processing (Computer science) |
title_short |
Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA |
title_full |
Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA |
title_fullStr |
Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA |
title_full_unstemmed |
Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA |
title_sort |
Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA |
author |
Kultzak, Adriano Francisco |
author_facet |
Kultzak, Adriano Francisco |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Fidelis, Marcos Vinicius |
dc.contributor.referee1.fl_str_mv |
Fidelis, Marcos Vinicius |
dc.contributor.referee2.fl_str_mv |
Borges, Helyane Bronoski |
dc.contributor.referee3.fl_str_mv |
Ranthum, Geraldo |
dc.contributor.author.fl_str_mv |
Kultzak, Adriano Francisco |
contributor_str_mv |
Fidelis, Marcos Vinicius Fidelis, Marcos Vinicius Borges, Helyane Bronoski Ranthum, Geraldo |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Mineração de dados (Computação) Algorítmos Processamento de textos (Computação) Data mining Algorithms Text processing (Computer science) |
dc.subject.por.fl_str_mv |
Mineração de dados (Computação) Algorítmos Processamento de textos (Computação) Data mining Algorithms Text processing (Computer science) |
description |
Este trabalho apresenta um estudo sobre a classificação de conjuntos de dados textuais utilizando algoritmos de aprendizagem de máquina através da plataforma WEKA. Apresenta-se uma visão geral sobre a interpretação da linguagem nos textos, as características e etapas da classificação e formas de avaliação dos resultados e desempenho dos algoritmos. Através de testes exemplifica-se todo o processo de classificação de textos e pela análise dos resultados procuram-se possíveis afinidades entre diversos algoritmos através da aplicação da técnica em bases de dados com características diversas. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016-06-03 |
dc.date.accessioned.fl_str_mv |
2020-11-19T21:05:44Z |
dc.date.available.fl_str_mv |
2020-11-19T21:05:44Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
KULTZAK, Adriano Francisco. Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA. 2016. 74 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Parana, Ponta Grossa, 2016. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/16799 |
identifier_str_mv |
KULTZAK, Adriano Francisco. Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA. 2016. 74 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Parana, Ponta Grossa, 2016. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/16799 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Ponta Grossa |
dc.publisher.program.fl_str_mv |
Tecnologia em Análise e Desenvolvimento de Sistemas |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento Acadêmico de Informática |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Ponta Grossa |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/1/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/2/PG_COADS_2016_1_04.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/3/PG_COADS_2016_1_04.pdf.jpg http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/4/PG_COADS_2016_1_04.pdf |
bitstream.checksum.fl_str_mv |
b9d82215ab23456fa2d8b49c5df1b95b 4aa4fe719c5079b19ab8ff15ebc852d1 34e5f8a2a3e029c672263ee58e0b445c a29e8e4c1771e17a65876a0f7388ca11 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923195069399040 |