Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA

Detalhes bibliográficos
Autor(a) principal: Kultzak, Adriano Francisco
Data de Publicação: 2016
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/16799
Resumo: Este trabalho apresenta um estudo sobre a classificação de conjuntos de dados textuais utilizando algoritmos de aprendizagem de máquina através da plataforma WEKA. Apresenta-se uma visão geral sobre a interpretação da linguagem nos textos, as características e etapas da classificação e formas de avaliação dos resultados e desempenho dos algoritmos. Através de testes exemplifica-se todo o processo de classificação de textos e pela análise dos resultados procuram-se possíveis afinidades entre diversos algoritmos através da aplicação da técnica em bases de dados com características diversas.
id UTFPR-12_89d3bca4a106d7b3385f215a49f9530f
oai_identifier_str oai:repositorio.utfpr.edu.br:1/16799
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-19T21:05:44Z2020-11-19T21:05:44Z2016-06-03KULTZAK, Adriano Francisco. Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA. 2016. 74 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Parana, Ponta Grossa, 2016.http://repositorio.utfpr.edu.br/jspui/handle/1/16799Este trabalho apresenta um estudo sobre a classificação de conjuntos de dados textuais utilizando algoritmos de aprendizagem de máquina através da plataforma WEKA. Apresenta-se uma visão geral sobre a interpretação da linguagem nos textos, as características e etapas da classificação e formas de avaliação dos resultados e desempenho dos algoritmos. Através de testes exemplifica-se todo o processo de classificação de textos e pela análise dos resultados procuram-se possíveis afinidades entre diversos algoritmos através da aplicação da técnica em bases de dados com características diversas.This paper presents a study on the classification of textual data sets using machine learning algorithms through the WEKA platform. It presents an overview of the interpretation of language in texts, characteristics and stages of the classification rating and forms of results evaluation and performance of the algorithms. Through testing it exemplifies up the process of classification of texts and analyzing the results looking for affinities between various possible algorithms by the technique of application databases with different characteristics.porUniversidade Tecnológica Federal do ParanáPonta GrossaTecnologia em Análise e Desenvolvimento de SistemasUTFPRBrasilDepartamento Acadêmico de InformáticaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOMineração de dados (Computação)AlgorítmosProcessamento de textos (Computação)Data miningAlgorithmsText processing (Computer science)Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKAinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPonta GrossaFidelis, Marcos ViniciusFidelis, Marcos ViniciusBorges, Helyane BronoskiRanthum, GeraldoKultzak, Adriano Franciscoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRLICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/1/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD51TEXTPG_COADS_2016_1_04.pdf.txtExtracted texttext/plain112793http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/2/PG_COADS_2016_1_04.pdf.txt4aa4fe719c5079b19ab8ff15ebc852d1MD52THUMBNAILPG_COADS_2016_1_04.pdf.jpgGenerated Thumbnailimage/jpeg1378http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/3/PG_COADS_2016_1_04.pdf.jpg34e5f8a2a3e029c672263ee58e0b445cMD53ORIGINALPG_COADS_2016_1_04.pdfapplication/pdf2680400http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/4/PG_COADS_2016_1_04.pdfa29e8e4c1771e17a65876a0f7388ca11MD541/167992020-11-19 19:05:44.797oai:repositorio.utfpr.edu.br:1/16799TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-19T21:05:44Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
title Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
spellingShingle Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
Kultzak, Adriano Francisco
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Mineração de dados (Computação)
Algorítmos
Processamento de textos (Computação)
Data mining
Algorithms
Text processing (Computer science)
title_short Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
title_full Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
title_fullStr Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
title_full_unstemmed Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
title_sort Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA
author Kultzak, Adriano Francisco
author_facet Kultzak, Adriano Francisco
author_role author
dc.contributor.advisor1.fl_str_mv Fidelis, Marcos Vinicius
dc.contributor.referee1.fl_str_mv Fidelis, Marcos Vinicius
dc.contributor.referee2.fl_str_mv Borges, Helyane Bronoski
dc.contributor.referee3.fl_str_mv Ranthum, Geraldo
dc.contributor.author.fl_str_mv Kultzak, Adriano Francisco
contributor_str_mv Fidelis, Marcos Vinicius
Fidelis, Marcos Vinicius
Borges, Helyane Bronoski
Ranthum, Geraldo
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Mineração de dados (Computação)
Algorítmos
Processamento de textos (Computação)
Data mining
Algorithms
Text processing (Computer science)
dc.subject.por.fl_str_mv Mineração de dados (Computação)
Algorítmos
Processamento de textos (Computação)
Data mining
Algorithms
Text processing (Computer science)
description Este trabalho apresenta um estudo sobre a classificação de conjuntos de dados textuais utilizando algoritmos de aprendizagem de máquina através da plataforma WEKA. Apresenta-se uma visão geral sobre a interpretação da linguagem nos textos, as características e etapas da classificação e formas de avaliação dos resultados e desempenho dos algoritmos. Através de testes exemplifica-se todo o processo de classificação de textos e pela análise dos resultados procuram-se possíveis afinidades entre diversos algoritmos através da aplicação da técnica em bases de dados com características diversas.
publishDate 2016
dc.date.issued.fl_str_mv 2016-06-03
dc.date.accessioned.fl_str_mv 2020-11-19T21:05:44Z
dc.date.available.fl_str_mv 2020-11-19T21:05:44Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv KULTZAK, Adriano Francisco. Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA. 2016. 74 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Parana, Ponta Grossa, 2016.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/16799
identifier_str_mv KULTZAK, Adriano Francisco. Categorização de textos utilizando algoritmos de aprendizagem de máquina com WEKA. 2016. 74 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Parana, Ponta Grossa, 2016.
url http://repositorio.utfpr.edu.br/jspui/handle/1/16799
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
dc.publisher.program.fl_str_mv Tecnologia em Análise e Desenvolvimento de Sistemas
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Informática
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/1/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/2/PG_COADS_2016_1_04.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/3/PG_COADS_2016_1_04.pdf.jpg
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16799/4/PG_COADS_2016_1_04.pdf
bitstream.checksum.fl_str_mv b9d82215ab23456fa2d8b49c5df1b95b
4aa4fe719c5079b19ab8ff15ebc852d1
34e5f8a2a3e029c672263ee58e0b445c
a29e8e4c1771e17a65876a0f7388ca11
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923195069399040