Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes

Detalhes bibliográficos
Autor(a) principal: Silva, Bruno Ferreira
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/14459
Resumo: One of the main technology tools currently used to exchange information is the email service. However, managing the high volume of information received is one of the major challenges encountered in using this service in public and private institutions. Automated text classification has been considered an essential method to handle a high of textual information that people have to deal with on a daily basis. Problem solving by electronic and automatic means is increasingly common due to the reduction of manual work and costs. With that in mind, companies that receive support requests via email have been trying to reduce service time by using machine learning algorithms to sort texts sent via email. This study aims to identify the ability of machine learning algorithms to correctly determine categories, using a previously labeled database. The results were calculated as means and standard deviations of the most used metrics in machine learning, as well as the execution time of the four algorithms used. The results showed themselves to be satisfactory and well functional.
id SCAR_d4204c2700047e0cd63a9a5286a806a4
oai_identifier_str oai:repositorio.ufscar.br:ufscar/14459
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Silva, Bruno FerreiraLevada, Alexandre Luís Magalhãeshttp://lattes.cnpq.br/3341441596395463http://lattes.cnpq.br/04103891876048927ffe33ac-f3f8-416e-92f2-8cb15890517d2021-06-29T16:22:16Z2021-06-29T16:22:16Z2021-06-20SILVA, Bruno Ferreira. UTILIZAÇÃO DE APRENDIZAGEM DE MÁQUINA PARA CLASSIFICAÇÃO DE E-MAILS EM CATEGORIAS RELEVANTES. 2021. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14459.https://repositorio.ufscar.br/handle/ufscar/14459One of the main technology tools currently used to exchange information is the email service. However, managing the high volume of information received is one of the major challenges encountered in using this service in public and private institutions. Automated text classification has been considered an essential method to handle a high of textual information that people have to deal with on a daily basis. Problem solving by electronic and automatic means is increasingly common due to the reduction of manual work and costs. With that in mind, companies that receive support requests via email have been trying to reduce service time by using machine learning algorithms to sort texts sent via email. This study aims to identify the ability of machine learning algorithms to correctly determine categories, using a previously labeled database. The results were calculated as means and standard deviations of the most used metrics in machine learning, as well as the execution time of the four algorithms used. The results showed themselves to be satisfactory and well functional.Uma das principais ferramentas de tecnologia utilizadas atualmente para a troca de informações é o serviço de e-mail. Entretanto, o gerenciamento do alto volume de informações recebidas é um dos grandes desafios encontrados na utilização desse serviço nas instituições públicas e privadas. A classificação automatizada de textos tem sido considerada um método essencial para atender um alto volume de informações textuais que temos que lidar diariamente. É cada vez mais comum a resolução de problemas por meios eletrônicos e automáticos devido à diminuição de trabalho manual e custos. Pensando nisso, empresas que recebem solicitações de suporte por e-mail tentam reduzir o tempo de atendimento utilizando algoritmos de aprendizado de máquina para a classificação de textos enviados por e-mail. Este estudo tem como objetivo identificar a capacidade dos algoritmos de aprendizado de máquina em determinar corretamente as categorias, utilizando uma base de e-mails previamente rotulada. Para os resultados foram calculadas as médias e desvios padrão das métricas mais utilizadas em aprendizagem de máquina, assim como o tempo de execução dos quatro algoritmos utilizados. Os resultados se mostraram satisfatórios e funcionais.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosCiência da Computação - CCUFSCarCC0 1.0 Universalhttp://creativecommons.org/publicdomain/zero/1.0/info:eu-repo/semantics/openAccessaprendizado de máquinareconhecimento de padrõesbag of wordsclassificação supervisionadaCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOUtilização de aprendizagem de máquina para classificação de e-mails em categorias relevantesMachine Learning algorithms for email subject classificationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis600600fec0c75b-1b4b-43d8-bc3e-1e011fe2653areponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8701https://repositorio.ufscar.br/bitstream/ufscar/14459/2/license_rdf42fd4ad1e89814f5e4a476b409eb708cMD52ORIGINALBrunoSilva_TCC_MLemails (22).pdfBrunoSilva_TCC_MLemails (22).pdfapplication/pdf5810187https://repositorio.ufscar.br/bitstream/ufscar/14459/1/BrunoSilva_TCC_MLemails%20%2822%29.pdfb5755d467eb51ce3a7b82a4900294af1MD51TEXTBrunoSilva_TCC_MLemails (22).pdf.txtBrunoSilva_TCC_MLemails (22).pdf.txtExtracted texttext/plain109542https://repositorio.ufscar.br/bitstream/ufscar/14459/3/BrunoSilva_TCC_MLemails%20%2822%29.pdf.txt963e69e3f112400078cee40730e28660MD53THUMBNAILBrunoSilva_TCC_MLemails (22).pdf.jpgBrunoSilva_TCC_MLemails (22).pdf.jpgIM Thumbnailimage/jpeg6537https://repositorio.ufscar.br/bitstream/ufscar/14459/4/BrunoSilva_TCC_MLemails%20%2822%29.pdf.jpgc097ce478bb66268ed973d0a5a71facaMD54ufscar/144592023-09-18 18:32:12.649oai:repositorio.ufscar.br:ufscar/14459Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:12Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
dc.title.alternative.por.fl_str_mv Machine Learning algorithms for email subject classification
title Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
spellingShingle Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
Silva, Bruno Ferreira
aprendizado de máquina
reconhecimento de padrões
bag of words
classificação supervisionada
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
title_short Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
title_full Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
title_fullStr Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
title_full_unstemmed Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
title_sort Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
author Silva, Bruno Ferreira
author_facet Silva, Bruno Ferreira
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/0410389187604892
dc.contributor.author.fl_str_mv Silva, Bruno Ferreira
dc.contributor.advisor1.fl_str_mv Levada, Alexandre Luís Magalhães
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3341441596395463
dc.contributor.authorID.fl_str_mv 7ffe33ac-f3f8-416e-92f2-8cb15890517d
contributor_str_mv Levada, Alexandre Luís Magalhães
dc.subject.por.fl_str_mv aprendizado de máquina
reconhecimento de padrões
bag of words
classificação supervisionada
topic aprendizado de máquina
reconhecimento de padrões
bag of words
classificação supervisionada
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
description One of the main technology tools currently used to exchange information is the email service. However, managing the high volume of information received is one of the major challenges encountered in using this service in public and private institutions. Automated text classification has been considered an essential method to handle a high of textual information that people have to deal with on a daily basis. Problem solving by electronic and automatic means is increasingly common due to the reduction of manual work and costs. With that in mind, companies that receive support requests via email have been trying to reduce service time by using machine learning algorithms to sort texts sent via email. This study aims to identify the ability of machine learning algorithms to correctly determine categories, using a previously labeled database. The results were calculated as means and standard deviations of the most used metrics in machine learning, as well as the execution time of the four algorithms used. The results showed themselves to be satisfactory and well functional.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-06-29T16:22:16Z
dc.date.available.fl_str_mv 2021-06-29T16:22:16Z
dc.date.issued.fl_str_mv 2021-06-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Bruno Ferreira. UTILIZAÇÃO DE APRENDIZAGEM DE MÁQUINA PARA CLASSIFICAÇÃO DE E-MAILS EM CATEGORIAS RELEVANTES. 2021. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14459.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/14459
identifier_str_mv SILVA, Bruno Ferreira. UTILIZAÇÃO DE APRENDIZAGEM DE MÁQUINA PARA CLASSIFICAÇÃO DE E-MAILS EM CATEGORIAS RELEVANTES. 2021. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14459.
url https://repositorio.ufscar.br/handle/ufscar/14459
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv fec0c75b-1b4b-43d8-bc3e-1e011fe2653a
dc.rights.driver.fl_str_mv CC0 1.0 Universal
http://creativecommons.org/publicdomain/zero/1.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC0 1.0 Universal
http://creativecommons.org/publicdomain/zero/1.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
Ciência da Computação - CC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
Ciência da Computação - CC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/14459/2/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/14459/1/BrunoSilva_TCC_MLemails%20%2822%29.pdf
https://repositorio.ufscar.br/bitstream/ufscar/14459/3/BrunoSilva_TCC_MLemails%20%2822%29.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/14459/4/BrunoSilva_TCC_MLemails%20%2822%29.pdf.jpg
bitstream.checksum.fl_str_mv 42fd4ad1e89814f5e4a476b409eb708c
b5755d467eb51ce3a7b82a4900294af1
963e69e3f112400078cee40730e28660
c097ce478bb66268ed973d0a5a71faca
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136391918813184