Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/14459 |
Resumo: | One of the main technology tools currently used to exchange information is the email service. However, managing the high volume of information received is one of the major challenges encountered in using this service in public and private institutions. Automated text classification has been considered an essential method to handle a high of textual information that people have to deal with on a daily basis. Problem solving by electronic and automatic means is increasingly common due to the reduction of manual work and costs. With that in mind, companies that receive support requests via email have been trying to reduce service time by using machine learning algorithms to sort texts sent via email. This study aims to identify the ability of machine learning algorithms to correctly determine categories, using a previously labeled database. The results were calculated as means and standard deviations of the most used metrics in machine learning, as well as the execution time of the four algorithms used. The results showed themselves to be satisfactory and well functional. |
id |
SCAR_d4204c2700047e0cd63a9a5286a806a4 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/14459 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Silva, Bruno FerreiraLevada, Alexandre Luís Magalhãeshttp://lattes.cnpq.br/3341441596395463http://lattes.cnpq.br/04103891876048927ffe33ac-f3f8-416e-92f2-8cb15890517d2021-06-29T16:22:16Z2021-06-29T16:22:16Z2021-06-20SILVA, Bruno Ferreira. UTILIZAÇÃO DE APRENDIZAGEM DE MÁQUINA PARA CLASSIFICAÇÃO DE E-MAILS EM CATEGORIAS RELEVANTES. 2021. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14459.https://repositorio.ufscar.br/handle/ufscar/14459One of the main technology tools currently used to exchange information is the email service. However, managing the high volume of information received is one of the major challenges encountered in using this service in public and private institutions. Automated text classification has been considered an essential method to handle a high of textual information that people have to deal with on a daily basis. Problem solving by electronic and automatic means is increasingly common due to the reduction of manual work and costs. With that in mind, companies that receive support requests via email have been trying to reduce service time by using machine learning algorithms to sort texts sent via email. This study aims to identify the ability of machine learning algorithms to correctly determine categories, using a previously labeled database. The results were calculated as means and standard deviations of the most used metrics in machine learning, as well as the execution time of the four algorithms used. The results showed themselves to be satisfactory and well functional.Uma das principais ferramentas de tecnologia utilizadas atualmente para a troca de informações é o serviço de e-mail. Entretanto, o gerenciamento do alto volume de informações recebidas é um dos grandes desafios encontrados na utilização desse serviço nas instituições públicas e privadas. A classificação automatizada de textos tem sido considerada um método essencial para atender um alto volume de informações textuais que temos que lidar diariamente. É cada vez mais comum a resolução de problemas por meios eletrônicos e automáticos devido à diminuição de trabalho manual e custos. Pensando nisso, empresas que recebem solicitações de suporte por e-mail tentam reduzir o tempo de atendimento utilizando algoritmos de aprendizado de máquina para a classificação de textos enviados por e-mail. Este estudo tem como objetivo identificar a capacidade dos algoritmos de aprendizado de máquina em determinar corretamente as categorias, utilizando uma base de e-mails previamente rotulada. Para os resultados foram calculadas as médias e desvios padrão das métricas mais utilizadas em aprendizagem de máquina, assim como o tempo de execução dos quatro algoritmos utilizados. Os resultados se mostraram satisfatórios e funcionais.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosCiência da Computação - CCUFSCarCC0 1.0 Universalhttp://creativecommons.org/publicdomain/zero/1.0/info:eu-repo/semantics/openAccessaprendizado de máquinareconhecimento de padrõesbag of wordsclassificação supervisionadaCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOUtilização de aprendizagem de máquina para classificação de e-mails em categorias relevantesMachine Learning algorithms for email subject classificationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis600600fec0c75b-1b4b-43d8-bc3e-1e011fe2653areponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8701https://repositorio.ufscar.br/bitstream/ufscar/14459/2/license_rdf42fd4ad1e89814f5e4a476b409eb708cMD52ORIGINALBrunoSilva_TCC_MLemails (22).pdfBrunoSilva_TCC_MLemails (22).pdfapplication/pdf5810187https://repositorio.ufscar.br/bitstream/ufscar/14459/1/BrunoSilva_TCC_MLemails%20%2822%29.pdfb5755d467eb51ce3a7b82a4900294af1MD51TEXTBrunoSilva_TCC_MLemails (22).pdf.txtBrunoSilva_TCC_MLemails (22).pdf.txtExtracted texttext/plain109542https://repositorio.ufscar.br/bitstream/ufscar/14459/3/BrunoSilva_TCC_MLemails%20%2822%29.pdf.txt963e69e3f112400078cee40730e28660MD53THUMBNAILBrunoSilva_TCC_MLemails (22).pdf.jpgBrunoSilva_TCC_MLemails (22).pdf.jpgIM Thumbnailimage/jpeg6537https://repositorio.ufscar.br/bitstream/ufscar/14459/4/BrunoSilva_TCC_MLemails%20%2822%29.pdf.jpgc097ce478bb66268ed973d0a5a71facaMD54ufscar/144592023-09-18 18:32:12.649oai:repositorio.ufscar.br:ufscar/14459Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:12Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes |
dc.title.alternative.por.fl_str_mv |
Machine Learning algorithms for email subject classification |
title |
Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes |
spellingShingle |
Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes Silva, Bruno Ferreira aprendizado de máquina reconhecimento de padrões bag of words classificação supervisionada CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
title_short |
Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes |
title_full |
Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes |
title_fullStr |
Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes |
title_full_unstemmed |
Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes |
title_sort |
Utilização de aprendizagem de máquina para classificação de e-mails em categorias relevantes |
author |
Silva, Bruno Ferreira |
author_facet |
Silva, Bruno Ferreira |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/0410389187604892 |
dc.contributor.author.fl_str_mv |
Silva, Bruno Ferreira |
dc.contributor.advisor1.fl_str_mv |
Levada, Alexandre Luís Magalhães |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3341441596395463 |
dc.contributor.authorID.fl_str_mv |
7ffe33ac-f3f8-416e-92f2-8cb15890517d |
contributor_str_mv |
Levada, Alexandre Luís Magalhães |
dc.subject.por.fl_str_mv |
aprendizado de máquina reconhecimento de padrões bag of words classificação supervisionada |
topic |
aprendizado de máquina reconhecimento de padrões bag of words classificação supervisionada CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
description |
One of the main technology tools currently used to exchange information is the email service. However, managing the high volume of information received is one of the major challenges encountered in using this service in public and private institutions. Automated text classification has been considered an essential method to handle a high of textual information that people have to deal with on a daily basis. Problem solving by electronic and automatic means is increasingly common due to the reduction of manual work and costs. With that in mind, companies that receive support requests via email have been trying to reduce service time by using machine learning algorithms to sort texts sent via email. This study aims to identify the ability of machine learning algorithms to correctly determine categories, using a previously labeled database. The results were calculated as means and standard deviations of the most used metrics in machine learning, as well as the execution time of the four algorithms used. The results showed themselves to be satisfactory and well functional. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-06-29T16:22:16Z |
dc.date.available.fl_str_mv |
2021-06-29T16:22:16Z |
dc.date.issued.fl_str_mv |
2021-06-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Bruno Ferreira. UTILIZAÇÃO DE APRENDIZAGEM DE MÁQUINA PARA CLASSIFICAÇÃO DE E-MAILS EM CATEGORIAS RELEVANTES. 2021. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14459. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/14459 |
identifier_str_mv |
SILVA, Bruno Ferreira. UTILIZAÇÃO DE APRENDIZAGEM DE MÁQUINA PARA CLASSIFICAÇÃO DE E-MAILS EM CATEGORIAS RELEVANTES. 2021. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14459. |
url |
https://repositorio.ufscar.br/handle/ufscar/14459 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
fec0c75b-1b4b-43d8-bc3e-1e011fe2653a |
dc.rights.driver.fl_str_mv |
CC0 1.0 Universal http://creativecommons.org/publicdomain/zero/1.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC0 1.0 Universal http://creativecommons.org/publicdomain/zero/1.0/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos Ciência da Computação - CC |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos Ciência da Computação - CC |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/14459/2/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/14459/1/BrunoSilva_TCC_MLemails%20%2822%29.pdf https://repositorio.ufscar.br/bitstream/ufscar/14459/3/BrunoSilva_TCC_MLemails%20%2822%29.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/14459/4/BrunoSilva_TCC_MLemails%20%2822%29.pdf.jpg |
bitstream.checksum.fl_str_mv |
42fd4ad1e89814f5e4a476b409eb708c b5755d467eb51ce3a7b82a4900294af1 963e69e3f112400078cee40730e28660 c097ce478bb66268ed973d0a5a71faca |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136391918813184 |