Detecção de spam em mensagens SMS utilizando aprendizagem de máquina

Detalhes bibliográficos
Autor(a) principal: Tibola, Rafael Henrique
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/12504
Resumo: O SMS (Short Message Service) é ainda um dos serviços de comunicação móvel mais simples e práticos para alcançar consumidores, sendo independente da conexão com uma rede de Internet ou da capacidade dos aparelhos. Algumas aplicações fornecem recursos para o envio das mensagens SMS, mas por estarem presentes na Internet, há espaço para que usuários maliciosos as utilizem para realizar envios de spam. No âmbito da Inteligência Artificial, áreas como a Aprendizagem de Máquina e o estudo de línguas podem se mostrar grandes aliados no desenvolvimento de sistemas que auxiliem a filtragem de mensagens spam. Neste trabalho, apresenta-se como foram alcançadas melhorias no desempenho do algoritmo de classificação Bayesiano Ingênuo, utilizando-o para classificar mensagens SMS apoiado por Redes Neurais Artificiais e vetores Word Embedding, utilizados para prever e generalizar probabilidades para palavras que não foram utilizadas no treinamento do classificador.
id UTFPR-12_421281513fa10d892b371f71a9d6c506
oai_identifier_str oai:repositorio.utfpr.edu.br:1/12504
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-16T13:09:19Z2020-11-16T13:09:19Z2018-11-19TIBOLA, Rafael Henrique. Detecção de spam em mensagens SMS utilizando aprendizagem de máquina. 2018. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Medianeira, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/12504O SMS (Short Message Service) é ainda um dos serviços de comunicação móvel mais simples e práticos para alcançar consumidores, sendo independente da conexão com uma rede de Internet ou da capacidade dos aparelhos. Algumas aplicações fornecem recursos para o envio das mensagens SMS, mas por estarem presentes na Internet, há espaço para que usuários maliciosos as utilizem para realizar envios de spam. No âmbito da Inteligência Artificial, áreas como a Aprendizagem de Máquina e o estudo de línguas podem se mostrar grandes aliados no desenvolvimento de sistemas que auxiliem a filtragem de mensagens spam. Neste trabalho, apresenta-se como foram alcançadas melhorias no desempenho do algoritmo de classificação Bayesiano Ingênuo, utilizando-o para classificar mensagens SMS apoiado por Redes Neurais Artificiais e vetores Word Embedding, utilizados para prever e generalizar probabilidades para palavras que não foram utilizadas no treinamento do classificador.SMS (Short Message Service) is still one of the simplest and most practical mobile communication services to reach consumers, regardless of the connection to an Internet network or the capacity of the handsets. Some applications provide resources for sending SMS messages, but because they are present on the Internet, there is room for malicious users to use them to send spam. In the field of Artificial Intelligence, areas such as Machine Learning and language studies may prove to be great allies in the development of systems that aid in the filtering of spam messages. In this study, it is shown how improvements in the performance of the Bayesian Naive classification algorithm were reached, using it to classify SMS messages supported by Artificial Neural Networks and Word Embedding vectors, used to predict and generalize probabilities for words that were not used in the training of the classifier.porUniversidade Tecnológica Federal do ParanáMedianeiraCiência da ComputaçãoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSpam (Mensagens eletrônicas)Redes neurais (Computação)Inteligência artificialSpam (Electronic mail)Neural networks (Computer science)Artificial intelligenceDetecção de spam em mensagens SMS utilizando aprendizagem de máquinaSpam detection in sms messages using machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisMedianeiraCandido Junior, ArnaldoCandido Junior, ArnaldoGavioli, AlanPessini, Evando CarlosTibola, Rafael Henriqueinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALdeteccaospamaprendizagemmaquina.pdfapplication/pdf1715197http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/1/deteccaospamaprendizagemmaquina.pdfbb35d12ebae1aa69e4abfd235f5d7a89MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTdeteccaospamaprendizagemmaquina.pdf.txtExtracted texttext/plain103066http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/3/deteccaospamaprendizagemmaquina.pdf.txtc830863c706300a830b6a5ed019bb6b6MD53THUMBNAILdeteccaospamaprendizagemmaquina.pdf.jpgGenerated Thumbnailimage/jpeg1231http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/4/deteccaospamaprendizagemmaquina.pdf.jpgb5dc5ebc04ec56d93a5b5148c4529f79MD541/125042020-11-16 11:09:19.452oai:repositorio.utfpr.edu.br:1/12504TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-16T13:09:19Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
dc.title.alternative.pt_BR.fl_str_mv Spam detection in sms messages using machine learning
title Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
spellingShingle Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
Tibola, Rafael Henrique
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Spam (Mensagens eletrônicas)
Redes neurais (Computação)
Inteligência artificial
Spam (Electronic mail)
Neural networks (Computer science)
Artificial intelligence
title_short Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
title_full Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
title_fullStr Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
title_full_unstemmed Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
title_sort Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
author Tibola, Rafael Henrique
author_facet Tibola, Rafael Henrique
author_role author
dc.contributor.advisor1.fl_str_mv Candido Junior, Arnaldo
dc.contributor.referee1.fl_str_mv Candido Junior, Arnaldo
dc.contributor.referee2.fl_str_mv Gavioli, Alan
dc.contributor.referee3.fl_str_mv Pessini, Evando Carlos
dc.contributor.author.fl_str_mv Tibola, Rafael Henrique
contributor_str_mv Candido Junior, Arnaldo
Candido Junior, Arnaldo
Gavioli, Alan
Pessini, Evando Carlos
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Spam (Mensagens eletrônicas)
Redes neurais (Computação)
Inteligência artificial
Spam (Electronic mail)
Neural networks (Computer science)
Artificial intelligence
dc.subject.por.fl_str_mv Spam (Mensagens eletrônicas)
Redes neurais (Computação)
Inteligência artificial
Spam (Electronic mail)
Neural networks (Computer science)
Artificial intelligence
description O SMS (Short Message Service) é ainda um dos serviços de comunicação móvel mais simples e práticos para alcançar consumidores, sendo independente da conexão com uma rede de Internet ou da capacidade dos aparelhos. Algumas aplicações fornecem recursos para o envio das mensagens SMS, mas por estarem presentes na Internet, há espaço para que usuários maliciosos as utilizem para realizar envios de spam. No âmbito da Inteligência Artificial, áreas como a Aprendizagem de Máquina e o estudo de línguas podem se mostrar grandes aliados no desenvolvimento de sistemas que auxiliem a filtragem de mensagens spam. Neste trabalho, apresenta-se como foram alcançadas melhorias no desempenho do algoritmo de classificação Bayesiano Ingênuo, utilizando-o para classificar mensagens SMS apoiado por Redes Neurais Artificiais e vetores Word Embedding, utilizados para prever e generalizar probabilidades para palavras que não foram utilizadas no treinamento do classificador.
publishDate 2018
dc.date.issued.fl_str_mv 2018-11-19
dc.date.accessioned.fl_str_mv 2020-11-16T13:09:19Z
dc.date.available.fl_str_mv 2020-11-16T13:09:19Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv TIBOLA, Rafael Henrique. Detecção de spam em mensagens SMS utilizando aprendizagem de máquina. 2018. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Medianeira, 2018.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/12504
identifier_str_mv TIBOLA, Rafael Henrique. Detecção de spam em mensagens SMS utilizando aprendizagem de máquina. 2018. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Medianeira, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/12504
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Medianeira
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Medianeira
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/1/deteccaospamaprendizagemmaquina.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/3/deteccaospamaprendizagemmaquina.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/4/deteccaospamaprendizagemmaquina.pdf.jpg
bitstream.checksum.fl_str_mv bb35d12ebae1aa69e4abfd235f5d7a89
b9d82215ab23456fa2d8b49c5df1b95b
c830863c706300a830b6a5ed019bb6b6
b5dc5ebc04ec56d93a5b5148c4529f79
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1797044002685452288