Detecção de spam em mensagens SMS utilizando aprendizagem de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/12504 |
Resumo: | O SMS (Short Message Service) é ainda um dos serviços de comunicação móvel mais simples e práticos para alcançar consumidores, sendo independente da conexão com uma rede de Internet ou da capacidade dos aparelhos. Algumas aplicações fornecem recursos para o envio das mensagens SMS, mas por estarem presentes na Internet, há espaço para que usuários maliciosos as utilizem para realizar envios de spam. No âmbito da Inteligência Artificial, áreas como a Aprendizagem de Máquina e o estudo de línguas podem se mostrar grandes aliados no desenvolvimento de sistemas que auxiliem a filtragem de mensagens spam. Neste trabalho, apresenta-se como foram alcançadas melhorias no desempenho do algoritmo de classificação Bayesiano Ingênuo, utilizando-o para classificar mensagens SMS apoiado por Redes Neurais Artificiais e vetores Word Embedding, utilizados para prever e generalizar probabilidades para palavras que não foram utilizadas no treinamento do classificador. |
id |
UTFPR-12_421281513fa10d892b371f71a9d6c506 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/12504 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-16T13:09:19Z2020-11-16T13:09:19Z2018-11-19TIBOLA, Rafael Henrique. Detecção de spam em mensagens SMS utilizando aprendizagem de máquina. 2018. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Medianeira, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/12504O SMS (Short Message Service) é ainda um dos serviços de comunicação móvel mais simples e práticos para alcançar consumidores, sendo independente da conexão com uma rede de Internet ou da capacidade dos aparelhos. Algumas aplicações fornecem recursos para o envio das mensagens SMS, mas por estarem presentes na Internet, há espaço para que usuários maliciosos as utilizem para realizar envios de spam. No âmbito da Inteligência Artificial, áreas como a Aprendizagem de Máquina e o estudo de línguas podem se mostrar grandes aliados no desenvolvimento de sistemas que auxiliem a filtragem de mensagens spam. Neste trabalho, apresenta-se como foram alcançadas melhorias no desempenho do algoritmo de classificação Bayesiano Ingênuo, utilizando-o para classificar mensagens SMS apoiado por Redes Neurais Artificiais e vetores Word Embedding, utilizados para prever e generalizar probabilidades para palavras que não foram utilizadas no treinamento do classificador.SMS (Short Message Service) is still one of the simplest and most practical mobile communication services to reach consumers, regardless of the connection to an Internet network or the capacity of the handsets. Some applications provide resources for sending SMS messages, but because they are present on the Internet, there is room for malicious users to use them to send spam. In the field of Artificial Intelligence, areas such as Machine Learning and language studies may prove to be great allies in the development of systems that aid in the filtering of spam messages. In this study, it is shown how improvements in the performance of the Bayesian Naive classification algorithm were reached, using it to classify SMS messages supported by Artificial Neural Networks and Word Embedding vectors, used to predict and generalize probabilities for words that were not used in the training of the classifier.porUniversidade Tecnológica Federal do ParanáMedianeiraCiência da ComputaçãoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSpam (Mensagens eletrônicas)Redes neurais (Computação)Inteligência artificialSpam (Electronic mail)Neural networks (Computer science)Artificial intelligenceDetecção de spam em mensagens SMS utilizando aprendizagem de máquinaSpam detection in sms messages using machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisMedianeiraCandido Junior, ArnaldoCandido Junior, ArnaldoGavioli, AlanPessini, Evando CarlosTibola, Rafael Henriqueinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALdeteccaospamaprendizagemmaquina.pdfapplication/pdf1715197http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/1/deteccaospamaprendizagemmaquina.pdfbb35d12ebae1aa69e4abfd235f5d7a89MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTdeteccaospamaprendizagemmaquina.pdf.txtExtracted texttext/plain103066http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/3/deteccaospamaprendizagemmaquina.pdf.txtc830863c706300a830b6a5ed019bb6b6MD53THUMBNAILdeteccaospamaprendizagemmaquina.pdf.jpgGenerated Thumbnailimage/jpeg1231http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/4/deteccaospamaprendizagemmaquina.pdf.jpgb5dc5ebc04ec56d93a5b5148c4529f79MD541/125042020-11-16 11:09:19.452oai:repositorio.utfpr.edu.br:1/12504TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-16T13:09:19Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Detecção de spam em mensagens SMS utilizando aprendizagem de máquina |
dc.title.alternative.pt_BR.fl_str_mv |
Spam detection in sms messages using machine learning |
title |
Detecção de spam em mensagens SMS utilizando aprendizagem de máquina |
spellingShingle |
Detecção de spam em mensagens SMS utilizando aprendizagem de máquina Tibola, Rafael Henrique CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Spam (Mensagens eletrônicas) Redes neurais (Computação) Inteligência artificial Spam (Electronic mail) Neural networks (Computer science) Artificial intelligence |
title_short |
Detecção de spam em mensagens SMS utilizando aprendizagem de máquina |
title_full |
Detecção de spam em mensagens SMS utilizando aprendizagem de máquina |
title_fullStr |
Detecção de spam em mensagens SMS utilizando aprendizagem de máquina |
title_full_unstemmed |
Detecção de spam em mensagens SMS utilizando aprendizagem de máquina |
title_sort |
Detecção de spam em mensagens SMS utilizando aprendizagem de máquina |
author |
Tibola, Rafael Henrique |
author_facet |
Tibola, Rafael Henrique |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Candido Junior, Arnaldo |
dc.contributor.referee1.fl_str_mv |
Candido Junior, Arnaldo |
dc.contributor.referee2.fl_str_mv |
Gavioli, Alan |
dc.contributor.referee3.fl_str_mv |
Pessini, Evando Carlos |
dc.contributor.author.fl_str_mv |
Tibola, Rafael Henrique |
contributor_str_mv |
Candido Junior, Arnaldo Candido Junior, Arnaldo Gavioli, Alan Pessini, Evando Carlos |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Spam (Mensagens eletrônicas) Redes neurais (Computação) Inteligência artificial Spam (Electronic mail) Neural networks (Computer science) Artificial intelligence |
dc.subject.por.fl_str_mv |
Spam (Mensagens eletrônicas) Redes neurais (Computação) Inteligência artificial Spam (Electronic mail) Neural networks (Computer science) Artificial intelligence |
description |
O SMS (Short Message Service) é ainda um dos serviços de comunicação móvel mais simples e práticos para alcançar consumidores, sendo independente da conexão com uma rede de Internet ou da capacidade dos aparelhos. Algumas aplicações fornecem recursos para o envio das mensagens SMS, mas por estarem presentes na Internet, há espaço para que usuários maliciosos as utilizem para realizar envios de spam. No âmbito da Inteligência Artificial, áreas como a Aprendizagem de Máquina e o estudo de línguas podem se mostrar grandes aliados no desenvolvimento de sistemas que auxiliem a filtragem de mensagens spam. Neste trabalho, apresenta-se como foram alcançadas melhorias no desempenho do algoritmo de classificação Bayesiano Ingênuo, utilizando-o para classificar mensagens SMS apoiado por Redes Neurais Artificiais e vetores Word Embedding, utilizados para prever e generalizar probabilidades para palavras que não foram utilizadas no treinamento do classificador. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-11-19 |
dc.date.accessioned.fl_str_mv |
2020-11-16T13:09:19Z |
dc.date.available.fl_str_mv |
2020-11-16T13:09:19Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
TIBOLA, Rafael Henrique. Detecção de spam em mensagens SMS utilizando aprendizagem de máquina. 2018. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Medianeira, 2018. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/12504 |
identifier_str_mv |
TIBOLA, Rafael Henrique. Detecção de spam em mensagens SMS utilizando aprendizagem de máquina. 2018. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Medianeira, 2018. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/12504 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Medianeira |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Medianeira |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/1/deteccaospamaprendizagemmaquina.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/3/deteccaospamaprendizagemmaquina.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/12504/4/deteccaospamaprendizagemmaquina.pdf.jpg |
bitstream.checksum.fl_str_mv |
bb35d12ebae1aa69e4abfd235f5d7a89 b9d82215ab23456fa2d8b49c5df1b95b c830863c706300a830b6a5ed019bb6b6 b5dc5ebc04ec56d93a5b5148c4529f79 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1797044002685452288 |