Desenvolvimento de um sistema Anti-Spam de Código Aberto

Detalhes bibliográficos
Autor(a) principal: FERREIRA, Isaac Caldas
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNIFEI (RIUNIFEI)
Texto Completo: https://repositorio.unifei.edu.br/jspui/handle/123456789/3802
Resumo: Neste trabalho, apresentamos o desenvolvimento de um Sistema Anti-Spam de Código Aberto (SASCA), em Java. Ao contrário de sistemas anti-spam comerciais, o SASCA não faz uso de listas de bloqueio (negras/brancas) e sim de modelos de machine learning para classificação de e-mails. Foram realizados diversos experimentos sobre uma base de e-mails reais, coletados na Universidade Federal de Itajubá Nos experimentos realizados, observou-se que o SASCA obteve desempenho bem próximo ao do sistema anti-spam comercial CanIt, em termos de classificação de e-mails, mas com desempenho bem melhor, em termos de tempo requerido para classificação.
id UFEI_2346848564e3d725781b0dc09ac8fb92
oai_identifier_str oai:repositorio.unifei.edu.br:123456789/3802
network_acronym_str UFEI
network_name_str Repositório Institucional da UNIFEI (RIUNIFEI)
repository_id_str 7044
spelling 2018-06-152023-06-272023-06-27T19:24:36Z2023-06-27T19:24:36Zhttps://repositorio.unifei.edu.br/jspui/handle/123456789/3802Neste trabalho, apresentamos o desenvolvimento de um Sistema Anti-Spam de Código Aberto (SASCA), em Java. Ao contrário de sistemas anti-spam comerciais, o SASCA não faz uso de listas de bloqueio (negras/brancas) e sim de modelos de machine learning para classificação de e-mails. Foram realizados diversos experimentos sobre uma base de e-mails reais, coletados na Universidade Federal de Itajubá Nos experimentos realizados, observou-se que o SASCA obteve desempenho bem próximo ao do sistema anti-spam comercial CanIt, em termos de classificação de e-mails, mas com desempenho bem melhor, em termos de tempo requerido para classificação.In this work, we present the development of an Open Source Anti-Spam System (SASCA) in Java. Unlike commercial anti-spam systems, SASCA does not make use of block lists (black / white), but rather of m machine learning models for email classification. Several experiments were carried out on a basis of real e-mails collected at the Federal University of Itajubá. In the experiments carried out, it was observed that the SASCA performed very close to the CanIt commercial anti-spam system in terms of e-mail classification, but with a much better performance in terms of the time required for classification.porUniversidade Federal de ItajubáPrograma de Pós-Graduação: Mestrado - Ciência e Tecnologia da ComputaçãoUNIFEIBrasilIESTI - Instituto de Engenharia de Sistemas e Tecnologia da InformaçãoCNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃOe-mailSpamAnti-spamModelos de machine learningParserCrawlerDesenvolvimento de um sistema Anti-Spam de Código Abertoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCARPINTEIRO, Otávio Augusto Salgadohttp://lattes.cnpq.br/9549706714935542MOREIRA, Edmilson Marmo Moreirahttp://lattes.cnpq.br/3910450557582884http://lattes.cnpq.br/4719959810078299FERREIRA, Isaac CaldasFERREIRA, Isaac Caldas. Desenvolvimento de um sistema Anti-Spam de Código Aberto. 2018. 134 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itajubá, 2018.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFEI (RIUNIFEI)instname:Universidade Federal de Itajubá (UNIFEI)instacron:UNIFEILICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unifei.edu.br/jspui/bitstream/123456789/3802/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALDissertação_2018087.pdfDissertação_2018087.pdfapplication/pdf2015771https://repositorio.unifei.edu.br/jspui/bitstream/123456789/3802/1/Disserta%c3%a7%c3%a3o_2018087.pdf0bcaac05807e4c340090be64b14a0b3fMD51123456789/38022023-06-27 16:24:36.91oai:repositorio.unifei.edu.br:123456789/3802Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.unifei.edu.br/oai/requestrepositorio@unifei.edu.br || geraldocarlos@unifei.edu.bropendoar:70442023-06-27T19:24:36Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de um sistema Anti-Spam de Código Aberto
title Desenvolvimento de um sistema Anti-Spam de Código Aberto
spellingShingle Desenvolvimento de um sistema Anti-Spam de Código Aberto
FERREIRA, Isaac Caldas
CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
e-mail
Spam
Anti-spam
Modelos de machine learning
Parser
Crawler
title_short Desenvolvimento de um sistema Anti-Spam de Código Aberto
title_full Desenvolvimento de um sistema Anti-Spam de Código Aberto
title_fullStr Desenvolvimento de um sistema Anti-Spam de Código Aberto
title_full_unstemmed Desenvolvimento de um sistema Anti-Spam de Código Aberto
title_sort Desenvolvimento de um sistema Anti-Spam de Código Aberto
author FERREIRA, Isaac Caldas
author_facet FERREIRA, Isaac Caldas
author_role author
dc.contributor.advisor1.fl_str_mv CARPINTEIRO, Otávio Augusto Salgado
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9549706714935542
dc.contributor.advisor-co1.fl_str_mv MOREIRA, Edmilson Marmo Moreira
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/3910450557582884
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4719959810078299
dc.contributor.author.fl_str_mv FERREIRA, Isaac Caldas
contributor_str_mv CARPINTEIRO, Otávio Augusto Salgado
MOREIRA, Edmilson Marmo Moreira
dc.subject.cnpq.fl_str_mv CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
topic CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
e-mail
Spam
Anti-spam
Modelos de machine learning
Parser
Crawler
dc.subject.por.fl_str_mv e-mail
Spam
Anti-spam
Modelos de machine learning
Parser
Crawler
description Neste trabalho, apresentamos o desenvolvimento de um Sistema Anti-Spam de Código Aberto (SASCA), em Java. Ao contrário de sistemas anti-spam comerciais, o SASCA não faz uso de listas de bloqueio (negras/brancas) e sim de modelos de machine learning para classificação de e-mails. Foram realizados diversos experimentos sobre uma base de e-mails reais, coletados na Universidade Federal de Itajubá Nos experimentos realizados, observou-se que o SASCA obteve desempenho bem próximo ao do sistema anti-spam comercial CanIt, em termos de classificação de e-mails, mas com desempenho bem melhor, em termos de tempo requerido para classificação.
publishDate 2018
dc.date.issued.fl_str_mv 2018-06-15
dc.date.available.fl_str_mv 2023-06-27
2023-06-27T19:24:36Z
dc.date.accessioned.fl_str_mv 2023-06-27T19:24:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.unifei.edu.br/jspui/handle/123456789/3802
url https://repositorio.unifei.edu.br/jspui/handle/123456789/3802
dc.language.iso.fl_str_mv por
language por
dc.relation.references.pt_BR.fl_str_mv FERREIRA, Isaac Caldas. Desenvolvimento de um sistema Anti-Spam de Código Aberto. 2018. 134 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itajubá, 2018.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Itajubá
dc.publisher.program.fl_str_mv Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
dc.publisher.initials.fl_str_mv UNIFEI
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
publisher.none.fl_str_mv Universidade Federal de Itajubá
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFEI (RIUNIFEI)
instname:Universidade Federal de Itajubá (UNIFEI)
instacron:UNIFEI
instname_str Universidade Federal de Itajubá (UNIFEI)
instacron_str UNIFEI
institution UNIFEI
reponame_str Repositório Institucional da UNIFEI (RIUNIFEI)
collection Repositório Institucional da UNIFEI (RIUNIFEI)
bitstream.url.fl_str_mv https://repositorio.unifei.edu.br/jspui/bitstream/123456789/3802/2/license.txt
https://repositorio.unifei.edu.br/jspui/bitstream/123456789/3802/1/Disserta%c3%a7%c3%a3o_2018087.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
0bcaac05807e4c340090be64b14a0b3f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)
repository.mail.fl_str_mv repositorio@unifei.edu.br || geraldocarlos@unifei.edu.br
_version_ 1801863222732521472