Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária

Detalhes bibliográficos
Autor(a) principal: Vaz, Rui Fernando Martins
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/19599
Resumo: Dissertação de mestrado integrado em Engenharia de Comunicações
id RCAP_8f7d6c0a2cfbdae3e7848d943ff22a2f
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/19599
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionáriaSpamFiltragem baseada no conteúdoSeleção de atributosAprendizagem máquinaAlgoritmos evolucionáriosFiltragem colaborativaContent-based filteringFeature selectionMachine learningEvolutionary algorithmsCollaborative filtering681.324Dissertação de mestrado integrado em Engenharia de ComunicaçõesO serviço de correio eletrónico é atualmente um serviço de comunicação essencial, que assume uma crescente importância na sociedade atual. No entanto, apesar dos vários esforços concentrados contra o correio eletrónico (email) não solicitado, designado também por spam, este continua a ser ainda um problema inerente a este serviço. No quadro das soluções tecnológicas, os métodos de filtragem baseados no conteúdo das mensagens de email, que utilizam técnicas de data mining, são atualmente os mais populares e amplamente utilizados para combater este problema. No âmbito destes métodos, a seleção de atributos que melhor caraterizam as mensagens de spam (e.g., palavras mais correlacionadas com mensagens de spam), constitui um passo importante no desenvolvimento de filtros mais assertivos. Nesse sentido, é efetuado neste trabalho um estudo empírico da introdução de técnicas de computação evolucionária de seleção de atributos no contexto da filtragem anti-spam. De forma a avaliar o método proposto foram desenvolvidos diversos filtros anti- spam que implementam, usando estratégias diferentes, técnicas de computação evolucionária de seleção de atributos. Uma das estratégias desenvolvida segue uma abordagem colaborativa que permite a troca de atributos relevantes entre filtros locais. O desempenho dos filtros anti-spam que utilizam técnicas de computação evolucionária de seleção de atributos são analisados. Posteriormente o desempenho do filltro colaborativo e comparado com um filtro padrão que utiliza apenas um método de seleção de atributos baseado num critério de informação.Nowadays electronic mail (email) service assumes an increasing importance in modern society and is considered an essential communication service. However, despite the several efforts made against the unsolicited email (also known as spam), it remains an inherent problem which affects this service. Within the existing technological solutions, Content-Based Filtering (CBF) methods, that use data mining techniques, are currently the most popular approaches to solve this issue. Feature selection techniques are essential in CBF methods. These techniques allow the selection of a reduced set of relevant attributes (e.g., words correlated with spam messages) that provides essential information to enhance the accuracy of anti-spam filters. Hence, in this work we perform an empirical study concerning the introduction of evolutionary computation techniques for feature selection in the scope of anti-spam filtering. In order to evaluate the proposed method several anti-spam filters were developed. These filters implement, through different strategies, evolutionary computation techniques for feature selection. One of these strategies follows a collaborative approach which enables the exchange of relevant attributes between local filters. The performances of the developed filters that implement evolutionary computation techniques are evaluated. Afterwards, the performance of the collaborative filter is compared to a standard filter which uses a feature selection method based on an information criterion.Fundação para a Ciência e a Tecnologia (FCT) - Projecto de R&D PTDC/EIA/64541/2006 - "SPAM Telescope Miner: detecção a nível mundial de correio electrónico não solicitado via técnicas de data mining"Cortez, PauloSousa, PedroUniversidade do MinhoVaz, Rui Fernando Martins20122012-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/19599porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T11:58:36Zoai:repositorium.sdum.uminho.pt:1822/19599Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:48:21.418241Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
title Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
spellingShingle Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
Vaz, Rui Fernando Martins
Spam
Filtragem baseada no conteúdo
Seleção de atributos
Aprendizagem máquina
Algoritmos evolucionários
Filtragem colaborativa
Content-based filtering
Feature selection
Machine learning
Evolutionary algorithms
Collaborative filtering
681.324
title_short Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
title_full Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
title_fullStr Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
title_full_unstemmed Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
title_sort Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
author Vaz, Rui Fernando Martins
author_facet Vaz, Rui Fernando Martins
author_role author
dc.contributor.none.fl_str_mv Cortez, Paulo
Sousa, Pedro
Universidade do Minho
dc.contributor.author.fl_str_mv Vaz, Rui Fernando Martins
dc.subject.por.fl_str_mv Spam
Filtragem baseada no conteúdo
Seleção de atributos
Aprendizagem máquina
Algoritmos evolucionários
Filtragem colaborativa
Content-based filtering
Feature selection
Machine learning
Evolutionary algorithms
Collaborative filtering
681.324
topic Spam
Filtragem baseada no conteúdo
Seleção de atributos
Aprendizagem máquina
Algoritmos evolucionários
Filtragem colaborativa
Content-based filtering
Feature selection
Machine learning
Evolutionary algorithms
Collaborative filtering
681.324
description Dissertação de mestrado integrado em Engenharia de Comunicações
publishDate 2012
dc.date.none.fl_str_mv 2012
2012-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/19599
url http://hdl.handle.net/1822/19599
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132244244168704