Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/19599 |
Resumo: | Dissertação de mestrado integrado em Engenharia de Comunicações |
id |
RCAP_8f7d6c0a2cfbdae3e7848d943ff22a2f |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/19599 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionáriaSpamFiltragem baseada no conteúdoSeleção de atributosAprendizagem máquinaAlgoritmos evolucionáriosFiltragem colaborativaContent-based filteringFeature selectionMachine learningEvolutionary algorithmsCollaborative filtering681.324Dissertação de mestrado integrado em Engenharia de ComunicaçõesO serviço de correio eletrónico é atualmente um serviço de comunicação essencial, que assume uma crescente importância na sociedade atual. No entanto, apesar dos vários esforços concentrados contra o correio eletrónico (email) não solicitado, designado também por spam, este continua a ser ainda um problema inerente a este serviço. No quadro das soluções tecnológicas, os métodos de filtragem baseados no conteúdo das mensagens de email, que utilizam técnicas de data mining, são atualmente os mais populares e amplamente utilizados para combater este problema. No âmbito destes métodos, a seleção de atributos que melhor caraterizam as mensagens de spam (e.g., palavras mais correlacionadas com mensagens de spam), constitui um passo importante no desenvolvimento de filtros mais assertivos. Nesse sentido, é efetuado neste trabalho um estudo empírico da introdução de técnicas de computação evolucionária de seleção de atributos no contexto da filtragem anti-spam. De forma a avaliar o método proposto foram desenvolvidos diversos filtros anti- spam que implementam, usando estratégias diferentes, técnicas de computação evolucionária de seleção de atributos. Uma das estratégias desenvolvida segue uma abordagem colaborativa que permite a troca de atributos relevantes entre filtros locais. O desempenho dos filtros anti-spam que utilizam técnicas de computação evolucionária de seleção de atributos são analisados. Posteriormente o desempenho do filltro colaborativo e comparado com um filtro padrão que utiliza apenas um método de seleção de atributos baseado num critério de informação.Nowadays electronic mail (email) service assumes an increasing importance in modern society and is considered an essential communication service. However, despite the several efforts made against the unsolicited email (also known as spam), it remains an inherent problem which affects this service. Within the existing technological solutions, Content-Based Filtering (CBF) methods, that use data mining techniques, are currently the most popular approaches to solve this issue. Feature selection techniques are essential in CBF methods. These techniques allow the selection of a reduced set of relevant attributes (e.g., words correlated with spam messages) that provides essential information to enhance the accuracy of anti-spam filters. Hence, in this work we perform an empirical study concerning the introduction of evolutionary computation techniques for feature selection in the scope of anti-spam filtering. In order to evaluate the proposed method several anti-spam filters were developed. These filters implement, through different strategies, evolutionary computation techniques for feature selection. One of these strategies follows a collaborative approach which enables the exchange of relevant attributes between local filters. The performances of the developed filters that implement evolutionary computation techniques are evaluated. Afterwards, the performance of the collaborative filter is compared to a standard filter which uses a feature selection method based on an information criterion.Fundação para a Ciência e a Tecnologia (FCT) - Projecto de R&D PTDC/EIA/64541/2006 - "SPAM Telescope Miner: detecção a nível mundial de correio electrónico não solicitado via técnicas de data mining"Cortez, PauloSousa, PedroUniversidade do MinhoVaz, Rui Fernando Martins20122012-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/19599porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T11:58:36Zoai:repositorium.sdum.uminho.pt:1822/19599Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:48:21.418241Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária |
title |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária |
spellingShingle |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária Vaz, Rui Fernando Martins Spam Filtragem baseada no conteúdo Seleção de atributos Aprendizagem máquina Algoritmos evolucionários Filtragem colaborativa Content-based filtering Feature selection Machine learning Evolutionary algorithms Collaborative filtering 681.324 |
title_short |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária |
title_full |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária |
title_fullStr |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária |
title_full_unstemmed |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária |
title_sort |
Estratégias de filtragem Anti-Spam baseadas em técnicas de computação evolucionária |
author |
Vaz, Rui Fernando Martins |
author_facet |
Vaz, Rui Fernando Martins |
author_role |
author |
dc.contributor.none.fl_str_mv |
Cortez, Paulo Sousa, Pedro Universidade do Minho |
dc.contributor.author.fl_str_mv |
Vaz, Rui Fernando Martins |
dc.subject.por.fl_str_mv |
Spam Filtragem baseada no conteúdo Seleção de atributos Aprendizagem máquina Algoritmos evolucionários Filtragem colaborativa Content-based filtering Feature selection Machine learning Evolutionary algorithms Collaborative filtering 681.324 |
topic |
Spam Filtragem baseada no conteúdo Seleção de atributos Aprendizagem máquina Algoritmos evolucionários Filtragem colaborativa Content-based filtering Feature selection Machine learning Evolutionary algorithms Collaborative filtering 681.324 |
description |
Dissertação de mestrado integrado em Engenharia de Comunicações |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012 2012-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/19599 |
url |
http://hdl.handle.net/1822/19599 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132244244168704 |