Bloom filters for stream windows

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Ana Catarina Gomes
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/81094
Resumo: Dissertação de mestrado integrado em Engenharia Informática
id RCAP_56b83702f04b2013a5bf15af783eb98c
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/81094
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Bloom filters for stream windowsBloom filterData streamsData structuresDictionariesWindow modelsFluxo de dadosEstruturas de dadosDicionáriosModelos de janelasEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado integrado em Engenharia InformáticaA Bloom Filter is a probabilistic data structure designed to check, rapidly and memory-efficiently, whether an element is present in a set. It has been vastly used in various computing areas and several variants, allowing deletions, dynamic sets and working with sliding windows, have surfaced over the years. In many systems, it becomes relevant to identify the more recent information in the data stream. However, the majority of the sliding window schemes consider the most recent elements of a data stream without taking into account time as a factor. While this allows, e.g., saving the most recent 10000 elements, it does not easily translate into storing data received in the last 60 seconds, unless the insertion rate is stable and known in advance. In this thesis, a new technique is explored, Unproved in terms of time complexity and memory usage compared to the already existing ones, that can save information of a given time period and correctly identify it as present when queried, while also being able to retire data when it becomes stale. This new solution can be employed in a wide range of real world applications, such as in advertising, networking, fraud detection and distributed denial of service attacks prevention.Um Bloom Filter é uma estrutura de dados probabilistica, cuja função é verificar, rapida-mente e eficientemente em termos de memória, se um elemento está presente no set. Tem sido vastamente utilizado em diversas áreas da informática e várias variantes, que permitem remoções, seis dinâmicos e funcionam com sliding windows, têm surgido ao longo dos anos. Em inúmeros sistemas, toma-se relevante identificar a informação mais recente do fluxo de dados. Contudo, a maioria dos esquemas em sliding windows considera os elementos mais recentes de um fluxo de dados sem ter em conta o tempo como um fator. Enquanto que isto permite, e.g., guardar os 10000 elementos mais recentes, não se traduz facilmente em armazenar dados recebidos nos últimos 60 segundos, a menos que a taxa de inserção seja estável e conhecida antecipadamente. Nesta dissertação, uma nova técnica é explorada, melhorada em termos de complexidade temporal e uso de memória comparativamente a outras já existentes, que consegue guardar informação de um dado período de tempo e identificá-la corretamente como presente quando uma consulta é feita, como também é capaz de eliminar dados quando estes "envelhecem". Esta nova solução pode ser utilizada numa vasta gama de aplicações do mundo real, tais como em publicidade, networking, deteção de fraude e prevenção de ataques distribuídos de negação de serviço.Baquero, CarlosUniversidade do MinhoRodrigues, Ana Catarina Gomes2021-04-062021-04-06T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/81094eng203047753info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:32:08Zoai:repositorium.sdum.uminho.pt:1822/81094Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:27:29.684073Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Bloom filters for stream windows
title Bloom filters for stream windows
spellingShingle Bloom filters for stream windows
Rodrigues, Ana Catarina Gomes
Bloom filter
Data streams
Data structures
Dictionaries
Window models
Fluxo de dados
Estruturas de dados
Dicionários
Modelos de janelas
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Bloom filters for stream windows
title_full Bloom filters for stream windows
title_fullStr Bloom filters for stream windows
title_full_unstemmed Bloom filters for stream windows
title_sort Bloom filters for stream windows
author Rodrigues, Ana Catarina Gomes
author_facet Rodrigues, Ana Catarina Gomes
author_role author
dc.contributor.none.fl_str_mv Baquero, Carlos
Universidade do Minho
dc.contributor.author.fl_str_mv Rodrigues, Ana Catarina Gomes
dc.subject.por.fl_str_mv Bloom filter
Data streams
Data structures
Dictionaries
Window models
Fluxo de dados
Estruturas de dados
Dicionários
Modelos de janelas
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Bloom filter
Data streams
Data structures
Dictionaries
Window models
Fluxo de dados
Estruturas de dados
Dicionários
Modelos de janelas
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado integrado em Engenharia Informática
publishDate 2021
dc.date.none.fl_str_mv 2021-04-06
2021-04-06T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/81094
url https://hdl.handle.net/1822/81094
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203047753
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132766047043584