Bloom filters for stream windows
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/81094 |
Resumo: | Dissertação de mestrado integrado em Engenharia Informática |
id |
RCAP_56b83702f04b2013a5bf15af783eb98c |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/81094 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Bloom filters for stream windowsBloom filterData streamsData structuresDictionariesWindow modelsFluxo de dadosEstruturas de dadosDicionáriosModelos de janelasEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado integrado em Engenharia InformáticaA Bloom Filter is a probabilistic data structure designed to check, rapidly and memory-efficiently, whether an element is present in a set. It has been vastly used in various computing areas and several variants, allowing deletions, dynamic sets and working with sliding windows, have surfaced over the years. In many systems, it becomes relevant to identify the more recent information in the data stream. However, the majority of the sliding window schemes consider the most recent elements of a data stream without taking into account time as a factor. While this allows, e.g., saving the most recent 10000 elements, it does not easily translate into storing data received in the last 60 seconds, unless the insertion rate is stable and known in advance. In this thesis, a new technique is explored, Unproved in terms of time complexity and memory usage compared to the already existing ones, that can save information of a given time period and correctly identify it as present when queried, while also being able to retire data when it becomes stale. This new solution can be employed in a wide range of real world applications, such as in advertising, networking, fraud detection and distributed denial of service attacks prevention.Um Bloom Filter é uma estrutura de dados probabilistica, cuja função é verificar, rapida-mente e eficientemente em termos de memória, se um elemento está presente no set. Tem sido vastamente utilizado em diversas áreas da informática e várias variantes, que permitem remoções, seis dinâmicos e funcionam com sliding windows, têm surgido ao longo dos anos. Em inúmeros sistemas, toma-se relevante identificar a informação mais recente do fluxo de dados. Contudo, a maioria dos esquemas em sliding windows considera os elementos mais recentes de um fluxo de dados sem ter em conta o tempo como um fator. Enquanto que isto permite, e.g., guardar os 10000 elementos mais recentes, não se traduz facilmente em armazenar dados recebidos nos últimos 60 segundos, a menos que a taxa de inserção seja estável e conhecida antecipadamente. Nesta dissertação, uma nova técnica é explorada, melhorada em termos de complexidade temporal e uso de memória comparativamente a outras já existentes, que consegue guardar informação de um dado período de tempo e identificá-la corretamente como presente quando uma consulta é feita, como também é capaz de eliminar dados quando estes "envelhecem". Esta nova solução pode ser utilizada numa vasta gama de aplicações do mundo real, tais como em publicidade, networking, deteção de fraude e prevenção de ataques distribuídos de negação de serviço.Baquero, CarlosUniversidade do MinhoRodrigues, Ana Catarina Gomes2021-04-062021-04-06T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/81094eng203047753info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:32:08Zoai:repositorium.sdum.uminho.pt:1822/81094Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:27:29.684073Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Bloom filters for stream windows |
title |
Bloom filters for stream windows |
spellingShingle |
Bloom filters for stream windows Rodrigues, Ana Catarina Gomes Bloom filter Data streams Data structures Dictionaries Window models Fluxo de dados Estruturas de dados Dicionários Modelos de janelas Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
Bloom filters for stream windows |
title_full |
Bloom filters for stream windows |
title_fullStr |
Bloom filters for stream windows |
title_full_unstemmed |
Bloom filters for stream windows |
title_sort |
Bloom filters for stream windows |
author |
Rodrigues, Ana Catarina Gomes |
author_facet |
Rodrigues, Ana Catarina Gomes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Baquero, Carlos Universidade do Minho |
dc.contributor.author.fl_str_mv |
Rodrigues, Ana Catarina Gomes |
dc.subject.por.fl_str_mv |
Bloom filter Data streams Data structures Dictionaries Window models Fluxo de dados Estruturas de dados Dicionários Modelos de janelas Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Bloom filter Data streams Data structures Dictionaries Window models Fluxo de dados Estruturas de dados Dicionários Modelos de janelas Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
Dissertação de mestrado integrado em Engenharia Informática |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-04-06 2021-04-06T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/81094 |
url |
https://hdl.handle.net/1822/81094 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
203047753 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132766047043584 |