Mineração de dados aplicada à construção de bases de hash em computação forense

Detalhes bibliográficos
Autor(a) principal: Ruback, Marcelo Caldeira
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/10836
Resumo: Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2011.
id UNB_295e7ead8195a045ed5c077a9b7971c4
oai_identifier_str oai:repositorio.unb.br:10482/10836
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Mineração de dados aplicada à construção de bases de hash em computação forenseData mining applied to hashsets construction in computer forensicsComputação forenseEngenharia elétricaMineração de dados (Computação)Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2011.A grande quantidade de dados a serem processados e analisados por peritos em informática é um desafio crescente enfrentado pela comunidade de Computação Forense. O uso de conjuntos de hashes de arquivos conhecidos para identificar e filtrar arquivos irrelevantes é um procedimento amplamente utilizado, mas não é tão eficaz quanto poderia ser, especialmente em países cujo idioma não seja o inglês. Este trabalho propõe o uso de técnicas de mineração de dados com algoritmos de classificação baseados em árvores de decisão para encontrar novos arquivos irrelevantes para a análise forense a partir de uma amostra de computadores de uma dada região ou país. Os hashes dos arquivos identificados podem ser mesclados com um subconjunto selecionado de hashes que sejam realmente efetivos, escolhido a partir de bases de hashes convencionais. Os experimentos foram conduzidos para avaliar o desempenho de filtragem da solução proposta, usando amostras de evidências extraídas de casos reais. Esses experimentos demonstraram que a abordagem proposta obteve resultados de filtragem entre 15% e 30% melhores do que a base de hash convencional utilizada, mesmo contendo um número reduzido de valores de hash. Este trabalho lança luz sobre uma técnica forense comumente utilizada, mas que tem sido relegada ao uso de bases de dados em constante crescimento composto apenas de hashes de arquivos conhecidos cuja origem seja rigidamente rastreável. A adoção de novas soluções para lidar com bancos de dados de hash em Computação Forense é uma boa oportunidade para introduzir técnicas inteligentes para melhorar a forma como conjuntos de hashes são criados, mantidos e utilizados. _________________________________________________________________________________ ABSTRACTThe large amount of data to be processed and analyzed by forensic experts is a growing challenge faced by the computer forensics community. The use of hashsets of known files to identify and filter irrelevant files is a commonly used technique, but it is not as effective as it could be, especially in non-English speaking countries. This work proposes the use of data mining techniques with decision tree learning algorithms to find new irrelevant files to the forensic analysis from a sample of computers from a given region or country. The resulting files can be merged with an optimized subset of really effectively used hashsets, which are chosen from conventional hash databases. Experiments were conducted to evaluate the filtering performance of the proposed solution, using samples from real evidence. The experimental results demonstrate that our approach obtained between 15% to 30% better filtering results than the conventional hashset database used as benchmark, even with a reduced number of hash values. This work sheds light on a commonly used forensics technique, which has relied on the use of ever-growing databases composed only of hashes from rigidly traceable known files. The adoption of new solutions to deal with hash databases in computer forensics is a good opportunity to introduce intelligent techniques to improve the way hashsets are created, maintained and used.Faculdade de Tecnologia (FT)Departamento de Engenharia Elétrica (FT ENE)Programa de Pós-Graduação em Engenharia ElétricaRalha, Célia GhediniHoelz, Bruno Werneck PintoRuback, Marcelo Caldeira2012-06-27T14:13:27Z2012-06-27T14:13:27Z2012-06-272011-12-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfRUBACK, Marcelo Caldeira. Mineração de dados aplicada à construção de bases de hash em computação forense. 2011. xxix, 169 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2011.http://repositorio.unb.br/handle/10482/10836info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-01T16:12:14Zoai:repositorio.unb.br:10482/10836Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-01T16:12:14Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Mineração de dados aplicada à construção de bases de hash em computação forense
Data mining applied to hashsets construction in computer forensics
title Mineração de dados aplicada à construção de bases de hash em computação forense
spellingShingle Mineração de dados aplicada à construção de bases de hash em computação forense
Ruback, Marcelo Caldeira
Computação forense
Engenharia elétrica
Mineração de dados (Computação)
title_short Mineração de dados aplicada à construção de bases de hash em computação forense
title_full Mineração de dados aplicada à construção de bases de hash em computação forense
title_fullStr Mineração de dados aplicada à construção de bases de hash em computação forense
title_full_unstemmed Mineração de dados aplicada à construção de bases de hash em computação forense
title_sort Mineração de dados aplicada à construção de bases de hash em computação forense
author Ruback, Marcelo Caldeira
author_facet Ruback, Marcelo Caldeira
author_role author
dc.contributor.none.fl_str_mv Ralha, Célia Ghedini
Hoelz, Bruno Werneck Pinto
dc.contributor.author.fl_str_mv Ruback, Marcelo Caldeira
dc.subject.por.fl_str_mv Computação forense
Engenharia elétrica
Mineração de dados (Computação)
topic Computação forense
Engenharia elétrica
Mineração de dados (Computação)
description Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2011.
publishDate 2011
dc.date.none.fl_str_mv 2011-12-11
2012-06-27T14:13:27Z
2012-06-27T14:13:27Z
2012-06-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv RUBACK, Marcelo Caldeira. Mineração de dados aplicada à construção de bases de hash em computação forense. 2011. xxix, 169 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2011.
http://repositorio.unb.br/handle/10482/10836
identifier_str_mv RUBACK, Marcelo Caldeira. Mineração de dados aplicada à construção de bases de hash em computação forense. 2011. xxix, 169 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2011.
url http://repositorio.unb.br/handle/10482/10836
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1810580753194418176