Extração e análise de publicações associadas à cibersegurança no Pastebin

Detalhes bibliográficos
Autor(a) principal: Ramos, Felipe Veiga
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/6012
Resumo: O Pastebin é uma ferramenta de compartilhamento de texto puro, ou seja, permite a publicação de textos, inclusive de forma anônima. Nesta monografia objetiva-se investigar os textos (pastes) postados no Pastebin quanto à sua relevância para extrair e identificar informações que possam ser utilizadas para ações proativas ou reativas mais rápidas na proteção de redes de computadores e sistemas. Para identificar tais informações, foram utilizadas expressões regulares, palavras-chave, detecção de idioma e análise manual, que também serviram de entrada para algoritmos de classificação. A coleta foi realizada num intervalo de 21 dias, resultando em uma base com 3650 pastes. A partir do pré-processamento e análise da base por meio de processamento de linguagem natural e estatística, foram extraídas características que resultaram em uma base de inteligência para uso na identificação de novos pastes de interesse. Verificou-se que existem informações relacionadas à cibersegurança no Pastebin, como venda de informações bancárias, vazamento de credenciais (por exemplo e-mails), disponibilização de informações pessoais e programas alterados. Essas informações são importantes para ações proativas ou reações mais rápidas contra ciberameaças.
id UTFPR-12_445367e6d3eb29ee0a492a5bd09aad22
oai_identifier_str oai:repositorio.utfpr.edu.br:1/6012
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-09T19:10:17Z2020-11-09T19:10:17Z2018-11-19RAMOS, Felipe Veiga. Extração e análise de publicações associadas à cibersegurança no Pastebin. 2018. 85 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/6012O Pastebin é uma ferramenta de compartilhamento de texto puro, ou seja, permite a publicação de textos, inclusive de forma anônima. Nesta monografia objetiva-se investigar os textos (pastes) postados no Pastebin quanto à sua relevância para extrair e identificar informações que possam ser utilizadas para ações proativas ou reativas mais rápidas na proteção de redes de computadores e sistemas. Para identificar tais informações, foram utilizadas expressões regulares, palavras-chave, detecção de idioma e análise manual, que também serviram de entrada para algoritmos de classificação. A coleta foi realizada num intervalo de 21 dias, resultando em uma base com 3650 pastes. A partir do pré-processamento e análise da base por meio de processamento de linguagem natural e estatística, foram extraídas características que resultaram em uma base de inteligência para uso na identificação de novos pastes de interesse. Verificou-se que existem informações relacionadas à cibersegurança no Pastebin, como venda de informações bancárias, vazamento de credenciais (por exemplo e-mails), disponibilização de informações pessoais e programas alterados. Essas informações são importantes para ações proativas ou reações mais rápidas contra ciberameaças.Pure-text sharing tools allows the anonymous sharing of any kind of text. One of the oldest and most used tools is Pastebin. The goal of this monography is to analyse the relevance of texts (known as pastes), that were posted on Pastebin, to Cybersecurity: how to extract and identify information that can be useful to proactive and quickly reactive actions to protect computer networks and systems. In order to identify such information, the methods used were regular expressions, keywords, word count, frequency of bigrams, trigrams and quadgrams and classification’s algorithms. The collector ran for 21 days and 3650 pastes were manually inspected. A base of knowledgement was built using the chraracteristics extracted. Because of it,was possible to know that there are sensible information,like financial and personal data and cracked programs hosted on Pastebin. This kind of information allow better answer to cyber threatments.porUniversidade Tecnológica Federal do ParanáCampo MouraoCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOProcessamento de linguagem natural (Computação)Compartilhamento de arquivos de computadorRecuperação de dados (Computação)Proteção de dadosNatural language processing (Computer science)Computer file sharingData recovery (Computer science)Data protectionExtração e análise de publicações associadas à cibersegurança no PastebinExtraction and analysis of publication related with cybersecurity in Pastebininfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCampo MourãoCampiolo, RodrigoSantos, Luiz Arthur Feitosa dosCampiolo, RodrigoSantos, Luiz Arthur Feitosa dosHübner, RodrigoValentin, Lucio GeronimoRamos, Felipe Veigainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALpublicacoesassociadascibersegurancapastebin.pdfapplication/pdf1175184http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/1/publicacoesassociadascibersegurancapastebin.pdfaf86dac47999bf57219a986551fd41c2MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTpublicacoesassociadascibersegurancapastebin.pdf.txtExtracted texttext/plain159313http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/3/publicacoesassociadascibersegurancapastebin.pdf.txt24bf3219120b98633ae3060cd326ee6eMD53THUMBNAILpublicacoesassociadascibersegurancapastebin.pdf.jpgGenerated Thumbnailimage/jpeg1335http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/4/publicacoesassociadascibersegurancapastebin.pdf.jpg4fa799d4e6162c38d0be3c1f804f741bMD541/60122020-11-09 17:10:17.953oai:repositorio.utfpr.edu.br:1/6012TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-09T19:10:17Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Extração e análise de publicações associadas à cibersegurança no Pastebin
dc.title.alternative.pt_BR.fl_str_mv Extraction and analysis of publication related with cybersecurity in Pastebin
title Extração e análise de publicações associadas à cibersegurança no Pastebin
spellingShingle Extração e análise de publicações associadas à cibersegurança no Pastebin
Ramos, Felipe Veiga
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Processamento de linguagem natural (Computação)
Compartilhamento de arquivos de computador
Recuperação de dados (Computação)
Proteção de dados
Natural language processing (Computer science)
Computer file sharing
Data recovery (Computer science)
Data protection
title_short Extração e análise de publicações associadas à cibersegurança no Pastebin
title_full Extração e análise de publicações associadas à cibersegurança no Pastebin
title_fullStr Extração e análise de publicações associadas à cibersegurança no Pastebin
title_full_unstemmed Extração e análise de publicações associadas à cibersegurança no Pastebin
title_sort Extração e análise de publicações associadas à cibersegurança no Pastebin
author Ramos, Felipe Veiga
author_facet Ramos, Felipe Veiga
author_role author
dc.contributor.advisor1.fl_str_mv Campiolo, Rodrigo
dc.contributor.advisor-co1.fl_str_mv Santos, Luiz Arthur Feitosa dos
dc.contributor.referee1.fl_str_mv Campiolo, Rodrigo
dc.contributor.referee2.fl_str_mv Santos, Luiz Arthur Feitosa dos
dc.contributor.referee3.fl_str_mv Hübner, Rodrigo
dc.contributor.referee4.fl_str_mv Valentin, Lucio Geronimo
dc.contributor.author.fl_str_mv Ramos, Felipe Veiga
contributor_str_mv Campiolo, Rodrigo
Santos, Luiz Arthur Feitosa dos
Campiolo, Rodrigo
Santos, Luiz Arthur Feitosa dos
Hübner, Rodrigo
Valentin, Lucio Geronimo
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Processamento de linguagem natural (Computação)
Compartilhamento de arquivos de computador
Recuperação de dados (Computação)
Proteção de dados
Natural language processing (Computer science)
Computer file sharing
Data recovery (Computer science)
Data protection
dc.subject.por.fl_str_mv Processamento de linguagem natural (Computação)
Compartilhamento de arquivos de computador
Recuperação de dados (Computação)
Proteção de dados
Natural language processing (Computer science)
Computer file sharing
Data recovery (Computer science)
Data protection
description O Pastebin é uma ferramenta de compartilhamento de texto puro, ou seja, permite a publicação de textos, inclusive de forma anônima. Nesta monografia objetiva-se investigar os textos (pastes) postados no Pastebin quanto à sua relevância para extrair e identificar informações que possam ser utilizadas para ações proativas ou reativas mais rápidas na proteção de redes de computadores e sistemas. Para identificar tais informações, foram utilizadas expressões regulares, palavras-chave, detecção de idioma e análise manual, que também serviram de entrada para algoritmos de classificação. A coleta foi realizada num intervalo de 21 dias, resultando em uma base com 3650 pastes. A partir do pré-processamento e análise da base por meio de processamento de linguagem natural e estatística, foram extraídas características que resultaram em uma base de inteligência para uso na identificação de novos pastes de interesse. Verificou-se que existem informações relacionadas à cibersegurança no Pastebin, como venda de informações bancárias, vazamento de credenciais (por exemplo e-mails), disponibilização de informações pessoais e programas alterados. Essas informações são importantes para ações proativas ou reações mais rápidas contra ciberameaças.
publishDate 2018
dc.date.issued.fl_str_mv 2018-11-19
dc.date.accessioned.fl_str_mv 2020-11-09T19:10:17Z
dc.date.available.fl_str_mv 2020-11-09T19:10:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv RAMOS, Felipe Veiga. Extração e análise de publicações associadas à cibersegurança no Pastebin. 2018. 85 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/6012
identifier_str_mv RAMOS, Felipe Veiga. Extração e análise de publicações associadas à cibersegurança no Pastebin. 2018. 85 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/6012
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Computação
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/1/publicacoesassociadascibersegurancapastebin.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/3/publicacoesassociadascibersegurancapastebin.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/4/publicacoesassociadascibersegurancapastebin.pdf.jpg
bitstream.checksum.fl_str_mv af86dac47999bf57219a986551fd41c2
b9d82215ab23456fa2d8b49c5df1b95b
24bf3219120b98633ae3060cd326ee6e
4fa799d4e6162c38d0be3c1f804f741b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1797043900467118080