Extração e análise de publicações associadas à cibersegurança no Pastebin
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/6012 |
Resumo: | O Pastebin é uma ferramenta de compartilhamento de texto puro, ou seja, permite a publicação de textos, inclusive de forma anônima. Nesta monografia objetiva-se investigar os textos (pastes) postados no Pastebin quanto à sua relevância para extrair e identificar informações que possam ser utilizadas para ações proativas ou reativas mais rápidas na proteção de redes de computadores e sistemas. Para identificar tais informações, foram utilizadas expressões regulares, palavras-chave, detecção de idioma e análise manual, que também serviram de entrada para algoritmos de classificação. A coleta foi realizada num intervalo de 21 dias, resultando em uma base com 3650 pastes. A partir do pré-processamento e análise da base por meio de processamento de linguagem natural e estatística, foram extraídas características que resultaram em uma base de inteligência para uso na identificação de novos pastes de interesse. Verificou-se que existem informações relacionadas à cibersegurança no Pastebin, como venda de informações bancárias, vazamento de credenciais (por exemplo e-mails), disponibilização de informações pessoais e programas alterados. Essas informações são importantes para ações proativas ou reações mais rápidas contra ciberameaças. |
id |
UTFPR-12_445367e6d3eb29ee0a492a5bd09aad22 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/6012 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-09T19:10:17Z2020-11-09T19:10:17Z2018-11-19RAMOS, Felipe Veiga. Extração e análise de publicações associadas à cibersegurança no Pastebin. 2018. 85 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/6012O Pastebin é uma ferramenta de compartilhamento de texto puro, ou seja, permite a publicação de textos, inclusive de forma anônima. Nesta monografia objetiva-se investigar os textos (pastes) postados no Pastebin quanto à sua relevância para extrair e identificar informações que possam ser utilizadas para ações proativas ou reativas mais rápidas na proteção de redes de computadores e sistemas. Para identificar tais informações, foram utilizadas expressões regulares, palavras-chave, detecção de idioma e análise manual, que também serviram de entrada para algoritmos de classificação. A coleta foi realizada num intervalo de 21 dias, resultando em uma base com 3650 pastes. A partir do pré-processamento e análise da base por meio de processamento de linguagem natural e estatística, foram extraídas características que resultaram em uma base de inteligência para uso na identificação de novos pastes de interesse. Verificou-se que existem informações relacionadas à cibersegurança no Pastebin, como venda de informações bancárias, vazamento de credenciais (por exemplo e-mails), disponibilização de informações pessoais e programas alterados. Essas informações são importantes para ações proativas ou reações mais rápidas contra ciberameaças.Pure-text sharing tools allows the anonymous sharing of any kind of text. One of the oldest and most used tools is Pastebin. The goal of this monography is to analyse the relevance of texts (known as pastes), that were posted on Pastebin, to Cybersecurity: how to extract and identify information that can be useful to proactive and quickly reactive actions to protect computer networks and systems. In order to identify such information, the methods used were regular expressions, keywords, word count, frequency of bigrams, trigrams and quadgrams and classification’s algorithms. The collector ran for 21 days and 3650 pastes were manually inspected. A base of knowledgement was built using the chraracteristics extracted. Because of it,was possible to know that there are sensible information,like financial and personal data and cracked programs hosted on Pastebin. This kind of information allow better answer to cyber threatments.porUniversidade Tecnológica Federal do ParanáCampo MouraoCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOProcessamento de linguagem natural (Computação)Compartilhamento de arquivos de computadorRecuperação de dados (Computação)Proteção de dadosNatural language processing (Computer science)Computer file sharingData recovery (Computer science)Data protectionExtração e análise de publicações associadas à cibersegurança no PastebinExtraction and analysis of publication related with cybersecurity in Pastebininfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCampo MourãoCampiolo, RodrigoSantos, Luiz Arthur Feitosa dosCampiolo, RodrigoSantos, Luiz Arthur Feitosa dosHübner, RodrigoValentin, Lucio GeronimoRamos, Felipe Veigainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALpublicacoesassociadascibersegurancapastebin.pdfapplication/pdf1175184http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/1/publicacoesassociadascibersegurancapastebin.pdfaf86dac47999bf57219a986551fd41c2MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTpublicacoesassociadascibersegurancapastebin.pdf.txtExtracted texttext/plain159313http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/3/publicacoesassociadascibersegurancapastebin.pdf.txt24bf3219120b98633ae3060cd326ee6eMD53THUMBNAILpublicacoesassociadascibersegurancapastebin.pdf.jpgGenerated Thumbnailimage/jpeg1335http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/4/publicacoesassociadascibersegurancapastebin.pdf.jpg4fa799d4e6162c38d0be3c1f804f741bMD541/60122020-11-09 17:10:17.953oai:repositorio.utfpr.edu.br:1/6012TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-09T19:10:17Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Extração e análise de publicações associadas à cibersegurança no Pastebin |
dc.title.alternative.pt_BR.fl_str_mv |
Extraction and analysis of publication related with cybersecurity in Pastebin |
title |
Extração e análise de publicações associadas à cibersegurança no Pastebin |
spellingShingle |
Extração e análise de publicações associadas à cibersegurança no Pastebin Ramos, Felipe Veiga CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Processamento de linguagem natural (Computação) Compartilhamento de arquivos de computador Recuperação de dados (Computação) Proteção de dados Natural language processing (Computer science) Computer file sharing Data recovery (Computer science) Data protection |
title_short |
Extração e análise de publicações associadas à cibersegurança no Pastebin |
title_full |
Extração e análise de publicações associadas à cibersegurança no Pastebin |
title_fullStr |
Extração e análise de publicações associadas à cibersegurança no Pastebin |
title_full_unstemmed |
Extração e análise de publicações associadas à cibersegurança no Pastebin |
title_sort |
Extração e análise de publicações associadas à cibersegurança no Pastebin |
author |
Ramos, Felipe Veiga |
author_facet |
Ramos, Felipe Veiga |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Campiolo, Rodrigo |
dc.contributor.advisor-co1.fl_str_mv |
Santos, Luiz Arthur Feitosa dos |
dc.contributor.referee1.fl_str_mv |
Campiolo, Rodrigo |
dc.contributor.referee2.fl_str_mv |
Santos, Luiz Arthur Feitosa dos |
dc.contributor.referee3.fl_str_mv |
Hübner, Rodrigo |
dc.contributor.referee4.fl_str_mv |
Valentin, Lucio Geronimo |
dc.contributor.author.fl_str_mv |
Ramos, Felipe Veiga |
contributor_str_mv |
Campiolo, Rodrigo Santos, Luiz Arthur Feitosa dos Campiolo, Rodrigo Santos, Luiz Arthur Feitosa dos Hübner, Rodrigo Valentin, Lucio Geronimo |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Processamento de linguagem natural (Computação) Compartilhamento de arquivos de computador Recuperação de dados (Computação) Proteção de dados Natural language processing (Computer science) Computer file sharing Data recovery (Computer science) Data protection |
dc.subject.por.fl_str_mv |
Processamento de linguagem natural (Computação) Compartilhamento de arquivos de computador Recuperação de dados (Computação) Proteção de dados Natural language processing (Computer science) Computer file sharing Data recovery (Computer science) Data protection |
description |
O Pastebin é uma ferramenta de compartilhamento de texto puro, ou seja, permite a publicação de textos, inclusive de forma anônima. Nesta monografia objetiva-se investigar os textos (pastes) postados no Pastebin quanto à sua relevância para extrair e identificar informações que possam ser utilizadas para ações proativas ou reativas mais rápidas na proteção de redes de computadores e sistemas. Para identificar tais informações, foram utilizadas expressões regulares, palavras-chave, detecção de idioma e análise manual, que também serviram de entrada para algoritmos de classificação. A coleta foi realizada num intervalo de 21 dias, resultando em uma base com 3650 pastes. A partir do pré-processamento e análise da base por meio de processamento de linguagem natural e estatística, foram extraídas características que resultaram em uma base de inteligência para uso na identificação de novos pastes de interesse. Verificou-se que existem informações relacionadas à cibersegurança no Pastebin, como venda de informações bancárias, vazamento de credenciais (por exemplo e-mails), disponibilização de informações pessoais e programas alterados. Essas informações são importantes para ações proativas ou reações mais rápidas contra ciberameaças. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-11-19 |
dc.date.accessioned.fl_str_mv |
2020-11-09T19:10:17Z |
dc.date.available.fl_str_mv |
2020-11-09T19:10:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
RAMOS, Felipe Veiga. Extração e análise de publicações associadas à cibersegurança no Pastebin. 2018. 85 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/6012 |
identifier_str_mv |
RAMOS, Felipe Veiga. Extração e análise de publicações associadas à cibersegurança no Pastebin. 2018. 85 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/6012 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Campo Mourao |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento Acadêmico de Computação |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Campo Mourao |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/1/publicacoesassociadascibersegurancapastebin.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/3/publicacoesassociadascibersegurancapastebin.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6012/4/publicacoesassociadascibersegurancapastebin.pdf.jpg |
bitstream.checksum.fl_str_mv |
af86dac47999bf57219a986551fd41c2 b9d82215ab23456fa2d8b49c5df1b95b 24bf3219120b98633ae3060cd326ee6e 4fa799d4e6162c38d0be3c1f804f741b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1797043900467118080 |