Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql

Detalhes bibliográficos
Autor(a) principal: Souza, Ânderson Luís de
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UNESC
Texto Completo: http://repositorio.unesc.net/handle/1/9138
Resumo: Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
id UNESC-1_c15cc97915523cc80810ebd62e202d36
oai_identifier_str oai:repositorio.unesc.net:1/9138
network_acronym_str UNESC-1
network_name_str Repositório Institucional da UNESC
repository_id_str
spelling Souza, Ânderson Luís deMartins, Paulo João2022-04-22T11:50:27Z2022-04-22T11:50:27Z2021-12http://repositorio.unesc.net/handle/1/9138Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.O crescimento acelerado dos sites de redes sociais nos últimos anos criou uma enorme base de dados. Dentre o grande volume de informações compartilhadas diariamente, encontram-se dados que comprometem a segurança dos usuários. Atentos a esses dados, existem pessoas mal-intencionadas e à espera de qualquer tipo de informação que possa lhes trazer vantagens sobre determinado usuário. Utilizando de técnicas de engenharia social, alguns poucos dados são suficientes para planejar ataques diretos. O propósito desse trabalho foi realizar uma análise na rede social Twitter, utilizando técnicas de Descoberta de conhecimento em base de dados para localizar dados que possam ser possíveis alvos da engenharia social. Para execução das etapas de descoberta de conhecimento foram implementados algoritmos na linguagem de programação Python e os dados foram armazenados no banco de dados relacional MySQL. Para realizar extração dos dados da rede social, foi utilizado a biblioteca tweepy e para classificação dos dados, a biblioteca sklearn. Utilizando a biblioteca sklearn, dois modelos foram testados: Máquinas de Vetores de Suporte e Multinomial Naive Bayes. O modelo de Máquinas de Vetores de Suporte se mostrou superior e foi selecionado para realizar a classificação da base principal. Os resultados mostraram que mais de 99% dos usuários possuem algum tipo de exposição, porém, a falta da validação de um dos campos, diminuiu a credibilidade dos resultados. Ao final, o resultado foi satisfatório, identificando-se que uma pequena parcela dos usuários compartilha dados pessoais suscetíveis a ataques de engenharia social.Mineração de dadosDescoberta de conhecimentoBase de dadosDados pessoaisTwitter (Rede social on-line)Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysqlinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UNESCinstname:Universidade do Extremo Sul Catarinense (Unesc)instacron:UNESCinfo:eu-repo/semantics/openAccessORIGINALAnderson de Souza.pdfAnderson de Souza.pdfTCCapplication/pdf372187http://repositorio.unesc.net/bitstream/1/9138/1/Anderson%20de%20Souza.pdf3a356e9d5e17b16b8432ffe44d53c670MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.unesc.net/bitstream/1/9138/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD521/91382022-04-22 08:50:31.987oai:repositorio.unesc.net:1/9138Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://repositorio.unesc.net/oai/requestrepositorio@unesc.net.opendoar:2024-07-23T15:45:04.292314Repositório Institucional da UNESC - Universidade do Extremo Sul Catarinense (Unesc)false
dc.title.pt_BR.fl_str_mv Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
title Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
spellingShingle Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
Souza, Ânderson Luís de
Mineração de dados
Descoberta de conhecimento
Base de dados
Dados pessoais
Twitter (Rede social on-line)
title_short Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
title_full Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
title_fullStr Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
title_full_unstemmed Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
title_sort Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
author Souza, Ânderson Luís de
author_facet Souza, Ânderson Luís de
author_role author
dc.contributor.author.fl_str_mv Souza, Ânderson Luís de
dc.contributor.advisor1.fl_str_mv Martins, Paulo João
contributor_str_mv Martins, Paulo João
dc.subject.por.fl_str_mv Mineração de dados
Descoberta de conhecimento
Base de dados
Dados pessoais
Twitter (Rede social on-line)
topic Mineração de dados
Descoberta de conhecimento
Base de dados
Dados pessoais
Twitter (Rede social on-line)
description Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
publishDate 2021
dc.date.created.fl_str_mv 2021-12
dc.date.accessioned.fl_str_mv 2022-04-22T11:50:27Z
dc.date.available.fl_str_mv 2022-04-22T11:50:27Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.unesc.net/handle/1/9138
url http://repositorio.unesc.net/handle/1/9138
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESC
instname:Universidade do Extremo Sul Catarinense (Unesc)
instacron:UNESC
instname_str Universidade do Extremo Sul Catarinense (Unesc)
instacron_str UNESC
institution UNESC
reponame_str Repositório Institucional da UNESC
collection Repositório Institucional da UNESC
bitstream.url.fl_str_mv http://repositorio.unesc.net/bitstream/1/9138/1/Anderson%20de%20Souza.pdf
http://repositorio.unesc.net/bitstream/1/9138/2/license.txt
bitstream.checksum.fl_str_mv 3a356e9d5e17b16b8432ffe44d53c670
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNESC - Universidade do Extremo Sul Catarinense (Unesc)
repository.mail.fl_str_mv repositorio@unesc.net.
_version_ 1805673305873580032