Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNESC |
Texto Completo: | http://repositorio.unesc.net/handle/1/9138 |
Resumo: | Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC. |
id |
UNESC-1_c15cc97915523cc80810ebd62e202d36 |
---|---|
oai_identifier_str |
oai:repositorio.unesc.net:1/9138 |
network_acronym_str |
UNESC-1 |
network_name_str |
Repositório Institucional da UNESC |
repository_id_str |
|
spelling |
Souza, Ânderson Luís deMartins, Paulo João2022-04-22T11:50:27Z2022-04-22T11:50:27Z2021-12http://repositorio.unesc.net/handle/1/9138Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.O crescimento acelerado dos sites de redes sociais nos últimos anos criou uma enorme base de dados. Dentre o grande volume de informações compartilhadas diariamente, encontram-se dados que comprometem a segurança dos usuários. Atentos a esses dados, existem pessoas mal-intencionadas e à espera de qualquer tipo de informação que possa lhes trazer vantagens sobre determinado usuário. Utilizando de técnicas de engenharia social, alguns poucos dados são suficientes para planejar ataques diretos. O propósito desse trabalho foi realizar uma análise na rede social Twitter, utilizando técnicas de Descoberta de conhecimento em base de dados para localizar dados que possam ser possíveis alvos da engenharia social. Para execução das etapas de descoberta de conhecimento foram implementados algoritmos na linguagem de programação Python e os dados foram armazenados no banco de dados relacional MySQL. Para realizar extração dos dados da rede social, foi utilizado a biblioteca tweepy e para classificação dos dados, a biblioteca sklearn. Utilizando a biblioteca sklearn, dois modelos foram testados: Máquinas de Vetores de Suporte e Multinomial Naive Bayes. O modelo de Máquinas de Vetores de Suporte se mostrou superior e foi selecionado para realizar a classificação da base principal. Os resultados mostraram que mais de 99% dos usuários possuem algum tipo de exposição, porém, a falta da validação de um dos campos, diminuiu a credibilidade dos resultados. Ao final, o resultado foi satisfatório, identificando-se que uma pequena parcela dos usuários compartilha dados pessoais suscetíveis a ataques de engenharia social.Mineração de dadosDescoberta de conhecimentoBase de dadosDados pessoaisTwitter (Rede social on-line)Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysqlinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UNESCinstname:Universidade do Extremo Sul Catarinense (Unesc)instacron:UNESCinfo:eu-repo/semantics/openAccessORIGINALAnderson de Souza.pdfAnderson de Souza.pdfTCCapplication/pdf372187http://repositorio.unesc.net/bitstream/1/9138/1/Anderson%20de%20Souza.pdf3a356e9d5e17b16b8432ffe44d53c670MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.unesc.net/bitstream/1/9138/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD521/91382022-04-22 08:50:31.987oai:repositorio.unesc.net:1/9138Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://repositorio.unesc.net/oai/requestrepositorio@unesc.net.opendoar:2024-07-23T15:45:04.292314Repositório Institucional da UNESC - Universidade do Extremo Sul Catarinense (Unesc)false |
dc.title.pt_BR.fl_str_mv |
Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql |
title |
Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql |
spellingShingle |
Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql Souza, Ânderson Luís de Mineração de dados Descoberta de conhecimento Base de dados Dados pessoais Twitter (Rede social on-line) |
title_short |
Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql |
title_full |
Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql |
title_fullStr |
Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql |
title_full_unstemmed |
Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql |
title_sort |
Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql |
author |
Souza, Ânderson Luís de |
author_facet |
Souza, Ânderson Luís de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Souza, Ânderson Luís de |
dc.contributor.advisor1.fl_str_mv |
Martins, Paulo João |
contributor_str_mv |
Martins, Paulo João |
dc.subject.por.fl_str_mv |
Mineração de dados Descoberta de conhecimento Base de dados Dados pessoais Twitter (Rede social on-line) |
topic |
Mineração de dados Descoberta de conhecimento Base de dados Dados pessoais Twitter (Rede social on-line) |
description |
Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC. |
publishDate |
2021 |
dc.date.created.fl_str_mv |
2021-12 |
dc.date.accessioned.fl_str_mv |
2022-04-22T11:50:27Z |
dc.date.available.fl_str_mv |
2022-04-22T11:50:27Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://repositorio.unesc.net/handle/1/9138 |
url |
http://repositorio.unesc.net/handle/1/9138 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESC instname:Universidade do Extremo Sul Catarinense (Unesc) instacron:UNESC |
instname_str |
Universidade do Extremo Sul Catarinense (Unesc) |
instacron_str |
UNESC |
institution |
UNESC |
reponame_str |
Repositório Institucional da UNESC |
collection |
Repositório Institucional da UNESC |
bitstream.url.fl_str_mv |
http://repositorio.unesc.net/bitstream/1/9138/1/Anderson%20de%20Souza.pdf http://repositorio.unesc.net/bitstream/1/9138/2/license.txt |
bitstream.checksum.fl_str_mv |
3a356e9d5e17b16b8432ffe44d53c670 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UNESC - Universidade do Extremo Sul Catarinense (Unesc) |
repository.mail.fl_str_mv |
repositorio@unesc.net. |
_version_ |
1805673305873580032 |