Caracterização de usuários no Instagram

Detalhes bibliográficos
Autor(a) principal: Oliveira, Rodrigo Ribeiro
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UEFS
Texto Completo: http://tede2.uefs.br:8080/handle/tede/1507
Resumo: With the popularization of social media, more and more data is created, generating new opportunities of extracting knowledge from it. An example of social media that became popular in recent years is Instagram, whose focus is image sharing. For marketing purposes, the characterization of users is a very important task, because it allows to deliver specific advertisements for each group of users. This approach allows for applications in marketing, pointing to users within an intended demography. This problem is tackled in this work, in particular, the determination of age range and professional area in Instagram users that are native speakers of Portuguese. Two datasets of Instagram profiles were built, one labeled with the age range and another with the professional area of the users. The classifiers Random Forest and Support Vector Machines were used for determining these characteristics, through textual and behavioral attributes. The best results achieved have a accuracy of 60\%, performance superior to the baseline for each problem.
id UEFS_465b3ac15fe07160fcba71ec3e99af12
oai_identifier_str oai:tede2.uefs.br:8080:tede/1507
network_acronym_str UEFS
network_name_str Biblioteca Digital de Teses e Dissertações da UEFS
repository_id_str
spelling Rocha Junior, João Batista da02778818464http://lattes.cnpq.br/630437754910179205783557528http://lattes.cnpq.br/3053104537804643Oliveira, Rodrigo Ribeiro2023-08-09T15:21:06Z2021-07-16OLIVEIRA, Rodrigo Ribeiro. Caracterização de usuários no Instagram. 2021. 117 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação) - Universidade Estadual de Feira de Santana, Feira de Santana, 2021.http://tede2.uefs.br:8080/handle/tede/1507With the popularization of social media, more and more data is created, generating new opportunities of extracting knowledge from it. An example of social media that became popular in recent years is Instagram, whose focus is image sharing. For marketing purposes, the characterization of users is a very important task, because it allows to deliver specific advertisements for each group of users. This approach allows for applications in marketing, pointing to users within an intended demography. This problem is tackled in this work, in particular, the determination of age range and professional area in Instagram users that are native speakers of Portuguese. Two datasets of Instagram profiles were built, one labeled with the age range and another with the professional area of the users. The classifiers Random Forest and Support Vector Machines were used for determining these characteristics, through textual and behavioral attributes. The best results achieved have a accuracy of 60\%, performance superior to the baseline for each problem.Com o advento e popularização de redes sociais, cada vez mais dados são gerados a partir delas, ensejando oportunidades de obtenção de conhecimento útil. Uma dessas redes é o Instagram, voltada para o compartilhamento de imagens. Um dos ramos de análise que pode ser realizada em redes sociais é a descoberta de características de usuários. Esta abordagem possibilita aplicações na área publicitária, indicando quais os usuários que estejam dentro de uma demografia que se queira alcançar, cobrindo uma área para a qual o Instagram não fornece ferramentas. Este trabalho se volta para este problema, tratando da caracterização de área profissional e faixa etária de perfis do Instagram, cujos usuários são falantes da língua portuguesa, onde há uma carência de trabalhos relacionados. Para isso, dois conjuntos de dados com perfis de usuários do Instagram, que são falantes da língua portuguesa, foram construídos, um deles rotulado com faixa etária e outro com área profissional. Foi realizada a classificação dessas características usando os classificadores Random Forest e Support Vector Machines, através de atributos textuais e comportamentais. Os resultados alcançados chegam a uma acurácia de cerca de 60\%, com desempenho acima do baseline.Submitted by Amanda Ponce (aponce@uefs.br) on 2023-08-09T15:21:06Z No. of bitstreams: 1 Dissertacao_rodrigo_PGCC_v2.pdf: 3301107 bytes, checksum: 4094a253b89ac217f9a7e1b85e3fc9a2 (MD5)Made available in DSpace on 2023-08-09T15:21:06Z (GMT). No. of bitstreams: 1 Dissertacao_rodrigo_PGCC_v2.pdf: 3301107 bytes, checksum: 4094a253b89ac217f9a7e1b85e3fc9a2 (MD5) Previous issue date: 2021-07-16application/pdfporUniversidade Estadual de Feira de SantanaPrograma de Pós-Graduação em Ciência da ComputaçãoUEFSBrasilDEPARTAMENTO DE TECNOLOGIARedes sociaisAprendizagem de máquinaInteligência artificialCaracterização de usuárioMachine learningSocial mediaUser characterizationArtificial intelligenceCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSISTEMAS DE COMPUTACAO::TELEINFORMATICAMETODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAOCaracterização de usuários no Instagraminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis197499653308127447060060060060060043351085230203470513671711205811204509-8816208982924656813-651669516009542875info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UEFSinstname:Universidade Estadual de Feira de Santana (UEFS)instacron:UEFSORIGINALDissertacao_rodrigo_PGCC_v2.pdfDissertacao_rodrigo_PGCC_v2.pdfapplication/pdf3301107http://tede2.uefs.br:8080/bitstream/tede/1507/2/Dissertacao_rodrigo_PGCC_v2.pdf4094a253b89ac217f9a7e1b85e3fc9a2MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82089http://tede2.uefs.br:8080/bitstream/tede/1507/1/license.txt7b5ba3d2445355f386edab96125d42b7MD51tede/15072023-12-06 15:23:13.53oai:tede2.uefs.br:8080:tede/1507Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSP1BSSUEgTElDRU4/QQpFc3RhIGxpY2VuP2EgZGUgZXhlbXBsbyA/IGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOP0EgREUgRElTVFJJQlVJPz9PIE4/Ty1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YT8/byBkZXN0YSBsaWNlbj9hLCB2b2M/IChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSA/IFVuaXZlcnNpZGFkZSAKWFhYIChTaWdsYSBkYSBVbml2ZXJzaWRhZGUpIG8gZGlyZWl0byBuP28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSAKZGlzdHJpYnVpciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyP25pY28gZSAKZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zID91ZGlvIG91IHY/ZGVvLgoKVm9jPyBjb25jb3JkYSBxdWUgYSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZT9kbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhPz9vLgoKVm9jPyB0YW1iP20gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGM/cGlhIGEgc3VhIHRlc2Ugb3UgCmRpc3NlcnRhPz9vIHBhcmEgZmlucyBkZSBzZWd1cmFuP2EsIGJhY2stdXAgZSBwcmVzZXJ2YT8/by4KClZvYz8gZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byA/IG9yaWdpbmFsIGUgcXVlIHZvYz8gdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgCm5lc3RhIGxpY2VuP2EuIFZvYz8gdGFtYj9tIGRlY2xhcmEgcXVlIG8gZGVwP3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGE/P28gbj9vLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3U/bS4KCkNhc28gYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jPyBuP28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jPyAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzcz9vIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgPyBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgCm9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbj9hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Q/IGNsYXJhbWVudGUgCmlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlP2RvIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgVEVTRSBPVSBESVNTRVJUQT8/TyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0M/TklPIE9VIApBUE9JTyBERSBVTUEgQUc/TkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTj9PIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0M/IERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJUz9PIENPTU8gClRBTUI/TSBBUyBERU1BSVMgT0JSSUdBPz9FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28sIGUgbj9vIGZhcj8gcXVhbHF1ZXIgYWx0ZXJhPz9vLCBhbD9tIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2VuP2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.uefs.br:8080/PUBhttp://tede2.uefs.br:8080/oai/requestbcuefs@uefs.br|| bcref@uefs.br||bcuefs@uefs.bropendoar:2023-12-06T18:23:13Biblioteca Digital de Teses e Dissertações da UEFS - Universidade Estadual de Feira de Santana (UEFS)false
dc.title.por.fl_str_mv Caracterização de usuários no Instagram
title Caracterização de usuários no Instagram
spellingShingle Caracterização de usuários no Instagram
Oliveira, Rodrigo Ribeiro
Redes sociais
Aprendizagem de máquina
Inteligência artificial
Caracterização de usuário
Machine learning
Social media
User characterization
Artificial intelligence
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
SISTEMAS DE COMPUTACAO::TELEINFORMATICA
METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO
title_short Caracterização de usuários no Instagram
title_full Caracterização de usuários no Instagram
title_fullStr Caracterização de usuários no Instagram
title_full_unstemmed Caracterização de usuários no Instagram
title_sort Caracterização de usuários no Instagram
author Oliveira, Rodrigo Ribeiro
author_facet Oliveira, Rodrigo Ribeiro
author_role author
dc.contributor.advisor1.fl_str_mv Rocha Junior, João Batista da
dc.contributor.advisor1ID.fl_str_mv 02778818464
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6304377549101792
dc.contributor.authorID.fl_str_mv 05783557528
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/3053104537804643
dc.contributor.author.fl_str_mv Oliveira, Rodrigo Ribeiro
contributor_str_mv Rocha Junior, João Batista da
dc.subject.por.fl_str_mv Redes sociais
Aprendizagem de máquina
Inteligência artificial
Caracterização de usuário
topic Redes sociais
Aprendizagem de máquina
Inteligência artificial
Caracterização de usuário
Machine learning
Social media
User characterization
Artificial intelligence
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
SISTEMAS DE COMPUTACAO::TELEINFORMATICA
METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO
dc.subject.eng.fl_str_mv Machine learning
Social media
User characterization
Artificial intelligence
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
SISTEMAS DE COMPUTACAO::TELEINFORMATICA
METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO
description With the popularization of social media, more and more data is created, generating new opportunities of extracting knowledge from it. An example of social media that became popular in recent years is Instagram, whose focus is image sharing. For marketing purposes, the characterization of users is a very important task, because it allows to deliver specific advertisements for each group of users. This approach allows for applications in marketing, pointing to users within an intended demography. This problem is tackled in this work, in particular, the determination of age range and professional area in Instagram users that are native speakers of Portuguese. Two datasets of Instagram profiles were built, one labeled with the age range and another with the professional area of the users. The classifiers Random Forest and Support Vector Machines were used for determining these characteristics, through textual and behavioral attributes. The best results achieved have a accuracy of 60\%, performance superior to the baseline for each problem.
publishDate 2021
dc.date.issued.fl_str_mv 2021-07-16
dc.date.accessioned.fl_str_mv 2023-08-09T15:21:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Rodrigo Ribeiro. Caracterização de usuários no Instagram. 2021. 117 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação) - Universidade Estadual de Feira de Santana, Feira de Santana, 2021.
dc.identifier.uri.fl_str_mv http://tede2.uefs.br:8080/handle/tede/1507
identifier_str_mv OLIVEIRA, Rodrigo Ribeiro. Caracterização de usuários no Instagram. 2021. 117 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação) - Universidade Estadual de Feira de Santana, Feira de Santana, 2021.
url http://tede2.uefs.br:8080/handle/tede/1507
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 600
600
600
600
600
dc.relation.department.fl_str_mv 4335108523020347051
dc.relation.cnpq.fl_str_mv 3671711205811204509
-8816208982924656813
-651669516009542875
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual de Feira de Santana
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UEFS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv DEPARTAMENTO DE TECNOLOGIA
publisher.none.fl_str_mv Universidade Estadual de Feira de Santana
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UEFS
instname:Universidade Estadual de Feira de Santana (UEFS)
instacron:UEFS
instname_str Universidade Estadual de Feira de Santana (UEFS)
instacron_str UEFS
institution UEFS
reponame_str Biblioteca Digital de Teses e Dissertações da UEFS
collection Biblioteca Digital de Teses e Dissertações da UEFS
bitstream.url.fl_str_mv http://tede2.uefs.br:8080/bitstream/tede/1507/2/Dissertacao_rodrigo_PGCC_v2.pdf
http://tede2.uefs.br:8080/bitstream/tede/1507/1/license.txt
bitstream.checksum.fl_str_mv 4094a253b89ac217f9a7e1b85e3fc9a2
7b5ba3d2445355f386edab96125d42b7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UEFS - Universidade Estadual de Feira de Santana (UEFS)
repository.mail.fl_str_mv bcuefs@uefs.br|| bcref@uefs.br||bcuefs@uefs.br
_version_ 1809288785517608960