Caracterização de usuários no Instagram
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UEFS |
Texto Completo: | http://tede2.uefs.br:8080/handle/tede/1507 |
Resumo: | With the popularization of social media, more and more data is created, generating new opportunities of extracting knowledge from it. An example of social media that became popular in recent years is Instagram, whose focus is image sharing. For marketing purposes, the characterization of users is a very important task, because it allows to deliver specific advertisements for each group of users. This approach allows for applications in marketing, pointing to users within an intended demography. This problem is tackled in this work, in particular, the determination of age range and professional area in Instagram users that are native speakers of Portuguese. Two datasets of Instagram profiles were built, one labeled with the age range and another with the professional area of the users. The classifiers Random Forest and Support Vector Machines were used for determining these characteristics, through textual and behavioral attributes. The best results achieved have a accuracy of 60\%, performance superior to the baseline for each problem. |
id |
UEFS_465b3ac15fe07160fcba71ec3e99af12 |
---|---|
oai_identifier_str |
oai:tede2.uefs.br:8080:tede/1507 |
network_acronym_str |
UEFS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UEFS |
repository_id_str |
|
spelling |
Rocha Junior, João Batista da02778818464http://lattes.cnpq.br/630437754910179205783557528http://lattes.cnpq.br/3053104537804643Oliveira, Rodrigo Ribeiro2023-08-09T15:21:06Z2021-07-16OLIVEIRA, Rodrigo Ribeiro. Caracterização de usuários no Instagram. 2021. 117 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação) - Universidade Estadual de Feira de Santana, Feira de Santana, 2021.http://tede2.uefs.br:8080/handle/tede/1507With the popularization of social media, more and more data is created, generating new opportunities of extracting knowledge from it. An example of social media that became popular in recent years is Instagram, whose focus is image sharing. For marketing purposes, the characterization of users is a very important task, because it allows to deliver specific advertisements for each group of users. This approach allows for applications in marketing, pointing to users within an intended demography. This problem is tackled in this work, in particular, the determination of age range and professional area in Instagram users that are native speakers of Portuguese. Two datasets of Instagram profiles were built, one labeled with the age range and another with the professional area of the users. The classifiers Random Forest and Support Vector Machines were used for determining these characteristics, through textual and behavioral attributes. The best results achieved have a accuracy of 60\%, performance superior to the baseline for each problem.Com o advento e popularização de redes sociais, cada vez mais dados são gerados a partir delas, ensejando oportunidades de obtenção de conhecimento útil. Uma dessas redes é o Instagram, voltada para o compartilhamento de imagens. Um dos ramos de análise que pode ser realizada em redes sociais é a descoberta de características de usuários. Esta abordagem possibilita aplicações na área publicitária, indicando quais os usuários que estejam dentro de uma demografia que se queira alcançar, cobrindo uma área para a qual o Instagram não fornece ferramentas. Este trabalho se volta para este problema, tratando da caracterização de área profissional e faixa etária de perfis do Instagram, cujos usuários são falantes da língua portuguesa, onde há uma carência de trabalhos relacionados. Para isso, dois conjuntos de dados com perfis de usuários do Instagram, que são falantes da língua portuguesa, foram construídos, um deles rotulado com faixa etária e outro com área profissional. Foi realizada a classificação dessas características usando os classificadores Random Forest e Support Vector Machines, através de atributos textuais e comportamentais. Os resultados alcançados chegam a uma acurácia de cerca de 60\%, com desempenho acima do baseline.Submitted by Amanda Ponce (aponce@uefs.br) on 2023-08-09T15:21:06Z No. of bitstreams: 1 Dissertacao_rodrigo_PGCC_v2.pdf: 3301107 bytes, checksum: 4094a253b89ac217f9a7e1b85e3fc9a2 (MD5)Made available in DSpace on 2023-08-09T15:21:06Z (GMT). No. of bitstreams: 1 Dissertacao_rodrigo_PGCC_v2.pdf: 3301107 bytes, checksum: 4094a253b89ac217f9a7e1b85e3fc9a2 (MD5) Previous issue date: 2021-07-16application/pdfporUniversidade Estadual de Feira de SantanaPrograma de Pós-Graduação em Ciência da ComputaçãoUEFSBrasilDEPARTAMENTO DE TECNOLOGIARedes sociaisAprendizagem de máquinaInteligência artificialCaracterização de usuárioMachine learningSocial mediaUser characterizationArtificial intelligenceCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSISTEMAS DE COMPUTACAO::TELEINFORMATICAMETODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAOCaracterização de usuários no Instagraminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis197499653308127447060060060060060043351085230203470513671711205811204509-8816208982924656813-651669516009542875info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UEFSinstname:Universidade Estadual de Feira de Santana (UEFS)instacron:UEFSORIGINALDissertacao_rodrigo_PGCC_v2.pdfDissertacao_rodrigo_PGCC_v2.pdfapplication/pdf3301107http://tede2.uefs.br:8080/bitstream/tede/1507/2/Dissertacao_rodrigo_PGCC_v2.pdf4094a253b89ac217f9a7e1b85e3fc9a2MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82089http://tede2.uefs.br:8080/bitstream/tede/1507/1/license.txt7b5ba3d2445355f386edab96125d42b7MD51tede/15072023-12-06 15:23:13.53oai:tede2.uefs.br:8080:tede/1507Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSP1BSSUEgTElDRU4/QQpFc3RhIGxpY2VuP2EgZGUgZXhlbXBsbyA/IGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOP0EgREUgRElTVFJJQlVJPz9PIE4/Ty1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YT8/byBkZXN0YSBsaWNlbj9hLCB2b2M/IChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSA/IFVuaXZlcnNpZGFkZSAKWFhYIChTaWdsYSBkYSBVbml2ZXJzaWRhZGUpIG8gZGlyZWl0byBuP28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSAKZGlzdHJpYnVpciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyP25pY28gZSAKZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zID91ZGlvIG91IHY/ZGVvLgoKVm9jPyBjb25jb3JkYSBxdWUgYSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZT9kbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhPz9vLgoKVm9jPyB0YW1iP20gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGM/cGlhIGEgc3VhIHRlc2Ugb3UgCmRpc3NlcnRhPz9vIHBhcmEgZmlucyBkZSBzZWd1cmFuP2EsIGJhY2stdXAgZSBwcmVzZXJ2YT8/by4KClZvYz8gZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byA/IG9yaWdpbmFsIGUgcXVlIHZvYz8gdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgCm5lc3RhIGxpY2VuP2EuIFZvYz8gdGFtYj9tIGRlY2xhcmEgcXVlIG8gZGVwP3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGE/P28gbj9vLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3U/bS4KCkNhc28gYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jPyBuP28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jPyAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzcz9vIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgPyBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgCm9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbj9hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Q/IGNsYXJhbWVudGUgCmlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlP2RvIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgVEVTRSBPVSBESVNTRVJUQT8/TyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0M/TklPIE9VIApBUE9JTyBERSBVTUEgQUc/TkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTj9PIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0M/IERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJUz9PIENPTU8gClRBTUI/TSBBUyBERU1BSVMgT0JSSUdBPz9FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGE/P28sIGUgbj9vIGZhcj8gcXVhbHF1ZXIgYWx0ZXJhPz9vLCBhbD9tIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2VuP2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.uefs.br:8080/PUBhttp://tede2.uefs.br:8080/oai/requestbcuefs@uefs.br|| bcref@uefs.br||bcuefs@uefs.bropendoar:2023-12-06T18:23:13Biblioteca Digital de Teses e Dissertações da UEFS - Universidade Estadual de Feira de Santana (UEFS)false |
dc.title.por.fl_str_mv |
Caracterização de usuários no Instagram |
title |
Caracterização de usuários no Instagram |
spellingShingle |
Caracterização de usuários no Instagram Oliveira, Rodrigo Ribeiro Redes sociais Aprendizagem de máquina Inteligência artificial Caracterização de usuário Machine learning Social media User characterization Artificial intelligence CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO SISTEMAS DE COMPUTACAO::TELEINFORMATICA METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO |
title_short |
Caracterização de usuários no Instagram |
title_full |
Caracterização de usuários no Instagram |
title_fullStr |
Caracterização de usuários no Instagram |
title_full_unstemmed |
Caracterização de usuários no Instagram |
title_sort |
Caracterização de usuários no Instagram |
author |
Oliveira, Rodrigo Ribeiro |
author_facet |
Oliveira, Rodrigo Ribeiro |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Rocha Junior, João Batista da |
dc.contributor.advisor1ID.fl_str_mv |
02778818464 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6304377549101792 |
dc.contributor.authorID.fl_str_mv |
05783557528 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/3053104537804643 |
dc.contributor.author.fl_str_mv |
Oliveira, Rodrigo Ribeiro |
contributor_str_mv |
Rocha Junior, João Batista da |
dc.subject.por.fl_str_mv |
Redes sociais Aprendizagem de máquina Inteligência artificial Caracterização de usuário |
topic |
Redes sociais Aprendizagem de máquina Inteligência artificial Caracterização de usuário Machine learning Social media User characterization Artificial intelligence CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO SISTEMAS DE COMPUTACAO::TELEINFORMATICA METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO |
dc.subject.eng.fl_str_mv |
Machine learning Social media User characterization Artificial intelligence |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO SISTEMAS DE COMPUTACAO::TELEINFORMATICA METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO |
description |
With the popularization of social media, more and more data is created, generating new opportunities of extracting knowledge from it. An example of social media that became popular in recent years is Instagram, whose focus is image sharing. For marketing purposes, the characterization of users is a very important task, because it allows to deliver specific advertisements for each group of users. This approach allows for applications in marketing, pointing to users within an intended demography. This problem is tackled in this work, in particular, the determination of age range and professional area in Instagram users that are native speakers of Portuguese. Two datasets of Instagram profiles were built, one labeled with the age range and another with the professional area of the users. The classifiers Random Forest and Support Vector Machines were used for determining these characteristics, through textual and behavioral attributes. The best results achieved have a accuracy of 60\%, performance superior to the baseline for each problem. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-07-16 |
dc.date.accessioned.fl_str_mv |
2023-08-09T15:21:06Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
OLIVEIRA, Rodrigo Ribeiro. Caracterização de usuários no Instagram. 2021. 117 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação) - Universidade Estadual de Feira de Santana, Feira de Santana, 2021. |
dc.identifier.uri.fl_str_mv |
http://tede2.uefs.br:8080/handle/tede/1507 |
identifier_str_mv |
OLIVEIRA, Rodrigo Ribeiro. Caracterização de usuários no Instagram. 2021. 117 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação) - Universidade Estadual de Feira de Santana, Feira de Santana, 2021. |
url |
http://tede2.uefs.br:8080/handle/tede/1507 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
1974996533081274470 |
dc.relation.confidence.fl_str_mv |
600 600 600 600 600 |
dc.relation.department.fl_str_mv |
4335108523020347051 |
dc.relation.cnpq.fl_str_mv |
3671711205811204509 -8816208982924656813 -651669516009542875 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual de Feira de Santana |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UEFS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
DEPARTAMENTO DE TECNOLOGIA |
publisher.none.fl_str_mv |
Universidade Estadual de Feira de Santana |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UEFS instname:Universidade Estadual de Feira de Santana (UEFS) instacron:UEFS |
instname_str |
Universidade Estadual de Feira de Santana (UEFS) |
instacron_str |
UEFS |
institution |
UEFS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UEFS |
collection |
Biblioteca Digital de Teses e Dissertações da UEFS |
bitstream.url.fl_str_mv |
http://tede2.uefs.br:8080/bitstream/tede/1507/2/Dissertacao_rodrigo_PGCC_v2.pdf http://tede2.uefs.br:8080/bitstream/tede/1507/1/license.txt |
bitstream.checksum.fl_str_mv |
4094a253b89ac217f9a7e1b85e3fc9a2 7b5ba3d2445355f386edab96125d42b7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UEFS - Universidade Estadual de Feira de Santana (UEFS) |
repository.mail.fl_str_mv |
bcuefs@uefs.br|| bcref@uefs.br||bcuefs@uefs.br |
_version_ |
1809288785517608960 |