User characterization in social media
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10773/21758 |
Resumo: | O crescimento acentuado das Redes Sociais que se verificou num passado recente, criou uma nova área de estudo na investigação em análise e extração de dados. A sua disseminação pela sociedade moderna torna-as uma fonte interessante para a aplicação de ciência dos dados, visto que auxiliam a perceção de comportamentos e padrões em dados sociais. Este tipo de informação possui valor estratégico em áreas como a publicidade e o marketing. Nesta dissertação é apresentado um protótipo para uma aplicação web que visa apresentar informação sobre a rede Twitter e os utilizadores que a compõem, através de esquemas de visualização de dados. Esta aplicação adota um modelo de dados de um grafo de propriedades, armazenado numa base de dados de grafos, para permitir uma análise eficiente das relações entre os dados existentes no Twitter. Para além disso, também faz uso de algoritmos de aprendizagem supervisionados e não-supervisionados, assim como análise estatística, para extrair padrões no conteúdo de tweets e prever atributos latentes em utilizadores do Twitter. O objetivo final é permitir a caraterização dos utilizadores Portugueses do Twitter, através da interpretação dos resultados apresentados. |
id |
RCAP_9f6e2a46bac490c997aef14a9639260a |
---|---|
oai_identifier_str |
oai:ria.ua.pt:10773/21758 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
User characterization in social mediaEngenharia de computadores e telemáticaBases de dadosAnálise de dadosGrafosO crescimento acentuado das Redes Sociais que se verificou num passado recente, criou uma nova área de estudo na investigação em análise e extração de dados. A sua disseminação pela sociedade moderna torna-as uma fonte interessante para a aplicação de ciência dos dados, visto que auxiliam a perceção de comportamentos e padrões em dados sociais. Este tipo de informação possui valor estratégico em áreas como a publicidade e o marketing. Nesta dissertação é apresentado um protótipo para uma aplicação web que visa apresentar informação sobre a rede Twitter e os utilizadores que a compõem, através de esquemas de visualização de dados. Esta aplicação adota um modelo de dados de um grafo de propriedades, armazenado numa base de dados de grafos, para permitir uma análise eficiente das relações entre os dados existentes no Twitter. Para além disso, também faz uso de algoritmos de aprendizagem supervisionados e não-supervisionados, assim como análise estatística, para extrair padrões no conteúdo de tweets e prever atributos latentes em utilizadores do Twitter. O objetivo final é permitir a caraterização dos utilizadores Portugueses do Twitter, através da interpretação dos resultados apresentados.The massive growth of Social Media platforms in recent years has created a new area of study for Data Mining research. Its general dissemination in modern society makes it a very interesting data science resource, as it enables the better understanding of social behavior and demographic statistics, information that has strategic value in business areas like marketing and advertising. This dissertation presents a prototype for a web application that provides a number of intuitive and interactive data visualization schemes that present information about the Twitter network and its individual users. This application leverages a property graph data model, modeled from a collection of millions of tweets from the Portuguese community and stored in a state of the art graph database, to enable an efficient analysis of the existent relationships in Twitter data. It also makes use of Supervised and Unsupervised learning algorithms, as well as statistical analysis, to extract meaningful patterns in tweets content and predict latent attributes in Twitter users. The end goal is to allow the characterization of the Portuguese users in Twitter, through the created visual representations of the achieved results.Universidade de Aveiro2018-01-24T11:10:38Z2016-12-23T00:00:00Z2016-12-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/21758TID:201934507engVicente, Miguel Reisinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:42:44Zoai:ria.ua.pt:10773/21758Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:56:08.398731Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
User characterization in social media |
title |
User characterization in social media |
spellingShingle |
User characterization in social media Vicente, Miguel Reis Engenharia de computadores e telemática Bases de dados Análise de dados Grafos |
title_short |
User characterization in social media |
title_full |
User characterization in social media |
title_fullStr |
User characterization in social media |
title_full_unstemmed |
User characterization in social media |
title_sort |
User characterization in social media |
author |
Vicente, Miguel Reis |
author_facet |
Vicente, Miguel Reis |
author_role |
author |
dc.contributor.author.fl_str_mv |
Vicente, Miguel Reis |
dc.subject.por.fl_str_mv |
Engenharia de computadores e telemática Bases de dados Análise de dados Grafos |
topic |
Engenharia de computadores e telemática Bases de dados Análise de dados Grafos |
description |
O crescimento acentuado das Redes Sociais que se verificou num passado recente, criou uma nova área de estudo na investigação em análise e extração de dados. A sua disseminação pela sociedade moderna torna-as uma fonte interessante para a aplicação de ciência dos dados, visto que auxiliam a perceção de comportamentos e padrões em dados sociais. Este tipo de informação possui valor estratégico em áreas como a publicidade e o marketing. Nesta dissertação é apresentado um protótipo para uma aplicação web que visa apresentar informação sobre a rede Twitter e os utilizadores que a compõem, através de esquemas de visualização de dados. Esta aplicação adota um modelo de dados de um grafo de propriedades, armazenado numa base de dados de grafos, para permitir uma análise eficiente das relações entre os dados existentes no Twitter. Para além disso, também faz uso de algoritmos de aprendizagem supervisionados e não-supervisionados, assim como análise estatística, para extrair padrões no conteúdo de tweets e prever atributos latentes em utilizadores do Twitter. O objetivo final é permitir a caraterização dos utilizadores Portugueses do Twitter, através da interpretação dos resultados apresentados. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-12-23T00:00:00Z 2016-12-23 2018-01-24T11:10:38Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10773/21758 TID:201934507 |
url |
http://hdl.handle.net/10773/21758 |
identifier_str_mv |
TID:201934507 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade de Aveiro |
publisher.none.fl_str_mv |
Universidade de Aveiro |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137615520202752 |