Classification of Social Media Posts according to their Relevance

Detalhes bibliográficos
Autor(a) principal: Pinto, Alexandre
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/97347
Resumo: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
id RCAP_afc2480315ca6a816b5baa1ba422504a
oai_identifier_str oai:estudogeral.uc.pt:10316/97347
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Classification of Social Media Posts according to their RelevanceRelevance AssessmentSocial MiningInformation ExtractionNatural Language ProcessingAutomatic Text ClassificationDetecção de RelevânciaExtracção de Dados SociaisExtracção de ConhecimentoProcessamento de Linguagem NaturalClassificação Automática de TextoDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.Given the overwhelming quantity of messages posted in social networks, in order to to make their utilization more productive, it is imperative to lter out irrelevant information. This work is focused on the automatic classi cation of public social data according to its potential relevance to a general audience, according to journalistic criteria. This means ltering out information that is private, personal, not important or simply irrelevant to the public, improving the the overall quality of the social media information. A range of natural language processing toolkits was rst assessed while performing a set of standard tasks in popular datasets that cover newspaper and social network text. After that, di erent learning models were tested, using linguistic features extracted by some of the previous toolkits. The prediction of journalistic criteria, key in the assessment of relevance, was also explored, using the same features. A new classi er uses the journalist predictions, made by an ensemble of linguistic classi ers, as features to detect relevance. The obtained model achieved a F1 score of 0.82 with an area under the curve(AUC) equal to 0.78.Dada a grande quantidade de dados publicada em redes sociais, e imperativo ltrar informa c~ao irrelevante. Este trabalho foca-se na detec c~ao autom atica de dados sociais p ublicos de acordo com a sua relev^ancia para a audi^encia em geral. Isto signi ca ltrar informa c~ao que e privada, pessoal, n~ao importante, ou simplesmente irrelevante para o p ublico, melhorando assim a qualidade da informa c~ao. Um conjunto de ferramentas de linguagem em processamento natural e testado em uma s erie de tarefas padr~ao com um conjunto de dados que cobrem conte udo jornal stico e texto social. Para al em disso, diferentes modelos de aprendizagem s~ao testados, usando caracter sticas lingu sticas extra das atrav es de tarefas de processamento de linguagem natural, bem como crit erios jornal sticos. O sistema nal usa as previs~oes jornal sticas, realizadas por um conjunto de classi cadores lingu sticos, como atributos para detectar relev^ancia. O modelo obtido alcan cou um valor de F1 de 0.82 com uma area debaixo da curva(AUC) igual a 0.78.2016-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/97347http://hdl.handle.net/10316/97347engPinto, Alexandreinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T04:38:47Zoai:estudogeral.uc.pt:10316/97347Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:15:24.550152Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Classification of Social Media Posts according to their Relevance
title Classification of Social Media Posts according to their Relevance
spellingShingle Classification of Social Media Posts according to their Relevance
Pinto, Alexandre
Relevance Assessment
Social Mining
Information Extraction
Natural Language Processing
Automatic Text Classification
Detecção de Relevância
Extracção de Dados Sociais
Extracção de Conhecimento
Processamento de Linguagem Natural
Classificação Automática de Texto
title_short Classification of Social Media Posts according to their Relevance
title_full Classification of Social Media Posts according to their Relevance
title_fullStr Classification of Social Media Posts according to their Relevance
title_full_unstemmed Classification of Social Media Posts according to their Relevance
title_sort Classification of Social Media Posts according to their Relevance
author Pinto, Alexandre
author_facet Pinto, Alexandre
author_role author
dc.contributor.author.fl_str_mv Pinto, Alexandre
dc.subject.por.fl_str_mv Relevance Assessment
Social Mining
Information Extraction
Natural Language Processing
Automatic Text Classification
Detecção de Relevância
Extracção de Dados Sociais
Extracção de Conhecimento
Processamento de Linguagem Natural
Classificação Automática de Texto
topic Relevance Assessment
Social Mining
Information Extraction
Natural Language Processing
Automatic Text Classification
Detecção de Relevância
Extracção de Dados Sociais
Extracção de Conhecimento
Processamento de Linguagem Natural
Classificação Automática de Texto
description Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
publishDate 2016
dc.date.none.fl_str_mv 2016-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/97347
http://hdl.handle.net/10316/97347
url http://hdl.handle.net/10316/97347
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134050868264960