Pré-processamento de tweets visando melhorar resultados de NERD

Detalhes bibliográficos
Autor(a) principal: Fenali, Suelen Cardoso
Data de Publicação: 2016
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/171438
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.
id UFSC_196bb40206d2c1b35d4efb3effe637d6
oai_identifier_str oai:repositorio.ufsc.br:123456789/171438
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Pré-processamento de tweets visando melhorar resultados de NERDReconhecimento de Entidades NomeadasDesambiguação de Entidades NomeadasMídias SociaisTweetsPré-processamento de dados de microblogsTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.O enriquecimento semântico das postagens em mídias sociais pode trazer diversos benefícios em aplicações. Todavia, as técnicas e ferramentas de extração de informação atualmente presentes na literatura não trabalham adequadamente com dados provenientes dessas fontes, os quais estão sujeitos a ruídos diversos. Este trabalho propõe um método para filtragem de tweets baseado em normalização léxica visando diminuir ruídos e obter melhores resultados nas tarefas de reconhecimento e desambiguação de entidades nomeadas (NERD). Para realizar tal proposta, este trabalho apresenta uma revisão do estado-da-arte sobre o reconhecimento e desambiguação de entidades nomeadas com foco em mídias sociais, bem como revisa propostas para uma etapa preliminar de filtragem de tweets. De modo a verificar a qualidade do método proposto, foram realizados experimentos com a ferramenta FOX e observou-se um aumento de 5% no número de entidades nomeadas reconhecidas após a normalização léxica dos tweets.The semantic enrichment of posts in social media can bring several benefits in applications. However, the information extraction techniques and tools currently available in the literature are not prepared to work with data from these sources, which are very affected by noises. This work proposes a method for filtering tweets based on lexical normalization to reduce noise and obtain better results in the recognition and naming entity disambiguation (NERD) tasks. To accomplish this, this paper presents a state-of-the-art review of the recognition and disambiguation of social media-focused entities, as well as reviews proposals for a preliminary tweeting filtering step. In order to verify the quality of the proposed method, experiments were performed with the FOX tool and a 5% increase in the number of named entities recognized after the lexical normalization of the tweets was observed.Florianópolis, SCFileto, RenatoUniversidade Federal de Santa CatarinaFenali, Suelen Cardoso2016-12-12T22:10:13Z2016-12-12T22:10:13Z2016-12-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis81 f.application/pdfhttps://repositorio.ufsc.br/xmlui/handle/123456789/171438porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2016-12-12T22:10:13Zoai:repositorio.ufsc.br:123456789/171438Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732016-12-12T22:10:13Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Pré-processamento de tweets visando melhorar resultados de NERD
title Pré-processamento de tweets visando melhorar resultados de NERD
spellingShingle Pré-processamento de tweets visando melhorar resultados de NERD
Fenali, Suelen Cardoso
Reconhecimento de Entidades Nomeadas
Desambiguação de Entidades Nomeadas
Mídias Sociais
Tweets
Pré-processamento de dados de microblogs
title_short Pré-processamento de tweets visando melhorar resultados de NERD
title_full Pré-processamento de tweets visando melhorar resultados de NERD
title_fullStr Pré-processamento de tweets visando melhorar resultados de NERD
title_full_unstemmed Pré-processamento de tweets visando melhorar resultados de NERD
title_sort Pré-processamento de tweets visando melhorar resultados de NERD
author Fenali, Suelen Cardoso
author_facet Fenali, Suelen Cardoso
author_role author
dc.contributor.none.fl_str_mv Fileto, Renato
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Fenali, Suelen Cardoso
dc.subject.por.fl_str_mv Reconhecimento de Entidades Nomeadas
Desambiguação de Entidades Nomeadas
Mídias Sociais
Tweets
Pré-processamento de dados de microblogs
topic Reconhecimento de Entidades Nomeadas
Desambiguação de Entidades Nomeadas
Mídias Sociais
Tweets
Pré-processamento de dados de microblogs
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.
publishDate 2016
dc.date.none.fl_str_mv 2016-12-12T22:10:13Z
2016-12-12T22:10:13Z
2016-12-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/xmlui/handle/123456789/171438
url https://repositorio.ufsc.br/xmlui/handle/123456789/171438
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 81 f.
application/pdf
dc.publisher.none.fl_str_mv Florianópolis, SC
publisher.none.fl_str_mv Florianópolis, SC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808651986557468672