Pré-processamento de tweets visando melhorar resultados de NERD
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/xmlui/handle/123456789/171438 |
Resumo: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação. |
id |
UFSC_196bb40206d2c1b35d4efb3effe637d6 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/171438 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Pré-processamento de tweets visando melhorar resultados de NERDReconhecimento de Entidades NomeadasDesambiguação de Entidades NomeadasMídias SociaisTweetsPré-processamento de dados de microblogsTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.O enriquecimento semântico das postagens em mídias sociais pode trazer diversos benefícios em aplicações. Todavia, as técnicas e ferramentas de extração de informação atualmente presentes na literatura não trabalham adequadamente com dados provenientes dessas fontes, os quais estão sujeitos a ruídos diversos. Este trabalho propõe um método para filtragem de tweets baseado em normalização léxica visando diminuir ruídos e obter melhores resultados nas tarefas de reconhecimento e desambiguação de entidades nomeadas (NERD). Para realizar tal proposta, este trabalho apresenta uma revisão do estado-da-arte sobre o reconhecimento e desambiguação de entidades nomeadas com foco em mídias sociais, bem como revisa propostas para uma etapa preliminar de filtragem de tweets. De modo a verificar a qualidade do método proposto, foram realizados experimentos com a ferramenta FOX e observou-se um aumento de 5% no número de entidades nomeadas reconhecidas após a normalização léxica dos tweets.The semantic enrichment of posts in social media can bring several benefits in applications. However, the information extraction techniques and tools currently available in the literature are not prepared to work with data from these sources, which are very affected by noises. This work proposes a method for filtering tweets based on lexical normalization to reduce noise and obtain better results in the recognition and naming entity disambiguation (NERD) tasks. To accomplish this, this paper presents a state-of-the-art review of the recognition and disambiguation of social media-focused entities, as well as reviews proposals for a preliminary tweeting filtering step. In order to verify the quality of the proposed method, experiments were performed with the FOX tool and a 5% increase in the number of named entities recognized after the lexical normalization of the tweets was observed.Florianópolis, SCFileto, RenatoUniversidade Federal de Santa CatarinaFenali, Suelen Cardoso2016-12-12T22:10:13Z2016-12-12T22:10:13Z2016-12-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis81 f.application/pdfhttps://repositorio.ufsc.br/xmlui/handle/123456789/171438porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2016-12-12T22:10:13Zoai:repositorio.ufsc.br:123456789/171438Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732016-12-12T22:10:13Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Pré-processamento de tweets visando melhorar resultados de NERD |
title |
Pré-processamento de tweets visando melhorar resultados de NERD |
spellingShingle |
Pré-processamento de tweets visando melhorar resultados de NERD Fenali, Suelen Cardoso Reconhecimento de Entidades Nomeadas Desambiguação de Entidades Nomeadas Mídias Sociais Tweets Pré-processamento de dados de microblogs |
title_short |
Pré-processamento de tweets visando melhorar resultados de NERD |
title_full |
Pré-processamento de tweets visando melhorar resultados de NERD |
title_fullStr |
Pré-processamento de tweets visando melhorar resultados de NERD |
title_full_unstemmed |
Pré-processamento de tweets visando melhorar resultados de NERD |
title_sort |
Pré-processamento de tweets visando melhorar resultados de NERD |
author |
Fenali, Suelen Cardoso |
author_facet |
Fenali, Suelen Cardoso |
author_role |
author |
dc.contributor.none.fl_str_mv |
Fileto, Renato Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Fenali, Suelen Cardoso |
dc.subject.por.fl_str_mv |
Reconhecimento de Entidades Nomeadas Desambiguação de Entidades Nomeadas Mídias Sociais Tweets Pré-processamento de dados de microblogs |
topic |
Reconhecimento de Entidades Nomeadas Desambiguação de Entidades Nomeadas Mídias Sociais Tweets Pré-processamento de dados de microblogs |
description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-12-12T22:10:13Z 2016-12-12T22:10:13Z 2016-12-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/xmlui/handle/123456789/171438 |
url |
https://repositorio.ufsc.br/xmlui/handle/123456789/171438 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
81 f. application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC |
publisher.none.fl_str_mv |
Florianópolis, SC |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808651986557468672 |