Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais

Detalhes bibliográficos
Autor(a) principal: Pereira Júnior, Vilmar César
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/205444
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.
id UFSC_114e2529a732226b81e1ee4befe00e1c
oai_identifier_str oai:repositorio.ufsc.br:123456789/205444
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Universidade Federal de Santa CatarinaPereira Júnior, Vilmar CésarFileto, Renato2020-03-31T13:42:06Z2020-03-31T13:42:06Z2018360034https://repositorio.ufsc.br/handle/123456789/205444Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.Clipes textuais (Textual Clips - TCs), tais como postagens em mídias sociais e uma variedade de outros textos livres possivelmente georreferenciados, podem conter muitas informações. No entanto, a análise adequada de um TC requer a captura da semântica do que é mencionado em seu conteúdo, filtrando o que é de interesse para determinados domínios de aplicação e estruturando as informações extraídas de maneira adequada para análise. Este trabalho propõe uma abordagem para analisar incidências de menções de interesse para domínios de aplicação específicos em TCs, a qual combina as tecnologias de Web Se- mântica e Business Intelligence (BI). Esta abordagem é suportada por um processo de Extração, Transformação e Carga (ETL) de dados que anota semanticamente TCs com dados abertos ligados (Linked Open Data - LOD), filtra recursos de interesse nas anotações usando pontes definidas neste trabalho entre classes LOD e uma ontologia de domínio de alto nível, aprimora essas pontes e adapta hierarquias existentes de classes e instâncias de LOD para servir como dimensões para análise de informação. A abordagem foi validada em um estudo de caso que analisa menções a itens de interesse para negócios (business) em tweets. Resultados experimentais mostram que uma quantidade considerável de tweets recentemente enviados do Brasil têm ao menos uma menção de interesse para o domínio de negócios e que a abordagem proposta permite análises que não são suportadas pelos atuais sistemas de BI para dados de mídias sociais.Abstract : Textual clips, such as social media posts and a variety of other time- stamped and sometimes georreferenced free text, can carry lots of infor- mation. However, their proper analysis requires capturing the seman- tics of what is mentioned in their contents, filtering what is of interest for particular application domains, and structuring the extracted in- formation in a suitable way for analysis. In this work, we propose an approach to analyze the incidences of mentions of interest for particular application domains in textual clips, by combining Semantic Web and Business Intelligence (BI) technologies. This approach is supported by a data Extraction, Transformation and Loading (ETL) process that semantically annotates textual clips with Linked Open Data (LOD), fil- ters LOD resources of interest in the annotations using bridges between LOD classes and a high-level domain ontology, improves those bridges, and adapts existing hierarchies of LOD classes and instances accor- dingly to serve as information analysis dimensions. This approach is validated in a case study that analyzes mentions to things of interest for business in tweets. Experimental results show that a considerable amount of the tweets recently sent from Brazil have at least a mention to something of interest for business and that the proposed appro- ach enables analyses that are not supported by current BI systems for analyzing social media data.86 p.| il., gráfs., tabs.porInformáticaComputaçãoWeb semânticaMídia socialArmazenamento de dadosDados ligadosUma abordagem semântica para analisar menções de interesse em um domínio em clipes textuaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPGCC1131-D.pdfPGCC1131-D.pdfapplication/pdf1699515https://repositorio.ufsc.br/bitstream/123456789/205444/-1/PGCC1131-D.pdf380900d720e6ea04671b64457a8d2a65MD5-1123456789/2054442020-03-31 10:42:06.459oai:repositorio.ufsc.br:123456789/205444Repositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732020-03-31T13:42:06Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais
title Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais
spellingShingle Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais
Pereira Júnior, Vilmar César
Informática
Computação
Web semântica
Mídia social
Armazenamento de dados
Dados ligados
title_short Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais
title_full Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais
title_fullStr Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais
title_full_unstemmed Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais
title_sort Uma abordagem semântica para analisar menções de interesse em um domínio em clipes textuais
author Pereira Júnior, Vilmar César
author_facet Pereira Júnior, Vilmar César
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Pereira Júnior, Vilmar César
dc.contributor.advisor1.fl_str_mv Fileto, Renato
contributor_str_mv Fileto, Renato
dc.subject.classification.none.fl_str_mv Informática
Computação
Web semântica
Mídia social
Armazenamento de dados
Dados ligados
topic Informática
Computação
Web semântica
Mídia social
Armazenamento de dados
Dados ligados
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2020-03-31T13:42:06Z
dc.date.available.fl_str_mv 2020-03-31T13:42:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/205444
dc.identifier.other.none.fl_str_mv 360034
identifier_str_mv 360034
url https://repositorio.ufsc.br/handle/123456789/205444
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 86 p.| il., gráfs., tabs.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/205444/-1/PGCC1131-D.pdf
bitstream.checksum.fl_str_mv 380900d720e6ea04671b64457a8d2a65
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1766805218392014848