Classificação de textos usando ontologias

Detalhes bibliográficos
Autor(a) principal: Guevara, Juan Florencio Valdivia
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFABC
Texto Completo: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574
Resumo: Orientadora: Profa. Dra. Debora Maria Rossi de Medeiros
id UFBC_bba6cac68b5a62803b72a26ffa4d22c9
oai_identifier_str oai:BDTD:106574
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling Classificação de textos usando ontologiasCLASSIFICAÇÃO DE TEXTOSONTOLOGIASTEXT CLASSIFICATIONONTOLOGIESPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCOrientadora: Profa. Dra. Debora Maria Rossi de MedeirosDissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, 2016.Em diversos domínios de conhecimento, uma das principais forma de divulgação de informação é por meio de documentos de texto. Exemplos são websites, artigos científicos, blogs, postagens em redes sociais e reviews de produtos/serviços. Dessa forma, extrair automaticamente informações desse tipo de fonte de dados se torna uma importante tarefa. Uma das formas mais clássicas de extração de informação de documentos textuais é chamada de classificação. Esta tarefa consiste de atribuir automaticamente a categoria a qual um texto pertence, com base em um conjunto de textos previamente categorizado. Extrair informação de documentos textuais é, em geral, uma tarefa desafiadora por lidar com uma forma não estruturada de dados, uma vez que uma mesma informação pode ser expressa de diversas manerias. Neste contexto, uma ontologia pode representar uma ferramenta poderosa para auxiliar a tarefa de extração de informação de textos. Ontologias são, em linhas gerais, dicionários de conceitos conectados por meio de relações semânticas. Este trabalho investiga o uso de ontologias na tarefa de classificação de textos. Foi proposta uma abordagem onde são criados novos atributos para descrever os textos de uma base com base nos conceitos de uma ontologia. Foram realizados experimentos com bases de textos benchmark amplamente utilizadas pela comunidade científica. Em geral, a abordagem proposta proporcionou vantagem em relação à abordagem convencional em cenários específicos. Esses cenários indicam uma região de potencias da nova abordagem que será melhor explorada em trabalhos futuros.In several knowledge areas, one of the main forms of spreading information is through textual documents. Some examples are websites, scientific papers, blogs, social media posts and product/service reviews. Thus, automatically extracting information from this type of data becomes an important task. One of the most classic information extraction task is text classification. This task consists of automatically assigning the category to which a text belongs, based on a previously categorized text set. Extracting information from textual data is, in general, a challenging task because it deals with unstructured data, once the same piece of information can be expressed by different ways. In this context, an ontology may be a powerful tool to aid information extraction from texts. In a nutshell, ontologies are dictionaries of concepts linked according to semantic relations. This project studies the usage of ontologies in the task of text classification. We proposed an approach where new features for describing the texts based on an ontology concepts. Experiments with benchmark text bases, widely employed by scientific community. In general, the proposed approach overcomes the conventional approach in specific scenarios. These scenarios point to potential areas where the new approach will be better explored in future work.Medeiros, Debora Maria Rossi deFrança, Fabricio Olivetti deSouza, Bruno Feres deGuevara, Juan Florencio Valdivia2016info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf96 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74721http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74722Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=106574porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2017-11-23T09:47:49Zoai:BDTD:106574Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2017-11-23T09:47:49Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.none.fl_str_mv Classificação de textos usando ontologias
title Classificação de textos usando ontologias
spellingShingle Classificação de textos usando ontologias
Guevara, Juan Florencio Valdivia
CLASSIFICAÇÃO DE TEXTOS
ONTOLOGIAS
TEXT CLASSIFICATION
ONTOLOGIES
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
title_short Classificação de textos usando ontologias
title_full Classificação de textos usando ontologias
title_fullStr Classificação de textos usando ontologias
title_full_unstemmed Classificação de textos usando ontologias
title_sort Classificação de textos usando ontologias
author Guevara, Juan Florencio Valdivia
author_facet Guevara, Juan Florencio Valdivia
author_role author
dc.contributor.none.fl_str_mv Medeiros, Debora Maria Rossi de
França, Fabricio Olivetti de
Souza, Bruno Feres de
dc.contributor.author.fl_str_mv Guevara, Juan Florencio Valdivia
dc.subject.por.fl_str_mv CLASSIFICAÇÃO DE TEXTOS
ONTOLOGIAS
TEXT CLASSIFICATION
ONTOLOGIES
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
topic CLASSIFICAÇÃO DE TEXTOS
ONTOLOGIAS
TEXT CLASSIFICATION
ONTOLOGIES
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
description Orientadora: Profa. Dra. Debora Maria Rossi de Medeiros
publishDate 2016
dc.date.none.fl_str_mv 2016
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74721
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74722
Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=106574
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
96 f. : il.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1801502099670827008