Classificação de textos usando ontologias
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFABC |
Texto Completo: | http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574 |
Resumo: | Orientadora: Profa. Dra. Debora Maria Rossi de Medeiros |
id |
UFBC_bba6cac68b5a62803b72a26ffa4d22c9 |
---|---|
oai_identifier_str |
oai:BDTD:106574 |
network_acronym_str |
UFBC |
network_name_str |
Repositório Institucional da UFABC |
repository_id_str |
|
spelling |
Classificação de textos usando ontologiasCLASSIFICAÇÃO DE TEXTOSONTOLOGIASTEXT CLASSIFICATIONONTOLOGIESPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCOrientadora: Profa. Dra. Debora Maria Rossi de MedeirosDissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, 2016.Em diversos domínios de conhecimento, uma das principais forma de divulgação de informação é por meio de documentos de texto. Exemplos são websites, artigos científicos, blogs, postagens em redes sociais e reviews de produtos/serviços. Dessa forma, extrair automaticamente informações desse tipo de fonte de dados se torna uma importante tarefa. Uma das formas mais clássicas de extração de informação de documentos textuais é chamada de classificação. Esta tarefa consiste de atribuir automaticamente a categoria a qual um texto pertence, com base em um conjunto de textos previamente categorizado. Extrair informação de documentos textuais é, em geral, uma tarefa desafiadora por lidar com uma forma não estruturada de dados, uma vez que uma mesma informação pode ser expressa de diversas manerias. Neste contexto, uma ontologia pode representar uma ferramenta poderosa para auxiliar a tarefa de extração de informação de textos. Ontologias são, em linhas gerais, dicionários de conceitos conectados por meio de relações semânticas. Este trabalho investiga o uso de ontologias na tarefa de classificação de textos. Foi proposta uma abordagem onde são criados novos atributos para descrever os textos de uma base com base nos conceitos de uma ontologia. Foram realizados experimentos com bases de textos benchmark amplamente utilizadas pela comunidade científica. Em geral, a abordagem proposta proporcionou vantagem em relação à abordagem convencional em cenários específicos. Esses cenários indicam uma região de potencias da nova abordagem que será melhor explorada em trabalhos futuros.In several knowledge areas, one of the main forms of spreading information is through textual documents. Some examples are websites, scientific papers, blogs, social media posts and product/service reviews. Thus, automatically extracting information from this type of data becomes an important task. One of the most classic information extraction task is text classification. This task consists of automatically assigning the category to which a text belongs, based on a previously categorized text set. Extracting information from textual data is, in general, a challenging task because it deals with unstructured data, once the same piece of information can be expressed by different ways. In this context, an ontology may be a powerful tool to aid information extraction from texts. In a nutshell, ontologies are dictionaries of concepts linked according to semantic relations. This project studies the usage of ontologies in the task of text classification. We proposed an approach where new features for describing the texts based on an ontology concepts. Experiments with benchmark text bases, widely employed by scientific community. In general, the proposed approach overcomes the conventional approach in specific scenarios. These scenarios point to potential areas where the new approach will be better explored in future work.Medeiros, Debora Maria Rossi deFrança, Fabricio Olivetti deSouza, Bruno Feres deGuevara, Juan Florencio Valdivia2016info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf96 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74721http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74722Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=106574porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2017-11-23T09:47:49Zoai:BDTD:106574Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2017-11-23T09:47:49Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false |
dc.title.none.fl_str_mv |
Classificação de textos usando ontologias |
title |
Classificação de textos usando ontologias |
spellingShingle |
Classificação de textos usando ontologias Guevara, Juan Florencio Valdivia CLASSIFICAÇÃO DE TEXTOS ONTOLOGIAS TEXT CLASSIFICATION ONTOLOGIES PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
title_short |
Classificação de textos usando ontologias |
title_full |
Classificação de textos usando ontologias |
title_fullStr |
Classificação de textos usando ontologias |
title_full_unstemmed |
Classificação de textos usando ontologias |
title_sort |
Classificação de textos usando ontologias |
author |
Guevara, Juan Florencio Valdivia |
author_facet |
Guevara, Juan Florencio Valdivia |
author_role |
author |
dc.contributor.none.fl_str_mv |
Medeiros, Debora Maria Rossi de França, Fabricio Olivetti de Souza, Bruno Feres de |
dc.contributor.author.fl_str_mv |
Guevara, Juan Florencio Valdivia |
dc.subject.por.fl_str_mv |
CLASSIFICAÇÃO DE TEXTOS ONTOLOGIAS TEXT CLASSIFICATION ONTOLOGIES PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
topic |
CLASSIFICAÇÃO DE TEXTOS ONTOLOGIAS TEXT CLASSIFICATION ONTOLOGIES PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
description |
Orientadora: Profa. Dra. Debora Maria Rossi de Medeiros |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574 |
url |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74721 http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74722 Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=106574 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 96 f. : il. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFABC instname:Universidade Federal do ABC (UFABC) instacron:UFABC |
instname_str |
Universidade Federal do ABC (UFABC) |
instacron_str |
UFABC |
institution |
UFABC |
reponame_str |
Repositório Institucional da UFABC |
collection |
Repositório Institucional da UFABC |
repository.name.fl_str_mv |
Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC) |
repository.mail.fl_str_mv |
|
_version_ |
1801502099670827008 |