Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa

Detalhes bibliográficos
Autor(a) principal: Ferreira, Vinicius Hartmann
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/5207
Resumo: The construction of ontologies is a complex process that includes steps such as extraction of domain concepts, as well as the extraction of taxonomic and non-taxonomic relations between these concepts. The step of extracting non-taxonomic relations is the most neglected, specially for texts in portuguese. This dissertation presents a proposal for extracting non-taxonomic relations from texts in portuguese (corpora). These texts are represented by a list of domain concepts and contextual informations extracted by the tool ExATOlp. An application of the proposed process was performed with corpora of five domains and analysis on the relevance of the concepts, the specificity of relations and relations extracted application was made. Through this analysis, the proposed process seemed to be relevant and is considered the main contribution of this dissertation. Additionally, a tool for visualizing the extracted non-taxonomic relations, useful for various linguistic applications, is also proposed.
id P_RS_a53426bf4306ba349cdb0f7f723c62ef
oai_identifier_str oai:tede2.pucrs.br:tede/5207
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Vieira, RenataCPF:45133433034http://lattes.cnpq.br/6218967777630412CPF:01259167011Ferreira, Vinicius Hartmann2015-04-14T14:49:58Z2013-03-112012-12-11FERREIRA, Vinicius Hartmann. Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa. 2012. 86 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.http://tede2.pucrs.br/tede2/handle/tede/5207The construction of ontologies is a complex process that includes steps such as extraction of domain concepts, as well as the extraction of taxonomic and non-taxonomic relations between these concepts. The step of extracting non-taxonomic relations is the most neglected, specially for texts in portuguese. This dissertation presents a proposal for extracting non-taxonomic relations from texts in portuguese (corpora). These texts are represented by a list of domain concepts and contextual informations extracted by the tool ExATOlp. An application of the proposed process was performed with corpora of five domains and analysis on the relevance of the concepts, the specificity of relations and relations extracted application was made. Through this analysis, the proposed process seemed to be relevant and is considered the main contribution of this dissertation. Additionally, a tool for visualizing the extracted non-taxonomic relations, useful for various linguistic applications, is also proposed.A construção de ontologias é um processo complexo que compreende etapas como a extração de conceitos de domínio, bem como a extração de relações taxonômicas e não-taxonômicas entre esses conceitos. A etapa de extração de relações não-taxonômicas é a mais negligenciada, especialmente para textos na língua portuguesa. Essa dissertação apresenta uma proposta de extração de relações não-taxonômicas a partir de textos em língua portuguesa (corpora). Esses textos são representados por uma lista de conceitos e informações contextuais automaticamente extraídos pela ferramenta ExATOlp. Uma aplicação do processo proposto foi realizada com corpora de cinco domínios e uma análise sobre a relevância dos conceitos, a especifidade das relações e a aplicação das relações extraídas foi realizada. Através dessa análise o processo proposto mostrou-se relevante, sendo considerado a principal contribuição dessa dissertação. Adicionalmente, uma ferramenta para visualização das relações não-taxonômicas extraídas, útil para diversas aplicações linguísticas, também é proposta.Made available in DSpace on 2015-04-14T14:49:58Z (GMT). No. of bitstreams: 1 446187.pdf: 2000156 bytes, checksum: d69c6168cd6efd48f1f38ca794de2813 (MD5) Previous issue date: 2012-12-11application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/15276/446187.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBRFaculdade de InformácaINFORMÁTICAONTOLOGIAPROCESSAMENTO DA LINGUAGEM NATURALCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL446187.pdf.jpg446187.pdf.jpgimage/jpeg3508http://tede2.pucrs.br/tede2/bitstream/tede/5207/3/446187.pdf.jpg852ab15fd20fbe110c2880bbcdf788d8MD53TEXT446187.pdf.txt446187.pdf.txttext/plain130503http://tede2.pucrs.br/tede2/bitstream/tede/5207/2/446187.pdf.txt976ecbf9e0f78a4dbfc6f4d1af7eb055MD52ORIGINAL446187.pdfapplication/pdf2000156http://tede2.pucrs.br/tede2/bitstream/tede/5207/1/446187.pdfd69c6168cd6efd48f1f38ca794de2813MD51tede/52072015-04-17 11:57:31.678oai:tede2.pucrs.br:tede/5207Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:31Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
title Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
spellingShingle Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
Ferreira, Vinicius Hartmann
INFORMÁTICA
ONTOLOGIA
PROCESSAMENTO DA LINGUAGEM NATURAL
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
title_full Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
title_fullStr Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
title_full_unstemmed Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
title_sort Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
author Ferreira, Vinicius Hartmann
author_facet Ferreira, Vinicius Hartmann
author_role author
dc.contributor.advisor1.fl_str_mv Vieira, Renata
dc.contributor.advisor1ID.fl_str_mv CPF:45133433034
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6218967777630412
dc.contributor.authorID.fl_str_mv CPF:01259167011
dc.contributor.author.fl_str_mv Ferreira, Vinicius Hartmann
contributor_str_mv Vieira, Renata
dc.subject.por.fl_str_mv INFORMÁTICA
ONTOLOGIA
PROCESSAMENTO DA LINGUAGEM NATURAL
topic INFORMÁTICA
ONTOLOGIA
PROCESSAMENTO DA LINGUAGEM NATURAL
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The construction of ontologies is a complex process that includes steps such as extraction of domain concepts, as well as the extraction of taxonomic and non-taxonomic relations between these concepts. The step of extracting non-taxonomic relations is the most neglected, specially for texts in portuguese. This dissertation presents a proposal for extracting non-taxonomic relations from texts in portuguese (corpora). These texts are represented by a list of domain concepts and contextual informations extracted by the tool ExATOlp. An application of the proposed process was performed with corpora of five domains and analysis on the relevance of the concepts, the specificity of relations and relations extracted application was made. Through this analysis, the proposed process seemed to be relevant and is considered the main contribution of this dissertation. Additionally, a tool for visualizing the extracted non-taxonomic relations, useful for various linguistic applications, is also proposed.
publishDate 2012
dc.date.issued.fl_str_mv 2012-12-11
dc.date.available.fl_str_mv 2013-03-11
dc.date.accessioned.fl_str_mv 2015-04-14T14:49:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERREIRA, Vinicius Hartmann. Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa. 2012. 86 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/5207
identifier_str_mv FERREIRA, Vinicius Hartmann. Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa. 2012. 86 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.
url http://tede2.pucrs.br/tede2/handle/tede/5207
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 500
600
dc.relation.department.fl_str_mv 1946639708616176246
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Faculdade de Informáca
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/5207/3/446187.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/5207/2/446187.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/5207/1/446187.pdf
bitstream.checksum.fl_str_mv 852ab15fd20fbe110c2880bbcdf788d8
976ecbf9e0f78a4dbfc6f4d1af7eb055
d69c6168cd6efd48f1f38ca794de2813
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765306139213824