Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | http://tede2.pucrs.br/tede2/handle/tede/5207 |
Resumo: | The construction of ontologies is a complex process that includes steps such as extraction of domain concepts, as well as the extraction of taxonomic and non-taxonomic relations between these concepts. The step of extracting non-taxonomic relations is the most neglected, specially for texts in portuguese. This dissertation presents a proposal for extracting non-taxonomic relations from texts in portuguese (corpora). These texts are represented by a list of domain concepts and contextual informations extracted by the tool ExATOlp. An application of the proposed process was performed with corpora of five domains and analysis on the relevance of the concepts, the specificity of relations and relations extracted application was made. Through this analysis, the proposed process seemed to be relevant and is considered the main contribution of this dissertation. Additionally, a tool for visualizing the extracted non-taxonomic relations, useful for various linguistic applications, is also proposed. |
id |
P_RS_a53426bf4306ba349cdb0f7f723c62ef |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/5207 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Vieira, RenataCPF:45133433034http://lattes.cnpq.br/6218967777630412CPF:01259167011Ferreira, Vinicius Hartmann2015-04-14T14:49:58Z2013-03-112012-12-11FERREIRA, Vinicius Hartmann. Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa. 2012. 86 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.http://tede2.pucrs.br/tede2/handle/tede/5207The construction of ontologies is a complex process that includes steps such as extraction of domain concepts, as well as the extraction of taxonomic and non-taxonomic relations between these concepts. The step of extracting non-taxonomic relations is the most neglected, specially for texts in portuguese. This dissertation presents a proposal for extracting non-taxonomic relations from texts in portuguese (corpora). These texts are represented by a list of domain concepts and contextual informations extracted by the tool ExATOlp. An application of the proposed process was performed with corpora of five domains and analysis on the relevance of the concepts, the specificity of relations and relations extracted application was made. Through this analysis, the proposed process seemed to be relevant and is considered the main contribution of this dissertation. Additionally, a tool for visualizing the extracted non-taxonomic relations, useful for various linguistic applications, is also proposed.A construção de ontologias é um processo complexo que compreende etapas como a extração de conceitos de domínio, bem como a extração de relações taxonômicas e não-taxonômicas entre esses conceitos. A etapa de extração de relações não-taxonômicas é a mais negligenciada, especialmente para textos na língua portuguesa. Essa dissertação apresenta uma proposta de extração de relações não-taxonômicas a partir de textos em língua portuguesa (corpora). Esses textos são representados por uma lista de conceitos e informações contextuais automaticamente extraídos pela ferramenta ExATOlp. Uma aplicação do processo proposto foi realizada com corpora de cinco domínios e uma análise sobre a relevância dos conceitos, a especifidade das relações e a aplicação das relações extraídas foi realizada. Através dessa análise o processo proposto mostrou-se relevante, sendo considerado a principal contribuição dessa dissertação. Adicionalmente, uma ferramenta para visualização das relações não-taxonômicas extraídas, útil para diversas aplicações linguísticas, também é proposta.Made available in DSpace on 2015-04-14T14:49:58Z (GMT). No. of bitstreams: 1 446187.pdf: 2000156 bytes, checksum: d69c6168cd6efd48f1f38ca794de2813 (MD5) Previous issue date: 2012-12-11application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/15276/446187.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBRFaculdade de InformácaINFORMÁTICAONTOLOGIAPROCESSAMENTO DA LINGUAGEM NATURALCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL446187.pdf.jpg446187.pdf.jpgimage/jpeg3508http://tede2.pucrs.br/tede2/bitstream/tede/5207/3/446187.pdf.jpg852ab15fd20fbe110c2880bbcdf788d8MD53TEXT446187.pdf.txt446187.pdf.txttext/plain130503http://tede2.pucrs.br/tede2/bitstream/tede/5207/2/446187.pdf.txt976ecbf9e0f78a4dbfc6f4d1af7eb055MD52ORIGINAL446187.pdfapplication/pdf2000156http://tede2.pucrs.br/tede2/bitstream/tede/5207/1/446187.pdfd69c6168cd6efd48f1f38ca794de2813MD51tede/52072015-04-17 11:57:31.678oai:tede2.pucrs.br:tede/5207Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:31Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa |
title |
Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa |
spellingShingle |
Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa Ferreira, Vinicius Hartmann INFORMÁTICA ONTOLOGIA PROCESSAMENTO DA LINGUAGEM NATURAL CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa |
title_full |
Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa |
title_fullStr |
Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa |
title_full_unstemmed |
Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa |
title_sort |
Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa |
author |
Ferreira, Vinicius Hartmann |
author_facet |
Ferreira, Vinicius Hartmann |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Vieira, Renata |
dc.contributor.advisor1ID.fl_str_mv |
CPF:45133433034 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6218967777630412 |
dc.contributor.authorID.fl_str_mv |
CPF:01259167011 |
dc.contributor.author.fl_str_mv |
Ferreira, Vinicius Hartmann |
contributor_str_mv |
Vieira, Renata |
dc.subject.por.fl_str_mv |
INFORMÁTICA ONTOLOGIA PROCESSAMENTO DA LINGUAGEM NATURAL |
topic |
INFORMÁTICA ONTOLOGIA PROCESSAMENTO DA LINGUAGEM NATURAL CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
The construction of ontologies is a complex process that includes steps such as extraction of domain concepts, as well as the extraction of taxonomic and non-taxonomic relations between these concepts. The step of extracting non-taxonomic relations is the most neglected, specially for texts in portuguese. This dissertation presents a proposal for extracting non-taxonomic relations from texts in portuguese (corpora). These texts are represented by a list of domain concepts and contextual informations extracted by the tool ExATOlp. An application of the proposed process was performed with corpora of five domains and analysis on the relevance of the concepts, the specificity of relations and relations extracted application was made. Through this analysis, the proposed process seemed to be relevant and is considered the main contribution of this dissertation. Additionally, a tool for visualizing the extracted non-taxonomic relations, useful for various linguistic applications, is also proposed. |
publishDate |
2012 |
dc.date.issued.fl_str_mv |
2012-12-11 |
dc.date.available.fl_str_mv |
2013-03-11 |
dc.date.accessioned.fl_str_mv |
2015-04-14T14:49:58Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FERREIRA, Vinicius Hartmann. Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa. 2012. 86 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012. |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/5207 |
identifier_str_mv |
FERREIRA, Vinicius Hartmann. Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa. 2012. 86 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012. |
url |
http://tede2.pucrs.br/tede2/handle/tede/5207 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
1974996533081274470 |
dc.relation.confidence.fl_str_mv |
500 600 |
dc.relation.department.fl_str_mv |
1946639708616176246 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Faculdade de Informáca |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/5207/3/446187.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/5207/2/446187.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/5207/1/446187.pdf |
bitstream.checksum.fl_str_mv |
852ab15fd20fbe110c2880bbcdf788d8 976ecbf9e0f78a4dbfc6f4d1af7eb055 d69c6168cd6efd48f1f38ca794de2813 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765306139213824 |