Processamento de linguagem natural para indexação automática semântico-ontológica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio.unb.br/handle/10482/13768 |
Resumo: | Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2013. |
id |
UNB_019d475e438628608ab917d5151d846a |
---|---|
oai_identifier_str |
oai:repositorio.unb.br:10482/13768 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Processamento de linguagem natural para indexação automática semântico-ontológicaIndexação automáticaLinguística - processamento de dadosOntologiaSemânticaTese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2013.A pesquisa propõe uma arquitetura de indexação automática de documentos utilizando mecanismos de processamento de linguagem natural em nível semântico. Por meio do arranjo de ferramentas e recursos existentes, agregado ao desenvolvimento de software para integração, é construído um sistema de indexação automática que utiliza conhecimento modelado em uma ontologia para análise semântica. A aplicação da arquitetura é exemplificada e posta à prova em um conjunto de laudos periciais de crimes cibernéticos produzidos pela Perícia Criminal da Polícia Federal. Os resultados de pesquisa apontam para a melhoria que o aprofundamento à análise semântica do processamento de linguagem natural oferece para a seleção automática de descritores e, por extensão, para a recuperação da informação. Dentre as contribuições inéditas desta tese incluem-se a arquitetura de sistema de informação para indexação automática proposta, a ontologia construída para a análise semântica e as implementações em linguagem de programação Python. Por fim, o trabalho insere-se em uma área de pesquisa que tem sido cada vez mais investigada, no entanto ainda carece de resultados amadurecidos, qual seja o processamento de linguagem natural em língua portuguesa. __________________________________________________________________________ ABSTRACTThe research proposes an automatic indexing architecture of documents using natural language processing mechanisms on semantic level. By organizing existing tools and resources, added to software development for integration, an automatic indexing system which uses knowledge modeled by ontology to semantic analysis is built. The applicability of the architecture is exemplified and put into proof on forensics reports of cybercrimes produced by Federal Police Forensics Experts. The research results point to the benefits that semantic analysis on natural language processing offers to automatic descriptor selection and information retrieval. As contributions of this thesis there are the proposed automatic indexing information system architecture, the ontology built to semantic analysis and the implementations on Python programming language. Concluding, the work inserts itself in a research area that has been increasingly more investigated, however still demanding mature results, which is natural language processing on portuguese language.Faculdade de Ciência da Informação (FCI)Programa de Pós-Graduação em Ciência da InformaçãoMedeiros, Marisa Bräscher BasílioCâmara Júnior, Auto Tavares da2013-07-30T15:57:34Z2013-07-30T15:57:34Z2013-07-302013-04-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfCAMARA JUNIOR, Auto Tavares da. Processamento de linguagem natural para indexação automática semântico-ontológica. 2013. 180 f., il. Tese (Doutorado em Ciência da Informação)—Universidade de Brasília, Brasília, 2013.http://repositorio.unb.br/handle/10482/13768A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-14T16:25:40Zoai:repositorio.unb.br:10482/13768Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-14T16:25:40Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Processamento de linguagem natural para indexação automática semântico-ontológica |
title |
Processamento de linguagem natural para indexação automática semântico-ontológica |
spellingShingle |
Processamento de linguagem natural para indexação automática semântico-ontológica Câmara Júnior, Auto Tavares da Indexação automática Linguística - processamento de dados Ontologia Semântica |
title_short |
Processamento de linguagem natural para indexação automática semântico-ontológica |
title_full |
Processamento de linguagem natural para indexação automática semântico-ontológica |
title_fullStr |
Processamento de linguagem natural para indexação automática semântico-ontológica |
title_full_unstemmed |
Processamento de linguagem natural para indexação automática semântico-ontológica |
title_sort |
Processamento de linguagem natural para indexação automática semântico-ontológica |
author |
Câmara Júnior, Auto Tavares da |
author_facet |
Câmara Júnior, Auto Tavares da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Medeiros, Marisa Bräscher Basílio |
dc.contributor.author.fl_str_mv |
Câmara Júnior, Auto Tavares da |
dc.subject.por.fl_str_mv |
Indexação automática Linguística - processamento de dados Ontologia Semântica |
topic |
Indexação automática Linguística - processamento de dados Ontologia Semântica |
description |
Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2013. |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013-07-30T15:57:34Z 2013-07-30T15:57:34Z 2013-07-30 2013-04-11 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
CAMARA JUNIOR, Auto Tavares da. Processamento de linguagem natural para indexação automática semântico-ontológica. 2013. 180 f., il. Tese (Doutorado em Ciência da Informação)—Universidade de Brasília, Brasília, 2013. http://repositorio.unb.br/handle/10482/13768 |
identifier_str_mv |
CAMARA JUNIOR, Auto Tavares da. Processamento de linguagem natural para indexação automática semântico-ontológica. 2013. 180 f., il. Tese (Doutorado em Ciência da Informação)—Universidade de Brasília, Brasília, 2013. |
url |
http://repositorio.unb.br/handle/10482/13768 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
repositorio@unb.br |
_version_ |
1814508174814740480 |