Extração automática de contextos definitórios em textos acadêmicos da ciência da informação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio.unb.br/handle/10482/10954 |
Resumo: | Dissertação (mestrado)—Universidade Brasília, Faculdade de Ciência da Informação, 2012. |
id |
UNB_1452d68bc314942b298e408b0e30712f |
---|---|
oai_identifier_str |
oai:repositorio.unb.br:10482/10954 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informaçãoTerminologiaCiência da informação - linguísticaOrganização da informaçãoDissertação (mestrado)—Universidade Brasília, Faculdade de Ciência da Informação, 2012.O trabalho apresenta estudo sobre o papel da Ciência da Informação, sua interdisciplinaridade e interseção com a Linguística e a Ciência da Computação no que se refere à utilização dos textos como fonte de informação e conhecimento a ser organizado ou reorganizado, nos grandes repositórios de informação já existentes, com a finalidade de recuperação. A ênfase é na extração automática de Contextos Definitórios (CD) em textos, o que se entende como qualquer fragmento textual que introduz e associa um termo a uma definição. Cita teorias de Organização da Informação como Classificação Facetada de Ranganathan, a teoria do Conceito de Dahlberg e as teorias da terminologia, tais como a Teoria Geral da Terminologia de Wüster e a Teoria Comunicativa da Terminologia de Cabré. Todas as teorias são abordadas com enfoque na importância do termo e principalmente da definição como elemento primordial para o mapeamento semântico de um documento e de um domínio do conhecimento. Enfatiza a visão da definição como elemento de ligação entre os objetos e seus conceitos, identifica tipos de definições, cita estudos anteriores de identificação e extração automática de enunciados definitórios em inglês, espanhol e francês. Menciona as técnicas de Processamento de Linguagem Natural e Descoberta de Conhecimento em Textos como ferramentas para o processamento e extração de informação em documentos escritos em língua natural. Por fim, propõe um método de extração automática de Contextos Definitórios em textos acadêmicos da Ciência da Informação, a partir de uma gramática de padrões definitórios em língua portuguesa criada no âmbito da pesquisa. Entende-se gramática de padrões definitórios como um conjunto de expressões linguísticas capazes de identificar um CD em um texto. A gramática foi validada comparando uma extração manual com uma automática. O método foi aplicado nas teses e dissertações da Faculdade de Ciência da Informação da Universidade de Brasília - UNB, disponibilizadas a partir de seu repositório RIUnb, de 2006 a 2011. _________________________________________________________________________ ABSTRACTThe paper presents a study on the role of Information Science, and its interdisciplinary intersection with Linguistics and Computer Science with regard to the use of texts as a source of information and knowledge to be organized or reorganized, in large information repositories existing, with recovery purposes. The emphasis is on automatic extraction of Definitory Context (DC) in texts, which is understood as any fragment of text that introduces and associate a term with a definition. It makes reference to the theories of Information Organization and Faceted Classification of Ranganathan’s theory of concept Dahlberg and theories of terminology, such as the General Theory of Terminology of Wüster’s and the Communicative Theory of Terminology of Cabré’s. All theories are discussed with emphasis on the importance of the term and the definition as a major element for the semantic mapping of a document and a domain of knowledge. It emphasizes the view of the definition as a liaison between the objects and their concepts, identifies types of settings, make reference to previous studies of automatic identification and extraction of Definitory Enunciation in English, Spanish and French. It mentions techniques of Natural Language Processing and Knowledge Discovery in Texts as tools for processing and extraction of information in documents written in natural language. Finally, it proposes a method for automatic extraction of Contexts in academic texts of Information Science, from a Definitory grammar patters in Portuguese established within the research. It is understood that Definitories grammar patters as a set of that linguistic expressions can identify a DC in a text. The grammar was validated by comparing an automatic with a manual extraction. The method was applied in thesis and dissertations at the Faculty of Information Science at the University of Brasilia - UNB, available from it repository RIUnB, from 2006 to 2011.Medeiros, Marisa Bräscher BasílioOliveira Junior, Carlos Duarte de2012-07-17T12:59:22Z2012-07-17T12:59:22Z2012-07-172012-04-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfOLIVEIRA JUNIOR, Carlos Duarte de. Extração automática de contextos definitórios em textos acadêmicos da ciência da informação. 2012. 116 f. Dissertação (Mestrado em Ciência da Informação)—Universidade Brasília, Brasília, 2012.http://repositorio.unb.br/handle/10482/10954info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-13T12:54:29Zoai:repositorio.unb.br:10482/10954Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-13T12:54:29Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
spellingShingle |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação Oliveira Junior, Carlos Duarte de Terminologia Ciência da informação - linguística Organização da informação |
title_short |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title_full |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title_fullStr |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title_full_unstemmed |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title_sort |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
author |
Oliveira Junior, Carlos Duarte de |
author_facet |
Oliveira Junior, Carlos Duarte de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Medeiros, Marisa Bräscher Basílio |
dc.contributor.author.fl_str_mv |
Oliveira Junior, Carlos Duarte de |
dc.subject.por.fl_str_mv |
Terminologia Ciência da informação - linguística Organização da informação |
topic |
Terminologia Ciência da informação - linguística Organização da informação |
description |
Dissertação (mestrado)—Universidade Brasília, Faculdade de Ciência da Informação, 2012. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012-07-17T12:59:22Z 2012-07-17T12:59:22Z 2012-07-17 2012-04-19 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
OLIVEIRA JUNIOR, Carlos Duarte de. Extração automática de contextos definitórios em textos acadêmicos da ciência da informação. 2012. 116 f. Dissertação (Mestrado em Ciência da Informação)—Universidade Brasília, Brasília, 2012. http://repositorio.unb.br/handle/10482/10954 |
identifier_str_mv |
OLIVEIRA JUNIOR, Carlos Duarte de. Extração automática de contextos definitórios em textos acadêmicos da ciência da informação. 2012. 116 f. Dissertação (Mestrado em Ciência da Informação)—Universidade Brasília, Brasília, 2012. |
url |
http://repositorio.unb.br/handle/10482/10954 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
repositorio@unb.br |
_version_ |
1814508388094050304 |