Extração automática de contextos definitórios em textos acadêmicos da ciência da informação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Revista Ibero-americana de Ciência da Informação |
Texto Completo: | https://periodicos.unb.br/index.php/RICI/article/view/2264 |
Resumo: | O trabalho apresenta estudo sobre o papel da Ciência da Informação, sua interdisciplinaridade e interseção com a Linguística e a Ciência da Computação no que se refere à utilização dos textos como fonte de informação e conhecimento a ser organizado ou reorganizado, nos grandes repositórios de informação já existentes, com a finalidade de recuperação. A ênfase é na extração automática de Contextos Definitórios em textos, o que se entende como qualquer fragmento textual que introduz e associa um termo a uma definição. Cita teorias de Organização da Informação como Classificação Facetada de Ranganathan, a teoria do Conceito de Dahlberg e as teorias da terminologia, tais como a Teoria Geral da Terminologia de Wüster e a Teoria Comunicativa da Terminologia de Cabré. Todas as teorias são abordadas com enfoque na importância do termo e principalmente da definição como elemento primordial para o mapeamento semântico de um documento e de um domínio do conhecimento. Enfatiza a visão da definição como elemento de ligação entre os objetos e seus conceitos, identifica tipos de definições, cita estudos anteriores de identificação e extração automática de enunciados definitórios em inglês, espanhol e francês. Menciona as técnicas de Processamento de Linguagem Natural e Descoberta de Conhecimento em Textos como ferramentas para o processamento e extração de informação em documentos escritos em língua natural. Por fim, propõe um método de extração automática de Contextos Definitórios em textos acadêmicos da Ciência da Informação, a partir de uma gramática de padrões definitórios em língua portuguesa criada no âmbito da pesquisa. Entende-se gramática de padrões definitórios como um conjunto de expressões linguísticas capazes de identificar um CD em um texto. A gramática foi validada comparando uma extração manual com uma automática. O método foi aplicado nas teses e dissertações da Faculdade de Ciência da Informação |
id |
UNB-7_2a407d56a6886947c5def85bab959376 |
---|---|
oai_identifier_str |
oai:ojs.pkp.sfu.ca:article/2264 |
network_acronym_str |
UNB-7 |
network_name_str |
Revista Ibero-americana de Ciência da Informação |
repository_id_str |
|
spelling |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informaçãocontexto definitórioextração automática de textosorganização da informaçãoterminologiacontexto definitorioextracción automática de textosorganización de la informaciónterminologiadefinitive contextautomatic text extractionorganization of informationterminologyO trabalho apresenta estudo sobre o papel da Ciência da Informação, sua interdisciplinaridade e interseção com a Linguística e a Ciência da Computação no que se refere à utilização dos textos como fonte de informação e conhecimento a ser organizado ou reorganizado, nos grandes repositórios de informação já existentes, com a finalidade de recuperação. A ênfase é na extração automática de Contextos Definitórios em textos, o que se entende como qualquer fragmento textual que introduz e associa um termo a uma definição. Cita teorias de Organização da Informação como Classificação Facetada de Ranganathan, a teoria do Conceito de Dahlberg e as teorias da terminologia, tais como a Teoria Geral da Terminologia de Wüster e a Teoria Comunicativa da Terminologia de Cabré. Todas as teorias são abordadas com enfoque na importância do termo e principalmente da definição como elemento primordial para o mapeamento semântico de um documento e de um domínio do conhecimento. Enfatiza a visão da definição como elemento de ligação entre os objetos e seus conceitos, identifica tipos de definições, cita estudos anteriores de identificação e extração automática de enunciados definitórios em inglês, espanhol e francês. Menciona as técnicas de Processamento de Linguagem Natural e Descoberta de Conhecimento em Textos como ferramentas para o processamento e extração de informação em documentos escritos em língua natural. Por fim, propõe um método de extração automática de Contextos Definitórios em textos acadêmicos da Ciência da Informação, a partir de uma gramática de padrões definitórios em língua portuguesa criada no âmbito da pesquisa. Entende-se gramática de padrões definitórios como um conjunto de expressões linguísticas capazes de identificar um CD em um texto. A gramática foi validada comparando uma extração manual com uma automática. O método foi aplicado nas teses e dissertações da Faculdade de Ciência da InformaçãoUniversidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação2016-03-02info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/htmlhttps://periodicos.unb.br/index.php/RICI/article/view/2264Revista Ibero-Americana de Ciência da Informação; Vol. 9 No. 1 (2016); 324Revista Ibero-Americana de Ciência da Informação; Vol. 9 Núm. 1 (2016); 324Revista Ibero-Americana de Ciência da Informação; v. 9 n. 1 (2016); 3241983-521310.26512/rici.v9.n1.2016reponame:Revista Ibero-americana de Ciência da Informaçãoinstname:Universidade de Brasília (UnB)instacron:UNBporhttps://periodicos.unb.br/index.php/RICI/article/view/2264/2011https://periodicos.unb.br/index.php/RICI/article/view/2264/6098Copyright (c) 2016 Carlos Duarte de Oliveira Juniorhttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessOliveira Junior, Carlos Duarte de2021-03-30T23:39:11Zoai:ojs.pkp.sfu.ca:article/2264Revistahttps://periodicos.unb.br/index.php/RICI/indexPUBhttps://periodicos.unb.br/index.php/RICI/oai||rici@unb.br1983-52131983-5213opendoar:2021-03-30T23:39:11Revista Ibero-americana de Ciência da Informação - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
spellingShingle |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação Oliveira Junior, Carlos Duarte de contexto definitório extração automática de textos organização da informação terminologia contexto definitorio extracción automática de textos organización de la información terminologia definitive context automatic text extraction organization of information terminology |
title_short |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title_full |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title_fullStr |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title_full_unstemmed |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
title_sort |
Extração automática de contextos definitórios em textos acadêmicos da ciência da informação |
author |
Oliveira Junior, Carlos Duarte de |
author_facet |
Oliveira Junior, Carlos Duarte de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Oliveira Junior, Carlos Duarte de |
dc.subject.por.fl_str_mv |
contexto definitório extração automática de textos organização da informação terminologia contexto definitorio extracción automática de textos organización de la información terminologia definitive context automatic text extraction organization of information terminology |
topic |
contexto definitório extração automática de textos organização da informação terminologia contexto definitorio extracción automática de textos organización de la información terminologia definitive context automatic text extraction organization of information terminology |
description |
O trabalho apresenta estudo sobre o papel da Ciência da Informação, sua interdisciplinaridade e interseção com a Linguística e a Ciência da Computação no que se refere à utilização dos textos como fonte de informação e conhecimento a ser organizado ou reorganizado, nos grandes repositórios de informação já existentes, com a finalidade de recuperação. A ênfase é na extração automática de Contextos Definitórios em textos, o que se entende como qualquer fragmento textual que introduz e associa um termo a uma definição. Cita teorias de Organização da Informação como Classificação Facetada de Ranganathan, a teoria do Conceito de Dahlberg e as teorias da terminologia, tais como a Teoria Geral da Terminologia de Wüster e a Teoria Comunicativa da Terminologia de Cabré. Todas as teorias são abordadas com enfoque na importância do termo e principalmente da definição como elemento primordial para o mapeamento semântico de um documento e de um domínio do conhecimento. Enfatiza a visão da definição como elemento de ligação entre os objetos e seus conceitos, identifica tipos de definições, cita estudos anteriores de identificação e extração automática de enunciados definitórios em inglês, espanhol e francês. Menciona as técnicas de Processamento de Linguagem Natural e Descoberta de Conhecimento em Textos como ferramentas para o processamento e extração de informação em documentos escritos em língua natural. Por fim, propõe um método de extração automática de Contextos Definitórios em textos acadêmicos da Ciência da Informação, a partir de uma gramática de padrões definitórios em língua portuguesa criada no âmbito da pesquisa. Entende-se gramática de padrões definitórios como um conjunto de expressões linguísticas capazes de identificar um CD em um texto. A gramática foi validada comparando uma extração manual com uma automática. O método foi aplicado nas teses e dissertações da Faculdade de Ciência da Informação |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-03-02 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://periodicos.unb.br/index.php/RICI/article/view/2264 |
url |
https://periodicos.unb.br/index.php/RICI/article/view/2264 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://periodicos.unb.br/index.php/RICI/article/view/2264/2011 https://periodicos.unb.br/index.php/RICI/article/view/2264/6098 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2016 Carlos Duarte de Oliveira Junior https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2016 Carlos Duarte de Oliveira Junior https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf text/html |
dc.publisher.none.fl_str_mv |
Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação |
publisher.none.fl_str_mv |
Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação |
dc.source.none.fl_str_mv |
Revista Ibero-Americana de Ciência da Informação; Vol. 9 No. 1 (2016); 324 Revista Ibero-Americana de Ciência da Informação; Vol. 9 Núm. 1 (2016); 324 Revista Ibero-Americana de Ciência da Informação; v. 9 n. 1 (2016); 324 1983-5213 10.26512/rici.v9.n1.2016 reponame:Revista Ibero-americana de Ciência da Informação instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Revista Ibero-americana de Ciência da Informação |
collection |
Revista Ibero-americana de Ciência da Informação |
repository.name.fl_str_mv |
Revista Ibero-americana de Ciência da Informação - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
||rici@unb.br |
_version_ |
1800210998225797120 |