Sistemas de informação em linguagem natural : em busca de uma indexação automática

Detalhes bibliográficos
Autor(a) principal: Brito, Marcílio de
Data de Publicação: 1992
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/12892
Resumo: Este artigo aborda o tratamento automático de linguagens naturais, particularmente a descrição do conteúdo informacional de textos, para melhorar sua indexação e preencher os requisitos dos sistemas de informação documentária, a partir de elementos fornecidos pela estruturação dos sintagmas nominais (SN). Uma nova ferramenta para análise morfossintática foi criada e desenvolvida com a linguagem de programação Starlet, baseada na teoria de Gramáticas Afixos, gramáticas em dois níveis, resultante do trabalho anterior de C. H. A. Koster. Usando-se gramáticas em dois níveis, aumentou-se a capacidade descritiva desta nova linguagem e produziu-se um simples e elegante modelo que possibilitou uma representação mais detalhada dos procedimentos de análise. Um corpo maior constituído de textos da Agence France Presse (AFP News Brieves) foi usado para testar o analisador morfossintático. Os resultados demonstraram claramente a capacidade das gramáticas em dois níveis para alcançar a formalização de fenômenos lingüísticos. As vantagens importantes deste método repousam na capacidade de se ter controle mais específico sobre a aplicação das regras de análise. Uma descrição mais sintática conduza programas mais bem adaptados ao meio computadorizado e às necessidades lingüísticas.
id UNB_620265941221571ad59eedb4aa8ffcd7
oai_identifier_str oai:repositorio.unb.br:10482/12892
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Sistemas de informação em linguagem natural : em busca de uma indexação automáticaInformation systems in natural languages : looking for an automatic indexingRecuperação da informaçãoIndexação automáticaLinguagem naturalLinguagem documentáriaEste artigo aborda o tratamento automático de linguagens naturais, particularmente a descrição do conteúdo informacional de textos, para melhorar sua indexação e preencher os requisitos dos sistemas de informação documentária, a partir de elementos fornecidos pela estruturação dos sintagmas nominais (SN). Uma nova ferramenta para análise morfossintática foi criada e desenvolvida com a linguagem de programação Starlet, baseada na teoria de Gramáticas Afixos, gramáticas em dois níveis, resultante do trabalho anterior de C. H. A. Koster. Usando-se gramáticas em dois níveis, aumentou-se a capacidade descritiva desta nova linguagem e produziu-se um simples e elegante modelo que possibilitou uma representação mais detalhada dos procedimentos de análise. Um corpo maior constituído de textos da Agence France Presse (AFP News Brieves) foi usado para testar o analisador morfossintático. Os resultados demonstraram claramente a capacidade das gramáticas em dois níveis para alcançar a formalização de fenômenos lingüísticos. As vantagens importantes deste método repousam na capacidade de se ter controle mais específico sobre a aplicação das regras de análise. Uma descrição mais sintática conduza programas mais bem adaptados ao meio computadorizado e às necessidades lingüísticas.This paper deals with the automatic treatment of natural languages, particularly the informational description of texts in order to improve their indexing and match the requirements of documentary information systems from noun phrase structured elements. A new tool for morpho-syntactic analysis was created and developed with the programming language Starlet based on the theory of Affix Grammars, two-level grammars, which resulted from C. H. A. Koster's early work. Using two-level grammars increased the descriptive power of this new language and produced a simple and elegant frame that allowed a more detailed representation of the analysis procedures. A large corpus of texts from Agence France Presse (AFP News Brieves) was used to test the morpno-syntatic analyser. The results clearly demonstrated the power of two-level grammars to reach linguistics phenomena formalization. The main advantages of this method lay in the ability to have stricter control on analysis rules. A better syntatic description leads to programs better adapted to computerized environment and linguistics needs.Faculdade de Ciência da Informação (FCI)Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)2013-04-24T17:21:52Z2013-04-24T17:21:52Z1992-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfBRITO, Marcílio de. Sistemas de informação em linguagem natural: em busca de uma indexação automática. Ciência da Informação, Brasília, DF, v. 21, n. 3, p. 223-232, set./dez. 1992. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/view/1300>. Acesso em: 23 abr. 2013.http://repositorio.unb.br/handle/10482/12892Revista Ciência da Informação - Esta obra está licenciada sob uma Licença Creative Commons (Attribution 3.0 Unported (CC BY 3.0)). Fonte: http://revista.ibict.br/ciinf/. Acesso em: 23 abr. 2013.info:eu-repo/semantics/openAccessBrito, Marcílio deporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-03T18:41:44Zoai:repositorio.unb.br:10482/12892Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-03T18:41:44Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Sistemas de informação em linguagem natural : em busca de uma indexação automática
Information systems in natural languages : looking for an automatic indexing
title Sistemas de informação em linguagem natural : em busca de uma indexação automática
spellingShingle Sistemas de informação em linguagem natural : em busca de uma indexação automática
Brito, Marcílio de
Recuperação da informação
Indexação automática
Linguagem natural
Linguagem documentária
title_short Sistemas de informação em linguagem natural : em busca de uma indexação automática
title_full Sistemas de informação em linguagem natural : em busca de uma indexação automática
title_fullStr Sistemas de informação em linguagem natural : em busca de uma indexação automática
title_full_unstemmed Sistemas de informação em linguagem natural : em busca de uma indexação automática
title_sort Sistemas de informação em linguagem natural : em busca de uma indexação automática
author Brito, Marcílio de
author_facet Brito, Marcílio de
author_role author
dc.contributor.author.fl_str_mv Brito, Marcílio de
dc.subject.por.fl_str_mv Recuperação da informação
Indexação automática
Linguagem natural
Linguagem documentária
topic Recuperação da informação
Indexação automática
Linguagem natural
Linguagem documentária
description Este artigo aborda o tratamento automático de linguagens naturais, particularmente a descrição do conteúdo informacional de textos, para melhorar sua indexação e preencher os requisitos dos sistemas de informação documentária, a partir de elementos fornecidos pela estruturação dos sintagmas nominais (SN). Uma nova ferramenta para análise morfossintática foi criada e desenvolvida com a linguagem de programação Starlet, baseada na teoria de Gramáticas Afixos, gramáticas em dois níveis, resultante do trabalho anterior de C. H. A. Koster. Usando-se gramáticas em dois níveis, aumentou-se a capacidade descritiva desta nova linguagem e produziu-se um simples e elegante modelo que possibilitou uma representação mais detalhada dos procedimentos de análise. Um corpo maior constituído de textos da Agence France Presse (AFP News Brieves) foi usado para testar o analisador morfossintático. Os resultados demonstraram claramente a capacidade das gramáticas em dois níveis para alcançar a formalização de fenômenos lingüísticos. As vantagens importantes deste método repousam na capacidade de se ter controle mais específico sobre a aplicação das regras de análise. Uma descrição mais sintática conduza programas mais bem adaptados ao meio computadorizado e às necessidades lingüísticas.
publishDate 1992
dc.date.none.fl_str_mv 1992-09
2013-04-24T17:21:52Z
2013-04-24T17:21:52Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv BRITO, Marcílio de. Sistemas de informação em linguagem natural: em busca de uma indexação automática. Ciência da Informação, Brasília, DF, v. 21, n. 3, p. 223-232, set./dez. 1992. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/view/1300>. Acesso em: 23 abr. 2013.
http://repositorio.unb.br/handle/10482/12892
identifier_str_mv BRITO, Marcílio de. Sistemas de informação em linguagem natural: em busca de uma indexação automática. Ciência da Informação, Brasília, DF, v. 21, n. 3, p. 223-232, set./dez. 1992. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/view/1300>. Acesso em: 23 abr. 2013.
url http://repositorio.unb.br/handle/10482/12892
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)
publisher.none.fl_str_mv Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508399246704640