A ambiqüidade na recuperação da informação

Detalhes bibliográficos
Autor(a) principal: Brascher, Marisa
Data de Publicação: 2002
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional do IBICT - RIDI
Texto Completo: http://ridi.ibict.br/handle/123456789/284
Resumo: Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural.
id IBICT_506f061e03deb06853f94a3ccd1df0f6
oai_identifier_str oai:ridi.ibict.br:123456789/284
network_acronym_str IBICT
network_name_str Repositório Institucional do IBICT - RIDI
repository_id_str 2404
spelling 2012-06-27T18:01:43Z2012-06-27T18:01:43Z2002DataGramaZero - Revista de Ciência da Informação, v.3 n.1, 20021517-3801http://ridi.ibict.br/handle/123456789/284Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural.[en] Issues relative to information extraction from complete texts and subsequent retrieval by means of automatic natural language treatment methods are discussed. Besides extracting words from the text, the relationship of significance that these words have in the context of the speech in which they occur is attempted to be preserved. An information retrieval system using natural language should be able to treat given linguistic phenomena that affect the quality of information, such as, for instance, the issues of ambiguity. The Valence Grammar and the Conceptual Graphics are used as theoretical and methodological. An automatic natural language treatment system – Zstation – is utilized, as well as a pool of official documents concerning the Mercosul, for the ambiguity solutions tests. The conclusion is reached that a natural language treatment system can solve certain types of ambiguities when information is available regarding the syntactic-semantic valence of the lexical units that compose an enunciation. The results obtained show that it is possible to introduce automatic procedures for solving ambiguities in a natural language treatment system.Submitted by Sonia Burnier (sdesouza@ibict.br) on 2012-06-27T18:01:43Z No. of bitstreams: 1 BrascherDTZ2002.pdf: 142118 bytes, checksum: 013e673a71564c5e4f7a7e904758b07e (MD5)Made available in DSpace on 2012-06-27T18:01:43Z (GMT). No. of bitstreams: 1 BrascherDTZ2002.pdf: 142118 bytes, checksum: 013e673a71564c5e4f7a7e904758b07e (MD5) Previous issue date: 2002porIASIRecuperação da informaçãoTratamento automático da linguagem naturalAmbigüidadeValência sintático-semânticaGráficos conceituaisA ambiqüidade na recuperação da informaçãoAmbiguity in information retrievalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleBrascher, Marisainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional do IBICT - RIDIinstname:Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)instacron:IBICTORIGINALBrascherDTZ2002.pdfBrascherDTZ2002.pdfapplication/pdf142118http://ridi.ibict.br/bitstream/123456789/284/1/BrascherDTZ2002.pdf013e673a71564c5e4f7a7e904758b07eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://ridi.ibict.br/bitstream/123456789/284/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTBrascherDTZ2002.pdf.txtBrascherDTZ2002.pdf.txtExtracted texttext/plain63232http://ridi.ibict.br/bitstream/123456789/284/3/BrascherDTZ2002.pdf.txt598c61684b97892702641c047ea86455MD53123456789/2842016-06-22 16:23:00.546oai:ridi.ibict.br:123456789/284AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA=Repositório InstitucionalPUBhttps://ridi.ibict.br/oai/requestrd@ibict.bropendoar:24042016-06-22T19:23Repositório Institucional do IBICT - RIDI - Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)false
dc.title.pt_BR.fl_str_mv A ambiqüidade na recuperação da informação
dc.title.alternative.pt_BR.fl_str_mv Ambiguity in information retrieval
title A ambiqüidade na recuperação da informação
spellingShingle A ambiqüidade na recuperação da informação
Brascher, Marisa
Recuperação da informação
Tratamento automático da linguagem natural
Ambigüidade
Valência sintático-semântica
Gráficos conceituais
title_short A ambiqüidade na recuperação da informação
title_full A ambiqüidade na recuperação da informação
title_fullStr A ambiqüidade na recuperação da informação
title_full_unstemmed A ambiqüidade na recuperação da informação
title_sort A ambiqüidade na recuperação da informação
author Brascher, Marisa
author_facet Brascher, Marisa
author_role author
dc.contributor.author.fl_str_mv Brascher, Marisa
dc.subject.por.fl_str_mv Recuperação da informação
Tratamento automático da linguagem natural
Ambigüidade
Valência sintático-semântica
Gráficos conceituais
topic Recuperação da informação
Tratamento automático da linguagem natural
Ambigüidade
Valência sintático-semântica
Gráficos conceituais
description Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural.
publishDate 2002
dc.date.issued.fl_str_mv 2002
dc.date.accessioned.fl_str_mv 2012-06-27T18:01:43Z
dc.date.available.fl_str_mv 2012-06-27T18:01:43Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.citation.fl_str_mv DataGramaZero - Revista de Ciência da Informação, v.3 n.1, 2002
dc.identifier.uri.fl_str_mv http://ridi.ibict.br/handle/123456789/284
dc.identifier.issn.none.fl_str_mv 1517-3801
identifier_str_mv DataGramaZero - Revista de Ciência da Informação, v.3 n.1, 2002
1517-3801
url http://ridi.ibict.br/handle/123456789/284
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv IASI
publisher.none.fl_str_mv IASI
dc.source.none.fl_str_mv reponame:Repositório Institucional do IBICT - RIDI
instname:Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)
instacron:IBICT
instname_str Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)
instacron_str IBICT
institution IBICT
reponame_str Repositório Institucional do IBICT - RIDI
collection Repositório Institucional do IBICT - RIDI
bitstream.url.fl_str_mv http://ridi.ibict.br/bitstream/123456789/284/1/BrascherDTZ2002.pdf
http://ridi.ibict.br/bitstream/123456789/284/2/license.txt
http://ridi.ibict.br/bitstream/123456789/284/3/BrascherDTZ2002.pdf.txt
bitstream.checksum.fl_str_mv 013e673a71564c5e4f7a7e904758b07e
8a4605be74aa9ea9d79846c1fba20a33
598c61684b97892702641c047ea86455
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional do IBICT - RIDI - Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)
repository.mail.fl_str_mv rd@ibict.br
_version_ 1801662284334891008