A ambiqüidade na recuperação da informação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2002 |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Institucional do IBICT - RIDI |
Texto Completo: | http://ridi.ibict.br/handle/123456789/284 |
Resumo: | Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural. |
id |
IBICT_506f061e03deb06853f94a3ccd1df0f6 |
---|---|
oai_identifier_str |
oai:ridi.ibict.br:123456789/284 |
network_acronym_str |
IBICT |
network_name_str |
Repositório Institucional do IBICT - RIDI |
repository_id_str |
2404 |
spelling |
2012-06-27T18:01:43Z2012-06-27T18:01:43Z2002DataGramaZero - Revista de Ciência da Informação, v.3 n.1, 20021517-3801http://ridi.ibict.br/handle/123456789/284Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural.[en] Issues relative to information extraction from complete texts and subsequent retrieval by means of automatic natural language treatment methods are discussed. Besides extracting words from the text, the relationship of significance that these words have in the context of the speech in which they occur is attempted to be preserved. An information retrieval system using natural language should be able to treat given linguistic phenomena that affect the quality of information, such as, for instance, the issues of ambiguity. The Valence Grammar and the Conceptual Graphics are used as theoretical and methodological. An automatic natural language treatment system – Zstation – is utilized, as well as a pool of official documents concerning the Mercosul, for the ambiguity solutions tests. The conclusion is reached that a natural language treatment system can solve certain types of ambiguities when information is available regarding the syntactic-semantic valence of the lexical units that compose an enunciation. The results obtained show that it is possible to introduce automatic procedures for solving ambiguities in a natural language treatment system.Submitted by Sonia Burnier (sdesouza@ibict.br) on 2012-06-27T18:01:43Z No. of bitstreams: 1 BrascherDTZ2002.pdf: 142118 bytes, checksum: 013e673a71564c5e4f7a7e904758b07e (MD5)Made available in DSpace on 2012-06-27T18:01:43Z (GMT). No. of bitstreams: 1 BrascherDTZ2002.pdf: 142118 bytes, checksum: 013e673a71564c5e4f7a7e904758b07e (MD5) Previous issue date: 2002porIASIRecuperação da informaçãoTratamento automático da linguagem naturalAmbigüidadeValência sintático-semânticaGráficos conceituaisA ambiqüidade na recuperação da informaçãoAmbiguity in information retrievalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleBrascher, Marisainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional do IBICT - RIDIinstname:Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)instacron:IBICTORIGINALBrascherDTZ2002.pdfBrascherDTZ2002.pdfapplication/pdf142118http://ridi.ibict.br/bitstream/123456789/284/1/BrascherDTZ2002.pdf013e673a71564c5e4f7a7e904758b07eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://ridi.ibict.br/bitstream/123456789/284/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTBrascherDTZ2002.pdf.txtBrascherDTZ2002.pdf.txtExtracted texttext/plain63232http://ridi.ibict.br/bitstream/123456789/284/3/BrascherDTZ2002.pdf.txt598c61684b97892702641c047ea86455MD53123456789/2842016-06-22 16:23:00.546oai:ridi.ibict.br:123456789/284AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA=Repositório InstitucionalPUBhttps://ridi.ibict.br/oai/requestrd@ibict.bropendoar:24042016-06-22T19:23Repositório Institucional do IBICT - RIDI - Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT)false |
dc.title.pt_BR.fl_str_mv |
A ambiqüidade na recuperação da informação |
dc.title.alternative.pt_BR.fl_str_mv |
Ambiguity in information retrieval |
title |
A ambiqüidade na recuperação da informação |
spellingShingle |
A ambiqüidade na recuperação da informação Brascher, Marisa Recuperação da informação Tratamento automático da linguagem natural Ambigüidade Valência sintático-semântica Gráficos conceituais |
title_short |
A ambiqüidade na recuperação da informação |
title_full |
A ambiqüidade na recuperação da informação |
title_fullStr |
A ambiqüidade na recuperação da informação |
title_full_unstemmed |
A ambiqüidade na recuperação da informação |
title_sort |
A ambiqüidade na recuperação da informação |
author |
Brascher, Marisa |
author_facet |
Brascher, Marisa |
author_role |
author |
dc.contributor.author.fl_str_mv |
Brascher, Marisa |
dc.subject.por.fl_str_mv |
Recuperação da informação Tratamento automático da linguagem natural Ambigüidade Valência sintático-semântica Gráficos conceituais |
topic |
Recuperação da informação Tratamento automático da linguagem natural Ambigüidade Valência sintático-semântica Gráficos conceituais |
description |
Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural. |
publishDate |
2002 |
dc.date.issued.fl_str_mv |
2002 |
dc.date.accessioned.fl_str_mv |
2012-06-27T18:01:43Z |
dc.date.available.fl_str_mv |
2012-06-27T18:01:43Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
DataGramaZero - Revista de Ciência da Informação, v.3 n.1, 2002 |
dc.identifier.uri.fl_str_mv |
http://ridi.ibict.br/handle/123456789/284 |
dc.identifier.issn.none.fl_str_mv |
1517-3801 |
identifier_str_mv |
DataGramaZero - Revista de Ciência da Informação, v.3 n.1, 2002 1517-3801 |
url |
http://ridi.ibict.br/handle/123456789/284 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
IASI |
publisher.none.fl_str_mv |
IASI |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional do IBICT - RIDI instname:Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) instacron:IBICT |
instname_str |
Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) |
instacron_str |
IBICT |
institution |
IBICT |
reponame_str |
Repositório Institucional do IBICT - RIDI |
collection |
Repositório Institucional do IBICT - RIDI |
bitstream.url.fl_str_mv |
http://ridi.ibict.br/bitstream/123456789/284/1/BrascherDTZ2002.pdf http://ridi.ibict.br/bitstream/123456789/284/2/license.txt http://ridi.ibict.br/bitstream/123456789/284/3/BrascherDTZ2002.pdf.txt |
bitstream.checksum.fl_str_mv |
013e673a71564c5e4f7a7e904758b07e 8a4605be74aa9ea9d79846c1fba20a33 598c61684b97892702641c047ea86455 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional do IBICT - RIDI - Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) |
repository.mail.fl_str_mv |
rd@ibict.br |
_version_ |
1801662284334891008 |