SISMULT- Sistema de indexação semiautomática multilíngue.

Detalhes bibliográficos
Autor(a) principal: SOUSA, Ianna Maria Sodré Ferreira de.
Data de Publicação: 1998
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087
Resumo: Com a difusão das bibliotecas digitais e da Internet, mais e mais textos em meio eletrônico, em diversos idiomas, se tornam acessíveis para um publico amplo e geograficamente disperso. Isto torna necessário o desenvolvimento de ferramentas adequadas para facilitar a indexação, o armazenamento e a recuperação adequada de documentos referentes a informação pesquisada. Este trabalho tem como objetivo apresentar um método para construção semi-automática de um thesaurus retangular multilíngue, a partir de documentos eletrônicos, que auxiliara no processo de recuperação da informação, independente do idioma. O método consiste em extrair termos semi-automaticamente do conjunto de documentos e utilizar a analise da co-ocorrência de termos para selecionar os termos relevantes, apos consultar os dicionários unilíngues para determinar os termos abstratos. Os conceitos relevantes extraídos dos documentos são então representados por uma relação binaria sobre a qual aplica-se o Método de Decomposição Retangular de uma Relação Binaria para a obtenção dos retângulos que geram o thesaurus a partir de um algoritmo incremental. Dicionários especiais e interações com o usuário são utilizados para determinar o contexto adequado para palavras ambíguas, alem de eliminar flexões e associar um conceito abstrato para cada palavra. O protótipo desenvolvido permite uma atualização continua dos thesauri existentes com novos documentos, em diversos idiomas, e a realização de consultas multilíngues, alem de permitir o acréscimo de novos idiomas.
id UFCG_300c2345451b93472e1302abb87fe9f6
oai_identifier_str oai:localhost:riufcg/7087
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling SISMULT- Sistema de indexação semiautomática multilíngue.SISMULT- Multilingual automatic indexing system.Sistema de Banco de DadosSistema de Indexação Semi-Automática Multilíngue (SISMULT)Sistema de InformaçãoExtração de TermosDecomposição RetangularRelação BináriaAlgoritmo de PintoThesaurus MultilíngueDatabase SystemMultilingual Semi-Automatic Indexing System (SISMULT)Information systemExtraction of TermsRectangular DecompositionBinary RatioPinto's AlgorithmMultilingual ThesaurusCiência da ComputaçãoCom a difusão das bibliotecas digitais e da Internet, mais e mais textos em meio eletrônico, em diversos idiomas, se tornam acessíveis para um publico amplo e geograficamente disperso. Isto torna necessário o desenvolvimento de ferramentas adequadas para facilitar a indexação, o armazenamento e a recuperação adequada de documentos referentes a informação pesquisada. Este trabalho tem como objetivo apresentar um método para construção semi-automática de um thesaurus retangular multilíngue, a partir de documentos eletrônicos, que auxiliara no processo de recuperação da informação, independente do idioma. O método consiste em extrair termos semi-automaticamente do conjunto de documentos e utilizar a analise da co-ocorrência de termos para selecionar os termos relevantes, apos consultar os dicionários unilíngues para determinar os termos abstratos. Os conceitos relevantes extraídos dos documentos são então representados por uma relação binaria sobre a qual aplica-se o Método de Decomposição Retangular de uma Relação Binaria para a obtenção dos retângulos que geram o thesaurus a partir de um algoritmo incremental. Dicionários especiais e interações com o usuário são utilizados para determinar o contexto adequado para palavras ambíguas, alem de eliminar flexões e associar um conceito abstrato para cada palavra. O protótipo desenvolvido permite uma atualização continua dos thesauri existentes com novos documentos, em diversos idiomas, e a realização de consultas multilíngues, alem de permitir o acréscimo de novos idiomas.With the outsprccd of the digital libraries and the Internet more and more electronic texts, written in several languages, become available for a wide and geographically dispersed public. This turns it's necessary to develop tools that facilitates indexing, representation and retrieval of multilingual documents. This thesis presents a method for semiautomatic construction of a multilingual thesaurus, based on the indexing of electronic documents, in order to support a adequate information retrieval, independent of the language of the documents. The method consists in extracting the terms of a document and to use an analysis of the co-occurrence of terms in order to determine its relevance. Using special unilingual dictionaries, abstract, language-independent terms are determined. Relevant concepts are represented as binary relations and, using the method of rectangular decomposition of Gammoudi, rectangles of pairs concept/document are determined and added to the existing thesaurus incrementally. Special dictionaries and an interaction with the user determines the correct contexts for ambiguous terms, further on eliminating flexions and determining the abstract concepts. A prototype has been developed which allows a continuous update of the existing thesaurus, indexing new documents, in several languages. It also supports multilingual queries and the addition of the new languages.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGSCHIEL, Ulrich.SCHIEL, U.http://lattes.cnpq.br/2971250918247087SUAVÉ, Jacques Philippe.NAKAYAMA, Haruka.SOUSA, Ianna Maria Sodré Ferreira de.1998-08-312019-09-18T11:30:53Z2019-09-182019-09-18T11:30:53Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087SOUSA, Ianna Maria Sodré Ferreira de. SISMULT- Sistema de indexação semiautomática multilíngue. 1998. 89f. (Dissertação) Mestrado em Informática, Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal da Paraíba, Campus II, Campina Grande - Paraíba - Brasil, 1998. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-17T12:59:49Zoai:localhost:riufcg/7087Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-17T12:59:49Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv SISMULT- Sistema de indexação semiautomática multilíngue.
SISMULT- Multilingual automatic indexing system.
title SISMULT- Sistema de indexação semiautomática multilíngue.
spellingShingle SISMULT- Sistema de indexação semiautomática multilíngue.
SOUSA, Ianna Maria Sodré Ferreira de.
Sistema de Banco de Dados
Sistema de Indexação Semi-Automática Multilíngue (SISMULT)
Sistema de Informação
Extração de Termos
Decomposição Retangular
Relação Binária
Algoritmo de Pinto
Thesaurus Multilíngue
Database System
Multilingual Semi-Automatic Indexing System (SISMULT)
Information system
Extraction of Terms
Rectangular Decomposition
Binary Ratio
Pinto's Algorithm
Multilingual Thesaurus
Ciência da Computação
title_short SISMULT- Sistema de indexação semiautomática multilíngue.
title_full SISMULT- Sistema de indexação semiautomática multilíngue.
title_fullStr SISMULT- Sistema de indexação semiautomática multilíngue.
title_full_unstemmed SISMULT- Sistema de indexação semiautomática multilíngue.
title_sort SISMULT- Sistema de indexação semiautomática multilíngue.
author SOUSA, Ianna Maria Sodré Ferreira de.
author_facet SOUSA, Ianna Maria Sodré Ferreira de.
author_role author
dc.contributor.none.fl_str_mv SCHIEL, Ulrich.
SCHIEL, U.
http://lattes.cnpq.br/2971250918247087
SUAVÉ, Jacques Philippe.
NAKAYAMA, Haruka.
dc.contributor.author.fl_str_mv SOUSA, Ianna Maria Sodré Ferreira de.
dc.subject.por.fl_str_mv Sistema de Banco de Dados
Sistema de Indexação Semi-Automática Multilíngue (SISMULT)
Sistema de Informação
Extração de Termos
Decomposição Retangular
Relação Binária
Algoritmo de Pinto
Thesaurus Multilíngue
Database System
Multilingual Semi-Automatic Indexing System (SISMULT)
Information system
Extraction of Terms
Rectangular Decomposition
Binary Ratio
Pinto's Algorithm
Multilingual Thesaurus
Ciência da Computação
topic Sistema de Banco de Dados
Sistema de Indexação Semi-Automática Multilíngue (SISMULT)
Sistema de Informação
Extração de Termos
Decomposição Retangular
Relação Binária
Algoritmo de Pinto
Thesaurus Multilíngue
Database System
Multilingual Semi-Automatic Indexing System (SISMULT)
Information system
Extraction of Terms
Rectangular Decomposition
Binary Ratio
Pinto's Algorithm
Multilingual Thesaurus
Ciência da Computação
description Com a difusão das bibliotecas digitais e da Internet, mais e mais textos em meio eletrônico, em diversos idiomas, se tornam acessíveis para um publico amplo e geograficamente disperso. Isto torna necessário o desenvolvimento de ferramentas adequadas para facilitar a indexação, o armazenamento e a recuperação adequada de documentos referentes a informação pesquisada. Este trabalho tem como objetivo apresentar um método para construção semi-automática de um thesaurus retangular multilíngue, a partir de documentos eletrônicos, que auxiliara no processo de recuperação da informação, independente do idioma. O método consiste em extrair termos semi-automaticamente do conjunto de documentos e utilizar a analise da co-ocorrência de termos para selecionar os termos relevantes, apos consultar os dicionários unilíngues para determinar os termos abstratos. Os conceitos relevantes extraídos dos documentos são então representados por uma relação binaria sobre a qual aplica-se o Método de Decomposição Retangular de uma Relação Binaria para a obtenção dos retângulos que geram o thesaurus a partir de um algoritmo incremental. Dicionários especiais e interações com o usuário são utilizados para determinar o contexto adequado para palavras ambíguas, alem de eliminar flexões e associar um conceito abstrato para cada palavra. O protótipo desenvolvido permite uma atualização continua dos thesauri existentes com novos documentos, em diversos idiomas, e a realização de consultas multilíngues, alem de permitir o acréscimo de novos idiomas.
publishDate 1998
dc.date.none.fl_str_mv 1998-08-31
2019-09-18T11:30:53Z
2019-09-18
2019-09-18T11:30:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087
SOUSA, Ianna Maria Sodré Ferreira de. SISMULT- Sistema de indexação semiautomática multilíngue. 1998. 89f. (Dissertação) Mestrado em Informática, Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal da Paraíba, Campus II, Campina Grande - Paraíba - Brasil, 1998. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087
identifier_str_mv SOUSA, Ianna Maria Sodré Ferreira de. SISMULT- Sistema de indexação semiautomática multilíngue. 1998. 89f. (Dissertação) Mestrado em Informática, Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal da Paraíba, Campus II, Campina Grande - Paraíba - Brasil, 1998. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744394912268288