Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UEL |
Texto Completo: | https://repositorio.uel.br/handle/123456789/16021 |
Resumo: | Resumo: O desenvolvimento de dicionários eletrônicos para qualquer segmento requer um trabalho em conjunto das áreas de Linguística e de Processamento de Linguagem Natural (PLN) e a implementação desses tipos de sistemas depende, em primeira mão, de uma linguagem de programação e um eficiente banco de dados, sem os quais não é possível estabelecer um canal de ligação entre usuário e a base de dados para busca do léxico No âmbito do desenvolvimento destas ferramentas, estruturas de dados chamadas tabelas hash têm demonstrado bons resultados e tem como características a dispersão dos dados, rapidez nas respostas e simplicidade de programação O armazenamento das informações desejadas é feito associando uma chave através das funções hashing que é responsável por distribuir as informações por esta tabela Com base nessas contextualizações, o objetivo deste trabalho é desenvolver uma ferramenta que empregue tabela esparsa a um léxico, gerando resultados de desempenho das funções hash implementadas Para que o objetivo geral seja alcançado foram almejados alguns objetivos específicos: desenvolver um aporte teórico sobre as funções hash e léxicos, a fim de compreender melhor os algoritmos a serem implementados; desenvolver a ferramenta “Visual Tahs” que contém 14 funções hash encontradas em algumas literaturas da área para ser possível realizar o experimento de desempenho de buscas em um léxico; catalogar na ferramenta as propriedades de um léxico real da temática que servirão como base para os experimentos; analisar as funções de dispersão pelos relatórios emitidos pela própria ferramenta traçando padrões e definindo as melhores funções Desse modo, após a aplicação dos experimentos, verificou-se que a utilização da ferramenta desenvolvida é mais rápida, no que diz respeito ao acesso das informações, viabilizando assim a eficácia do software desenvolvido utilizando as funções hash, além de que, os resultados demostrados também servirão para encorajar a construção de léxicos digitais com tabelas hash, já que experiências mostraram que as buscas nessa estrutura de dados são mais rápidas em relação aos bancos de dados e que pode funcionar em vários meios, como desktop, Web e mobile |
id |
UEL_13e2d7a66a332249d6cad4509f545421 |
---|---|
oai_identifier_str |
oai:repositorio.uel.br:123456789/16021 |
network_acronym_str |
UEL |
network_name_str |
Repositório Institucional da UEL |
repository_id_str |
|
spelling |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua naturalProcessamento de linguagem natural (Computação)Hashing (Computação)Ciência da computaçãoNatural language processing (Computer science)Hashing (Computer science)Resumo: O desenvolvimento de dicionários eletrônicos para qualquer segmento requer um trabalho em conjunto das áreas de Linguística e de Processamento de Linguagem Natural (PLN) e a implementação desses tipos de sistemas depende, em primeira mão, de uma linguagem de programação e um eficiente banco de dados, sem os quais não é possível estabelecer um canal de ligação entre usuário e a base de dados para busca do léxico No âmbito do desenvolvimento destas ferramentas, estruturas de dados chamadas tabelas hash têm demonstrado bons resultados e tem como características a dispersão dos dados, rapidez nas respostas e simplicidade de programação O armazenamento das informações desejadas é feito associando uma chave através das funções hashing que é responsável por distribuir as informações por esta tabela Com base nessas contextualizações, o objetivo deste trabalho é desenvolver uma ferramenta que empregue tabela esparsa a um léxico, gerando resultados de desempenho das funções hash implementadas Para que o objetivo geral seja alcançado foram almejados alguns objetivos específicos: desenvolver um aporte teórico sobre as funções hash e léxicos, a fim de compreender melhor os algoritmos a serem implementados; desenvolver a ferramenta “Visual Tahs” que contém 14 funções hash encontradas em algumas literaturas da área para ser possível realizar o experimento de desempenho de buscas em um léxico; catalogar na ferramenta as propriedades de um léxico real da temática que servirão como base para os experimentos; analisar as funções de dispersão pelos relatórios emitidos pela própria ferramenta traçando padrões e definindo as melhores funções Desse modo, após a aplicação dos experimentos, verificou-se que a utilização da ferramenta desenvolvida é mais rápida, no que diz respeito ao acesso das informações, viabilizando assim a eficácia do software desenvolvido utilizando as funções hash, além de que, os resultados demostrados também servirão para encorajar a construção de léxicos digitais com tabelas hash, já que experiências mostraram que as buscas nessa estrutura de dados são mais rápidas em relação aos bancos de dados e que pode funcionar em vários meios, como desktop, Web e mobileDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da ComputaçãoAbstract: The electronic development of dictionaries for any segment requires a pair work in Linguistics and Natural Language Processing (NLP) areas and the implementation of these types of systems depends, first and foremost, on a programming language and an efficient database, because without them it is not possible to establish a link between the user and the lexicon search database In the development of these tools framework, data structures called hash tables have shown good results and they are characterized by their data dispersion, response speed and simplicity of programming The storage of the desired information is done by associating a key through the hashing functions that is responsible for distributing the information through this table Based on these contextualizations, the objective of this work is to develop a tool that uses sparse tables to a lexicon, generating performance results of the implemented hash functions In order to achieve the general objective, some specific objectives were intended, such as: to develop a theoretical contribution on the hash and lexical functions, in order to better understand the algorithms to be implemented; to develop "Visual Tahs" tool that contains 14 hash functions, which are, found in some literature areas that are able to perform the search performance experiment in a lexicon; to catalog the properties of a real lexicon of the subject in the software once, they will serve as the basis for the experiments; to analyze the dispersion functions considering the reports generated by the tool itself, drawing patterns and defining the best functions By doing this way, after the experimental applications, it was verified that the use of the developed tool is faster, considering the access of the information, thus enabling the effectiveness of the software developed using the hash functions The displayed results will also encourage the construction of digital lexicons with hash tables, once the experiments have shown that searches in this data structure are faster compared to the database and they can work across multiple media, such as desktop, Web, and mobileBarbosa, Cinthyan Renata Sachs Camerlengo de [Orientador]Coelho Neto, JoãoCampos, Vitor Valério de SouzaMoreno, Fábio Carlos2024-05-01T14:59:32Z2024-05-01T14:59:32Z2017.0028.06.2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://repositorio.uel.br/handle/123456789/16021porMestradoCiência da ComputaçãoCentro de Ciências ExatasPrograma de Pós-Graduação em Ciência da ComputaçãoLondrinareponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess2024-07-12T04:19:45Zoai:repositorio.uel.br:123456789/16021Biblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:19:45Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false |
dc.title.none.fl_str_mv |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural |
title |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural |
spellingShingle |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural Moreno, Fábio Carlos Processamento de linguagem natural (Computação) Hashing (Computação) Ciência da computação Natural language processing (Computer science) Hashing (Computer science) |
title_short |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural |
title_full |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural |
title_fullStr |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural |
title_full_unstemmed |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural |
title_sort |
Visual Tahs : ferramenta para analisar a eficácia de buscas das funções hash em um léxico para língua natural |
author |
Moreno, Fábio Carlos |
author_facet |
Moreno, Fábio Carlos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Barbosa, Cinthyan Renata Sachs Camerlengo de [Orientador] Coelho Neto, João Campos, Vitor Valério de Souza |
dc.contributor.author.fl_str_mv |
Moreno, Fábio Carlos |
dc.subject.por.fl_str_mv |
Processamento de linguagem natural (Computação) Hashing (Computação) Ciência da computação Natural language processing (Computer science) Hashing (Computer science) |
topic |
Processamento de linguagem natural (Computação) Hashing (Computação) Ciência da computação Natural language processing (Computer science) Hashing (Computer science) |
description |
Resumo: O desenvolvimento de dicionários eletrônicos para qualquer segmento requer um trabalho em conjunto das áreas de Linguística e de Processamento de Linguagem Natural (PLN) e a implementação desses tipos de sistemas depende, em primeira mão, de uma linguagem de programação e um eficiente banco de dados, sem os quais não é possível estabelecer um canal de ligação entre usuário e a base de dados para busca do léxico No âmbito do desenvolvimento destas ferramentas, estruturas de dados chamadas tabelas hash têm demonstrado bons resultados e tem como características a dispersão dos dados, rapidez nas respostas e simplicidade de programação O armazenamento das informações desejadas é feito associando uma chave através das funções hashing que é responsável por distribuir as informações por esta tabela Com base nessas contextualizações, o objetivo deste trabalho é desenvolver uma ferramenta que empregue tabela esparsa a um léxico, gerando resultados de desempenho das funções hash implementadas Para que o objetivo geral seja alcançado foram almejados alguns objetivos específicos: desenvolver um aporte teórico sobre as funções hash e léxicos, a fim de compreender melhor os algoritmos a serem implementados; desenvolver a ferramenta “Visual Tahs” que contém 14 funções hash encontradas em algumas literaturas da área para ser possível realizar o experimento de desempenho de buscas em um léxico; catalogar na ferramenta as propriedades de um léxico real da temática que servirão como base para os experimentos; analisar as funções de dispersão pelos relatórios emitidos pela própria ferramenta traçando padrões e definindo as melhores funções Desse modo, após a aplicação dos experimentos, verificou-se que a utilização da ferramenta desenvolvida é mais rápida, no que diz respeito ao acesso das informações, viabilizando assim a eficácia do software desenvolvido utilizando as funções hash, além de que, os resultados demostrados também servirão para encorajar a construção de léxicos digitais com tabelas hash, já que experiências mostraram que as buscas nessa estrutura de dados são mais rápidas em relação aos bancos de dados e que pode funcionar em vários meios, como desktop, Web e mobile |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2017.00 2024-05-01T14:59:32Z 2024-05-01T14:59:32Z 28.06.2017 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.uel.br/handle/123456789/16021 |
url |
https://repositorio.uel.br/handle/123456789/16021 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Mestrado Ciência da Computação Centro de Ciências Exatas Programa de Pós-Graduação em Ciência da Computação |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
Londrina |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UEL instname:Universidade Estadual de Londrina (UEL) instacron:UEL |
instname_str |
Universidade Estadual de Londrina (UEL) |
instacron_str |
UEL |
institution |
UEL |
reponame_str |
Repositório Institucional da UEL |
collection |
Repositório Institucional da UEL |
repository.name.fl_str_mv |
Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL) |
repository.mail.fl_str_mv |
bcuel@uel.br|| |
_version_ |
1809823252930887680 |