Representação de Léxicos Através de Autômatos Finitos

Detalhes bibliográficos
Autor(a) principal: Jesus, Marcelo Alexandre Couto de
Data de Publicação: 1999
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06032018-160704/
Resumo: Aplicações de Processamento de Língua Natural (PLN), como revisores ortográficos, gramaticais e tradutores, geralmente precisam consultar extensos dicionários contendo, por exemplo, informações morfossintáticas de várias centenas de milhares de palavras de uma língua. Autômatos finitos, largamente utilizados na construção de eficientes analisadores léxicos para compiladores, apresentam-se como ótimos candidatos para o problema de representação desse tipo de léxico de língua natural. Este trabalho investigou os métodos de codificação de léxicos utilizando autômatos finitos, as técnicas de minimização de autômatos determinísticos acíclicos e as estruturas de dados necessárias para uma representação compacta, resultando em um sistema computacional eficiente e versátil de representação de grandes léxicos de língua natural. Um léxico de mais de 430.000 palavras da língua portuguesa pode ser convertido em um autômato de menos de 220Kb, em menos de 5 minutos usando um computador doméstico.
id USP_992a98e3f3b70ed4e8781aae238fce98
oai_identifier_str oai:teses.usp.br:tde-06032018-160704
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Representação de Léxicos Através de Autômatos FinitosNot availableNão disponívelNot availableAplicações de Processamento de Língua Natural (PLN), como revisores ortográficos, gramaticais e tradutores, geralmente precisam consultar extensos dicionários contendo, por exemplo, informações morfossintáticas de várias centenas de milhares de palavras de uma língua. Autômatos finitos, largamente utilizados na construção de eficientes analisadores léxicos para compiladores, apresentam-se como ótimos candidatos para o problema de representação desse tipo de léxico de língua natural. Este trabalho investigou os métodos de codificação de léxicos utilizando autômatos finitos, as técnicas de minimização de autômatos determinísticos acíclicos e as estruturas de dados necessárias para uma representação compacta, resultando em um sistema computacional eficiente e versátil de representação de grandes léxicos de língua natural. Um léxico de mais de 430.000 palavras da língua portuguesa pode ser convertido em um autômato de menos de 220Kb, em menos de 5 minutos usando um computador doméstico.Natural Language Processing (NLP) applications, such as speller and grammar checkers and translation systems, need to search very larga dictionaries which contab.\' morphosyntactical and/or semantic information of severa] hundreds of thousand words of a given language. Finite Automata are often used in efficient scanners for compilers and are also good candidates for representing dictionaries. This work has investigated methods for representing dictionaries using finite automata, techniques for minimizing acyclic deterministic finite automaton, and adequate data structures for a compact representation. The resulting system is able to represent a dictionary of 430,000 Brazilian Portuguese words in a 220Kb automaton, by using a standard home computer and spending less than five minutes.Biblioteca Digitais de Teses e Dissertações da USPNunes, Maria das Graças VolpeJesus, Marcelo Alexandre Couto de1999-12-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-06032018-160704/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2018-07-19T20:50:39Zoai:teses.usp.br:tde-06032018-160704Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212018-07-19T20:50:39Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Representação de Léxicos Através de Autômatos Finitos
Not available
title Representação de Léxicos Através de Autômatos Finitos
spellingShingle Representação de Léxicos Através de Autômatos Finitos
Jesus, Marcelo Alexandre Couto de
Não disponível
Not available
title_short Representação de Léxicos Através de Autômatos Finitos
title_full Representação de Léxicos Através de Autômatos Finitos
title_fullStr Representação de Léxicos Através de Autômatos Finitos
title_full_unstemmed Representação de Léxicos Através de Autômatos Finitos
title_sort Representação de Léxicos Através de Autômatos Finitos
author Jesus, Marcelo Alexandre Couto de
author_facet Jesus, Marcelo Alexandre Couto de
author_role author
dc.contributor.none.fl_str_mv Nunes, Maria das Graças Volpe
dc.contributor.author.fl_str_mv Jesus, Marcelo Alexandre Couto de
dc.subject.por.fl_str_mv Não disponível
Not available
topic Não disponível
Not available
description Aplicações de Processamento de Língua Natural (PLN), como revisores ortográficos, gramaticais e tradutores, geralmente precisam consultar extensos dicionários contendo, por exemplo, informações morfossintáticas de várias centenas de milhares de palavras de uma língua. Autômatos finitos, largamente utilizados na construção de eficientes analisadores léxicos para compiladores, apresentam-se como ótimos candidatos para o problema de representação desse tipo de léxico de língua natural. Este trabalho investigou os métodos de codificação de léxicos utilizando autômatos finitos, as técnicas de minimização de autômatos determinísticos acíclicos e as estruturas de dados necessárias para uma representação compacta, resultando em um sistema computacional eficiente e versátil de representação de grandes léxicos de língua natural. Um léxico de mais de 430.000 palavras da língua portuguesa pode ser convertido em um autômato de menos de 220Kb, em menos de 5 minutos usando um computador doméstico.
publishDate 1999
dc.date.none.fl_str_mv 1999-12-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06032018-160704/
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06032018-160704/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090438085214208