Metodos eficientes para reconhecimento de padrões em texto

Detalhes bibliográficos
Autor(a) principal: Andrade, Marcus Vinicius Alvim
Data de Publicação: 1993
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1580776
Resumo: Orientador : Claudio Leonardo Lucchesi
id UNICAMP-30_01cf06a62efbfaf799772c9c08770180
oai_identifier_str oai::65322
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Metodos eficientes para reconhecimento de padrões em textoReconhecimento de padrõesAlgoritmosOrientador : Claudio Leonardo LucchesiDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da ComputaçãoResumo: O problema de reconhecimento de padrões surge muito freqüentem ente em diversas áreas e consiste basicamente em determinar se um dado objeto (padrão) ocorre em alguma parte de um outro objeto (geralmente bem maior). Existem diversas variações sobre o tema, por exemplo, objetos com uma ou mais dimensões, reconhecimento aproximado de padrões etc. Neste trabalho abordaremos a questão do reconhecimento de padrões unidimensionais que na literatura normalmente é citado como reconhecimento de padrões em texto. Além disso, nos concentramos no problema de reconhecimento exato de padrões. Nosso objetivo principal é apresentar (descrever e analisar) de forma clara e precisa os principais algoritmos que solucionam o problema em questão. No capítulo 2 descrevemos o algoritmo de Knuth, Morris e Pratt através de autômatos, sendo que vale destacar que, embora a associação entre este algoritmo e autômatos seja citada na literatura com bastante freqüência, normalmente ela não é efetivamente utilizada na descrição do algoritmo. Esta abordagem tornou a descrição do algoritmo bastante simples. Além disso, na análise do algoritmo, a demonstração de alguns resultados foram realizadas de forma bem mais clara do que a originalmente proposta. No capítulo 3 apresentamos o algoritmo de Boyer e Moore que é um algoritmo extremamente eficiente na prática e no qual se baseiam a maioria dos outros algoritmos existentes. Inclusive, nós apresentamos uma variação deste algoritmo que pode ser descrita de forma mais simples do que o algoritmo original e, em alguns casos, é mais eficiente do que ele. Além disso, neste capítulo tratamos da questão da análise de complexidade do algoritmo de Boyer e Moore que é um problema razoavelmente complexo e apresentamos ainda as principais variações deste algoritmo. No apêndice A descrevemos outros algoritmos propostos recentemente que solucionam o problema de reconhecimento de padrões em textos e finalmente, no apêndice B, analisamos teoricamente o comportamento médio de alguns algoritmos e também descrevemos os resultados de algumas análises empíricas realizadas por outros autores.Abstract: The pattern matching problem arises very frequently in several areas of knowledge and basically consists in determining if a given object (pattern) occurs in any place of another object (usually bigger). There are many variations of this problem, for exam pie, objects with one or more dimensions, approximate pattern matching etc. In this work we approach the pattern matching problem on one dimension that in the literature is normally named the string matching problem. More precisely, we confined ourselves to the exact pattern matching problem. Our main objective is to present (describe and analyse) dearly and precisely the most important algorithms to solve this problem. In chapter 2 we describe the Knuth, Morris and Pratt algorithm through automata. It is worth mentioning that, although the association between this algorithm and automata is cited in the literature quite often, in general, automata are not effectively used in the description of the algorithm. This approach made the description of the algorithm very sim pie. Moreover, in the analysis of the algorithm, the proofs of some of the results were accomplished in a clearer way. In chapter 3 we present the Boyer and Moore algorithm, which is extremelly efficient in practice and the majority of the algorithms found in the literature are based on the ideas of this algorithm. Actually, we present a little variation of this algorithm that is simpler and, in some cases, more efficient than the original algorithm. Moreover, in this chapter, we deal with the complexity analysis of the Boyer and Moore algorithm. We also present several variations of this algorithm. In appendix A we describe other pattern matching algorithms that were recently developed and finally, in the appendix B, we analise theoretically the average behaviourof some algorithms and also describe the results of some empirical analyses made by other authors.MestradoMestre em Ciência da Computação[s.n.]Lucchesi, Cláudio Leonardo, 1945-Simon, ImreMeidanis, JoãoUniversidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Ciência da ComputaçãoPrograma de Pós-Graduação em MatemáticaUNIVERSIDADE ESTADUAL DE CAMPINASAndrade, Marcus Vinicius Alvim19931993-10-03T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf172f. : il.https://hdl.handle.net/20.500.12733/1580776ANDRADE, Marcus Vinicius Alvim. Metodos eficientes para reconhecimento de padrões em texto. 1993. 172f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1580776. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/65322porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2022-05-25T11:02:59Zoai::65322Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2022-05-25T11:02:59Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Metodos eficientes para reconhecimento de padrões em texto
title Metodos eficientes para reconhecimento de padrões em texto
spellingShingle Metodos eficientes para reconhecimento de padrões em texto
Andrade, Marcus Vinicius Alvim
Reconhecimento de padrões
Algoritmos
title_short Metodos eficientes para reconhecimento de padrões em texto
title_full Metodos eficientes para reconhecimento de padrões em texto
title_fullStr Metodos eficientes para reconhecimento de padrões em texto
title_full_unstemmed Metodos eficientes para reconhecimento de padrões em texto
title_sort Metodos eficientes para reconhecimento de padrões em texto
author Andrade, Marcus Vinicius Alvim
author_facet Andrade, Marcus Vinicius Alvim
author_role author
dc.contributor.none.fl_str_mv Lucchesi, Cláudio Leonardo, 1945-
Simon, Imre
Meidanis, João
Universidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Ciência da Computação
Programa de Pós-Graduação em Matemática
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Andrade, Marcus Vinicius Alvim
dc.subject.por.fl_str_mv Reconhecimento de padrões
Algoritmos
topic Reconhecimento de padrões
Algoritmos
description Orientador : Claudio Leonardo Lucchesi
publishDate 1993
dc.date.none.fl_str_mv 1993
1993-10-03T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1580776
ANDRADE, Marcus Vinicius Alvim. Metodos eficientes para reconhecimento de padrões em texto. 1993. 172f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1580776. Acesso em: 2 set. 2024.
url https://hdl.handle.net/20.500.12733/1580776
identifier_str_mv ANDRADE, Marcus Vinicius Alvim. Metodos eficientes para reconhecimento de padrões em texto. 1993. 172f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1580776. Acesso em: 2 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/65322
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
172f. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809188759272423424