Metodos eficientes para reconhecimento de padrões em texto
Autor(a) principal: | |
---|---|
Data de Publicação: | 1993 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1580776 |
Resumo: | Orientador : Claudio Leonardo Lucchesi |
id |
UNICAMP-30_01cf06a62efbfaf799772c9c08770180 |
---|---|
oai_identifier_str |
oai::65322 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Metodos eficientes para reconhecimento de padrões em textoReconhecimento de padrõesAlgoritmosOrientador : Claudio Leonardo LucchesiDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da ComputaçãoResumo: O problema de reconhecimento de padrões surge muito freqüentem ente em diversas áreas e consiste basicamente em determinar se um dado objeto (padrão) ocorre em alguma parte de um outro objeto (geralmente bem maior). Existem diversas variações sobre o tema, por exemplo, objetos com uma ou mais dimensões, reconhecimento aproximado de padrões etc. Neste trabalho abordaremos a questão do reconhecimento de padrões unidimensionais que na literatura normalmente é citado como reconhecimento de padrões em texto. Além disso, nos concentramos no problema de reconhecimento exato de padrões. Nosso objetivo principal é apresentar (descrever e analisar) de forma clara e precisa os principais algoritmos que solucionam o problema em questão. No capítulo 2 descrevemos o algoritmo de Knuth, Morris e Pratt através de autômatos, sendo que vale destacar que, embora a associação entre este algoritmo e autômatos seja citada na literatura com bastante freqüência, normalmente ela não é efetivamente utilizada na descrição do algoritmo. Esta abordagem tornou a descrição do algoritmo bastante simples. Além disso, na análise do algoritmo, a demonstração de alguns resultados foram realizadas de forma bem mais clara do que a originalmente proposta. No capítulo 3 apresentamos o algoritmo de Boyer e Moore que é um algoritmo extremamente eficiente na prática e no qual se baseiam a maioria dos outros algoritmos existentes. Inclusive, nós apresentamos uma variação deste algoritmo que pode ser descrita de forma mais simples do que o algoritmo original e, em alguns casos, é mais eficiente do que ele. Além disso, neste capítulo tratamos da questão da análise de complexidade do algoritmo de Boyer e Moore que é um problema razoavelmente complexo e apresentamos ainda as principais variações deste algoritmo. No apêndice A descrevemos outros algoritmos propostos recentemente que solucionam o problema de reconhecimento de padrões em textos e finalmente, no apêndice B, analisamos teoricamente o comportamento médio de alguns algoritmos e também descrevemos os resultados de algumas análises empíricas realizadas por outros autores.Abstract: The pattern matching problem arises very frequently in several areas of knowledge and basically consists in determining if a given object (pattern) occurs in any place of another object (usually bigger). There are many variations of this problem, for exam pie, objects with one or more dimensions, approximate pattern matching etc. In this work we approach the pattern matching problem on one dimension that in the literature is normally named the string matching problem. More precisely, we confined ourselves to the exact pattern matching problem. Our main objective is to present (describe and analyse) dearly and precisely the most important algorithms to solve this problem. In chapter 2 we describe the Knuth, Morris and Pratt algorithm through automata. It is worth mentioning that, although the association between this algorithm and automata is cited in the literature quite often, in general, automata are not effectively used in the description of the algorithm. This approach made the description of the algorithm very sim pie. Moreover, in the analysis of the algorithm, the proofs of some of the results were accomplished in a clearer way. In chapter 3 we present the Boyer and Moore algorithm, which is extremelly efficient in practice and the majority of the algorithms found in the literature are based on the ideas of this algorithm. Actually, we present a little variation of this algorithm that is simpler and, in some cases, more efficient than the original algorithm. Moreover, in this chapter, we deal with the complexity analysis of the Boyer and Moore algorithm. We also present several variations of this algorithm. In appendix A we describe other pattern matching algorithms that were recently developed and finally, in the appendix B, we analise theoretically the average behaviourof some algorithms and also describe the results of some empirical analyses made by other authors.MestradoMestre em Ciência da Computação[s.n.]Lucchesi, Cláudio Leonardo, 1945-Simon, ImreMeidanis, JoãoUniversidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Ciência da ComputaçãoPrograma de Pós-Graduação em MatemáticaUNIVERSIDADE ESTADUAL DE CAMPINASAndrade, Marcus Vinicius Alvim19931993-10-03T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf172f. : il.https://hdl.handle.net/20.500.12733/1580776ANDRADE, Marcus Vinicius Alvim. Metodos eficientes para reconhecimento de padrões em texto. 1993. 172f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1580776. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/65322porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2022-05-25T11:02:59Zoai::65322Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2022-05-25T11:02:59Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Metodos eficientes para reconhecimento de padrões em texto |
title |
Metodos eficientes para reconhecimento de padrões em texto |
spellingShingle |
Metodos eficientes para reconhecimento de padrões em texto Andrade, Marcus Vinicius Alvim Reconhecimento de padrões Algoritmos |
title_short |
Metodos eficientes para reconhecimento de padrões em texto |
title_full |
Metodos eficientes para reconhecimento de padrões em texto |
title_fullStr |
Metodos eficientes para reconhecimento de padrões em texto |
title_full_unstemmed |
Metodos eficientes para reconhecimento de padrões em texto |
title_sort |
Metodos eficientes para reconhecimento de padrões em texto |
author |
Andrade, Marcus Vinicius Alvim |
author_facet |
Andrade, Marcus Vinicius Alvim |
author_role |
author |
dc.contributor.none.fl_str_mv |
Lucchesi, Cláudio Leonardo, 1945- Simon, Imre Meidanis, João Universidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Ciência da Computação Programa de Pós-Graduação em Matemática UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Andrade, Marcus Vinicius Alvim |
dc.subject.por.fl_str_mv |
Reconhecimento de padrões Algoritmos |
topic |
Reconhecimento de padrões Algoritmos |
description |
Orientador : Claudio Leonardo Lucchesi |
publishDate |
1993 |
dc.date.none.fl_str_mv |
1993 1993-10-03T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1580776 ANDRADE, Marcus Vinicius Alvim. Metodos eficientes para reconhecimento de padrões em texto. 1993. 172f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1580776. Acesso em: 2 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1580776 |
identifier_str_mv |
ANDRADE, Marcus Vinicius Alvim. Metodos eficientes para reconhecimento de padrões em texto. 1993. 172f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1580776. Acesso em: 2 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/65322 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 172f. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809188759272423424 |