Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável
Autor(a) principal: | |
---|---|
Data de Publicação: | 2005 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ |
Resumo: | Dado um texto, queremos atribuir a cada palavra, de acordo com seu contexto, uma categoria morfo-sintática. Para isto, implementamos dois etiquetadores morfo-sintáticos baseados em cadeias de Markov. Primeiro, utilizando uma abordagem bastante conhecida, construímos um etiquetador que usa cadeias de Markov de ordem fixa igual a dois. Então, propomos e implementamos outro etiquetador utilizando uma abordagem recente, baseada em cadeias de Markov de tamanho variável. Depois de mostrar a teoria estatística dos dois modelos e os problemas e desafios mais comuns a serem resolvidos, explicamos o funcionamento dos etiquetadores e expomos os resultados obtidos. Com estes resultados, obtemos uma comparação mais precisa da eficiência destes dois modelos aplicados à etiquetagem morfo-sintática, identificando pontos fortes e fracos de cada um. Por uma combinação de fatores, consideramos o etiquetador com cadeias de Markov de tamanho variável melhor do que o de ordem fixa, e alcançamos um dos melhores resultados em etiquetagem morfo-sintática do português atualmente: 95,51% de precisão, obtida em um tempo total de execução, incluindo o aprendizado e etiquetagem de mais de um milhão de palavras, de menos de três minutos. Contribuímos, assim, com o estado da arte da área e, além disso, fornecemos resultados que nos permitem observar limitações e vantagens da aplicação de modelos estatísticos, em geral, ao problema focado, que podem ajudar a comunidade a identificar pontos críticos sobre os quais as pesuqisas nessa área deverão procurar se concentrar. |
id |
USP_7adde5b5de1064e7e4186133cc6e1a65 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20210729-141428 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variávelnot availableLinguística ComputacionalDado um texto, queremos atribuir a cada palavra, de acordo com seu contexto, uma categoria morfo-sintática. Para isto, implementamos dois etiquetadores morfo-sintáticos baseados em cadeias de Markov. Primeiro, utilizando uma abordagem bastante conhecida, construímos um etiquetador que usa cadeias de Markov de ordem fixa igual a dois. Então, propomos e implementamos outro etiquetador utilizando uma abordagem recente, baseada em cadeias de Markov de tamanho variável. Depois de mostrar a teoria estatística dos dois modelos e os problemas e desafios mais comuns a serem resolvidos, explicamos o funcionamento dos etiquetadores e expomos os resultados obtidos. Com estes resultados, obtemos uma comparação mais precisa da eficiência destes dois modelos aplicados à etiquetagem morfo-sintática, identificando pontos fortes e fracos de cada um. Por uma combinação de fatores, consideramos o etiquetador com cadeias de Markov de tamanho variável melhor do que o de ordem fixa, e alcançamos um dos melhores resultados em etiquetagem morfo-sintática do português atualmente: 95,51% de precisão, obtida em um tempo total de execução, incluindo o aprendizado e etiquetagem de mais de um milhão de palavras, de menos de três minutos. Contribuímos, assim, com o estado da arte da área e, além disso, fornecemos resultados que nos permitem observar limitações e vantagens da aplicação de modelos estatísticos, em geral, ao problema focado, que podem ajudar a comunidade a identificar pontos críticos sobre os quais as pesuqisas nessa área deverão procurar se concentrar.not availableBiblioteca Digitais de Teses e Dissertações da USPFinger, MarceloKepler, Fábio Natanael2005-04-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-07T19:10:40Zoai:teses.usp.br:tde-20210729-141428Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-07T19:10:40Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável not available |
title |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável |
spellingShingle |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável Kepler, Fábio Natanael Linguística Computacional |
title_short |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável |
title_full |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável |
title_fullStr |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável |
title_full_unstemmed |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável |
title_sort |
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável |
author |
Kepler, Fábio Natanael |
author_facet |
Kepler, Fábio Natanael |
author_role |
author |
dc.contributor.none.fl_str_mv |
Finger, Marcelo |
dc.contributor.author.fl_str_mv |
Kepler, Fábio Natanael |
dc.subject.por.fl_str_mv |
Linguística Computacional |
topic |
Linguística Computacional |
description |
Dado um texto, queremos atribuir a cada palavra, de acordo com seu contexto, uma categoria morfo-sintática. Para isto, implementamos dois etiquetadores morfo-sintáticos baseados em cadeias de Markov. Primeiro, utilizando uma abordagem bastante conhecida, construímos um etiquetador que usa cadeias de Markov de ordem fixa igual a dois. Então, propomos e implementamos outro etiquetador utilizando uma abordagem recente, baseada em cadeias de Markov de tamanho variável. Depois de mostrar a teoria estatística dos dois modelos e os problemas e desafios mais comuns a serem resolvidos, explicamos o funcionamento dos etiquetadores e expomos os resultados obtidos. Com estes resultados, obtemos uma comparação mais precisa da eficiência destes dois modelos aplicados à etiquetagem morfo-sintática, identificando pontos fortes e fracos de cada um. Por uma combinação de fatores, consideramos o etiquetador com cadeias de Markov de tamanho variável melhor do que o de ordem fixa, e alcançamos um dos melhores resultados em etiquetagem morfo-sintática do português atualmente: 95,51% de precisão, obtida em um tempo total de execução, incluindo o aprendizado e etiquetagem de mais de um milhão de palavras, de menos de três minutos. Contribuímos, assim, com o estado da arte da área e, além disso, fornecemos resultados que nos permitem observar limitações e vantagens da aplicação de modelos estatísticos, em geral, ao problema focado, que podem ajudar a comunidade a identificar pontos críticos sobre os quais as pesuqisas nessa área deverão procurar se concentrar. |
publishDate |
2005 |
dc.date.none.fl_str_mv |
2005-04-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ |
url |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256524765790208 |