Um método adaptativo para análise sintática do Português Brasileiro.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/ |
Resumo: | As línguas naturais caracterizam-se por sua riqueza semântica, léxica e sintática, permitindo a elaboração de textos complexos com alto grau de abstração como os vistos nas grandes obras da literatura, ou precisos e direcionados, como os encontrados em tratados acadêmicos e trabalhos científicos. Há um grande apelo para que as pessoas se comuniquem com as máquinas da mesma forma que fazem umas com as outras. No entanto, o processamento de linguagens naturais requer o desenvolvimento de programas capazes de determinar e interpretar a estrutura léxico-sintática e semântica das sentenças em vários níveis de detalhe. A análise sintática, também conhecida como parsing, é um dos principais componentes em várias aplicações de processamento de linguagem natural, porém se trata de uma tarefa complexa por causa das ambiguidades da linguagem, múltiplas interpretações de palavras, diferentes ordens possíveis de elementos e itens ausentes. Além disso, as línguas mais conhecidas se beneficiam de um número significativo de recursos computacionais, enquanto as demais, entre elas o Português, não dispõem de tantas ferramentas dessa natureza. Esta tese tem como objetivo apresentar um método para análise sintática do Português Brasileiro. O formalismo adaptativo foi escolhido como modelo teórico subjacente devido à sua potencial riqueza de representação e de manipulação, o que o torna consistente e flexível ao mesmo tempo, proporcionando o embasamento necessário para a construção do modelo computacional proposto, sem a necessidade de recorrer a técnicas auxiliares. O modelo proposto foi validado através de experimentos nos quais os resultados foram comparados aos obtidos pelos analisadores sintáticos do estado da arte para o Português, visando avaliar a sua eficiência nos diversos cenários de testes. |
id |
USP_b52864441b53a4d186a38180f459a3a6 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20042022-080552 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Um método adaptativo para análise sintática do Português Brasileiro.An adaptive method for syntactic analysis of Brazilian Portuguese.Análise morfossintáticaAutomataAutômatos finitosGramática transformacionalGrammarsNatural language processingParsersProcessamento de linguagem naturalAs línguas naturais caracterizam-se por sua riqueza semântica, léxica e sintática, permitindo a elaboração de textos complexos com alto grau de abstração como os vistos nas grandes obras da literatura, ou precisos e direcionados, como os encontrados em tratados acadêmicos e trabalhos científicos. Há um grande apelo para que as pessoas se comuniquem com as máquinas da mesma forma que fazem umas com as outras. No entanto, o processamento de linguagens naturais requer o desenvolvimento de programas capazes de determinar e interpretar a estrutura léxico-sintática e semântica das sentenças em vários níveis de detalhe. A análise sintática, também conhecida como parsing, é um dos principais componentes em várias aplicações de processamento de linguagem natural, porém se trata de uma tarefa complexa por causa das ambiguidades da linguagem, múltiplas interpretações de palavras, diferentes ordens possíveis de elementos e itens ausentes. Além disso, as línguas mais conhecidas se beneficiam de um número significativo de recursos computacionais, enquanto as demais, entre elas o Português, não dispõem de tantas ferramentas dessa natureza. Esta tese tem como objetivo apresentar um método para análise sintática do Português Brasileiro. O formalismo adaptativo foi escolhido como modelo teórico subjacente devido à sua potencial riqueza de representação e de manipulação, o que o torna consistente e flexível ao mesmo tempo, proporcionando o embasamento necessário para a construção do modelo computacional proposto, sem a necessidade de recorrer a técnicas auxiliares. O modelo proposto foi validado através de experimentos nos quais os resultados foram comparados aos obtidos pelos analisadores sintáticos do estado da arte para o Português, visando avaliar a sua eficiência nos diversos cenários de testes.Natural languages are characterized by their semantic, lexical and syntactic richness, allowing the elaboration of complex texts with a high degree of abstraction, such as those seen in great works of literature, or precise and directed, as found in academic treatises and scientific works. There is a huge appeal for people to communicate with machines the same way they do with each other. However, natural language processing requires the development of programs capable of determining and interpreting the lexical-syntactic and semantic structure of sentences at various levels of detail. Parsing is one of the main components of many natural language processing applications, but it is a complex task because of language ambiguities, multiple word interpretations, different possible orders of elements and missing items. In addition, the most popular languages benefit from a significant number of computational resources, while the others, including Portuguese, do not have as many tools of this nature. This thesis aims to present a method for syntactic analysis of Brazilian Portuguese. The adaptive formalism was chosen as the underlying theoretical model because of its potential richness of representation and manipulation, which makes it consistent and flexible at the same time, providing the necessary foundation for the construction of the proposed computational model, without the need to resort to auxiliary techniques. The proposed model was validated through experiments in which the results were compared to those obtained by stateof- the-art syntactic analyzers for Portuguese, in order to evaluate the efficiency of the model in different test scenarios.Biblioteca Digitais de Teses e Dissertações da USPJosé Neto, JoãoPadovani, Djalma2022-02-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-04-20T12:35:56Zoai:teses.usp.br:tde-20042022-080552Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-04-20T12:35:56Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Um método adaptativo para análise sintática do Português Brasileiro. An adaptive method for syntactic analysis of Brazilian Portuguese. |
title |
Um método adaptativo para análise sintática do Português Brasileiro. |
spellingShingle |
Um método adaptativo para análise sintática do Português Brasileiro. Padovani, Djalma Análise morfossintática Automata Autômatos finitos Gramática transformacional Grammars Natural language processing Parsers Processamento de linguagem natural |
title_short |
Um método adaptativo para análise sintática do Português Brasileiro. |
title_full |
Um método adaptativo para análise sintática do Português Brasileiro. |
title_fullStr |
Um método adaptativo para análise sintática do Português Brasileiro. |
title_full_unstemmed |
Um método adaptativo para análise sintática do Português Brasileiro. |
title_sort |
Um método adaptativo para análise sintática do Português Brasileiro. |
author |
Padovani, Djalma |
author_facet |
Padovani, Djalma |
author_role |
author |
dc.contributor.none.fl_str_mv |
José Neto, João |
dc.contributor.author.fl_str_mv |
Padovani, Djalma |
dc.subject.por.fl_str_mv |
Análise morfossintática Automata Autômatos finitos Gramática transformacional Grammars Natural language processing Parsers Processamento de linguagem natural |
topic |
Análise morfossintática Automata Autômatos finitos Gramática transformacional Grammars Natural language processing Parsers Processamento de linguagem natural |
description |
As línguas naturais caracterizam-se por sua riqueza semântica, léxica e sintática, permitindo a elaboração de textos complexos com alto grau de abstração como os vistos nas grandes obras da literatura, ou precisos e direcionados, como os encontrados em tratados acadêmicos e trabalhos científicos. Há um grande apelo para que as pessoas se comuniquem com as máquinas da mesma forma que fazem umas com as outras. No entanto, o processamento de linguagens naturais requer o desenvolvimento de programas capazes de determinar e interpretar a estrutura léxico-sintática e semântica das sentenças em vários níveis de detalhe. A análise sintática, também conhecida como parsing, é um dos principais componentes em várias aplicações de processamento de linguagem natural, porém se trata de uma tarefa complexa por causa das ambiguidades da linguagem, múltiplas interpretações de palavras, diferentes ordens possíveis de elementos e itens ausentes. Além disso, as línguas mais conhecidas se beneficiam de um número significativo de recursos computacionais, enquanto as demais, entre elas o Português, não dispõem de tantas ferramentas dessa natureza. Esta tese tem como objetivo apresentar um método para análise sintática do Português Brasileiro. O formalismo adaptativo foi escolhido como modelo teórico subjacente devido à sua potencial riqueza de representação e de manipulação, o que o torna consistente e flexível ao mesmo tempo, proporcionando o embasamento necessário para a construção do modelo computacional proposto, sem a necessidade de recorrer a técnicas auxiliares. O modelo proposto foi validado através de experimentos nos quais os resultados foram comparados aos obtidos pelos analisadores sintáticos do estado da arte para o Português, visando avaliar a sua eficiência nos diversos cenários de testes. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-02-18 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/ |
url |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090887558365184 |