Um método adaptativo para análise sintática do Português Brasileiro.

Detalhes bibliográficos
Autor(a) principal: Padovani, Djalma
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/
Resumo: As línguas naturais caracterizam-se por sua riqueza semântica, léxica e sintática, permitindo a elaboração de textos complexos com alto grau de abstração como os vistos nas grandes obras da literatura, ou precisos e direcionados, como os encontrados em tratados acadêmicos e trabalhos científicos. Há um grande apelo para que as pessoas se comuniquem com as máquinas da mesma forma que fazem umas com as outras. No entanto, o processamento de linguagens naturais requer o desenvolvimento de programas capazes de determinar e interpretar a estrutura léxico-sintática e semântica das sentenças em vários níveis de detalhe. A análise sintática, também conhecida como parsing, é um dos principais componentes em várias aplicações de processamento de linguagem natural, porém se trata de uma tarefa complexa por causa das ambiguidades da linguagem, múltiplas interpretações de palavras, diferentes ordens possíveis de elementos e itens ausentes. Além disso, as línguas mais conhecidas se beneficiam de um número significativo de recursos computacionais, enquanto as demais, entre elas o Português, não dispõem de tantas ferramentas dessa natureza. Esta tese tem como objetivo apresentar um método para análise sintática do Português Brasileiro. O formalismo adaptativo foi escolhido como modelo teórico subjacente devido à sua potencial riqueza de representação e de manipulação, o que o torna consistente e flexível ao mesmo tempo, proporcionando o embasamento necessário para a construção do modelo computacional proposto, sem a necessidade de recorrer a técnicas auxiliares. O modelo proposto foi validado através de experimentos nos quais os resultados foram comparados aos obtidos pelos analisadores sintáticos do estado da arte para o Português, visando avaliar a sua eficiência nos diversos cenários de testes.
id USP_b52864441b53a4d186a38180f459a3a6
oai_identifier_str oai:teses.usp.br:tde-20042022-080552
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Um método adaptativo para análise sintática do Português Brasileiro.An adaptive method for syntactic analysis of Brazilian Portuguese.Análise morfossintáticaAutomataAutômatos finitosGramática transformacionalGrammarsNatural language processingParsersProcessamento de linguagem naturalAs línguas naturais caracterizam-se por sua riqueza semântica, léxica e sintática, permitindo a elaboração de textos complexos com alto grau de abstração como os vistos nas grandes obras da literatura, ou precisos e direcionados, como os encontrados em tratados acadêmicos e trabalhos científicos. Há um grande apelo para que as pessoas se comuniquem com as máquinas da mesma forma que fazem umas com as outras. No entanto, o processamento de linguagens naturais requer o desenvolvimento de programas capazes de determinar e interpretar a estrutura léxico-sintática e semântica das sentenças em vários níveis de detalhe. A análise sintática, também conhecida como parsing, é um dos principais componentes em várias aplicações de processamento de linguagem natural, porém se trata de uma tarefa complexa por causa das ambiguidades da linguagem, múltiplas interpretações de palavras, diferentes ordens possíveis de elementos e itens ausentes. Além disso, as línguas mais conhecidas se beneficiam de um número significativo de recursos computacionais, enquanto as demais, entre elas o Português, não dispõem de tantas ferramentas dessa natureza. Esta tese tem como objetivo apresentar um método para análise sintática do Português Brasileiro. O formalismo adaptativo foi escolhido como modelo teórico subjacente devido à sua potencial riqueza de representação e de manipulação, o que o torna consistente e flexível ao mesmo tempo, proporcionando o embasamento necessário para a construção do modelo computacional proposto, sem a necessidade de recorrer a técnicas auxiliares. O modelo proposto foi validado através de experimentos nos quais os resultados foram comparados aos obtidos pelos analisadores sintáticos do estado da arte para o Português, visando avaliar a sua eficiência nos diversos cenários de testes.Natural languages are characterized by their semantic, lexical and syntactic richness, allowing the elaboration of complex texts with a high degree of abstraction, such as those seen in great works of literature, or precise and directed, as found in academic treatises and scientific works. There is a huge appeal for people to communicate with machines the same way they do with each other. However, natural language processing requires the development of programs capable of determining and interpreting the lexical-syntactic and semantic structure of sentences at various levels of detail. Parsing is one of the main components of many natural language processing applications, but it is a complex task because of language ambiguities, multiple word interpretations, different possible orders of elements and missing items. In addition, the most popular languages benefit from a significant number of computational resources, while the others, including Portuguese, do not have as many tools of this nature. This thesis aims to present a method for syntactic analysis of Brazilian Portuguese. The adaptive formalism was chosen as the underlying theoretical model because of its potential richness of representation and manipulation, which makes it consistent and flexible at the same time, providing the necessary foundation for the construction of the proposed computational model, without the need to resort to auxiliary techniques. The proposed model was validated through experiments in which the results were compared to those obtained by stateof- the-art syntactic analyzers for Portuguese, in order to evaluate the efficiency of the model in different test scenarios.Biblioteca Digitais de Teses e Dissertações da USPJosé Neto, JoãoPadovani, Djalma2022-02-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-04-20T12:35:56Zoai:teses.usp.br:tde-20042022-080552Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-04-20T12:35:56Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Um método adaptativo para análise sintática do Português Brasileiro.
An adaptive method for syntactic analysis of Brazilian Portuguese.
title Um método adaptativo para análise sintática do Português Brasileiro.
spellingShingle Um método adaptativo para análise sintática do Português Brasileiro.
Padovani, Djalma
Análise morfossintática
Automata
Autômatos finitos
Gramática transformacional
Grammars
Natural language processing
Parsers
Processamento de linguagem natural
title_short Um método adaptativo para análise sintática do Português Brasileiro.
title_full Um método adaptativo para análise sintática do Português Brasileiro.
title_fullStr Um método adaptativo para análise sintática do Português Brasileiro.
title_full_unstemmed Um método adaptativo para análise sintática do Português Brasileiro.
title_sort Um método adaptativo para análise sintática do Português Brasileiro.
author Padovani, Djalma
author_facet Padovani, Djalma
author_role author
dc.contributor.none.fl_str_mv José Neto, João
dc.contributor.author.fl_str_mv Padovani, Djalma
dc.subject.por.fl_str_mv Análise morfossintática
Automata
Autômatos finitos
Gramática transformacional
Grammars
Natural language processing
Parsers
Processamento de linguagem natural
topic Análise morfossintática
Automata
Autômatos finitos
Gramática transformacional
Grammars
Natural language processing
Parsers
Processamento de linguagem natural
description As línguas naturais caracterizam-se por sua riqueza semântica, léxica e sintática, permitindo a elaboração de textos complexos com alto grau de abstração como os vistos nas grandes obras da literatura, ou precisos e direcionados, como os encontrados em tratados acadêmicos e trabalhos científicos. Há um grande apelo para que as pessoas se comuniquem com as máquinas da mesma forma que fazem umas com as outras. No entanto, o processamento de linguagens naturais requer o desenvolvimento de programas capazes de determinar e interpretar a estrutura léxico-sintática e semântica das sentenças em vários níveis de detalhe. A análise sintática, também conhecida como parsing, é um dos principais componentes em várias aplicações de processamento de linguagem natural, porém se trata de uma tarefa complexa por causa das ambiguidades da linguagem, múltiplas interpretações de palavras, diferentes ordens possíveis de elementos e itens ausentes. Além disso, as línguas mais conhecidas se beneficiam de um número significativo de recursos computacionais, enquanto as demais, entre elas o Português, não dispõem de tantas ferramentas dessa natureza. Esta tese tem como objetivo apresentar um método para análise sintática do Português Brasileiro. O formalismo adaptativo foi escolhido como modelo teórico subjacente devido à sua potencial riqueza de representação e de manipulação, o que o torna consistente e flexível ao mesmo tempo, proporcionando o embasamento necessário para a construção do modelo computacional proposto, sem a necessidade de recorrer a técnicas auxiliares. O modelo proposto foi validado através de experimentos nos quais os resultados foram comparados aos obtidos pelos analisadores sintáticos do estado da arte para o Português, visando avaliar a sua eficiência nos diversos cenários de testes.
publishDate 2022
dc.date.none.fl_str_mv 2022-02-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/
url https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090887558365184