Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK

Detalhes bibliográficos
Autor(a) principal: Araripe, Leonel Figueiredo de Alencar
Data de Publicação: 2012
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Ceará (UFC)
Texto Completo: http://www.repositorio.ufc.br/handle/riufc/19738
Resumo: Este trabalho objetiva, primeiramente, evidenciar a utilidade da CFG e da FCFG no estudo da sintaxe formal. A aplicação de parsers baseados nesses formalismos na análise de um corpus pode revelar consequências de uma dada análise que de outro modo passariam despercebidas. O NLTK é uma caixa de ferramentas para o PLN em Python que possibilita a construção de parsers em diferentes arquiteturas. No entanto, para uma utilização não trivial dessa biblioteca na análise sintática automática são necessários conhecimentos de programação. Para permitir o acesso de não programadores à implementação e testagem de parsers, desenvolvemos o Donatus, uma interface gráfica amigável para as facilidades de parsing do NLTK, dotada de recursos adicionais que a tornam interessante também para programadores. Como exemplo do funcionamento da ferramenta e demonstração da sua relevância na investigação sintática formal, comparamos implementações de duas análises alternativas da modificação adjetival em português. A primeira abordagem, baseada na Teoria X-barra tradicional, produziu um grande número de pseudoambiguidades. Esse problema foi evitado por um parser baseado em abordagem no âmbito do Programa Minimalista. Sem o recurso do computador, essa diferença entre as duas abordagens não seria facilmente revelada.
id UFC-7_dbd162eea7b04c2704900e4dd6548e05
oai_identifier_str oai:repositorio.ufc.br:riufc/19738
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTKLinguística computacionalSintaxe formalGramática gerativaTeoria X-barraGramática livre de contextoGramática de unificaçãoModificação adjetivalEste trabalho objetiva, primeiramente, evidenciar a utilidade da CFG e da FCFG no estudo da sintaxe formal. A aplicação de parsers baseados nesses formalismos na análise de um corpus pode revelar consequências de uma dada análise que de outro modo passariam despercebidas. O NLTK é uma caixa de ferramentas para o PLN em Python que possibilita a construção de parsers em diferentes arquiteturas. No entanto, para uma utilização não trivial dessa biblioteca na análise sintática automática são necessários conhecimentos de programação. Para permitir o acesso de não programadores à implementação e testagem de parsers, desenvolvemos o Donatus, uma interface gráfica amigável para as facilidades de parsing do NLTK, dotada de recursos adicionais que a tornam interessante também para programadores. Como exemplo do funcionamento da ferramenta e demonstração da sua relevância na investigação sintática formal, comparamos implementações de duas análises alternativas da modificação adjetival em português. A primeira abordagem, baseada na Teoria X-barra tradicional, produziu um grande número de pseudoambiguidades. Esse problema foi evitado por um parser baseado em abordagem no âmbito do Programa Minimalista. Sem o recurso do computador, essa diferença entre as duas abordagens não seria facilmente revelada.Alfa: Revista de Linguística2016-09-26T22:08:30Z2016-09-26T22:08:30Z2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfARARIPE, Leonel Figueiredo de Alencar. Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK. Alfa: Revista de Linguística, São Paulo, v. 56, n. 2, p. 523-555, 2012.1981-5794http://www.repositorio.ufc.br/handle/riufc/19738Araripe, Leonel Figueiredo de Alencarinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFC2023-10-31T14:21:12Zoai:repositorio.ufc.br:riufc/19738Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2023-10-31T14:21:12Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.none.fl_str_mv Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
spellingShingle Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
Araripe, Leonel Figueiredo de Alencar
Linguística computacional
Sintaxe formal
Gramática gerativa
Teoria X-barra
Gramática livre de contexto
Gramática de unificação
Modificação adjetival
title_short Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title_full Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title_fullStr Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title_full_unstemmed Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title_sort Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
author Araripe, Leonel Figueiredo de Alencar
author_facet Araripe, Leonel Figueiredo de Alencar
author_role author
dc.contributor.author.fl_str_mv Araripe, Leonel Figueiredo de Alencar
dc.subject.por.fl_str_mv Linguística computacional
Sintaxe formal
Gramática gerativa
Teoria X-barra
Gramática livre de contexto
Gramática de unificação
Modificação adjetival
topic Linguística computacional
Sintaxe formal
Gramática gerativa
Teoria X-barra
Gramática livre de contexto
Gramática de unificação
Modificação adjetival
description Este trabalho objetiva, primeiramente, evidenciar a utilidade da CFG e da FCFG no estudo da sintaxe formal. A aplicação de parsers baseados nesses formalismos na análise de um corpus pode revelar consequências de uma dada análise que de outro modo passariam despercebidas. O NLTK é uma caixa de ferramentas para o PLN em Python que possibilita a construção de parsers em diferentes arquiteturas. No entanto, para uma utilização não trivial dessa biblioteca na análise sintática automática são necessários conhecimentos de programação. Para permitir o acesso de não programadores à implementação e testagem de parsers, desenvolvemos o Donatus, uma interface gráfica amigável para as facilidades de parsing do NLTK, dotada de recursos adicionais que a tornam interessante também para programadores. Como exemplo do funcionamento da ferramenta e demonstração da sua relevância na investigação sintática formal, comparamos implementações de duas análises alternativas da modificação adjetival em português. A primeira abordagem, baseada na Teoria X-barra tradicional, produziu um grande número de pseudoambiguidades. Esse problema foi evitado por um parser baseado em abordagem no âmbito do Programa Minimalista. Sem o recurso do computador, essa diferença entre as duas abordagens não seria facilmente revelada.
publishDate 2012
dc.date.none.fl_str_mv 2012
2016-09-26T22:08:30Z
2016-09-26T22:08:30Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv ARARIPE, Leonel Figueiredo de Alencar. Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK. Alfa: Revista de Linguística, São Paulo, v. 56, n. 2, p. 523-555, 2012.
1981-5794
http://www.repositorio.ufc.br/handle/riufc/19738
identifier_str_mv ARARIPE, Leonel Figueiredo de Alencar. Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK. Alfa: Revista de Linguística, São Paulo, v. 56, n. 2, p. 523-555, 2012.
1981-5794
url http://www.repositorio.ufc.br/handle/riufc/19738
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Alfa: Revista de Linguística
publisher.none.fl_str_mv Alfa: Revista de Linguística
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1809935799720869888