Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK

Detalhes bibliográficos
Autor(a) principal: Alencar, Leonel Figueiredo de
Data de Publicação: 2012
Tipo de documento: Artigo
Idioma: por
Título da fonte: Alfa (São José do Rio Preto. Online)
Texto Completo: https://periodicos.fclar.unesp.br/alfa/article/view/5537
Resumo: Este trabalho objetiva, primeiramente, evidenciar a utilidade da CFG e da FCFG no estudo da sintaxe formal. A aplicação de parsers baseados nesses formalismos na análise de um corpus pode revelar consequências de uma dada análise que de outro modo passariam despercebidas. O NLTK é uma caixa de ferramentas para o PLN em Python que possibilita a construção de parsers em diferentes arquiteturas. No entanto, para uma utilização não trivial dessa biblioteca na análise sintática automática são necessários conhecimentos de programação. Para permitir o acesso de não programadores à implementação e testagem de parsers, desenvolvemos o Donatus, uma interface gráfica amigável para as facilidades de parsing do NLTK, dotada de recursos adicionais que a tornam interessante também para programadores. Como exemplo do funcionamento da ferramenta e demonstração da sua relevância na investigação sintática formal, comparamos implementações de duas análises alternativas da modificação adjetival em português. A primeira abordagem, baseada na Teoria X-barra tradicional, produziu um grande número de pseudoambiguidades. Esse problema foi evitado por um parser baseado em abordagem no âmbito do Programa Minimalista. Sem o recurso do computador, essa diferença entre as duas abordagens não seria facilmente revelada.
id UNESP-4_1c13d9c086856010cb8bff735b2d21db
oai_identifier_str oai:ojs.pkp.sfu.ca:article/5537
network_acronym_str UNESP-4
network_name_str Alfa (São José do Rio Preto. Online)
repository_id_str
spelling Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTKLinguística computacionalSintaxe formalGramática gerativaTeoria X-barraGramática livre de contextoGramática de unificaçãoModificação adjetivalEste trabalho objetiva, primeiramente, evidenciar a utilidade da CFG e da FCFG no estudo da sintaxe formal. A aplicação de parsers baseados nesses formalismos na análise de um corpus pode revelar consequências de uma dada análise que de outro modo passariam despercebidas. O NLTK é uma caixa de ferramentas para o PLN em Python que possibilita a construção de parsers em diferentes arquiteturas. No entanto, para uma utilização não trivial dessa biblioteca na análise sintática automática são necessários conhecimentos de programação. Para permitir o acesso de não programadores à implementação e testagem de parsers, desenvolvemos o Donatus, uma interface gráfica amigável para as facilidades de parsing do NLTK, dotada de recursos adicionais que a tornam interessante também para programadores. Como exemplo do funcionamento da ferramenta e demonstração da sua relevância na investigação sintática formal, comparamos implementações de duas análises alternativas da modificação adjetival em português. A primeira abordagem, baseada na Teoria X-barra tradicional, produziu um grande número de pseudoambiguidades. Esse problema foi evitado por um parser baseado em abordagem no âmbito do Programa Minimalista. Sem o recurso do computador, essa diferença entre as duas abordagens não seria facilmente revelada.UNESP2012-11-26info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.fclar.unesp.br/alfa/article/view/5537ALFA: Revista de Linguística; v. 56 n. 2 (2012)1981-5794reponame:Alfa (São José do Rio Preto. Online)instname:Universidade Estadual Paulista (UNESP)instacron:UNESPporhttps://periodicos.fclar.unesp.br/alfa/article/view/5537/4349Copyright (c) 2012 ALFA: Revista de Linguísticainfo:eu-repo/semantics/openAccessAlencar, Leonel Figueiredo de2013-09-09T19:40:10Zoai:ojs.pkp.sfu.ca:article/5537Revistahttp://www.scielo.br/scielo.php?script=sci_serial&pid=1981-5794&lng=pt&nrm=isoPUBhttps://old.scielo.br/oai/scielo-oai.phpalfa@unesp.br1981-57940002-5216opendoar:2013-09-09T19:40:10Alfa (São José do Rio Preto. Online) - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
spellingShingle Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
Alencar, Leonel Figueiredo de
Linguística computacional
Sintaxe formal
Gramática gerativa
Teoria X-barra
Gramática livre de contexto
Gramática de unificação
Modificação adjetival
title_short Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title_full Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title_fullStr Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title_full_unstemmed Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
title_sort Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK
author Alencar, Leonel Figueiredo de
author_facet Alencar, Leonel Figueiredo de
author_role author
dc.contributor.author.fl_str_mv Alencar, Leonel Figueiredo de
dc.subject.por.fl_str_mv Linguística computacional
Sintaxe formal
Gramática gerativa
Teoria X-barra
Gramática livre de contexto
Gramática de unificação
Modificação adjetival
topic Linguística computacional
Sintaxe formal
Gramática gerativa
Teoria X-barra
Gramática livre de contexto
Gramática de unificação
Modificação adjetival
description Este trabalho objetiva, primeiramente, evidenciar a utilidade da CFG e da FCFG no estudo da sintaxe formal. A aplicação de parsers baseados nesses formalismos na análise de um corpus pode revelar consequências de uma dada análise que de outro modo passariam despercebidas. O NLTK é uma caixa de ferramentas para o PLN em Python que possibilita a construção de parsers em diferentes arquiteturas. No entanto, para uma utilização não trivial dessa biblioteca na análise sintática automática são necessários conhecimentos de programação. Para permitir o acesso de não programadores à implementação e testagem de parsers, desenvolvemos o Donatus, uma interface gráfica amigável para as facilidades de parsing do NLTK, dotada de recursos adicionais que a tornam interessante também para programadores. Como exemplo do funcionamento da ferramenta e demonstração da sua relevância na investigação sintática formal, comparamos implementações de duas análises alternativas da modificação adjetival em português. A primeira abordagem, baseada na Teoria X-barra tradicional, produziu um grande número de pseudoambiguidades. Esse problema foi evitado por um parser baseado em abordagem no âmbito do Programa Minimalista. Sem o recurso do computador, essa diferença entre as duas abordagens não seria facilmente revelada.
publishDate 2012
dc.date.none.fl_str_mv 2012-11-26
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.fclar.unesp.br/alfa/article/view/5537
url https://periodicos.fclar.unesp.br/alfa/article/view/5537
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.fclar.unesp.br/alfa/article/view/5537/4349
dc.rights.driver.fl_str_mv Copyright (c) 2012 ALFA: Revista de Linguística
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2012 ALFA: Revista de Linguística
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv UNESP
publisher.none.fl_str_mv UNESP
dc.source.none.fl_str_mv ALFA: Revista de Linguística; v. 56 n. 2 (2012)
1981-5794
reponame:Alfa (São José do Rio Preto. Online)
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Alfa (São José do Rio Preto. Online)
collection Alfa (São José do Rio Preto. Online)
repository.name.fl_str_mv Alfa (São José do Rio Preto. Online) - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv alfa@unesp.br
_version_ 1800214376905441280