Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos

Detalhes bibliográficos
Autor(a) principal: Bidarra, Jorge
Data de Publicação: 2001
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1591143
Resumo: Orientador: Edson Françozo
id UNICAMP-30_d591414f4bc5eaacc7568c49cb73b401
oai_identifier_str oai::222132
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicosAmbiguidadePolissemiaProcessamento de linguagem natural (Computação)Inteligência artificialOrientador: Edson FrançozoTese (doutorado) - Universidade Estadual de Campinas, Instituto de Estudos da LinguagemResumo: A maioria das palavras em português revela um alto grau de polissemia. Apesar disso, os modelos de léxicos convencionais não têm se mostrado aptos para lidar adequadamente com o fenômeno. O tratamento que dão às palavras polissêmicas, não raro, é exatamente o mesmo aplicado aos casos de homonímia. Ou seja, para cada significado diferente que a palavra admite, cria-se uma nova entrada no léxico, totalmente desarticulada dos demais sentidos, mesmo que entre eles haja algum tipo de relacionamento semântico estabelecido. A principal implicação desta falta de estruturação é que ao sistema lexical deixa-se pouco ou nenhum recurso para enfrentar situações tais como aquela em que um novo sentido de uma palavra é detectado mas que não encontra correspondência com qualquer das entradas descritas no léxico. Esta tese investiga justamente o problema da representação no léxico de palavras ambíguas, mas em particular no que tange à polissemia adjetival, e propõe um protótipo de léxico semântico para o PLN. O modelo em si resulta da integração de duas importantes teorias gramaticais, quais sejam, a do léxico gerativo de James PUSTEJOVSKY (1991, 1995) e a da HPSG desenvolvida por Carl POLLARD e Ivan A. SAG (1987, 1994). Do ponto de vista da arquitetura, o léxico como aqui é proposto, e que se encontra formalmente especificado, apresenta algumas vantagens (das quais citaremos apenas três) em relação a outras modelagens existentes. Uma delas dizendo respeito a sua capacidade para integrar de uma maneira bastante satisfatória ambos os níveis de representação sintática e semântico-conceitual de qualquer um dos itens a serem lexicalizados. Uma outra vantagem é que, partindo de uma representação lexical interna ricamente estruturada, cujas especificações são feitas com base nas chamadas estruturas de traços tipadas, dá-se ao modelo um alto poder de expressividade, na medida em que pela unificação das estruturas toma-se também possível combinar informações que não só as oriundas do próprio item lexical mas também aquelas obtidas de outros itens que com ele se estruturam para formar uma expressão gramatical mais complexa. A terceira e última vantagem, talvez sendo ela a mais importante de todas, tem a ver com a habilidade do modelo para, a partir de uma única entrada lexical (esta representando a especificação do significado básico e central da palavra polissêmica), capturar cada um dos diferentes sentidos que o item em questão possa admitir quando submetido ao contextoAbstract: Most words in portuguese display a highest degree of polysemy. Nevertheless the conventional lexical models have not been able to deal with this phenomenon adequately. The treatment given to polysemy is often the same as to homonymy. That is, for each different meaning the word presents, a new lexicon entry is created, unrelated to the others even if there is some kind of semantic relation among them. The most important implication of this lack of structure is that the lexical system finds few or no resources to deal with situations in which a new sense is detected for a given word but this sense does not match any of the listed homonymous senses in the lexicon. This thesis investigates the lexical ambiguity problem but in particular that concerning the adjectival polysemy and proposes a prototypical semantic lexicon for NLP. The model we propose integrates two important grammatical theories, that is, the Generative Lexicon by James PUSTEJOVKSY (1991, 1995), and HPSG by Carl POLLARDand Ivan A. SAG (1987, 1994). From the point of view of its architecture, the lexicon formally specified here, shows some advantages (only three of them are mentioned here) when compared to the other proposed models. The first advantage is certainly its capacity to integrate satisfactorily both syntactical and semantic-conceptuallevels for any item to be inserted in the lexicon. Second, starting with a highly structured lexical representation, the model reaches a high leveI of expression because the unification of structures enables a combination of information obtained not only from the lexical item itself, but also trom other items combined to form a more complex grammatical expression. The last advantage, perhaps the most important one, refers to the model's ability to capture each one of the different senses the word admits when submitted to the context, taking as a start point only one lexical entry (which represents the basic and central meaning specification of the polyssemic word)DoutoradoDoutor em Linguística Aplicada[s.n.]Françozo, Edson, 1951-Carvalho, Ariadne Maria Brito RizzoniIlari, RodolfoSilva, Bento Carlos Dias daBarbosa, Plinio AlmeidaUniversidade Estadual de Campinas (UNICAMP). Instituto de Estudos da LinguagemPrograma de Pós-Graduação em Linguística AplicadaUNIVERSIDADE ESTADUAL DE CAMPINASBidarra, Jorge20012002-01-15T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf266p. : il.(Broch.)https://hdl.handle.net/20.500.12733/1591143BIDARRA, Jorge. Prototipo de um lexico para o processamento da linguagem natural: o caso dos adjetivos polissemicos. 2001. 266p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1591143. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/222132porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T03:28:12Zoai::222132Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T03:28:12Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
title Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
spellingShingle Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
Bidarra, Jorge
Ambiguidade
Polissemia
Processamento de linguagem natural (Computação)
Inteligência artificial
title_short Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
title_full Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
title_fullStr Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
title_full_unstemmed Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
title_sort Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
author Bidarra, Jorge
author_facet Bidarra, Jorge
author_role author
dc.contributor.none.fl_str_mv Françozo, Edson, 1951-
Carvalho, Ariadne Maria Brito Rizzoni
Ilari, Rodolfo
Silva, Bento Carlos Dias da
Barbosa, Plinio Almeida
Universidade Estadual de Campinas (UNICAMP). Instituto de Estudos da Linguagem
Programa de Pós-Graduação em Linguística Aplicada
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Bidarra, Jorge
dc.subject.por.fl_str_mv Ambiguidade
Polissemia
Processamento de linguagem natural (Computação)
Inteligência artificial
topic Ambiguidade
Polissemia
Processamento de linguagem natural (Computação)
Inteligência artificial
description Orientador: Edson Françozo
publishDate 2001
dc.date.none.fl_str_mv 2001
2002-01-15T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv (Broch.)
https://hdl.handle.net/20.500.12733/1591143
BIDARRA, Jorge. Prototipo de um lexico para o processamento da linguagem natural: o caso dos adjetivos polissemicos. 2001. 266p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1591143. Acesso em: 2 set. 2024.
identifier_str_mv (Broch.)
BIDARRA, Jorge. Prototipo de um lexico para o processamento da linguagem natural: o caso dos adjetivos polissemicos. 2001. 266p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1591143. Acesso em: 2 set. 2024.
url https://hdl.handle.net/20.500.12733/1591143
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/222132
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
266p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809188859430305792