Interpretação automatizada de textos : processamento de anáforas

Detalhes bibliográficos
Autor(a) principal: Freitas, Sérgio Antônio Andrade de
Data de Publicação: 2005
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
Texto Completo: http://repositorio.ufes.br/handle/10/4114
Resumo: This thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents.
id UFES_d759070229ff68a4bc1cb6424869226e
oai_identifier_str oai:repositorio.ufes.br:10/4114
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str 2108
spelling Lopes, José Gabriel PereiraMenezes, Crediné Silva deFreitas, Sérgio Antônio Andrade deCury, DavidsonGarcia, Berilhes BorgesVicari, Rosa MariaTavares, Orivaldo de Lira2016-08-29T15:32:42Z2016-07-112016-08-29T15:32:42Z2005-04-11This thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents.Esta tese apresenta uma solução para a interpretação de anáforas nominais definidas.Considere o seguinte texto: (1) a. Mariana comprou um carro novo. b. O motor veio danificado. A frase (1a) apresenta duas entidades: Mariana e um carro novo. Já a frase (1.2b) tem apenas uma entidade o motor. No processo de interpretação, humano ou computacional, a utilização do artigo de nido o é um indicativo de que a entidade já havia sido introduzida no discurso, i.e. apresenta um caráter anafórico. Resolver uma anáfora é, a priori, identi car a quem ou a que se refere esta anáfora. Mas no caso acima é mais do que isto: sem dúvida o motor existe no texto por causa da existência de um carro, porém a interpretação do motor deve ir além disto e identi car como este motor está ligado com aquele carro. Isto é uma anáfora nominal de nida. A interpretação das anáforas nominais de nidas ou de qualquer fenômeno anafórico pode ser generalizada como um processo que atribui valores aos itens da seguinte equação: R(A, T ) (2) onde: A denota a entidade introduzida pela interpretação fora de contexto de um pronome, de uma elipse ou de um sintagma nominal de nido, T denota o seu antecedente e R é a relação existente entre A e T . O processo de resolução da equação, que é propriamente o processo de resolução de anáforas, consiste em descobrir T e R dado A. Nesta tese é proposta uma metodologia computacional que interpreta as anáforas nominais de nidas cuja relação R é uma dentre: parte de, membro de, subcategorizado por e coreferência. A obtenção das relações é feita por um conjunto de regras pragmáticas [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003] (cap. 3). Caso seja constatado que A não seja anafórica então ela é acomodada no contexto. A metodologia computacional é construída sobre um ambiente de programação em lógica [Damásio, Nejdl e Pereira 1994] que permite raciocinar abdutivamente [Kakas, Kowalski e Toni 1992] sobre a representação semântica do texto [Kamp e Reyle 1993]. A partir da interpretação das entidades é construída a estrutura nominal do discurso [Lopes e Freitas 1994] (cap. 4), a qual permite: (1) fazer o acompanhamento das entidades mais salientes em cada frase [Freitas e Lopes 1994], (2) limitar o universo de escolha de possíveis antecedentes[Freitas e Lopes 1996] e (3) prover um resumo das entidades do discurso. O resultado é uma metodologia que permite, de forma integrada, resolver anáforas e elipses, sendo que a estrutura nominal do discurso pode ser usada na busca de informações.TextFREITAS, Sérgio Antônio Andrade de. Interpretação automatizada de textos: processamento de anáforas. 2005. Tese (Doutorado) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2002.http://repositorio.ufes.br/handle/10/4114porUniversidade Federal do Espírito SantoDoutorado em Engenharia ElétricaPrograma de Pós-Graduação em Engenharia ElétricaUFESBRCentro TecnológicoProcessamento de textos (Computação)Algoritmos de computadorAnáfora (Linguística)Processamento da linguagem natural (Computação)Eletrônica Industrial, Sistemas e Controles Eletrônicos621.3Interpretação automatizada de textos : processamento de anáforasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALTese-SergioAntonioAndradedeFreitas.pdfapplication/pdf1020803http://repositorio.ufes.br/bitstreams/063fdad9-b8c4-43da-ae27-b619328dfe97/download73b2bf94bf90fb5a8311ac7ece3a65b3MD5110/41142024-06-28 16:06:51.852oai:repositorio.ufes.br:10/4114http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-06-28T16:06:51Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv Interpretação automatizada de textos : processamento de anáforas
title Interpretação automatizada de textos : processamento de anáforas
spellingShingle Interpretação automatizada de textos : processamento de anáforas
Freitas, Sérgio Antônio Andrade de
Eletrônica Industrial, Sistemas e Controles Eletrônicos
Processamento de textos (Computação)
Algoritmos de computador
Anáfora (Linguística)
Processamento da linguagem natural (Computação)
621.3
title_short Interpretação automatizada de textos : processamento de anáforas
title_full Interpretação automatizada de textos : processamento de anáforas
title_fullStr Interpretação automatizada de textos : processamento de anáforas
title_full_unstemmed Interpretação automatizada de textos : processamento de anáforas
title_sort Interpretação automatizada de textos : processamento de anáforas
author Freitas, Sérgio Antônio Andrade de
author_facet Freitas, Sérgio Antônio Andrade de
author_role author
dc.contributor.advisor-co1.fl_str_mv Lopes, José Gabriel Pereira
dc.contributor.advisor1.fl_str_mv Menezes, Crediné Silva de
dc.contributor.author.fl_str_mv Freitas, Sérgio Antônio Andrade de
dc.contributor.referee1.fl_str_mv Cury, Davidson
dc.contributor.referee2.fl_str_mv Garcia, Berilhes Borges
dc.contributor.referee3.fl_str_mv Vicari, Rosa Maria
dc.contributor.referee4.fl_str_mv Tavares, Orivaldo de Lira
contributor_str_mv Lopes, José Gabriel Pereira
Menezes, Crediné Silva de
Cury, Davidson
Garcia, Berilhes Borges
Vicari, Rosa Maria
Tavares, Orivaldo de Lira
dc.subject.cnpq.fl_str_mv Eletrônica Industrial, Sistemas e Controles Eletrônicos
topic Eletrônica Industrial, Sistemas e Controles Eletrônicos
Processamento de textos (Computação)
Algoritmos de computador
Anáfora (Linguística)
Processamento da linguagem natural (Computação)
621.3
dc.subject.br-rjbn.none.fl_str_mv Processamento de textos (Computação)
Algoritmos de computador
Anáfora (Linguística)
Processamento da linguagem natural (Computação)
dc.subject.udc.none.fl_str_mv 621.3
description This thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents.
publishDate 2005
dc.date.issued.fl_str_mv 2005-04-11
dc.date.accessioned.fl_str_mv 2016-08-29T15:32:42Z
dc.date.available.fl_str_mv 2016-07-11
2016-08-29T15:32:42Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FREITAS, Sérgio Antônio Andrade de. Interpretação automatizada de textos: processamento de anáforas. 2005. Tese (Doutorado) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2002.
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/4114
identifier_str_mv FREITAS, Sérgio Antônio Andrade de. Interpretação automatizada de textos: processamento de anáforas. 2005. Tese (Doutorado) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2002.
url http://repositorio.ufes.br/handle/10/4114
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Doutorado em Engenharia Elétrica
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv UFES
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Centro Tecnológico
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Doutorado em Engenharia Elétrica
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
bitstream.url.fl_str_mv http://repositorio.ufes.br/bitstreams/063fdad9-b8c4-43da-ae27-b619328dfe97/download
bitstream.checksum.fl_str_mv 73b2bf94bf90fb5a8311ac7ece3a65b3
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv
_version_ 1804309131664818176