Interpretação automatizada de textos : processamento de anáforas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2005 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
Texto Completo: | http://repositorio.ufes.br/handle/10/4114 |
Resumo: | This thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents. |
id |
UFES_d759070229ff68a4bc1cb6424869226e |
---|---|
oai_identifier_str |
oai:repositorio.ufes.br:10/4114 |
network_acronym_str |
UFES |
network_name_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
repository_id_str |
2108 |
spelling |
Lopes, José Gabriel PereiraMenezes, Crediné Silva deFreitas, Sérgio Antônio Andrade deCury, DavidsonGarcia, Berilhes BorgesVicari, Rosa MariaTavares, Orivaldo de Lira2016-08-29T15:32:42Z2016-07-112016-08-29T15:32:42Z2005-04-11This thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents.Esta tese apresenta uma solução para a interpretação de anáforas nominais definidas.Considere o seguinte texto: (1) a. Mariana comprou um carro novo. b. O motor veio danificado. A frase (1a) apresenta duas entidades: Mariana e um carro novo. Já a frase (1.2b) tem apenas uma entidade o motor. No processo de interpretação, humano ou computacional, a utilização do artigo de nido o é um indicativo de que a entidade já havia sido introduzida no discurso, i.e. apresenta um caráter anafórico. Resolver uma anáfora é, a priori, identi car a quem ou a que se refere esta anáfora. Mas no caso acima é mais do que isto: sem dúvida o motor existe no texto por causa da existência de um carro, porém a interpretação do motor deve ir além disto e identi car como este motor está ligado com aquele carro. Isto é uma anáfora nominal de nida. A interpretação das anáforas nominais de nidas ou de qualquer fenômeno anafórico pode ser generalizada como um processo que atribui valores aos itens da seguinte equação: R(A, T ) (2) onde: A denota a entidade introduzida pela interpretação fora de contexto de um pronome, de uma elipse ou de um sintagma nominal de nido, T denota o seu antecedente e R é a relação existente entre A e T . O processo de resolução da equação, que é propriamente o processo de resolução de anáforas, consiste em descobrir T e R dado A. Nesta tese é proposta uma metodologia computacional que interpreta as anáforas nominais de nidas cuja relação R é uma dentre: parte de, membro de, subcategorizado por e coreferência. A obtenção das relações é feita por um conjunto de regras pragmáticas [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003] (cap. 3). Caso seja constatado que A não seja anafórica então ela é acomodada no contexto. A metodologia computacional é construída sobre um ambiente de programação em lógica [Damásio, Nejdl e Pereira 1994] que permite raciocinar abdutivamente [Kakas, Kowalski e Toni 1992] sobre a representação semântica do texto [Kamp e Reyle 1993]. A partir da interpretação das entidades é construída a estrutura nominal do discurso [Lopes e Freitas 1994] (cap. 4), a qual permite: (1) fazer o acompanhamento das entidades mais salientes em cada frase [Freitas e Lopes 1994], (2) limitar o universo de escolha de possíveis antecedentes[Freitas e Lopes 1996] e (3) prover um resumo das entidades do discurso. O resultado é uma metodologia que permite, de forma integrada, resolver anáforas e elipses, sendo que a estrutura nominal do discurso pode ser usada na busca de informações.TextFREITAS, Sérgio Antônio Andrade de. Interpretação automatizada de textos: processamento de anáforas. 2005. Tese (Doutorado) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2002.http://repositorio.ufes.br/handle/10/4114porUniversidade Federal do Espírito SantoDoutorado em Engenharia ElétricaPrograma de Pós-Graduação em Engenharia ElétricaUFESBRCentro TecnológicoProcessamento de textos (Computação)Algoritmos de computadorAnáfora (Linguística)Processamento da linguagem natural (Computação)Eletrônica Industrial, Sistemas e Controles Eletrônicos621.3Interpretação automatizada de textos : processamento de anáforasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALTese-SergioAntonioAndradedeFreitas.pdfapplication/pdf1020803http://repositorio.ufes.br/bitstreams/063fdad9-b8c4-43da-ae27-b619328dfe97/download73b2bf94bf90fb5a8311ac7ece3a65b3MD5110/41142024-06-28 16:06:51.852oai:repositorio.ufes.br:10/4114http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-06-28T16:06:51Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false |
dc.title.none.fl_str_mv |
Interpretação automatizada de textos : processamento de anáforas |
title |
Interpretação automatizada de textos : processamento de anáforas |
spellingShingle |
Interpretação automatizada de textos : processamento de anáforas Freitas, Sérgio Antônio Andrade de Eletrônica Industrial, Sistemas e Controles Eletrônicos Processamento de textos (Computação) Algoritmos de computador Anáfora (Linguística) Processamento da linguagem natural (Computação) 621.3 |
title_short |
Interpretação automatizada de textos : processamento de anáforas |
title_full |
Interpretação automatizada de textos : processamento de anáforas |
title_fullStr |
Interpretação automatizada de textos : processamento de anáforas |
title_full_unstemmed |
Interpretação automatizada de textos : processamento de anáforas |
title_sort |
Interpretação automatizada de textos : processamento de anáforas |
author |
Freitas, Sérgio Antônio Andrade de |
author_facet |
Freitas, Sérgio Antônio Andrade de |
author_role |
author |
dc.contributor.advisor-co1.fl_str_mv |
Lopes, José Gabriel Pereira |
dc.contributor.advisor1.fl_str_mv |
Menezes, Crediné Silva de |
dc.contributor.author.fl_str_mv |
Freitas, Sérgio Antônio Andrade de |
dc.contributor.referee1.fl_str_mv |
Cury, Davidson |
dc.contributor.referee2.fl_str_mv |
Garcia, Berilhes Borges |
dc.contributor.referee3.fl_str_mv |
Vicari, Rosa Maria |
dc.contributor.referee4.fl_str_mv |
Tavares, Orivaldo de Lira |
contributor_str_mv |
Lopes, José Gabriel Pereira Menezes, Crediné Silva de Cury, Davidson Garcia, Berilhes Borges Vicari, Rosa Maria Tavares, Orivaldo de Lira |
dc.subject.cnpq.fl_str_mv |
Eletrônica Industrial, Sistemas e Controles Eletrônicos |
topic |
Eletrônica Industrial, Sistemas e Controles Eletrônicos Processamento de textos (Computação) Algoritmos de computador Anáfora (Linguística) Processamento da linguagem natural (Computação) 621.3 |
dc.subject.br-rjbn.none.fl_str_mv |
Processamento de textos (Computação) Algoritmos de computador Anáfora (Linguística) Processamento da linguagem natural (Computação) |
dc.subject.udc.none.fl_str_mv |
621.3 |
description |
This thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents. |
publishDate |
2005 |
dc.date.issued.fl_str_mv |
2005-04-11 |
dc.date.accessioned.fl_str_mv |
2016-08-29T15:32:42Z |
dc.date.available.fl_str_mv |
2016-07-11 2016-08-29T15:32:42Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FREITAS, Sérgio Antônio Andrade de. Interpretação automatizada de textos: processamento de anáforas. 2005. Tese (Doutorado) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2002. |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufes.br/handle/10/4114 |
identifier_str_mv |
FREITAS, Sérgio Antônio Andrade de. Interpretação automatizada de textos: processamento de anáforas. 2005. Tese (Doutorado) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2002. |
url |
http://repositorio.ufes.br/handle/10/4114 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
Text |
dc.publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo Doutorado em Engenharia Elétrica |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
UFES |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Centro Tecnológico |
publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo Doutorado em Engenharia Elétrica |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) instname:Universidade Federal do Espírito Santo (UFES) instacron:UFES |
instname_str |
Universidade Federal do Espírito Santo (UFES) |
instacron_str |
UFES |
institution |
UFES |
reponame_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
collection |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
bitstream.url.fl_str_mv |
http://repositorio.ufes.br/bitstreams/063fdad9-b8c4-43da-ae27-b619328dfe97/download |
bitstream.checksum.fl_str_mv |
73b2bf94bf90fb5a8311ac7ece3a65b3 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES) |
repository.mail.fl_str_mv |
|
_version_ |
1804309131664818176 |