A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov

Detalhes bibliográficos
Autor(a) principal: Chaves, Amanda Rocha
Data de Publicação: 2007
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/351
Resumo: One of the problems of natural language processing systems is to assure referential cohesion in a text. This property allows connecting the text constituents and making it readable. We address the anaphoric phenomenon as one of the main factors of referential cohesion. Anaphors depict a reference relationship between two or more text components, and the interpretation of the anaphor is dependent upon the interpretation of its antecedent. This work is limited to pronominal anaphors, thus, to automatic pronoun resolution. Several algorithms have been proposed to this end. They usually involve (1) identifying the anaphoric component; (2) determining the set of its possible antecedents; and (3) identifying and selecting the most likely antecedent of the anaphor. The lack of anaphora resolution in, e.g., information extraction and automatic translation or summarization may yield non-cohesive texts. Herein we present an adaptation of the Mitkov´s algorithm for pronoun resolution. 3rd person pronouns for Brazilian Portuguese are especially addressed, whose antecedents are noun phrases. This approach has been intrinsically evaluated on annotated corpora. It has also been compared with Lappin and Leass algorithm for pronoun resolution, adapted to Portuguese. Annotations embed morphological, syntactic and co-referential information. The evaluation measure adopted was the success rate. This is defined as the ratio between the number of anaphors correctly resolved by the system and the total number of anaphors in the text. The results of both evaluations are discussed here.
id SCAR_ecb53f8d1691b778129d909714bfc711
oai_identifier_str oai:repositorio.ufscar.br:ufscar/351
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Chaves, Amanda RochaRino, Lúcia Helena Machadohttp://lattes.cnpq.br/0315640846525832http://lattes.cnpq.br/048634288910907580035fec-3757-40b1-a863-8aa91a8008af2016-06-02T19:05:25Z2007-10-262016-06-02T19:05:25Z2007-08-22CHAVES, Amanda Rocha. A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov.. 2007. 118 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007.https://repositorio.ufscar.br/handle/ufscar/351One of the problems of natural language processing systems is to assure referential cohesion in a text. This property allows connecting the text constituents and making it readable. We address the anaphoric phenomenon as one of the main factors of referential cohesion. Anaphors depict a reference relationship between two or more text components, and the interpretation of the anaphor is dependent upon the interpretation of its antecedent. This work is limited to pronominal anaphors, thus, to automatic pronoun resolution. Several algorithms have been proposed to this end. They usually involve (1) identifying the anaphoric component; (2) determining the set of its possible antecedents; and (3) identifying and selecting the most likely antecedent of the anaphor. The lack of anaphora resolution in, e.g., information extraction and automatic translation or summarization may yield non-cohesive texts. Herein we present an adaptation of the Mitkov´s algorithm for pronoun resolution. 3rd person pronouns for Brazilian Portuguese are especially addressed, whose antecedents are noun phrases. This approach has been intrinsically evaluated on annotated corpora. It has also been compared with Lappin and Leass algorithm for pronoun resolution, adapted to Portuguese. Annotations embed morphological, syntactic and co-referential information. The evaluation measure adopted was the success rate. This is defined as the ratio between the number of anaphors correctly resolved by the system and the total number of anaphors in the text. The results of both evaluations are discussed here.Um dos problemas encontrados em sistemas de processamento de línguas naturais é conseguir manter a coesão referencial de um texto, propriedade que permite estabelecer as ligações entre os seus constituintes, tornando-o inteligível. Dentre os fatores de coesão referencial destacamos a anáfora, que ocorre quando duas ou mais expressões de um texto estabelecem uma relação de referência entre si, isto é, a interpretação da anáfora depende de um antecedente ao qual ela se refere no texto. Diversos algoritmos na literatura foram propostos para a resolução automática de anáforas pronominais, que consiste em: 1) identificar a anáfora, 2) determinar o conjunto de possíveis antecedentes e 3) identificar e selecionar o antecedente da anáfora. A ausência da resolução anafórica em aplicações como extração de informação, tradução automática e sumarização textual, dentre outras, pode levar à descontinuidade referencial de seus resultados, tornando-os não-coesos. Nesse contexto, apresentamos uma adaptação do algoritmo de Mitkov, originalmente aplicado no inglês, para resolver anáforas da língua portuguesa, especialmente as determinadas por pronomes pessoais de terceira pessoa cujo antecedente seja um sintagma nominal. Essa abordagem foi avaliada com base em corpora anotados com informações morfossintáticas e coreferenciais, utilizando-se como medida de avaliação de desempenho a taxa de sucesso, que determina o número de anáforas resolvidas corretamente pelo sistema automático em relação ao número de anáforas presentes no corpus avaliado. Além disso, fez-se uma comparação de desempenho entre essa abordagem e o algoritmo de Lappin & Leass adaptado para o português. Os resultados dessa avaliação são discutidos ao final do trabalho.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRInteligência artificialProcessamento da linguagem natural (Computação)Resolução anafórica automáticaCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOA resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkovinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1629307e8-d9f0-4e50-b2e4-e495b4d8b0fbinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALChavesDissMestrado2007.pdfapplication/pdf1531762https://repositorio.ufscar.br/bitstream/ufscar/351/1/ChavesDissMestrado2007.pdf7abc0f23650c4081b1838680a8af1dd3MD51TEXTChavesDissMestrado2007.pdf.txtChavesDissMestrado2007.pdf.txtExtracted texttext/plain235764https://repositorio.ufscar.br/bitstream/ufscar/351/2/ChavesDissMestrado2007.pdf.txt985acfbbc9ae72dcff752ceac4465dd4MD52THUMBNAILChavesDissMestrado2007.pdf.jpgChavesDissMestrado2007.pdf.jpgIM Thumbnailimage/jpeg6373https://repositorio.ufscar.br/bitstream/ufscar/351/3/ChavesDissMestrado2007.pdf.jpg7f23dd1a6945dcb2236fa71fc799ac3bMD53ufscar/3512023-09-18 18:30:38.595oai:repositorio.ufscar.br:ufscar/351Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:30:38Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov
title A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov
spellingShingle A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov
Chaves, Amanda Rocha
Inteligência artificial
Processamento da linguagem natural (Computação)
Resolução anafórica automática
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov
title_full A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov
title_fullStr A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov
title_full_unstemmed A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov
title_sort A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov
author Chaves, Amanda Rocha
author_facet Chaves, Amanda Rocha
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/0486342889109075
dc.contributor.author.fl_str_mv Chaves, Amanda Rocha
dc.contributor.advisor1.fl_str_mv Rino, Lúcia Helena Machado
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0315640846525832
dc.contributor.authorID.fl_str_mv 80035fec-3757-40b1-a863-8aa91a8008af
contributor_str_mv Rino, Lúcia Helena Machado
dc.subject.por.fl_str_mv Inteligência artificial
Processamento da linguagem natural (Computação)
Resolução anafórica automática
topic Inteligência artificial
Processamento da linguagem natural (Computação)
Resolução anafórica automática
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description One of the problems of natural language processing systems is to assure referential cohesion in a text. This property allows connecting the text constituents and making it readable. We address the anaphoric phenomenon as one of the main factors of referential cohesion. Anaphors depict a reference relationship between two or more text components, and the interpretation of the anaphor is dependent upon the interpretation of its antecedent. This work is limited to pronominal anaphors, thus, to automatic pronoun resolution. Several algorithms have been proposed to this end. They usually involve (1) identifying the anaphoric component; (2) determining the set of its possible antecedents; and (3) identifying and selecting the most likely antecedent of the anaphor. The lack of anaphora resolution in, e.g., information extraction and automatic translation or summarization may yield non-cohesive texts. Herein we present an adaptation of the Mitkov´s algorithm for pronoun resolution. 3rd person pronouns for Brazilian Portuguese are especially addressed, whose antecedents are noun phrases. This approach has been intrinsically evaluated on annotated corpora. It has also been compared with Lappin and Leass algorithm for pronoun resolution, adapted to Portuguese. Annotations embed morphological, syntactic and co-referential information. The evaluation measure adopted was the success rate. This is defined as the ratio between the number of anaphors correctly resolved by the system and the total number of anaphors in the text. The results of both evaluations are discussed here.
publishDate 2007
dc.date.available.fl_str_mv 2007-10-26
2016-06-02T19:05:25Z
dc.date.issued.fl_str_mv 2007-08-22
dc.date.accessioned.fl_str_mv 2016-06-02T19:05:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CHAVES, Amanda Rocha. A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov.. 2007. 118 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/351
identifier_str_mv CHAVES, Amanda Rocha. A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov.. 2007. 118 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2007.
url https://repositorio.ufscar.br/handle/ufscar/351
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 629307e8-d9f0-4e50-b2e4-e495b4d8b0fb
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/351/1/ChavesDissMestrado2007.pdf
https://repositorio.ufscar.br/bitstream/ufscar/351/2/ChavesDissMestrado2007.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/351/3/ChavesDissMestrado2007.pdf.jpg
bitstream.checksum.fl_str_mv 7abc0f23650c4081b1838680a8af1dd3
985acfbbc9ae72dcff752ceac4465dd4
7f23dd1a6945dcb2236fa71fc799ac3b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136244090568704