Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFJF |
Texto Completo: | https://repositorio.ufjf.br/jspui/handle/ufjf/15270 |
Resumo: | O trabalho apresentado nesta dissertação se insere nos estudos desenvolvidos pela FrameNet Brasil (FN-Br). Por meio dos pressupostos teóricos da Semântica de Frames (FILLMORE, 1982) e da Gramática de Construções de Berkeley (KAY; FILLMORE, 1999), este trabalho tem como objetivos (i) fornecer o tratamento linguístico-computacional das construções anafóricas pronominais no português brasileiro; (ii) discutir a aplicação do modelo do Constructicon em métodos de extração de informação. Para atingir esses objetivos, o trabalho conta com uma metodologia dividida em: apresentação do corpus de análise, cadastramento de construções, análise de ocorrências, modelagem e experimento de reconhecimento de construções. Assim, este trabalho propõe uma representação linguística e computacional das construções anafóricas pronominais demonstrativas, possessivas, reflexivas, relativas, indefinidas, nominativas, oblíquas e de tratamento. Por meio da análise de dados em dois corpora General e Natural Language Generation, constatamos a diversidade dos padrões anafóricos pronominais em língua portuguesa. A partir disso, modelamos computacionalmente as construções por tipo de anáfora e definimos os elementos que compõem a estrutura: o antecedente e o pronome. Depois, limitamos morfossintática e semanticamente os elementos que constituem as estruturas por meio de constraints baseados em Universal Dependencies (UDs), ordem de constituintes e frames. Por fim, implementamos um sistema de reconhecimento de construções anafóricas pronominais e de seus antecedentes a partir das construções modeladas no Constructicon e quantificamos os dados obtidos. Os resultados apontam para o mapeamento correto dos elementos antecedentes pela aplicação do modelo em contextos que o antecedente localiza-se próximo ao pronome anafórico. Por outro lado, o modelo não obteve o resultado esperado em contextos que os antecedentes são sintagmas nominais complexos, entidades nomeadas, elipses ou estão localizados fora do limite da sentença. Tais limitações estão relacionadas a três fatores: às deficiências do modelo propriamente dito, à base de dados da FN-Br que não processa entidades nomeadas e, por fim, ao funcionamento do parser UD - que processa itens lexicais em uma sentença por vez. Os resultados reforçam a necessidade de ampliação da cobertura do Constructicon da FN-Br. |
id |
UFJF_925d128eea68d2de44502ed98e1ad55a |
---|---|
oai_identifier_str |
oai:hermes.cpd.ufjf.br:ufjf/15270 |
network_acronym_str |
UFJF |
network_name_str |
Repositório Institucional da UFJF |
repository_id_str |
|
spelling |
Torrent, Tiago Timponihttp://buscatextual.cnpq.br/buscatextual/busca.doMatos, Ely Edison da Silvahttp://buscatextual.cnpq.br/buscatextual/busca.doLacerda, Fabiane Amaral da Cunhahttp://buscatextual.cnpq.br/buscatextual/busca.doVieira, Márcia Machadohttp://buscatextual.cnpq.br/buscatextual/busca.dohttp://buscatextual.cnpq.br/buscatextual/busca.doSantos, Bárbara Dias2023-04-12T13:53:55Z2023-04-122023-04-12T13:53:55Z2022-12-16https://repositorio.ufjf.br/jspui/handle/ufjf/15270O trabalho apresentado nesta dissertação se insere nos estudos desenvolvidos pela FrameNet Brasil (FN-Br). Por meio dos pressupostos teóricos da Semântica de Frames (FILLMORE, 1982) e da Gramática de Construções de Berkeley (KAY; FILLMORE, 1999), este trabalho tem como objetivos (i) fornecer o tratamento linguístico-computacional das construções anafóricas pronominais no português brasileiro; (ii) discutir a aplicação do modelo do Constructicon em métodos de extração de informação. Para atingir esses objetivos, o trabalho conta com uma metodologia dividida em: apresentação do corpus de análise, cadastramento de construções, análise de ocorrências, modelagem e experimento de reconhecimento de construções. Assim, este trabalho propõe uma representação linguística e computacional das construções anafóricas pronominais demonstrativas, possessivas, reflexivas, relativas, indefinidas, nominativas, oblíquas e de tratamento. Por meio da análise de dados em dois corpora General e Natural Language Generation, constatamos a diversidade dos padrões anafóricos pronominais em língua portuguesa. A partir disso, modelamos computacionalmente as construções por tipo de anáfora e definimos os elementos que compõem a estrutura: o antecedente e o pronome. Depois, limitamos morfossintática e semanticamente os elementos que constituem as estruturas por meio de constraints baseados em Universal Dependencies (UDs), ordem de constituintes e frames. Por fim, implementamos um sistema de reconhecimento de construções anafóricas pronominais e de seus antecedentes a partir das construções modeladas no Constructicon e quantificamos os dados obtidos. Os resultados apontam para o mapeamento correto dos elementos antecedentes pela aplicação do modelo em contextos que o antecedente localiza-se próximo ao pronome anafórico. Por outro lado, o modelo não obteve o resultado esperado em contextos que os antecedentes são sintagmas nominais complexos, entidades nomeadas, elipses ou estão localizados fora do limite da sentença. Tais limitações estão relacionadas a três fatores: às deficiências do modelo propriamente dito, à base de dados da FN-Br que não processa entidades nomeadas e, por fim, ao funcionamento do parser UD - que processa itens lexicais em uma sentença por vez. Os resultados reforçam a necessidade de ampliação da cobertura do Constructicon da FN-Br.The work presented in this thesis is included in the FrameNet Brasil studies (FN Br). Through the theoretical basis of Frame Semantics (FILLMORE, 1982) and Berkeley Construction Grammar (KAY & FILLMORE, 1999), it aims to (i) provide the computational and linguistic treatment required to model Brazilian Portuguese anaphorical constructions (ii) discuss the application of the Constructicon model to information extraction methods. To achieve these goals, this work proposes a linguistic-computational representation of the demonstrative, possessive, reflexive, relative, undetermined, nominative, oblique and treatment anaphorical constructions. By analyzing data in corpora, we noted some diversity related to pronominal anaphora patterns in Portuguese language. From that, we modeled the constructions according to the types of anaphora and we defined the elements which compose the structure: the antecedent and the pronoun. Furthermore, we specified all the elements which are part of the structure using linguistic descriptions – constraints based on Universal Dependencies (UDs), constituent order and frames. At last, we implemented a construction recognition system for pronominal anaphoras and their antecedents using the constructions we modeled in the constructicon tool. On the one hand, the results suggest a correct mapping of antecedents by applying the model, on the other hand they suggest some exceptions related to mapping some types of antecedents, such as complex noun phrases, named entities, ellipses or cases when they are located outside the sentence boundary. Those exceptions are related to three reasons: deficiencies related to the anaphora model itself, restrictions in the FrameNet database, which can’t process named entities, and, lastly, restrictions in the UD parser, which processes lexical items in one sentence each time. The results emphasize the need to extend the coverage of the FN-Br Constructicon.porUniversidade Federal de Juiz de Fora (UFJF)Programa de Pós-graduação em Letras: LinguísticaUFJFBrasilFaculdade de LetrasAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICAGramática de construçõesSemântica de framesProcessamento de língua naturalAnáforaExtração de informaçãoConstruction grammarFrame semanticsAnaphoraConstructiconInformation extractionModelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referênciainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALbarbaradiassantos.pdfbarbaradiassantos.pdfapplication/pdf1934381https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/1/barbaradiassantos.pdf366cec99ffd53ff861e67b9af4de1b55MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTbarbaradiassantos.pdf.txtbarbaradiassantos.pdf.txtExtracted texttext/plain174690https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/4/barbaradiassantos.pdf.txt5234c3b6da135008ede37be8b00fe14bMD54THUMBNAILbarbaradiassantos.pdf.jpgbarbaradiassantos.pdf.jpgGenerated Thumbnailimage/jpeg1219https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/5/barbaradiassantos.pdf.jpgd1064d113f2462965d6512f9403f8ae9MD55ufjf/152702023-04-13 03:12:17.369oai:hermes.cpd.ufjf.br:ufjf/15270Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2023-04-13T06:12:17Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false |
dc.title.pt_BR.fl_str_mv |
Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência |
title |
Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência |
spellingShingle |
Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência Santos, Bárbara Dias CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA Gramática de construções Semântica de frames Processamento de língua natural Anáfora Extração de informação Construction grammar Frame semantics Anaphora Constructicon Information extraction |
title_short |
Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência |
title_full |
Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência |
title_fullStr |
Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência |
title_full_unstemmed |
Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência |
title_sort |
Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência |
author |
Santos, Bárbara Dias |
author_facet |
Santos, Bárbara Dias |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Torrent, Tiago Timponi |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/busca.do |
dc.contributor.advisor-co1.fl_str_mv |
Matos, Ely Edison da Silva |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/busca.do |
dc.contributor.referee1.fl_str_mv |
Lacerda, Fabiane Amaral da Cunha |
dc.contributor.referee1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/busca.do |
dc.contributor.referee2.fl_str_mv |
Vieira, Márcia Machado |
dc.contributor.referee2Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/busca.do |
dc.contributor.authorLattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/busca.do |
dc.contributor.author.fl_str_mv |
Santos, Bárbara Dias |
contributor_str_mv |
Torrent, Tiago Timponi Matos, Ely Edison da Silva Lacerda, Fabiane Amaral da Cunha Vieira, Márcia Machado |
dc.subject.cnpq.fl_str_mv |
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA |
topic |
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA Gramática de construções Semântica de frames Processamento de língua natural Anáfora Extração de informação Construction grammar Frame semantics Anaphora Constructicon Information extraction |
dc.subject.por.fl_str_mv |
Gramática de construções Semântica de frames Processamento de língua natural Anáfora Extração de informação Construction grammar Frame semantics Anaphora Constructicon Information extraction |
description |
O trabalho apresentado nesta dissertação se insere nos estudos desenvolvidos pela FrameNet Brasil (FN-Br). Por meio dos pressupostos teóricos da Semântica de Frames (FILLMORE, 1982) e da Gramática de Construções de Berkeley (KAY; FILLMORE, 1999), este trabalho tem como objetivos (i) fornecer o tratamento linguístico-computacional das construções anafóricas pronominais no português brasileiro; (ii) discutir a aplicação do modelo do Constructicon em métodos de extração de informação. Para atingir esses objetivos, o trabalho conta com uma metodologia dividida em: apresentação do corpus de análise, cadastramento de construções, análise de ocorrências, modelagem e experimento de reconhecimento de construções. Assim, este trabalho propõe uma representação linguística e computacional das construções anafóricas pronominais demonstrativas, possessivas, reflexivas, relativas, indefinidas, nominativas, oblíquas e de tratamento. Por meio da análise de dados em dois corpora General e Natural Language Generation, constatamos a diversidade dos padrões anafóricos pronominais em língua portuguesa. A partir disso, modelamos computacionalmente as construções por tipo de anáfora e definimos os elementos que compõem a estrutura: o antecedente e o pronome. Depois, limitamos morfossintática e semanticamente os elementos que constituem as estruturas por meio de constraints baseados em Universal Dependencies (UDs), ordem de constituintes e frames. Por fim, implementamos um sistema de reconhecimento de construções anafóricas pronominais e de seus antecedentes a partir das construções modeladas no Constructicon e quantificamos os dados obtidos. Os resultados apontam para o mapeamento correto dos elementos antecedentes pela aplicação do modelo em contextos que o antecedente localiza-se próximo ao pronome anafórico. Por outro lado, o modelo não obteve o resultado esperado em contextos que os antecedentes são sintagmas nominais complexos, entidades nomeadas, elipses ou estão localizados fora do limite da sentença. Tais limitações estão relacionadas a três fatores: às deficiências do modelo propriamente dito, à base de dados da FN-Br que não processa entidades nomeadas e, por fim, ao funcionamento do parser UD - que processa itens lexicais em uma sentença por vez. Os resultados reforçam a necessidade de ampliação da cobertura do Constructicon da FN-Br. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-12-16 |
dc.date.accessioned.fl_str_mv |
2023-04-12T13:53:55Z |
dc.date.available.fl_str_mv |
2023-04-12 2023-04-12T13:53:55Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufjf.br/jspui/handle/ufjf/15270 |
url |
https://repositorio.ufjf.br/jspui/handle/ufjf/15270 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Letras: Linguística |
dc.publisher.initials.fl_str_mv |
UFJF |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Faculdade de Letras |
publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFJF instname:Universidade Federal de Juiz de Fora (UFJF) instacron:UFJF |
instname_str |
Universidade Federal de Juiz de Fora (UFJF) |
instacron_str |
UFJF |
institution |
UFJF |
reponame_str |
Repositório Institucional da UFJF |
collection |
Repositório Institucional da UFJF |
bitstream.url.fl_str_mv |
https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/1/barbaradiassantos.pdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/2/license_rdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/3/license.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/4/barbaradiassantos.pdf.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/15270/5/barbaradiassantos.pdf.jpg |
bitstream.checksum.fl_str_mv |
366cec99ffd53ff861e67b9af4de1b55 e39d27027a6cc9cb039ad269a5db8e34 8a4605be74aa9ea9d79846c1fba20a33 5234c3b6da135008ede37be8b00fe14b d1064d113f2462965d6512f9403f8ae9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF) |
repository.mail.fl_str_mv |
|
_version_ |
1801661338324303872 |