Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | https://locus.ufv.br//handle/123456789/29661 |
Resumo: | A anotação semântica permite que pessoas e dispositivos computacionais entendam mais facilmente o significado de uma sentença expressa em linguagem natural. Classificar textos de acordo com seu conteúdo é frequentemente uma das primeiras etapas realizadas por aplicativos voltados para o processamento de linguagem natural. E, apesar de ser um princípio básico, este passo é feito, geralmente, de forma manual, o que faz com que o processo seja lento, custoso e limitado. Para que a anotação seja realizada automaticamente, os métodos devem ser bem definidos por meio de um conjunto de características ou features, elaborado por especialistas, a fim de que o sistema possa atribuir probabilidades e fazer inferências. Nesta dissertação é apresentado um modelo de rede recorrente profunda que anota semanticamente textos escritos em inglês, e manipula como rótulo categorias de uma ontologia de nível topo. Os testes mostraram que é possível obter melhores resultados do que os encontrados em modelos que precisam do fornecimento prévio de features. Palavras-chave: PLN. Anotação Semântica. Rede Neural Recorrente. LSTM. Ontologia. |
id |
UFV_107b76d132e0ab22ca91aff4ca698448 |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/29661 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Moreira, AlexandraSilva, Roberta Caroline Rodrigueshttp://lattes.cnpq.br/7236985482391957Oliveira, Alcione de Paiva2022-08-15T18:31:43Z2022-08-15T18:31:43Z2019-11-28SILVA, Roberta Caroline Rodrigues. Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa. 2019. 66 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2019.https://locus.ufv.br//handle/123456789/29661A anotação semântica permite que pessoas e dispositivos computacionais entendam mais facilmente o significado de uma sentença expressa em linguagem natural. Classificar textos de acordo com seu conteúdo é frequentemente uma das primeiras etapas realizadas por aplicativos voltados para o processamento de linguagem natural. E, apesar de ser um princípio básico, este passo é feito, geralmente, de forma manual, o que faz com que o processo seja lento, custoso e limitado. Para que a anotação seja realizada automaticamente, os métodos devem ser bem definidos por meio de um conjunto de características ou features, elaborado por especialistas, a fim de que o sistema possa atribuir probabilidades e fazer inferências. Nesta dissertação é apresentado um modelo de rede recorrente profunda que anota semanticamente textos escritos em inglês, e manipula como rótulo categorias de uma ontologia de nível topo. Os testes mostraram que é possível obter melhores resultados do que os encontrados em modelos que precisam do fornecimento prévio de features. Palavras-chave: PLN. Anotação Semântica. Rede Neural Recorrente. LSTM. Ontologia.Semantic labeling of texts allows people and computing devices to more easily understand the meaning of a natural language sentence as a whole. Semantic annotation is often one of the first steps carried out by applications focused on natural language processing. However, this step is often done manually, which is very expensive and time-consuming. When automatic methods are employed, they require that a set of features, elaborated by specialists, be provided so that the system can assign probabilities in order to make inferences. In this thesis we present a model of the deep recurrent network that semantically annotates texts in English using as labels the top categories of an ontology. The tests showed that it is possible to obtain better results than the models that need the features to be made explicit. Keywords: NLP. Semantic Annotation. Recurrent Network. LSTM. Ontology.porUniversidade Federal de ViçosaCiência da ComputaçãoProcessamento de linguagem natural (Computação)Língua inglesa - SemânticaRedes neurais (Computação)Memória de longo prazoOntologiaCiência da ComputaçãoAnotação semântica automática por meio de redes neurais profundas para corpora na língua inglesaSemantic labeling of english texts with ontological categories employing recurrent networksinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2019-11-28Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf14488764https://locus.ufv.br//bitstream/123456789/29661/1/texto%20completo.pdf91c0b49fa86886785bf89fd4ba181cb4MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/29661/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/296612022-08-15 15:33:04.153oai:locus.ufv.br:123456789/29661Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452022-08-15T18:33:04LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.pt-BR.fl_str_mv |
Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa |
dc.title.en.fl_str_mv |
Semantic labeling of english texts with ontological categories employing recurrent networks |
title |
Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa |
spellingShingle |
Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa Silva, Roberta Caroline Rodrigues Processamento de linguagem natural (Computação) Língua inglesa - Semântica Redes neurais (Computação) Memória de longo prazo Ontologia Ciência da Computação |
title_short |
Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa |
title_full |
Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa |
title_fullStr |
Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa |
title_full_unstemmed |
Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa |
title_sort |
Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa |
author |
Silva, Roberta Caroline Rodrigues |
author_facet |
Silva, Roberta Caroline Rodrigues |
author_role |
author |
dc.contributor.authorLattes.pt-BR.fl_str_mv |
http://lattes.cnpq.br/7236985482391957 |
dc.contributor.none.fl_str_mv |
Moreira, Alexandra |
dc.contributor.author.fl_str_mv |
Silva, Roberta Caroline Rodrigues |
dc.contributor.advisor1.fl_str_mv |
Oliveira, Alcione de Paiva |
contributor_str_mv |
Oliveira, Alcione de Paiva |
dc.subject.pt-BR.fl_str_mv |
Processamento de linguagem natural (Computação) Língua inglesa - Semântica Redes neurais (Computação) Memória de longo prazo Ontologia |
topic |
Processamento de linguagem natural (Computação) Língua inglesa - Semântica Redes neurais (Computação) Memória de longo prazo Ontologia Ciência da Computação |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
description |
A anotação semântica permite que pessoas e dispositivos computacionais entendam mais facilmente o significado de uma sentença expressa em linguagem natural. Classificar textos de acordo com seu conteúdo é frequentemente uma das primeiras etapas realizadas por aplicativos voltados para o processamento de linguagem natural. E, apesar de ser um princípio básico, este passo é feito, geralmente, de forma manual, o que faz com que o processo seja lento, custoso e limitado. Para que a anotação seja realizada automaticamente, os métodos devem ser bem definidos por meio de um conjunto de características ou features, elaborado por especialistas, a fim de que o sistema possa atribuir probabilidades e fazer inferências. Nesta dissertação é apresentado um modelo de rede recorrente profunda que anota semanticamente textos escritos em inglês, e manipula como rótulo categorias de uma ontologia de nível topo. Os testes mostraram que é possível obter melhores resultados do que os encontrados em modelos que precisam do fornecimento prévio de features. Palavras-chave: PLN. Anotação Semântica. Rede Neural Recorrente. LSTM. Ontologia. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-11-28 |
dc.date.accessioned.fl_str_mv |
2022-08-15T18:31:43Z |
dc.date.available.fl_str_mv |
2022-08-15T18:31:43Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Roberta Caroline Rodrigues. Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa. 2019. 66 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2019. |
dc.identifier.uri.fl_str_mv |
https://locus.ufv.br//handle/123456789/29661 |
identifier_str_mv |
SILVA, Roberta Caroline Rodrigues. Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa. 2019. 66 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2019. |
url |
https://locus.ufv.br//handle/123456789/29661 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/29661/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/29661/2/license.txt |
bitstream.checksum.fl_str_mv |
91c0b49fa86886785bf89fd4ba181cb4 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801213103333965824 |