Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro

Detalhes bibliográficos
Autor(a) principal: Heck, Amabyle Rabeche
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/233250
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.
id UFSC_3c09e92b5c15816901c297afe383621c
oai_identifier_str oai:repositorio.ufsc.br:123456789/233250
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Universidade Federal de Santa CatarinaHeck, Amabyle RabecheAntonelo, Eric Aislan2022-03-28T18:34:14Z2022-03-28T18:34:14Z2022-03-21https://repositorio.ufsc.br/handle/123456789/233250TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.O Reconhecimento de Entidades Nomeadas (REN) (ou Named Entity Recognition (NER)) é uma técnica de Processamento de Linguagem Natural (PLN) que consiste em encontrar e identificar nomes de entidades pré-definidas (como pessoas, organizações, locais, etc.) em dados textuais. Essa tarefa é uma forma de extração de informação de documentos, o que facilita a análise e a manipulação deles. Este projeto tem como objetivo obter um modelo de Inteligência Artificial (IA) que realize a tarefa de NER especificamente em textos legais escritos no idioma Português Brasileiro, reconhecendo as entidades Pessoa, Tempo, Local, Organização, Legislação e Jurisprudência. As arquiteturas de redes neurais utilizadas foram Bidirectional Long Short-Term Memory (BiLSTM) e Bidirectional Encoder Representation from Transformers (BERT) (pré-treinada em língua portuguesa brasileira), com e sem camadas Conditional Random Field (CRF). O dataset de textos jurídicos usado para realizar os treinamentos foi o LeNER-Br. As métricas para avaliar os desempenhos foram precisão, recall e F1-score, e o modelo treinado com melhor performance, uma rede BERT-CRF, obteve valores de métricas de, respectivamente, 90,16%, 91,86% e 91,00%, superando o modelo baseline.Named Entity Recognition is a Natural Language Processing technique that consists in finding and identifying names of pre-defined entities (such as people, organizations, locations, etc.) in textual data. This task is a type of information extraction from documents that facilitate their analysis and manipulation. This project’s objective is to obtain a Artificial Intelligence model that perform the NER task specifically in legal texts written in Brazilian Portuguese, recognizing the entities Person, Time, Location, Organization, Legislation (Laws) and Legal Cases. The neural networks architectures chosen were Bidirectional Long Short-Term Memory (BiLSTM) and Bidirectional Encoder Representation from Transformers (BERT) (pre-trained in Brazilian Portuguese), both with and without Conditional Random Fields layers. The legal texts dataset used for training was LeNER-Br. Metrics used to evaluate the performances were precision, recall and F1-score, and the trained model with the best results (a BERT-CRF neural network) achieved the following values of metrics, respectively, 90,16%, 91,86% and 91,00%, surpassing the baseline model.71Florianópolis, SC.Processamento de Linguagem NaturalReconhecimento de Entidades NomeadasRedes neuraisProcessamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiroinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCLICENSElicense.txtlicense.txttext/plain; charset=utf-81383https://repositorio.ufsc.br/bitstream/123456789/233250/4/license.txt11ee89cd31d893362820eab7c4d46734MD54ORIGINALMonografia_PFC-Final-A.pdfMonografia_PFC-Final-A.pdfapplication/pdf1609550https://repositorio.ufsc.br/bitstream/123456789/233250/3/Monografia_PFC-Final-A.pdf02dbb87cd46fb63f8120c571b5e56281MD53123456789/2332502022-03-28 15:34:14.942oai:repositorio.ufsc.br:123456789/233250Vm9jw6ogdGVtIGEgbGliZXJkYWRlIGRlOiBDb21wYXJ0aWxoYXIg4oCUIGNvcGlhciwgZGlzdHJpYnVpciBlIHRyYW5zbWl0aXIgYSBvYnJhLiBSZW1peGFyIOKAlCBjcmlhciBvYnJhcyBkZXJpdmFkYXMuClNvYiBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6IEF0cmlidWnDp8OjbyDigJQgVm9jw6ogZGV2ZSBjcmVkaXRhciBhIG9icmEgZGEgZm9ybWEgZXNwZWNpZmljYWRhIHBlbG8gYXV0b3Igb3UgbGljZW5jaWFudGUgKG1hcyBuw6NvIGRlIG1hbmVpcmEgcXVlIHN1Z2lyYSBxdWUgZXN0ZXMgY29uY2VkZW0gcXVhbHF1ZXIgYXZhbCBhIHZvY8OqIG91IGFvIHNldSB1c28gZGEgb2JyYSkuIFVzbyBuw6NvLWNvbWVyY2lhbCDigJQgVm9jw6ogbsOjbyBwb2RlIHVzYXIgZXN0YSBvYnJhIHBhcmEgZmlucyBjb21lcmNpYWlzLgpGaWNhbmRvIGNsYXJvIHF1ZTogUmVuw7puY2lhIOKAlCBRdWFscXVlciBkYXMgY29uZGnDp8O1ZXMgYWNpbWEgcG9kZSBzZXIgcmVudW5jaWFkYSBzZSB2b2PDqiBvYnRpdmVyIHBlcm1pc3PDo28gZG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMuIERvbcOtbmlvIFDDumJsaWNvIOKAlCBPbmRlIGEgb2JyYSBvdSBxdWFscXVlciBkZSBzZXVzIGVsZW1lbnRvcyBlc3RpdmVyIGVtIGRvbcOtbmlvIHDDumJsaWNvIHNvYiBvIGRpcmVpdG8gYXBsaWPDoXZlbCwgZXN0YSBjb25kacOnw6NvIG7Do28gw6ksIGRlIG1hbmVpcmEgYWxndW1hLCBhZmV0YWRhIHBlbGEgbGljZW7Dp2EuIE91dHJvcyBEaXJlaXRvcyDigJQgT3Mgc2VndWludGVzIGRpcmVpdG9zIG7Do28gc8OjbywgZGUgbWFuZWlyYSBhbGd1bWEsIGFmZXRhZG9zIHBlbGEgbGljZW7Dp2E6IExpbWl0YcOnw7VlcyBlIGV4Y2XDp8O1ZXMgYW9zIGRpcmVpdG9zIGF1dG9yYWlzIG91IHF1YWlzcXVlciB1c29zIGxpdnJlcyBhcGxpY8OhdmVpczsgT3MgZGlyZWl0b3MgbW9yYWlzIGRvIGF1dG9yOyBEaXJlaXRvcyBxdWUgb3V0cmFzIHBlc3NvYXMgcG9kZW0gdGVyIHNvYnJlIGEgb2JyYSBvdSBzb2JyZSBhIHV0aWxpemHDp8OjbyBkYSBvYnJhLCB0YWlzIGNvbW8gZGlyZWl0b3MgZGUgaW1hZ2VtIG91IHByaXZhY2lkYWRlLiBBdmlzbyDigJQgUGFyYSBxdWFscXVlciByZXV0aWxpemHDp8OjbyBvdSBkaXN0cmlidWnDp8Ojbywgdm9jw6ogZGV2ZSBkZWl4YXIgY2xhcm8gYSB0ZXJjZWlyb3Mgb3MgdGVybW9zIGRhIGxpY2Vuw6dhIGEgcXVlIHNlIGVuY29udHJhIHN1Ym1ldGlkYSBlc3RhIG9icmEuIEEgbWVsaG9yIG1hbmVpcmEgZGUgZmF6ZXIgaXNzbyDDqSBjb20gdW0gbGluayBwYXJhIGVzdGEgcMOhZ2luYS4KTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyAtIGh0dHA6Ly9jcmVhdGl2ZWNvbW1vbnMub3JnL2xpY2Vuc2VzL2J5LW5jLzMuMC9ici8KRepositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732022-03-28T18:34:14Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.pt_BR.fl_str_mv Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro
title Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro
spellingShingle Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro
Heck, Amabyle Rabeche
Processamento de Linguagem Natural
Reconhecimento de Entidades Nomeadas
Redes neurais
title_short Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro
title_full Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro
title_fullStr Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro
title_full_unstemmed Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro
title_sort Processamento de linguagem natural aplicado a reconhecimento de entidades nomeadas em textos legais em português brasileiro
author Heck, Amabyle Rabeche
author_facet Heck, Amabyle Rabeche
author_role author
dc.contributor.pt_BR.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Heck, Amabyle Rabeche
dc.contributor.advisor1.fl_str_mv Antonelo, Eric Aislan
contributor_str_mv Antonelo, Eric Aislan
dc.subject.por.fl_str_mv Processamento de Linguagem Natural
Reconhecimento de Entidades Nomeadas
Redes neurais
topic Processamento de Linguagem Natural
Reconhecimento de Entidades Nomeadas
Redes neurais
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-03-28T18:34:14Z
dc.date.available.fl_str_mv 2022-03-28T18:34:14Z
dc.date.issued.fl_str_mv 2022-03-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/233250
url https://repositorio.ufsc.br/handle/123456789/233250
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 71
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/233250/4/license.txt
https://repositorio.ufsc.br/bitstream/123456789/233250/3/Monografia_PFC-Final-A.pdf
bitstream.checksum.fl_str_mv 11ee89cd31d893362820eab7c4d46734
02dbb87cd46fb63f8120c571b5e56281
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1766805254757679104