Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN

Detalhes bibliográficos
Autor(a) principal: Brito, Bruna Alice Oliveira de
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/55431
Resumo: A jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos.
id UFRN_0c7d1132f4c7380395ee7b8b4d2aa7f7
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/55431
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Brito, Bruna Alice Oliveira dehttps://orcid.org/0009-0001-8116-495XMagalhães, Ismenia Blavatsky deBezerra, Leonardo César TeonacioGurgel, André MoraisMenezes Neto, Elias Jacob de2023-11-24T16:03:24Z2023-11-24T16:03:24Z2023-10-26BRITO, Bruna Alice Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/55431A jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos.The jurisdiction exercised by the Federal Court of Rio Grande do Norte (JFRN) is extensive and encompasses the analysis and resolution of a wide range of judicial cases of various natures, which may pertain to the environment, social security, tax law, among others [1]. In these cases, on one side, there are private individuals, and on the other side, there are the Union, public enterprises, federal autarchies and foundations, or professional oversight councils [1]. In this context, the integration of Artificial Intelligence (AI) is of significant interest in the field. One of the crucial tools in this scenario is Natural Language Processing (NLP), as numerous legal procedures involve the analysis and interpretation of textual documents. Named Entity Recognition (NER) is one area of NLP dedicated to recognizing and classifying entities mentioned in texts. NER gains special prominence in the legal field, where a multitude of legal documents, contracts, petitions, jurisprudence, and other textual genres require meticulous analysis. Given the foregoing, the main objective of this work is the application of NLP techniques in the processes of the Special Federal Courts of the JFRN, and the secondary objective is the construction of BI dashboards for visualizing the data applied in these techniques. This application analyzed the texts of initial petitions and judgments, and two distinct models were developed. The first model aims to discern whether a process is related to healthcare or not, using an XGBoost model. The second model is responsible for identifying and highlighting words and terms denoting some form of ailment, using a pre-trained BERT (Bidirectional Encoder Representations from Transformers) model, specifically BioBERTpt for disease recognition [3]. By implementing these models, the goal was to facilitate the identification of healthcare-related issues within the texts so that responsible officials could have an overview of the diseases found and optimize the allocation of resources.Universidade Federal do Rio Grande do NorteResidência em Tecnologia da InformaçãoUFRNBrasilInstituto Metrópole DigitalCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAONERPLNProcessos de saúdeUtilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRNinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccessORIGINALUtilizacaodePLNnaJFRN.pdfUtilizacaodePLNnaJFRN.pdfapplication/pdf1140203https://repositorio.ufrn.br/bitstream/123456789/55431/1/UtilizacaodePLNnaJFRN.pdf1b2c5e5660923d1ee7138d57cc56ed8eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/55431/2/license.txte9597aa2854d128fd968be5edc8a28d9MD52123456789/554312023-11-24 13:03:25.108oai:https://repositorio.ufrn.br:123456789/55431Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-11-24T16:03:25Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
title Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
spellingShingle Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
Brito, Bruna Alice Oliveira de
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
NER
PLN
Processos de saúde
title_short Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
title_full Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
title_fullStr Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
title_full_unstemmed Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
title_sort Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
author Brito, Bruna Alice Oliveira de
author_facet Brito, Bruna Alice Oliveira de
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv https://orcid.org/0009-0001-8116-495X
dc.contributor.referees1.none.fl_str_mv Bezerra, Leonardo César Teonacio
dc.contributor.referees2.none.fl_str_mv Gurgel, André Morais
dc.contributor.author.fl_str_mv Brito, Bruna Alice Oliveira de
dc.contributor.advisor-co1.fl_str_mv Magalhães, Ismenia Blavatsky de
dc.contributor.advisor1.fl_str_mv Menezes Neto, Elias Jacob de
contributor_str_mv Magalhães, Ismenia Blavatsky de
Menezes Neto, Elias Jacob de
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
NER
PLN
Processos de saúde
dc.subject.por.fl_str_mv NER
PLN
Processos de saúde
description A jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-11-24T16:03:24Z
dc.date.available.fl_str_mv 2023-11-24T16:03:24Z
dc.date.issued.fl_str_mv 2023-10-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BRITO, Bruna Alice Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/55431
identifier_str_mv BRITO, Bruna Alice Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023.
url https://repositorio.ufrn.br/handle/123456789/55431
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv Residência em Tecnologia da Informação
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto Metrópole Digital
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/55431/1/UtilizacaodePLNnaJFRN.pdf
https://repositorio.ufrn.br/bitstream/123456789/55431/2/license.txt
bitstream.checksum.fl_str_mv 1b2c5e5660923d1ee7138d57cc56ed8e
e9597aa2854d128fd968be5edc8a28d9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814833070998552576