Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/55431 |
Resumo: | A jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos. |
id |
UFRN_0c7d1132f4c7380395ee7b8b4d2aa7f7 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/55431 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Brito, Bruna Alice Oliveira dehttps://orcid.org/0009-0001-8116-495XMagalhães, Ismenia Blavatsky deBezerra, Leonardo César TeonacioGurgel, André MoraisMenezes Neto, Elias Jacob de2023-11-24T16:03:24Z2023-11-24T16:03:24Z2023-10-26BRITO, Bruna Alice Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/55431A jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos.The jurisdiction exercised by the Federal Court of Rio Grande do Norte (JFRN) is extensive and encompasses the analysis and resolution of a wide range of judicial cases of various natures, which may pertain to the environment, social security, tax law, among others [1]. In these cases, on one side, there are private individuals, and on the other side, there are the Union, public enterprises, federal autarchies and foundations, or professional oversight councils [1]. In this context, the integration of Artificial Intelligence (AI) is of significant interest in the field. One of the crucial tools in this scenario is Natural Language Processing (NLP), as numerous legal procedures involve the analysis and interpretation of textual documents. Named Entity Recognition (NER) is one area of NLP dedicated to recognizing and classifying entities mentioned in texts. NER gains special prominence in the legal field, where a multitude of legal documents, contracts, petitions, jurisprudence, and other textual genres require meticulous analysis. Given the foregoing, the main objective of this work is the application of NLP techniques in the processes of the Special Federal Courts of the JFRN, and the secondary objective is the construction of BI dashboards for visualizing the data applied in these techniques. This application analyzed the texts of initial petitions and judgments, and two distinct models were developed. The first model aims to discern whether a process is related to healthcare or not, using an XGBoost model. The second model is responsible for identifying and highlighting words and terms denoting some form of ailment, using a pre-trained BERT (Bidirectional Encoder Representations from Transformers) model, specifically BioBERTpt for disease recognition [3]. By implementing these models, the goal was to facilitate the identification of healthcare-related issues within the texts so that responsible officials could have an overview of the diseases found and optimize the allocation of resources.Universidade Federal do Rio Grande do NorteResidência em Tecnologia da InformaçãoUFRNBrasilInstituto Metrópole DigitalCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAONERPLNProcessos de saúdeUtilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRNinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccessORIGINALUtilizacaodePLNnaJFRN.pdfUtilizacaodePLNnaJFRN.pdfapplication/pdf1140203https://repositorio.ufrn.br/bitstream/123456789/55431/1/UtilizacaodePLNnaJFRN.pdf1b2c5e5660923d1ee7138d57cc56ed8eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/55431/2/license.txte9597aa2854d128fd968be5edc8a28d9MD52123456789/554312023-11-24 13:03:25.108oai:https://repositorio.ufrn.br:123456789/55431Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-11-24T16:03:25Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN |
title |
Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN |
spellingShingle |
Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN Brito, Bruna Alice Oliveira de CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO NER PLN Processos de saúde |
title_short |
Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN |
title_full |
Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN |
title_fullStr |
Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN |
title_full_unstemmed |
Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN |
title_sort |
Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN |
author |
Brito, Bruna Alice Oliveira de |
author_facet |
Brito, Bruna Alice Oliveira de |
author_role |
author |
dc.contributor.authorID.pt_BR.fl_str_mv |
https://orcid.org/0009-0001-8116-495X |
dc.contributor.referees1.none.fl_str_mv |
Bezerra, Leonardo César Teonacio |
dc.contributor.referees2.none.fl_str_mv |
Gurgel, André Morais |
dc.contributor.author.fl_str_mv |
Brito, Bruna Alice Oliveira de |
dc.contributor.advisor-co1.fl_str_mv |
Magalhães, Ismenia Blavatsky de |
dc.contributor.advisor1.fl_str_mv |
Menezes Neto, Elias Jacob de |
contributor_str_mv |
Magalhães, Ismenia Blavatsky de Menezes Neto, Elias Jacob de |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO NER PLN Processos de saúde |
dc.subject.por.fl_str_mv |
NER PLN Processos de saúde |
description |
A jurisdição exercida pela Justiça Federal no Rio Grande do Norte (JFRN) é ampla e abarca a análise e resolução de uma variada gama de casos judiciais de diversas naturezas, os processos podem ser referentes ao meio ambiente, previdência social, direito tributário, entre outros. [1]. Nesses processos aparecem, de um lado, os particulares e de outro a União, as empresas públicas, autarquias e fundações públicas federais ou os conselhos de fiscalização profissional [1]. Nesse contexto, a integração da Inteligência Artificial (IA) desperta significativo interesse da área, uma das ferramentas cruciais nesse panorama é o Processamento de Linguagem Natural (PLN), pois inúmeros procedimentos legais envolvem a análise e interpretação de documentos textuais. O Reconhecimento de Entidades Nomeadas (do inglês NER - Named Entity Recognition) é uma das áreas do PLN, que é destinada a reconhecer e classificar entidades mencionadas em textos. O NER ganha especial destaque no campo jurídico, onde uma profusão de documentos legais, contratos, petições, jurisprudências e outros gêneros textuais demandam análises minuciosas. Diante do exposto, o objetivo principal deste trabalho é a aplicação de técnicas de PLN em processos dos Juizados Especiais Federais da JFRN, e o objetivo secundário é a construção de painéis de BI para visualização dos dados aplicados nessas técnicas. Essa aplicação analisou os textos das petições iniciais e das sentenças, dois modelos distintos foram desenvolvidos. O primeiro modelo desempenha a função de discernir se um processo é da área da saúde ou não, foi utilizado um modelo XGBoost. O segundo modelo é responsável por identificar e destacar palavras e termos que denotam algum tipo de enfermidade, foi utilizado um modelo pré-treinado de BERT(Bidirectional Encoder Representations from Transformers), o BioBERTpt para reconhecimento de doenças [3]. Ao implementar esses modelos, visou-se promover a identificação de questões relacionadas à saúde existentes nos textos para que os servidores responsáveis tenham um panorama geral das doenças encontradas e possam otimizar a alocação de recursos. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-11-24T16:03:24Z |
dc.date.available.fl_str_mv |
2023-11-24T16:03:24Z |
dc.date.issued.fl_str_mv |
2023-10-26 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
BRITO, Bruna Alice Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/55431 |
identifier_str_mv |
BRITO, Bruna Alice Utilização de técnicas de processamento de linguagem natural para identificação automática de doenças em processos da JFRN. 2023. 59 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
url |
https://repositorio.ufrn.br/handle/123456789/55431 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
Residência em Tecnologia da Informação |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto Metrópole Digital |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/55431/1/UtilizacaodePLNnaJFRN.pdf https://repositorio.ufrn.br/bitstream/123456789/55431/2/license.txt |
bitstream.checksum.fl_str_mv |
1b2c5e5660923d1ee7138d57cc56ed8e e9597aa2854d128fd968be5edc8a28d9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814833070998552576 |