Mineração de textos para classificação de processos judiciais trabalhistas

Detalhes bibliográficos
Autor(a) principal: Rocha, Ana Carolina Pereira
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: https://repositorio.unb.br/handle/10482/37933
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
id UNB_4f1b71a8270239d45514a73f2f6ffd02
oai_identifier_str oai:repositorio2.unb.br:10482/37933
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Rocha, Ana Carolina PereiraValentini, Rômulo SoaresRamos, Guilherme Novaes2020-06-02T10:50:42Z2020-06-02T10:50:42Z2020-06-022019-12-04ROCHA, Ana Carolina Pereira. Mineração de textos para classificação de processos judiciais trabalhistas. 2019. xiv, 148 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2019.https://repositorio.unb.br/handle/10482/37933Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.Atualmente existe uma grande quantidade de processos que tramitam na justiça trabalhista brasileira, o que demanda um alto esforço dos servidores do judiciário e demais envolvidos para dar tratamento a todas as demandas. É possível que a aplicação de técnicas de mineração de textos possa contribuir com a identificação automática de informações relevantes dos processos. Assim, este trabalho aplicou algoritmos de classificação em um conjunto de 241 mil documentos do tipo Recursos Ordinários, extraídos de processos do PJe instalado na Justiça do Trabalho, com o objetivo de encontrar o assunto principal de processos do 2 o grau, considerando 35 assuntos possíveis. Foram comparados os algoritmos Multinomial Naïve Bayes, Multi-Layer Perceptron, Random Forest e SVM. Identificou-se baixo desempenho dos modelos para se encontrar o assunto principal, que negocialmente, pode ser uma escolha subjetiva na maior parte dos processos. Nesta abordagem, chegouse à uma micro precisão máxima de 46,03% com o Multi-Layer Perceptron. Ao fazer uma análise considerando o acerto dos modelos visando não apenas o assunto principal, mas avaliando se o modelo acertou qualquer um dos assuntos existentes no processo, chegouse a uma micro precisão de 75,21% com o Random Forest. Assim, mostrou-se que é possível extrair conhecimento dos documentos para identificação de assuntos, embora a identificação do assunto principal tenha apresentado baixo desempenho.The number of lawsuits being processed in the Brazilian Labor Court system is growing every year, demanding more and more resources. This cost may be reduced by applying text mining techniques to the automatic identification of relevant information within a process. This work applied classification algorithms to a specific set of documents extracted from the Superior Court’s system (PJe), aiming to find the main subject of a process within 35 possibilities. Multinomial Naïve Bayes, Multi-Layer Perceptron, Random Forest and SVM were compared at this task, and the best result for micro precision was 46,03%, achieved through Multi-Layer Perceptron. Extending the analysis to consider all the related subjects, instead of only the main one, Random Forest provided a micro precision of 75,21%, indicating that a machine learning approach is a feasible approach.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessMineração de textos para classificação de processos judiciais trabalhistasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisJustiça do trabalhoProcesso Judicial Eletrônico (PJe)Classificação da informaçãoMineração de textoAprendizagem de máquinaporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2019_AnaCarolinaPereiraRocha.pdf2019_AnaCarolinaPereiraRocha.pdfapplication/pdf26885654http://repositorio2.unb.br/jspui/bitstream/10482/37933/1/2019_AnaCarolinaPereiraRocha.pdfd9dd73a9530788e9bbf13ef5b6ba782aMD51open accessLICENSElicense.txtlicense.txttext/plain673http://repositorio2.unb.br/jspui/bitstream/10482/37933/2/license.txt04587889c0a9cc4613b199de6b76dc6cMD52open access10482/379332023-07-14 15:59:40.409open accessoai:repositorio2.unb.br:10482/37933QSBjb25jZXNzw6NvIGRhIGxpY2Vuw6dhIGRlc3RhIGNvbGXDp8OjbyByZWZlcmUtc2UgYW8gdGVybW8gZGUgYXV0b3JpemHDp8OjbyBpbXByZXNzbyBhc3NpbmFkbyANCnBlbG8gYXV0b3IgY29tIGFzIHNlZ3VpbnRlcyBjb25kacOnw7VlczoNCg0KTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhDQogZSBvIElCSUNUIGEgZGlzcG9uaWJpbGl6YXIgcG9yIG1laW8gZG9zIHNpdGVzIHd3dy5iY2UudW5iLmJyLCB3d3cuaWJpY3QuYnIsDQogaHR0cDovL2hlcmN1bGVzLnZ0bHMuY29tL2NnaS1iaW4vbmRsdGQvY2hhbWVsZW9uP2xuZz1wdCZza2luPW5kbHRkIHNlbSByZXNzYXJjaW1lbnRvIGRvcyANCmRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG7CuiA5NjEwLzk4LCBvIHRleHRvIGludGVncmFsIGRhIG9icmEgZGlzcG9uaWJpbGl6YWRhLCAgY29uZm9ybWUgcGVybWlzc8O1ZXMgYXNzaW5hbGFkYXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQsIGEgdMOtdHVsbyBkZSBkaXZ1bGdhw6fDo28gZGEgcHJvZHXDp8OjbyBjaWVudMOtZmljYSBicmFzaWxlaXJhLCBhIHBhcnRpciBkZXN0YSBkYXRhLg==Biblioteca Digital de Teses e DissertaçõesPUBhttps://repositorio.unb.br/oai/requestopendoar:2023-07-14T18:59:40Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Mineração de textos para classificação de processos judiciais trabalhistas
title Mineração de textos para classificação de processos judiciais trabalhistas
spellingShingle Mineração de textos para classificação de processos judiciais trabalhistas
Rocha, Ana Carolina Pereira
Justiça do trabalho
Processo Judicial Eletrônico (PJe)
Classificação da informação
Mineração de texto
Aprendizagem de máquina
title_short Mineração de textos para classificação de processos judiciais trabalhistas
title_full Mineração de textos para classificação de processos judiciais trabalhistas
title_fullStr Mineração de textos para classificação de processos judiciais trabalhistas
title_full_unstemmed Mineração de textos para classificação de processos judiciais trabalhistas
title_sort Mineração de textos para classificação de processos judiciais trabalhistas
author Rocha, Ana Carolina Pereira
author_facet Rocha, Ana Carolina Pereira
author_role author
dc.contributor.advisorco.none.fl_str_mv Valentini, Rômulo Soares
dc.contributor.author.fl_str_mv Rocha, Ana Carolina Pereira
dc.contributor.advisor1.fl_str_mv Ramos, Guilherme Novaes
contributor_str_mv Ramos, Guilherme Novaes
dc.subject.keyword.pt_BR.fl_str_mv Justiça do trabalho
Processo Judicial Eletrônico (PJe)
Classificação da informação
Mineração de texto
Aprendizagem de máquina
topic Justiça do trabalho
Processo Judicial Eletrônico (PJe)
Classificação da informação
Mineração de texto
Aprendizagem de máquina
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
publishDate 2019
dc.date.submitted.none.fl_str_mv 2019-12-04
dc.date.accessioned.fl_str_mv 2020-06-02T10:50:42Z
dc.date.available.fl_str_mv 2020-06-02T10:50:42Z
dc.date.issued.fl_str_mv 2020-06-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ROCHA, Ana Carolina Pereira. Mineração de textos para classificação de processos judiciais trabalhistas. 2019. xiv, 148 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.unb.br/handle/10482/37933
identifier_str_mv ROCHA, Ana Carolina Pereira. Mineração de textos para classificação de processos judiciais trabalhistas. 2019. xiv, 148 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2019.
url https://repositorio.unb.br/handle/10482/37933
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
bitstream.url.fl_str_mv http://repositorio2.unb.br/jspui/bitstream/10482/37933/1/2019_AnaCarolinaPereiraRocha.pdf
http://repositorio2.unb.br/jspui/bitstream/10482/37933/2/license.txt
bitstream.checksum.fl_str_mv d9dd73a9530788e9bbf13ef5b6ba782a
04587889c0a9cc4613b199de6b76dc6c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv
_version_ 1797405231901835264