Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech

Detalhes bibliográficos
Autor(a) principal: Flesch, Jean Ampos
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/255630
Resumo: A área de LegalTech é referida como a relação entre áreas da Ciência da Computação que operam em linguagem natural e áreas jurídicas. A proximidade entre as áreas da Linguagem e Direito possibilita que a LegalTech seja aplicada em diversas tarefas como geração de texto legal, predição de sentenças, recuperação de texto legal. Porém, apesar da flexibilidade em aplicações, muitas soluções apresentam lacunas em sua metodologia de implementação e/ou disponibilização das bases de dados extraídas e pré-processadas. Neste trabalho, é proposta uma Abordagem Agnóstica com o objetivo de providenciar recomendações para o desenvolvimento de soluções na área de LegalTech de forma coesa, estruturada, extensível, e robusta. Inicialmente, foi realizada a revisão sistemática da literatura para identificar e apresentar um panorama sobre diferentes soluções propostas na geração de texto legal. A partir da revisão sistemática, uma taxonomia para classificar os estudos em cinco categorias de acordo com o escopo principal de cada trabalho foi proposta a fim de embasar a Abordagem Agnóstica, que é composta por 4 etapas responsáveis pela coleta, processamento, modelagem e exibição de resultados a partir da utilização de técnicas de Inteligência Artificial e Processamento de Linguagem Natural em documentos legais. A abordagem é testada em três tarefas diferentes. A primeira tarefa testa a capacidade de construção de uma base de dados com documentos legais a partir da extração de informações dos acórdãos em páginas Web do Supremo Tribunal Brasileiro. Além da organização e disponibilização da base de dados, uma análise com visualização de informações sobre os dados é apresentada. A segunda tarefa realiza a classificação de palavras em documentos legais para geração de texto anotado, resultando no primeiro passo para a construção de uma solução capaz de facilitar a leitura de texto legal para pessoas leigas na área jurídica. Por fim, a terceira tarefa utiliza a base de dados construída para experimentos em classificação de documentos legais utilizando algoritmos de aprendizado de máquina supervisionado em modelos classificadores. Na realização dos experimentos, o uso dos modelos apresentou resultados promissores para predição das classes dos acórdãos. Em especial, o uso do classificador SVM resultou em um F1-score médio de 0,96.
id URGS_9d09074cfcf636bd3e0129216ce35404
oai_identifier_str oai:www.lume.ufrgs.br:10183/255630
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Flesch, Jean AmposGalante, Renata de Matos2023-03-11T03:30:31Z2022http://hdl.handle.net/10183/255630001163948A área de LegalTech é referida como a relação entre áreas da Ciência da Computação que operam em linguagem natural e áreas jurídicas. A proximidade entre as áreas da Linguagem e Direito possibilita que a LegalTech seja aplicada em diversas tarefas como geração de texto legal, predição de sentenças, recuperação de texto legal. Porém, apesar da flexibilidade em aplicações, muitas soluções apresentam lacunas em sua metodologia de implementação e/ou disponibilização das bases de dados extraídas e pré-processadas. Neste trabalho, é proposta uma Abordagem Agnóstica com o objetivo de providenciar recomendações para o desenvolvimento de soluções na área de LegalTech de forma coesa, estruturada, extensível, e robusta. Inicialmente, foi realizada a revisão sistemática da literatura para identificar e apresentar um panorama sobre diferentes soluções propostas na geração de texto legal. A partir da revisão sistemática, uma taxonomia para classificar os estudos em cinco categorias de acordo com o escopo principal de cada trabalho foi proposta a fim de embasar a Abordagem Agnóstica, que é composta por 4 etapas responsáveis pela coleta, processamento, modelagem e exibição de resultados a partir da utilização de técnicas de Inteligência Artificial e Processamento de Linguagem Natural em documentos legais. A abordagem é testada em três tarefas diferentes. A primeira tarefa testa a capacidade de construção de uma base de dados com documentos legais a partir da extração de informações dos acórdãos em páginas Web do Supremo Tribunal Brasileiro. Além da organização e disponibilização da base de dados, uma análise com visualização de informações sobre os dados é apresentada. A segunda tarefa realiza a classificação de palavras em documentos legais para geração de texto anotado, resultando no primeiro passo para a construção de uma solução capaz de facilitar a leitura de texto legal para pessoas leigas na área jurídica. Por fim, a terceira tarefa utiliza a base de dados construída para experimentos em classificação de documentos legais utilizando algoritmos de aprendizado de máquina supervisionado em modelos classificadores. Na realização dos experimentos, o uso dos modelos apresentou resultados promissores para predição das classes dos acórdãos. Em especial, o uso do classificador SVM resultou em um F1-score médio de 0,96.The area of LegalTech is referred as the relationship between fields of Computer Science that operate in natural language and fields of law. The proximity between the fields of Language and Law allows LegalTech to be applied in various tasks such as legal text generation, sentence prediction, legal text recovery. However, despite the flexibility in the range of applications, many solutions have gaps in their implementation methodology and/or availability of extracted and preprocessed databases. In this work, an Agnostic Approach is proposed with the objective of providing guidelines for the development of solutions in the area of LegalTech in a cohesive, structured, extensible, and robust way. Initially, a systematic literature review is performed to identify and present an overview of different solutions proposed in the generation of legal text. From the systematic review, a taxonomy to classify the studies into five categories according to the main scope of each work is proposed in order to support the Agnostic Approach, which is composed of 4 steps responsible for collecting, processing, modeling and displaying results from the use of Artificial Intelligence and Natural Language Processing techniques in legal documents. The approach is tested on three different tasks. The first task tests the ability to build a database with legal documents by extracting information from judgments on Web pages of the Brazilian Supreme Court. In addition to the organization and availability of the database, an analysis with visualization of information about the data is presented. The second task performs the classification of words in legal documents to generate annotated text, resulting in the first step towards the construction of a solution capable of facilitat ing the reading of legal texts for non practitioner people in the legal area. Finally, the third task uses the database built for experiments in legal document classification using supervised machine learning algorithms in classifier models. During the execution of the experiments, the use of models showed promising results for predicting the classes of judgments. In particular, the use of the SVM classifier resulted in an average F1-score of 0.96.application/pdfengInteligência artificialAprendizado de máquinaClassificação de documentosLinguagem naturalLegalTechLegal text generationUma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTechAn agnostic approach to legal text generation and application to legalTech tasks info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001163948.pdf.txt001163948.pdf.txtExtracted Texttext/plain236463http://www.lume.ufrgs.br/bitstream/10183/255630/2/001163948.pdf.txt07d5538183caef2d279b0fafb03576e5MD52ORIGINAL001163948.pdfTexto completoapplication/pdf1477032http://www.lume.ufrgs.br/bitstream/10183/255630/1/001163948.pdf33abaed371235e7bd05251b744ad5704MD5110183/2556302023-03-12 03:24:07.508188oai:www.lume.ufrgs.br:10183/255630Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-03-12T06:24:07Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
dc.title.alternative.pt.fl_str_mv An agnostic approach to legal text generation and application to legalTech tasks
title Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
spellingShingle Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
Flesch, Jean Ampos
Inteligência artificial
Aprendizado de máquina
Classificação de documentos
Linguagem natural
LegalTech
Legal text generation
title_short Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
title_full Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
title_fullStr Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
title_full_unstemmed Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
title_sort Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
author Flesch, Jean Ampos
author_facet Flesch, Jean Ampos
author_role author
dc.contributor.author.fl_str_mv Flesch, Jean Ampos
dc.contributor.advisor1.fl_str_mv Galante, Renata de Matos
contributor_str_mv Galante, Renata de Matos
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizado de máquina
Classificação de documentos
Linguagem natural
topic Inteligência artificial
Aprendizado de máquina
Classificação de documentos
Linguagem natural
LegalTech
Legal text generation
dc.subject.eng.fl_str_mv LegalTech
Legal text generation
description A área de LegalTech é referida como a relação entre áreas da Ciência da Computação que operam em linguagem natural e áreas jurídicas. A proximidade entre as áreas da Linguagem e Direito possibilita que a LegalTech seja aplicada em diversas tarefas como geração de texto legal, predição de sentenças, recuperação de texto legal. Porém, apesar da flexibilidade em aplicações, muitas soluções apresentam lacunas em sua metodologia de implementação e/ou disponibilização das bases de dados extraídas e pré-processadas. Neste trabalho, é proposta uma Abordagem Agnóstica com o objetivo de providenciar recomendações para o desenvolvimento de soluções na área de LegalTech de forma coesa, estruturada, extensível, e robusta. Inicialmente, foi realizada a revisão sistemática da literatura para identificar e apresentar um panorama sobre diferentes soluções propostas na geração de texto legal. A partir da revisão sistemática, uma taxonomia para classificar os estudos em cinco categorias de acordo com o escopo principal de cada trabalho foi proposta a fim de embasar a Abordagem Agnóstica, que é composta por 4 etapas responsáveis pela coleta, processamento, modelagem e exibição de resultados a partir da utilização de técnicas de Inteligência Artificial e Processamento de Linguagem Natural em documentos legais. A abordagem é testada em três tarefas diferentes. A primeira tarefa testa a capacidade de construção de uma base de dados com documentos legais a partir da extração de informações dos acórdãos em páginas Web do Supremo Tribunal Brasileiro. Além da organização e disponibilização da base de dados, uma análise com visualização de informações sobre os dados é apresentada. A segunda tarefa realiza a classificação de palavras em documentos legais para geração de texto anotado, resultando no primeiro passo para a construção de uma solução capaz de facilitar a leitura de texto legal para pessoas leigas na área jurídica. Por fim, a terceira tarefa utiliza a base de dados construída para experimentos em classificação de documentos legais utilizando algoritmos de aprendizado de máquina supervisionado em modelos classificadores. Na realização dos experimentos, o uso dos modelos apresentou resultados promissores para predição das classes dos acórdãos. Em especial, o uso do classificador SVM resultou em um F1-score médio de 0,96.
publishDate 2022
dc.date.issued.fl_str_mv 2022
dc.date.accessioned.fl_str_mv 2023-03-11T03:30:31Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/255630
dc.identifier.nrb.pt_BR.fl_str_mv 001163948
url http://hdl.handle.net/10183/255630
identifier_str_mv 001163948
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/255630/2/001163948.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/255630/1/001163948.pdf
bitstream.checksum.fl_str_mv 07d5538183caef2d279b0fafb03576e5
33abaed371235e7bd05251b744ad5704
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085611441225728