Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech

Flesch, Jean Ampos

Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech

Detalhes bibliográficos
Autor(a) principal:	Flesch, Jean Ampos
Data de Publicação:	2022
Tipo de documento:	Dissertação
Idioma:	eng
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo:	http://hdl.handle.net/10183/255630
Resumo:	A área de LegalTech é referida como a relação entre áreas da Ciência da Computação que operam em linguagem natural e áreas jurídicas. A proximidade entre as áreas da Linguagem e Direito possibilita que a LegalTech seja aplicada em diversas tarefas como geração de texto legal, predição de sentenças, recuperação de texto legal. Porém, apesar da flexibilidade em aplicações, muitas soluções apresentam lacunas em sua metodologia de implementação e/ou disponibilização das bases de dados extraídas e pré-processadas. Neste trabalho, é proposta uma Abordagem Agnóstica com o objetivo de providenciar recomendações para o desenvolvimento de soluções na área de LegalTech de forma coesa, estruturada, extensível, e robusta. Inicialmente, foi realizada a revisão sistemática da literatura para identificar e apresentar um panorama sobre diferentes soluções propostas na geração de texto legal. A partir da revisão sistemática, uma taxonomia para classificar os estudos em cinco categorias de acordo com o escopo principal de cada trabalho foi proposta a fim de embasar a Abordagem Agnóstica, que é composta por 4 etapas responsáveis pela coleta, processamento, modelagem e exibição de resultados a partir da utilização de técnicas de Inteligência Artificial e Processamento de Linguagem Natural em documentos legais. A abordagem é testada em três tarefas diferentes. A primeira tarefa testa a capacidade de construção de uma base de dados com documentos legais a partir da extração de informações dos acórdãos em páginas Web do Supremo Tribunal Brasileiro. Além da organização e disponibilização da base de dados, uma análise com visualização de informações sobre os dados é apresentada. A segunda tarefa realiza a classificação de palavras em documentos legais para geração de texto anotado, resultando no primeiro passo para a construção de uma solução capaz de facilitar a leitura de texto legal para pessoas leigas na área jurídica. Por fim, a terceira tarefa utiliza a base de dados construída para experimentos em classificação de documentos legais utilizando algoritmos de aprendizado de máquina supervisionado em modelos classificadores. Na realização dos experimentos, o uso dos modelos apresentou resultados promissores para predição das classes dos acórdãos. Em especial, o uso do classificador SVM resultou em um F1-score médio de 0,96.

Metadados do item

id	URGS_9d09074cfcf636bd3e0129216ce35404
oai_identifier_str	oai:www.lume.ufrgs.br:10183/255630
network_acronym_str	URGS
network_name_str	Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str	1853
spelling	Flesch, Jean AmposGalante, Renata de Matos2023-03-11T03:30:31Z2022http://hdl.handle.net/10183/255630001163948A área de LegalTech é referida como a relação entre áreas da Ciência da Computação que operam em linguagem natural e áreas jurídicas. A proximidade entre as áreas da Linguagem e Direito possibilita que a LegalTech seja aplicada em diversas tarefas como geração de texto legal, predição de sentenças, recuperação de texto legal. Porém, apesar da flexibilidade em aplicações, muitas soluções apresentam lacunas em sua metodologia de implementação e/ou disponibilização das bases de dados extraídas e pré-processadas. Neste trabalho, é proposta uma Abordagem Agnóstica com o objetivo de providenciar recomendações para o desenvolvimento de soluções na área de LegalTech de forma coesa, estruturada, extensível, e robusta. Inicialmente, foi realizada a revisão sistemática da literatura para identificar e apresentar um panorama sobre diferentes soluções propostas na geração de texto legal. A partir da revisão sistemática, uma taxonomia para classificar os estudos em cinco categorias de acordo com o escopo principal de cada trabalho foi proposta a fim de embasar a Abordagem Agnóstica, que é composta por 4 etapas responsáveis pela coleta, processamento, modelagem e exibição de resultados a partir da utilização de técnicas de Inteligência Artificial e Processamento de Linguagem Natural em documentos legais. A abordagem é testada em três tarefas diferentes. A primeira tarefa testa a capacidade de construção de uma base de dados com documentos legais a partir da extração de informações dos acórdãos em páginas Web do Supremo Tribunal Brasileiro. Além da organização e disponibilização da base de dados, uma análise com visualização de informações sobre os dados é apresentada. A segunda tarefa realiza a classificação de palavras em documentos legais para geração de texto anotado, resultando no primeiro passo para a construção de uma solução capaz de facilitar a leitura de texto legal para pessoas leigas na área jurídica. Por fim, a terceira tarefa utiliza a base de dados construída para experimentos em classificação de documentos legais utilizando algoritmos de aprendizado de máquina supervisionado em modelos classificadores. Na realização dos experimentos, o uso dos modelos apresentou resultados promissores para predição das classes dos acórdãos. Em especial, o uso do classificador SVM resultou em um F1-score médio de 0,96.The area of LegalTech is referred as the relationship between fields of Computer Science that operate in natural language and fields of law. The proximity between the fields of Language and Law allows LegalTech to be applied in various tasks such as legal text generation, sentence prediction, legal text recovery. However, despite the flexibility in the range of applications, many solutions have gaps in their implementation methodology and/or availability of extracted and preprocessed databases. In this work, an Agnostic Approach is proposed with the objective of providing guidelines for the development of solutions in the area of LegalTech in a cohesive, structured, extensible, and robust way. Initially, a systematic literature review is performed to identify and present an overview of different solutions proposed in the generation of legal text. From the systematic review, a taxonomy to classify the studies into five categories according to the main scope of each work is proposed in order to support the Agnostic Approach, which is composed of 4 steps responsible for collecting, processing, modeling and displaying results from the use of Artificial Intelligence and Natural Language Processing techniques in legal documents. The approach is tested on three different tasks. The first task tests the ability to build a database with legal documents by extracting information from judgments on Web pages of the Brazilian Supreme Court. In addition to the organization and availability of the database, an analysis with visualization of information about the data is presented. The second task performs the classification of words in legal documents to generate annotated text, resulting in the first step towards the construction of a solution capable of facilitat ing the reading of legal texts for non practitioner people in the legal area. Finally, the third task uses the database built for experiments in legal document classification using supervised machine learning algorithms in classifier models. During the execution of the experiments, the use of models showed promising results for predicting the classes of judgments. In particular, the use of the SVM classifier resulted in an average F1-score of 0.96.application/pdfengInteligência artificialAprendizado de máquinaClassificação de documentosLinguagem naturalLegalTechLegal text generationUma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTechAn agnostic approach to legal text generation and application to legalTech tasks info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001163948.pdf.txt001163948.pdf.txtExtracted Texttext/plain236463http://www.lume.ufrgs.br/bitstream/10183/255630/2/001163948.pdf.txt07d5538183caef2d279b0fafb03576e5MD52ORIGINAL001163948.pdfTexto completoapplication/pdf1477032http://www.lume.ufrgs.br/bitstream/10183/255630/1/001163948.pdf33abaed371235e7bd05251b744ad5704MD5110183/2556302023-03-12 03:24:07.508188oai:www.lume.ufrgs.br:10183/255630Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br\|\|lume@ufrgs.bropendoar:18532023-03-12T06:24:07Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
dc.title.alternative.pt.fl_str_mv	An agnostic approach to legal text generation and application to legalTech tasks
title	Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
spellingShingle	Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech Flesch, Jean Ampos Inteligência artificial Aprendizado de máquina Classificação de documentos Linguagem natural LegalTech Legal text generation
title_short	Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
title_full	Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
title_fullStr	Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
title_full_unstemmed	Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
title_sort	Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech
author	Flesch, Jean Ampos
author_facet	Flesch, Jean Ampos
author_role	author
dc.contributor.author.fl_str_mv	Flesch, Jean Ampos
dc.contributor.advisor1.fl_str_mv	Galante, Renata de Matos
contributor_str_mv	Galante, Renata de Matos
dc.subject.por.fl_str_mv	Inteligência artificial Aprendizado de máquina Classificação de documentos Linguagem natural
topic	Inteligência artificial Aprendizado de máquina Classificação de documentos Linguagem natural LegalTech Legal text generation
dc.subject.eng.fl_str_mv	LegalTech Legal text generation
description	A área de LegalTech é referida como a relação entre áreas da Ciência da Computação que operam em linguagem natural e áreas jurídicas. A proximidade entre as áreas da Linguagem e Direito possibilita que a LegalTech seja aplicada em diversas tarefas como geração de texto legal, predição de sentenças, recuperação de texto legal. Porém, apesar da flexibilidade em aplicações, muitas soluções apresentam lacunas em sua metodologia de implementação e/ou disponibilização das bases de dados extraídas e pré-processadas. Neste trabalho, é proposta uma Abordagem Agnóstica com o objetivo de providenciar recomendações para o desenvolvimento de soluções na área de LegalTech de forma coesa, estruturada, extensível, e robusta. Inicialmente, foi realizada a revisão sistemática da literatura para identificar e apresentar um panorama sobre diferentes soluções propostas na geração de texto legal. A partir da revisão sistemática, uma taxonomia para classificar os estudos em cinco categorias de acordo com o escopo principal de cada trabalho foi proposta a fim de embasar a Abordagem Agnóstica, que é composta por 4 etapas responsáveis pela coleta, processamento, modelagem e exibição de resultados a partir da utilização de técnicas de Inteligência Artificial e Processamento de Linguagem Natural em documentos legais. A abordagem é testada em três tarefas diferentes. A primeira tarefa testa a capacidade de construção de uma base de dados com documentos legais a partir da extração de informações dos acórdãos em páginas Web do Supremo Tribunal Brasileiro. Além da organização e disponibilização da base de dados, uma análise com visualização de informações sobre os dados é apresentada. A segunda tarefa realiza a classificação de palavras em documentos legais para geração de texto anotado, resultando no primeiro passo para a construção de uma solução capaz de facilitar a leitura de texto legal para pessoas leigas na área jurídica. Por fim, a terceira tarefa utiliza a base de dados construída para experimentos em classificação de documentos legais utilizando algoritmos de aprendizado de máquina supervisionado em modelos classificadores. Na realização dos experimentos, o uso dos modelos apresentou resultados promissores para predição das classes dos acórdãos. Em especial, o uso do classificador SVM resultou em um F1-score médio de 0,96.
publishDate	2022
dc.date.issued.fl_str_mv	2022
dc.date.accessioned.fl_str_mv	2023-03-11T03:30:31Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/255630
dc.identifier.nrb.pt_BR.fl_str_mv	001163948
url	http://hdl.handle.net/10183/255630
identifier_str_mv	001163948
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Biblioteca Digital de Teses e Dissertações da UFRGS
collection	Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/255630/2/001163948.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/255630/1/001163948.pdf
bitstream.checksum.fl_str_mv	07d5538183caef2d279b0fafb03576e5 33abaed371235e7bd05251b744ad5704
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br\|\|lume@ufrgs.br
_version_	1810085611441225728

Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech

Registros relacionados