Avaliação de técnicas de similaridade textual na uniformização de jurisprudência

Detalhes bibliográficos
Autor(a) principal: Gomes, Thiago Alencar
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: https://repositorio.unb.br/handle/10482/40798
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.
id UNB_4e1a52c611174de74fcecaed5ddf4a81
oai_identifier_str oai:repositorio.unb.br:10482/40798
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Avaliação de técnicas de similaridade textual na uniformização de jurisprudênciaMineração de textoLinguagem natural - processamentoRecuperação da informaçãoDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.A uniformização de jurisprudência é de extrema importância para a sociedade. Através dela é possível garantir maior celeridade processual e estabilidade jurídica à medida que novos casos são julgados com base na mesma tese jurídica de casos similares anteriores. Para garantir o efetivo acesso às teses, as bases textuais são indexadas em ferramentas de busca textual. Este estudo tem como contexto o Superior Tribunal de Justiça (STJ) que possui uma ferramenta legada de busca textual que fornece somente buscas baseadas em consultas booleanas com operadores lógicos e de proximidade complexos. Para facilitar a busca no corpus de decisões da Corte, a Secretária de Jurisprudência (SJR) fornece diversos produtos, como consultas pré-construídas para teses importantes e decisões agrupadas que possuem as mesmas teses. Assim, é possível acessar de forma otimizada a interpretação da legislação pelo STJ e acompanhar a sua evolução. O tempo dispendido na construção das consultas e no treinamento de servidores para utilização da ferramenta motiva este trabalho na avaliação da aplicação de outras técnicas de similaridade na recuperação de decisões. Como baseline utilizamos as consultas do sistema legado e comparamos com buscas a partir de textos, que descrevem as teses, escritos pelos servidores ou textos selecionados diretamente das decisões. Os resultados indicam que a utilização direta dos textos com modelos tradicionais TF-IDF e BM25 pode substituir as consultas do sistema legado. Os modelos semânticos baseados em predição Word2Vec e BERT não apresentaram ganhos em relação aos modelos clássicos.Jurisprudence is the set of all decisions of a judicial court and when they are organized efficiently they reflect the majority interpretation of the same court and thus consolidate an legal thesis used repeatedly. Hence, it is possible to guarantee faster judgments and legal stability as new cases are judged based on the same legal thesis as previous similar cases. This research investigates the use of text retrieval techniques on the Brazilian Superior Court of Justice decisions. The Court uses a legacy textual system that only provides complex Boolean queries. The training of new analysts on the tool takes between 2 and 3 months. This scenario motivates the research of other textual retrieval techniques that use text written in natural language as a queries. Through a historical base of legal theses descriptions written by the analysts, the decisions that those theses were extracted and the legacy system queries built to retrieve decisions with the same theses this work simulates two approaches. First, recovery of decisions after a user selects paragraphs with the legal opinion. Second, recovery of decisions after a user enters the legal opinion description in free text. The legacy system is used as baseline and compared with TF-IDF, BM25 retrieval models and prediction based semantic models Word2Vec and BERT. The results indicate that it is possible to replace the legacy system using classic and semantic textual retrieval using the decisions text as queries, with minimum intervention from the user.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em Computação Aplicada, Mestrado ProfissionalLadeira, MarceloFaleiros, Thiago de PauloGomes, Thiago Alencar2021-05-04T02:56:31Z2021-05-04T02:56:31Z2021-05-032020-12-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGOMES, Thiago Alencar. Avaliação de técnicas de similaridade textual na uniformização de jurisprudência. 2020. xv, 67 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2020.https://repositorio.unb.br/handle/10482/40798A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-14T16:13:44Zoai:repositorio.unb.br:10482/40798Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-14T16:13:44Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Avaliação de técnicas de similaridade textual na uniformização de jurisprudência
title Avaliação de técnicas de similaridade textual na uniformização de jurisprudência
spellingShingle Avaliação de técnicas de similaridade textual na uniformização de jurisprudência
Gomes, Thiago Alencar
Mineração de texto
Linguagem natural - processamento
Recuperação da informação
title_short Avaliação de técnicas de similaridade textual na uniformização de jurisprudência
title_full Avaliação de técnicas de similaridade textual na uniformização de jurisprudência
title_fullStr Avaliação de técnicas de similaridade textual na uniformização de jurisprudência
title_full_unstemmed Avaliação de técnicas de similaridade textual na uniformização de jurisprudência
title_sort Avaliação de técnicas de similaridade textual na uniformização de jurisprudência
author Gomes, Thiago Alencar
author_facet Gomes, Thiago Alencar
author_role author
dc.contributor.none.fl_str_mv Ladeira, Marcelo
Faleiros, Thiago de Paulo
dc.contributor.author.fl_str_mv Gomes, Thiago Alencar
dc.subject.por.fl_str_mv Mineração de texto
Linguagem natural - processamento
Recuperação da informação
topic Mineração de texto
Linguagem natural - processamento
Recuperação da informação
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.
publishDate 2020
dc.date.none.fl_str_mv 2020-12-10
2021-05-04T02:56:31Z
2021-05-04T02:56:31Z
2021-05-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv GOMES, Thiago Alencar. Avaliação de técnicas de similaridade textual na uniformização de jurisprudência. 2020. xv, 67 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2020.
https://repositorio.unb.br/handle/10482/40798
identifier_str_mv GOMES, Thiago Alencar. Avaliação de técnicas de similaridade textual na uniformização de jurisprudência. 2020. xv, 67 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2020.
url https://repositorio.unb.br/handle/10482/40798
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508168228634624