Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal

Detalhes bibliográficos
Autor(a) principal: Rosa, Samuel Santos da
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/189837
Resumo: Este trabalho tem como objetivo investigar o potencial da análise de logs para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação na área do Direito Penal. Compõem o corpus de análise 882 logs (236 Jornadas dos Usuários) coletados no período de 2 a 24 de setembro de 2017. O avanço tecnológico tem gerado uma constante modificação no comportamento informacional dos usuários, sendo necessária a utilização de métodos que auxiliem na coleta de informações sobre esses usuários. A análise de logs é um desses métodos ao permitir identificar as ações dos usuários de um sistema de informação ao trazer um conteúdo abundante de informações sobre sua interação com o sistema. O percurso metodológico ocorreu através da coleta dos dados junto ao Portal LexML, seguindo da análise de logs, dividida em cinco etapas: 1ª Etapa – Estruturação e Organização: os logs foram agrupados e organizados (estruturação de cabeçalhos); 2ª Etapa – Classificação e Seleção: classificação das expressões de busca utilizadas pelos usuários com base na CDDir; 3ª Etapa – Validação: validação das expressões referentes ao Direito Penal com base no Vocabulário Controlado Básico do Senado Federal; 4ª Etapa – Análise Estatística: identificação das Jornadas dos Usuários, eliminação de outliers e cálculos estatísticos; 5ª Etapa – Análise da Jornada dos Usuários: observação manual de cada jornada. Como resultados foram observados um alto índice de expressões sem termos representados no VCB (54,31%). O assunto mais pesquisado pelos usuários foi ―Infrações contra as pessoas‖ com 191 buscas. No número de interações junto ao sistema identificamos uma média de 3,74 solicitações por usuário e uma média de 11 minutos e 33 segundos por jornada. Verificamos que 48,38% dos usuários modificam sua expressão de busca e que 31,78% dos usuários iniciam a busca de forma geral e posteriormente a tornam especificas. Encontramos também uma média de 4 lexias por expressão e 15,1 por jornada. Quanto ao uso de recursos terminológicos, 24,58% das jornadas utilizam a numeração jurídica. Observamos também um baixo uso de booleanos. Em relação ao uso de modificadores, 3,81% dos usuários não utilizam e na análise de uso de filtros encontramos que 61,44% não fazem uso deste artificio. Identificamos como limitações da análise de logs: delimitação dos usuários e suas jornadas; identificação de robôs de busca; e o desconhecimento das motivações dos usuários. Já como contribuições: a coleta dos dados sem interferência humana; visualização das ações dos usuários; acesso a um grande volume de informações sobre características de busca dos usuários; avaliação do controle terminológico; e a possibilidade de configuração dos dados registrados no arquivo log. Conclui-se que a análise de logs é uma fonte de dados valiosa para o estudo do comportamento de busca em sistemas de informação, ao trazer uma gama de informações disponíveis passiveis de análise. Torna-se, portanto uma metodologia importante na identificação de características de busca dos usuários, que por usa vez são fundamentais para o aperfeiçoamento dos sistemas de recuperação da informação e do processo de indexação.
id UFRGS-2_b7d1ff7ef4ff6dc21649d66fe5dfe574
oai_identifier_str oai:www.lume.ufrgs.br:10183/189837
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Rosa, Samuel Santos daLaipelt, Rita do Carmo FerreiraKrebs, Luciana Monteiro2019-03-30T04:22:48Z2018http://hdl.handle.net/10183/189837001087779Este trabalho tem como objetivo investigar o potencial da análise de logs para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação na área do Direito Penal. Compõem o corpus de análise 882 logs (236 Jornadas dos Usuários) coletados no período de 2 a 24 de setembro de 2017. O avanço tecnológico tem gerado uma constante modificação no comportamento informacional dos usuários, sendo necessária a utilização de métodos que auxiliem na coleta de informações sobre esses usuários. A análise de logs é um desses métodos ao permitir identificar as ações dos usuários de um sistema de informação ao trazer um conteúdo abundante de informações sobre sua interação com o sistema. O percurso metodológico ocorreu através da coleta dos dados junto ao Portal LexML, seguindo da análise de logs, dividida em cinco etapas: 1ª Etapa – Estruturação e Organização: os logs foram agrupados e organizados (estruturação de cabeçalhos); 2ª Etapa – Classificação e Seleção: classificação das expressões de busca utilizadas pelos usuários com base na CDDir; 3ª Etapa – Validação: validação das expressões referentes ao Direito Penal com base no Vocabulário Controlado Básico do Senado Federal; 4ª Etapa – Análise Estatística: identificação das Jornadas dos Usuários, eliminação de outliers e cálculos estatísticos; 5ª Etapa – Análise da Jornada dos Usuários: observação manual de cada jornada. Como resultados foram observados um alto índice de expressões sem termos representados no VCB (54,31%). O assunto mais pesquisado pelos usuários foi ―Infrações contra as pessoas‖ com 191 buscas. No número de interações junto ao sistema identificamos uma média de 3,74 solicitações por usuário e uma média de 11 minutos e 33 segundos por jornada. Verificamos que 48,38% dos usuários modificam sua expressão de busca e que 31,78% dos usuários iniciam a busca de forma geral e posteriormente a tornam especificas. Encontramos também uma média de 4 lexias por expressão e 15,1 por jornada. Quanto ao uso de recursos terminológicos, 24,58% das jornadas utilizam a numeração jurídica. Observamos também um baixo uso de booleanos. Em relação ao uso de modificadores, 3,81% dos usuários não utilizam e na análise de uso de filtros encontramos que 61,44% não fazem uso deste artificio. Identificamos como limitações da análise de logs: delimitação dos usuários e suas jornadas; identificação de robôs de busca; e o desconhecimento das motivações dos usuários. Já como contribuições: a coleta dos dados sem interferência humana; visualização das ações dos usuários; acesso a um grande volume de informações sobre características de busca dos usuários; avaliação do controle terminológico; e a possibilidade de configuração dos dados registrados no arquivo log. Conclui-se que a análise de logs é uma fonte de dados valiosa para o estudo do comportamento de busca em sistemas de informação, ao trazer uma gama de informações disponíveis passiveis de análise. Torna-se, portanto uma metodologia importante na identificação de características de busca dos usuários, que por usa vez são fundamentais para o aperfeiçoamento dos sistemas de recuperação da informação e do processo de indexação.This work aims to investigate the potential of log analysis for the study of information searching behaviour of Portal LexML users in the information retrieval in the area of Criminal Law. They compose the analysis corpus 882 logs (236 User Journey) collected in the period from September 2 to 24, 2017. The technological advance has generated a constant modification in the informational behavior of the users, being necessary the use of methods that help in the search of information about these users. The log analysis is one of these methods by allowing the identification of the actions of users of an information system by bringing abundant information about their interaction with the system. The methodological course was carried out through the collection of data from the Portal LexML, followed by log analysis, divided into five stages: 1st Stage – Structuring and Organization: the logs were grouped and organized (structuring headers); 2st Stage – Classification and Selection: classification of search expressions used by users based on CDDir; 3st. Stage – Validation: validation of expressions related to Criminal Law based on the Basic Controlled Vocabulary of the Federal Senate; 4st Stage – Statistical Analysis: identification of User Journey, elimination of outliers and statistical calculations; 5st Stage – User Journey Analysis: manual observation of each journey. As results we observed a high index of expressions without terms represented in the VCB (54,31%). The subject most searched by users was "Offenses against people" with 191 searches. In the number of interactions with the system we identified an average of 3,74 requests per user and an average of 11 minutes and 33 seconds per journey. We verified that 48,38% of the users modified their search expression and that 31,78% of the users initiated the search in general form and subsequently made it specific. We found an average of 4 lexias per expression and 15,1 per journey. As for the use of terminological resources, 24,58% of the journeys use legal numbering. We also noticed a low use of booleans. In relation to the use of modifiers, 3,81% of users do not use and in the analysis of the use of filters we find that 61,44% do not use. We have identified limitations of log analysis: delimitation of users and their journeys; identification of search robots; and unknown motivations of users. Already as contributions: the collection of data without human interference; visualization of user actions; access to a large volume of information about user search characteristics; assessment of terminological control; and the possibility of setting the data recorded in the log file. It is concluded that log analysis is a valuable data source for the study of information searching behaviour, by bringing a range of information available for analysis. It is, therefore, an important methodology in the identification of search characteristics of the users, which for once are fundamental for the improvement of information retrieval systems and the indexing process.application/pdfporRepresentação da informaçãoRecuperação da informaçãoInformação jurídicaLog AnalysisInformation Retrieval SystemsInformation RetrievalInformation Searching BehaviourPegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulFaculdade de Biblioteconomia e ComunicaçãoPorto Alegre, BR-RS2018Biblioteconomiagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001087779.pdf.txt001087779.pdf.txtExtracted Texttext/plain344874http://www.lume.ufrgs.br/bitstream/10183/189837/2/001087779.pdf.txt2b7041333dcc108b6be623c9e3bf8694MD52ORIGINAL001087779.pdfTexto completoapplication/pdf2480650http://www.lume.ufrgs.br/bitstream/10183/189837/1/001087779.pdf67bf589ad28bdbeb034df9d86fa28423MD5110183/1898372019-03-31 04:12:31.804616oai:www.lume.ufrgs.br:10183/189837Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2019-03-31T07:12:31Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
title Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
spellingShingle Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
Rosa, Samuel Santos da
Representação da informação
Recuperação da informação
Informação jurídica
Log Analysis
Information Retrieval Systems
Information Retrieval
Information Searching Behaviour
title_short Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
title_full Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
title_fullStr Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
title_full_unstemmed Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
title_sort Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
author Rosa, Samuel Santos da
author_facet Rosa, Samuel Santos da
author_role author
dc.contributor.author.fl_str_mv Rosa, Samuel Santos da
dc.contributor.advisor1.fl_str_mv Laipelt, Rita do Carmo Ferreira
dc.contributor.advisor-co1.fl_str_mv Krebs, Luciana Monteiro
contributor_str_mv Laipelt, Rita do Carmo Ferreira
Krebs, Luciana Monteiro
dc.subject.por.fl_str_mv Representação da informação
Recuperação da informação
Informação jurídica
topic Representação da informação
Recuperação da informação
Informação jurídica
Log Analysis
Information Retrieval Systems
Information Retrieval
Information Searching Behaviour
dc.subject.eng.fl_str_mv Log Analysis
Information Retrieval Systems
Information Retrieval
Information Searching Behaviour
description Este trabalho tem como objetivo investigar o potencial da análise de logs para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação na área do Direito Penal. Compõem o corpus de análise 882 logs (236 Jornadas dos Usuários) coletados no período de 2 a 24 de setembro de 2017. O avanço tecnológico tem gerado uma constante modificação no comportamento informacional dos usuários, sendo necessária a utilização de métodos que auxiliem na coleta de informações sobre esses usuários. A análise de logs é um desses métodos ao permitir identificar as ações dos usuários de um sistema de informação ao trazer um conteúdo abundante de informações sobre sua interação com o sistema. O percurso metodológico ocorreu através da coleta dos dados junto ao Portal LexML, seguindo da análise de logs, dividida em cinco etapas: 1ª Etapa – Estruturação e Organização: os logs foram agrupados e organizados (estruturação de cabeçalhos); 2ª Etapa – Classificação e Seleção: classificação das expressões de busca utilizadas pelos usuários com base na CDDir; 3ª Etapa – Validação: validação das expressões referentes ao Direito Penal com base no Vocabulário Controlado Básico do Senado Federal; 4ª Etapa – Análise Estatística: identificação das Jornadas dos Usuários, eliminação de outliers e cálculos estatísticos; 5ª Etapa – Análise da Jornada dos Usuários: observação manual de cada jornada. Como resultados foram observados um alto índice de expressões sem termos representados no VCB (54,31%). O assunto mais pesquisado pelos usuários foi ―Infrações contra as pessoas‖ com 191 buscas. No número de interações junto ao sistema identificamos uma média de 3,74 solicitações por usuário e uma média de 11 minutos e 33 segundos por jornada. Verificamos que 48,38% dos usuários modificam sua expressão de busca e que 31,78% dos usuários iniciam a busca de forma geral e posteriormente a tornam especificas. Encontramos também uma média de 4 lexias por expressão e 15,1 por jornada. Quanto ao uso de recursos terminológicos, 24,58% das jornadas utilizam a numeração jurídica. Observamos também um baixo uso de booleanos. Em relação ao uso de modificadores, 3,81% dos usuários não utilizam e na análise de uso de filtros encontramos que 61,44% não fazem uso deste artificio. Identificamos como limitações da análise de logs: delimitação dos usuários e suas jornadas; identificação de robôs de busca; e o desconhecimento das motivações dos usuários. Já como contribuições: a coleta dos dados sem interferência humana; visualização das ações dos usuários; acesso a um grande volume de informações sobre características de busca dos usuários; avaliação do controle terminológico; e a possibilidade de configuração dos dados registrados no arquivo log. Conclui-se que a análise de logs é uma fonte de dados valiosa para o estudo do comportamento de busca em sistemas de informação, ao trazer uma gama de informações disponíveis passiveis de análise. Torna-se, portanto uma metodologia importante na identificação de características de busca dos usuários, que por usa vez são fundamentais para o aperfeiçoamento dos sistemas de recuperação da informação e do processo de indexação.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2019-03-30T04:22:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/189837
dc.identifier.nrb.pt_BR.fl_str_mv 001087779
url http://hdl.handle.net/10183/189837
identifier_str_mv 001087779
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/189837/2/001087779.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/189837/1/001087779.pdf
bitstream.checksum.fl_str_mv 2b7041333dcc108b6be623c9e3bf8694
67bf589ad28bdbeb034df9d86fa28423
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1798486917001510912