Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais

Detalhes bibliográficos
Autor(a) principal: Brito, Jean Carlos Borges
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio2.unb.br/jspui/handle/10482/48817
Resumo: Tese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2023.
id UNB_5cc88cace40874f5a43be1648c533fb7
oai_identifier_str oai:repositorio.unb.br:10482/48817
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitaisDescritoresRepositórios DigitaisMetadadosTesaurosIndexaçãoTese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2023.Introdução. Com o aumento exponencial de dados, devido a sua característica digital, amplia-se também os problemas de ausência ou a discrepância de metadados cadastrados, tornando um trabalho oneroso e árduo para um ser humano corrigi-los manualmente. Surge a necessidade de investigações para melhorar a organização e facilitar recuperação da informação. Nesse contexto, a aplicação de inteligência artificial através da aprendizagem de máquina, utilizando ferramentas automáticas e semiautomáticas de forma complementar para coleta de metadados e geração de assuntos, propicia a melhoria de sua indexação e buscas nos repositórios digitais. Objetivo. Propor um framework genérico com um conjunto de atividades e técnicas para executar a geração e indexação automática de assuntos em um repositório digital, visando a organização e a recuperação da informação. Métodos. Revisão Sistemática da Literatura, estudando sobre o tema de geração automática e semiautomática de metadados, suas ferramentas, técnicas, características e funções. Realizouse pesquisa exploratória em bases de dados científicas da Ciência da Informação, selecionando periódicos específicos para a avaliação de acordo com as principais listas de classificação. Utilizou-se método misto na análise dos dados, com abordagens quantitativas e qualitativas, sendo definido um protocolo rigoroso de revisão. Identificou-se ferramentas para auxiliar a pesquisa aplicada, através da sua customização e uso em conjunto de vários algoritmos de aprendizagem de máquina que auxiliassem no processo de geração automática de assuntos. Ao final, realizou-se um estudo de caso aplicado para o “modelo de pesquisa”. Resultados. Conclui-se que as técnicas de geração automática de metadados auxiliam na sugestão de assuntos para documentos robustos como uma tese e dissertação, ampliando o quantitativo de descritores, de modo a facilitar a configuração de taxonomias, filtros e facetas. Esse trabalho propôs o framework genérico validado pelo modelo de pesquisa, através do estudo de caso aplicado. Esse framework pode ser adequado e aplicado em qualquer área do conhecimento, com intuito de melhorar e facilitar a busca e a recuperação da informação nos repositórios digitais pelos usuários e gestores desses acervos.Introduction. With the exponential increase in data, due to its digital nature, problems with the absence or discrepancy of registered metadata also increase, making it an expensive and arduous job for a human being to correct them manually. There is a need for investigations to improve the organization and facilitate information retrieval. In this context, the application of artificial intelligence through machine learning, using automatic and semi-automatic tools in a complementary way to collect metadata and generate subjects, improves indexing and searches in digital repositories. Goal. Propose a generic framework with a set of activities and techniques to automatically generate and index subjects in a digital repository, aiming at organizing and retrieving information. Methods. Systematic Literature Review, studying the subject of automatic and semiautomatic generation of metadata, its tools, techniques, characteristics and functions. Exploratory research was carried out in scientific databases of Information Science, selecting specific journals for evaluation according to the main classification lists. A mixed method was used for data analysis, with quantitative and qualitative approaches, with a strict review protocol being defined. Tools were identified to help applied research, through their customization and joint use of several machine learning algorithms that would help in the process of automatic subject generation. At the end, a case study applied to the “research model” was carried out. Results. It is concluded that the automatic generation of metadata techniques help in suggesting subjects for robust documents such as a thesis and dissertation, expanding the number of descriptors, in order to facilitate the configuration of taxonomies, filters and facets. This work proposed the generic framework validated by the research model, through the applied case study. This framework can be adapted and applied in any area of knowledge, with the aim of improving and facilitating the search and retrieval of information in digital repositories by users and managers of these collections.Faculdade de Ciência da Informação (FCI)Programa de Pós-Graduação em Ciência da InformaçãoMartins, Dalton LopesBrito, Jean Carlos Borges2024-07-12T19:45:31Z2024-07-12T19:45:31Z2024-07-122023-11-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBRITO, Jean Carlos Borges. Organização da informação: uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais . 2023. 139 f., il. Tese (Doutorado em Ciência Da Informação) — Universidade de Brasília, Brasília, 2023.http://repositorio2.unb.br/jspui/handle/10482/48817porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-07-17T04:24:31Zoai:repositorio.unb.br:10482/48817Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-07-17T04:24:31Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
title Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
spellingShingle Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
Brito, Jean Carlos Borges
Descritores
Repositórios Digitais
Metadados
Tesauros
Indexação
title_short Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
title_full Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
title_fullStr Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
title_full_unstemmed Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
title_sort Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
author Brito, Jean Carlos Borges
author_facet Brito, Jean Carlos Borges
author_role author
dc.contributor.none.fl_str_mv Martins, Dalton Lopes
dc.contributor.author.fl_str_mv Brito, Jean Carlos Borges
dc.subject.por.fl_str_mv Descritores
Repositórios Digitais
Metadados
Tesauros
Indexação
topic Descritores
Repositórios Digitais
Metadados
Tesauros
Indexação
description Tese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2023.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-21
2024-07-12T19:45:31Z
2024-07-12T19:45:31Z
2024-07-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BRITO, Jean Carlos Borges. Organização da informação: uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais . 2023. 139 f., il. Tese (Doutorado em Ciência Da Informação) — Universidade de Brasília, Brasília, 2023.
http://repositorio2.unb.br/jspui/handle/10482/48817
identifier_str_mv BRITO, Jean Carlos Borges. Organização da informação: uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais . 2023. 139 f., il. Tese (Doutorado em Ciência Da Informação) — Universidade de Brasília, Brasília, 2023.
url http://repositorio2.unb.br/jspui/handle/10482/48817
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508181377777664