Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio2.unb.br/jspui/handle/10482/48817 |
Resumo: | Tese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2023. |
id |
UNB_5cc88cace40874f5a43be1648c533fb7 |
---|---|
oai_identifier_str |
oai:repositorio.unb.br:10482/48817 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitaisDescritoresRepositórios DigitaisMetadadosTesaurosIndexaçãoTese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2023.Introdução. Com o aumento exponencial de dados, devido a sua característica digital, amplia-se também os problemas de ausência ou a discrepância de metadados cadastrados, tornando um trabalho oneroso e árduo para um ser humano corrigi-los manualmente. Surge a necessidade de investigações para melhorar a organização e facilitar recuperação da informação. Nesse contexto, a aplicação de inteligência artificial através da aprendizagem de máquina, utilizando ferramentas automáticas e semiautomáticas de forma complementar para coleta de metadados e geração de assuntos, propicia a melhoria de sua indexação e buscas nos repositórios digitais. Objetivo. Propor um framework genérico com um conjunto de atividades e técnicas para executar a geração e indexação automática de assuntos em um repositório digital, visando a organização e a recuperação da informação. Métodos. Revisão Sistemática da Literatura, estudando sobre o tema de geração automática e semiautomática de metadados, suas ferramentas, técnicas, características e funções. Realizouse pesquisa exploratória em bases de dados científicas da Ciência da Informação, selecionando periódicos específicos para a avaliação de acordo com as principais listas de classificação. Utilizou-se método misto na análise dos dados, com abordagens quantitativas e qualitativas, sendo definido um protocolo rigoroso de revisão. Identificou-se ferramentas para auxiliar a pesquisa aplicada, através da sua customização e uso em conjunto de vários algoritmos de aprendizagem de máquina que auxiliassem no processo de geração automática de assuntos. Ao final, realizou-se um estudo de caso aplicado para o “modelo de pesquisa”. Resultados. Conclui-se que as técnicas de geração automática de metadados auxiliam na sugestão de assuntos para documentos robustos como uma tese e dissertação, ampliando o quantitativo de descritores, de modo a facilitar a configuração de taxonomias, filtros e facetas. Esse trabalho propôs o framework genérico validado pelo modelo de pesquisa, através do estudo de caso aplicado. Esse framework pode ser adequado e aplicado em qualquer área do conhecimento, com intuito de melhorar e facilitar a busca e a recuperação da informação nos repositórios digitais pelos usuários e gestores desses acervos.Introduction. With the exponential increase in data, due to its digital nature, problems with the absence or discrepancy of registered metadata also increase, making it an expensive and arduous job for a human being to correct them manually. There is a need for investigations to improve the organization and facilitate information retrieval. In this context, the application of artificial intelligence through machine learning, using automatic and semi-automatic tools in a complementary way to collect metadata and generate subjects, improves indexing and searches in digital repositories. Goal. Propose a generic framework with a set of activities and techniques to automatically generate and index subjects in a digital repository, aiming at organizing and retrieving information. Methods. Systematic Literature Review, studying the subject of automatic and semiautomatic generation of metadata, its tools, techniques, characteristics and functions. Exploratory research was carried out in scientific databases of Information Science, selecting specific journals for evaluation according to the main classification lists. A mixed method was used for data analysis, with quantitative and qualitative approaches, with a strict review protocol being defined. Tools were identified to help applied research, through their customization and joint use of several machine learning algorithms that would help in the process of automatic subject generation. At the end, a case study applied to the “research model” was carried out. Results. It is concluded that the automatic generation of metadata techniques help in suggesting subjects for robust documents such as a thesis and dissertation, expanding the number of descriptors, in order to facilitate the configuration of taxonomies, filters and facets. This work proposed the generic framework validated by the research model, through the applied case study. This framework can be adapted and applied in any area of knowledge, with the aim of improving and facilitating the search and retrieval of information in digital repositories by users and managers of these collections.Faculdade de Ciência da Informação (FCI)Programa de Pós-Graduação em Ciência da InformaçãoMartins, Dalton LopesBrito, Jean Carlos Borges2024-07-12T19:45:31Z2024-07-12T19:45:31Z2024-07-122023-11-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBRITO, Jean Carlos Borges. Organização da informação: uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais . 2023. 139 f., il. Tese (Doutorado em Ciência Da Informação) — Universidade de Brasília, Brasília, 2023.http://repositorio2.unb.br/jspui/handle/10482/48817porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-07-17T04:24:31Zoai:repositorio.unb.br:10482/48817Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-07-17T04:24:31Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais |
title |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais |
spellingShingle |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais Brito, Jean Carlos Borges Descritores Repositórios Digitais Metadados Tesauros Indexação |
title_short |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais |
title_full |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais |
title_fullStr |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais |
title_full_unstemmed |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais |
title_sort |
Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais |
author |
Brito, Jean Carlos Borges |
author_facet |
Brito, Jean Carlos Borges |
author_role |
author |
dc.contributor.none.fl_str_mv |
Martins, Dalton Lopes |
dc.contributor.author.fl_str_mv |
Brito, Jean Carlos Borges |
dc.subject.por.fl_str_mv |
Descritores Repositórios Digitais Metadados Tesauros Indexação |
topic |
Descritores Repositórios Digitais Metadados Tesauros Indexação |
description |
Tese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2023. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-11-21 2024-07-12T19:45:31Z 2024-07-12T19:45:31Z 2024-07-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
BRITO, Jean Carlos Borges. Organização da informação: uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais . 2023. 139 f., il. Tese (Doutorado em Ciência Da Informação) — Universidade de Brasília, Brasília, 2023. http://repositorio2.unb.br/jspui/handle/10482/48817 |
identifier_str_mv |
BRITO, Jean Carlos Borges. Organização da informação: uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais . 2023. 139 f., il. Tese (Doutorado em Ciência Da Informação) — Universidade de Brasília, Brasília, 2023. |
url |
http://repositorio2.unb.br/jspui/handle/10482/48817 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
repositorio@unb.br |
_version_ |
1814508181377777664 |