Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform

Detalhes bibliográficos
Autor(a) principal: Oliveira, Vagner Inácio de, 1985-
Data de Publicação: 2024
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/18730
Resumo: Orientadores: Paula Dornhofer Paro Costa, Dalton Lopes Martins
id UNICAMP-30_411a6a084ff83e95b1cc74df67851723
oai_identifier_str oai::1392802
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platformAprendizado de máquina e patrimônio cultural : extração automática de metadados de acervos digitais de museus brasileiros na plataforma TainacanPatrimônio culturalAprendizado profundoAnálise de imagemCultural heritageDeep learningImage analysisComputer visionOrientadores: Paula Dornhofer Paro Costa, Dalton Lopes MartinsDissertação (mestrado) - Universidade Estadual de Campinas (UNICAMP), Faculdade de Engenharia Elétrica e de ComputaçãoResumo: A digitalização de acervos museológicos e a preservação do patrimônio cultural, em um contexto cada vez mais digital, representam desafios cruciais no cenário brasileiro, particularmente diante de perdas históricas ocorridas na última década e da necessidade urgente de democratizar o acesso à cultura. A carência de informações detalhadas que descrevem os objetos nas bases de dados amplia esses desafios, dificultando não apenas o rastreamento eficaz dos itens, mas também a contextualização adequada de cada peça. Essa lacuna na documentação dos acervos restringe a capacidade de acesso e compreensão por parte do público, sublinhando a importância de metodologias avançadas para uma catalogação mais rica e informativa. Este trabalho aborda a aplicação de tecnologias avançadas de aprendizado de máquina e visão computacional para automatizar a extração e descrição de metadados em imagens de objetos culturais, com foco no contexto brasileiro. Utilizando modelos de inteligência artificial, o estudo desenvolve metodologias para gerar descrições precisas e contextualmente relevantes. Apesar de limitações relacionadas ao tamanho da base de dados, os resultados indicam um potencial significativo dessas tecnologias em aprimorar a eficiência e precisão do processo de catalogação. Além disso, contribui para a curadoria digital, propondo soluções que agilizam a catalogação de acervos e enriquecem a experiência de acesso ao patrimônio cultural. As principais contribuições incluem a construção de um dataset de imagens rotuladas de objetos de patrimônios culturais brasileiros, especificamente museus administrados pelo Ibram, a disponibilização das implementações em código aberto e a criação de um template descritivo com informações do objeto. Este template permite a descrição detalhada dos objetos, adicionando campos para identificação do momento de criação da descrição e um identificador único, o que representa um avanço significativo para a aplicação prática dos modelos em contextos museológicos. Este trabalho sublinha a importância da interseção entre inteligência artificial e curadoria cultural, abrindo caminhos para a preservação e democratização do acesso ao patrimônio cultural brasileiroAbstract: The digitization of museum collections and the preservation of cultural heritage, in an increasingly digital context, represent crucial challenges in the Brazilian scenario, particularly given the historical losses that have occurred in the last decade and the urgent need to democratize access to culture. The lack of detailed information describing objects in databases increases these challenges, making it difficult not only to effectively track items, but also to adequately contextualize each piece. This gap in collection documentation restricts the public's ability to access and understand it, highlighting the importance of advanced methodologies for richer and more informative cataloging. This work addresses the application of advanced machine learning and computer vision technologies to automate the extraction and description of metadata in images of cultural objects, focusing on the Brazilian context. Using artificial intelligence models, the study develops methodologies to generate accurate and contextually relevant descriptions. Despite limitations related to the size of the database, the results indicate a significant potential for these technologies to improve the efficiency and accuracy of the cataloging process. Furthermore, it contributes to digital curation, proposing solutions that speed up the cataloging of collections and enrich the experience of accessing cultural heritage. The main contributions include the construction of a dataset of labeled images of Brazilian cultural heritage objects, specifically museums managed by Ibram, the availability of open source implementations and the creation of a descriptive template with information from the object. This template allows for a detailed description of objects, adding fields to identify the moment the description was created and a unique identifier, which represents a significant advance for the practical application of models in museum contexts. This work highlights the importance of the intersection between artificial intelligence and cultural curation, opening paths for the preservation and democratization of access to Brazilian cultural heritageAbertoMestradoEngenharia de ComputaçãoMestre em Engenharia Elétrica[s.n.]Costa, Paula Dornhofer Paro, 1978-Santanchè, AndréLima, Solange Ferraz deMartins, Dalton LopesUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASOliveira, Vagner Inácio de, 1985-20242024-01-31T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (101 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/18730OLIVEIRA, Vagner Inácio de. Machine learning and cultural heritage: automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform. 2024. 1 recurso online (101 p.) Dissertação (mestrado) - Universidade Estadual de Campinas (UNICAMP), Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/18730. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1392802Cover: https://repositorio.unicamp.br/capa/capa?codigo=1392802Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2024-07-02T10:11:57Zoai::1392802Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2024-07-02T10:11:57Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform
Aprendizado de máquina e patrimônio cultural : extração automática de metadados de acervos digitais de museus brasileiros na plataforma Tainacan
title Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform
spellingShingle Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform
Oliveira, Vagner Inácio de, 1985-
Patrimônio cultural
Aprendizado profundo
Análise de imagem
Cultural heritage
Deep learning
Image analysis
Computer vision
title_short Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform
title_full Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform
title_fullStr Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform
title_full_unstemmed Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform
title_sort Machine learning and cultural heritage : automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform
author Oliveira, Vagner Inácio de, 1985-
author_facet Oliveira, Vagner Inácio de, 1985-
author_role author
dc.contributor.none.fl_str_mv Costa, Paula Dornhofer Paro, 1978-
Santanchè, André
Lima, Solange Ferraz de
Martins, Dalton Lopes
Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Programa de Pós-Graduação em Engenharia Elétrica
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Oliveira, Vagner Inácio de, 1985-
dc.subject.por.fl_str_mv Patrimônio cultural
Aprendizado profundo
Análise de imagem
Cultural heritage
Deep learning
Image analysis
Computer vision
topic Patrimônio cultural
Aprendizado profundo
Análise de imagem
Cultural heritage
Deep learning
Image analysis
Computer vision
description Orientadores: Paula Dornhofer Paro Costa, Dalton Lopes Martins
publishDate 2024
dc.date.none.fl_str_mv 2024
2024-01-31T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/18730
OLIVEIRA, Vagner Inácio de. Machine learning and cultural heritage: automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform. 2024. 1 recurso online (101 p.) Dissertação (mestrado) - Universidade Estadual de Campinas (UNICAMP), Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/18730. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/18730
identifier_str_mv OLIVEIRA, Vagner Inácio de. Machine learning and cultural heritage: automatic metadata extraction from brazilian museums' digital collections on the Tainacan platform. 2024. 1 recurso online (101 p.) Dissertação (mestrado) - Universidade Estadual de Campinas (UNICAMP), Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/18730. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1392802
Cover: https://repositorio.unicamp.br/capa/capa?codigo=1392802
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (101 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189198992769024