Identificação de critérios de seleção de conteúdos para o arquivamento da Web

Detalhes bibliográficos
Autor(a) principal: Formenton, Danilo
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/18426
Resumo: With the significant increase in production, diffusion and consumption of digital content in the Web environment, actions for the recovery, preservation and communication of data and information, of scientific, cultural and historical value produced in websites, social media and other Web-based content, are being created and studied in face of the ephemerality of the Internet that imposes rapid changes or even permanent losses to informational resources. Digital preservation and archiving of Web-based content is a recent theme in Brazil, specifically discussed in Information Science and, in general, not contemplated in the field of Science, Technology and Society (STS), being necessary the interdisciplinary transit with Information Science. In this context, we aim to verify how criteria for selecting Web content in the context of digital preservation and Web archiving have been discussed by Information Science and related areas (Archivology, Librarianship and Museology), pointing out how these criteria could meet the demands for structuring institutional Web archives in a more adequate way for the long-term preservation of digital information. As methodology, an exploratory study was carried out, based on bibliographic and documentary research with a narrative literature review concerning Web archiving in the scope of digital preservation. Content analysis was applied to Web content selection criteria and policies identified in the literature for digital preservation and long-term archiving purposes. As a result, a theoretical, technical and systematized framework of selection criteria applicable to Web archiving and digital preservation is presented, based on the surveyed scientific literature and on policies from various Web archiving initiatives around the world, such as criteria for "old" and "current" sites, geographic and linguistic criteria, subject-related criteria, criteria based on Web archiving uses and its users or experts, or format-related criteria, and, simultaneously, that may be relevant for modeling institutional Web archive collections. It was found that the imperfection of the Web archiving process and the incompleteness of its products, that is, the Web archives, in terms of the completeness of the archived sites, stems not only from technical, temporal, budgetary or legal limits, but also from limits tied to selection decisions. The selection decisions adopted in Web archiving policies bring some degree of subjectivity and deliberation, which can be avoided by explicitly justifying the criteria in a selection policy, making the archiving and its final product (collections) coherent. Furthermore, within the development of a Web archiving selection policy, it was possible to verify that in the scopes of the selection methods adopted in the creation of Web collections, in the scope, coverage of the archiving and the target (extent) of the collection itself, in the definition of the type and means of access of the Web archive, and in the definition of the expected uses of the Web archive and the intended users, different criteria for the selection of contents agreed upon in the policy are delineated.
id SCAR_beea3f02ef8371c973a7743eecc5cfbc
oai_identifier_str oai:repositorio.ufscar.br:ufscar/18426
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Formenton, DaniloGracioso, Luciana de Souzahttp://lattes.cnpq.br/4898201916360294http://lattes.cnpq.br/0625069342441295https://orcid.org/0000-0001-6531-429513b03841-95b7-4a4e-94d7-df6e1427f0272023-08-21T16:58:16Z2023-08-21T16:58:16Z2023-06-29FORMENTON, Danilo. Identificação de critérios de seleção de conteúdos para o arquivamento da Web. 2023. Tese (Doutorado em Ciência, Tecnologia e Sociedade) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18426.https://repositorio.ufscar.br/handle/ufscar/18426With the significant increase in production, diffusion and consumption of digital content in the Web environment, actions for the recovery, preservation and communication of data and information, of scientific, cultural and historical value produced in websites, social media and other Web-based content, are being created and studied in face of the ephemerality of the Internet that imposes rapid changes or even permanent losses to informational resources. Digital preservation and archiving of Web-based content is a recent theme in Brazil, specifically discussed in Information Science and, in general, not contemplated in the field of Science, Technology and Society (STS), being necessary the interdisciplinary transit with Information Science. In this context, we aim to verify how criteria for selecting Web content in the context of digital preservation and Web archiving have been discussed by Information Science and related areas (Archivology, Librarianship and Museology), pointing out how these criteria could meet the demands for structuring institutional Web archives in a more adequate way for the long-term preservation of digital information. As methodology, an exploratory study was carried out, based on bibliographic and documentary research with a narrative literature review concerning Web archiving in the scope of digital preservation. Content analysis was applied to Web content selection criteria and policies identified in the literature for digital preservation and long-term archiving purposes. As a result, a theoretical, technical and systematized framework of selection criteria applicable to Web archiving and digital preservation is presented, based on the surveyed scientific literature and on policies from various Web archiving initiatives around the world, such as criteria for "old" and "current" sites, geographic and linguistic criteria, subject-related criteria, criteria based on Web archiving uses and its users or experts, or format-related criteria, and, simultaneously, that may be relevant for modeling institutional Web archive collections. It was found that the imperfection of the Web archiving process and the incompleteness of its products, that is, the Web archives, in terms of the completeness of the archived sites, stems not only from technical, temporal, budgetary or legal limits, but also from limits tied to selection decisions. The selection decisions adopted in Web archiving policies bring some degree of subjectivity and deliberation, which can be avoided by explicitly justifying the criteria in a selection policy, making the archiving and its final product (collections) coherent. Furthermore, within the development of a Web archiving selection policy, it was possible to verify that in the scopes of the selection methods adopted in the creation of Web collections, in the scope, coverage of the archiving and the target (extent) of the collection itself, in the definition of the type and means of access of the Web archive, and in the definition of the expected uses of the Web archive and the intended users, different criteria for the selection of contents agreed upon in the policy are delineated.Com o significativo aumento na produção, difusão e consumo de conteúdos digitais no ambiente da Web, ações de recuperação, preservação e comunicação de dados e informações, de valor científico, cultural e histórico produzidos em websites, mídias sociais e em outros conteúdos baseados na Web, estão sendo criadas e estudadas defronte à efemeridade da Internet que impõe rápidas alterações ou, mesmo, perdas permanentes aos recursos informacionais. A preservação digital e arquivamento de conteúdos publicados na Web é uma temática recente no Brasil, especificamente discutida na Ciência da Informação e, de modo geral, não contemplada no campo da Ciência, Tecnologia e Sociedade (CTS) sendo necessário o trânsito interdisciplinar com a Ciência da Informação. Nesse contexto, objetiva-se verificar como critérios de seleção de conteúdos da Web no âmbito da preservação digital e do arquivamento da Web têm sido discutidos pela Ciência da Informação e áreas afins (Arquivologia, Biblioteconomia e Museologia), apontando como estes critérios poderiam atender às demandas de estruturação de arquivos da Web institucionais de maneira mais adequada para a preservação a longo prazo de informações digitais. Como metodologia, destaca-se a realização de um estudo exploratório, pautado em pesquisa bibliográfica e documental com revisão de literatura narrativa referente ao arquivamento da Web no escopo da preservação digital. Aplicou-se a análise de conteúdo dos critérios e políticas de seleção de conteúdos da Web identificados na literatura para fins de preservação digital e arquivamento de longo prazo. Como resultado apresenta-se um quadro referencial teórico, técnico e sistematizado de critérios de seleção aplicáveis à preservação digital e arquivamento da Web com base na literatura científica levantada e em políticas de várias iniciativas de arquivos da Web no mundo, como critérios para sites “antigos” e atuais, critérios geográficos e linguísticos, critérios relativos ao assunto, critérios pautados nos usos do arquivo da Web e em seus usuários ou especialistas, ou critérios relativos ao formato e, simultaneamente, que podem ser relevantes para a modelagem das coleções de arquivos da Web institucionais. Constatou-se que a imperfeição do processo de arquivamento da Web e a incompletude dos seus produtos, isto é, dos arquivos da Web, em termos de integralidade dos sites arquivados, decorre não apenas de limites técnicos, temporais, orçamentários ou legais, mas também de limites atrelados a tomada de decisões de seleção. As decisões de seleção adotadas nas políticas de arquivos da Web trazem algum grau de subjetividade e deliberação, o que pode ser evitado com a justificação explícita dos critérios em uma política de seleção, tornando o arquivamento e o seu produto final (coleções) coerentes. Além disto, dentro do desenvolvimento de uma política de seleção de arquivamento da Web, foi possível verificar que nos escopos dos métodos de seleção adotados na criação de coleções Web, no escopo, cobertura do arquivamento e o alvo (extensão) da coleção em si, na definição do tipo e dos meios de acesso do arquivo da Web, e na definição dos usos esperados do arquivo da Web e dos usuários pretendidos, delineiam-se diferentes critérios para a seleção de conteúdos acordados na política.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Código de Financiamento 001porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência, Tecnologia e Sociedade - PPGCTSUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessArquivamento da WebPreservação digitalGestão de conteúdos na WebCritérios de seleçãoDesenvolvimento de coleçõesWeb archivingDigital preservationWeb content managementSelection criteriaCollection managementCIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIACIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAOCIENCIAS SOCIAIS APLICADASIdentificação de critérios de seleção de conteúdos para o arquivamento da WebIdentification of content selection criteria for Web archivingIdentificación de criterios de selección de contenido para archivo Webinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis60060089d8d962-9d73-459b-a352-f9015439def4reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTese CTS (Defesa) - Danilo Formenton (com ficha e folha de aprov).pdfTese CTS (Defesa) - Danilo Formenton (com ficha e folha de aprov).pdfTese principalapplication/pdf14210542https://repositorio.ufscar.br/bitstream/ufscar/18426/2/Tese%20CTS%20%28Defesa%29%20-%20Danilo%20Formenton%20%28com%20ficha%20e%20folha%20de%20aprov%29.pdf8b1d115fb87f90b4f1d50c434239bbdaMD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://repositorio.ufscar.br/bitstream/ufscar/18426/4/license_rdff337d95da1fce0a22c77480e5e9a7aecMD54TEXTTese CTS (Defesa) - Danilo Formenton (com ficha e folha de aprov).pdf.txtTese CTS (Defesa) - Danilo Formenton (com ficha e folha de aprov).pdf.txtExtracted texttext/plain921557https://repositorio.ufscar.br/bitstream/ufscar/18426/5/Tese%20CTS%20%28Defesa%29%20-%20Danilo%20Formenton%20%28com%20ficha%20e%20folha%20de%20aprov%29.pdf.txtde9a10881cac866bf929724581f6298aMD55ufscar/184262024-05-14 18:29:49.94oai:repositorio.ufscar.br:ufscar/18426Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222024-05-14T18:29:49Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Identificação de critérios de seleção de conteúdos para o arquivamento da Web
dc.title.alternative.eng.fl_str_mv Identification of content selection criteria for Web archiving
dc.title.alternative.spa.fl_str_mv Identificación de criterios de selección de contenido para archivo Web
title Identificação de critérios de seleção de conteúdos para o arquivamento da Web
spellingShingle Identificação de critérios de seleção de conteúdos para o arquivamento da Web
Formenton, Danilo
Arquivamento da Web
Preservação digital
Gestão de conteúdos na Web
Critérios de seleção
Desenvolvimento de coleções
Web archiving
Digital preservation
Web content management
Selection criteria
Collection management
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
CIENCIAS SOCIAIS APLICADAS
title_short Identificação de critérios de seleção de conteúdos para o arquivamento da Web
title_full Identificação de critérios de seleção de conteúdos para o arquivamento da Web
title_fullStr Identificação de critérios de seleção de conteúdos para o arquivamento da Web
title_full_unstemmed Identificação de critérios de seleção de conteúdos para o arquivamento da Web
title_sort Identificação de critérios de seleção de conteúdos para o arquivamento da Web
author Formenton, Danilo
author_facet Formenton, Danilo
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/0625069342441295
dc.contributor.authororcid.por.fl_str_mv https://orcid.org/0000-0001-6531-4295
dc.contributor.author.fl_str_mv Formenton, Danilo
dc.contributor.advisor1.fl_str_mv Gracioso, Luciana de Souza
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4898201916360294
dc.contributor.authorID.fl_str_mv 13b03841-95b7-4a4e-94d7-df6e1427f027
contributor_str_mv Gracioso, Luciana de Souza
dc.subject.por.fl_str_mv Arquivamento da Web
Preservação digital
Gestão de conteúdos na Web
Critérios de seleção
Desenvolvimento de coleções
topic Arquivamento da Web
Preservação digital
Gestão de conteúdos na Web
Critérios de seleção
Desenvolvimento de coleções
Web archiving
Digital preservation
Web content management
Selection criteria
Collection management
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
CIENCIAS SOCIAIS APLICADAS
dc.subject.eng.fl_str_mv Web archiving
Digital preservation
Web content management
Selection criteria
Collection management
dc.subject.cnpq.fl_str_mv CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
CIENCIAS SOCIAIS APLICADAS
description With the significant increase in production, diffusion and consumption of digital content in the Web environment, actions for the recovery, preservation and communication of data and information, of scientific, cultural and historical value produced in websites, social media and other Web-based content, are being created and studied in face of the ephemerality of the Internet that imposes rapid changes or even permanent losses to informational resources. Digital preservation and archiving of Web-based content is a recent theme in Brazil, specifically discussed in Information Science and, in general, not contemplated in the field of Science, Technology and Society (STS), being necessary the interdisciplinary transit with Information Science. In this context, we aim to verify how criteria for selecting Web content in the context of digital preservation and Web archiving have been discussed by Information Science and related areas (Archivology, Librarianship and Museology), pointing out how these criteria could meet the demands for structuring institutional Web archives in a more adequate way for the long-term preservation of digital information. As methodology, an exploratory study was carried out, based on bibliographic and documentary research with a narrative literature review concerning Web archiving in the scope of digital preservation. Content analysis was applied to Web content selection criteria and policies identified in the literature for digital preservation and long-term archiving purposes. As a result, a theoretical, technical and systematized framework of selection criteria applicable to Web archiving and digital preservation is presented, based on the surveyed scientific literature and on policies from various Web archiving initiatives around the world, such as criteria for "old" and "current" sites, geographic and linguistic criteria, subject-related criteria, criteria based on Web archiving uses and its users or experts, or format-related criteria, and, simultaneously, that may be relevant for modeling institutional Web archive collections. It was found that the imperfection of the Web archiving process and the incompleteness of its products, that is, the Web archives, in terms of the completeness of the archived sites, stems not only from technical, temporal, budgetary or legal limits, but also from limits tied to selection decisions. The selection decisions adopted in Web archiving policies bring some degree of subjectivity and deliberation, which can be avoided by explicitly justifying the criteria in a selection policy, making the archiving and its final product (collections) coherent. Furthermore, within the development of a Web archiving selection policy, it was possible to verify that in the scopes of the selection methods adopted in the creation of Web collections, in the scope, coverage of the archiving and the target (extent) of the collection itself, in the definition of the type and means of access of the Web archive, and in the definition of the expected uses of the Web archive and the intended users, different criteria for the selection of contents agreed upon in the policy are delineated.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-08-21T16:58:16Z
dc.date.available.fl_str_mv 2023-08-21T16:58:16Z
dc.date.issued.fl_str_mv 2023-06-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FORMENTON, Danilo. Identificação de critérios de seleção de conteúdos para o arquivamento da Web. 2023. Tese (Doutorado em Ciência, Tecnologia e Sociedade) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18426.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/18426
identifier_str_mv FORMENTON, Danilo. Identificação de critérios de seleção de conteúdos para o arquivamento da Web. 2023. Tese (Doutorado em Ciência, Tecnologia e Sociedade) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18426.
url https://repositorio.ufscar.br/handle/ufscar/18426
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv 89d8d962-9d73-459b-a352-f9015439def4
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência, Tecnologia e Sociedade - PPGCTS
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/18426/2/Tese%20CTS%20%28Defesa%29%20-%20Danilo%20Formenton%20%28com%20ficha%20e%20folha%20de%20aprov%29.pdf
https://repositorio.ufscar.br/bitstream/ufscar/18426/4/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/18426/5/Tese%20CTS%20%28Defesa%29%20-%20Danilo%20Formenton%20%28com%20ficha%20e%20folha%20de%20aprov%29.pdf.txt
bitstream.checksum.fl_str_mv 8b1d115fb87f90b4f1d50c434239bbda
f337d95da1fce0a22c77480e5e9a7aec
de9a10881cac866bf929724581f6298a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136425811935232