Identificação de critérios de seleção de conteúdos para o arquivamento da Web
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/18426 |
Resumo: | With the significant increase in production, diffusion and consumption of digital content in the Web environment, actions for the recovery, preservation and communication of data and information, of scientific, cultural and historical value produced in websites, social media and other Web-based content, are being created and studied in face of the ephemerality of the Internet that imposes rapid changes or even permanent losses to informational resources. Digital preservation and archiving of Web-based content is a recent theme in Brazil, specifically discussed in Information Science and, in general, not contemplated in the field of Science, Technology and Society (STS), being necessary the interdisciplinary transit with Information Science. In this context, we aim to verify how criteria for selecting Web content in the context of digital preservation and Web archiving have been discussed by Information Science and related areas (Archivology, Librarianship and Museology), pointing out how these criteria could meet the demands for structuring institutional Web archives in a more adequate way for the long-term preservation of digital information. As methodology, an exploratory study was carried out, based on bibliographic and documentary research with a narrative literature review concerning Web archiving in the scope of digital preservation. Content analysis was applied to Web content selection criteria and policies identified in the literature for digital preservation and long-term archiving purposes. As a result, a theoretical, technical and systematized framework of selection criteria applicable to Web archiving and digital preservation is presented, based on the surveyed scientific literature and on policies from various Web archiving initiatives around the world, such as criteria for "old" and "current" sites, geographic and linguistic criteria, subject-related criteria, criteria based on Web archiving uses and its users or experts, or format-related criteria, and, simultaneously, that may be relevant for modeling institutional Web archive collections. It was found that the imperfection of the Web archiving process and the incompleteness of its products, that is, the Web archives, in terms of the completeness of the archived sites, stems not only from technical, temporal, budgetary or legal limits, but also from limits tied to selection decisions. The selection decisions adopted in Web archiving policies bring some degree of subjectivity and deliberation, which can be avoided by explicitly justifying the criteria in a selection policy, making the archiving and its final product (collections) coherent. Furthermore, within the development of a Web archiving selection policy, it was possible to verify that in the scopes of the selection methods adopted in the creation of Web collections, in the scope, coverage of the archiving and the target (extent) of the collection itself, in the definition of the type and means of access of the Web archive, and in the definition of the expected uses of the Web archive and the intended users, different criteria for the selection of contents agreed upon in the policy are delineated. |
id |
SCAR_beea3f02ef8371c973a7743eecc5cfbc |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/18426 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Formenton, DaniloGracioso, Luciana de Souzahttp://lattes.cnpq.br/4898201916360294http://lattes.cnpq.br/0625069342441295https://orcid.org/0000-0001-6531-429513b03841-95b7-4a4e-94d7-df6e1427f0272023-08-21T16:58:16Z2023-08-21T16:58:16Z2023-06-29FORMENTON, Danilo. Identificação de critérios de seleção de conteúdos para o arquivamento da Web. 2023. Tese (Doutorado em Ciência, Tecnologia e Sociedade) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18426.https://repositorio.ufscar.br/handle/ufscar/18426With the significant increase in production, diffusion and consumption of digital content in the Web environment, actions for the recovery, preservation and communication of data and information, of scientific, cultural and historical value produced in websites, social media and other Web-based content, are being created and studied in face of the ephemerality of the Internet that imposes rapid changes or even permanent losses to informational resources. Digital preservation and archiving of Web-based content is a recent theme in Brazil, specifically discussed in Information Science and, in general, not contemplated in the field of Science, Technology and Society (STS), being necessary the interdisciplinary transit with Information Science. In this context, we aim to verify how criteria for selecting Web content in the context of digital preservation and Web archiving have been discussed by Information Science and related areas (Archivology, Librarianship and Museology), pointing out how these criteria could meet the demands for structuring institutional Web archives in a more adequate way for the long-term preservation of digital information. As methodology, an exploratory study was carried out, based on bibliographic and documentary research with a narrative literature review concerning Web archiving in the scope of digital preservation. Content analysis was applied to Web content selection criteria and policies identified in the literature for digital preservation and long-term archiving purposes. As a result, a theoretical, technical and systematized framework of selection criteria applicable to Web archiving and digital preservation is presented, based on the surveyed scientific literature and on policies from various Web archiving initiatives around the world, such as criteria for "old" and "current" sites, geographic and linguistic criteria, subject-related criteria, criteria based on Web archiving uses and its users or experts, or format-related criteria, and, simultaneously, that may be relevant for modeling institutional Web archive collections. It was found that the imperfection of the Web archiving process and the incompleteness of its products, that is, the Web archives, in terms of the completeness of the archived sites, stems not only from technical, temporal, budgetary or legal limits, but also from limits tied to selection decisions. The selection decisions adopted in Web archiving policies bring some degree of subjectivity and deliberation, which can be avoided by explicitly justifying the criteria in a selection policy, making the archiving and its final product (collections) coherent. Furthermore, within the development of a Web archiving selection policy, it was possible to verify that in the scopes of the selection methods adopted in the creation of Web collections, in the scope, coverage of the archiving and the target (extent) of the collection itself, in the definition of the type and means of access of the Web archive, and in the definition of the expected uses of the Web archive and the intended users, different criteria for the selection of contents agreed upon in the policy are delineated.Com o significativo aumento na produção, difusão e consumo de conteúdos digitais no ambiente da Web, ações de recuperação, preservação e comunicação de dados e informações, de valor científico, cultural e histórico produzidos em websites, mídias sociais e em outros conteúdos baseados na Web, estão sendo criadas e estudadas defronte à efemeridade da Internet que impõe rápidas alterações ou, mesmo, perdas permanentes aos recursos informacionais. A preservação digital e arquivamento de conteúdos publicados na Web é uma temática recente no Brasil, especificamente discutida na Ciência da Informação e, de modo geral, não contemplada no campo da Ciência, Tecnologia e Sociedade (CTS) sendo necessário o trânsito interdisciplinar com a Ciência da Informação. Nesse contexto, objetiva-se verificar como critérios de seleção de conteúdos da Web no âmbito da preservação digital e do arquivamento da Web têm sido discutidos pela Ciência da Informação e áreas afins (Arquivologia, Biblioteconomia e Museologia), apontando como estes critérios poderiam atender às demandas de estruturação de arquivos da Web institucionais de maneira mais adequada para a preservação a longo prazo de informações digitais. Como metodologia, destaca-se a realização de um estudo exploratório, pautado em pesquisa bibliográfica e documental com revisão de literatura narrativa referente ao arquivamento da Web no escopo da preservação digital. Aplicou-se a análise de conteúdo dos critérios e políticas de seleção de conteúdos da Web identificados na literatura para fins de preservação digital e arquivamento de longo prazo. Como resultado apresenta-se um quadro referencial teórico, técnico e sistematizado de critérios de seleção aplicáveis à preservação digital e arquivamento da Web com base na literatura científica levantada e em políticas de várias iniciativas de arquivos da Web no mundo, como critérios para sites “antigos” e atuais, critérios geográficos e linguísticos, critérios relativos ao assunto, critérios pautados nos usos do arquivo da Web e em seus usuários ou especialistas, ou critérios relativos ao formato e, simultaneamente, que podem ser relevantes para a modelagem das coleções de arquivos da Web institucionais. Constatou-se que a imperfeição do processo de arquivamento da Web e a incompletude dos seus produtos, isto é, dos arquivos da Web, em termos de integralidade dos sites arquivados, decorre não apenas de limites técnicos, temporais, orçamentários ou legais, mas também de limites atrelados a tomada de decisões de seleção. As decisões de seleção adotadas nas políticas de arquivos da Web trazem algum grau de subjetividade e deliberação, o que pode ser evitado com a justificação explícita dos critérios em uma política de seleção, tornando o arquivamento e o seu produto final (coleções) coerentes. Além disto, dentro do desenvolvimento de uma política de seleção de arquivamento da Web, foi possível verificar que nos escopos dos métodos de seleção adotados na criação de coleções Web, no escopo, cobertura do arquivamento e o alvo (extensão) da coleção em si, na definição do tipo e dos meios de acesso do arquivo da Web, e na definição dos usos esperados do arquivo da Web e dos usuários pretendidos, delineiam-se diferentes critérios para a seleção de conteúdos acordados na política.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Código de Financiamento 001porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência, Tecnologia e Sociedade - PPGCTSUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessArquivamento da WebPreservação digitalGestão de conteúdos na WebCritérios de seleçãoDesenvolvimento de coleçõesWeb archivingDigital preservationWeb content managementSelection criteriaCollection managementCIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIACIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAOCIENCIAS SOCIAIS APLICADASIdentificação de critérios de seleção de conteúdos para o arquivamento da WebIdentification of content selection criteria for Web archivingIdentificación de criterios de selección de contenido para archivo Webinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis60060089d8d962-9d73-459b-a352-f9015439def4reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTese CTS (Defesa) - Danilo Formenton (com ficha e folha de aprov).pdfTese CTS (Defesa) - Danilo Formenton (com ficha e folha de aprov).pdfTese principalapplication/pdf14210542https://repositorio.ufscar.br/bitstream/ufscar/18426/2/Tese%20CTS%20%28Defesa%29%20-%20Danilo%20Formenton%20%28com%20ficha%20e%20folha%20de%20aprov%29.pdf8b1d115fb87f90b4f1d50c434239bbdaMD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://repositorio.ufscar.br/bitstream/ufscar/18426/4/license_rdff337d95da1fce0a22c77480e5e9a7aecMD54TEXTTese CTS (Defesa) - Danilo Formenton (com ficha e folha de aprov).pdf.txtTese CTS (Defesa) - Danilo Formenton (com ficha e folha de aprov).pdf.txtExtracted texttext/plain921557https://repositorio.ufscar.br/bitstream/ufscar/18426/5/Tese%20CTS%20%28Defesa%29%20-%20Danilo%20Formenton%20%28com%20ficha%20e%20folha%20de%20aprov%29.pdf.txtde9a10881cac866bf929724581f6298aMD55ufscar/184262024-05-14 18:29:49.94oai:repositorio.ufscar.br:ufscar/18426Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222024-05-14T18:29:49Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Identificação de critérios de seleção de conteúdos para o arquivamento da Web |
dc.title.alternative.eng.fl_str_mv |
Identification of content selection criteria for Web archiving |
dc.title.alternative.spa.fl_str_mv |
Identificación de criterios de selección de contenido para archivo Web |
title |
Identificação de critérios de seleção de conteúdos para o arquivamento da Web |
spellingShingle |
Identificação de critérios de seleção de conteúdos para o arquivamento da Web Formenton, Danilo Arquivamento da Web Preservação digital Gestão de conteúdos na Web Critérios de seleção Desenvolvimento de coleções Web archiving Digital preservation Web content management Selection criteria Collection management CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO CIENCIAS SOCIAIS APLICADAS |
title_short |
Identificação de critérios de seleção de conteúdos para o arquivamento da Web |
title_full |
Identificação de critérios de seleção de conteúdos para o arquivamento da Web |
title_fullStr |
Identificação de critérios de seleção de conteúdos para o arquivamento da Web |
title_full_unstemmed |
Identificação de critérios de seleção de conteúdos para o arquivamento da Web |
title_sort |
Identificação de critérios de seleção de conteúdos para o arquivamento da Web |
author |
Formenton, Danilo |
author_facet |
Formenton, Danilo |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/0625069342441295 |
dc.contributor.authororcid.por.fl_str_mv |
https://orcid.org/0000-0001-6531-4295 |
dc.contributor.author.fl_str_mv |
Formenton, Danilo |
dc.contributor.advisor1.fl_str_mv |
Gracioso, Luciana de Souza |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4898201916360294 |
dc.contributor.authorID.fl_str_mv |
13b03841-95b7-4a4e-94d7-df6e1427f027 |
contributor_str_mv |
Gracioso, Luciana de Souza |
dc.subject.por.fl_str_mv |
Arquivamento da Web Preservação digital Gestão de conteúdos na Web Critérios de seleção Desenvolvimento de coleções |
topic |
Arquivamento da Web Preservação digital Gestão de conteúdos na Web Critérios de seleção Desenvolvimento de coleções Web archiving Digital preservation Web content management Selection criteria Collection management CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO CIENCIAS SOCIAIS APLICADAS |
dc.subject.eng.fl_str_mv |
Web archiving Digital preservation Web content management Selection criteria Collection management |
dc.subject.cnpq.fl_str_mv |
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::BIBLIOTECONOMIA CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO CIENCIAS SOCIAIS APLICADAS |
description |
With the significant increase in production, diffusion and consumption of digital content in the Web environment, actions for the recovery, preservation and communication of data and information, of scientific, cultural and historical value produced in websites, social media and other Web-based content, are being created and studied in face of the ephemerality of the Internet that imposes rapid changes or even permanent losses to informational resources. Digital preservation and archiving of Web-based content is a recent theme in Brazil, specifically discussed in Information Science and, in general, not contemplated in the field of Science, Technology and Society (STS), being necessary the interdisciplinary transit with Information Science. In this context, we aim to verify how criteria for selecting Web content in the context of digital preservation and Web archiving have been discussed by Information Science and related areas (Archivology, Librarianship and Museology), pointing out how these criteria could meet the demands for structuring institutional Web archives in a more adequate way for the long-term preservation of digital information. As methodology, an exploratory study was carried out, based on bibliographic and documentary research with a narrative literature review concerning Web archiving in the scope of digital preservation. Content analysis was applied to Web content selection criteria and policies identified in the literature for digital preservation and long-term archiving purposes. As a result, a theoretical, technical and systematized framework of selection criteria applicable to Web archiving and digital preservation is presented, based on the surveyed scientific literature and on policies from various Web archiving initiatives around the world, such as criteria for "old" and "current" sites, geographic and linguistic criteria, subject-related criteria, criteria based on Web archiving uses and its users or experts, or format-related criteria, and, simultaneously, that may be relevant for modeling institutional Web archive collections. It was found that the imperfection of the Web archiving process and the incompleteness of its products, that is, the Web archives, in terms of the completeness of the archived sites, stems not only from technical, temporal, budgetary or legal limits, but also from limits tied to selection decisions. The selection decisions adopted in Web archiving policies bring some degree of subjectivity and deliberation, which can be avoided by explicitly justifying the criteria in a selection policy, making the archiving and its final product (collections) coherent. Furthermore, within the development of a Web archiving selection policy, it was possible to verify that in the scopes of the selection methods adopted in the creation of Web collections, in the scope, coverage of the archiving and the target (extent) of the collection itself, in the definition of the type and means of access of the Web archive, and in the definition of the expected uses of the Web archive and the intended users, different criteria for the selection of contents agreed upon in the policy are delineated. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-08-21T16:58:16Z |
dc.date.available.fl_str_mv |
2023-08-21T16:58:16Z |
dc.date.issued.fl_str_mv |
2023-06-29 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FORMENTON, Danilo. Identificação de critérios de seleção de conteúdos para o arquivamento da Web. 2023. Tese (Doutorado em Ciência, Tecnologia e Sociedade) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18426. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/18426 |
identifier_str_mv |
FORMENTON, Danilo. Identificação de critérios de seleção de conteúdos para o arquivamento da Web. 2023. Tese (Doutorado em Ciência, Tecnologia e Sociedade) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18426. |
url |
https://repositorio.ufscar.br/handle/ufscar/18426 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
89d8d962-9d73-459b-a352-f9015439def4 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência, Tecnologia e Sociedade - PPGCTS |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/18426/2/Tese%20CTS%20%28Defesa%29%20-%20Danilo%20Formenton%20%28com%20ficha%20e%20folha%20de%20aprov%29.pdf https://repositorio.ufscar.br/bitstream/ufscar/18426/4/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/18426/5/Tese%20CTS%20%28Defesa%29%20-%20Danilo%20Formenton%20%28com%20ficha%20e%20folha%20de%20aprov%29.pdf.txt |
bitstream.checksum.fl_str_mv |
8b1d115fb87f90b4f1d50c434239bbda f337d95da1fce0a22c77480e5e9a7aec de9a10881cac866bf929724581f6298a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136425811935232 |