Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR

Detalhes bibliográficos
Autor(a) principal: Melo, Jonas Ferrigolo
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/210671
Resumo: A presente pesquisa investiga quais são as possibilidades de arquivamento de websites do Governo Federal Brasileiro. O objetivo geral é demonstrar as possibilidades de arquivamento de websites do governo federal brasileiro a partir de um estudo de caso do domínio gov.br. Para o estudo aplicado, foram selecionados 23 websites governamentais, sendo 22 websites de ministérios e um website do governo central, o Portal Único www.gov.br. A pesquisa consistiu em verificar os recursos oferecidos por estes websites; arquivar os websites selecionados, com o uso de rastreador de páginas web automatizado Heritrix; reconstruir os websites arquivados com o uso de software automatizado WABAC; e comparar os recursos disponibilizados nas versões ao vivo e arquivadas dos websites selecionados. A pesquisa foi amparada pelas teorias do arquivamento da web, com ênfase nas abordagens de Bragg; Hanna (2013) em seu The Web Archiving Life Cycle Model, em Khan; Rahman (2019), considerando A Systematic Approach Towards Web Preservation; e no levantamento de informações acerca do arquivamento da web governamental. Como procedimentos metodológicos a pesquisa é classificada como de natureza aplicada, exploratória-descritiva, com pesquisa documental e aplicação do estudo de caso, sendo que a abordagem do problema se classifica como mista, considerando que os dados foram analisados quali e quantitativamente. Como considerações finais a pesquisa apresenta os resultados encontrados, permitindo visualizar as possibilidades de arquivamento dos websites do Governo Federal Brasileiro. Alguns recursos presentes nos websites não foram recuperados, especialmente, quando o formato do arquivo era diferente do textual e da imagem estática. Áudios, vídeos e recursos hospedados em servidores externos tenderam a não recuperação. Entende-se que se faz necessário o uso de ferramenta auxiliar para recuperação destes documentos não textuais, além de outros estudos empíricos para compreender as necessidades e melhores ferramentas para a recuperação destes documentos. A recuperação foi considerada satisfatória quando os resultados mostram que a maioria dos websites arquivados apresentam seus conteúdos de forma integral, ainda que alguns não estejam formatados visualmente, tal como o website ao vivo. Medidas para garantia de qualidade foram atribuídas e a permanência dos recursos dos websites após seu arquivamento são balizadores para definir a qualidade de uma coleta. É apresentado um mapa mental com informações que poderão ser úteis para quem deseja realizar o arquivamento da web no Brasil. O arquivamento da web é uma forma de preservar e manter as evidências dos serviços e fazeres do Governo Federal Brasileiro, para tornar acessível para futuros fins de pesquisa e, também, como registros da evolução das ações governamentais. Conclui-se que os websites do Governo Federal Brasileiro são arquiváveis sem perda de informações relevantes e que o país carece de uma política pública para sistematizar o arquivamento dos websites governamentais.
id URGS_aae9803dc515cdc413cadd8b403f5192
oai_identifier_str oai:www.lume.ufrgs.br:10183/210671
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Melo, Jonas FerrigoloRockembach, Moisés2020-06-26T03:32:58Z2020http://hdl.handle.net/10183/210671001115375A presente pesquisa investiga quais são as possibilidades de arquivamento de websites do Governo Federal Brasileiro. O objetivo geral é demonstrar as possibilidades de arquivamento de websites do governo federal brasileiro a partir de um estudo de caso do domínio gov.br. Para o estudo aplicado, foram selecionados 23 websites governamentais, sendo 22 websites de ministérios e um website do governo central, o Portal Único www.gov.br. A pesquisa consistiu em verificar os recursos oferecidos por estes websites; arquivar os websites selecionados, com o uso de rastreador de páginas web automatizado Heritrix; reconstruir os websites arquivados com o uso de software automatizado WABAC; e comparar os recursos disponibilizados nas versões ao vivo e arquivadas dos websites selecionados. A pesquisa foi amparada pelas teorias do arquivamento da web, com ênfase nas abordagens de Bragg; Hanna (2013) em seu The Web Archiving Life Cycle Model, em Khan; Rahman (2019), considerando A Systematic Approach Towards Web Preservation; e no levantamento de informações acerca do arquivamento da web governamental. Como procedimentos metodológicos a pesquisa é classificada como de natureza aplicada, exploratória-descritiva, com pesquisa documental e aplicação do estudo de caso, sendo que a abordagem do problema se classifica como mista, considerando que os dados foram analisados quali e quantitativamente. Como considerações finais a pesquisa apresenta os resultados encontrados, permitindo visualizar as possibilidades de arquivamento dos websites do Governo Federal Brasileiro. Alguns recursos presentes nos websites não foram recuperados, especialmente, quando o formato do arquivo era diferente do textual e da imagem estática. Áudios, vídeos e recursos hospedados em servidores externos tenderam a não recuperação. Entende-se que se faz necessário o uso de ferramenta auxiliar para recuperação destes documentos não textuais, além de outros estudos empíricos para compreender as necessidades e melhores ferramentas para a recuperação destes documentos. A recuperação foi considerada satisfatória quando os resultados mostram que a maioria dos websites arquivados apresentam seus conteúdos de forma integral, ainda que alguns não estejam formatados visualmente, tal como o website ao vivo. Medidas para garantia de qualidade foram atribuídas e a permanência dos recursos dos websites após seu arquivamento são balizadores para definir a qualidade de uma coleta. É apresentado um mapa mental com informações que poderão ser úteis para quem deseja realizar o arquivamento da web no Brasil. O arquivamento da web é uma forma de preservar e manter as evidências dos serviços e fazeres do Governo Federal Brasileiro, para tornar acessível para futuros fins de pesquisa e, também, como registros da evolução das ações governamentais. Conclui-se que os websites do Governo Federal Brasileiro são arquiváveis sem perda de informações relevantes e que o país carece de uma política pública para sistematizar o arquivamento dos websites governamentais.This research investigates what are the possibilities for archiving websites of the Brazilian Federal Government. The general objective is to demonstrate the possibilities of archiving Brazilian Federal Government websites from a case study of the domain gov.br. For the applied study, 23 government websites were selected, being that 22 ministry websites and one central government website, Portal Único www.gov.br. The research consisted of checking the resources offered by these websites; archive the selected websites, using the Heritrix web page crawler; rebuild archived websites using the software WABAC; and compare the resources available in the live and archived versions of selected websites. The research was supported by theories of web archiving, with an emphasis on approaches of Bragg; Hanna (2013) The Web Archiving Life Cycle Model, and Khan; Rahman (2019), considering A Systematic Approach Towards Web Preservation; and gathering information about archiving the government web. As methodological procedures the research is classified as applied, exploratory-descriptive, with documentary research and application of the case study, and the problem approach is classified as mixed, considering that the data were analyzed qualitatively and quantitatively. As final considerations the research presents the results found, allowing to visualize the possibilities of archiving the websites of the Brazilian Federal Government. Some resources present on the websites were not recovered, especially when the file format was different from the textual and static image. Audios, videos and resources hosted on external servers tended not to recover. It is understood that it is necessary to use an auxiliary tool to recover these non-text documents, in addition to other empirical studies to understand the needs and better tools for the recovery of these documents. The recovery was considered satisfactory when the results show that most of the archived websites present their contents in full, although some are not visually formatted, such as the live version. Quality assurance measures have been assigned and the permanence of the resources of the websites after their archiving are guidelines to define the quality of a collection. A mind map is presented with information that may be useful for those who wish to archive the web in Brazil. Archiving the web is a way to preserve and maintain evidence of the services and actions of the Brazilian Federal Government, to make it accessible for future research purposes and also as records of the evolution of government actions. It is concluded that the websites of the Brazilian Federal Government are archivable without loss of relevant information and that the country lacks a public policy to systematize the archiving of government websites.application/pdfporSites institucionaisPreservação digitalGestão de documentosWeb archivingGovernmental webDigital preservationArquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BRinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulFaculdade de Biblioteconomia e ComunicaçãoPrograma de Pós-Graduação em ComunicaçãoPorto Alegre, BR-RS2020mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001115375.pdf.txt001115375.pdf.txtExtracted Texttext/plain237662http://www.lume.ufrgs.br/bitstream/10183/210671/2/001115375.pdf.txt8cc07a956a7b790d679c3fb121bf71a5MD52ORIGINAL001115375.pdfTexto completoapplication/pdf3369399http://www.lume.ufrgs.br/bitstream/10183/210671/1/001115375.pdf35b7da9976740b0af38dec78a044e83aMD5110183/2106712022-02-22 05:07:10.624934oai:www.lume.ufrgs.br:10183/210671Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-02-22T08:07:10Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR
title Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR
spellingShingle Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR
Melo, Jonas Ferrigolo
Sites institucionais
Preservação digital
Gestão de documentos
Web archiving
Governmental web
Digital preservation
title_short Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR
title_full Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR
title_fullStr Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR
title_full_unstemmed Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR
title_sort Arquivamento dos websites do governo federal brasileiro: preservação do domínio GOV.BR
author Melo, Jonas Ferrigolo
author_facet Melo, Jonas Ferrigolo
author_role author
dc.contributor.author.fl_str_mv Melo, Jonas Ferrigolo
dc.contributor.advisor1.fl_str_mv Rockembach, Moisés
contributor_str_mv Rockembach, Moisés
dc.subject.por.fl_str_mv Sites institucionais
Preservação digital
Gestão de documentos
topic Sites institucionais
Preservação digital
Gestão de documentos
Web archiving
Governmental web
Digital preservation
dc.subject.eng.fl_str_mv Web archiving
Governmental web
Digital preservation
description A presente pesquisa investiga quais são as possibilidades de arquivamento de websites do Governo Federal Brasileiro. O objetivo geral é demonstrar as possibilidades de arquivamento de websites do governo federal brasileiro a partir de um estudo de caso do domínio gov.br. Para o estudo aplicado, foram selecionados 23 websites governamentais, sendo 22 websites de ministérios e um website do governo central, o Portal Único www.gov.br. A pesquisa consistiu em verificar os recursos oferecidos por estes websites; arquivar os websites selecionados, com o uso de rastreador de páginas web automatizado Heritrix; reconstruir os websites arquivados com o uso de software automatizado WABAC; e comparar os recursos disponibilizados nas versões ao vivo e arquivadas dos websites selecionados. A pesquisa foi amparada pelas teorias do arquivamento da web, com ênfase nas abordagens de Bragg; Hanna (2013) em seu The Web Archiving Life Cycle Model, em Khan; Rahman (2019), considerando A Systematic Approach Towards Web Preservation; e no levantamento de informações acerca do arquivamento da web governamental. Como procedimentos metodológicos a pesquisa é classificada como de natureza aplicada, exploratória-descritiva, com pesquisa documental e aplicação do estudo de caso, sendo que a abordagem do problema se classifica como mista, considerando que os dados foram analisados quali e quantitativamente. Como considerações finais a pesquisa apresenta os resultados encontrados, permitindo visualizar as possibilidades de arquivamento dos websites do Governo Federal Brasileiro. Alguns recursos presentes nos websites não foram recuperados, especialmente, quando o formato do arquivo era diferente do textual e da imagem estática. Áudios, vídeos e recursos hospedados em servidores externos tenderam a não recuperação. Entende-se que se faz necessário o uso de ferramenta auxiliar para recuperação destes documentos não textuais, além de outros estudos empíricos para compreender as necessidades e melhores ferramentas para a recuperação destes documentos. A recuperação foi considerada satisfatória quando os resultados mostram que a maioria dos websites arquivados apresentam seus conteúdos de forma integral, ainda que alguns não estejam formatados visualmente, tal como o website ao vivo. Medidas para garantia de qualidade foram atribuídas e a permanência dos recursos dos websites após seu arquivamento são balizadores para definir a qualidade de uma coleta. É apresentado um mapa mental com informações que poderão ser úteis para quem deseja realizar o arquivamento da web no Brasil. O arquivamento da web é uma forma de preservar e manter as evidências dos serviços e fazeres do Governo Federal Brasileiro, para tornar acessível para futuros fins de pesquisa e, também, como registros da evolução das ações governamentais. Conclui-se que os websites do Governo Federal Brasileiro são arquiváveis sem perda de informações relevantes e que o país carece de uma política pública para sistematizar o arquivamento dos websites governamentais.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-06-26T03:32:58Z
dc.date.issued.fl_str_mv 2020
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/210671
dc.identifier.nrb.pt_BR.fl_str_mv 001115375
url http://hdl.handle.net/10183/210671
identifier_str_mv 001115375
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/210671/2/001115375.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/210671/1/001115375.pdf
bitstream.checksum.fl_str_mv 8cc07a956a7b790d679c3fb121bf71a5
35b7da9976740b0af38dec78a044e83a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309165170622464