Preservação da web através de replicação distribuída em larga escala
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/3997 |
Resumo: | Tese de mestrado, Engenharia Informática, Universidade de Lisboa, Faculdade de Ciências, 2008 |
id |
RCAP_c3f69b0041c6f015ffaffbdb87ffd729 |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/3997 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Preservação da web através de replicação distribuída em larga escalaArquivos da WebBibliotecas digitaisSistemas distribuídosFormato ARCPreservação digitalTeses de mestrado - 2008Tese de mestrado, Engenharia Informática, Universidade de Lisboa, Faculdade de Ciências, 2008A Web é a maior fonte de informação alguma vez construída. A tendência verificada nos últimos anos indica que a popularidade da Web vai continuar a aumentar no futuro, assim como a quantidade de informação que nela é exclusivamente publicada. No entanto, a informação publicada na Web está disponível durante um período de tempo muito curto, findo o qual, por regra se perde para sempre. Surge assim o interesse na criação de arquivos da Web que permitam preservar esta informação para gerações vindouras. Para preservarem a informação os arquivos da Web requerem sistemas com elevada capacidade de armazenamento. Tradicionalmente, o armazenamento da informação é feito de uma forma centralizada. Contudo, esta aproximação é susceptível a perda de informação, caso ocorram falhas no sistema de armazenamento central. O trabalho apresentado nesta tese enquadra-se no projecto de Arquivo da Web Portuguesa1, em curso na Fundação para a Computação Científica Nacional. Este trabalho tem como objectivo a criação de um sistema de replicação distribuído que permita tolerar falhas nos sistemas de armazenamento de arquivos da Web, através da replicação dos conteúdos arquivados por computadores espalhados pela Internet.The Web is the largest source of information ever built. The trend in recent years indicates that the popularity of the Web will continue to grow in the future, as well as the amount of information solely published on it. However, the information published on the Web is available for a very short period of time, after which, as a rule, is lost forever. This motivates the creation of web archives that allow the preservation of this information for future generations. To preserve the information, web archives require high storage capacity systems. The storage of information is usually performed in a centralized manner. However, this approach is susceptible to loss of information, if failures in the central storage system occur. The work presented in this thesis is within the scope of the Portuguese Web Archive, a project of the Foundation for National Scienti_c Computing. This work aims at creating a distributed replication system that allows to tolerate failures in the storage systems of web archives, through the replication of the archived contents over computers across the Internet.Veiga, Pedro, 1952-Gomes, Daniel Coelho, 1977-Repositório da Universidade de LisboaAndré, Ricardo Lopes Nogueira2011-09-06T12:10:05Z20082008-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/3997porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T15:44:44Zoai:repositorio.ul.pt:10451/3997Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:29:46.064256Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Preservação da web através de replicação distribuída em larga escala |
title |
Preservação da web através de replicação distribuída em larga escala |
spellingShingle |
Preservação da web através de replicação distribuída em larga escala André, Ricardo Lopes Nogueira Arquivos da Web Bibliotecas digitais Sistemas distribuídos Formato ARC Preservação digital Teses de mestrado - 2008 |
title_short |
Preservação da web através de replicação distribuída em larga escala |
title_full |
Preservação da web através de replicação distribuída em larga escala |
title_fullStr |
Preservação da web através de replicação distribuída em larga escala |
title_full_unstemmed |
Preservação da web através de replicação distribuída em larga escala |
title_sort |
Preservação da web através de replicação distribuída em larga escala |
author |
André, Ricardo Lopes Nogueira |
author_facet |
André, Ricardo Lopes Nogueira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Veiga, Pedro, 1952- Gomes, Daniel Coelho, 1977- Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
André, Ricardo Lopes Nogueira |
dc.subject.por.fl_str_mv |
Arquivos da Web Bibliotecas digitais Sistemas distribuídos Formato ARC Preservação digital Teses de mestrado - 2008 |
topic |
Arquivos da Web Bibliotecas digitais Sistemas distribuídos Formato ARC Preservação digital Teses de mestrado - 2008 |
description |
Tese de mestrado, Engenharia Informática, Universidade de Lisboa, Faculdade de Ciências, 2008 |
publishDate |
2008 |
dc.date.none.fl_str_mv |
2008 2008-01-01T00:00:00Z 2011-09-06T12:10:05Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/3997 |
url |
http://hdl.handle.net/10451/3997 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134182988840960 |