AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFT |
Texto Completo: | http://hdl.handle.net/11612/466 |
Resumo: | Reconciliação é o processo de prover uma visão consistente de dados provenientes de várias fontes de dados. Embora existam na literatura trabalhos voltados à proposta de soluções de reconciliação baseadas em colaboração assíncrona, o desafio de reconciliar dados quando vários usuários colaborativos trabalham de forma assíncrona sobre as mesmas co´pias locais de dados, compartilhando somente eventualmente as suas decisões de integração particulares, tem recebido menos atenção. Nesta tese de doutorado investiga-se esse desafio, por meio da proposta do modelo AcCORD (Asynchronous COllaborative data ReconcIliation moDel). AcCORD é um modelo colaborativo assíncrono para reconciliação de dados no qual as atualizações dos usuários são mantidas em um repositório de operações na forma de dados de procedência. Cada usuário tem o seu próprio repositório para armazenar a procedência e a sua própria cópia das fontes. Ou seja, quando inconsistências entre fontes importadas são detectadas, o usuário pode tomar decisões de integração para resolvê-las de maneira autônoma, e as atualizações que são executadas localmente são registradas em seu próprio repositório. As atualizações são compartilhadas entre colaboradores quando um usuário importa as operações dos repositórios dos demais usuários. Desde que diferentes usuários podem ter diferentes pontos de vista para resolver o mesmo conflito, seus repositórios podem estar inconsistentes. Assim, o modelo Ac- CORD também inclui a proposta de diferentes políticas de reconciliação multiusuário para resolver conflitos entre repositórios. Políticas distintas podem ser aplicadas por diferentes usuários para reconciliar as suas atualizações. Dependendo da política aplicada, a visão final das fontes importadas pode ser a mesma para todos os usuários, ou seja, um única visão global integrada, ou resultar em distintas visões locais para cada um deles. Adicionalmente, o modelo AcCORD também incorpora um método de propagação de decisões de integração, o qual tem como objetivo evitar que um usuário tome decisões inconsistentes a respeito de um mesmo conflito de dado presente em diferentes fontes, garantindo um processo de reconciliação multiusuário mais efetivo. O modelo AcCORD foi validado por meio de testes de desempenho que avaliaram as políticas propostas, e por entrevistas a usuários que avaliaram não somente as políticas propostas mas também a qualidade da reconciliação multiusuário. Os resultados obtidos demonstraram a eficiência e a eficácia do modelo proposto, além de sua flexibilidade para gerar uma visão integrada ou distintas visões locais. As entrevistas realizadas demonstraram diferentes percepções dos usuários quanto à qualidade do resultado provido pelo modelo AcCORD, incluindo aspectos relacionados à consistência, aceitabilidade, corretude, economia de tempo e satisfacão. |
id |
UFT_835ce1f2c152850853420bcec833ec0e |
---|---|
oai_identifier_str |
oai:repositorio.uft.edu.br:11612/466 |
network_acronym_str |
UFT |
network_name_str |
Repositório Institucional da UFT |
repository_id_str |
|
spelling |
Almeida, Dayse Silveira deCiferri, Cristina Dutra de Aguiar2017-08-15T13:37:28Z2017-08-15T13:37:28Z2016-04-28ALMEIDA, Dayse Silveira de. AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados.2016.135f. Tese (Doutorado em Ciências da Computação e Matemática Computacional) – Universidade de São Paulo, Programa de Pós-Graduação em Ciências da Computação e Matemática Computacional, São Paulo, 2016.http://hdl.handle.net/11612/466Reconciliação é o processo de prover uma visão consistente de dados provenientes de várias fontes de dados. Embora existam na literatura trabalhos voltados à proposta de soluções de reconciliação baseadas em colaboração assíncrona, o desafio de reconciliar dados quando vários usuários colaborativos trabalham de forma assíncrona sobre as mesmas co´pias locais de dados, compartilhando somente eventualmente as suas decisões de integração particulares, tem recebido menos atenção. Nesta tese de doutorado investiga-se esse desafio, por meio da proposta do modelo AcCORD (Asynchronous COllaborative data ReconcIliation moDel). AcCORD é um modelo colaborativo assíncrono para reconciliação de dados no qual as atualizações dos usuários são mantidas em um repositório de operações na forma de dados de procedência. Cada usuário tem o seu próprio repositório para armazenar a procedência e a sua própria cópia das fontes. Ou seja, quando inconsistências entre fontes importadas são detectadas, o usuário pode tomar decisões de integração para resolvê-las de maneira autônoma, e as atualizações que são executadas localmente são registradas em seu próprio repositório. As atualizações são compartilhadas entre colaboradores quando um usuário importa as operações dos repositórios dos demais usuários. Desde que diferentes usuários podem ter diferentes pontos de vista para resolver o mesmo conflito, seus repositórios podem estar inconsistentes. Assim, o modelo Ac- CORD também inclui a proposta de diferentes políticas de reconciliação multiusuário para resolver conflitos entre repositórios. Políticas distintas podem ser aplicadas por diferentes usuários para reconciliar as suas atualizações. Dependendo da política aplicada, a visão final das fontes importadas pode ser a mesma para todos os usuários, ou seja, um única visão global integrada, ou resultar em distintas visões locais para cada um deles. Adicionalmente, o modelo AcCORD também incorpora um método de propagação de decisões de integração, o qual tem como objetivo evitar que um usuário tome decisões inconsistentes a respeito de um mesmo conflito de dado presente em diferentes fontes, garantindo um processo de reconciliação multiusuário mais efetivo. O modelo AcCORD foi validado por meio de testes de desempenho que avaliaram as políticas propostas, e por entrevistas a usuários que avaliaram não somente as políticas propostas mas também a qualidade da reconciliação multiusuário. Os resultados obtidos demonstraram a eficiência e a eficácia do modelo proposto, além de sua flexibilidade para gerar uma visão integrada ou distintas visões locais. As entrevistas realizadas demonstraram diferentes percepções dos usuários quanto à qualidade do resultado provido pelo modelo AcCORD, incluindo aspectos relacionados à consistência, aceitabilidade, corretude, economia de tempo e satisfacão.Reconciliation is the process of providing a consistent view of the data imported from different sources. Despite some efforts reported in the literature for providing data reconciliation solutions with asynchronous collaboration, the challenge of reconciling data when multiple users work asyn- chronously over local copies of the same imported data has received less attention. In this thesis we investigate this challenge. We propose AcCORD, an asynchronous collaborative data reconciliation model. It stores users’ integration decision in logs, called repositories. Repositories keep data prove- nance, that is, the operations applied to the data sources that led to the current state of the data. Each user has her own repository for storing the provenance. That is, whenever inconsistencies among im- ported sources are detected, the user may autonomously take decisions to solve them, and integration decisions that are locally executed are registered in her repository. Integration decisions are shared among collaborators by importing each other’s repositories. Since users may have different points of view, repositories may also be inconsistent. Therefore, AcCORD also introduces several policies that can be applied by different users in order to solve conflicts among repositories and reconcile their integration decisions. Depending on the applied policy, the final view of the imported sources may either be the same for all users, that is, a single integrated view, or result in distinct local views for each of them. Furthermore, AcCORD encompasses a decision integration propagation method, which is aimed to avoid that a user take inconsistent decisions over the same data conflict present in different sources, thus guaranteeing a more effective reconciliation process. AcCORD was validated through performance tests that investigated the proposed policies and through users’ interviews that investigated not only the proposed policies but also the quality of the multiuser reconciliation. The re- sults demonstrated the efficiency and efficacy of AcCORD, and highlighted its flexibility to generate a single integrated view or different local views. The interviews demonstrated different perceptions of the users with regard to the quality of the result provided by AcCORD, including aspects related to consistency, acceptability, correctness, time-saving and satisfaction.Universidade de São PauloSão PauloPós-Graduação em Ciências de Computação e Matemática ComputacionalBrasilTese apresentada ao Instituto de Ciências Matemáticas e de Computação - ICMC-USP, como parte dos requisitos para obtenção do título de Doutora em Ciências - Ciências de Computação e Matemática Computacional.info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOReconciliação de dadosResolução de conflitosIntegração de dadosCompartilhamento de dadosProcedência de dadosData reconciliationConflict resolutionData integrationData sharingData provenanceAcCORD: um modelo colaborativo assíncrono para a reconciliação de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFTinstname:Universidade Federal do Tocantins (UFT)instacron:UFTTEXTDayse Silveira de Almeida - Tese.pdf.txtDayse Silveira de Almeida - Tese.pdf.txtExtracted texttext/plain336605http://repositorio.uft.edu.br/bitstream/11612/466/3/Dayse%20Silveira%20de%20Almeida%20-%20Tese.pdf.txt01e85ba4c176f66c7552d7d09552159dMD53THUMBNAILDayse Silveira de Almeida - Tese.pdf.jpgDayse Silveira de Almeida - Tese.pdf.jpgGenerated Thumbnailimage/jpeg1118http://repositorio.uft.edu.br/bitstream/11612/466/4/Dayse%20Silveira%20de%20Almeida%20-%20Tese.pdf.jpg8c4955f1343faca9ae0a08ba8e886673MD54ORIGINALDayse Silveira de Almeida - Tese.pdfDayse Silveira de Almeida - Tese.pdfapplication/pdf4234301http://repositorio.uft.edu.br/bitstream/11612/466/1/Dayse%20Silveira%20de%20Almeida%20-%20Tese.pdfe85203d33fba0671591eff7b655c4f17MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.uft.edu.br/bitstream/11612/466/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5211612/4662019-05-25 03:09:08.311oai:repositorio.uft.edu.br:11612/466Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://repositorio.uft.edu.br/oai/requestbiblioarraias@uft.edu.br || bibliogpi@uft.edu.br || bibliomira@uft.edu.br || bibliopalmas@uft.edu.br || biblioporto@uft.edu.br || biblioarag@uft.edu.br || dirbib@ufnt.edu.br || bibliocca@uft.edu.br || bibliotoc@uft.edu.bropendoar:2019-05-25T06:09:08Repositório Institucional da UFT - Universidade Federal do Tocantins (UFT)false |
dc.title.pt_BR.fl_str_mv |
AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados |
title |
AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados |
spellingShingle |
AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados Almeida, Dayse Silveira de CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Reconciliação de dados Resolução de conflitos Integração de dados Compartilhamento de dados Procedência de dados Data reconciliation Conflict resolution Data integration Data sharing Data provenance |
title_short |
AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados |
title_full |
AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados |
title_fullStr |
AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados |
title_full_unstemmed |
AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados |
title_sort |
AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados |
author |
Almeida, Dayse Silveira de |
author_facet |
Almeida, Dayse Silveira de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Almeida, Dayse Silveira de |
dc.contributor.advisor1.fl_str_mv |
Ciferri, Cristina Dutra de Aguiar |
contributor_str_mv |
Ciferri, Cristina Dutra de Aguiar |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Reconciliação de dados Resolução de conflitos Integração de dados Compartilhamento de dados Procedência de dados Data reconciliation Conflict resolution Data integration Data sharing Data provenance |
dc.subject.por.fl_str_mv |
Reconciliação de dados Resolução de conflitos Integração de dados Compartilhamento de dados Procedência de dados Data reconciliation Conflict resolution Data integration Data sharing Data provenance |
description |
Reconciliação é o processo de prover uma visão consistente de dados provenientes de várias fontes de dados. Embora existam na literatura trabalhos voltados à proposta de soluções de reconciliação baseadas em colaboração assíncrona, o desafio de reconciliar dados quando vários usuários colaborativos trabalham de forma assíncrona sobre as mesmas co´pias locais de dados, compartilhando somente eventualmente as suas decisões de integração particulares, tem recebido menos atenção. Nesta tese de doutorado investiga-se esse desafio, por meio da proposta do modelo AcCORD (Asynchronous COllaborative data ReconcIliation moDel). AcCORD é um modelo colaborativo assíncrono para reconciliação de dados no qual as atualizações dos usuários são mantidas em um repositório de operações na forma de dados de procedência. Cada usuário tem o seu próprio repositório para armazenar a procedência e a sua própria cópia das fontes. Ou seja, quando inconsistências entre fontes importadas são detectadas, o usuário pode tomar decisões de integração para resolvê-las de maneira autônoma, e as atualizações que são executadas localmente são registradas em seu próprio repositório. As atualizações são compartilhadas entre colaboradores quando um usuário importa as operações dos repositórios dos demais usuários. Desde que diferentes usuários podem ter diferentes pontos de vista para resolver o mesmo conflito, seus repositórios podem estar inconsistentes. Assim, o modelo Ac- CORD também inclui a proposta de diferentes políticas de reconciliação multiusuário para resolver conflitos entre repositórios. Políticas distintas podem ser aplicadas por diferentes usuários para reconciliar as suas atualizações. Dependendo da política aplicada, a visão final das fontes importadas pode ser a mesma para todos os usuários, ou seja, um única visão global integrada, ou resultar em distintas visões locais para cada um deles. Adicionalmente, o modelo AcCORD também incorpora um método de propagação de decisões de integração, o qual tem como objetivo evitar que um usuário tome decisões inconsistentes a respeito de um mesmo conflito de dado presente em diferentes fontes, garantindo um processo de reconciliação multiusuário mais efetivo. O modelo AcCORD foi validado por meio de testes de desempenho que avaliaram as políticas propostas, e por entrevistas a usuários que avaliaram não somente as políticas propostas mas também a qualidade da reconciliação multiusuário. Os resultados obtidos demonstraram a eficiência e a eficácia do modelo proposto, além de sua flexibilidade para gerar uma visão integrada ou distintas visões locais. As entrevistas realizadas demonstraram diferentes percepções dos usuários quanto à qualidade do resultado provido pelo modelo AcCORD, incluindo aspectos relacionados à consistência, aceitabilidade, corretude, economia de tempo e satisfacão. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016-04-28 |
dc.date.accessioned.fl_str_mv |
2017-08-15T13:37:28Z |
dc.date.available.fl_str_mv |
2017-08-15T13:37:28Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ALMEIDA, Dayse Silveira de. AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados.2016.135f. Tese (Doutorado em Ciências da Computação e Matemática Computacional) – Universidade de São Paulo, Programa de Pós-Graduação em Ciências da Computação e Matemática Computacional, São Paulo, 2016. |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11612/466 |
identifier_str_mv |
ALMEIDA, Dayse Silveira de. AcCORD: um modelo colaborativo assíncrono para a reconciliação de dados.2016.135f. Tese (Doutorado em Ciências da Computação e Matemática Computacional) – Universidade de São Paulo, Programa de Pós-Graduação em Ciências da Computação e Matemática Computacional, São Paulo, 2016. |
url |
http://hdl.handle.net/11612/466 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade de São Paulo São Paulo |
dc.publisher.program.fl_str_mv |
Pós-Graduação em Ciências de Computação e Matemática Computacional |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade de São Paulo São Paulo |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFT instname:Universidade Federal do Tocantins (UFT) instacron:UFT |
instname_str |
Universidade Federal do Tocantins (UFT) |
instacron_str |
UFT |
institution |
UFT |
reponame_str |
Repositório Institucional da UFT |
collection |
Repositório Institucional da UFT |
bitstream.url.fl_str_mv |
http://repositorio.uft.edu.br/bitstream/11612/466/3/Dayse%20Silveira%20de%20Almeida%20-%20Tese.pdf.txt http://repositorio.uft.edu.br/bitstream/11612/466/4/Dayse%20Silveira%20de%20Almeida%20-%20Tese.pdf.jpg http://repositorio.uft.edu.br/bitstream/11612/466/1/Dayse%20Silveira%20de%20Almeida%20-%20Tese.pdf http://repositorio.uft.edu.br/bitstream/11612/466/2/license.txt |
bitstream.checksum.fl_str_mv |
01e85ba4c176f66c7552d7d09552159d 8c4955f1343faca9ae0a08ba8e886673 e85203d33fba0671591eff7b655c4f17 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFT - Universidade Federal do Tocantins (UFT) |
repository.mail.fl_str_mv |
biblioarraias@uft.edu.br || bibliogpi@uft.edu.br || bibliomira@uft.edu.br || bibliopalmas@uft.edu.br || biblioporto@uft.edu.br || biblioarag@uft.edu.br || dirbib@ufnt.edu.br || bibliocca@uft.edu.br || bibliotoc@uft.edu.br |
_version_ |
1813912803634839552 |