Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding

Detalhes bibliográficos
Autor(a) principal: SANTOS, Helton Douglas Araújo dos
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/33306
Resumo: Desde o seu surgimento, a Web tem emergido como um importante canal de compartilhamento e troca de informações, habilitando a publicação e o consumo de conjuntos de dados de diferentes domínios. Na Web há uma participação ativa de atores que podem ser desde indivíduos até organizações públicas ou privadas, ou até mesmo sistemas ou dispositivos móveis. Esses atores podem agir tanto como publicadores quanto como consumidores de dados. O publicador produz, entrega e refina dados de algum tipo de acordo com condições específicas, enquanto que o consumidor, acessa e consome os dados, realizando análises, construindo visualizações, como também gerando novos dados. De maneira geral, dados na Web seguem um ciclo de vida composto de várias fases que vão desde a preparação dos dados até o refinamento. Em particular, o refinamento de conjuntos de dados diz respeito às atividades de limpeza e enriquecimento de dados, como também a atualizações e adição de novos dados a conjuntos de dados já existentes. Usualmente, o refinamento é realizado pelos publicadores de dados antes de efetuarem a publicação dos dados. Porém, consumidores de dados também realizam frequentemente a limpeza e o enriquecimento de conjuntos de dados ao processarem os mesmos nas suas atividades de consumo. É importante notar que o resultado do refinamento realizado pelos consumidores, na maioria das vezes, não é compartilhado nem com os publicadores do conjunto de dados original nem com outros consumidores interessados no mesmo conjunto de dados. Dessa forma, é muito comum que exista retrabalho, tanto por parte dos publicadores como por parte dos consumidores, uma vez que o resultado das atividades de refinamento não são compartilhadas. Nesse contexto, o objetivo deste trabalho é propor uma estratégia baseada nos princípios de open collaboration e social coding que permita o refinamento, de forma colaborativa, de conjuntos de dados publicados na Web, contribuindo, assim, para reduzir o retrabalho nas atividades de refinamento, bem como para melhorar a qualidade dos conjuntos de dados na Web.
id UFPE_5bb0cf2e9c6c0c6681dfbd480fbd4d34
oai_identifier_str oai:repositorio.ufpe.br:123456789/33306
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling SANTOS, Helton Douglas Araújo doshttp://lattes.cnpq.br/2541616516342112http://lattes.cnpq.br/2512064355660153LÓSCIO, Bernadette Farias2019-09-19T19:40:35Z2019-09-19T19:40:35Z2018-08-22https://repositorio.ufpe.br/handle/123456789/33306Desde o seu surgimento, a Web tem emergido como um importante canal de compartilhamento e troca de informações, habilitando a publicação e o consumo de conjuntos de dados de diferentes domínios. Na Web há uma participação ativa de atores que podem ser desde indivíduos até organizações públicas ou privadas, ou até mesmo sistemas ou dispositivos móveis. Esses atores podem agir tanto como publicadores quanto como consumidores de dados. O publicador produz, entrega e refina dados de algum tipo de acordo com condições específicas, enquanto que o consumidor, acessa e consome os dados, realizando análises, construindo visualizações, como também gerando novos dados. De maneira geral, dados na Web seguem um ciclo de vida composto de várias fases que vão desde a preparação dos dados até o refinamento. Em particular, o refinamento de conjuntos de dados diz respeito às atividades de limpeza e enriquecimento de dados, como também a atualizações e adição de novos dados a conjuntos de dados já existentes. Usualmente, o refinamento é realizado pelos publicadores de dados antes de efetuarem a publicação dos dados. Porém, consumidores de dados também realizam frequentemente a limpeza e o enriquecimento de conjuntos de dados ao processarem os mesmos nas suas atividades de consumo. É importante notar que o resultado do refinamento realizado pelos consumidores, na maioria das vezes, não é compartilhado nem com os publicadores do conjunto de dados original nem com outros consumidores interessados no mesmo conjunto de dados. Dessa forma, é muito comum que exista retrabalho, tanto por parte dos publicadores como por parte dos consumidores, uma vez que o resultado das atividades de refinamento não são compartilhadas. Nesse contexto, o objetivo deste trabalho é propor uma estratégia baseada nos princípios de open collaboration e social coding que permita o refinamento, de forma colaborativa, de conjuntos de dados publicados na Web, contribuindo, assim, para reduzir o retrabalho nas atividades de refinamento, bem como para melhorar a qualidade dos conjuntos de dados na Web.CNPqSince its inception, the Web has emerged as an important channel for sharing and exchanging information, enabling the publication and consumption of datasets from different domains. In this context, there is an active participation of multiple and autonomous actors who are involved in the publication and consumption of data on the Web. An actor can be an individual, a company, a system or a device who acts as a publisher or as a consumer. The publisher produces, delivers and refines data of some kind according to specific conditions. The consumer access and consumes data, performing analysis, building visualizations, as well as generating new data. In general, data on the Web follows a life cycle composed of several phases that ranges from data preparation to refinement. In particular, dataset refinement includes data cleansing and enrichment activities, as well as updates and adding new data to existing datasets. Typically, dataset refinement is performed by publishers before publishing the data. However, consumers also often clean and enrich datasets during the consuption actitivities. It is important to note that the refinement performed by consumers, most of the time, is not shared either with the publishers of the original dataset or with other consumers interested in the same dataset. In this way, it is very common that redoing the refinement over and over again, since the result of the refinement activities are not shared. In this context, the objective of this work is to propose a strategy based on the principles of open collaboration and social coding that allow the refinement of datasets published on the Web in a collaborative way, as consequence contributing to reduce rework in the refinement activities, as well as to improve the quality of datasets published on the Web.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessBanco de dadosRefinamento de dadosUma estratégia para o refinamento colaborativo de dados na web baseada em social codinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf.jpgDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf.jpgGenerated Thumbnailimage/jpeg1244https://repositorio.ufpe.br/bitstream/123456789/33306/5/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf.jpg71a305287af62811a00c389580267f1dMD55ORIGINALDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdfDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdfapplication/pdf2626461https://repositorio.ufpe.br/bitstream/123456789/33306/1/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf442b1ff9eeb5664ead96ceac05e2bcc4MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/33306/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/33306/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf.txtDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf.txtExtracted texttext/plain287645https://repositorio.ufpe.br/bitstream/123456789/33306/4/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf.txt61971190e758cfc6c579e4f4f41ea930MD54123456789/333062019-10-26 04:13:18.0oai:repositorio.ufpe.br:123456789/33306TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-26T07:13:18Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
title Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
spellingShingle Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
SANTOS, Helton Douglas Araújo dos
Banco de dados
Refinamento de dados
title_short Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
title_full Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
title_fullStr Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
title_full_unstemmed Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
title_sort Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
author SANTOS, Helton Douglas Araújo dos
author_facet SANTOS, Helton Douglas Araújo dos
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2541616516342112
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2512064355660153
dc.contributor.author.fl_str_mv SANTOS, Helton Douglas Araújo dos
dc.contributor.advisor1.fl_str_mv LÓSCIO, Bernadette Farias
contributor_str_mv LÓSCIO, Bernadette Farias
dc.subject.por.fl_str_mv Banco de dados
Refinamento de dados
topic Banco de dados
Refinamento de dados
description Desde o seu surgimento, a Web tem emergido como um importante canal de compartilhamento e troca de informações, habilitando a publicação e o consumo de conjuntos de dados de diferentes domínios. Na Web há uma participação ativa de atores que podem ser desde indivíduos até organizações públicas ou privadas, ou até mesmo sistemas ou dispositivos móveis. Esses atores podem agir tanto como publicadores quanto como consumidores de dados. O publicador produz, entrega e refina dados de algum tipo de acordo com condições específicas, enquanto que o consumidor, acessa e consome os dados, realizando análises, construindo visualizações, como também gerando novos dados. De maneira geral, dados na Web seguem um ciclo de vida composto de várias fases que vão desde a preparação dos dados até o refinamento. Em particular, o refinamento de conjuntos de dados diz respeito às atividades de limpeza e enriquecimento de dados, como também a atualizações e adição de novos dados a conjuntos de dados já existentes. Usualmente, o refinamento é realizado pelos publicadores de dados antes de efetuarem a publicação dos dados. Porém, consumidores de dados também realizam frequentemente a limpeza e o enriquecimento de conjuntos de dados ao processarem os mesmos nas suas atividades de consumo. É importante notar que o resultado do refinamento realizado pelos consumidores, na maioria das vezes, não é compartilhado nem com os publicadores do conjunto de dados original nem com outros consumidores interessados no mesmo conjunto de dados. Dessa forma, é muito comum que exista retrabalho, tanto por parte dos publicadores como por parte dos consumidores, uma vez que o resultado das atividades de refinamento não são compartilhadas. Nesse contexto, o objetivo deste trabalho é propor uma estratégia baseada nos princípios de open collaboration e social coding que permita o refinamento, de forma colaborativa, de conjuntos de dados publicados na Web, contribuindo, assim, para reduzir o retrabalho nas atividades de refinamento, bem como para melhorar a qualidade dos conjuntos de dados na Web.
publishDate 2018
dc.date.issued.fl_str_mv 2018-08-22
dc.date.accessioned.fl_str_mv 2019-09-19T19:40:35Z
dc.date.available.fl_str_mv 2019-09-19T19:40:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/33306
url https://repositorio.ufpe.br/handle/123456789/33306
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/33306/5/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/33306/1/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf
https://repositorio.ufpe.br/bitstream/123456789/33306/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/33306/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/33306/4/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf.txt
bitstream.checksum.fl_str_mv 71a305287af62811a00c389580267f1d
442b1ff9eeb5664ead96ceac05e2bcc4
e39d27027a6cc9cb039ad269a5db8e34
bd573a5ca8288eb7272482765f819534
61971190e758cfc6c579e4f4f41ea930
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310734437154816