Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/33306 |
Resumo: | Desde o seu surgimento, a Web tem emergido como um importante canal de compartilhamento e troca de informações, habilitando a publicação e o consumo de conjuntos de dados de diferentes domínios. Na Web há uma participação ativa de atores que podem ser desde indivíduos até organizações públicas ou privadas, ou até mesmo sistemas ou dispositivos móveis. Esses atores podem agir tanto como publicadores quanto como consumidores de dados. O publicador produz, entrega e refina dados de algum tipo de acordo com condições específicas, enquanto que o consumidor, acessa e consome os dados, realizando análises, construindo visualizações, como também gerando novos dados. De maneira geral, dados na Web seguem um ciclo de vida composto de várias fases que vão desde a preparação dos dados até o refinamento. Em particular, o refinamento de conjuntos de dados diz respeito às atividades de limpeza e enriquecimento de dados, como também a atualizações e adição de novos dados a conjuntos de dados já existentes. Usualmente, o refinamento é realizado pelos publicadores de dados antes de efetuarem a publicação dos dados. Porém, consumidores de dados também realizam frequentemente a limpeza e o enriquecimento de conjuntos de dados ao processarem os mesmos nas suas atividades de consumo. É importante notar que o resultado do refinamento realizado pelos consumidores, na maioria das vezes, não é compartilhado nem com os publicadores do conjunto de dados original nem com outros consumidores interessados no mesmo conjunto de dados. Dessa forma, é muito comum que exista retrabalho, tanto por parte dos publicadores como por parte dos consumidores, uma vez que o resultado das atividades de refinamento não são compartilhadas. Nesse contexto, o objetivo deste trabalho é propor uma estratégia baseada nos princípios de open collaboration e social coding que permita o refinamento, de forma colaborativa, de conjuntos de dados publicados na Web, contribuindo, assim, para reduzir o retrabalho nas atividades de refinamento, bem como para melhorar a qualidade dos conjuntos de dados na Web. |
id |
UFPE_5bb0cf2e9c6c0c6681dfbd480fbd4d34 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/33306 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
SANTOS, Helton Douglas Araújo doshttp://lattes.cnpq.br/2541616516342112http://lattes.cnpq.br/2512064355660153LÓSCIO, Bernadette Farias2019-09-19T19:40:35Z2019-09-19T19:40:35Z2018-08-22https://repositorio.ufpe.br/handle/123456789/33306Desde o seu surgimento, a Web tem emergido como um importante canal de compartilhamento e troca de informações, habilitando a publicação e o consumo de conjuntos de dados de diferentes domínios. Na Web há uma participação ativa de atores que podem ser desde indivíduos até organizações públicas ou privadas, ou até mesmo sistemas ou dispositivos móveis. Esses atores podem agir tanto como publicadores quanto como consumidores de dados. O publicador produz, entrega e refina dados de algum tipo de acordo com condições específicas, enquanto que o consumidor, acessa e consome os dados, realizando análises, construindo visualizações, como também gerando novos dados. De maneira geral, dados na Web seguem um ciclo de vida composto de várias fases que vão desde a preparação dos dados até o refinamento. Em particular, o refinamento de conjuntos de dados diz respeito às atividades de limpeza e enriquecimento de dados, como também a atualizações e adição de novos dados a conjuntos de dados já existentes. Usualmente, o refinamento é realizado pelos publicadores de dados antes de efetuarem a publicação dos dados. Porém, consumidores de dados também realizam frequentemente a limpeza e o enriquecimento de conjuntos de dados ao processarem os mesmos nas suas atividades de consumo. É importante notar que o resultado do refinamento realizado pelos consumidores, na maioria das vezes, não é compartilhado nem com os publicadores do conjunto de dados original nem com outros consumidores interessados no mesmo conjunto de dados. Dessa forma, é muito comum que exista retrabalho, tanto por parte dos publicadores como por parte dos consumidores, uma vez que o resultado das atividades de refinamento não são compartilhadas. Nesse contexto, o objetivo deste trabalho é propor uma estratégia baseada nos princípios de open collaboration e social coding que permita o refinamento, de forma colaborativa, de conjuntos de dados publicados na Web, contribuindo, assim, para reduzir o retrabalho nas atividades de refinamento, bem como para melhorar a qualidade dos conjuntos de dados na Web.CNPqSince its inception, the Web has emerged as an important channel for sharing and exchanging information, enabling the publication and consumption of datasets from different domains. In this context, there is an active participation of multiple and autonomous actors who are involved in the publication and consumption of data on the Web. An actor can be an individual, a company, a system or a device who acts as a publisher or as a consumer. The publisher produces, delivers and refines data of some kind according to specific conditions. The consumer access and consumes data, performing analysis, building visualizations, as well as generating new data. In general, data on the Web follows a life cycle composed of several phases that ranges from data preparation to refinement. In particular, dataset refinement includes data cleansing and enrichment activities, as well as updates and adding new data to existing datasets. Typically, dataset refinement is performed by publishers before publishing the data. However, consumers also often clean and enrich datasets during the consuption actitivities. It is important to note that the refinement performed by consumers, most of the time, is not shared either with the publishers of the original dataset or with other consumers interested in the same dataset. In this way, it is very common that redoing the refinement over and over again, since the result of the refinement activities are not shared. In this context, the objective of this work is to propose a strategy based on the principles of open collaboration and social coding that allow the refinement of datasets published on the Web in a collaborative way, as consequence contributing to reduce rework in the refinement activities, as well as to improve the quality of datasets published on the Web.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessBanco de dadosRefinamento de dadosUma estratégia para o refinamento colaborativo de dados na web baseada em social codinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf.jpgDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf.jpgGenerated Thumbnailimage/jpeg1244https://repositorio.ufpe.br/bitstream/123456789/33306/5/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf.jpg71a305287af62811a00c389580267f1dMD55ORIGINALDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdfDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdfapplication/pdf2626461https://repositorio.ufpe.br/bitstream/123456789/33306/1/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf442b1ff9eeb5664ead96ceac05e2bcc4MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/33306/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/33306/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf.txtDISSERTAÇÃO Helton Douglas Araújo dos Santos.pdf.txtExtracted texttext/plain287645https://repositorio.ufpe.br/bitstream/123456789/33306/4/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf.txt61971190e758cfc6c579e4f4f41ea930MD54123456789/333062019-10-26 04:13:18.0oai:repositorio.ufpe.br:123456789/33306TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-26T07:13:18Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding |
title |
Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding |
spellingShingle |
Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding SANTOS, Helton Douglas Araújo dos Banco de dados Refinamento de dados |
title_short |
Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding |
title_full |
Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding |
title_fullStr |
Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding |
title_full_unstemmed |
Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding |
title_sort |
Uma estratégia para o refinamento colaborativo de dados na web baseada em social coding |
author |
SANTOS, Helton Douglas Araújo dos |
author_facet |
SANTOS, Helton Douglas Araújo dos |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2541616516342112 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2512064355660153 |
dc.contributor.author.fl_str_mv |
SANTOS, Helton Douglas Araújo dos |
dc.contributor.advisor1.fl_str_mv |
LÓSCIO, Bernadette Farias |
contributor_str_mv |
LÓSCIO, Bernadette Farias |
dc.subject.por.fl_str_mv |
Banco de dados Refinamento de dados |
topic |
Banco de dados Refinamento de dados |
description |
Desde o seu surgimento, a Web tem emergido como um importante canal de compartilhamento e troca de informações, habilitando a publicação e o consumo de conjuntos de dados de diferentes domínios. Na Web há uma participação ativa de atores que podem ser desde indivíduos até organizações públicas ou privadas, ou até mesmo sistemas ou dispositivos móveis. Esses atores podem agir tanto como publicadores quanto como consumidores de dados. O publicador produz, entrega e refina dados de algum tipo de acordo com condições específicas, enquanto que o consumidor, acessa e consome os dados, realizando análises, construindo visualizações, como também gerando novos dados. De maneira geral, dados na Web seguem um ciclo de vida composto de várias fases que vão desde a preparação dos dados até o refinamento. Em particular, o refinamento de conjuntos de dados diz respeito às atividades de limpeza e enriquecimento de dados, como também a atualizações e adição de novos dados a conjuntos de dados já existentes. Usualmente, o refinamento é realizado pelos publicadores de dados antes de efetuarem a publicação dos dados. Porém, consumidores de dados também realizam frequentemente a limpeza e o enriquecimento de conjuntos de dados ao processarem os mesmos nas suas atividades de consumo. É importante notar que o resultado do refinamento realizado pelos consumidores, na maioria das vezes, não é compartilhado nem com os publicadores do conjunto de dados original nem com outros consumidores interessados no mesmo conjunto de dados. Dessa forma, é muito comum que exista retrabalho, tanto por parte dos publicadores como por parte dos consumidores, uma vez que o resultado das atividades de refinamento não são compartilhadas. Nesse contexto, o objetivo deste trabalho é propor uma estratégia baseada nos princípios de open collaboration e social coding que permita o refinamento, de forma colaborativa, de conjuntos de dados publicados na Web, contribuindo, assim, para reduzir o retrabalho nas atividades de refinamento, bem como para melhorar a qualidade dos conjuntos de dados na Web. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-08-22 |
dc.date.accessioned.fl_str_mv |
2019-09-19T19:40:35Z |
dc.date.available.fl_str_mv |
2019-09-19T19:40:35Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/33306 |
url |
https://repositorio.ufpe.br/handle/123456789/33306 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/33306/5/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/33306/1/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf https://repositorio.ufpe.br/bitstream/123456789/33306/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/33306/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/33306/4/DISSERTA%c3%87%c3%83O%20Helton%20Douglas%20Ara%c3%bajo%20dos%20Santos.pdf.txt |
bitstream.checksum.fl_str_mv |
71a305287af62811a00c389580267f1d 442b1ff9eeb5664ead96ceac05e2bcc4 e39d27027a6cc9cb039ad269a5db8e34 bd573a5ca8288eb7272482765f819534 61971190e758cfc6c579e4f4f41ea930 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310734437154816 |