The scientific production on data quality in big data: a study in the Web of Science database

Detalhes bibliográficos
Autor(a) principal: Fagundes, Priscila Basto
Data de Publicação: 2017
Outros Autores: Macedo, Douglas Dyllon Jeronimo de, Freund, Gislaine Parra
Tipo de documento: Artigo
Idioma: por
Título da fonte: Revista Digital de Biblioteconomia e Ciência da Informação
Texto Completo: https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412
Resumo: More and more, the big data theme has attracted interest in researchers from different areas of knowledge, among them information scientists who need to understand their concepts and applications in order to contribute with new proposals for the management of the information generated from the data stored in these environments. The objective of this article is to present a survey of publications about data quality in big data in the Web of Science database until the year 2016. Will be presented the total number of publications indexed in the database, the number of publications per year, the location the origin of the research and a synthesis of the studies found. The survey in the database was conducted in July 2017 and resulted in a total of 23 publications. In order to make it possible to present a summary of the publications in this article, searches were made of the full texts of all the publications on the Internet and read the ones that were available. With this survey it was possible to conclude that the studies on data quality in big data had their publications starting in 2013, most of which present literature reviews and few effective proposals for the monitoring and management of data quality in environments with large volumes of data. Therefore, it is intended with this survey to contribute and foster new research on the context of data quality in big data environments.
id UNICAMP-4_c15e5eccb2a21459587c56a8f5cf2f48
oai_identifier_str oai:ojs.periodicos.sbu.unicamp.br:article/8650412
network_acronym_str UNICAMP-4
network_name_str Revista Digital de Biblioteconomia e Ciência da Informação
repository_id_str
spelling The scientific production on data quality in big data: a study in the Web of Science databaseLa producción científica sobre calidad de datos en big data: un estudio en la base de datos Web of ScienceA produção científica sobre qualidade de dados em big data: um estudo na base de dados Web of ScienceQualidade de dados. Big Data. Gestão da qualidade. Web of ScienceData quality. Big data. Quality Management. Web of ScienceCalidad de los datos. Big Data. Gestión de la Calidad. Web of ScienceMore and more, the big data theme has attracted interest in researchers from different areas of knowledge, among them information scientists who need to understand their concepts and applications in order to contribute with new proposals for the management of the information generated from the data stored in these environments. The objective of this article is to present a survey of publications about data quality in big data in the Web of Science database until the year 2016. Will be presented the total number of publications indexed in the database, the number of publications per year, the location the origin of the research and a synthesis of the studies found. The survey in the database was conducted in July 2017 and resulted in a total of 23 publications. In order to make it possible to present a summary of the publications in this article, searches were made of the full texts of all the publications on the Internet and read the ones that were available. With this survey it was possible to conclude that the studies on data quality in big data had their publications starting in 2013, most of which present literature reviews and few effective proposals for the monitoring and management of data quality in environments with large volumes of data. Therefore, it is intended with this survey to contribute and foster new research on the context of data quality in big data environments.Cada vez más el tema big data ha despertado interés en investigadores de las más diversas áreas del conocimiento, entre ellos los científicos de la información que necesitan comprender sus conceptos y aplicaciones para poder contribuir con nuevas propuestas para la gestión de las informaciones generadas a partirde los datos almacenados en estos datos los ambientes. El objetivo de este artículo es presentar un relevamiento de las publicaciones relacionadas con la calidad de datos en big data en la base de datos Web of Science hasta elaño 2016. Se presentarán el total de publicaciones indexadas en la base, la cantidad de publicaciones al año, el local de origen de las investigaciones y una síntesis de los estudios encontrados. La investigación en la base de datos se realizó en julio de 2017 y resultó en un total de 23 publicaciones. Con el fin de posibilitar la presentación de un resumen de las publicaciones, se realizaron búsquedas por los textos completos de todas las publicaciones en internet y la lectura de los que se encontraban disponibles. Con este levantamiento fue posible concluir que los estudios sobre calidad de datos en big data tuvieron sus publicaciones a partir de 2013, siendo que su mayoría presenta revisiones de la literatura y pocas propuestas efectivas para el monitoreo y gestión de lacalidad de datos en ambientes con grandes volúmenes de datos.Cada vez mais o tema big data tem despertado interesse em pesquisadores das mais diferentes áreas do conhecimento, entre eles os cientistas da informação que necessitam compreender seus conceitos e aplicações para poderem contribuir com novas propostas para a gestão das informações geradas a partir dos dados armazenado nestes ambientes. O objetivo deste artigo é apresentar um levantamento das publicações relacionadas a qualidade de dados em big data na base de dados Web of Science até o ano de 2016. Serão apresentados o total de publicações indexadas na base, a quantidade de publicações por ano, o local de origem das pesquisas e uma síntese dos estudos encontrados. A pesquisa na base de dados foi realizada em julho de 2017 e resultou em um total de 23 publicações. A fim de possibilitar a apresentação de um resumo das publicações neste artigo foram realizadas buscas pelos textos completos de todas as publicações na internet e feita a leitura dos que se encontravam disponíveis. Com este levantamento foi possível concluir que os estudos sobre qualidade de dados em big data tiveram suas publicações a partir de 2013, sendo que a sua maioria apresenta revisões da literatura e poucas propostas efetivas para o monitoramento e gestão da qualidade de dados em ambientes com grandes volumes de dados. Sendo assim, pretende-se com este levantamento contribuir e fomentar novas pesquisas sobre o contexto qualidade de dados em ambientes big data.Universidade Estadual de Campinas2017-11-09info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionRevisão da LiteraturaLiterature revisionRevision de literaturaapplication/pdfapplication/pdfapplication/xmlhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/865041210.20396/rdbci.v16i1.8650412RDBCI: Digital Journal of Library and Information Science; Vol. 16 No. 1 (2018): jan./abr.: Ética profissional, sustentabilidade e informação científica; 194-210RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação; v. 16 n. 1 (2018): jan./abr.: Ética profissional, sustentabilidade e informação científica; 194-2101678-765Xreponame:Revista Digital de Biblioteconomia e Ciência da Informaçãoinstname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPporhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412/pdfhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412/pdf_1https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412/xmlFagundes, Priscila BastoMacedo, Douglas Dyllon Jeronimo deFreund, Gislaine Parrainfo:eu-repo/semantics/openAccess2019-06-25T14:19:12Zoai:ojs.periodicos.sbu.unicamp.br:article/8650412Revistahttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbciPUBhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/oaippec@unicamp.br||gilbfe@unicamp.br|| rdbci@unicamp.br|| danif@unicamp.br1678-765X1678-765Xopendoar:2023-05-22T10:16:23.306216Revista Digital de Biblioteconomia e Ciência da Informação - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv The scientific production on data quality in big data: a study in the Web of Science database
La producción científica sobre calidad de datos en big data: un estudio en la base de datos Web of Science
A produção científica sobre qualidade de dados em big data: um estudo na base de dados Web of Science
title The scientific production on data quality in big data: a study in the Web of Science database
spellingShingle The scientific production on data quality in big data: a study in the Web of Science database
Fagundes, Priscila Basto
Qualidade de dados. Big Data. Gestão da qualidade. Web of Science
Data quality. Big data. Quality Management. Web of Science
Calidad de los datos. Big Data. Gestión de la Calidad. Web of Science
title_short The scientific production on data quality in big data: a study in the Web of Science database
title_full The scientific production on data quality in big data: a study in the Web of Science database
title_fullStr The scientific production on data quality in big data: a study in the Web of Science database
title_full_unstemmed The scientific production on data quality in big data: a study in the Web of Science database
title_sort The scientific production on data quality in big data: a study in the Web of Science database
author Fagundes, Priscila Basto
author_facet Fagundes, Priscila Basto
Macedo, Douglas Dyllon Jeronimo de
Freund, Gislaine Parra
author_role author
author2 Macedo, Douglas Dyllon Jeronimo de
Freund, Gislaine Parra
author2_role author
author
dc.contributor.author.fl_str_mv Fagundes, Priscila Basto
Macedo, Douglas Dyllon Jeronimo de
Freund, Gislaine Parra
dc.subject.por.fl_str_mv Qualidade de dados. Big Data. Gestão da qualidade. Web of Science
Data quality. Big data. Quality Management. Web of Science
Calidad de los datos. Big Data. Gestión de la Calidad. Web of Science
topic Qualidade de dados. Big Data. Gestão da qualidade. Web of Science
Data quality. Big data. Quality Management. Web of Science
Calidad de los datos. Big Data. Gestión de la Calidad. Web of Science
description More and more, the big data theme has attracted interest in researchers from different areas of knowledge, among them information scientists who need to understand their concepts and applications in order to contribute with new proposals for the management of the information generated from the data stored in these environments. The objective of this article is to present a survey of publications about data quality in big data in the Web of Science database until the year 2016. Will be presented the total number of publications indexed in the database, the number of publications per year, the location the origin of the research and a synthesis of the studies found. The survey in the database was conducted in July 2017 and resulted in a total of 23 publications. In order to make it possible to present a summary of the publications in this article, searches were made of the full texts of all the publications on the Internet and read the ones that were available. With this survey it was possible to conclude that the studies on data quality in big data had their publications starting in 2013, most of which present literature reviews and few effective proposals for the monitoring and management of data quality in environments with large volumes of data. Therefore, it is intended with this survey to contribute and foster new research on the context of data quality in big data environments.
publishDate 2017
dc.date.none.fl_str_mv 2017-11-09
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Revisão da Literatura
Literature revision
Revision de literatura
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412
10.20396/rdbci.v16i1.8650412
url https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412
identifier_str_mv 10.20396/rdbci.v16i1.8650412
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412/pdf
https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412/pdf_1
https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8650412/xml
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
application/xml
dc.publisher.none.fl_str_mv Universidade Estadual de Campinas
publisher.none.fl_str_mv Universidade Estadual de Campinas
dc.source.none.fl_str_mv RDBCI: Digital Journal of Library and Information Science; Vol. 16 No. 1 (2018): jan./abr.: Ética profissional, sustentabilidade e informação científica; 194-210
RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação; v. 16 n. 1 (2018): jan./abr.: Ética profissional, sustentabilidade e informação científica; 194-210
1678-765X
reponame:Revista Digital de Biblioteconomia e Ciência da Informação
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Revista Digital de Biblioteconomia e Ciência da Informação
collection Revista Digital de Biblioteconomia e Ciência da Informação
repository.name.fl_str_mv Revista Digital de Biblioteconomia e Ciência da Informação - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv ppec@unicamp.br||gilbfe@unicamp.br|| rdbci@unicamp.br|| danif@unicamp.br
_version_ 1788167559436042240