Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.2/11540 |
Resumo: | A qualidade dos dados é essencial para uma correta compreensão dos conceitos que representam. Em projetos de prospeção de dados é especialmente relevante evitar dados com qualidade inferior uma vez que se usam algoritmos que dependem de dados corretos para criar modelos e previsões precisos. Neste artigo, propomos uma abordagem de avaliação de qualidade que considera métricas que lidam com atributos individuais e, adicionalmente, uma análise longitudinal de fluxo, que permite fazer uma avaliação de qualidade que tem em consideração informação contextual. São propostas métricas de Qualidade de Dados por Entrada e Qualidade de Dados por Atributo e, finalmente, é proposta uma medida de Qualidade Global de Dados baseada nessas métricas. |
id |
RCAP_c5665b1d3846183bb312c04ecca3f388 |
---|---|
oai_identifier_str |
oai:repositorioaberto.uab.pt:10400.2/11540 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mistaQualidade dadosAvaliação da qualidadeCiência dos dadosProspeção de dadosA qualidade dos dados é essencial para uma correta compreensão dos conceitos que representam. Em projetos de prospeção de dados é especialmente relevante evitar dados com qualidade inferior uma vez que se usam algoritmos que dependem de dados corretos para criar modelos e previsões precisos. Neste artigo, propomos uma abordagem de avaliação de qualidade que considera métricas que lidam com atributos individuais e, adicionalmente, uma análise longitudinal de fluxo, que permite fazer uma avaliação de qualidade que tem em consideração informação contextual. São propostas métricas de Qualidade de Dados por Entrada e Qualidade de Dados por Atributo e, finalmente, é proposta uma medida de Qualidade Global de Dados baseada nessas métricas.Este trabalho foi parcialmente financiado pelos projetos FCT, na unidade de investigação BioISI, ref. UID/MULTI/04046/2103, unidade de investigação LASIGE, ref. UIDB, UIDP/00408/2020 e DSAIPA/DS/0039/2018.UID/MULTI/04046/2103Boletim SPE - Sociedade Portuguesa de EstatísticaRepositório AbertoPombinho, PauloCavique, LuísCorreia, Luís2021-12-22T13:00:50Z20212021-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/10400.2/11540por1646-5903info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-12-03T01:47:13Zoai:repositorioaberto.uab.pt:10400.2/11540Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:50:55.454019Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista |
title |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista |
spellingShingle |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista Pombinho, Paulo Qualidade dados Avaliação da qualidade Ciência dos dados Prospeção de dados |
title_short |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista |
title_full |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista |
title_fullStr |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista |
title_full_unstemmed |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista |
title_sort |
Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mista |
author |
Pombinho, Paulo |
author_facet |
Pombinho, Paulo Cavique, Luís Correia, Luís |
author_role |
author |
author2 |
Cavique, Luís Correia, Luís |
author2_role |
author author |
dc.contributor.none.fl_str_mv |
Repositório Aberto |
dc.contributor.author.fl_str_mv |
Pombinho, Paulo Cavique, Luís Correia, Luís |
dc.subject.por.fl_str_mv |
Qualidade dados Avaliação da qualidade Ciência dos dados Prospeção de dados |
topic |
Qualidade dados Avaliação da qualidade Ciência dos dados Prospeção de dados |
description |
A qualidade dos dados é essencial para uma correta compreensão dos conceitos que representam. Em projetos de prospeção de dados é especialmente relevante evitar dados com qualidade inferior uma vez que se usam algoritmos que dependem de dados corretos para criar modelos e previsões precisos. Neste artigo, propomos uma abordagem de avaliação de qualidade que considera métricas que lidam com atributos individuais e, adicionalmente, uma análise longitudinal de fluxo, que permite fazer uma avaliação de qualidade que tem em consideração informação contextual. São propostas métricas de Qualidade de Dados por Entrada e Qualidade de Dados por Atributo e, finalmente, é proposta uma medida de Qualidade Global de Dados baseada nessas métricas. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-12-22T13:00:50Z 2021 2021-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.2/11540 |
url |
http://hdl.handle.net/10400.2/11540 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
1646-5903 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Boletim SPE - Sociedade Portuguesa de Estatística |
publisher.none.fl_str_mv |
Boletim SPE - Sociedade Portuguesa de Estatística |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799135098572898304 |