Historical data management in big databases

Detalhes bibliográficos
Autor(a) principal: Simão, José Pedro Ribeiro Nunes
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/60021
Resumo: Dissertação de mestrado em Informatics Engineering
id RCAP_3c80b1b3eada137d5bdd21c8f3419f94
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/60021
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Historical data management in big databasesDatabasesData qualityData managementData miningMachine learningBases de dadosQualidade de dadosGestão de dadosMineração de dadosAprendizagem máquinaEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado em Informatics EngineeringWe are now living in a digital world where almost anything, or something is saved somewhere with very few considerations for determining if that was in fact relevant to be saved or not. Hence, it is predictable that most information systems are facing an information management problem. To overcome this issue, it is vital the creation of new and more specific data management techniques that will enforce the established governance policies and manage the information systems in order to maintain their ideal performance and quality. Currently, a solution that is able to cope with this problem efficiently is “pure digital gold”, especially for the biggest players that have to handle an astonishing amount of data, which needs to be properly managed. Nevertheless, this is a problem of general interest for any database administration, because even if shrinking the dimension of the information is not a major concern in some cases, the data assessment efficiency and its quality assurance are certainly two subjects of great interest for any system administrator. This work tackles the data management problem with a proposal for a solution that uses machine learning techniques and other methods, trying to understand in an intelligent manner the data in a database, according to its relevance for their users. Thus, identifying what is really important to who uses the system and being able to distinguish it from the rest of the data, is a great way for creating new and efficient measures for managing data in an information system. Through this, it is possible to improve the quality of what is kept in the database as well as increase, or at least try to ensure, system performance. Basically, what its users expect from it throughout its lifetime.Estamos a viver num mundo digital onde praticamente tudo que alguém ou algo faça é capturado e guardado em algum sítio, com muito pouca consideração que determine se esse evento é ou não relevante para ser guardado. Como tal, é previsível que grande parte dos sistemas de informação tenha, ou venha a ter, um problema de gestão de informação no futuro. Isto obriga a que sejam criados novos tipos de técnicas de gestão de dados mais eficientes e específicos para cada caso, que sejam capazes de governar os sistemas de forma a assegurar o desempenho e qualidade desejados. Atualmente, uma solução capaz de lidar com este problema eficientemente nos tempos que correm é “ouro digital”, especialmente para os grandes intervenientes neste domínio que têm de lidar com uma quantidade exorbitante de dados e que, por sua vez, precisam de ser devidamente geridos. Apesar disso, este é um problema de interesse global para qualquer equipa de administração de bases de dados, porque mesmo que a diminuição da dimensão da base de dados não seja uma preocupação fulcral para certos casos, o eficiente acesso e a qualidade dos dados existentes numa base de dados serão sempre dois assuntos de grande preocupação para qualquer administrador de sistemas. Neste trabalho, é investigado o problema da gestão de dados através de uma proposta de solução, na qual através de técnicas de machine learning, tenta com inteligência perceber, aprender e classificar os dados em qualquer base de dados, de acordo com a sua relevância para os utilizadores. Identificar o que realmente é importante para quem usa o sistema e ser capaz de distinguir esta informação da restante, é uma excelente forma para se criarem novas e eficientes medidas de gestão de dados em qualquer sistema de informação. Assim, certamente, irá aumentar a qualidade de tudo o que é mantido no mesmo, bem como aumentar, ou pelo menos tentar assegurar, que o desempenho do sistema é o esperado pelos utilizadores.Belo, OrlandoSoares, JorgeUniversidade do MinhoSimão, José Pedro Ribeiro Nunes20172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/60021eng202209245info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T11:57:17Zoai:repositorium.sdum.uminho.pt:1822/60021Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:46:55.879296Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Historical data management in big databases
title Historical data management in big databases
spellingShingle Historical data management in big databases
Simão, José Pedro Ribeiro Nunes
Databases
Data quality
Data management
Data mining
Machine learning
Bases de dados
Qualidade de dados
Gestão de dados
Mineração de dados
Aprendizagem máquina
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Historical data management in big databases
title_full Historical data management in big databases
title_fullStr Historical data management in big databases
title_full_unstemmed Historical data management in big databases
title_sort Historical data management in big databases
author Simão, José Pedro Ribeiro Nunes
author_facet Simão, José Pedro Ribeiro Nunes
author_role author
dc.contributor.none.fl_str_mv Belo, Orlando
Soares, Jorge
Universidade do Minho
dc.contributor.author.fl_str_mv Simão, José Pedro Ribeiro Nunes
dc.subject.por.fl_str_mv Databases
Data quality
Data management
Data mining
Machine learning
Bases de dados
Qualidade de dados
Gestão de dados
Mineração de dados
Aprendizagem máquina
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Databases
Data quality
Data management
Data mining
Machine learning
Bases de dados
Qualidade de dados
Gestão de dados
Mineração de dados
Aprendizagem máquina
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado em Informatics Engineering
publishDate 2017
dc.date.none.fl_str_mv 2017
2017-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/60021
url http://hdl.handle.net/1822/60021
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 202209245
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132226671083520