Quanto valem os metadados?

Detalhes bibliográficos
Autor(a) principal: Inácio, Bruno Filipe Prudêncio
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/24477
Resumo: Tese de mestrado, Engenharia Informática (Engenharia de Software), Universidade de Lisboa, Faculdade de Ciências, 2016
id RCAP_0b96d496b238fcdd0618178f6d647151
oai_identifier_str oai:repositorio.ul.pt:10451/24477
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Quanto valem os metadados?Partilha de informaçãoIntegração de informaçãoWeb semânticaMetadadosOntologiasTeses de mestrado - 2016Departamento de InformáticaTese de mestrado, Engenharia Informática (Engenharia de Software), Universidade de Lisboa, Faculdade de Ciências, 2016As atividades de investigação e desenvolvimento estão cada vez mais dependentes da partilha de informação. O volume de dados gerados ou consumidos assume valores cada vez maiores em muitas áreas científicas. No entanto, as metodologias desenvolvidas e implementadas, no sentido de aumentar a quantidade e qualidade dos dados partilhados, têm apresentado sérias dificuldades em cumprir o propósito de facilitar essa partilha. Até ao momento, o caminho seguido tem sido a utilização de meros repositórios públicos onde os dados gerados pelas investigações são depositados, mas que não implementam funcionalidades que facilitem a partilha e integração dos dados por outros investigadores, sendo portanto difícil extrair conhecimento de forma automática destes dados. É necessária assim uma nova abordagem à forma como esta partilha é feita. Uma abordagem que permita que a informação possa ser organizada, caracterizada e atualizada de modo contínuo. Esse trabalho poderá ser feito pelo investigador, que acima de tudo conhece o domínio dos dados, mas também por curadores, que conhecem tanto o domínio como as práticas de partilha. A maior barreira para a implementação desta metodologia é assim humana, sendo a motivação para organizar, caraterizar semanticamente e atualizar os dados um dos pontos-chave. Nesta tese é assumido que através da implementação de um mecanismo que recompense a partilha e a integração dos metadados que descrevem os conjuntos de dados, de acordo com os princípios da Web Semântica, estaremos a promover e a intensificar a confiança e qualidade na partilha e integração dos mesmos, como passo essencial no avanço científico. Para tal, é necessário que esta qualidade de integração possa ser avaliada, e assim averiguar a utilidade dos metadados e, consequentemente, do conhecimento proporcionado pelos metadados na descoberta dos conjuntos de dados. Esta tese teve como objetivo o desenvolvimento de uma ferramenta que permite a avaliação do nível de conhecimento proporcionado pelos metadados utilizados para a descrição de conjuntos de dados de um qualquer repositório científico, tendo em conta a qualidade da sua integração semântica com ontologias públicas, de acordo com a especificidade das anotações com referência a conceitos ontológicos, utilizados para descrição das suas propriedades, e da completude desta integração. Deste modo, foi apresentado um estudo onde estes dois critérios (especificidade e cobertura de anotações) foram propostos como medidas de qualidade de integração semântica de metadados, partindo da representação formal de ontologia como um grafo acíclico. Estas medidas foram implementadas e utilizadas pela ferramenta de modo a analisar a qualidade dos metadados utilizados por um repositório real de dados científicos, e assim efetuar uma avaliação quantitativa da implementação específica da ferramenta. Os resultados obtidos permitiram concluir que a ferramenta implementou corretamente as medidas estudadas, na avaliação da qualidade dos metadados, e que existe de facto uma fraca aposta, sobretudo quantitativa, na descrição semântica dos metadados por parte dos investigadores.Research and development activities are increasingly dependent on information sharing. The volume of generated or consumed data assumes increasing values in many scientific areas. However, the methodologies developed and implemented to increase the quantity and quality of shared data, have presented serious difficulties in fulfilling the purpose of facilitating such sharing. So far, the followed path has been to use public repositories, where data generated by the investigations is deposited, but which fail to impleme nt features that facilitate data sharing and integration by other researchers, making it difficult to extract actual knowledge in an automatic way from the deposited data. It is necessary to develop a new approach to how this data sharing is performed; an approach that allows the information to be organized, characterized and continuously updated. This work can be done by the investigator, who above all knows the field of data, but also by curators, who know both the domain and the data sharing practices. However the biggest barrier to the implementation of this methodology is human, and the motivation to organize, semantically characterize and update the datasets is one of the key points in the process. In this thesis it is assumed that through the implementation of a mechanism that rewards and recognizes sharing and integration of metadata describing the datasets, according to the principles of the Semantic Web, we will promote and intensify the confidence and quality of data sharing and integration as an essential step in scientific progress. To this end, it is necessary that the quality of integration can be assessed, and thus that we can determine the utility of the knowledge provided by metadata in dataset discovery. The main work carried out by this thesis, was the development of a tool that allows the assessment of the level of knowledge provided by metadata used to describe datasets of any scientific repository, taking into account the quality of its semantic integration with public available ontologies, according to the specificity of annotations with reference to the ontological concepts used to describe its properties, and completeness, of this integration. Thus, a study was made where these two criteria (specificity and annotations coverage) have been proposed as semantic metadata integration quality. These measures were implemented and used by the tool to examine the quality of the metadata used in a real repository of scientific data to describe its datasets, and thus make a quantitative assessment of the tool’s specific implementation. The results show that the tool correctly implements the measures studied in the evaluation of metadata quality and that there is indeed a lack of effort, especially with regards to the quantity, in semantic description of metadata by researchers.Couto, Francisco José MoreiraFerreira, João Diogo SilvaRepositório da Universidade de LisboaInácio, Bruno Filipe Prudêncio2016-08-05T10:27:31Z201620162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/24477TID:201330342porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:13:21Zoai:repositorio.ul.pt:10451/24477Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:41:36.972424Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Quanto valem os metadados?
title Quanto valem os metadados?
spellingShingle Quanto valem os metadados?
Inácio, Bruno Filipe Prudêncio
Partilha de informação
Integração de informação
Web semântica
Metadados
Ontologias
Teses de mestrado - 2016
Departamento de Informática
title_short Quanto valem os metadados?
title_full Quanto valem os metadados?
title_fullStr Quanto valem os metadados?
title_full_unstemmed Quanto valem os metadados?
title_sort Quanto valem os metadados?
author Inácio, Bruno Filipe Prudêncio
author_facet Inácio, Bruno Filipe Prudêncio
author_role author
dc.contributor.none.fl_str_mv Couto, Francisco José Moreira
Ferreira, João Diogo Silva
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Inácio, Bruno Filipe Prudêncio
dc.subject.por.fl_str_mv Partilha de informação
Integração de informação
Web semântica
Metadados
Ontologias
Teses de mestrado - 2016
Departamento de Informática
topic Partilha de informação
Integração de informação
Web semântica
Metadados
Ontologias
Teses de mestrado - 2016
Departamento de Informática
description Tese de mestrado, Engenharia Informática (Engenharia de Software), Universidade de Lisboa, Faculdade de Ciências, 2016
publishDate 2016
dc.date.none.fl_str_mv 2016-08-05T10:27:31Z
2016
2016
2016-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/24477
TID:201330342
url http://hdl.handle.net/10451/24477
identifier_str_mv TID:201330342
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134327757340672