Validation of automatic similarity measures

Detalhes bibliográficos
Autor(a) principal: Santos, Pedro Jorge Mendes dos
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/48089
Resumo: Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020
id RCAP_040a439c14c40165c64cb8fd3e83600b
oai_identifier_str oai:repositorio.ul.pt:10451/48089
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Validation of automatic similarity measuresFerramenta webOntologias biomédicasValidação manualMultidisciplinaridade de dados biomédicosTeses de mestrado - 2020Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020A capacidade para comparar automaticamente duas entidades biomédicas (p. ex. doenças, vias metabólicas ou artigos científicos) permite que os computadores raciocinem sobre o conhecimento científico. Assim sendo, fazer a validação destas medidas é essencial para garantir que os resultados produzidos por elas reflictam o actual conhecimento colectivo sobre o respectivo domínio. Uma das estratégias para avaliar se a medida é precisa e funcional é a validação manual por parte de peritos. Contudo, este processo é ineficiente devido a toda a pesquisa secundária necessária para o fazer, o que significa que compilar grandes conjuntos de dados de valores de semelhança atribuídos por humanos é uma tarefa difícil. “Manual Validation Helper Tool” (MVHT) é uma aplicação web criada com o intuito de acelerar esta validação manual, em conjunto com um formato capaz de acomodar os diversos tipos de dados em forma de anotações, provenientes de diferentes ontologias ou domínios. MVHT foi testada em quatro datasets distintos e um deles foi apresentado a utilizadores piloto para que dessem o seu feedback acerca do que poderia ser melhorado na aplicação, bem como para se obter um gold-standard de semelhança manual. Com o seu auxílio, a ferramenta foi optimizada e encontra-se acessível para ser usada por criadores de medidas de semelhança semântica, que por sua vez podem partilhar os seus datasets de forma prática, os quais peritos podem visitar e rapidamente começar a comparar pares de entidades.The ability to automatically compare two biomedical entities (e.g. diseases, biochemical pathways, papers) enables the use of computers to reason over scientific knowledge. As such, validating these measures is essential to ensure that the results they produce reflect the current community knowledge on the respective domain. Manual validation by experts is one of the strategies to assess whether a measure is sound and accurate. However, this is an inefficient process because of the secondary research required to do so, which means that compiling large datasets of human-curated similarity values is difficult. The “Manual Validation Helper Tool” (MVHT) is a web application created to accelerate this manual validation, coupled to a format that can accommodate different types of data in the form of annotations, from different domains or ontologies. MVHT was tested on four distinct datasets and one of them was given to pilot users so they could provide feedback on the application, as well as to gather a gold-standard of manual similarity. With their help the tool was optimized and is accessible to be used by creators of semantic similarity measures, who can share their datasets in a more practical way via generated URLs, which other people can visit and quickly start comparing pairs of entities.Couto, Francisco José MoreiraFerreira, João Diogo SilvaRepositório da Universidade de LisboaSantos, Pedro Jorge Mendes dos2021-05-21T15:26:53Z202020202020-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/48089TID:202596575enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:51:18Zoai:repositorio.ul.pt:10451/48089Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:00:00.617693Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Validation of automatic similarity measures
title Validation of automatic similarity measures
spellingShingle Validation of automatic similarity measures
Santos, Pedro Jorge Mendes dos
Ferramenta web
Ontologias biomédicas
Validação manual
Multidisciplinaridade de dados biomédicos
Teses de mestrado - 2020
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
title_short Validation of automatic similarity measures
title_full Validation of automatic similarity measures
title_fullStr Validation of automatic similarity measures
title_full_unstemmed Validation of automatic similarity measures
title_sort Validation of automatic similarity measures
author Santos, Pedro Jorge Mendes dos
author_facet Santos, Pedro Jorge Mendes dos
author_role author
dc.contributor.none.fl_str_mv Couto, Francisco José Moreira
Ferreira, João Diogo Silva
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Santos, Pedro Jorge Mendes dos
dc.subject.por.fl_str_mv Ferramenta web
Ontologias biomédicas
Validação manual
Multidisciplinaridade de dados biomédicos
Teses de mestrado - 2020
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
topic Ferramenta web
Ontologias biomédicas
Validação manual
Multidisciplinaridade de dados biomédicos
Teses de mestrado - 2020
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
description Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020
publishDate 2020
dc.date.none.fl_str_mv 2020
2020
2020-01-01T00:00:00Z
2021-05-21T15:26:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/48089
TID:202596575
url http://hdl.handle.net/10451/48089
identifier_str_mv TID:202596575
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134546672746496