Validation of automatic similarity measures
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/48089 |
Resumo: | Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020 |
id |
RCAP_040a439c14c40165c64cb8fd3e83600b |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/48089 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Validation of automatic similarity measuresFerramenta webOntologias biomédicasValidação manualMultidisciplinaridade de dados biomédicosTeses de mestrado - 2020Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020A capacidade para comparar automaticamente duas entidades biomédicas (p. ex. doenças, vias metabólicas ou artigos científicos) permite que os computadores raciocinem sobre o conhecimento científico. Assim sendo, fazer a validação destas medidas é essencial para garantir que os resultados produzidos por elas reflictam o actual conhecimento colectivo sobre o respectivo domínio. Uma das estratégias para avaliar se a medida é precisa e funcional é a validação manual por parte de peritos. Contudo, este processo é ineficiente devido a toda a pesquisa secundária necessária para o fazer, o que significa que compilar grandes conjuntos de dados de valores de semelhança atribuídos por humanos é uma tarefa difícil. “Manual Validation Helper Tool” (MVHT) é uma aplicação web criada com o intuito de acelerar esta validação manual, em conjunto com um formato capaz de acomodar os diversos tipos de dados em forma de anotações, provenientes de diferentes ontologias ou domínios. MVHT foi testada em quatro datasets distintos e um deles foi apresentado a utilizadores piloto para que dessem o seu feedback acerca do que poderia ser melhorado na aplicação, bem como para se obter um gold-standard de semelhança manual. Com o seu auxílio, a ferramenta foi optimizada e encontra-se acessível para ser usada por criadores de medidas de semelhança semântica, que por sua vez podem partilhar os seus datasets de forma prática, os quais peritos podem visitar e rapidamente começar a comparar pares de entidades.The ability to automatically compare two biomedical entities (e.g. diseases, biochemical pathways, papers) enables the use of computers to reason over scientific knowledge. As such, validating these measures is essential to ensure that the results they produce reflect the current community knowledge on the respective domain. Manual validation by experts is one of the strategies to assess whether a measure is sound and accurate. However, this is an inefficient process because of the secondary research required to do so, which means that compiling large datasets of human-curated similarity values is difficult. The “Manual Validation Helper Tool” (MVHT) is a web application created to accelerate this manual validation, coupled to a format that can accommodate different types of data in the form of annotations, from different domains or ontologies. MVHT was tested on four distinct datasets and one of them was given to pilot users so they could provide feedback on the application, as well as to gather a gold-standard of manual similarity. With their help the tool was optimized and is accessible to be used by creators of semantic similarity measures, who can share their datasets in a more practical way via generated URLs, which other people can visit and quickly start comparing pairs of entities.Couto, Francisco José MoreiraFerreira, João Diogo SilvaRepositório da Universidade de LisboaSantos, Pedro Jorge Mendes dos2021-05-21T15:26:53Z202020202020-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/48089TID:202596575enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:51:18Zoai:repositorio.ul.pt:10451/48089Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:00:00.617693Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Validation of automatic similarity measures |
title |
Validation of automatic similarity measures |
spellingShingle |
Validation of automatic similarity measures Santos, Pedro Jorge Mendes dos Ferramenta web Ontologias biomédicas Validação manual Multidisciplinaridade de dados biomédicos Teses de mestrado - 2020 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
title_short |
Validation of automatic similarity measures |
title_full |
Validation of automatic similarity measures |
title_fullStr |
Validation of automatic similarity measures |
title_full_unstemmed |
Validation of automatic similarity measures |
title_sort |
Validation of automatic similarity measures |
author |
Santos, Pedro Jorge Mendes dos |
author_facet |
Santos, Pedro Jorge Mendes dos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Couto, Francisco José Moreira Ferreira, João Diogo Silva Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Santos, Pedro Jorge Mendes dos |
dc.subject.por.fl_str_mv |
Ferramenta web Ontologias biomédicas Validação manual Multidisciplinaridade de dados biomédicos Teses de mestrado - 2020 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
topic |
Ferramenta web Ontologias biomédicas Validação manual Multidisciplinaridade de dados biomédicos Teses de mestrado - 2020 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
description |
Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020 |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020 2020 2020-01-01T00:00:00Z 2021-05-21T15:26:53Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/48089 TID:202596575 |
url |
http://hdl.handle.net/10451/48089 |
identifier_str_mv |
TID:202596575 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134546672746496 |