Compound matching of biomedical ontologies

Detalhes bibliográficos
Autor(a) principal: Oliveira, Daniela Patrícia dos Santos
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/20621
Resumo: Tese de mestrado, Bioinformática e Biologia Computacional (Bioinformática)Universidade de Lisboa, Faculdade de Ciências, 2015
id RCAP_fc337873fbbbad1707fb4d2184e39b05
oai_identifier_str oai:repositorio.ul.pt:10451/20621
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Compound matching of biomedical ontologiesOntologias biomédicasEmparelhamento de ontologiasAlinhamento de ontologiasAlinhamento composto de ontologiasDefinições lógicasTeses de mestrado - 2015Departamento de InformáticaTese de mestrado, Bioinformática e Biologia Computacional (Bioinformática)Universidade de Lisboa, Faculdade de Ciências, 2015As ontologias biomédicas são particularmente bem sucedidas na uniformização do domínio das ciências da vida. Devido à sua recente expansão, a integração de todo o conhecimento que contêm tornou-se uma tarefa extenuante. Desta forma, foram desenvolvidos sistemas de alinhamento de ontologias para lidar com o problema, que alinham uma ontologia com outra e encontram classes que correspondem entre as duas. Contudo, novos desafios para estes sistemas estão a começar a aparecer, já que existem ontologias biomédicas que contêm relações complexas e os sistemas têm dificuldade em encontrá-las. Produzir alinhamentos compostos, ou seja, que alinham mais de duas ontologias simultaneamente, pode ser útil para o desenvolvimento de uma próxima geração de tecnologias semânticas. Desta forma, esta dissertação avança o campo de alinhamento de ontologias biomédicas com o desenvolvimento de novos algoritmos que produzem correspondências compostas entre três ontologias diferentes, uma fonte e dois alvos. O algoritmo é baseado em dois passos de comparação léxica. Num primeiro é feito o alinhamento parcial da ontologia fonte com um primeiro alvo, e no segundo apenas as palavras não mapeadas das classes fonte alinhadas são comparadas com as palavras das classes do segundo alvo. O alinhamento composto assim gerado é sujeito a um passo de seleção para encontrar a melhor correspondência possível para cada classe da fonte. Os alinhamentos resultantes foram avaliados contra seis alinhamentos de referência automaticamente inferidos a partir de definições lógicas de ontologias biomédicas da OBO Foundry, mas também foram manualmente verificados. Os resultados preliminares, usando a avaliação automática, apresentam f-measure baixa, com uma precisão mais alta, que flutua entre os 62.9 e os 11.7% e sensibilidade máxima de 60.7%. Contudo, a análise manual demonstra que, apesar do baixo desempenho contra as referências automáticas, o algoritmo estava a encontrar maioritariamente mapeamentos corretos, com uma pequena percentagem de mapeamentos incorretos. Assim, esta descoberta inspirou a investigação da possível aplicação do algoritmo na expansão e manutenção das definições lógicas. O algoritmo também foi bem sucedido no alinhamento de conjuntos ternários de ontologias do domínio das plantas.Biomedical ontologies are particularly successful in the uniformization of the life sciences domain. Due to their recent expansion it became a strenuous task to integrate all the knowledge they encompass. So, ontology matching systems were developed to deal with the problem by aligning one ontology to another and finding matching classes. However, there are still some challenges which are not addressed by the current systems, since there are ontologies which cover complex relations and they struggle to find them. Therefore, I argue that producing “compound” alignments, which match more than two ontologies simultaneously, could be potentially useful to support a next generation of semantic technologies. This thesis advances the field of ontology matching with the development of novel algorithms that produce compound matches between three different ontologies. The overall steps of the algorithm involve matching a source ontology to a first target and, from the resulting alignment, the source classes not mapped are removed and the words already matched are ignored in the second matching step. This second step aligns those remaining words to the third ontology and returns a compound alignment, which is subjected to a selection step to find the best possible match for each source class. The resulting alignments were evaluated against six reference alignments automatically inferred from logical definition of biomedical ontologies, but they were also manually to verified. Preliminary results using the automatic evaluation approach present low f-measure, with a higher precision, which fluctuates between 62.9 and 11.7% and the higher recall is 60.7%. However, the manual analysis showed that despite the low performance against the automatic references, the algorithm was obtaining mostly correct mappings, with a very low percentage of incorrect mappings. Therefore, this finding led me to think that the reference alignments can be expanded and so, one of the possible applications of this algorithm could be to help experts add and maintain the logical definitions present in the OBO Foundry. The algorithm was also successful in its application to align several ternary sets of plant related ontologies.Pesquita, Cátia, 1980-Repositório da Universidade de LisboaOliveira, Daniela Patrícia dos Santos2015-11-25T14:19:55Z201520152015-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/20621TID:201385015enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:06:14Zoai:repositorio.ul.pt:10451/20621Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:38:35.282015Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Compound matching of biomedical ontologies
title Compound matching of biomedical ontologies
spellingShingle Compound matching of biomedical ontologies
Oliveira, Daniela Patrícia dos Santos
Ontologias biomédicas
Emparelhamento de ontologias
Alinhamento de ontologias
Alinhamento composto de ontologias
Definições lógicas
Teses de mestrado - 2015
Departamento de Informática
title_short Compound matching of biomedical ontologies
title_full Compound matching of biomedical ontologies
title_fullStr Compound matching of biomedical ontologies
title_full_unstemmed Compound matching of biomedical ontologies
title_sort Compound matching of biomedical ontologies
author Oliveira, Daniela Patrícia dos Santos
author_facet Oliveira, Daniela Patrícia dos Santos
author_role author
dc.contributor.none.fl_str_mv Pesquita, Cátia, 1980-
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Oliveira, Daniela Patrícia dos Santos
dc.subject.por.fl_str_mv Ontologias biomédicas
Emparelhamento de ontologias
Alinhamento de ontologias
Alinhamento composto de ontologias
Definições lógicas
Teses de mestrado - 2015
Departamento de Informática
topic Ontologias biomédicas
Emparelhamento de ontologias
Alinhamento de ontologias
Alinhamento composto de ontologias
Definições lógicas
Teses de mestrado - 2015
Departamento de Informática
description Tese de mestrado, Bioinformática e Biologia Computacional (Bioinformática)Universidade de Lisboa, Faculdade de Ciências, 2015
publishDate 2015
dc.date.none.fl_str_mv 2015-11-25T14:19:55Z
2015
2015
2015-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/20621
TID:201385015
url http://hdl.handle.net/10451/20621
identifier_str_mv TID:201385015
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134285664354304