Compound matching of biomedical ontologies
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/20621 |
Resumo: | Tese de mestrado, Bioinformática e Biologia Computacional (Bioinformática)Universidade de Lisboa, Faculdade de Ciências, 2015 |
id |
RCAP_fc337873fbbbad1707fb4d2184e39b05 |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/20621 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Compound matching of biomedical ontologiesOntologias biomédicasEmparelhamento de ontologiasAlinhamento de ontologiasAlinhamento composto de ontologiasDefinições lógicasTeses de mestrado - 2015Departamento de InformáticaTese de mestrado, Bioinformática e Biologia Computacional (Bioinformática)Universidade de Lisboa, Faculdade de Ciências, 2015As ontologias biomédicas são particularmente bem sucedidas na uniformização do domínio das ciências da vida. Devido à sua recente expansão, a integração de todo o conhecimento que contêm tornou-se uma tarefa extenuante. Desta forma, foram desenvolvidos sistemas de alinhamento de ontologias para lidar com o problema, que alinham uma ontologia com outra e encontram classes que correspondem entre as duas. Contudo, novos desafios para estes sistemas estão a começar a aparecer, já que existem ontologias biomédicas que contêm relações complexas e os sistemas têm dificuldade em encontrá-las. Produzir alinhamentos compostos, ou seja, que alinham mais de duas ontologias simultaneamente, pode ser útil para o desenvolvimento de uma próxima geração de tecnologias semânticas. Desta forma, esta dissertação avança o campo de alinhamento de ontologias biomédicas com o desenvolvimento de novos algoritmos que produzem correspondências compostas entre três ontologias diferentes, uma fonte e dois alvos. O algoritmo é baseado em dois passos de comparação léxica. Num primeiro é feito o alinhamento parcial da ontologia fonte com um primeiro alvo, e no segundo apenas as palavras não mapeadas das classes fonte alinhadas são comparadas com as palavras das classes do segundo alvo. O alinhamento composto assim gerado é sujeito a um passo de seleção para encontrar a melhor correspondência possível para cada classe da fonte. Os alinhamentos resultantes foram avaliados contra seis alinhamentos de referência automaticamente inferidos a partir de definições lógicas de ontologias biomédicas da OBO Foundry, mas também foram manualmente verificados. Os resultados preliminares, usando a avaliação automática, apresentam f-measure baixa, com uma precisão mais alta, que flutua entre os 62.9 e os 11.7% e sensibilidade máxima de 60.7%. Contudo, a análise manual demonstra que, apesar do baixo desempenho contra as referências automáticas, o algoritmo estava a encontrar maioritariamente mapeamentos corretos, com uma pequena percentagem de mapeamentos incorretos. Assim, esta descoberta inspirou a investigação da possível aplicação do algoritmo na expansão e manutenção das definições lógicas. O algoritmo também foi bem sucedido no alinhamento de conjuntos ternários de ontologias do domínio das plantas.Biomedical ontologies are particularly successful in the uniformization of the life sciences domain. Due to their recent expansion it became a strenuous task to integrate all the knowledge they encompass. So, ontology matching systems were developed to deal with the problem by aligning one ontology to another and finding matching classes. However, there are still some challenges which are not addressed by the current systems, since there are ontologies which cover complex relations and they struggle to find them. Therefore, I argue that producing “compound” alignments, which match more than two ontologies simultaneously, could be potentially useful to support a next generation of semantic technologies. This thesis advances the field of ontology matching with the development of novel algorithms that produce compound matches between three different ontologies. The overall steps of the algorithm involve matching a source ontology to a first target and, from the resulting alignment, the source classes not mapped are removed and the words already matched are ignored in the second matching step. This second step aligns those remaining words to the third ontology and returns a compound alignment, which is subjected to a selection step to find the best possible match for each source class. The resulting alignments were evaluated against six reference alignments automatically inferred from logical definition of biomedical ontologies, but they were also manually to verified. Preliminary results using the automatic evaluation approach present low f-measure, with a higher precision, which fluctuates between 62.9 and 11.7% and the higher recall is 60.7%. However, the manual analysis showed that despite the low performance against the automatic references, the algorithm was obtaining mostly correct mappings, with a very low percentage of incorrect mappings. Therefore, this finding led me to think that the reference alignments can be expanded and so, one of the possible applications of this algorithm could be to help experts add and maintain the logical definitions present in the OBO Foundry. The algorithm was also successful in its application to align several ternary sets of plant related ontologies.Pesquita, Cátia, 1980-Repositório da Universidade de LisboaOliveira, Daniela Patrícia dos Santos2015-11-25T14:19:55Z201520152015-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/20621TID:201385015enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:06:14Zoai:repositorio.ul.pt:10451/20621Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:38:35.282015Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Compound matching of biomedical ontologies |
title |
Compound matching of biomedical ontologies |
spellingShingle |
Compound matching of biomedical ontologies Oliveira, Daniela Patrícia dos Santos Ontologias biomédicas Emparelhamento de ontologias Alinhamento de ontologias Alinhamento composto de ontologias Definições lógicas Teses de mestrado - 2015 Departamento de Informática |
title_short |
Compound matching of biomedical ontologies |
title_full |
Compound matching of biomedical ontologies |
title_fullStr |
Compound matching of biomedical ontologies |
title_full_unstemmed |
Compound matching of biomedical ontologies |
title_sort |
Compound matching of biomedical ontologies |
author |
Oliveira, Daniela Patrícia dos Santos |
author_facet |
Oliveira, Daniela Patrícia dos Santos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pesquita, Cátia, 1980- Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Oliveira, Daniela Patrícia dos Santos |
dc.subject.por.fl_str_mv |
Ontologias biomédicas Emparelhamento de ontologias Alinhamento de ontologias Alinhamento composto de ontologias Definições lógicas Teses de mestrado - 2015 Departamento de Informática |
topic |
Ontologias biomédicas Emparelhamento de ontologias Alinhamento de ontologias Alinhamento composto de ontologias Definições lógicas Teses de mestrado - 2015 Departamento de Informática |
description |
Tese de mestrado, Bioinformática e Biologia Computacional (Bioinformática)Universidade de Lisboa, Faculdade de Ciências, 2015 |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-11-25T14:19:55Z 2015 2015 2015-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/20621 TID:201385015 |
url |
http://hdl.handle.net/10451/20621 |
identifier_str_mv |
TID:201385015 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134285664354304 |