Understanding ALS patients using Semantic Similarity

Detalhes bibliográficos
Autor(a) principal: Teixeira, David Carriço
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/40236
Resumo: Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019
id RCAP_1fb831dd260b74eeee0607e477eea779
oai_identifier_str oai:repositorio.ul.pt:10451/40236
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Understanding ALS patients using Semantic SimilarityOntologias biomédicasSemelhança semânticaEsclerose Amiotrófica LateralAgrupamentoTeses de mestrado - 2019Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019As técnicas clássicas de prospecção de dados têm dificuldades a lidar com dados biomédicos não estruturados/ semiestruturados, pois estes contêm um significado semântico profundamente enraizado em palavras e frases que não é detectado através da extracção e análise diretas de recursos. Uma maneira de formalmente contextualizar dados é anotá-los com ontologias biomédicas e usar semelhança semântica sobre essas anotações para encontrar relações ocultas entre instâncias de dados. Deste modo, se os dados puderem ser enriquecidos com conhecimento externo, uma prospecção mais informada poderá, em princípio, retornar resultados mais precisos. Este projeto abordou este desafio desenvolvendo uma metodologia para analisar registos médicos de pacientes por meio da integração com recursos e software semânticos. Uma pipeline de três etapas cria uma rede semântica de ontologias que garante cobertura semântica sobre os dados alvo, calcula a semelhança semântica entre pacientes com a aplicação SML (Semantic Measures Library), e agrupa pacientes usando algoritmos de clustering do módulo Scikit-Learn do Python. Além disso, foi desenvolvida uma ferramenta para elaborar uma descrição resumida do conteúdo semântico de um agrupamento, destacando os seus elementos mais relevantes. Estes métodos foram avaliados usando um conjunto de dados de 1376 pacientes com esclerose lateral aiotrófica (ELA), possuindo uma forte componente textual e uma ampla heterogeneidade de sintomas entre pacientes. Os grupos de pacientes obtidos foram comparados, juntamente com uma baseline não-semântica, com grupos ground-truth de pacientes derivados das suas taxas de progressão de ELA. Foi demonstrado que a eficácia da metodologia proposta era fortemente dependente do número e da qualidade das anotações, mas também que os dados disponíveis não eram suficientes para detectar grupos de progressão. Apesar disso, as descrições de agrupamentos foram aplicadas com êxito em todas as abordagens, e forneceram informações úteis que evidenciaram pontos em comum entre o conteúdo semântico dos agrupamentos teste e da ground-truth. Por fim, esta metodologia pode ser generalizada para quaisquer entidades biomédicas que podem ser anotadas semanticamente com ontologias existentes.Pesquita, Cátia,1980-Madeira, Sara Alexandra CordeiroRepositório da Universidade de LisboaTeixeira, David Carriço2019-11-22T17:26:39Z201920192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/40236TID:202374432enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:39:25Zoai:repositorio.ul.pt:10451/40236Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:53:56.667635Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Understanding ALS patients using Semantic Similarity
title Understanding ALS patients using Semantic Similarity
spellingShingle Understanding ALS patients using Semantic Similarity
Teixeira, David Carriço
Ontologias biomédicas
Semelhança semântica
Esclerose Amiotrófica Lateral
Agrupamento
Teses de mestrado - 2019
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
title_short Understanding ALS patients using Semantic Similarity
title_full Understanding ALS patients using Semantic Similarity
title_fullStr Understanding ALS patients using Semantic Similarity
title_full_unstemmed Understanding ALS patients using Semantic Similarity
title_sort Understanding ALS patients using Semantic Similarity
author Teixeira, David Carriço
author_facet Teixeira, David Carriço
author_role author
dc.contributor.none.fl_str_mv Pesquita, Cátia,1980-
Madeira, Sara Alexandra Cordeiro
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Teixeira, David Carriço
dc.subject.por.fl_str_mv Ontologias biomédicas
Semelhança semântica
Esclerose Amiotrófica Lateral
Agrupamento
Teses de mestrado - 2019
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
topic Ontologias biomédicas
Semelhança semântica
Esclerose Amiotrófica Lateral
Agrupamento
Teses de mestrado - 2019
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
description Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019
publishDate 2019
dc.date.none.fl_str_mv 2019-11-22T17:26:39Z
2019
2019
2019-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/40236
TID:202374432
url http://hdl.handle.net/10451/40236
identifier_str_mv TID:202374432
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134478233239552