Understanding ALS patients using Semantic Similarity
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/40236 |
Resumo: | Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019 |
id |
RCAP_1fb831dd260b74eeee0607e477eea779 |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/40236 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Understanding ALS patients using Semantic SimilarityOntologias biomédicasSemelhança semânticaEsclerose Amiotrófica LateralAgrupamentoTeses de mestrado - 2019Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019As técnicas clássicas de prospecção de dados têm dificuldades a lidar com dados biomédicos não estruturados/ semiestruturados, pois estes contêm um significado semântico profundamente enraizado em palavras e frases que não é detectado através da extracção e análise diretas de recursos. Uma maneira de formalmente contextualizar dados é anotá-los com ontologias biomédicas e usar semelhança semântica sobre essas anotações para encontrar relações ocultas entre instâncias de dados. Deste modo, se os dados puderem ser enriquecidos com conhecimento externo, uma prospecção mais informada poderá, em princípio, retornar resultados mais precisos. Este projeto abordou este desafio desenvolvendo uma metodologia para analisar registos médicos de pacientes por meio da integração com recursos e software semânticos. Uma pipeline de três etapas cria uma rede semântica de ontologias que garante cobertura semântica sobre os dados alvo, calcula a semelhança semântica entre pacientes com a aplicação SML (Semantic Measures Library), e agrupa pacientes usando algoritmos de clustering do módulo Scikit-Learn do Python. Além disso, foi desenvolvida uma ferramenta para elaborar uma descrição resumida do conteúdo semântico de um agrupamento, destacando os seus elementos mais relevantes. Estes métodos foram avaliados usando um conjunto de dados de 1376 pacientes com esclerose lateral aiotrófica (ELA), possuindo uma forte componente textual e uma ampla heterogeneidade de sintomas entre pacientes. Os grupos de pacientes obtidos foram comparados, juntamente com uma baseline não-semântica, com grupos ground-truth de pacientes derivados das suas taxas de progressão de ELA. Foi demonstrado que a eficácia da metodologia proposta era fortemente dependente do número e da qualidade das anotações, mas também que os dados disponíveis não eram suficientes para detectar grupos de progressão. Apesar disso, as descrições de agrupamentos foram aplicadas com êxito em todas as abordagens, e forneceram informações úteis que evidenciaram pontos em comum entre o conteúdo semântico dos agrupamentos teste e da ground-truth. Por fim, esta metodologia pode ser generalizada para quaisquer entidades biomédicas que podem ser anotadas semanticamente com ontologias existentes.Pesquita, Cátia,1980-Madeira, Sara Alexandra CordeiroRepositório da Universidade de LisboaTeixeira, David Carriço2019-11-22T17:26:39Z201920192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/40236TID:202374432enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:39:25Zoai:repositorio.ul.pt:10451/40236Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:53:56.667635Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Understanding ALS patients using Semantic Similarity |
title |
Understanding ALS patients using Semantic Similarity |
spellingShingle |
Understanding ALS patients using Semantic Similarity Teixeira, David Carriço Ontologias biomédicas Semelhança semântica Esclerose Amiotrófica Lateral Agrupamento Teses de mestrado - 2019 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
title_short |
Understanding ALS patients using Semantic Similarity |
title_full |
Understanding ALS patients using Semantic Similarity |
title_fullStr |
Understanding ALS patients using Semantic Similarity |
title_full_unstemmed |
Understanding ALS patients using Semantic Similarity |
title_sort |
Understanding ALS patients using Semantic Similarity |
author |
Teixeira, David Carriço |
author_facet |
Teixeira, David Carriço |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pesquita, Cátia,1980- Madeira, Sara Alexandra Cordeiro Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Teixeira, David Carriço |
dc.subject.por.fl_str_mv |
Ontologias biomédicas Semelhança semântica Esclerose Amiotrófica Lateral Agrupamento Teses de mestrado - 2019 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
topic |
Ontologias biomédicas Semelhança semântica Esclerose Amiotrófica Lateral Agrupamento Teses de mestrado - 2019 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
description |
Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019 |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-11-22T17:26:39Z 2019 2019 2019-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/40236 TID:202374432 |
url |
http://hdl.handle.net/10451/40236 |
identifier_str_mv |
TID:202374432 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134478233239552 |