Probabilistic logic programming for cancer genomics
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/79792 |
Resumo: | Dissertação de mestrado em Bioinformática |
id |
RCAP_8f17ad05e91faefe054fef5fd4da8e21 |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/79792 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Probabilistic logic programming for cancer genomicsCancer genomicsExplorationProblogStomach cancerTCGAData processingEstudos genómicosExploraçãoCancro do EstômagoProcessamento de dadosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado em BioinformáticaOver the past years, research on cancer genomics has been boosted by the advances in high throughput sequencing technologies. The Cancer Genome Atlas (TCGA) project is an effort to map the genomic alterations possibly associated with specific types of tumours and aims to improve the prevention, diagnosis and treatment of cancer. The generation of large and heterogeneous datasets, as a result of TCGA and other similar projects, creates the need to use advanced bioinformatics and computational tools for the analysis of cancer genomic data. Despite different bioinformatics frameworks have been established in order to explore and perform comprehensive analysis of cancer datasets, the area of logic and probabilistic logic programming has not been sufficiently explored in the analysis of cancer data. The main goal of this thesis was to explore Problog – a probabilistic logic programming (PLP) language – to encode interactions on heterogeneous cancer genomics datasets that may lead to new insights. To accomplish this objective, our work consisted in the elaboration of a python program and a Problog framework. The used datasets involved stomach cancer genomic data. The python program – ProceOmics – aimed to process and format cancer genomic data so it could be used by Problog programs. The Problog framework – Problog Knowledge Base (KB) – intended to codify the data previously processed by ProceOmics. To evaluate the consistency of the developed framework and explore possible relations between the different types of genomic data, queries were formulated to the Problog KB. Thus, this thesis provides a tool that establishes a link between the genomic data contained in public databases with probabilistic logic programs. We hope this work may help to overcome future efforts to use PLP on genomic data analysis.Ao longo dos últimos anos, devido aos avanços significativos nas áreas tecnológicas responsáveis pelo estudo do genoma humano, o estudo dos dados genómicos associados a casos de ocorrência de cancro tem crescido exponencialmente. The Cancer Genome Atlas (TCGA), é um projeto que consiste no mapeamento de mudanças a nível genómico que possam estar associadas com algum tipo específico de cancro e que, por sua vez, possam fornecer alternativas mais avançadas de prevenção, prognóstico e tratamento relativamente àquelas já existentes. No entanto, a geração de inúmeros e extensivos datasets tem, consequentemente, vindo a aumentar. Apesar de já existir um número significativo de ferramentas e metodologias bioinformáticas que têm como objetivo explorar e realizar análises sobre os diferentes datasets relativos a variados tipos de cancro, a área da programação lógica, bem como da programação lógica probabilística, não têm sido frequentemente exploradas de modo a alcançar esse mesmo objetivo. Posto isto, o objetivo principal desta tese consistiu na exploração de uma extensão probabilística de uma linguagem lógica – Problog – de modo a codificar e explorar interações complexas entre diferentes datasets, visando ainda a descoberta de novas relações entre eles. De modo a alcançar este objetivo, o trabalho desenvolvido consistiu na elaboração de um programa em python e de uma framework em Problog. Todos os dados utilizados nas análises realizadas nesta tese são relativos à genómica do cancro do estômago. O programa em python – ProceOmics – teve como objetivo processar e formatar dados genómicos de cancro de modo a ser possível codificar esses mesmos dados em programas Problog. Por sua vez, a framework em Problog – Problog KB – foi criada com o intuito de codificar os dados previamente processados pelo programa. De modo a avaliar a consistência da framework desenvolvida e explorar possíveis relações entre os diferentes tipos de dados genómicos, foram colocadas queries à Problog KB. Assim sendo, esta tese forneceu uma ferramenta que estabelece uma ligação entre os dados genómicos, contidos em base dados públicas, e programas lógico probabilísticos. Esta ligação poderá ajudar a ultrapassar os poucos esforços aplicados na utilização deste tipo de linguagem para estudar dados genómicos.Ferreira, Pedro G.Mendes, RuiUniversidade do MinhoFernandes, João Pedro Alves2018-12-142018-12-14T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/79792eng203010744info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-04T01:17:21Zoai:repositorium.sdum.uminho.pt:1822/79792Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:33:38.626238Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Probabilistic logic programming for cancer genomics |
title |
Probabilistic logic programming for cancer genomics |
spellingShingle |
Probabilistic logic programming for cancer genomics Fernandes, João Pedro Alves Cancer genomics Exploration Problog Stomach cancer TCGA Data processing Estudos genómicos Exploração Cancro do Estômago Processamento de dados Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
Probabilistic logic programming for cancer genomics |
title_full |
Probabilistic logic programming for cancer genomics |
title_fullStr |
Probabilistic logic programming for cancer genomics |
title_full_unstemmed |
Probabilistic logic programming for cancer genomics |
title_sort |
Probabilistic logic programming for cancer genomics |
author |
Fernandes, João Pedro Alves |
author_facet |
Fernandes, João Pedro Alves |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ferreira, Pedro G. Mendes, Rui Universidade do Minho |
dc.contributor.author.fl_str_mv |
Fernandes, João Pedro Alves |
dc.subject.por.fl_str_mv |
Cancer genomics Exploration Problog Stomach cancer TCGA Data processing Estudos genómicos Exploração Cancro do Estômago Processamento de dados Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Cancer genomics Exploration Problog Stomach cancer TCGA Data processing Estudos genómicos Exploração Cancro do Estômago Processamento de dados Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
Dissertação de mestrado em Bioinformática |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-12-14 2018-12-14T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/79792 |
url |
https://hdl.handle.net/1822/79792 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
203010744 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132855213752320 |