Probabilistic logic programming for cancer genomics

Detalhes bibliográficos
Autor(a) principal: Fernandes, João Pedro Alves
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/79792
Resumo: Dissertação de mestrado em Bioinformática
id RCAP_8f17ad05e91faefe054fef5fd4da8e21
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/79792
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Probabilistic logic programming for cancer genomicsCancer genomicsExplorationProblogStomach cancerTCGAData processingEstudos genómicosExploraçãoCancro do EstômagoProcessamento de dadosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado em BioinformáticaOver the past years, research on cancer genomics has been boosted by the advances in high throughput sequencing technologies. The Cancer Genome Atlas (TCGA) project is an effort to map the genomic alterations possibly associated with specific types of tumours and aims to improve the prevention, diagnosis and treatment of cancer. The generation of large and heterogeneous datasets, as a result of TCGA and other similar projects, creates the need to use advanced bioinformatics and computational tools for the analysis of cancer genomic data. Despite different bioinformatics frameworks have been established in order to explore and perform comprehensive analysis of cancer datasets, the area of logic and probabilistic logic programming has not been sufficiently explored in the analysis of cancer data. The main goal of this thesis was to explore Problog – a probabilistic logic programming (PLP) language – to encode interactions on heterogeneous cancer genomics datasets that may lead to new insights. To accomplish this objective, our work consisted in the elaboration of a python program and a Problog framework. The used datasets involved stomach cancer genomic data. The python program – ProceOmics – aimed to process and format cancer genomic data so it could be used by Problog programs. The Problog framework – Problog Knowledge Base (KB) – intended to codify the data previously processed by ProceOmics. To evaluate the consistency of the developed framework and explore possible relations between the different types of genomic data, queries were formulated to the Problog KB. Thus, this thesis provides a tool that establishes a link between the genomic data contained in public databases with probabilistic logic programs. We hope this work may help to overcome future efforts to use PLP on genomic data analysis.Ao longo dos últimos anos, devido aos avanços significativos nas áreas tecnológicas responsáveis pelo estudo do genoma humano, o estudo dos dados genómicos associados a casos de ocorrência de cancro tem crescido exponencialmente. The Cancer Genome Atlas (TCGA), é um projeto que consiste no mapeamento de mudanças a nível genómico que possam estar associadas com algum tipo específico de cancro e que, por sua vez, possam fornecer alternativas mais avançadas de prevenção, prognóstico e tratamento relativamente àquelas já existentes. No entanto, a geração de inúmeros e extensivos datasets tem, consequentemente, vindo a aumentar. Apesar de já existir um número significativo de ferramentas e metodologias bioinformáticas que têm como objetivo explorar e realizar análises sobre os diferentes datasets relativos a variados tipos de cancro, a área da programação lógica, bem como da programação lógica probabilística, não têm sido frequentemente exploradas de modo a alcançar esse mesmo objetivo. Posto isto, o objetivo principal desta tese consistiu na exploração de uma extensão probabilística de uma linguagem lógica – Problog – de modo a codificar e explorar interações complexas entre diferentes datasets, visando ainda a descoberta de novas relações entre eles. De modo a alcançar este objetivo, o trabalho desenvolvido consistiu na elaboração de um programa em python e de uma framework em Problog. Todos os dados utilizados nas análises realizadas nesta tese são relativos à genómica do cancro do estômago. O programa em python – ProceOmics – teve como objetivo processar e formatar dados genómicos de cancro de modo a ser possível codificar esses mesmos dados em programas Problog. Por sua vez, a framework em Problog – Problog KB – foi criada com o intuito de codificar os dados previamente processados pelo programa. De modo a avaliar a consistência da framework desenvolvida e explorar possíveis relações entre os diferentes tipos de dados genómicos, foram colocadas queries à Problog KB. Assim sendo, esta tese forneceu uma ferramenta que estabelece uma ligação entre os dados genómicos, contidos em base dados públicas, e programas lógico probabilísticos. Esta ligação poderá ajudar a ultrapassar os poucos esforços aplicados na utilização deste tipo de linguagem para estudar dados genómicos.Ferreira, Pedro G.Mendes, RuiUniversidade do MinhoFernandes, João Pedro Alves2018-12-142018-12-14T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/79792eng203010744info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-04T01:17:21Zoai:repositorium.sdum.uminho.pt:1822/79792Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:33:38.626238Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Probabilistic logic programming for cancer genomics
title Probabilistic logic programming for cancer genomics
spellingShingle Probabilistic logic programming for cancer genomics
Fernandes, João Pedro Alves
Cancer genomics
Exploration
Problog
Stomach cancer
TCGA
Data processing
Estudos genómicos
Exploração
Cancro do Estômago
Processamento de dados
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Probabilistic logic programming for cancer genomics
title_full Probabilistic logic programming for cancer genomics
title_fullStr Probabilistic logic programming for cancer genomics
title_full_unstemmed Probabilistic logic programming for cancer genomics
title_sort Probabilistic logic programming for cancer genomics
author Fernandes, João Pedro Alves
author_facet Fernandes, João Pedro Alves
author_role author
dc.contributor.none.fl_str_mv Ferreira, Pedro G.
Mendes, Rui
Universidade do Minho
dc.contributor.author.fl_str_mv Fernandes, João Pedro Alves
dc.subject.por.fl_str_mv Cancer genomics
Exploration
Problog
Stomach cancer
TCGA
Data processing
Estudos genómicos
Exploração
Cancro do Estômago
Processamento de dados
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Cancer genomics
Exploration
Problog
Stomach cancer
TCGA
Data processing
Estudos genómicos
Exploração
Cancro do Estômago
Processamento de dados
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado em Bioinformática
publishDate 2018
dc.date.none.fl_str_mv 2018-12-14
2018-12-14T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/79792
url https://hdl.handle.net/1822/79792
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203010744
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132855213752320