Computational approaches for the integration of in vitro chemical and genetic screening data sets

Detalhes bibliográficos
Autor(a) principal: Cunha, Ana Beatriz Gonçalves da
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/82763
Resumo: Dissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação)
id RCAP_d513587301d4455989884e6c6f83ebb7
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/82763
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Computational approaches for the integration of in vitro chemical and genetic screening data setsTumour heterogeneitySingle-cell RNA SequencingDrug activity predictionDrug combinationsDeep learningHeterogeneidade tumoralSequenciação RNA Single-cellPrevisão da atividade farmacológicaCombinação de fármacosCiências Naturais::Ciências da Computação e da InformaçãoDissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação)Cellular heterogeneity plays an important role in tumour development and is often associated with poor prognosis, unsuccessful treatment, and relapse. Most therapeutic approaches do not account for the presence of drug-resistant clones within the tumour, that can affect the success of the treatment, and therefore it is crucial to address tumour heterogeneity in the clinic. Artificial intelligence is being increasingly introduced into Research & Development, especially in drug development. Current methodologies use information from in vitro cell line cultures as their source of biological signal, and drug screens. Models using this kind of data have clear limitations since they do not fully recapitulate cancer development in vivo. Furthermore, they also do not account for intratumour heterogeneity. This dissertation aims to develop deep learning models to predict the activity of drugs and drug combi nations at single-cell resolution using single-cell RNA sequencing technologies. The novelty of this project is the use of single-cell data that, if successful, could allow the identification of different populations of clones. First, two Variational Autoencoders were trained to analyse and compress both inputs, namely the molecular information and gene expression, that will be used as input to the deep learning models trained to predict the activity of compounds. They both proved to be a valid and efficient way to process the input without losing or compromising the signal. After processing the input, two models were trained to predict drug activity, Gradient Boosting Machines and Neural Networks. Overall, these models showed great results, particularly the Light Gradient Boosting Machines, with spearman correlations between real and predicted sensitivities around 0.8. Lastly, both architectures were also used to predict the drug combination synergy scores. These models showed average, but promising results, with spearman correlations between real and predicted synergies around 0.4. In a nutshell, this work shows that it is possible to predict drug activity using single-cell data. However, due to the novelty of this technology, the amount of data available is limited, which limited the performance of the models. Nevertheless, both models showed their potential, and as more data become available, the more the models will learn and make better predictions.A heterogeneidade celular tem um papel bastante importante no desenvolvimento tumoral, e está fre quentemente associada a mau prognóstico e falhas no tratamento, que poderá culminar em recidivas. A maioria das opções terapêuticas existentes não têm em consideração a presença de clones resistentes ao tratamento no tumor, que podem interferir com o sucesso da terapia. Assim sendo, a heterogeneidade tumoral é um ponto crucial que deve ser abordado em contexto clínico. A inteligência artificial está a ser aplicada cada vez mais na investigação, particularmente no desen volvimento de fármacos. As metodologias atuais utilizam informação proveniente de culturas de linhas celulares in vitro como fonte de sinal biológico e de estudos farmacológicos. Todavia, estes modelos ap resentam limitações evidentes, dado que não recapitulam o total desenvolvimento tumoral in vivo. Além disso, estes modelos também não têm em conta a heterogeneidade intratumoral. Esta dissertação tem como objetivo o desenvolvimento de modelos de deep learning para a previsão da atividade de fármacos e da sinergia de combinação de fármacos, ao nível celular, usando para isso dados de tecnologias de sequenciação single-cell. A inovação deste trabalho é o uso deste tipo de dados que, se bem-sucedido, poderá permitir a identificação de diferentes populações de clones tumorais. Numa primeira fase, dois Variational Autoencoders foram treinados de forma a serem capazes de analisar e comprimir os diferentes inputs (informação molecular e expressão genética), que foram depois utilizados como input para os modelos seguintes para a previsão da atividade dos fármacos. Ambos os variational autoencoders mostraram ser opções válidas e bastante eficientes para o processamento dos dados iniciais, sem perda e/ou comprometimento da informação. De seguida, dois modelos foram treinados para a previsão da atividade dos fármacos, mais especifica mente Gradient Boosting Machines e Redes Neuronais. De uma forma geral, estes modelos mostraram excelentes resultados, particularmente as Light Gradient Boosting Machines, com uma correlação de spearman entre os valores de actividade reais e previstos de 0.8. Por último, os mesmos tipos de modelos foram treinados para preverem os valores de sinergia entre combinação de fármacos. Estes modelos mostraram resultados promissores, com uma correlação de spearman entre os valores de sinergia reais e previstos de 0.4. Em epítome, este trabalho demonstra que é possível prever a atividade farmacológica usando dados single-cell. Todavia, devido ao facto desta tecnologia ser bastante recente, a quantidade de informação e dados disponíveis é reduzida, o que limita o sucesso dos modelos. Não obstante, ambos os modelos mostraram que têm bastante potencial e, assim que mais informação fique disponível, mais os modelos irão aprender e serão capazes de fazer melhores previsões.Rocha, MiguelCortés-Ciriano, IsidroUniversidade do MinhoCunha, Ana Beatriz Gonçalves da2021-11-012021-11-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/82763eng203153642info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:32:36Zoai:repositorium.sdum.uminho.pt:1822/82763Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:27:59.177883Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Computational approaches for the integration of in vitro chemical and genetic screening data sets
title Computational approaches for the integration of in vitro chemical and genetic screening data sets
spellingShingle Computational approaches for the integration of in vitro chemical and genetic screening data sets
Cunha, Ana Beatriz Gonçalves da
Tumour heterogeneity
Single-cell RNA Sequencing
Drug activity prediction
Drug combinations
Deep learning
Heterogeneidade tumoral
Sequenciação RNA Single-cell
Previsão da atividade farmacológica
Combinação de fármacos
Ciências Naturais::Ciências da Computação e da Informação
title_short Computational approaches for the integration of in vitro chemical and genetic screening data sets
title_full Computational approaches for the integration of in vitro chemical and genetic screening data sets
title_fullStr Computational approaches for the integration of in vitro chemical and genetic screening data sets
title_full_unstemmed Computational approaches for the integration of in vitro chemical and genetic screening data sets
title_sort Computational approaches for the integration of in vitro chemical and genetic screening data sets
author Cunha, Ana Beatriz Gonçalves da
author_facet Cunha, Ana Beatriz Gonçalves da
author_role author
dc.contributor.none.fl_str_mv Rocha, Miguel
Cortés-Ciriano, Isidro
Universidade do Minho
dc.contributor.author.fl_str_mv Cunha, Ana Beatriz Gonçalves da
dc.subject.por.fl_str_mv Tumour heterogeneity
Single-cell RNA Sequencing
Drug activity prediction
Drug combinations
Deep learning
Heterogeneidade tumoral
Sequenciação RNA Single-cell
Previsão da atividade farmacológica
Combinação de fármacos
Ciências Naturais::Ciências da Computação e da Informação
topic Tumour heterogeneity
Single-cell RNA Sequencing
Drug activity prediction
Drug combinations
Deep learning
Heterogeneidade tumoral
Sequenciação RNA Single-cell
Previsão da atividade farmacológica
Combinação de fármacos
Ciências Naturais::Ciências da Computação e da Informação
description Dissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação)
publishDate 2021
dc.date.none.fl_str_mv 2021-11-01
2021-11-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/82763
url https://hdl.handle.net/1822/82763
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203153642
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132774210207744