Computational approaches for the integration of in vitro chemical and genetic screening data sets
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/82763 |
Resumo: | Dissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação) |
id |
RCAP_d513587301d4455989884e6c6f83ebb7 |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/82763 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Computational approaches for the integration of in vitro chemical and genetic screening data setsTumour heterogeneitySingle-cell RNA SequencingDrug activity predictionDrug combinationsDeep learningHeterogeneidade tumoralSequenciação RNA Single-cellPrevisão da atividade farmacológicaCombinação de fármacosCiências Naturais::Ciências da Computação e da InformaçãoDissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação)Cellular heterogeneity plays an important role in tumour development and is often associated with poor prognosis, unsuccessful treatment, and relapse. Most therapeutic approaches do not account for the presence of drug-resistant clones within the tumour, that can affect the success of the treatment, and therefore it is crucial to address tumour heterogeneity in the clinic. Artificial intelligence is being increasingly introduced into Research & Development, especially in drug development. Current methodologies use information from in vitro cell line cultures as their source of biological signal, and drug screens. Models using this kind of data have clear limitations since they do not fully recapitulate cancer development in vivo. Furthermore, they also do not account for intratumour heterogeneity. This dissertation aims to develop deep learning models to predict the activity of drugs and drug combi nations at single-cell resolution using single-cell RNA sequencing technologies. The novelty of this project is the use of single-cell data that, if successful, could allow the identification of different populations of clones. First, two Variational Autoencoders were trained to analyse and compress both inputs, namely the molecular information and gene expression, that will be used as input to the deep learning models trained to predict the activity of compounds. They both proved to be a valid and efficient way to process the input without losing or compromising the signal. After processing the input, two models were trained to predict drug activity, Gradient Boosting Machines and Neural Networks. Overall, these models showed great results, particularly the Light Gradient Boosting Machines, with spearman correlations between real and predicted sensitivities around 0.8. Lastly, both architectures were also used to predict the drug combination synergy scores. These models showed average, but promising results, with spearman correlations between real and predicted synergies around 0.4. In a nutshell, this work shows that it is possible to predict drug activity using single-cell data. However, due to the novelty of this technology, the amount of data available is limited, which limited the performance of the models. Nevertheless, both models showed their potential, and as more data become available, the more the models will learn and make better predictions.A heterogeneidade celular tem um papel bastante importante no desenvolvimento tumoral, e está fre quentemente associada a mau prognóstico e falhas no tratamento, que poderá culminar em recidivas. A maioria das opções terapêuticas existentes não têm em consideração a presença de clones resistentes ao tratamento no tumor, que podem interferir com o sucesso da terapia. Assim sendo, a heterogeneidade tumoral é um ponto crucial que deve ser abordado em contexto clínico. A inteligência artificial está a ser aplicada cada vez mais na investigação, particularmente no desen volvimento de fármacos. As metodologias atuais utilizam informação proveniente de culturas de linhas celulares in vitro como fonte de sinal biológico e de estudos farmacológicos. Todavia, estes modelos ap resentam limitações evidentes, dado que não recapitulam o total desenvolvimento tumoral in vivo. Além disso, estes modelos também não têm em conta a heterogeneidade intratumoral. Esta dissertação tem como objetivo o desenvolvimento de modelos de deep learning para a previsão da atividade de fármacos e da sinergia de combinação de fármacos, ao nível celular, usando para isso dados de tecnologias de sequenciação single-cell. A inovação deste trabalho é o uso deste tipo de dados que, se bem-sucedido, poderá permitir a identificação de diferentes populações de clones tumorais. Numa primeira fase, dois Variational Autoencoders foram treinados de forma a serem capazes de analisar e comprimir os diferentes inputs (informação molecular e expressão genética), que foram depois utilizados como input para os modelos seguintes para a previsão da atividade dos fármacos. Ambos os variational autoencoders mostraram ser opções válidas e bastante eficientes para o processamento dos dados iniciais, sem perda e/ou comprometimento da informação. De seguida, dois modelos foram treinados para a previsão da atividade dos fármacos, mais especifica mente Gradient Boosting Machines e Redes Neuronais. De uma forma geral, estes modelos mostraram excelentes resultados, particularmente as Light Gradient Boosting Machines, com uma correlação de spearman entre os valores de actividade reais e previstos de 0.8. Por último, os mesmos tipos de modelos foram treinados para preverem os valores de sinergia entre combinação de fármacos. Estes modelos mostraram resultados promissores, com uma correlação de spearman entre os valores de sinergia reais e previstos de 0.4. Em epítome, este trabalho demonstra que é possível prever a atividade farmacológica usando dados single-cell. Todavia, devido ao facto desta tecnologia ser bastante recente, a quantidade de informação e dados disponíveis é reduzida, o que limita o sucesso dos modelos. Não obstante, ambos os modelos mostraram que têm bastante potencial e, assim que mais informação fique disponível, mais os modelos irão aprender e serão capazes de fazer melhores previsões.Rocha, MiguelCortés-Ciriano, IsidroUniversidade do MinhoCunha, Ana Beatriz Gonçalves da2021-11-012021-11-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/82763eng203153642info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:32:36Zoai:repositorium.sdum.uminho.pt:1822/82763Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:27:59.177883Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Computational approaches for the integration of in vitro chemical and genetic screening data sets |
title |
Computational approaches for the integration of in vitro chemical and genetic screening data sets |
spellingShingle |
Computational approaches for the integration of in vitro chemical and genetic screening data sets Cunha, Ana Beatriz Gonçalves da Tumour heterogeneity Single-cell RNA Sequencing Drug activity prediction Drug combinations Deep learning Heterogeneidade tumoral Sequenciação RNA Single-cell Previsão da atividade farmacológica Combinação de fármacos Ciências Naturais::Ciências da Computação e da Informação |
title_short |
Computational approaches for the integration of in vitro chemical and genetic screening data sets |
title_full |
Computational approaches for the integration of in vitro chemical and genetic screening data sets |
title_fullStr |
Computational approaches for the integration of in vitro chemical and genetic screening data sets |
title_full_unstemmed |
Computational approaches for the integration of in vitro chemical and genetic screening data sets |
title_sort |
Computational approaches for the integration of in vitro chemical and genetic screening data sets |
author |
Cunha, Ana Beatriz Gonçalves da |
author_facet |
Cunha, Ana Beatriz Gonçalves da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rocha, Miguel Cortés-Ciriano, Isidro Universidade do Minho |
dc.contributor.author.fl_str_mv |
Cunha, Ana Beatriz Gonçalves da |
dc.subject.por.fl_str_mv |
Tumour heterogeneity Single-cell RNA Sequencing Drug activity prediction Drug combinations Deep learning Heterogeneidade tumoral Sequenciação RNA Single-cell Previsão da atividade farmacológica Combinação de fármacos Ciências Naturais::Ciências da Computação e da Informação |
topic |
Tumour heterogeneity Single-cell RNA Sequencing Drug activity prediction Drug combinations Deep learning Heterogeneidade tumoral Sequenciação RNA Single-cell Previsão da atividade farmacológica Combinação de fármacos Ciências Naturais::Ciências da Computação e da Informação |
description |
Dissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação) |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-11-01 2021-11-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/82763 |
url |
https://hdl.handle.net/1822/82763 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
203153642 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132774210207744 |