Computational approaches for the integration of in vitro chemical and genetic screening data sets

Cunha, Ana Beatriz Gonçalves da

Computational approaches for the integration of in vitro chemical and genetic screening data sets

Detalhes bibliográficos
Autor(a) principal:	Cunha, Ana Beatriz Gonçalves da
Data de Publicação:	2021
Tipo de documento:	Dissertação
Idioma:	eng
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	https://hdl.handle.net/1822/82763
Resumo:	Dissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação)

Metadados do item

id	RCAP_d513587301d4455989884e6c6f83ebb7
oai_identifier_str	oai:repositorium.sdum.uminho.pt:1822/82763
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Computational approaches for the integration of in vitro chemical and genetic screening data setsTumour heterogeneitySingle-cell RNA SequencingDrug activity predictionDrug combinationsDeep learningHeterogeneidade tumoralSequenciação RNA Single-cellPrevisão da atividade farmacológicaCombinação de fármacosCiências Naturais::Ciências da Computação e da InformaçãoDissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação)Cellular heterogeneity plays an important role in tumour development and is often associated with poor prognosis, unsuccessful treatment, and relapse. Most therapeutic approaches do not account for the presence of drug-resistant clones within the tumour, that can affect the success of the treatment, and therefore it is crucial to address tumour heterogeneity in the clinic. Artificial intelligence is being increasingly introduced into Research & Development, especially in drug development. Current methodologies use information from in vitro cell line cultures as their source of biological signal, and drug screens. Models using this kind of data have clear limitations since they do not fully recapitulate cancer development in vivo. Furthermore, they also do not account for intratumour heterogeneity. This dissertation aims to develop deep learning models to predict the activity of drugs and drug combi nations at single-cell resolution using single-cell RNA sequencing technologies. The novelty of this project is the use of single-cell data that, if successful, could allow the identification of different populations of clones. First, two Variational Autoencoders were trained to analyse and compress both inputs, namely the molecular information and gene expression, that will be used as input to the deep learning models trained to predict the activity of compounds. They both proved to be a valid and efficient way to process the input without losing or compromising the signal. After processing the input, two models were trained to predict drug activity, Gradient Boosting Machines and Neural Networks. Overall, these models showed great results, particularly the Light Gradient Boosting Machines, with spearman correlations between real and predicted sensitivities around 0.8. Lastly, both architectures were also used to predict the drug combination synergy scores. These models showed average, but promising results, with spearman correlations between real and predicted synergies around 0.4. In a nutshell, this work shows that it is possible to predict drug activity using single-cell data. However, due to the novelty of this technology, the amount of data available is limited, which limited the performance of the models. Nevertheless, both models showed their potential, and as more data become available, the more the models will learn and make better predictions.A heterogeneidade celular tem um papel bastante importante no desenvolvimento tumoral, e está fre quentemente associada a mau prognóstico e falhas no tratamento, que poderá culminar em recidivas. A maioria das opções terapêuticas existentes não têm em consideração a presença de clones resistentes ao tratamento no tumor, que podem interferir com o sucesso da terapia. Assim sendo, a heterogeneidade tumoral é um ponto crucial que deve ser abordado em contexto clínico. A inteligência artificial está a ser aplicada cada vez mais na investigação, particularmente no desen volvimento de fármacos. As metodologias atuais utilizam informação proveniente de culturas de linhas celulares in vitro como fonte de sinal biológico e de estudos farmacológicos. Todavia, estes modelos ap resentam limitações evidentes, dado que não recapitulam o total desenvolvimento tumoral in vivo. Além disso, estes modelos também não têm em conta a heterogeneidade intratumoral. Esta dissertação tem como objetivo o desenvolvimento de modelos de deep learning para a previsão da atividade de fármacos e da sinergia de combinação de fármacos, ao nível celular, usando para isso dados de tecnologias de sequenciação single-cell. A inovação deste trabalho é o uso deste tipo de dados que, se bem-sucedido, poderá permitir a identificação de diferentes populações de clones tumorais. Numa primeira fase, dois Variational Autoencoders foram treinados de forma a serem capazes de analisar e comprimir os diferentes inputs (informação molecular e expressão genética), que foram depois utilizados como input para os modelos seguintes para a previsão da atividade dos fármacos. Ambos os variational autoencoders mostraram ser opções válidas e bastante eficientes para o processamento dos dados iniciais, sem perda e/ou comprometimento da informação. De seguida, dois modelos foram treinados para a previsão da atividade dos fármacos, mais especifica mente Gradient Boosting Machines e Redes Neuronais. De uma forma geral, estes modelos mostraram excelentes resultados, particularmente as Light Gradient Boosting Machines, com uma correlação de spearman entre os valores de actividade reais e previstos de 0.8. Por último, os mesmos tipos de modelos foram treinados para preverem os valores de sinergia entre combinação de fármacos. Estes modelos mostraram resultados promissores, com uma correlação de spearman entre os valores de sinergia reais e previstos de 0.4. Em epítome, este trabalho demonstra que é possível prever a atividade farmacológica usando dados single-cell. Todavia, devido ao facto desta tecnologia ser bastante recente, a quantidade de informação e dados disponíveis é reduzida, o que limita o sucesso dos modelos. Não obstante, ambos os modelos mostraram que têm bastante potencial e, assim que mais informação fique disponível, mais os modelos irão aprender e serão capazes de fazer melhores previsões.Rocha, MiguelCortés-Ciriano, IsidroUniversidade do MinhoCunha, Ana Beatriz Gonçalves da2021-11-012021-11-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/82763eng203153642info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:32:36Zoai:repositorium.sdum.uminho.pt:1822/82763Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:27:59.177883Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Computational approaches for the integration of in vitro chemical and genetic screening data sets
title	Computational approaches for the integration of in vitro chemical and genetic screening data sets
spellingShingle	Computational approaches for the integration of in vitro chemical and genetic screening data sets Cunha, Ana Beatriz Gonçalves da Tumour heterogeneity Single-cell RNA Sequencing Drug activity prediction Drug combinations Deep learning Heterogeneidade tumoral Sequenciação RNA Single-cell Previsão da atividade farmacológica Combinação de fármacos Ciências Naturais::Ciências da Computação e da Informação
title_short	Computational approaches for the integration of in vitro chemical and genetic screening data sets
title_full	Computational approaches for the integration of in vitro chemical and genetic screening data sets
title_fullStr	Computational approaches for the integration of in vitro chemical and genetic screening data sets
title_full_unstemmed	Computational approaches for the integration of in vitro chemical and genetic screening data sets
title_sort	Computational approaches for the integration of in vitro chemical and genetic screening data sets
author	Cunha, Ana Beatriz Gonçalves da
author_facet	Cunha, Ana Beatriz Gonçalves da
author_role	author
dc.contributor.none.fl_str_mv	Rocha, Miguel Cortés-Ciriano, Isidro Universidade do Minho
dc.contributor.author.fl_str_mv	Cunha, Ana Beatriz Gonçalves da
dc.subject.por.fl_str_mv	Tumour heterogeneity Single-cell RNA Sequencing Drug activity prediction Drug combinations Deep learning Heterogeneidade tumoral Sequenciação RNA Single-cell Previsão da atividade farmacológica Combinação de fármacos Ciências Naturais::Ciências da Computação e da Informação
topic	Tumour heterogeneity Single-cell RNA Sequencing Drug activity prediction Drug combinations Deep learning Heterogeneidade tumoral Sequenciação RNA Single-cell Previsão da atividade farmacológica Combinação de fármacos Ciências Naturais::Ciências da Computação e da Informação
description	Dissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação)
publishDate	2021
dc.date.none.fl_str_mv	2021-11-01 2021-11-01T00:00:00Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://hdl.handle.net/1822/82763
url	https://hdl.handle.net/1822/82763
dc.language.iso.fl_str_mv	eng
language	eng
dc.relation.none.fl_str_mv	203153642
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799132774210207744

Computational approaches for the integration of in vitro chemical and genetic screening data sets

Registros relacionados