Machine learning approaches for predicting effects of drug combinations in cancer

Detalhes bibliográficos
Autor(a) principal: Baptista, Delora Soeiro
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/47450
Resumo: Dissertação de mestrado em Bioinformática (área de especialização em Tecnologias da Informação)
id RCAP_517b20b964853b3b24991de2e189cc16
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/47450
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Machine learning approaches for predicting effects of drug combinations in cancerMétodos de aprendizagem máquina para a previsão de efeitos de combinações de medicamentos no tratamento de cancroEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em Bioinformática (área de especialização em Tecnologias da Informação)Drug combination therapies are commonly used to overcome tumor drug resistance. Computational methods can be helpful tools in drug combination discovery, but there are currently no e stablished methods for the prediction of drug combination effects. This work, integrated in the AstraZeneca -Sanger Drug Combination Prediction challenge launched by the Dialogue for Reverse Engineering Assessments and Methods (DREAM) community, aimed to develop machine learning methods to estimate the effects of drug combinations on cancer cell lines. The challenge was divided into three subchallenges (1A, 1B, and 2) addressing different clinical scenarios. A variety of machine learning models were devel oped and evaluated using cross-validation. Tree-based ensembles, particularly GB, performed best for this problem. Among the different the genomic datasets provided, the monotherapy, mutation and CNV datasets were the most informative and were the only ones used in the final models. The best model, submitted to 1A, was an ensemble of gradient boosting (GB), random forest (RF), and partial least squares (PLS) regression models, having achieved an average weighted Pearson correlation of 0.30, and ranking 24th among 76 submissions. The 1B model (average weighted Pearson correlation of 0.18; 47th/62 submissions) was also an ensemble of GB, RF, and PLS models. For subchallenge 2, a GB model was selected. It had a performance score (based on a three-way analysis of variance (ANOVA) ) of 5.15 and ranked 20th out of 39 submissions. The strategies explored in this work and by the DREAM challenge community will help to further the development of computational methods for the rational design of effective drug combinations for cancer therapy.A utilização de múltiplos fármacos em combinação é uma estratégia comum para superar a resistência a medicamentos em tumores. Métodos computacionais podem ser ferramentas valiosas na descoberta de novas combinações de interesse, mas atualmente não existe nenhum método estabelecido para este propósito. Este trabalho, integrado na iniciativa AstraZeneca-Sanger Drug Combination Prediction challenge proposta pela comunidade DREAM, tinha como objetivo o desenvolvimento de métodos de aprendizagem máquina para prever os efeitos de combinações de fármacos em linhas celulares tumorais. O problema encontrava-se dividido em três desafios (1A 1B e 2) que abordav am cenários clínicos distintos. Vários modelos foram desenvolvidos, sendo avaliados atr avés de validação cruzada. Conjuntos de modelos baseados em árvores de decisão conseguiram um melhor desempenho. De todos os conjuntos de dados, os dados de monoterapia, de mutações e de variação do número de cópia foram os mais informativos, tendo sido utilizados pelos mode los finais. O estimador utilizado para a tarefa 1A (média ponderada da correlação de Pearson de 0.30; 24º em 76 submissões) foi um conjunto composto por modelos de gradient boosting (GB), random forest (RF) e regressão por mínimos quadrados parciais (PLS). Para o problema 1B foi utilizado outro conjunto de modelos com GB, RF e PLS (0.18; 47º em 62 submissões). Para a questão 2, foi desenvolvido um modelo de GB que conseguiu um desempenho (calculado com base nos resultados de uma ANOVA) de 5.15, tendo sido o 20º melhor modelo num total de 39. As estratégias exploradas neste trabalho e pelas outras equipas que participaram neste desafio da comunidade DREAM são um contributo útil para o desenvolvimento futuro de métodos computacionais para o desenho racional de combinações de fármacos eficazes para o tratamento de tumores.Rocha, MiguelMachado, Carlos Daniel MoutinhoUniversidade do MinhoBaptista, Delora Soeiro2016-07-272016-07-27T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/47450eng201601109info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:14:02Zoai:repositorium.sdum.uminho.pt:1822/47450Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:06:15.542143Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Machine learning approaches for predicting effects of drug combinations in cancer
Métodos de aprendizagem máquina para a previsão de efeitos de combinações de medicamentos no tratamento de cancro
title Machine learning approaches for predicting effects of drug combinations in cancer
spellingShingle Machine learning approaches for predicting effects of drug combinations in cancer
Baptista, Delora Soeiro
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Machine learning approaches for predicting effects of drug combinations in cancer
title_full Machine learning approaches for predicting effects of drug combinations in cancer
title_fullStr Machine learning approaches for predicting effects of drug combinations in cancer
title_full_unstemmed Machine learning approaches for predicting effects of drug combinations in cancer
title_sort Machine learning approaches for predicting effects of drug combinations in cancer
author Baptista, Delora Soeiro
author_facet Baptista, Delora Soeiro
author_role author
dc.contributor.none.fl_str_mv Rocha, Miguel
Machado, Carlos Daniel Moutinho
Universidade do Minho
dc.contributor.author.fl_str_mv Baptista, Delora Soeiro
dc.subject.por.fl_str_mv Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado em Bioinformática (área de especialização em Tecnologias da Informação)
publishDate 2016
dc.date.none.fl_str_mv 2016-07-27
2016-07-27T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/47450
url http://hdl.handle.net/1822/47450
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 201601109
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132476451323904