Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica

Detalhes bibliográficos
Autor(a) principal: Santos, Danilo Carastan dos
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFABC
Texto Completo: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=77320
Resumo: Orientador: Prof. Dr. Luiz Carlos da Silva Rozante
id UFBC_5053197b178aa0140fb668a770f1dd87
oai_identifier_str oai:BDTD:77320
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênicaINFERÊNCIA DE GRNSCOMPUTAÇÃO EM GPUHITTING SETGRNS INFERENCEGPU COMPUTINGPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCOrientador: Prof. Dr. Luiz Carlos da Silva RozanteDissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, 2015.A inferência de redes de regulação gênica é um dos problemas cruciais no campo de Biologia de Sistemas. É ainda um problema em aberto, principalmente devido à alta dimensionalidade (milhares de genes) com um número limitado de amostras (dezenas), tornando difícil estimar dependências entre genes. Além do problema de estimação, outro obstáculo é a inerente complexidade computacional dos métodos de inferência de GRNs. Este trabalho teve como foco contornar problemas de desempenho de uma técnica baseada em perturbação de sinais para inferir dependências entre genes. Um dos passos principais consiste em resolver o problema da Transversal Mínima (do Inglês Hitting Set, ou HSP), o qual é NPDifícil. Existem diversas propostas para se obter soluções aproximadas ou exatas para esse problema. Uma dessas propostas consiste em um algoritmo baseado em GPU (Graphical Processing Unit) para se obter as soluções exatas do HSP. Entretanto, tal método não é escalável para GRNs de tamanho real. Foi proposto nesse trabalho, portanto, uma extensão desse algoritmo para resolver o HSP, que é capaz de lidar com conjuntos de entrada contendomilhares de variáveis, pela introdução de inovações nas estruturas de dados e um mecanismo de ordenação que permite um descarte eficiente de candidatos que não são solução do HSP. Foi provida uma implementação em CPU multi-core e em clusters de GPU. Os resultados experimentais mostraram que o uso do mecanismo de ordenação fornece speedups de até 3,5 na implementação em CPU. Além disso, utilizando uma única GPU, foi obtido um speedup adicional de até 4,7, em comparação com uma implementação multithreaded em CPU. Porfim, o uso de oito GPUs de um cluster de GPU forneceu um speedup adicional de até 6,6. Combinando todas as técnicas, foram obtidos speedups acima de 60 para a parte paralela do algoritmo.Gene regulatory networks inference is one of the crucial problems of the Systems Biology field. It is still an open problem, mainly because of its high dimensionality (thousands of genes) with a limited number of samples (dozens), making it difficult to estimate dependenciesamong genes. Besides the estimation problem, another important hindrance is the inherent computational complexity of GRN inference methods. In this work, we focus on circumventing performance issues of a technique based on signal perturbations to infer gene dependencies. One of its main steps consists in solving the Hitting Set problem (HSP), which is NP-Hard. There are many proposals to obtain approximate or exact solutions to this problem. One of these proposals consists of a Graphical Processing Unit (GPU) based algorithm to obtain exact solutions to the HSP. However, such method is not scalable for real size GRNs. We propose an extension of the HSP algorithm to deal with input sets containing thousands of variables by introducing innovations in the data structures and a sorting scheme to allow efficient discarding of Hitting Set non-solution candidates. We provide an implementation for multi-core CPUs and GPU clusters. Our experimental results show that the usage of the sorting scheme brings speedups of up to 3.5 in the CPU implementation. Moreover, using a single GPU, we could obtain an additional speedup of up to 4.7, in comparison with the multithreaded CPU implementation. Finally, usage of eight GPUs from a GPU cluster brought an additional speedup of up to 6.6. Combining all techniques, speedups above 60 were obtained for the parallel part of the algorithm.Rozante, Luiz Carlos da SilvaCamargo, Raphael Yokoingawa deAdi, Said SadiqueSong, Siang WunMartins Junior, David CorrêaSantos, Danilo Carastan dos2015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf52 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=77320http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=77320&midiaext=70723http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=77320&midiaext=70724Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=77320porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2016-08-18T13:38:09Zoai:BDTD:77320Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2016-08-18T13:38:09Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.none.fl_str_mv Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica
title Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica
spellingShingle Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica
Santos, Danilo Carastan dos
INFERÊNCIA DE GRNS
COMPUTAÇÃO EM GPU
HITTING SET
GRNS INFERENCE
GPU COMPUTING
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
title_short Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica
title_full Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica
title_fullStr Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica
title_full_unstemmed Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica
title_sort Um algoritmo exato em clusters de GPUs para o Hitting Set aplicado à inferência de redes de regulação gênica
author Santos, Danilo Carastan dos
author_facet Santos, Danilo Carastan dos
author_role author
dc.contributor.none.fl_str_mv Rozante, Luiz Carlos da Silva
Camargo, Raphael Yokoingawa de
Adi, Said Sadique
Song, Siang Wun
Martins Junior, David Corrêa
dc.contributor.author.fl_str_mv Santos, Danilo Carastan dos
dc.subject.por.fl_str_mv INFERÊNCIA DE GRNS
COMPUTAÇÃO EM GPU
HITTING SET
GRNS INFERENCE
GPU COMPUTING
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
topic INFERÊNCIA DE GRNS
COMPUTAÇÃO EM GPU
HITTING SET
GRNS INFERENCE
GPU COMPUTING
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
description Orientador: Prof. Dr. Luiz Carlos da Silva Rozante
publishDate 2015
dc.date.none.fl_str_mv 2015
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=77320
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=77320
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=77320&midiaext=70723
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=77320&midiaext=70724
Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=77320
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
52 f. : il.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1801502096035414016