Utilização de técnicas de otimização de desempenho em bioinformática

Detalhes bibliográficos
Autor(a) principal: Fujii, Sergio Yoshimitsu
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: http://hdl.handle.net/1884/28955
Resumo: Resumo: A área de bioinformática passou por um crescimento na quantidade de dados biológicos em formato digital devido ao desenvolvimento de novas tecnologias de sequenciamento de DNA e análise de expressão gênica. A base de dados vem crescendo em altas taxas anualmente e, atualmente, o desafio é a transformação dos dados biológicos digitais em conhecimento. No entanto, a dificuldade para processar a enorme quantidade de dados é apenas um dos vários problemas relacionados a este crescimento. A área de Ciência da Computação pode auxiliar na melhoria da bioinformática através da investigação focada em métodos eficientes para a montagem de genomas, expressão gênica, alinhamento de sequências, mineração de dados, predição de sRNA, entre outros. Além da grande quantidade de memória requerida, ferramentas de bioinformática também exigem alta capacidade de processamento. A computação de alto desempenho (CAD), incorporando vários núcleos de processador em uma placa com memória compartilhada e oferecendo técnicas de otimização de código, vem mudando paradigmas na área de computação. Ferramentas de bioinformática modernas precisam tirar proveito da computação paralela, o que sempre foi uma tarefa desafiadora. Porém, a conversão de código sequencial em paralelo é uma tarefa difícil e deve ser precedida por otimização. Essa otimização envolve tornar o programa o mais eficiente possível. Técnicas de otimização manual, por exemplo, otimização aritmética, eliminação de conversão de dados e otimização de loop, ajudam a melhorar o tempo de execução da aplicação. Este trabalho apresenta otimizações realizadas no software sRNAScanner, cuja motivação foram as respostas biológicas do software e o seu tempo de execução elevado. Para otimizar o programa, ferramentas de perfilação foram utilizadas para analisar e avaliar o seu desempenho. O software sofreu alterações em suas funções e em suas estruturas de dados. Utilizando o genoma da bactéria Salmonella enterica serovar Typhimurium e técnicas de otimização manual e programação paralela, o tempo médio diminuiu de 23 minutos para 16,283 segun dos, apresentando um aumento de desempenho (speedup) de 85 vezes. Os arquivos finais e temporário tiveram o conteúdo inalterado em comparação com os mesmos arquivos gravados pelo programa sRNAScanner original. Os resultados mostraram que a aplicação de técnicas de otimização utilizadas em computação de alto desempenho em ferramentas de bioinformática apresentou, neste caso, um ganho de desempenho expressivo.
id UFPR_172e7d83822012c640e419d4403f0ac6
oai_identifier_str oai:acervodigital.ufpr.br:1884/28955
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Fujii, Sergio YoshimitsuUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em BioinformáticaOliveira, Lucas Ferrari deSteffens, Maria Berenice Reynaud2012-12-12T14:16:30Z2012-12-12T14:16:30Z2012-12-12http://hdl.handle.net/1884/28955Resumo: A área de bioinformática passou por um crescimento na quantidade de dados biológicos em formato digital devido ao desenvolvimento de novas tecnologias de sequenciamento de DNA e análise de expressão gênica. A base de dados vem crescendo em altas taxas anualmente e, atualmente, o desafio é a transformação dos dados biológicos digitais em conhecimento. No entanto, a dificuldade para processar a enorme quantidade de dados é apenas um dos vários problemas relacionados a este crescimento. A área de Ciência da Computação pode auxiliar na melhoria da bioinformática através da investigação focada em métodos eficientes para a montagem de genomas, expressão gênica, alinhamento de sequências, mineração de dados, predição de sRNA, entre outros. Além da grande quantidade de memória requerida, ferramentas de bioinformática também exigem alta capacidade de processamento. A computação de alto desempenho (CAD), incorporando vários núcleos de processador em uma placa com memória compartilhada e oferecendo técnicas de otimização de código, vem mudando paradigmas na área de computação. Ferramentas de bioinformática modernas precisam tirar proveito da computação paralela, o que sempre foi uma tarefa desafiadora. Porém, a conversão de código sequencial em paralelo é uma tarefa difícil e deve ser precedida por otimização. Essa otimização envolve tornar o programa o mais eficiente possível. Técnicas de otimização manual, por exemplo, otimização aritmética, eliminação de conversão de dados e otimização de loop, ajudam a melhorar o tempo de execução da aplicação. Este trabalho apresenta otimizações realizadas no software sRNAScanner, cuja motivação foram as respostas biológicas do software e o seu tempo de execução elevado. Para otimizar o programa, ferramentas de perfilação foram utilizadas para analisar e avaliar o seu desempenho. O software sofreu alterações em suas funções e em suas estruturas de dados. Utilizando o genoma da bactéria Salmonella enterica serovar Typhimurium e técnicas de otimização manual e programação paralela, o tempo médio diminuiu de 23 minutos para 16,283 segun dos, apresentando um aumento de desempenho (speedup) de 85 vezes. Os arquivos finais e temporário tiveram o conteúdo inalterado em comparação com os mesmos arquivos gravados pelo programa sRNAScanner original. Os resultados mostraram que a aplicação de técnicas de otimização utilizadas em computação de alto desempenho em ferramentas de bioinformática apresentou, neste caso, um ganho de desempenho expressivo.application/pdfTesesSeqüencia de nucleotidiosBioinformáticaÁcido ribonucleico - AnaliseUtilização de técnicas de otimização de desempenho em bioinformáticainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - SERGIO YOSHIMITSU FUJII.pdfapplication/pdf1461379https://acervodigital.ufpr.br/bitstream/1884/28955/1/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf000ca3269a86dd7d58b76e92aac323c3MD51open accessTEXTR - D - SERGIO YOSHIMITSU FUJII.pdf.txtR - D - SERGIO YOSHIMITSU FUJII.pdf.txtExtracted Texttext/plain112642https://acervodigital.ufpr.br/bitstream/1884/28955/2/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf.txt165f23a5581f871f1f96693f1e9da59aMD52open accessTHUMBNAILR - D - SERGIO YOSHIMITSU FUJII.pdf.jpgR - D - SERGIO YOSHIMITSU FUJII.pdf.jpgGenerated Thumbnailimage/jpeg1248https://acervodigital.ufpr.br/bitstream/1884/28955/3/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf.jpg373c4fa4675bd081f446d749fd3012d6MD53open access1884/289552016-04-07 06:26:08.357open accessoai:acervodigital.ufpr.br:1884/28955Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-07T09:26:08Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Utilização de técnicas de otimização de desempenho em bioinformática
title Utilização de técnicas de otimização de desempenho em bioinformática
spellingShingle Utilização de técnicas de otimização de desempenho em bioinformática
Fujii, Sergio Yoshimitsu
Teses
Seqüencia de nucleotidios
Bioinformática
Ácido ribonucleico - Analise
title_short Utilização de técnicas de otimização de desempenho em bioinformática
title_full Utilização de técnicas de otimização de desempenho em bioinformática
title_fullStr Utilização de técnicas de otimização de desempenho em bioinformática
title_full_unstemmed Utilização de técnicas de otimização de desempenho em bioinformática
title_sort Utilização de técnicas de otimização de desempenho em bioinformática
author Fujii, Sergio Yoshimitsu
author_facet Fujii, Sergio Yoshimitsu
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
dc.contributor.author.fl_str_mv Fujii, Sergio Yoshimitsu
dc.contributor.advisor1.fl_str_mv Oliveira, Lucas Ferrari de
Steffens, Maria Berenice Reynaud
contributor_str_mv Oliveira, Lucas Ferrari de
Steffens, Maria Berenice Reynaud
dc.subject.por.fl_str_mv Teses
Seqüencia de nucleotidios
Bioinformática
Ácido ribonucleico - Analise
topic Teses
Seqüencia de nucleotidios
Bioinformática
Ácido ribonucleico - Analise
description Resumo: A área de bioinformática passou por um crescimento na quantidade de dados biológicos em formato digital devido ao desenvolvimento de novas tecnologias de sequenciamento de DNA e análise de expressão gênica. A base de dados vem crescendo em altas taxas anualmente e, atualmente, o desafio é a transformação dos dados biológicos digitais em conhecimento. No entanto, a dificuldade para processar a enorme quantidade de dados é apenas um dos vários problemas relacionados a este crescimento. A área de Ciência da Computação pode auxiliar na melhoria da bioinformática através da investigação focada em métodos eficientes para a montagem de genomas, expressão gênica, alinhamento de sequências, mineração de dados, predição de sRNA, entre outros. Além da grande quantidade de memória requerida, ferramentas de bioinformática também exigem alta capacidade de processamento. A computação de alto desempenho (CAD), incorporando vários núcleos de processador em uma placa com memória compartilhada e oferecendo técnicas de otimização de código, vem mudando paradigmas na área de computação. Ferramentas de bioinformática modernas precisam tirar proveito da computação paralela, o que sempre foi uma tarefa desafiadora. Porém, a conversão de código sequencial em paralelo é uma tarefa difícil e deve ser precedida por otimização. Essa otimização envolve tornar o programa o mais eficiente possível. Técnicas de otimização manual, por exemplo, otimização aritmética, eliminação de conversão de dados e otimização de loop, ajudam a melhorar o tempo de execução da aplicação. Este trabalho apresenta otimizações realizadas no software sRNAScanner, cuja motivação foram as respostas biológicas do software e o seu tempo de execução elevado. Para otimizar o programa, ferramentas de perfilação foram utilizadas para analisar e avaliar o seu desempenho. O software sofreu alterações em suas funções e em suas estruturas de dados. Utilizando o genoma da bactéria Salmonella enterica serovar Typhimurium e técnicas de otimização manual e programação paralela, o tempo médio diminuiu de 23 minutos para 16,283 segun dos, apresentando um aumento de desempenho (speedup) de 85 vezes. Os arquivos finais e temporário tiveram o conteúdo inalterado em comparação com os mesmos arquivos gravados pelo programa sRNAScanner original. Os resultados mostraram que a aplicação de técnicas de otimização utilizadas em computação de alto desempenho em ferramentas de bioinformática apresentou, neste caso, um ganho de desempenho expressivo.
publishDate 2012
dc.date.accessioned.fl_str_mv 2012-12-12T14:16:30Z
dc.date.available.fl_str_mv 2012-12-12T14:16:30Z
dc.date.issued.fl_str_mv 2012-12-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1884/28955
url http://hdl.handle.net/1884/28955
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/28955/1/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf
https://acervodigital.ufpr.br/bitstream/1884/28955/2/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/28955/3/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf.jpg
bitstream.checksum.fl_str_mv 000ca3269a86dd7d58b76e92aac323c3
165f23a5581f871f1f96693f1e9da59a
373c4fa4675bd081f446d749fd3012d6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1813898732262916096