Utilização de técnicas de otimização de desempenho em bioinformática
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPR |
Texto Completo: | http://hdl.handle.net/1884/28955 |
Resumo: | Resumo: A área de bioinformática passou por um crescimento na quantidade de dados biológicos em formato digital devido ao desenvolvimento de novas tecnologias de sequenciamento de DNA e análise de expressão gênica. A base de dados vem crescendo em altas taxas anualmente e, atualmente, o desafio é a transformação dos dados biológicos digitais em conhecimento. No entanto, a dificuldade para processar a enorme quantidade de dados é apenas um dos vários problemas relacionados a este crescimento. A área de Ciência da Computação pode auxiliar na melhoria da bioinformática através da investigação focada em métodos eficientes para a montagem de genomas, expressão gênica, alinhamento de sequências, mineração de dados, predição de sRNA, entre outros. Além da grande quantidade de memória requerida, ferramentas de bioinformática também exigem alta capacidade de processamento. A computação de alto desempenho (CAD), incorporando vários núcleos de processador em uma placa com memória compartilhada e oferecendo técnicas de otimização de código, vem mudando paradigmas na área de computação. Ferramentas de bioinformática modernas precisam tirar proveito da computação paralela, o que sempre foi uma tarefa desafiadora. Porém, a conversão de código sequencial em paralelo é uma tarefa difícil e deve ser precedida por otimização. Essa otimização envolve tornar o programa o mais eficiente possível. Técnicas de otimização manual, por exemplo, otimização aritmética, eliminação de conversão de dados e otimização de loop, ajudam a melhorar o tempo de execução da aplicação. Este trabalho apresenta otimizações realizadas no software sRNAScanner, cuja motivação foram as respostas biológicas do software e o seu tempo de execução elevado. Para otimizar o programa, ferramentas de perfilação foram utilizadas para analisar e avaliar o seu desempenho. O software sofreu alterações em suas funções e em suas estruturas de dados. Utilizando o genoma da bactéria Salmonella enterica serovar Typhimurium e técnicas de otimização manual e programação paralela, o tempo médio diminuiu de 23 minutos para 16,283 segun dos, apresentando um aumento de desempenho (speedup) de 85 vezes. Os arquivos finais e temporário tiveram o conteúdo inalterado em comparação com os mesmos arquivos gravados pelo programa sRNAScanner original. Os resultados mostraram que a aplicação de técnicas de otimização utilizadas em computação de alto desempenho em ferramentas de bioinformática apresentou, neste caso, um ganho de desempenho expressivo. |
id |
UFPR_172e7d83822012c640e419d4403f0ac6 |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/28955 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
308 |
spelling |
Fujii, Sergio YoshimitsuUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em BioinformáticaOliveira, Lucas Ferrari deSteffens, Maria Berenice Reynaud2012-12-12T14:16:30Z2012-12-12T14:16:30Z2012-12-12http://hdl.handle.net/1884/28955Resumo: A área de bioinformática passou por um crescimento na quantidade de dados biológicos em formato digital devido ao desenvolvimento de novas tecnologias de sequenciamento de DNA e análise de expressão gênica. A base de dados vem crescendo em altas taxas anualmente e, atualmente, o desafio é a transformação dos dados biológicos digitais em conhecimento. No entanto, a dificuldade para processar a enorme quantidade de dados é apenas um dos vários problemas relacionados a este crescimento. A área de Ciência da Computação pode auxiliar na melhoria da bioinformática através da investigação focada em métodos eficientes para a montagem de genomas, expressão gênica, alinhamento de sequências, mineração de dados, predição de sRNA, entre outros. Além da grande quantidade de memória requerida, ferramentas de bioinformática também exigem alta capacidade de processamento. A computação de alto desempenho (CAD), incorporando vários núcleos de processador em uma placa com memória compartilhada e oferecendo técnicas de otimização de código, vem mudando paradigmas na área de computação. Ferramentas de bioinformática modernas precisam tirar proveito da computação paralela, o que sempre foi uma tarefa desafiadora. Porém, a conversão de código sequencial em paralelo é uma tarefa difícil e deve ser precedida por otimização. Essa otimização envolve tornar o programa o mais eficiente possível. Técnicas de otimização manual, por exemplo, otimização aritmética, eliminação de conversão de dados e otimização de loop, ajudam a melhorar o tempo de execução da aplicação. Este trabalho apresenta otimizações realizadas no software sRNAScanner, cuja motivação foram as respostas biológicas do software e o seu tempo de execução elevado. Para otimizar o programa, ferramentas de perfilação foram utilizadas para analisar e avaliar o seu desempenho. O software sofreu alterações em suas funções e em suas estruturas de dados. Utilizando o genoma da bactéria Salmonella enterica serovar Typhimurium e técnicas de otimização manual e programação paralela, o tempo médio diminuiu de 23 minutos para 16,283 segun dos, apresentando um aumento de desempenho (speedup) de 85 vezes. Os arquivos finais e temporário tiveram o conteúdo inalterado em comparação com os mesmos arquivos gravados pelo programa sRNAScanner original. Os resultados mostraram que a aplicação de técnicas de otimização utilizadas em computação de alto desempenho em ferramentas de bioinformática apresentou, neste caso, um ganho de desempenho expressivo.application/pdfTesesSeqüencia de nucleotidiosBioinformáticaÁcido ribonucleico - AnaliseUtilização de técnicas de otimização de desempenho em bioinformáticainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - SERGIO YOSHIMITSU FUJII.pdfapplication/pdf1461379https://acervodigital.ufpr.br/bitstream/1884/28955/1/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf000ca3269a86dd7d58b76e92aac323c3MD51open accessTEXTR - D - SERGIO YOSHIMITSU FUJII.pdf.txtR - D - SERGIO YOSHIMITSU FUJII.pdf.txtExtracted Texttext/plain112642https://acervodigital.ufpr.br/bitstream/1884/28955/2/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf.txt165f23a5581f871f1f96693f1e9da59aMD52open accessTHUMBNAILR - D - SERGIO YOSHIMITSU FUJII.pdf.jpgR - D - SERGIO YOSHIMITSU FUJII.pdf.jpgGenerated Thumbnailimage/jpeg1248https://acervodigital.ufpr.br/bitstream/1884/28955/3/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf.jpg373c4fa4675bd081f446d749fd3012d6MD53open access1884/289552016-04-07 06:26:08.357open accessoai:acervodigital.ufpr.br:1884/28955Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-07T09:26:08Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.pt_BR.fl_str_mv |
Utilização de técnicas de otimização de desempenho em bioinformática |
title |
Utilização de técnicas de otimização de desempenho em bioinformática |
spellingShingle |
Utilização de técnicas de otimização de desempenho em bioinformática Fujii, Sergio Yoshimitsu Teses Seqüencia de nucleotidios Bioinformática Ácido ribonucleico - Analise |
title_short |
Utilização de técnicas de otimização de desempenho em bioinformática |
title_full |
Utilização de técnicas de otimização de desempenho em bioinformática |
title_fullStr |
Utilização de técnicas de otimização de desempenho em bioinformática |
title_full_unstemmed |
Utilização de técnicas de otimização de desempenho em bioinformática |
title_sort |
Utilização de técnicas de otimização de desempenho em bioinformática |
author |
Fujii, Sergio Yoshimitsu |
author_facet |
Fujii, Sergio Yoshimitsu |
author_role |
author |
dc.contributor.other.pt_BR.fl_str_mv |
Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática |
dc.contributor.author.fl_str_mv |
Fujii, Sergio Yoshimitsu |
dc.contributor.advisor1.fl_str_mv |
Oliveira, Lucas Ferrari de Steffens, Maria Berenice Reynaud |
contributor_str_mv |
Oliveira, Lucas Ferrari de Steffens, Maria Berenice Reynaud |
dc.subject.por.fl_str_mv |
Teses Seqüencia de nucleotidios Bioinformática Ácido ribonucleico - Analise |
topic |
Teses Seqüencia de nucleotidios Bioinformática Ácido ribonucleico - Analise |
description |
Resumo: A área de bioinformática passou por um crescimento na quantidade de dados biológicos em formato digital devido ao desenvolvimento de novas tecnologias de sequenciamento de DNA e análise de expressão gênica. A base de dados vem crescendo em altas taxas anualmente e, atualmente, o desafio é a transformação dos dados biológicos digitais em conhecimento. No entanto, a dificuldade para processar a enorme quantidade de dados é apenas um dos vários problemas relacionados a este crescimento. A área de Ciência da Computação pode auxiliar na melhoria da bioinformática através da investigação focada em métodos eficientes para a montagem de genomas, expressão gênica, alinhamento de sequências, mineração de dados, predição de sRNA, entre outros. Além da grande quantidade de memória requerida, ferramentas de bioinformática também exigem alta capacidade de processamento. A computação de alto desempenho (CAD), incorporando vários núcleos de processador em uma placa com memória compartilhada e oferecendo técnicas de otimização de código, vem mudando paradigmas na área de computação. Ferramentas de bioinformática modernas precisam tirar proveito da computação paralela, o que sempre foi uma tarefa desafiadora. Porém, a conversão de código sequencial em paralelo é uma tarefa difícil e deve ser precedida por otimização. Essa otimização envolve tornar o programa o mais eficiente possível. Técnicas de otimização manual, por exemplo, otimização aritmética, eliminação de conversão de dados e otimização de loop, ajudam a melhorar o tempo de execução da aplicação. Este trabalho apresenta otimizações realizadas no software sRNAScanner, cuja motivação foram as respostas biológicas do software e o seu tempo de execução elevado. Para otimizar o programa, ferramentas de perfilação foram utilizadas para analisar e avaliar o seu desempenho. O software sofreu alterações em suas funções e em suas estruturas de dados. Utilizando o genoma da bactéria Salmonella enterica serovar Typhimurium e técnicas de otimização manual e programação paralela, o tempo médio diminuiu de 23 minutos para 16,283 segun dos, apresentando um aumento de desempenho (speedup) de 85 vezes. Os arquivos finais e temporário tiveram o conteúdo inalterado em comparação com os mesmos arquivos gravados pelo programa sRNAScanner original. Os resultados mostraram que a aplicação de técnicas de otimização utilizadas em computação de alto desempenho em ferramentas de bioinformática apresentou, neste caso, um ganho de desempenho expressivo. |
publishDate |
2012 |
dc.date.accessioned.fl_str_mv |
2012-12-12T14:16:30Z |
dc.date.available.fl_str_mv |
2012-12-12T14:16:30Z |
dc.date.issued.fl_str_mv |
2012-12-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1884/28955 |
url |
http://hdl.handle.net/1884/28955 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/28955/1/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf https://acervodigital.ufpr.br/bitstream/1884/28955/2/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/28955/3/R%20-%20D%20-%20SERGIO%20YOSHIMITSU%20FUJII.pdf.jpg |
bitstream.checksum.fl_str_mv |
000ca3269a86dd7d58b76e92aac323c3 165f23a5581f871f1f96693f1e9da59a 373c4fa4675bd081f446d749fd3012d6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1813898732262916096 |