Um método híbrido para inferência de haplótipos por parcimônia
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/2447 |
Resumo: | Um grande desafio em Biologia hoje é associar mutações no DNA a várias características dos organismos, especialmente as relacionados com doenças. Muitas investigações sobre mutações que ocorrem no genoma foram realizadas, levando à conclusão de que alterações pontuais que ocorrem em regiões conservadas do DNA, que podem ser transmitidas através de várias gerações, podem ser associadas com a ocorrência de certas características ou doenças. Como consequência, mapear estas alterações e relacioná-las à ocorrência ou propensão de condições específicas é muito desejável. Infelizmente, esta tarefa não é fácil, pois para localizar estas mutações é necessário ter acesso ao haplótipo de um indivíduo, o que é um procedimento muito custoso, considerando a tecnologia corrente. Desta forma, métodos computacionais para inferência de haplótipos a partir de dados genotípicos são altamente necessários. Muitas abordagens foram propostas, mas nenhuma representa uma proposta completamente satisfatória, uma vez que os custos computacionais associados aos procedimentos são proibitivos ou as soluções encontradas são de baixa qualidade. A demanda principal corrente na pesquisa em inferência de haplótipos é que os métodos possam lidar com grandes volumes de dados genotípicos. Devido ao crescimento exponencial do custo das abordagens computacionais exatas, métodos que oferecem soluções rápidas com qualidade aceitável são altamente desejáveis. Nesta dissertação um novo método, chamado HybridPTG, é proposto. É uma abordagem híbrida que usa Cadeias de Markov para reduzir drasticamente a necessidade de passos randômicos (na média necessita de 99,99% menos operações aleatórias que o original PTG), convergindo para boas soluções (soluções similares ou melhores que as do método PTG) em poucos, frequentemente menos de dois, passos, portanto com uma complexidade computacional consideravelmente menor do que abordagens randômicas (tempo de processamento). Diversos experimentos com conjuntos de dados genotípicos de diferentes características foram realizados para comparar HybridPTG aos melhores algoritmos conhecidos, PTG, FastPHASE e Haplorec, mostrando que HybridPTG é um método bastante estável, confiável e eficiente |
id |
UFPE_82157444000a78662ee8f6d8d4d72866 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/2447 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
dos Santos Rosa, RogérioSilva Guimarães, Katia 2014-06-12T15:58:18Z2014-06-12T15:58:18Z2010-01-31dos Santos Rosa, Rogério; Silva Guimarães, Katia. Um método híbrido para inferência de haplótipos por parcimônia. 2010. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010.https://repositorio.ufpe.br/handle/123456789/2447Um grande desafio em Biologia hoje é associar mutações no DNA a várias características dos organismos, especialmente as relacionados com doenças. Muitas investigações sobre mutações que ocorrem no genoma foram realizadas, levando à conclusão de que alterações pontuais que ocorrem em regiões conservadas do DNA, que podem ser transmitidas através de várias gerações, podem ser associadas com a ocorrência de certas características ou doenças. Como consequência, mapear estas alterações e relacioná-las à ocorrência ou propensão de condições específicas é muito desejável. Infelizmente, esta tarefa não é fácil, pois para localizar estas mutações é necessário ter acesso ao haplótipo de um indivíduo, o que é um procedimento muito custoso, considerando a tecnologia corrente. Desta forma, métodos computacionais para inferência de haplótipos a partir de dados genotípicos são altamente necessários. Muitas abordagens foram propostas, mas nenhuma representa uma proposta completamente satisfatória, uma vez que os custos computacionais associados aos procedimentos são proibitivos ou as soluções encontradas são de baixa qualidade. A demanda principal corrente na pesquisa em inferência de haplótipos é que os métodos possam lidar com grandes volumes de dados genotípicos. Devido ao crescimento exponencial do custo das abordagens computacionais exatas, métodos que oferecem soluções rápidas com qualidade aceitável são altamente desejáveis. Nesta dissertação um novo método, chamado HybridPTG, é proposto. É uma abordagem híbrida que usa Cadeias de Markov para reduzir drasticamente a necessidade de passos randômicos (na média necessita de 99,99% menos operações aleatórias que o original PTG), convergindo para boas soluções (soluções similares ou melhores que as do método PTG) em poucos, frequentemente menos de dois, passos, portanto com uma complexidade computacional consideravelmente menor do que abordagens randômicas (tempo de processamento). Diversos experimentos com conjuntos de dados genotípicos de diferentes características foram realizados para comparar HybridPTG aos melhores algoritmos conhecidos, PTG, FastPHASE e Haplorec, mostrando que HybridPTG é um método bastante estável, confiável e eficienteCoordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessHaplótipoDNAMutaçõesGenótiposUm método híbrido para inferência de haplótipos por parcimôniainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALarquivo3451_1.pdfapplication/pdf1766411https://repositorio.ufpe.br/bitstream/123456789/2447/1/arquivo3451_1.pdfe0d05ca882fb75834d13a804d6b8f11fMD51LICENSElicense.txttext/plain1748https://repositorio.ufpe.br/bitstream/123456789/2447/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTarquivo3451_1.pdf.txtarquivo3451_1.pdf.txtExtracted texttext/plain136732https://repositorio.ufpe.br/bitstream/123456789/2447/3/arquivo3451_1.pdf.txt9a8da5871a1208df044bc0989d869b82MD53THUMBNAILarquivo3451_1.pdf.jpgarquivo3451_1.pdf.jpgGenerated Thumbnailimage/jpeg1284https://repositorio.ufpe.br/bitstream/123456789/2447/4/arquivo3451_1.pdf.jpga791d91fa3be6314adc6f0f5b6e814edMD54123456789/24472019-10-25 02:56:05.443oai:repositorio.ufpe.br:123456789/2447Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T05:56:05Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Um método híbrido para inferência de haplótipos por parcimônia |
title |
Um método híbrido para inferência de haplótipos por parcimônia |
spellingShingle |
Um método híbrido para inferência de haplótipos por parcimônia dos Santos Rosa, Rogério Haplótipo DNA Mutações Genótipos |
title_short |
Um método híbrido para inferência de haplótipos por parcimônia |
title_full |
Um método híbrido para inferência de haplótipos por parcimônia |
title_fullStr |
Um método híbrido para inferência de haplótipos por parcimônia |
title_full_unstemmed |
Um método híbrido para inferência de haplótipos por parcimônia |
title_sort |
Um método híbrido para inferência de haplótipos por parcimônia |
author |
dos Santos Rosa, Rogério |
author_facet |
dos Santos Rosa, Rogério |
author_role |
author |
dc.contributor.author.fl_str_mv |
dos Santos Rosa, Rogério |
dc.contributor.advisor1.fl_str_mv |
Silva Guimarães, Katia |
contributor_str_mv |
Silva Guimarães, Katia |
dc.subject.por.fl_str_mv |
Haplótipo DNA Mutações Genótipos |
topic |
Haplótipo DNA Mutações Genótipos |
description |
Um grande desafio em Biologia hoje é associar mutações no DNA a várias características dos organismos, especialmente as relacionados com doenças. Muitas investigações sobre mutações que ocorrem no genoma foram realizadas, levando à conclusão de que alterações pontuais que ocorrem em regiões conservadas do DNA, que podem ser transmitidas através de várias gerações, podem ser associadas com a ocorrência de certas características ou doenças. Como consequência, mapear estas alterações e relacioná-las à ocorrência ou propensão de condições específicas é muito desejável. Infelizmente, esta tarefa não é fácil, pois para localizar estas mutações é necessário ter acesso ao haplótipo de um indivíduo, o que é um procedimento muito custoso, considerando a tecnologia corrente. Desta forma, métodos computacionais para inferência de haplótipos a partir de dados genotípicos são altamente necessários. Muitas abordagens foram propostas, mas nenhuma representa uma proposta completamente satisfatória, uma vez que os custos computacionais associados aos procedimentos são proibitivos ou as soluções encontradas são de baixa qualidade. A demanda principal corrente na pesquisa em inferência de haplótipos é que os métodos possam lidar com grandes volumes de dados genotípicos. Devido ao crescimento exponencial do custo das abordagens computacionais exatas, métodos que oferecem soluções rápidas com qualidade aceitável são altamente desejáveis. Nesta dissertação um novo método, chamado HybridPTG, é proposto. É uma abordagem híbrida que usa Cadeias de Markov para reduzir drasticamente a necessidade de passos randômicos (na média necessita de 99,99% menos operações aleatórias que o original PTG), convergindo para boas soluções (soluções similares ou melhores que as do método PTG) em poucos, frequentemente menos de dois, passos, portanto com uma complexidade computacional consideravelmente menor do que abordagens randômicas (tempo de processamento). Diversos experimentos com conjuntos de dados genotípicos de diferentes características foram realizados para comparar HybridPTG aos melhores algoritmos conhecidos, PTG, FastPHASE e Haplorec, mostrando que HybridPTG é um método bastante estável, confiável e eficiente |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010-01-31 |
dc.date.accessioned.fl_str_mv |
2014-06-12T15:58:18Z |
dc.date.available.fl_str_mv |
2014-06-12T15:58:18Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
dos Santos Rosa, Rogério; Silva Guimarães, Katia. Um método híbrido para inferência de haplótipos por parcimônia. 2010. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/2447 |
identifier_str_mv |
dos Santos Rosa, Rogério; Silva Guimarães, Katia. Um método híbrido para inferência de haplótipos por parcimônia. 2010. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010. |
url |
https://repositorio.ufpe.br/handle/123456789/2447 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/2447/1/arquivo3451_1.pdf https://repositorio.ufpe.br/bitstream/123456789/2447/2/license.txt https://repositorio.ufpe.br/bitstream/123456789/2447/3/arquivo3451_1.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/2447/4/arquivo3451_1.pdf.jpg |
bitstream.checksum.fl_str_mv |
e0d05ca882fb75834d13a804d6b8f11f 8a4605be74aa9ea9d79846c1fba20a33 9a8da5871a1208df044bc0989d869b82 a791d91fa3be6314adc6f0f5b6e814ed |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310778451132416 |