Distribuição dos tamanhos de DNA humano codificante via teoria da informação

Detalhes bibliográficos
Autor(a) principal: Correia, Jonathan Pessoa
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/33330
Resumo: Analisamos as sequências codificantes do DNA do Homo Sapiens por meio de um modelo que naturalmente envolve correlações entre as bases nas sequências de DNA dos organismos vivos. O modelo é baseado na otimização da entropia de Shannon, que é o centro de todos os argumentos estatísticos. No presente trabalho, propomos a função de distribuição de dupla exponencial dos comprimentos do DNA medido em pares de bases (pb). Os resultados mostram que as Correlações de Curto Alcance (CCA), sempre presentes nas sequências de DNA codificantes, são apropriadamente capturadas por meio da distribuição dupla exponencial e descreve adequadamente a distribuição de comprimentos cumulativos das bases de DNA. Com base neste modelo, usamos uma função de distribuição cumulativa empírica e o banco de dados de proteínas compilado pelo Projeto Ensembl para mostrar consistência com os dados.
id UFRN_0d39489c222ce9fef89034ea56e7ed8f
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/33330
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Correia, Jonathan Pessoahttp://lattes.cnpq.br/8759510435086814http://lattes.cnpq.br/2680905746363331Anselmo, Dory Helio Aires de Limahttp://lattes.cnpq.br/0554474279738500Macedo Filho, Antônio dehttp://lattes.cnpq.br/5432651695056904Silva Júnior, Raimundo2021-09-09T22:19:37Z2021-09-09T22:19:37Z2021-02-12CORREIA, Jonathan Pessoa. Distribuição dos tamanhos de DNA humano codificante via teoria da informação. 2021. 73f. Dissertação (Mestrado em Física) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/33330Analisamos as sequências codificantes do DNA do Homo Sapiens por meio de um modelo que naturalmente envolve correlações entre as bases nas sequências de DNA dos organismos vivos. O modelo é baseado na otimização da entropia de Shannon, que é o centro de todos os argumentos estatísticos. No presente trabalho, propomos a função de distribuição de dupla exponencial dos comprimentos do DNA medido em pares de bases (pb). Os resultados mostram que as Correlações de Curto Alcance (CCA), sempre presentes nas sequências de DNA codificantes, são apropriadamente capturadas por meio da distribuição dupla exponencial e descreve adequadamente a distribuição de comprimentos cumulativos das bases de DNA. Com base neste modelo, usamos uma função de distribuição cumulativa empírica e o banco de dados de proteínas compilado pelo Projeto Ensembl para mostrar consistência com os dados.We analyze the coding sequence for the Homo Sapiens DNA via a model that naturally embraces correlations among the bases in DNA sequences of living organisms. The model is based on the Shannon entropy’s optimization, which is the core of all statistical arguments. On our work , we propose the double-exponential1 distribution function of the length of DNA measured in base pairs (bp). The results show that the ShortRange-Correlations (SRC), always present in coding DNA sequences, are appropriately captured through the double-exponential distribution and adequately describes the cumulative length distribution of DNA bases. Based on this model, we use an Empirical cumulative distribution function and the database of proteins compiled by the Ensembl Project to show consistency with the data.Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM FÍSICAUFRNBrasilFísicaTeoria da informaçãoDNA humanoEntropia ShannonDistribuição dos tamanhos de DNA humano codificante via teoria da informaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALDistribuicaotamanhosDNA_Correia_2021.pdfapplication/pdf2086966https://repositorio.ufrn.br/bitstream/123456789/33330/1/DistribuicaotamanhosDNA_Correia_2021.pdfbff79109a4e0a5d8ab50be91e0b64af6MD51123456789/333302022-05-02 12:42:18.035oai:https://repositorio.ufrn.br:123456789/33330Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-05-02T15:42:18Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Distribuição dos tamanhos de DNA humano codificante via teoria da informação
title Distribuição dos tamanhos de DNA humano codificante via teoria da informação
spellingShingle Distribuição dos tamanhos de DNA humano codificante via teoria da informação
Correia, Jonathan Pessoa
Física
Teoria da informação
DNA humano
Entropia Shannon
title_short Distribuição dos tamanhos de DNA humano codificante via teoria da informação
title_full Distribuição dos tamanhos de DNA humano codificante via teoria da informação
title_fullStr Distribuição dos tamanhos de DNA humano codificante via teoria da informação
title_full_unstemmed Distribuição dos tamanhos de DNA humano codificante via teoria da informação
title_sort Distribuição dos tamanhos de DNA humano codificante via teoria da informação
author Correia, Jonathan Pessoa
author_facet Correia, Jonathan Pessoa
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8759510435086814
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2680905746363331
dc.contributor.referees1.none.fl_str_mv Anselmo, Dory Helio Aires de Lima
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0554474279738500
dc.contributor.referees2.none.fl_str_mv Macedo Filho, Antônio de
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5432651695056904
dc.contributor.author.fl_str_mv Correia, Jonathan Pessoa
dc.contributor.advisor1.fl_str_mv Silva Júnior, Raimundo
contributor_str_mv Silva Júnior, Raimundo
dc.subject.por.fl_str_mv Física
Teoria da informação
DNA humano
Entropia Shannon
topic Física
Teoria da informação
DNA humano
Entropia Shannon
description Analisamos as sequências codificantes do DNA do Homo Sapiens por meio de um modelo que naturalmente envolve correlações entre as bases nas sequências de DNA dos organismos vivos. O modelo é baseado na otimização da entropia de Shannon, que é o centro de todos os argumentos estatísticos. No presente trabalho, propomos a função de distribuição de dupla exponencial dos comprimentos do DNA medido em pares de bases (pb). Os resultados mostram que as Correlações de Curto Alcance (CCA), sempre presentes nas sequências de DNA codificantes, são apropriadamente capturadas por meio da distribuição dupla exponencial e descreve adequadamente a distribuição de comprimentos cumulativos das bases de DNA. Com base neste modelo, usamos uma função de distribuição cumulativa empírica e o banco de dados de proteínas compilado pelo Projeto Ensembl para mostrar consistência com os dados.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-09-09T22:19:37Z
dc.date.available.fl_str_mv 2021-09-09T22:19:37Z
dc.date.issued.fl_str_mv 2021-02-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CORREIA, Jonathan Pessoa. Distribuição dos tamanhos de DNA humano codificante via teoria da informação. 2021. 73f. Dissertação (Mestrado em Física) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/33330
identifier_str_mv CORREIA, Jonathan Pessoa. Distribuição dos tamanhos de DNA humano codificante via teoria da informação. 2021. 73f. Dissertação (Mestrado em Física) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021.
url https://repositorio.ufrn.br/handle/123456789/33330
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM FÍSICA
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/33330/1/DistribuicaotamanhosDNA_Correia_2021.pdf
bitstream.checksum.fl_str_mv bff79109a4e0a5d8ab50be91e0b64af6
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832856525963264