Comparison of DNA sequencing technologies using sensory systems genes in bird genomes

Detalhes bibliográficos
Autor(a) principal: Fernandes, Inês de Castro
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/81097
Resumo: Dissertação de mestrado em Bioinformática
id RCAP_e4daa1bd3c9e6e232f2ff7eab4d4d701
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/81097
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Comparison of DNA sequencing technologies using sensory systems genes in bird genomesSequencing technologiesSensory systemsBird speciesGene extractionTecnologias de sequenciaçãoSistemas sensoriaisEspécies de avesExtração de genesEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em BioinformáticaVertebrate sensory systems play a major role in the survival of species, since their fitness and reproduction success depends on their ability to adapt to the surrounding environ mental conditions. Consequently, the sub-genomes of protein-coding genes responsible for stimulus perception, are constantly undergoing selective pressures and mutational changes. Birds are a very diverse group of organisms, about which there is still little information regarding the genetic and molecular mechanisms that gave rise to the enormous variability of phenotypes existing among species. However, due to the knowledge that has been ac quired about their sensory systems, birds have been considered a good model of study in this area. The sequencing of genomes, presents a great contribution to this theme and to the under standing of the influence of selective pressure in the modification of sub-genomes. However, a major restriction on this area is related to the quality of sequencing. There are several tech nologies that allow the sequencing of genomes, although they differ in the method used. One main difference is the size of the DNA reads generated. Technologies that are not so recent (Sanger, Solexa and Illumina), are based on short reads sequencing, on the other hand, more recent technologies (ex: PacBio) are based on long reads. Recently it has been proposed that the sequencing methodology may have a huge influence on the genome as sembly process and on the quality of the generated sequence. Considering this importance, the main purpose of this work was to compare the sequenc ing efficiency and quality of different technologies and to assess if the PacBio technology presents an “advantage” over the rest. Thus, we selected five species of birds with genomes that have been sequenced through older technologies and with the PacBio technology. From this, several sets of genes from six different sensory systems were extracted, in order to ob tain a good representation of each system. The results obtained revealed that in four of the systems, there are significant differences in the quality of sequencing between the “older” technologies and PacBio. Specifically, in PacBio genomes there is a higher quality of se quencing with regard to the fragmentation of genes along the genomes (less fragmented genes) as well as a higher quality in gene integrity (more complete and contiguous genes). In addition, allowed us to corroborate previously conclusions proposed by related studies that suggest that PacBio, and in this way, long read assembly, provides great improvements in genome assembly and gene completeness, as well as improvements in sequencing more complex genome regions.Os sistemas sensoriais dos vertebrados desempenham um papel fulcral para a sobrevivência das espécies, uma vez que o seu sucesso de fitness e reprodução depende da sua capacidade de adaptação às condições ambientais envolventes. Assim, os sub-genomas de genes codificantes de proteínas responsáveis por perceção de estímulos, estão constantemente a sofrer pressões seletivas e mutações. As aves, são um grupo de organismos bastante diverso, sobre as quais ainda existe pouca informação relativamente aos mecanismos genéticos e moleculares que deram origem à variabilidade de fenótipos existentes entre as espécies. No entanto, devido ao conhecimento que se tem vindo a adquirir acerca dos seus sistemas sensoriais, tem sido considerada um bom modelo de estudo nesta área. A sequenciação do genoma, apresenta-se um contributo para este tema e para a compreensão da influência da pressão seletiva na modificação dos sub-genomas. Porém, uma grande restrição nesta área relaciona-se com a qualidade de sequenciação das várias tecnologias, que diferem no método utilizado. Uma das principais diferenças é o tamanho das reads de DNA geradas. Tecnologias menos recentes (Sanger, Solexa e Illumina), baseiam a sequenciação em short reads, por outro lado, tecnologias mais recentes (ex: PacBio) baseiam-se nas long reads. Tem-se proposto que esta diferença poderá ter uma enorme influência no processo de sequenciação dos genomas. Considerando esta importância, o principal objetivo foi comparar a eficiência e qualidade de sequenciação de diferentes tecnologias e perceber se a tecnologia PacBio apresenta vantagens perante as restantes. Assim, selecionaram-se cinco espécies de aves com genomas que foram sequenciados através de tecnologias mais antigas e através da tecnologia PacBio. Destes, extraíram-se vários conjuntos de genes pertencentes a seis sistemas sensoriais, com o objetivo de obter uma boa representação de cada sistema. Os resultados revelaram que em quatro dos sistemas, existem diferenças significativas na qualidade de sequenciação entre tecnologias “mais antigas” e PacBio. Especificamente, nos genomas PacBio existe uma maior qualidade em termos de fragmentação dos genes ao longo dos genomas (genes menos fragmentados) assim como uma maior qualidade na integridade dos genes (genes mais completos e contíguos). Mais, permitiu-nos corroborar conclusões anteriormente reportadas por estudos relacionados, as quais sugeriam que PacBio, e assim, assemblies através de long reads, providencia uma grande melhoria na montagem de genomas e na obtenção de genes completos, assim como melhorias na sequenciação de regiões genómicas mais complexas.This work was partially supported by the Strategic Funding UID/Multi/04423/2019 through national funds provided by FCT and the European Regional Development Fund (ERDF) in the framework of the program PT2020, by the European Structural and In vestment Funds (ESIF) through the Competitiveness and Internationalization Operational Program - COMPETE 2020 and by National Funds through the FCT under the project PTDC/AAG-GLO/6887/2014 (POCI-01-0124-FEDER-016845).Antunes, AgostinhoRocha, MiguelUniversidade do MinhoFernandes, Inês de Castro2020-06-162020-06-16T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/81097eng203047940info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:02:29Zoai:repositorium.sdum.uminho.pt:1822/81097Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:52:28.056616Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Comparison of DNA sequencing technologies using sensory systems genes in bird genomes
title Comparison of DNA sequencing technologies using sensory systems genes in bird genomes
spellingShingle Comparison of DNA sequencing technologies using sensory systems genes in bird genomes
Fernandes, Inês de Castro
Sequencing technologies
Sensory systems
Bird species
Gene extraction
Tecnologias de sequenciação
Sistemas sensoriais
Espécies de aves
Extração de genes
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Comparison of DNA sequencing technologies using sensory systems genes in bird genomes
title_full Comparison of DNA sequencing technologies using sensory systems genes in bird genomes
title_fullStr Comparison of DNA sequencing technologies using sensory systems genes in bird genomes
title_full_unstemmed Comparison of DNA sequencing technologies using sensory systems genes in bird genomes
title_sort Comparison of DNA sequencing technologies using sensory systems genes in bird genomes
author Fernandes, Inês de Castro
author_facet Fernandes, Inês de Castro
author_role author
dc.contributor.none.fl_str_mv Antunes, Agostinho
Rocha, Miguel
Universidade do Minho
dc.contributor.author.fl_str_mv Fernandes, Inês de Castro
dc.subject.por.fl_str_mv Sequencing technologies
Sensory systems
Bird species
Gene extraction
Tecnologias de sequenciação
Sistemas sensoriais
Espécies de aves
Extração de genes
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Sequencing technologies
Sensory systems
Bird species
Gene extraction
Tecnologias de sequenciação
Sistemas sensoriais
Espécies de aves
Extração de genes
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado em Bioinformática
publishDate 2020
dc.date.none.fl_str_mv 2020-06-16
2020-06-16T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/81097
url https://hdl.handle.net/1822/81097
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203047940
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132301053919232