Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift

Detalhes bibliográficos
Autor(a) principal: Brito, Daniel Miranda de
Data de Publicação: 2017
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/tede/9040
Resumo: Genomic islands (GIs) are regions of the bacterial and archaeal genomes that were acquired through the phenomenon of horizontal transfer. Usually, these regions provide important adaptations to these organisms, such as antibiotic resistance and pathogenicity, whose effects can be harmful to other species. For these reasons, many computational methodologies have been proposed for their prediction, however, none of them are capable to precisely identify the whole repertoire of islands present in a given genomic sequence. Therefore, the development of new approaches that explore different aspects of these regions is timely, allowing the identification of those not known. In this paper, it is proposed a novel method for the identification of GIs, built based on mean shift clustering algorithm, with the automatic bandwidth calculation, necessary to its operation. Test results with genomic island inserted in bacterial genomes show that the method is capable of identifying these regions, with sensitivity rates above 99%. Tests performed with bacterial genomes with known GIs revealed the potential of the method for their identification and for the discovery of new island. The detailed study of the new islands content pointed the presence of typical GIs elements, confirming its effectiveness in the prediction of these regions.
id UFPB_e8fe5c3129a5fe2be2efc16fabf752a0
oai_identifier_str oai:repositorio.ufpb.br:tede/9040
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shiftIlhas genômicasPrediçãoAnálise genômicaAgrupamentoMean shiftCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOGenomic islands (GIs) are regions of the bacterial and archaeal genomes that were acquired through the phenomenon of horizontal transfer. Usually, these regions provide important adaptations to these organisms, such as antibiotic resistance and pathogenicity, whose effects can be harmful to other species. For these reasons, many computational methodologies have been proposed for their prediction, however, none of them are capable to precisely identify the whole repertoire of islands present in a given genomic sequence. Therefore, the development of new approaches that explore different aspects of these regions is timely, allowing the identification of those not known. In this paper, it is proposed a novel method for the identification of GIs, built based on mean shift clustering algorithm, with the automatic bandwidth calculation, necessary to its operation. Test results with genomic island inserted in bacterial genomes show that the method is capable of identifying these regions, with sensitivity rates above 99%. Tests performed with bacterial genomes with known GIs revealed the potential of the method for their identification and for the discovery of new island. The detailed study of the new islands content pointed the presence of typical GIs elements, confirming its effectiveness in the prediction of these regions.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESIlhas genômicas (IGs) são regiões do genoma de bactérias e arqueas adquiridas por meio do fenômeno da transferência horizontal. Frequentemente, essas regiões proporcionam importantes adaptações a esses organismos, como resistência a antibióticos e patogenicidade, cujos efeitos podem ser danosos a outras espécies. Por essa razão, diversas metodologias computacionais foram propostas para a sua predição, porém nenhuma capaz de identificar o repertório completo de ilhas presentes em uma determinada sequência genômica. Portanto, torna-se oportuno o desenvolvimento de novas abordagens que explorem diferentes aspectos dessas regiões, permitindo a identificação daquelas não conhecidas. Nesse trabalho, propõe-se um novo método para a identificação de IGs, construído com base no algoritmo de agrupamento mean shift, com o cálculo automático da largura de banda, indispensável para o seu funcionamento. Resultados dos testes com ilhas genômicas inseridas em genomas de bactérias mostram que o método é capaz de identificar essas regiões com taxas de acerto acima de 99%. Testes realizados com genomas de bactérias com IGs conhecidas revelaram o potencial do método para a sua identificação e para a descoberta de novas ilhas. O estudo detalhado do conteúdo das novas ilhas apontou a presença de elementos típicos de IGs, confirmando a eficácia do método na predição dessas regiões.Universidade Federal da ParaíbaBrasilInformáticaPrograma de Pós-Graduação em InformáticaUFPBRêgo, Thaís Gaudêncio dohttp://lattes.cnpq.br/3166390632199101Brito, Daniel Miranda de2017-07-03T13:42:30Z2018-07-21T00:15:09Z2018-07-21T00:15:09Z2017-02-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBRITO, Daniel Miranda de. Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift. 2017. 76 f. Tese (Mestrado em Informática) - Universidade Federal da Paraíba, João Pessoa, 2017.https://repositorio.ufpb.br/jspui/handle/tede/9040porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2018-09-06T01:01:58Zoai:repositorio.ufpb.br:tede/9040Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2018-09-06T01:01:58Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
title Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
spellingShingle Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
Brito, Daniel Miranda de
Ilhas genômicas
Predição
Análise genômica
Agrupamento
Mean shift
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
title_full Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
title_fullStr Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
title_full_unstemmed Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
title_sort Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
author Brito, Daniel Miranda de
author_facet Brito, Daniel Miranda de
author_role author
dc.contributor.none.fl_str_mv Rêgo, Thaís Gaudêncio do
http://lattes.cnpq.br/3166390632199101
dc.contributor.author.fl_str_mv Brito, Daniel Miranda de
dc.subject.por.fl_str_mv Ilhas genômicas
Predição
Análise genômica
Agrupamento
Mean shift
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Ilhas genômicas
Predição
Análise genômica
Agrupamento
Mean shift
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Genomic islands (GIs) are regions of the bacterial and archaeal genomes that were acquired through the phenomenon of horizontal transfer. Usually, these regions provide important adaptations to these organisms, such as antibiotic resistance and pathogenicity, whose effects can be harmful to other species. For these reasons, many computational methodologies have been proposed for their prediction, however, none of them are capable to precisely identify the whole repertoire of islands present in a given genomic sequence. Therefore, the development of new approaches that explore different aspects of these regions is timely, allowing the identification of those not known. In this paper, it is proposed a novel method for the identification of GIs, built based on mean shift clustering algorithm, with the automatic bandwidth calculation, necessary to its operation. Test results with genomic island inserted in bacterial genomes show that the method is capable of identifying these regions, with sensitivity rates above 99%. Tests performed with bacterial genomes with known GIs revealed the potential of the method for their identification and for the discovery of new island. The detailed study of the new islands content pointed the presence of typical GIs elements, confirming its effectiveness in the prediction of these regions.
publishDate 2017
dc.date.none.fl_str_mv 2017-07-03T13:42:30Z
2017-02-24
2018-07-21T00:15:09Z
2018-07-21T00:15:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BRITO, Daniel Miranda de. Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift. 2017. 76 f. Tese (Mestrado em Informática) - Universidade Federal da Paraíba, João Pessoa, 2017.
https://repositorio.ufpb.br/jspui/handle/tede/9040
identifier_str_mv BRITO, Daniel Miranda de. Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift. 2017. 76 f. Tese (Mestrado em Informática) - Universidade Federal da Paraíba, João Pessoa, 2017.
url https://repositorio.ufpb.br/jspui/handle/tede/9040
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Informática
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Informática
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| diretoria@ufpb.br
_version_ 1801842904529895424