Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFPB |
Texto Completo: | https://repositorio.ufpb.br/jspui/handle/tede/9040 |
Resumo: | Genomic islands (GIs) are regions of the bacterial and archaeal genomes that were acquired through the phenomenon of horizontal transfer. Usually, these regions provide important adaptations to these organisms, such as antibiotic resistance and pathogenicity, whose effects can be harmful to other species. For these reasons, many computational methodologies have been proposed for their prediction, however, none of them are capable to precisely identify the whole repertoire of islands present in a given genomic sequence. Therefore, the development of new approaches that explore different aspects of these regions is timely, allowing the identification of those not known. In this paper, it is proposed a novel method for the identification of GIs, built based on mean shift clustering algorithm, with the automatic bandwidth calculation, necessary to its operation. Test results with genomic island inserted in bacterial genomes show that the method is capable of identifying these regions, with sensitivity rates above 99%. Tests performed with bacterial genomes with known GIs revealed the potential of the method for their identification and for the discovery of new island. The detailed study of the new islands content pointed the presence of typical GIs elements, confirming its effectiveness in the prediction of these regions. |
id |
UFPB_e8fe5c3129a5fe2be2efc16fabf752a0 |
---|---|
oai_identifier_str |
oai:repositorio.ufpb.br:tede/9040 |
network_acronym_str |
UFPB |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
repository_id_str |
|
spelling |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shiftIlhas genômicasPrediçãoAnálise genômicaAgrupamentoMean shiftCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOGenomic islands (GIs) are regions of the bacterial and archaeal genomes that were acquired through the phenomenon of horizontal transfer. Usually, these regions provide important adaptations to these organisms, such as antibiotic resistance and pathogenicity, whose effects can be harmful to other species. For these reasons, many computational methodologies have been proposed for their prediction, however, none of them are capable to precisely identify the whole repertoire of islands present in a given genomic sequence. Therefore, the development of new approaches that explore different aspects of these regions is timely, allowing the identification of those not known. In this paper, it is proposed a novel method for the identification of GIs, built based on mean shift clustering algorithm, with the automatic bandwidth calculation, necessary to its operation. Test results with genomic island inserted in bacterial genomes show that the method is capable of identifying these regions, with sensitivity rates above 99%. Tests performed with bacterial genomes with known GIs revealed the potential of the method for their identification and for the discovery of new island. The detailed study of the new islands content pointed the presence of typical GIs elements, confirming its effectiveness in the prediction of these regions.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESIlhas genômicas (IGs) são regiões do genoma de bactérias e arqueas adquiridas por meio do fenômeno da transferência horizontal. Frequentemente, essas regiões proporcionam importantes adaptações a esses organismos, como resistência a antibióticos e patogenicidade, cujos efeitos podem ser danosos a outras espécies. Por essa razão, diversas metodologias computacionais foram propostas para a sua predição, porém nenhuma capaz de identificar o repertório completo de ilhas presentes em uma determinada sequência genômica. Portanto, torna-se oportuno o desenvolvimento de novas abordagens que explorem diferentes aspectos dessas regiões, permitindo a identificação daquelas não conhecidas. Nesse trabalho, propõe-se um novo método para a identificação de IGs, construído com base no algoritmo de agrupamento mean shift, com o cálculo automático da largura de banda, indispensável para o seu funcionamento. Resultados dos testes com ilhas genômicas inseridas em genomas de bactérias mostram que o método é capaz de identificar essas regiões com taxas de acerto acima de 99%. Testes realizados com genomas de bactérias com IGs conhecidas revelaram o potencial do método para a sua identificação e para a descoberta de novas ilhas. O estudo detalhado do conteúdo das novas ilhas apontou a presença de elementos típicos de IGs, confirmando a eficácia do método na predição dessas regiões.Universidade Federal da ParaíbaBrasilInformáticaPrograma de Pós-Graduação em InformáticaUFPBRêgo, Thaís Gaudêncio dohttp://lattes.cnpq.br/3166390632199101Brito, Daniel Miranda de2017-07-03T13:42:30Z2018-07-21T00:15:09Z2018-07-21T00:15:09Z2017-02-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBRITO, Daniel Miranda de. Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift. 2017. 76 f. Tese (Mestrado em Informática) - Universidade Federal da Paraíba, João Pessoa, 2017.https://repositorio.ufpb.br/jspui/handle/tede/9040porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2018-09-06T01:01:58Zoai:repositorio.ufpb.br:tede/9040Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2018-09-06T01:01:58Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false |
dc.title.none.fl_str_mv |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift |
title |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift |
spellingShingle |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift Brito, Daniel Miranda de Ilhas genômicas Predição Análise genômica Agrupamento Mean shift CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift |
title_full |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift |
title_fullStr |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift |
title_full_unstemmed |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift |
title_sort |
Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift |
author |
Brito, Daniel Miranda de |
author_facet |
Brito, Daniel Miranda de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rêgo, Thaís Gaudêncio do http://lattes.cnpq.br/3166390632199101 |
dc.contributor.author.fl_str_mv |
Brito, Daniel Miranda de |
dc.subject.por.fl_str_mv |
Ilhas genômicas Predição Análise genômica Agrupamento Mean shift CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Ilhas genômicas Predição Análise genômica Agrupamento Mean shift CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Genomic islands (GIs) are regions of the bacterial and archaeal genomes that were acquired through the phenomenon of horizontal transfer. Usually, these regions provide important adaptations to these organisms, such as antibiotic resistance and pathogenicity, whose effects can be harmful to other species. For these reasons, many computational methodologies have been proposed for their prediction, however, none of them are capable to precisely identify the whole repertoire of islands present in a given genomic sequence. Therefore, the development of new approaches that explore different aspects of these regions is timely, allowing the identification of those not known. In this paper, it is proposed a novel method for the identification of GIs, built based on mean shift clustering algorithm, with the automatic bandwidth calculation, necessary to its operation. Test results with genomic island inserted in bacterial genomes show that the method is capable of identifying these regions, with sensitivity rates above 99%. Tests performed with bacterial genomes with known GIs revealed the potential of the method for their identification and for the discovery of new island. The detailed study of the new islands content pointed the presence of typical GIs elements, confirming its effectiveness in the prediction of these regions. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-07-03T13:42:30Z 2017-02-24 2018-07-21T00:15:09Z 2018-07-21T00:15:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
BRITO, Daniel Miranda de. Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift. 2017. 76 f. Tese (Mestrado em Informática) - Universidade Federal da Paraíba, João Pessoa, 2017. https://repositorio.ufpb.br/jspui/handle/tede/9040 |
identifier_str_mv |
BRITO, Daniel Miranda de. Uma nova abordagem para a identificação de ilhas genômicas em bactérias com base no método de agrupamento mean shift. 2017. 76 f. Tese (Mestrado em Informática) - Universidade Federal da Paraíba, João Pessoa, 2017. |
url |
https://repositorio.ufpb.br/jspui/handle/tede/9040 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Informática Programa de Pós-Graduação em Informática UFPB |
publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Informática Programa de Pós-Graduação em Informática UFPB |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFPB instname:Universidade Federal da Paraíba (UFPB) instacron:UFPB |
instname_str |
Universidade Federal da Paraíba (UFPB) |
instacron_str |
UFPB |
institution |
UFPB |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
collection |
Biblioteca Digital de Teses e Dissertações da UFPB |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB) |
repository.mail.fl_str_mv |
diretoria@ufpb.br|| diretoria@ufpb.br |
_version_ |
1801842904529895424 |