Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/17/17153/tde-04102021-161934/ |
Resumo: | Com a chegada de novas tecnologias de sequenciamento, como as de segunda e terceira geração, o tempo e custo das análises reduziram drasticamente enquanto a obtenção de dados aumentou significativamente. Desta maneira, ampliou-se a utilização dessas novas metodologias possibilitando diversas aplicações. Dentre essas aplicações podemos destacar a metagenômica. A metagenômica consiste na obtenção do material genético de todos os organismos presentes em uma única amostra, seja ela ambiental ou clínica. O viroma é uma área da metagenômica em que o foco são os vírus encontrados nestas amostras. Dentre as possíveis aplicações da análise do viroma está a identificação de vírus emergentes e re-emergentes com impacto na área de hemoterapia. Para isso aplicamos técnicas de identificação do viroma em bolsas de sangue com Doença Pós-Doação (DPD) relatada pelo doador (geralmente sintomas relacionados a infecção) febre, exantema, conjuntivite, dores retro orbitais, artralgia, mialgia, diarreia, vômitos, enjôo) e amostras de doações de sangue obtidas de doadores positivos para infecções rotineiramente triadas nos bancos de sangue da região norte (Macapá, Amapá) e sul do país (Santa Maria, Rio Grande do Sul). Para isso foi implementada uma pipeline bioinformática de alto rendimento para identificação de vírus emergentes e re- emergentes. A implementação foi realizada em BASH script, DOCKER (containers) e alguns PERL scripts desenvolvidos inhouse. Dentre os principais passos executados podemos citar o controle de qualidade das sequências com o software FastQC, limpeza das sequências de baixa qualidade e caudas poli-x com Trimmomatic e AfterQC, montagem dos genomas com o software SPAdes e finalmente classificação taxonômicas das sequências com Kraken2 e Diamond. As análises filodinâmicas dos vírus encontrados e com genoma recuperado foram feitas através dos softwares IQ-TREE e do pacote BEAST. Dentre nossos resultados das amostras com DPD de Ribeirão Preto podemos destacar o primeiro relato do vírus da Influenza A (H2N3) em amostras de plasma de doadores de sangue. Assim como também identificamos o vírus da Dengue e Parvovírus B19 (todos sem testagem obrigatória). Interessantemente em amostras provenientes da região norte do país encontramos o pouco conhecido Gemykibivírus humano-2, um vírus relacionado a quadros clínicos graves e coinfecções com HIV. Outro achado interessante nestas amostras foi o Merkell cell poliomavírus com genoma completo recuperado (o que pode indicar um estado viremico). No Brasil, até então não foram desenvolvidos estudos abrangentes sobre infecções emergentes com impacto na transfusão de sangue e a sua ameaça real para os processos hemoterápicos é subestimada e pouco conhecida. Porém há alguns desafios neste âmbito a serem superados, dentre eles podemos citar as análises bioinformáticas dos dados gerados, que demanda muitas vezes altos recursos computacionais e mão de obra especializada. Portanto, este estudo visa investigar o impacto das viroses emergentes e não suspeitas na área da hemoterapia utilizando sequenciamento de última geração e a implementação de um pipeline bioinformática eficiente para análise do viroma. |
id |
USP_d9e16dc70ba205b7149d077ac59e9cdb |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-04102021-161934 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapiaApplication of bioinformatics methods to identify viral infections with impact on hemotherapyBioinformatics pipelineDoença pós-doaçãoDPDEmerging virusesHemoterapiaHemotherapyMetagenômicaMetagenomicsNGSPDDRPipeline bioinformáticaPostdonation disease reportsReemerging virusesSNGViromaViromaVírus emergentesVírus reemergentesCom a chegada de novas tecnologias de sequenciamento, como as de segunda e terceira geração, o tempo e custo das análises reduziram drasticamente enquanto a obtenção de dados aumentou significativamente. Desta maneira, ampliou-se a utilização dessas novas metodologias possibilitando diversas aplicações. Dentre essas aplicações podemos destacar a metagenômica. A metagenômica consiste na obtenção do material genético de todos os organismos presentes em uma única amostra, seja ela ambiental ou clínica. O viroma é uma área da metagenômica em que o foco são os vírus encontrados nestas amostras. Dentre as possíveis aplicações da análise do viroma está a identificação de vírus emergentes e re-emergentes com impacto na área de hemoterapia. Para isso aplicamos técnicas de identificação do viroma em bolsas de sangue com Doença Pós-Doação (DPD) relatada pelo doador (geralmente sintomas relacionados a infecção) febre, exantema, conjuntivite, dores retro orbitais, artralgia, mialgia, diarreia, vômitos, enjôo) e amostras de doações de sangue obtidas de doadores positivos para infecções rotineiramente triadas nos bancos de sangue da região norte (Macapá, Amapá) e sul do país (Santa Maria, Rio Grande do Sul). Para isso foi implementada uma pipeline bioinformática de alto rendimento para identificação de vírus emergentes e re- emergentes. A implementação foi realizada em BASH script, DOCKER (containers) e alguns PERL scripts desenvolvidos inhouse. Dentre os principais passos executados podemos citar o controle de qualidade das sequências com o software FastQC, limpeza das sequências de baixa qualidade e caudas poli-x com Trimmomatic e AfterQC, montagem dos genomas com o software SPAdes e finalmente classificação taxonômicas das sequências com Kraken2 e Diamond. As análises filodinâmicas dos vírus encontrados e com genoma recuperado foram feitas através dos softwares IQ-TREE e do pacote BEAST. Dentre nossos resultados das amostras com DPD de Ribeirão Preto podemos destacar o primeiro relato do vírus da Influenza A (H2N3) em amostras de plasma de doadores de sangue. Assim como também identificamos o vírus da Dengue e Parvovírus B19 (todos sem testagem obrigatória). Interessantemente em amostras provenientes da região norte do país encontramos o pouco conhecido Gemykibivírus humano-2, um vírus relacionado a quadros clínicos graves e coinfecções com HIV. Outro achado interessante nestas amostras foi o Merkell cell poliomavírus com genoma completo recuperado (o que pode indicar um estado viremico). No Brasil, até então não foram desenvolvidos estudos abrangentes sobre infecções emergentes com impacto na transfusão de sangue e a sua ameaça real para os processos hemoterápicos é subestimada e pouco conhecida. Porém há alguns desafios neste âmbito a serem superados, dentre eles podemos citar as análises bioinformáticas dos dados gerados, que demanda muitas vezes altos recursos computacionais e mão de obra especializada. Portanto, este estudo visa investigar o impacto das viroses emergentes e não suspeitas na área da hemoterapia utilizando sequenciamento de última geração e a implementação de um pipeline bioinformática eficiente para análise do viroma.With the introduction in the laboratory practice of new sequencing technologies, like second and third generation techniques, the time and cost of the sequencing has drastically reduced while the generated data has increased significantly. In this way, the field of application of these new techniques has expanded incliding analysis of the microbial communities of clinical and environmental samples known as metagenomics. Virome is an important area of metagenomics where the focus is concentrated on the viruses found in these samples. Among the possible applications of virome analysis is the identification of emerging and re-emerging viruses which can impact the area of hemotherapy. To investigate these agents, we applied virome techniques in blood units obtained from donors who related with Post-Donation Disease Reports (PDDR) (including symptoms like fever, rash, conjunctivitis, retro-orbital pain, arthralgia, myalgia, diarrhea, vomiting, and nausea among others). We also applied viral metagenomics to blood donations obtained from high-risk blood donors from Northern and Southern Brazil. To do this, a high-performance bioinformatics pipeline was implemented to identify emerging and re- emerging viruses. The implementation was carried out in BASH script, DOCKER (containers) and in-house developed PERL scripts. The main stages of the pipeline include quality control of the sequences with the FastQC software, cleaning of low-quality sequences and poly-x tails by Trimmomatic and AfterQC, genome assembly by SPAdes software and finally sequence taxonomy using Kraken2 and Diamond. The phylodynamic analyzes of the most important viruses found were performed using the IQ-TREE software and the BEAST package. Among our results from PDDR samples we can highlight the first report in the literature of the Influenza A virus (H2N3) in plasma samples from blood donors. We also identified the dengue virus and Parvovirus B19 (both not included in the route testing of the blood collection services). Interestingly, in samples from North Brazil, we identified in high-risk blood donors the scarcely studied studied Human Gemykibivirus-2, which has already been related to severe clinical conditions and HIV co-infections. Another interesting finding in these samples was the Merkell cell polyomavirus with high sequence numbers (which may indicate a viremic state). In Brazil, comprehensive studies on infections which can impact transfusion safety have not been performed and the real impact of the emerging viruses on the hemotherapy processes is underestimated and little known. However, some challenges in this area must be overcame, and among them we can mention the bioinformatics analysis of the generated data, which often requires high computational resources and specialized labor. Therefore, our study examines in extensive manner the impact of emerging viruses in the area of hemotherapy using the newest sequencing generation and implementing an efficient bioinformatics pipeline for virome analysis.Biblioteca Digitais de Teses e Dissertações da USPSlavov, Svetoslav NanevBezerra, Rafael dos Santos2021-07-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17153/tde-04102021-161934/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2021-11-19T19:13:02Zoai:teses.usp.br:tde-04102021-161934Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-11-19T19:13:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia Application of bioinformatics methods to identify viral infections with impact on hemotherapy |
title |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia |
spellingShingle |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia Bezerra, Rafael dos Santos Bioinformatics pipeline Doença pós-doação DPD Emerging viruses Hemoterapia Hemotherapy Metagenômica Metagenomics NGS PDDR Pipeline bioinformática Postdonation disease reports Reemerging viruses SNG Viroma Viroma Vírus emergentes Vírus reemergentes |
title_short |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia |
title_full |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia |
title_fullStr |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia |
title_full_unstemmed |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia |
title_sort |
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia |
author |
Bezerra, Rafael dos Santos |
author_facet |
Bezerra, Rafael dos Santos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Slavov, Svetoslav Nanev |
dc.contributor.author.fl_str_mv |
Bezerra, Rafael dos Santos |
dc.subject.por.fl_str_mv |
Bioinformatics pipeline Doença pós-doação DPD Emerging viruses Hemoterapia Hemotherapy Metagenômica Metagenomics NGS PDDR Pipeline bioinformática Postdonation disease reports Reemerging viruses SNG Viroma Viroma Vírus emergentes Vírus reemergentes |
topic |
Bioinformatics pipeline Doença pós-doação DPD Emerging viruses Hemoterapia Hemotherapy Metagenômica Metagenomics NGS PDDR Pipeline bioinformática Postdonation disease reports Reemerging viruses SNG Viroma Viroma Vírus emergentes Vírus reemergentes |
description |
Com a chegada de novas tecnologias de sequenciamento, como as de segunda e terceira geração, o tempo e custo das análises reduziram drasticamente enquanto a obtenção de dados aumentou significativamente. Desta maneira, ampliou-se a utilização dessas novas metodologias possibilitando diversas aplicações. Dentre essas aplicações podemos destacar a metagenômica. A metagenômica consiste na obtenção do material genético de todos os organismos presentes em uma única amostra, seja ela ambiental ou clínica. O viroma é uma área da metagenômica em que o foco são os vírus encontrados nestas amostras. Dentre as possíveis aplicações da análise do viroma está a identificação de vírus emergentes e re-emergentes com impacto na área de hemoterapia. Para isso aplicamos técnicas de identificação do viroma em bolsas de sangue com Doença Pós-Doação (DPD) relatada pelo doador (geralmente sintomas relacionados a infecção) febre, exantema, conjuntivite, dores retro orbitais, artralgia, mialgia, diarreia, vômitos, enjôo) e amostras de doações de sangue obtidas de doadores positivos para infecções rotineiramente triadas nos bancos de sangue da região norte (Macapá, Amapá) e sul do país (Santa Maria, Rio Grande do Sul). Para isso foi implementada uma pipeline bioinformática de alto rendimento para identificação de vírus emergentes e re- emergentes. A implementação foi realizada em BASH script, DOCKER (containers) e alguns PERL scripts desenvolvidos inhouse. Dentre os principais passos executados podemos citar o controle de qualidade das sequências com o software FastQC, limpeza das sequências de baixa qualidade e caudas poli-x com Trimmomatic e AfterQC, montagem dos genomas com o software SPAdes e finalmente classificação taxonômicas das sequências com Kraken2 e Diamond. As análises filodinâmicas dos vírus encontrados e com genoma recuperado foram feitas através dos softwares IQ-TREE e do pacote BEAST. Dentre nossos resultados das amostras com DPD de Ribeirão Preto podemos destacar o primeiro relato do vírus da Influenza A (H2N3) em amostras de plasma de doadores de sangue. Assim como também identificamos o vírus da Dengue e Parvovírus B19 (todos sem testagem obrigatória). Interessantemente em amostras provenientes da região norte do país encontramos o pouco conhecido Gemykibivírus humano-2, um vírus relacionado a quadros clínicos graves e coinfecções com HIV. Outro achado interessante nestas amostras foi o Merkell cell poliomavírus com genoma completo recuperado (o que pode indicar um estado viremico). No Brasil, até então não foram desenvolvidos estudos abrangentes sobre infecções emergentes com impacto na transfusão de sangue e a sua ameaça real para os processos hemoterápicos é subestimada e pouco conhecida. Porém há alguns desafios neste âmbito a serem superados, dentre eles podemos citar as análises bioinformáticas dos dados gerados, que demanda muitas vezes altos recursos computacionais e mão de obra especializada. Portanto, este estudo visa investigar o impacto das viroses emergentes e não suspeitas na área da hemoterapia utilizando sequenciamento de última geração e a implementação de um pipeline bioinformática eficiente para análise do viroma. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-07-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/17/17153/tde-04102021-161934/ |
url |
https://www.teses.usp.br/teses/disponiveis/17/17153/tde-04102021-161934/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256674400731136 |